Bonjour,
### version courte ###
J'ai fait un gros ménage dans mes paquets pour revenir à une trixie plus
"classique" (cf
détails ci-dessous).
Mon pb de suspend semble maintenant clairement lié au module nvidia.
J'ai le noyau linux-image-6.12.57+deb13-amd64
Avec une carte vidéo nvidia ancienne, et des écrans externes, quelles seraient
vos recommandations
concernant les modules à utiliser (nvidia vs nouveau, mais y'a p'tet des
alternatives que j'ignore) ?
### version longue ###
Pour info, le contenu de tous mes /etc/modprobe.d/*
/etc/modprobe.d/amd64-microcode-blacklist.conf
blacklist microcode
/etc/modprobe.d/intel-microcode-blacklist.conf
blacklist microcode
/etc/modprobe.d/mdadm.conf
options md_mod start_ro=1
/etc/modprobe.d/nvidia-blacklists-nouveau.conf
blacklist nouveau
/etc/modprobe.d/nvidia.conf
install nvidia modprobe -i nvidia-current $CMDLINE_OPTS
install nvidia-modeset modprobe nvidia ; modprobe -i nvidia-current-modeset
$CMDLINE_OPTS
install nvidia-drm modprobe nvidia-modeset ; modprobe -i nvidia-current-drm
$CMDLINE_OPTS
install nvidia-uvm modprobe nvidia ; modprobe -i nvidia-current-uvm
$CMDLINE_OPTS
install nvidia-peermem modprobe nvidia ; modprobe -i nvidia-current-peermem
$CMDLINE_OPTS
remove nvidia modprobe -r -i nvidia-drm nvidia-modeset nvidia-peermem
nvidia-uvm nvidia
remove nvidia-modeset modprobe -r -i nvidia-drm nvidia-modeset
alias char-major-195* nvidia
alias pci:v000010DEd00000E00sv*sd*bc04sc80i00* nvidia
alias pci:v000010DEd00000AA3sv*sd*bc0Bsc40i00* nvidia
alias pci:v000010DEd*sv*sd*bc03sc02i00* nvidia
alias pci:v000010DEd*sv*sd*bc03sc00i00* nvidia
/etc/modprobe.d/nvidia-power-management-custom.conf
options nvidia NVreg_PreserveVideoMemoryAllocations=1
options nvidia NVreg_EnableS0ixPowerManagement=1
options nvidia NVreg_TemporaryFilePath=/var/tmp
Au moment de lancer le suspend avec
systemctl suspend
depuis un tty (ouvert avec ctrl+alt+F3 en ayant X qui tourne à coté, seul moyen
de reprendre
la main après le plantage du suspend, si je lance ça depuis un terminal
graphique ça fige tout),
je vois ensuite dans le log
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: NVRM: GPU 0000:01:00.0:
PreserveVideoMemoryAllocations module parameter is set. System Power Management
attempted without driver procfs suspend interface. Please refer to the
'Configuring Power Management Support' section in the driver README.
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM:
pci_pm_suspend(): nv_pmops_suspend [nvidia] returns -5
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM:
dpm_run_callback(): pci_pm_suspend returns -5
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM:
failed to suspend async: error -5
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: PM: Some devices failed to
suspend, or early wake event detected
ça semble clair, nvidia veut pas passer en veille. Ensuite on trouve ça :
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM
functions and may not be fully accessible
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM
functions and may not be fully accessible
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: NVRM: GPU 0000:01:00.0:
PreserveVideoMemoryAllocations module parameter is set. System Power Management
attempted without driver procfs suspend interface. Please refer to the
'Configuring Power Management Support' section in the driver README.
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM:
pci_pm_suspend(): nv_pmops_suspend [nvidia] returns -5
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM:
dpm_run_callback(): pci_pm_suspend returns -5
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM:
failed to suspend async: error -5
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: PM: Some devices failed to
suspend, or early wake event detected
pourquoi il se répète ? La commande suspend fait une 2e tentative
automatiquement ?
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: done.
janv. 10 08:25:18 ldlc17.lairdutemps.org systemd-sleep[7806]: Failed to put
system to sleep. System resumed again: Input/output error
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM
functions and may not be fully accessible
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM
functions and may not be fully accessible
janv. 10 08:25:19 ldlc17.lairdutemps.org systemd[1]: systemd-suspend.service:
Failed with result 'exit-code'.
janv. 10 08:25:19 ldlc17.lairdutemps.org systemd[1]: Failed to start
systemd-suspend.service - System Suspend.
janv. 10 08:25:19 ldlc17.lairdutemps.org systemd[1]: Dependency failed for
suspend.target - Suspend.
ok, ensuite des messages xorg
janv. 10 08:25:31 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
systemd-logind: got resume for 13:65
janv. 10 08:25:31 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
systemd-logind: got resume for 226:0
janv. 10 08:25:31 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
AIGLX: Resuming AIGLX clients after VT switch
…
janv. 10 08:25:32 ldlc17.lairdutemps.org wireplumber[2531]: spa.bluez5: BlueZ
system service is not available
… ce pb de bluetooth existait déjà dans bookworm
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): ACPI: failed to connect to the ACPI event daemon; the daemon
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): may not be running or the "AcpidSocketPath" X
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): configuration option may not be set correctly. When the
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): ACPI event daemon is available, the NVIDIA X driver will
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): try to use it to receive ACPI event notifications. For
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): details, please see the "ConnectToAcpid" and
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): "AcpidSocketPath" X configuration options in Appendix B: X
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II)
NVIDIA(G0): Config Options in the README.
… là faut que je trouve de quel readme il parle
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: Error
in sys.excepthook:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]:
Original exception was:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: Error
in sys.excepthook:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]:
Original exception was:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: Error
in sys.excepthook:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]:
Original exception was:
janv. 10 08:28:56 ldlc17.lairdutemps.org kernel: nvidia_uvm: module uses
symbols nvUvmInterfaceDisableAccessCntr from proprietary module nvidia,
inheriting taint.
… encore un autre pb nvidia …
Quand je regarde mes paquets nvidia*, j'ai nvidia-detect et nvidia-driver, avec
leur dépendances
apt-cache policy nvidia-detect nvidia-driver
nvidia-detect:
Installé : 550.163.01-2
Candidat : 550.163.01-2
Table de version :
*** 550.163.01-2 500
500 http://deb.debian.org/debian trixie/non-free amd64 Packages
100 /var/lib/dpkg/status
nvidia-driver:
Installé : 550.163.01-2
Candidat : 550.163.01-2
Table de version :
*** 550.163.01-2 500
500 http://deb.debian.org/debian trixie/non-free amd64 Packages
100 /var/lib/dpkg/status
J'ai une carte nvidia GTX 1060, plutôt classique et ancienne (de l'age du PC,
un portable qui doit avoir 7~9 ans avec un i7-7700HQ)
et qui allume l'écran du portable et deux écrans externes (un sur le display
port et l'autre en hdmi).
J'ai testé après avoir débranché les écrans externes, même résultat.
J'ai ajouté le /etc/modprobe.d/nvidia-power-management-custom.conf (listé
ci-dessus),
=> ça change rien (j'ai fais l'upgrade initramfs et reboot avant de retester),
sinon mettre le warning concernant PreserveVideoMemoryAllocations dans le log
Ajouté aussi un /etc/systemd/system-sleep/99-nvidia-pm-custom
qui contient
#!/bin/sh
case "$1" in
pre)
echo suspend > /proc/driver/nvidia/suspend
;;
post)
echo resume > /proc/driver/nvidia/suspend
;;
esac
exit 0
mais ça change rien non plus.
Le 08/01/26 à 10:45+0100, didier gaumet <[email protected]> a écrit :
> Comme ta description du problème place son origine à la mise à jour vers
> Trixie, il est possible que tu te traînes des scories de versions
> précédentes, surtout si tu n'as pas bien suivi les consignes et que tu
> mets à jour une installation depuis 20 ans :-)
> Donc déjà chercher les paquets obsolètes (ça liste aussi les paquets
> locaux):
> $ apt list '~o'
> si tu n'as rien installé en local (hors archives Debian), cette liste
> doit être vide, normalement.
J'ai fini mon nettoyage seulement 4 paquets listés obsolètes
bcompare/now 4.4.7-28397 amd64 [installé, local]
dbeaver-ce/now 25.3.2 amd64 [installé, local]
gcstar/now 1.8.0-debian all [installé, local]
slack-desktop/now 4.47.69 amd64 [installé, local]
Il s'agit de logiciels bien identifiés et sans incidence sur le système (autre
que
d'éventuelles dépendances, mais il ne s'agit pas de lib utilisées par les
services système).
Plus de paquets venant de deb-multimedia.org, tout provient des archives
officielles hormis :
# aptitude search -F '%p' '?narrow(~i, !(?origin(Debian)))'
code dbeaver-ce debsuryorg-archive-keyring gcstar google-chrome-stable libgd3
microsoft-edge-dev molotov mongodb-database-tools mongodb-mongosh mongodb-org
mongodb-org-database mongodb-org-database-tools-extra mongodb-org-mongos
mongodb-org-server
mongodb-org-shell mongodb-org-tools nodejs php-apcu php-common php-redis
php8.5-apcu php8.5-cli
php8.5-common php8.5-curl php8.5-fpm php8.5-gd php8.5-igbinary php8.5-mbstring
php8.5-mysql
php8.5-readline php8.5-redis php8.5-xml php8.5-zip slack-desktop syncthing
=> ok (libgd3 est fourni par sury pour php8.5-gd, le seul à l'utiliser)
Les seuls services là-dedans sont mongodb/nodejs/php-fpm, à priori pas eux qui
sont en cause
dans mes pbs de veille (je pourrais les désactiver pour en être sûr)
Il pourrait rester d'anciennes configurations dans /etc, je pense par ex à de
la conf xorg (à
une époque il a fallu préciser des choses, ensuite il valait mieux le virer,
puis en remettre,
au gré des releases).
Le 08/01/26 à 14:07+0100, Michel Verdier <[email protected]> a écrit :
> Tu peux aussi faire
>
> apt list ?obsolete
cf ci-dessus
> dpkg --audit
> apt-mark showhold
> apt list '~c'
tous vides
> find /etc -name '*.dpkg-*' -o -name '*.ucf-*' -o -name '*.merge-error'
/etc/lightdm/lightdm.conf.dpkg-old
/etc/mongod.conf.dpkg-dist
/etc/nginx/sites-available/default.dpkg-old
/etc/ca-certificates.conf.dpkg-old
/etc/redis/redis.conf.dpkg-old
ok, tout ça est normal, je préfère conserver ces fichiers comme trace de la
config par défaut
de ces services.
--
Daniel
Écrivez dans l'ivresse, mais relisez-vous à jeun.
André Gide