Bonjour,

### version courte ###

J'ai fait un gros ménage dans mes paquets pour revenir à une trixie plus 
"classique" (cf
détails ci-dessous).
Mon pb de suspend semble maintenant clairement lié au module nvidia.
J'ai le noyau linux-image-6.12.57+deb13-amd64

Avec une carte vidéo nvidia ancienne, et des écrans externes, quelles seraient 
vos recommandations
concernant les modules à utiliser (nvidia vs nouveau, mais y'a p'tet des 
alternatives que j'ignore) ?


### version longue ###

Pour info, le contenu de tous mes /etc/modprobe.d/*

/etc/modprobe.d/amd64-microcode-blacklist.conf
blacklist microcode

/etc/modprobe.d/intel-microcode-blacklist.conf
blacklist microcode

/etc/modprobe.d/mdadm.conf
options md_mod start_ro=1

/etc/modprobe.d/nvidia-blacklists-nouveau.conf
blacklist nouveau

/etc/modprobe.d/nvidia.conf
install nvidia modprobe -i nvidia-current $CMDLINE_OPTS
install nvidia-modeset modprobe nvidia ; modprobe -i nvidia-current-modeset 
$CMDLINE_OPTS
install nvidia-drm modprobe nvidia-modeset ; modprobe -i nvidia-current-drm 
$CMDLINE_OPTS
install nvidia-uvm modprobe nvidia ; modprobe -i nvidia-current-uvm 
$CMDLINE_OPTS
install nvidia-peermem modprobe nvidia ; modprobe -i nvidia-current-peermem 
$CMDLINE_OPTS
remove nvidia modprobe -r -i nvidia-drm nvidia-modeset nvidia-peermem 
nvidia-uvm nvidia
remove nvidia-modeset modprobe -r -i nvidia-drm nvidia-modeset
alias char-major-195* nvidia
alias   pci:v000010DEd00000E00sv*sd*bc04sc80i00*        nvidia
alias   pci:v000010DEd00000AA3sv*sd*bc0Bsc40i00*        nvidia
alias   pci:v000010DEd*sv*sd*bc03sc02i00*               nvidia
alias   pci:v000010DEd*sv*sd*bc03sc00i00*               nvidia

/etc/modprobe.d/nvidia-power-management-custom.conf
options nvidia NVreg_PreserveVideoMemoryAllocations=1
options nvidia NVreg_EnableS0ixPowerManagement=1
options nvidia NVreg_TemporaryFilePath=/var/tmp


Au moment de lancer le suspend avec 
  systemctl suspend
depuis un tty (ouvert avec ctrl+alt+F3 en ayant X qui tourne à coté, seul moyen 
de reprendre
la main après le plantage du suspend, si je lance ça depuis un terminal 
graphique ça fige tout),
je vois ensuite dans le log


janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: NVRM: GPU 0000:01:00.0: 
PreserveVideoMemoryAllocations module parameter is set. System Power Management 
attempted without driver procfs suspend interface. Please refer to the 
'Configuring Power Management Support' section in the driver README.
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM: 
pci_pm_suspend(): nv_pmops_suspend [nvidia] returns -5
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM: 
dpm_run_callback(): pci_pm_suspend returns -5
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM: 
failed to suspend async: error -5
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: PM: Some devices failed to 
suspend, or early wake event detected

ça semble clair, nvidia veut pas passer en veille. Ensuite on trouve ça :

janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM 
functions and may not be fully accessible
janv. 10 08:25:15 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM 
functions and may not be fully accessible
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: NVRM: GPU 0000:01:00.0: 
PreserveVideoMemoryAllocations module parameter is set. System Power Management 
attempted without driver procfs suspend interface. Please refer to the 
'Configuring Power Management Support' section in the driver README.
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM: 
pci_pm_suspend(): nv_pmops_suspend [nvidia] returns -5
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM: 
dpm_run_callback(): pci_pm_suspend returns -5
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: nvidia 0000:01:00.0: PM: 
failed to suspend async: error -5
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: PM: Some devices failed to 
suspend, or early wake event detected

pourquoi il se répète ? La commande suspend fait une 2e tentative 
automatiquement ?

janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: done.
janv. 10 08:25:18 ldlc17.lairdutemps.org systemd-sleep[7806]: Failed to put 
system to sleep. System resumed again: Input/output error
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM 
functions and may not be fully accessible
janv. 10 08:25:18 ldlc17.lairdutemps.org kernel: ata1.00: supports DRM 
functions and may not be fully accessible
janv. 10 08:25:19 ldlc17.lairdutemps.org systemd[1]: systemd-suspend.service: 
Failed with result 'exit-code'.
janv. 10 08:25:19 ldlc17.lairdutemps.org systemd[1]: Failed to start 
systemd-suspend.service - System Suspend.
janv. 10 08:25:19 ldlc17.lairdutemps.org systemd[1]: Dependency failed for 
suspend.target - Suspend.

ok, ensuite des messages xorg

janv. 10 08:25:31 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
systemd-logind: got resume for 13:65
janv. 10 08:25:31 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
systemd-logind: got resume for 226:0
janv. 10 08:25:31 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
AIGLX: Resuming AIGLX clients after VT switch

…

janv. 10 08:25:32 ldlc17.lairdutemps.org wireplumber[2531]: spa.bluez5: BlueZ 
system service is not available

… ce pb de bluetooth existait déjà dans bookworm

janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0): ACPI: failed to connect to the ACPI event daemon; the daemon
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     may not be running or the "AcpidSocketPath" X
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     configuration option may not be set correctly.  When the
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     ACPI event daemon is available, the NVIDIA X driver will
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     try to use it to receive ACPI event notifications.  For
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     details, please see the "ConnectToAcpid" and
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     "AcpidSocketPath" X configuration options in Appendix B: X
janv. 10 08:25:32 ldlc17.lairdutemps.org /usr/libexec/gdm-x-session[2564]: (II) 
NVIDIA(G0):     Config Options in the README.

… là faut que je trouve de quel readme il parle

janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: Error 
in sys.excepthook:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: 
Original exception was:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: Error 
in sys.excepthook:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: 
Original exception was:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: Error 
in sys.excepthook:
janv. 10 08:26:11 ldlc17.lairdutemps.org org.cinnamon.ScreenSaver[7791]: 
Original exception was:
janv. 10 08:28:56 ldlc17.lairdutemps.org kernel: nvidia_uvm: module uses 
symbols nvUvmInterfaceDisableAccessCntr from proprietary module nvidia, 
inheriting taint.

… encore un autre pb nvidia …


Quand je regarde mes paquets nvidia*, j'ai nvidia-detect et nvidia-driver, avec 
leur dépendances

apt-cache policy nvidia-detect nvidia-driver
nvidia-detect:
  Installé : 550.163.01-2
  Candidat : 550.163.01-2
 Table de version :
 *** 550.163.01-2 500
        500 http://deb.debian.org/debian trixie/non-free amd64 Packages
        100 /var/lib/dpkg/status
nvidia-driver:
  Installé : 550.163.01-2
  Candidat : 550.163.01-2
 Table de version :
 *** 550.163.01-2 500
        500 http://deb.debian.org/debian trixie/non-free amd64 Packages
        100 /var/lib/dpkg/status


J'ai une carte nvidia GTX 1060, plutôt classique et ancienne (de l'age du PC, 
un portable qui doit avoir 7~9 ans avec un i7-7700HQ)
et qui allume l'écran du portable et deux écrans externes (un sur le display 
port et l'autre en hdmi).

J'ai testé après avoir débranché les écrans externes, même résultat.

J'ai ajouté le /etc/modprobe.d/nvidia-power-management-custom.conf (listé 
ci-dessus),
=> ça change rien (j'ai fais l'upgrade initramfs et reboot avant de retester), 
sinon mettre le warning concernant PreserveVideoMemoryAllocations dans le log

Ajouté aussi un /etc/systemd/system-sleep/99-nvidia-pm-custom
qui contient

#!/bin/sh
case "$1" in
  pre)
    echo suspend > /proc/driver/nvidia/suspend
    ;;
  post)
    echo resume > /proc/driver/nvidia/suspend
    ;;
esac

exit 0

mais ça change rien non plus.


Le 08/01/26 à 10:45+0100, didier gaumet <[email protected]> a écrit :
> Comme ta description du problème place son origine à la mise à jour vers 
> Trixie, il est possible que tu te traînes des scories de versions 
> précédentes, surtout si tu n'as pas bien suivi les consignes et que tu 
> mets à jour une installation depuis 20 ans :-)
> Donc déjà chercher les paquets obsolètes (ça liste aussi les paquets 
> locaux):
> $ apt list '~o'
> si tu n'as rien installé en local (hors archives Debian), cette liste 
> doit être vide, normalement.

J'ai fini mon nettoyage seulement 4 paquets listés obsolètes
    bcompare/now 4.4.7-28397 amd64 [installé, local]
    dbeaver-ce/now 25.3.2 amd64 [installé, local]
    gcstar/now 1.8.0-debian all [installé, local]
    slack-desktop/now 4.47.69 amd64 [installé, local]

Il s'agit de logiciels bien identifiés et sans incidence sur le système (autre 
que
d'éventuelles dépendances, mais il ne s'agit pas de lib utilisées par les 
services système).

Plus de paquets venant de deb-multimedia.org, tout provient des archives 
officielles hormis :
# aptitude search -F '%p' '?narrow(~i, !(?origin(Debian)))'
code dbeaver-ce debsuryorg-archive-keyring gcstar google-chrome-stable libgd3
microsoft-edge-dev molotov mongodb-database-tools mongodb-mongosh mongodb-org
mongodb-org-database mongodb-org-database-tools-extra mongodb-org-mongos 
mongodb-org-server
mongodb-org-shell mongodb-org-tools nodejs php-apcu php-common php-redis 
php8.5-apcu php8.5-cli
php8.5-common php8.5-curl php8.5-fpm php8.5-gd php8.5-igbinary php8.5-mbstring 
php8.5-mysql
php8.5-readline php8.5-redis php8.5-xml php8.5-zip slack-desktop syncthing 

=> ok (libgd3 est fourni par sury pour php8.5-gd, le seul à l'utiliser)
Les seuls services là-dedans sont mongodb/nodejs/php-fpm, à priori pas eux qui 
sont en cause
dans mes pbs de veille (je pourrais les désactiver pour en être sûr) 

Il pourrait rester d'anciennes configurations dans /etc, je pense par ex à de 
la conf xorg (à
une époque il a fallu préciser des choses, ensuite il valait mieux le virer, 
puis en remettre,
au gré des releases).


Le 08/01/26 à 14:07+0100, Michel Verdier <[email protected]> a écrit :
> Tu peux aussi faire
> 
> apt list ?obsolete
cf ci-dessus

> dpkg --audit
> apt-mark showhold
> apt list '~c'

tous vides

> find /etc -name '*.dpkg-*' -o -name '*.ucf-*' -o -name '*.merge-error'

/etc/lightdm/lightdm.conf.dpkg-old
/etc/mongod.conf.dpkg-dist
/etc/nginx/sites-available/default.dpkg-old
/etc/ca-certificates.conf.dpkg-old
/etc/redis/redis.conf.dpkg-old

ok, tout ça est normal, je préfère conserver ces fichiers comme trace de la 
config par défaut
de ces services.

-- 
Daniel

Écrivez dans l'ivresse, mais relisez-vous à jeun.
André Gide

Répondre à