Le 05/05/2017 à 17:03, Dominique Rousseau a écrit : > Le Fri, May 05, 2017 at 04:55:16PM +0200, Julien Escario [[email protected]] > a écrit: > [...] >> >> En revanche, en terme de symptômes, je n'ai aucun retour de pvdisplay, >> lvdisplay, vgdisplay ou lvs. > > Tu dois avec un (ou plusieurs) device qui amene tes pv* / lv* a > rencontrer une i/o bloquante > ( ces comandes font un scan de differents /dev/* ) > > Regardes ce que tu as comme file-descriptor en cours sur un des process > bloqués : > ls -l /proc/[le-pid]/fd/ > (ou avec lsof) > > Autre piste, lancer l'une des commandes qui se bloque aves strace > > Si c'est un /dev/dm-* ou /dev/mapper/* tu peux peut-etre regler le > probleme a grands coups de dmsetup
Ah, merci, ca me fait avancer :
# ls -l /proc/8165/fd/
total 0
lr-x------ 1 root root 64 May 5 17:44 0 -> /dev/null
l-wx------ 1 root root 64 May 5 17:44 1 -> pipe:[885312848]
lrwx------ 1 root root 64 May 5 17:44 2 -> socket:[3855574]
lrwx------ 1 root root 64 May 5 17:44 3 -> /run/lock/lvm/V_drbdpool
lrwx------ 1 root root 64 May 5 17:44 4 -> /dev/mapper/control
lr-x------ 1 root root 64 May 5 17:44 5 -> /dev/sdb1
lr-x------ 1 root root 64 May 5 17:44 6 -> /dev/drbd106
(le PID d'un vgdisplay lancé dans la matinée).
Et un strace bloque sur :
stat("/dev/drbd106", {st_mode=S_IFBLK|0660, st_rdev=makedev(147, 106), ...}) = 0
open("/dev/drbd106", O_RDONLY|O_DIRECT|O_NOATIME) = 4
fstat(4, {st_mode=S_IFBLK|0660, st_rdev=makedev(147, 106), ...}) = 0
ioctl(4, BLKBSZGET, 4096) = 0
ioctl(4, BLKPBSZGET, 512) = 0
lseek(4, 171798626304, SEEK_SET) = 171798626304
read(4,
On comment gentillement à pointer du doigt /dev/drbd106 qui est justement la
ressource qui à déclencher le truc.
Au départ, j'ai fait un assign de cette ressource sur cette machine. Ca a bien
démarré puis planté :
> exists device name:vm-210-disk-1 volume:0 minor:106 disk:Inconsistent
> size:167772160 read:0 written:267956 al-writes:116 bm-writes:0
> upper-pending:6 lower-pending:2 al-suspended:no blocked:no
donc /dev/drbd106 = vm-210-disk-1
et :
# drbdadm status
vm-210-disk-1 role:Secondary
disk:Inconsistent
vm4 role:Secondary
replication:SyncTarget peer-disk:UpToDate done:0.11
vm7 role:Primary
replication:PausedSyncT peer-disk:UpToDate done:0.10
Donc l'affichage des outils LVM plantent parce qu'il y a une I/O bloquante sur
/dev/drbd106. Du coup, c'est plutôt un soucis avec DRBD.
Je précise que sur les nodes vm7 et vm4, tout va bien, la ressource est synchro.
Il y a un stuck avec DRBD là.
Je vais descendre dans DRBD avec du plus low level que drbdmanage et tenter de
faire oublier cette ressource à DRBD sur ce node.
DRBD serait la cause et LVM le symptôme dans ce cas.
Merci pour la piste !
Julien
smime.p7s
Description: Signature cryptographique S/MIME
_______________________________________________ Liste de diffusion du FRsAG http://www.frsag.org/
