Bonjour,

J'ai probablement un disque bien malade, et je doute de la meilleure solution 
pour m'en sortir
sans trop de pertes.

J'ai tout en lvm sauf /boot, avec un vg sur sda pour / et /home (wheezy avec 
grub sur sda), 
tous en ext4

- sda : ssd avec /boot, plus un vg pour les lv / et /home
- sdb : sata 2TB, pv lvm, utilisé dans un vg commun avec sdc
- sdc : sata 1TB dans le vg commun avec sdb

J'ai des lv en mirror, montés dans des dossiers de /, et d'autres sans mirror 
qui doivent donc être 
sur sdb (mais je laisse lvm faire sa cuisine).

Je suppose que la meilleure solution est de démonter toutes les partitions 
concernées 
(et les virer du fstab pour pouvoir rebooter), acheter un disque, l'ajouter 
dans le vg 
puis retirer le pv du disque malade, mais
- ça peut achever le disque malade, et je sais pas s'il y a une solution moins 
risquée.
- vaut-il mieux lancer fsck avant de toucher au lvm

Merci pour vos avis !




Question subsidiaire, j'ai lu 
http://www.admin-debian.com/les-systemes-de-fichiers-linux/lvm-2-logical-volume-management/
 
et 
http://debian-handbook.info/browse/stable/advanced-administration.html#sect.lvm,
 parcouru le man
mais si vous avez un lien vers de la doc qui explique comment récupérer les 
options de création des 
lv, et comment les modifier ensuite (lvs m'indique les lv en mirror, mais je 
sais pas trop interpréter 
tout ce que raconte lvmdump), ou comment optimiser / sécuriser le journal, je 
suis preneur.



Et les détails du pb :

Au boot, j'ai fsck qui me dit qu'il y a des pbs et qu'il va tenter de réparer, 
me dit qu'il y
arrive pas et qu'il faudra le faire manuellement, puis ça reste planté là avec 
des messages qui
sentent mauvais (toutes les 5~10s un nouveau message d'erreur I/O sans avoir de 
shell de maintenance).
Évidemment je les ai pas noté et plus sous les yeux, et ils sont pas dans les 
logs, mais ça 
ressemblait à ce que j'ai trouvé ensuite dans le syslog (pour le boot réussi)

ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata3.01: failed command: READ DMA EXT
ata3.01: cmd 25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
         res 51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
ata3.01: status: { DRDY ERR }
ata3.01: error: { UNC }


Maintenant, je peux voir dans syslog

Jun  4 06:34:50 quad kernel: [    1.821746] sd 3:0:0:0: [sdc] 1953525168 
512-byte logical blocks: (1.00 TB/931 GiB)
Jun  4 06:34:50 quad kernel: [    1.821749] sd 2:0:1:0: [sdb] 3907029168 
512-byte logical blocks: (2.00 TB/1.81 TiB)
Jun  4 06:34:50 quad kernel: [    1.821764] sd 2:0:0:0: [sda] 125045424 
512-byte logical blocks: (64.0 GB/59.6 GiB)

1re surprise, il voit sdc, comme si l'avoir débranché dans le bios ne changait 
rien, 
mais pourtant ça a permis de booter... (peut-être un hasard mais c'est curieux)

Les erreurs arrivent ensuite

Jun  4 06:34:50 quad kernel: [    4.401704] EXT4-fs (dm-0): re-mounted. Opts: 
(null)
Jun  4 06:34:50 quad kernel: [    4.433963] EXT4-fs (dm-0): re-mounted. Opts: 
discard,barrier=1,errors=remount-ro
Jun  4 06:34:50 quad kernel: [    4.457868] loop: module loaded
Jun  4 06:34:50 quad kernel: [   11.246913] ata3.01: exception Emask 0x0 SAct 
0x0 SErr 0x0 action 0x0
Jun  4 06:34:50 quad kernel: [   11.246989] ata3.01: failed command: READ DMA 
EXT
Jun  4 06:34:50 quad kernel: [   11.247050] ata3.01: cmd 
25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
Jun  4 06:34:50 quad kernel: [   11.247051]          res 
51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
Jun  4 06:34:50 quad kernel: [   11.247187] ata3.01: status: { DRDY ERR }
Jun  4 06:34:50 quad kernel: [   11.247242] ata3.01: error: { UNC }
Jun  4 06:34:50 quad kernel: [   11.260207] ata3.00: configured for UDMA/100
Jun  4 06:34:50 quad kernel: [   11.268829] ata3.01: configured for UDMA/133
Jun  4 06:34:50 quad kernel: [   11.268839] ata3: EH complete
Jun  4 06:34:50 quad kernel: [   11.282947] ata3.01: exception Emask 0x0 SAct 
0x0 SErr 0x0 action 0x0
Jun  4 06:34:50 quad kernel: [   11.283014] ata3.01: failed command: READ DMA 
EXT
Jun  4 06:34:50 quad kernel: [   11.283080] ata3.01: cmd 
25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
Jun  4 06:34:50 quad kernel: [   11.283081]          res 
51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
Jun  4 06:34:50 quad kernel: [   11.283312] ata3.01: status: { DRDY ERR }
Jun  4 06:34:50 quad kernel: [   11.283398] ata3.01: error: { UNC }
Jun  4 06:34:50 quad kernel: [   11.296200] ata3.00: configured for UDMA/100
Jun  4 06:34:50 quad kernel: [   11.304861] ata3.01: configured for UDMA/133
Jun  4 06:34:50 quad kernel: [   11.304868] ata3: EH complete

... ça continue comme ça jusqu'à

Jun  4 06:34:50 quad kernel: [   13.190762] ata3.01: exception Emask 0x0 SAct 
0x0 SErr 0x0 action 0x0
Jun  4 06:34:50 quad kernel: [   13.190865] ata3.01: failed command: READ DMA 
EXT
Jun  4 06:34:50 quad kernel: [   13.190957] ata3.01: cmd 
25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
Jun  4 06:34:50 quad kernel: [   13.190959]          res 
51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
Jun  4 06:34:50 quad kernel: [   13.191221] ata3.01: status: { DRDY ERR }
Jun  4 06:34:50 quad kernel: [   13.191307] ata3.01: error: { UNC }
Jun  4 06:34:50 quad kernel: [   13.204201] ata3.00: configured for UDMA/100
Jun  4 06:34:50 quad kernel: [   13.212685] ata3.01: configured for UDMA/133
Jun  4 06:34:50 quad kernel: [   13.212695] sd 2:0:1:0: [sdb] Unhandled sense 
code
Jun  4 06:34:50 quad kernel: [   13.212697] sd 2:0:1:0: [sdb]  Result: 
hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jun  4 06:34:50 quad kernel: [   13.212701] sd 2:0:1:0: [sdb]  Sense Key : 
Medium Error [current] [descriptor]
Jun  4 06:34:50 quad kernel: [   13.212705] Descriptor sense data with sense 
descriptors (in hex):
Jun  4 06:34:50 quad kernel: [   13.212707]         72 03 11 04 00 00 00 0c 00 
0a 80 00 00 00 00 00 
Jun  4 06:34:50 quad kernel: [   13.212716]         12 c0 01 b8 
Jun  4 06:34:50 quad kernel: [   13.212720] sd 2:0:1:0: [sdb]  Add. Sense: 
Unrecovered read error - auto reallocate failed
Jun  4 06:34:50 quad kernel: [   13.212725] sd 2:0:1:0: [sdb] CDB: Read(10): 28 
00 12 c0 01 b7 00 00 08 00
Jun  4 06:34:50 quad kernel: [   13.212733] end_request: I/O error, dev sdb, 
sector 314573240
Jun  4 06:34:50 quad kernel: [   13.212837] device-mapper: raid1: Primary 
mirror (254:1) failed while out-of-sync: Reads may fail.
Jun  4 06:34:50 quad kernel: [   13.212976] device-mapper: raid1: Read failure 
on mirror device 254:1.  Failing I/O.
Jun  4 06:34:50 quad kernel: [   13.213109] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.213200] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.213301] ata3: EH complete
Jun  4 06:34:50 quad kernel: [   13.213308] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.213414] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.213679] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.213771] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.213878] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.213970] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214075] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.214167] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214272] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.214364] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214468] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.214560] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214666] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.214758] Buffer I/O error on device dm-3, 
logical block 39321592
Jun  4 06:34:50 quad kernel: [   13.214870] device-mapper: raid1: Mirror read 
failed.
Jun  4 06:34:50 quad kernel: [   13.214962] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.215068] Buffer I/O error on device dm-3, 
logical block 39321599

En résumé ça donne 
Jun  4 06:34:50 quad kernel: [   13.212701] sd 2:0:1:0: [sdb]  Sense Key : 
Medium Error [current] [descriptor]
Jun  4 06:34:50 quad kernel: [   13.212720] sd 2:0:1:0: [sdb]  Add. Sense: 
Unrecovered read error - auto reallocate failed
Jun  4 06:34:50 quad kernel: [   13.212733] end_request: I/O error, dev sdb, 
sector 314573240
Jun  4 06:34:50 quad kernel: [   13.213200] Buffer I/O error on device dm-3, 
logical block 39321599
[répété 7 fois]
Jun  4 06:34:50 quad kernel: [   13.215068] Buffer I/O error on device dm-3, 
logical block 39321599
Jun  4 06:34:50 quad kernel: [   61.572741] EXT4-fs (sda1): mounted filesystem 
with ordered data mode. Opts: errors=remount-ro
Jun  4 06:34:50 quad kernel: [   61.640486] JBD2: IO error reading journal 
superblock
Jun  4 06:34:50 quad kernel: [   61.640578] EXT4-fs (dm-3): error loading 
journal
Jun  4 06:34:50 quad kernel: [   69.579744] EXT4-fs (dm-8): warning: mounting 
fs with errors, running e2fsck is recommended

Jun  4 06:39:37 quad kernel: [  369.632009] EXT4-fs (dm-8): error count: 5
Jun  4 06:39:37 quad kernel: [  369.632013] EXT4-fs (dm-8): initial error at 
1401703303: __ext4_get_inode_loc:3678: inode 68207603: block 272632927 
Jun  4 06:39:37 quad kernel: [  369.632018] EXT4-fs (dm-8): last error at 
1401797435: __ext4_get_inode_loc:3678: inode 76686780: block 306709115

dm-3 est un lv en mirror, dm-8 sur sdb

-- 
Daniel

Il y a trois temps qui déplaisent souverainement aux jardiniers : 
le temps sec, le temps pluvieux et le temps en général.
Pierre Daninos

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers [email protected]
En cas de soucis, contactez EN ANGLAIS [email protected]
Archive: https://lists.debian.org/[email protected]

Répondre à