Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-27 Par sujet Frédéric BOITEUX
Le ven 24 mar 2006 16:30:39 CET, Daniel Déchelotte
[EMAIL PROTECTED] a écrit :

 Premiere remarque : cela faisait un bail que je n'avais pas fait de
 test. smartmontools ne devrait pas programmer des tests régulièrement ?
si tu le lui demandes, oui :-)
Modifie ton fichier /etc/default/smartmontools
pour avoir :
start_smartd=yes
et dans /etc/smartd.conf, avoir une ligne du genre :

DEVICESCAN -a -o on -S on -s (S/../.././02|L/../../6/03) \
 -m [EMAIL PROTECTED] \
 -M test

Ce qui lancera un test court tous les jours à 2h du matin, et un test long le
dimanche à 3h du matin...


 Seconde remarque : plus de probleme, apparemment.
 
 Suivant la doc, j'ai fait
 # fdisk -lu /dev/hda
 /dev/hda1  63  499967  249952+  83  Linux
 [...]
 Donc le secteur défectueux (16581) serait sur /dev/hda1
 
 # tune2fs -l /dev/hda1 | grep Block
 Block count:  249952
 Block size:   1024
 Blocks per group: 8192
 
 Ok, taille de 1024. Je fais son calcul :
 # echo (16581 - 63) * 512 / 1024 | bc
 8259
 
 Ok, bloc numero 8259. Je regarde quel fichier l'utilise :
 # debugfs 
 debugfs 1.39-WIP (31-Dec-2005)
 debugfs:  open /dev/hda1
 debugfs:  icheck 8259
 Block   Inode number
 8259block not found
 
 Donc il n'est pas utilisé. (?)
oui, quand le problème arrive suite à un test automatique, il peut s'agir d'un
bloc non utilisé.

 
 Je m'appretais à faire ceci :
 dd if=/dev/hda1 of=/root/backup_dev_hda1_8259 bs=1024 count=1 skip=8259
 dd if=/dev/zero of=/dev/hda1 bs=1024 count=1 seek=8259
 (si ca plante, chouette, sinon, ben tant mieux aussi et je remets :
  dd if=/root/backup_dev_hda1_8259 of=/deb/hda1 bs=1024 count=1 seek=8259)

c'est ce qu'il fallait faire... la sauvegarde ne sert à rien à priori : si elle
fonctionne, alors il n'y a pas de problème donc rien à faire. Si elle ne
fonctionne pas, elle ne sert pas non plus ...

 /dev/hda1 est ma racine, donc je prends quelques précautions. (par
 exemple, j'ai failli inverser skip et seek, ce qui aurait été du
 meilleur effet :)
Oui, attention danger !

Ne pas oublier de faire un couple de 'sync' pour forcer l'écriture des blocs...


Sinon, il arrive que certains disques, même après un retour à la normale, ne
remettent pas à zéro le compteur de blocs en souffrance : du coup, tu te les
traine ad vitam aeternam ...

Fred.



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-25 Par sujet Daniel Déchelotte
Daniel Déchelotte a écrit :

 Frédéric BOITEUX a écrit :
 
  Oui, je ne me rappelle plus si c'est expliqué dans le BadBlockHowto,
  mais le message que tu as [...] persistera tant que le disque ne
  saura pas quoi écrire dans ce bloc qu'il sait défectueux : le seul
  moyen de faire disparaître le message est d'écrire quelque chose
  (généralement des zéros) dans le bloc qui lui pose problème : il
  abandonnera alors le bloc qu'il sait défectueux, et en ré-allouera
  un nouveau pour y écrire ces données. [...]
 
 Ok. J'ai commencé à suivre les instructions, mais me suis arreté juste
 avant le « THIS LAST STEP HAS PERMANENTLY AND IRRETREVIABLY DESTROYED
 SOME OF THE DATA THAT WAS IN THIS FILE. » :)

Et maintenant j'ai passé l'étape irréversible. Résultat : pas de résultat
:-/. Je voudrais juste corriger une erreur de ma part :

 Voici la nouvelle sortie de smartctl -l selftest /dev/hda

 Num  Test_DescriptionStatus  Remaining  LifeTime(hours)  
 LBA_of_first_error
 # 1  Extended offlineCompleted without error   00%  8127 -
 # 2  Short offline   Completed without error   00%  1411 -
 # 3  Short offline   Completed without error   00%  1401 -
 # 4  Short offline   Completed without error   00%  1326 -
 # 5  Short captive   Completed without error   00%  1000 -
 # 6  Short captive   Completed without error   00%  1000 -
 # 7  Short offline   Completed: read failure   70%   997 
 16581
 # 8  Short offline   Completed: read failure   70%   996 
 16581
 [...]
 Donc le secteur défectueux est 16581

Non, il s'agit d'une erreur ancienne (il y a 7000 heures). Pour avoir le
bon bloc, faire : « smartctl -l error /dev/hda », qui me donne

[...]
Error 23 occurred at disk power-on lifetime: 7975 hours (332 days + 7 hours)
  When the command that caused the error occurred, the device was active or 
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 b5 7a 44 0f e0  Error: UNC 181 sectors at LBA = 0x000f447a = 1000570
[...]

Et j'ai suivi les instructions du BadBlockHowto pour le bloc 1000570.

Résultat : les dd (en lecture et en écriture) ont pu se faire sans accroc,
je reste avec mon « 1 Currently unreadable (pending) sectors ». Peut-etre
que c'était le cas depuis longtemps mais que le smartd de sarge ne
l'écrivait pas dans syslog. Seulement, peu de temps après les dd, mon
disque a fait un beep (ca lui arrive de temps en temps quand il travaille
beaucoup, par exemple pendant l'upgrade de sarge en testing). On verra ce
qu'il adviendra de mon disque...

Bon week-end (pluvieux, ici)
-- 
Daniel Déchelotte
  http://yo.dan.free.fr/


-- 
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs From et Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-24 Par sujet Daniel Déchelotte
Bonjour,

Merci pour vos réponses, je vous reviens après des expériences peu
fructueuses.

Frédéric BOITEUX a écrit :

 Daniel Déchelotte a écrit :
 
  Mar 22 17:50:00 igloo smartd[5738]: Device: /dev/hda, 1 Currently
  unreadable (pending) sectors 
 
   Alors, bon, voilà : panique !

Woah !!

 Sérieusement, ce n'est pas parce qu'un secteur de ton disque est
 illisible que le disque entier est fichu [...]

Aah :)

Jean-Michel OLTRA a écrit :

 badblocks -o et e2fsck -l ou -L ?? Jamais fait...

Comme la doc l'indique, j'ai plutot fait des e2fsck -c, mais « rien ne
s'est produit ». Pas d'affichage « j'ai trouvé un bad block », et
toujours le message de smartd.

 [...] Si tu veux supprimer ce message, il te faudra
 identifier le secteur défectueux et le corriger, soit en lisant le
 'BadBlock howto' (http://smartmontools.sourceforge.net/BadBlockHowTo.txt),

Très intéressant, merci pour la lecture.

Voici des extraits de ce que revoient les commandes :
# smartctl -A /dev/hda
  5 Reallocated_Sector_Ct   0x0033   100   100   005Pre-fail  Always   
-   0
196 Reallocated_Event_Count 0x0032   100   100   000Old_age   Always   
-   1
197 Current_Pending_Sector  0x0022   100   100   000Old_age   Always   
-   1
198 Offline_Uncorrectable   0x0008   100   100   000Old_age   Offline  
-   0

Donc là je crois comprendre que mon problème persiste, mais :

# smartctl -l selftest /dev/hda
Num  Test_DescriptionStatus  Remaining  LifeTime(hours)  
LBA_of_first_error
# 1  Short offline   Completed without error   00%  1411 -
# 2  Short offline   Completed without error   00%  1401 -
# 3  Short offline   Completed without error   00%  1326 -
# 4  Short captive   Completed without error   00%  1000 -
# 5  Short captive   Completed without error   00%  1000 -
# 6  Short offline   Completed: read failure   70%   997 
16581
# 7  Short offline   Completed: read failure   70%   996 
16581

Un bloc aurait eu un problème, mais il se serait rétabli ?

J'ai fait un fdisk -c (test en lecture) sur toutes les partitions, et un
-c -c (test en ecriture) sur /dev/hda1, sans qu'il ne trouve rien...  Je
ne suis pas sur que ce soit plus rassurant que d'avoir un bloc franchement
défectueux. :-/

-- 
Daniel Déchelotte
  http://yo.dan.free.fr/


-- 
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs From et Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-24 Par sujet Frédéric BOITEUX
Le ven 24 mar 2006 12:36:11 CET, Daniel Déchelotte
[EMAIL PROTECTED] a écrit :

 Bonjour,

Salut !

 Voici des extraits de ce que revoient les commandes :
 # smartctl -A /dev/hda
   5 Reallocated_Sector_Ct   0x0033   100   100   005Pre-fail  Always  
  -   0
 196 Reallocated_Event_Count 0x0032   100   100   000Old_age   Always  
  -   1
 197 Current_Pending_Sector  0x0022   100   100   000Old_age   Always  
  -   1
 198 Offline_Uncorrectable   0x0008   100   100   000Old_age   Offline 
  -   0

Oui, je ne me rappelle plus si c'est expliqué dans le BadBlockHowto, mais le
message que tu as (qui correspond au '1' en fin de la ligne :
197 Current_Pending_Sector  0x0022   100   100   000Old_age   Always   
-   1)
persistera tant que le disque ne saura pas quoi écrire dans ce bloc qu'il sait
défectueux : le seul moyen de faire disparaître le message est d'écrire quelque
chose (généralement des zéros) dans le bloc qui lui pose problème : il
abandonnera alors le bloc qu'il sait défectueux, et en ré-allouera un
nouveau pour y écrire ces données. Tu devrais alors avoir le compteur
'Reallocated_Sector_Ct' incrémenté.

 Donc là je crois comprendre que mon problème persiste, mais :
 
 # smartctl -l selftest /dev/hda
 Num  Test_DescriptionStatus  Remaining  LifeTime(hours)  
 LBA_of_first_error
 # 1  Short offline   Completed without error   00%  1411 -
 # 2  Short offline   Completed without error   00%  1401 -
 # 3  Short offline   Completed without error   00%  1326 -
 # 4  Short captive   Completed without error   00%  1000 -
 # 5  Short captive   Completed without error   00%  1000 -
 # 6  Short offline   Completed: read failure   70%   997 
 16581
 # 7  Short offline   Completed: read failure   70%   996 
 16581
 
 Un bloc aurait eu un problème, mais il se serait rétabli ?

Le test court ne parcours sans doute pas tout le disque (essaie un test long :
smartctl -t long /dev/hda) ...

 
 J'ai fait un fdisk -c (test en lecture) sur toutes les partitions, et un
 -c -c (test en ecriture) sur /dev/hda1, sans qu'il ne trouve rien...  Je
 ne suis pas sur que ce soit plus rassurant que d'avoir un bloc franchement
 défectueux. :-/

Connais-tu le numéro de bloc qui pose problème ? si oui, il faut appliquer la
méthode expliquée dans le howto pour corriger définitivement le problème.

Fred.



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-24 Par sujet Daniel Déchelotte
Frédéric BOITEUX a écrit :

 Oui, je ne me rappelle plus si c'est expliqué dans le BadBlockHowto,
 mais le message que tu as (qui correspond au '1' en fin de la ligne :
 197 Current_Pending_Sector  0x0022   100   100   000Old_age
 Always   -   1) persistera tant que le disque ne saura pas
 quoi écrire dans ce bloc qu'il sait défectueux : le seul moyen de
 faire disparaître le message est d'écrire quelque chose (généralement
 des zéros) dans le bloc qui lui pose problème : il abandonnera alors
 le bloc qu'il sait défectueux, et en ré-allouera un nouveau pour y
 écrire ces données. Tu devrais alors avoir le compteur
 'Reallocated_Sector_Ct' incrémenté.

Ok. J'ai commencé à suivre les instructions, mais me suis arreté juste
avant le « THIS LAST STEP HAS PERMANENTLY AND IRRETREVIABLY DESTROYED
SOME OF THE DATA THAT WAS IN THIS FILE. » :)

 Le test court ne parcours sans doute pas tout le disque (essaie un
 test long : smartctl -t long /dev/hda) ...

Je viens de le faire. Voici la nouvelle sortie de smartctl -l selftest /dev/hda

Num  Test_DescriptionStatus  Remaining  LifeTime(hours)  
LBA_of_first_error
# 1  Extended offlineCompleted without error   00%  8127 -
# 2  Short offline   Completed without error   00%  1411 -
# 3  Short offline   Completed without error   00%  1401 -
# 4  Short offline   Completed without error   00%  1326 -
# 5  Short captive   Completed without error   00%  1000 -
# 6  Short captive   Completed without error   00%  1000 -
# 7  Short offline   Completed: read failure   70%   997 
16581
# 8  Short offline   Completed: read failure   70%   996 
16581

Premiere remarque : cela faisait un bail que je n'avais pas fait de
test. smartmontools ne devrait pas programmer des tests régulièrement ?

Seconde remarque : plus de probleme, apparemment.

Suivant la doc, j'ai fait
# fdisk -lu /dev/hda
/dev/hda1  63  499967  249952+  83  Linux
[...]
Donc le secteur défectueux (16581) serait sur /dev/hda1

# tune2fs -l /dev/hda1 | grep Block
Block count:  249952
Block size:   1024
Blocks per group: 8192

Ok, taille de 1024. Je fais son calcul :
# echo (16581 - 63) * 512 / 1024 | bc
8259

Ok, bloc numero 8259. Je regarde quel fichier l'utilise :
# debugfs 
debugfs 1.39-WIP (31-Dec-2005)
debugfs:  open /dev/hda1
debugfs:  icheck 8259
Block   Inode number
8259block not found

Donc il n'est pas utilisé. (?)

Je m'appretais à faire ceci :
dd if=/dev/hda1 of=/root/backup_dev_hda1_8259 bs=1024 count=1 skip=8259
dd if=/dev/zero of=/dev/hda1 bs=1024 count=1 seek=8259
(si ca plante, chouette, sinon, ben tant mieux aussi et je remets :
 dd if=/root/backup_dev_hda1_8259 of=/deb/hda1 bs=1024 count=1 seek=8259)

/dev/hda1 est ma racine, donc je prends quelques précautions. (par
exemple, j'ai failli inverser skip et seek, ce qui aurait été du
meilleur effet :)

-- 
Daniel Déchelotte
  http://yo.dan.free.fr/


-- 
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs From et Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



1 Currently unreadable (pending) sectors : je panique ?

2006-03-22 Par sujet Daniel Déchelotte
Bonjour,

Depuis qu'un fsck de routine (après 30 montages) m'a détecté un
problème sur le DD, mon syslog contient régulièrement la ligne
suivante :

Mar 22 17:50:00 igloo smartd[5738]: Device: /dev/hda, 1 Currently unreadable 
(pending) sectors 

Questions en vrac : le pending semble suggérer qu'il y a quelque
chose à faire pour éviter le secteur défectueux, quelle commande
lancer ? Est-ce que cela va dégénérer ? Ou bien la vie de mon DD peut
continuer si j'évite le secteur défectueux ?

Pour l'instant, je ne remarque rien d'anormal quand j'utilise mon ordi.

-- 
Daniel Déchelotte
  http://yo.dan.free.fr/


-- 
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs From et Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-22 Par sujet Jean-Michel OLTRA

bonjour,


Le mercredi 22 mars 2006, Daniel Déchelotte a écrit...


 Mar 22 17:50:00 igloo smartd[5738]: Device: /dev/hda, 1 Currently unreadable 
 (pending) sectors 

 Questions en vrac : le pending semble suggérer qu'il y a quelque
 chose à faire pour éviter le secteur défectueux, quelle commande
 lancer ? Est-ce que cela va dégénérer ? Ou bien la vie de mon DD peut
 continuer si j'évite le secteur défectueux ?

badblocks -o et e2fsck -l ou -L ?? Jamais fait...

-- 
jm



-- 
Pensez � lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez � rajouter le mot ``spam'' dans vos champs From et Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-22 Par sujet Gurvan Huiban
Le Mercredi 22 Mars 2006 14:03, Daniel Déchelotte a écrit :
 Questions en vrac : le pending semble suggérer qu'il y a quelque
 chose à faire pour éviter le secteur défectueux, quelle commande
 lancer ? Est-ce que cela va dégénérer ? Ou bien la vie de mon DD peut
 continuer si j'évite le secteur défectueux ?

 Pour l'instant, je ne remarque rien d'anormal quand j'utilise mon ordi.

De ma (faible) expérience, on n'a aucun moyen de savoir si ça va dégénérer ou 
si ton DD va continuer de vivre pendant des années sans le moindre (autre) 
problème.

Je conseille:
- d'abord un coup de badblocks sur la partition. Ça marque le secteur 
défectueux, l'OS n'essaie plus d'y accéder. Ça peut être suffisant.
- si après ça tu continues d'avoir des problèmes, une formatation bas niveau 
du disque dur peut remettre tout ça d'équerre.
- si après la formatation bas niveau le problème revient, changer de disque 
dur devient une option à considérer très fortement.

Et faire des backups régulièrement, ça va de soi... 

-- 

Gurvan Huiban

What about a nice cup of coffee? (self-citation)



Re: 1 Currently unreadable (pending) sectors : je panique ?

2006-03-22 Par sujet Frédéric BOITEUX
Le mer 22 mar 2006 18:03:28 CET, Daniel Déchelotte
[EMAIL PROTECTED] a écrit :

 Bonjour,
 
 Depuis qu'un fsck de routine (après 30 montages) m'a détecté un
 problème sur le DD, mon syslog contient régulièrement la ligne
 suivante :
 
 Mar 22 17:50:00 igloo smartd[5738]: Device: /dev/hda, 1 Currently unreadable 
 (pending) sectors 
 
 Questions en vrac : le pending semble suggérer qu'il y a quelque
 chose à faire pour éviter le secteur défectueux, quelle commande
 lancer ? Est-ce que cela va dégénérer ? Ou bien la vie de mon DD peut
 continuer si j'évite le secteur défectueux ?
 

Salut,

  Alors, bon, voilà : panique !
...
Ça y est ? Bon, tu peux t'arrêter là, ça suffit ;-) Sérieusement, ce n'est pas
parce qu'un secteur de ton disque est illisible que le disque entier est
fichu (regarde un peu combien il en a) ! En fait, cela arrive parfois sans que
tu le saches, car ton disque sait ré-allouer des secteurs lorsqu'il n'arrive
pas à accéder à d'autres. Simplement, si on lui demande de lire un secteur et
qu'il n'y arrive pas, il ne peut le ré-allouer ailleurs tant qu'il ne sait pas
quoi y mettre, ce que t'indique le message ci-dessus !

  Ce que je te conseille, c'est d'installer si ce n'est déjà fait le paquet
smartmontools, qui entre autres te permettra d'accéder aux informations de
santé de ton disque, et de lui demander de faire des tests régulièrement.
 Si tu veux supprimer ce message, il te faudra identifier le secteur défectueux
et le corriger, soit en lisant le
'BadBlock howto' (http://smartmontools.sourceforge.net/BadBlockHowTo.txt),
sinon je peux te passer en privé une ébauche de doc en français...

Fred.