Buna,

 am de un an un Seagate Barracuda 7200.10 SATA, 250GB care are o 
problema ciudata pe care nu-l inteleg. Probleme au inceput acum doua 
saptamani, cu blocare, nerecunoasterea diskului la pornire. Este foarte 
probabil ca era o problema de cablu, fiindca daca miscam cablurile, era 
recunoscut si sistemul pornea. Pana cand o data nu m-ai puteam porni 
linuxul, fiindca imi dadea erori. Am testat cu smartctl -t short si 
long si primeam intr-adevar erori de citire:

Error 152 occurred at disk power-on lifetime: 2483 hours (103 days + 11 
  40 51 00 09 30 04 e0  Error: UNC at LBA = 0x00043009 = 274441

respectiv

#13  Extended offline    Completed: read failure       90%      2483         
274441
#14  Short offline       Completed: read failure       90%      2483         
274441
#15  Short offline       Completed: read failure       90%      2483         
274441

Bine, credeam ca inseamna ca diskul are un bad sector. Dar totusi am 
mutat cablul la un alt port SATA (controler Promise pe Asus A8V) - dar 
fara a schimba cablul, am pornit sistemul, am rulat smartctl -t 
short /dev/sda si smartctl -t long /dev/sda de mai multe ori si nu a 
dat nici o eroare:
# 8  Extended offline    Completed without error       00%      
2498         -
# 9  Short offline       Completed without error       00%      
2495         -
#10  Short offline       Completed without error       00%      
2488         -
#11  Extended offline    Completed without error       00%      
2485         -
#12  Short offline       Completed without error       00%      
2484         -


Numai ca ieri s-a blocat din nou. Acum am decis sa-l schimb cablul si sa 
testez cu badblocks, si in caz ca sunt bad-uri, sa returnez diskul la 
comerciant. Am rulat "badblocks -svn" pe toate partitiile si nu a dat 
nici o eroare. Insa in fiecare 30 de minute primesc urmatoarea eroare 
de la smartd:
Dec  2 17:20:57 stein smartd[4109]: Device: /dev/sda, 4294967295 
Currently unreadable (pending) sectors
Dec  2 17:20:57 stein smartd[4109]: Device: /dev/sda, 4294967295 Offline 
uncorrectable sectors

(si cateodata asa ceva:
ec  2 17:20:57 stein smartd[4109]: Device: /dev/sda, SMART Usage 
Attribute: 190 Temperature_Celsius changed from 81 to 71
Dec  2 17:20:57 stein smartd[4109]: Device: /dev/sda, SMART Usage 
Attribute: 194 Temperature_Celsius changed from 19 to 29
Dec  2 17:20:57 stein smartd[4109]: Device: /dev/sda, SMART Usage 
Attribute: 195 Hardware_ECC_Recovered changed from 80 to 78

dar cum vad Hardware_ECC_Recovered changed am in loguri de cand am 
instalat diskul si nu trebuie sa fie o eroare fatala).

Am verificat logul si primesc acelasi eroare din data cand au inceput 
prima data problemele. Cu smartctl -a /dev/sda vad acelasi lucru:
195 Hardware_ECC_Recovered  0x001a   063   053   000    Old_age   
Always       -       62295350
197 Current_Pending_Sector  0x0012   001   001   000    Old_age   
Always       -       4294967295
198 Offline_Uncorrectable   0x0010   001   001   000    Old_age   
Offline      -       4294967295
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   
Always       -       0

Deci si aici Current_Pending_Sector si Offline_Uncorrectable 
4294967295 .

Acum vine partea pe care nu-l inteleg. Current_Pending_Sector ar trebui 
sa contine numarul sectorului cu probleme, iar solutia recomandata 
pentru corectarea erorii este sa scrii ceva pe sectorul respectiv, 
astfel hard diskul sesizeaza ca e problema cu sectorul si marcheaza ca 
bad, si astfel ar trebui sa dispara eroarea din log (vezi 
http://smartmontools.sourceforge.net/BadBlockHowTo.txt)

Dar sectorul acela nu exista!
fdisk -lu /dev/sda

Disk /dev/sda: 250.0 GB, 250059350016 bytes
255 heads, 63 sectors/track, 30401 cylinders, total 488397168 sectors
Units = sectors of 1 * 512 = 512 bytes
Disk identifier: 0x000ede98

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *          63      208844      104391   83  Linux
/dev/sda2          208845    97884044    48837600   83  Linux
/dev/sda3        97884045   488392064   195254010    5  Extended
/dev/sda5        97884108   293218379    97667136   83  Linux
/dev/sda6       293218443   297138239     1959898+  82  Linux swap / 
Solaris
/dev/sda7       297138303   488392064    95626881   83  Linux

4294967295 e muuult peste ultimul sector!

Cum pot sa sterg aceasta eroare din logul smart? babdlock -svn ar fi 
trebuit sa scrie pe toate sectoarele de pe disk, deci ar fi trebuit sa 
marcheaza ca bad sectorul respectiv - daca exista asa ceva.
Si oare chiar are probleme diskul daca badblocks nu a data nici o 
eroare? Sau chiar era problema de cablu, sau de controler?

(Sectorul din prima eroare - 274441 - este pe /dev/sda2, dar badblocks 
nu a raportat acolo nicio eroare,)

Andras

_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug

Raspunde prin e-mail lui