Buna, am de un an un Seagate Barracuda 7200.10 SATA, 250GB care are o problema ciudata pe care nu-l inteleg. Probleme au inceput acum doua saptamani, cu blocare, nerecunoasterea diskului la pornire. Este foarte probabil ca era o problema de cablu, fiindca daca miscam cablurile, era recunoscut si sistemul pornea. Pana cand o data nu m-ai puteam porni linuxul, fiindca imi dadea erori. Am testat cu smartctl -t short si long si primeam intr-adevar erori de citire:
Error 152 occurred at disk power-on lifetime: 2483 hours (103 days + 11 40 51 00 09 30 04 e0 Error: UNC at LBA = 0x00043009 = 274441 respectiv #13 Extended offline Completed: read failure 90% 2483 274441 #14 Short offline Completed: read failure 90% 2483 274441 #15 Short offline Completed: read failure 90% 2483 274441 Bine, credeam ca inseamna ca diskul are un bad sector. Dar totusi am mutat cablul la un alt port SATA (controler Promise pe Asus A8V) - dar fara a schimba cablul, am pornit sistemul, am rulat smartctl -t short /dev/sda si smartctl -t long /dev/sda de mai multe ori si nu a dat nici o eroare: # 8 Extended offline Completed without error 00% 2498 - # 9 Short offline Completed without error 00% 2495 - #10 Short offline Completed without error 00% 2488 - #11 Extended offline Completed without error 00% 2485 - #12 Short offline Completed without error 00% 2484 - Numai ca ieri s-a blocat din nou. Acum am decis sa-l schimb cablul si sa testez cu badblocks, si in caz ca sunt bad-uri, sa returnez diskul la comerciant. Am rulat "badblocks -svn" pe toate partitiile si nu a dat nici o eroare. Insa in fiecare 30 de minute primesc urmatoarea eroare de la smartd: Dec 2 17:20:57 stein smartd[4109]: Device: /dev/sda, 4294967295 Currently unreadable (pending) sectors Dec 2 17:20:57 stein smartd[4109]: Device: /dev/sda, 4294967295 Offline uncorrectable sectors (si cateodata asa ceva: ec 2 17:20:57 stein smartd[4109]: Device: /dev/sda, SMART Usage Attribute: 190 Temperature_Celsius changed from 81 to 71 Dec 2 17:20:57 stein smartd[4109]: Device: /dev/sda, SMART Usage Attribute: 194 Temperature_Celsius changed from 19 to 29 Dec 2 17:20:57 stein smartd[4109]: Device: /dev/sda, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 80 to 78 dar cum vad Hardware_ECC_Recovered changed am in loguri de cand am instalat diskul si nu trebuie sa fie o eroare fatala). Am verificat logul si primesc acelasi eroare din data cand au inceput prima data problemele. Cu smartctl -a /dev/sda vad acelasi lucru: 195 Hardware_ECC_Recovered 0x001a 063 053 000 Old_age Always - 62295350 197 Current_Pending_Sector 0x0012 001 001 000 Old_age Always - 4294967295 198 Offline_Uncorrectable 0x0010 001 001 000 Old_age Offline - 4294967295 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 Deci si aici Current_Pending_Sector si Offline_Uncorrectable 4294967295 . Acum vine partea pe care nu-l inteleg. Current_Pending_Sector ar trebui sa contine numarul sectorului cu probleme, iar solutia recomandata pentru corectarea erorii este sa scrii ceva pe sectorul respectiv, astfel hard diskul sesizeaza ca e problema cu sectorul si marcheaza ca bad, si astfel ar trebui sa dispara eroarea din log (vezi http://smartmontools.sourceforge.net/BadBlockHowTo.txt) Dar sectorul acela nu exista! fdisk -lu /dev/sda Disk /dev/sda: 250.0 GB, 250059350016 bytes 255 heads, 63 sectors/track, 30401 cylinders, total 488397168 sectors Units = sectors of 1 * 512 = 512 bytes Disk identifier: 0x000ede98 Device Boot Start End Blocks Id System /dev/sda1 * 63 208844 104391 83 Linux /dev/sda2 208845 97884044 48837600 83 Linux /dev/sda3 97884045 488392064 195254010 5 Extended /dev/sda5 97884108 293218379 97667136 83 Linux /dev/sda6 293218443 297138239 1959898+ 82 Linux swap / Solaris /dev/sda7 297138303 488392064 95626881 83 Linux 4294967295 e muuult peste ultimul sector! Cum pot sa sterg aceasta eroare din logul smart? babdlock -svn ar fi trebuit sa scrie pe toate sectoarele de pe disk, deci ar fi trebuit sa marcheaza ca bad sectorul respectiv - daca exista asa ceva. Si oare chiar are probleme diskul daca badblocks nu a data nici o eroare? Sau chiar era problema de cablu, sau de controler? (Sectorul din prima eroare - 274441 - este pe /dev/sda2, dar badblocks nu a raportat acolo nicio eroare,) Andras _______________________________________________ RLUG mailing list [email protected] http://lists.lug.ro/mailman/listinfo/rlug
