Hola,

Des de fa uns dies, l'ordinador de casa m'ha començat a fer coses
estranyes, de cop i volta es queda a Bàbia mentre el dimoni ksoftirqd ocupa
tot el temps de procés, després torna a la terra i puc seguir treballant.
En reiniciar, de voltes troba errors a /dev/sda3 (partició root) i em
llança a un terminal d'emergència on he d'executar fsck manualment. Troba
uns quants errors i tira endavant.

De tant en tant em vaig trobant amb errors curiosos, com quan després de
fer un "locate" em troba errors I/O a /var/.../...mlocate.db. Si provo
seguidament de fer un updatedb em diu que el sistema de fitxers a sda3 és
de sols lectura. Si reinicio, tot torna a la normalitat (de moment).

Jo he sospitat errors de disc, i un smartctl -t short /dev/sda em diu que
alguna cosa no rutlla:
smartctl -l selftest /dev/sda
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining
LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%
6964         13671800
# 2  Extended offline    Completed without error       00%
4998         -
# 3  Conveyance offline  Completed without error       00%
4828         -
# 4  Extended offline    Completed without error       00%
4824         -
# 5  Short offline       Completed without error       00%      4820

He provat de canviar cables SATA, d'alimentació i desconnectar el sdb i el
cdrom (fa temps errors similars els vaig solucionar així, semblava que la
font d'alimentació no donava abast) però aquesta vegada no ha sonat la
flauta.

A /var/log/syslog es repeteixen amb preocupant insistència les següents
línees:

Feb 29 02:03:48 ordinador kernel: [  167.308050] ata6.00: exception Emask
0x0 SAct 0x0 SErr 0x0 action 0x0
Feb 29 02:03:48 ordinador kernel: [  167.308057] ata6.00: BMDMA stat 0x24
Feb 29 02:03:48 ordinador kernel: [  167.308062] ata6.00: failed command:
READ DMA
Feb 29 02:03:48 ordinador kernel: [  167.308071] ata6.00: cmd
c8/00:08:22:e7:ce/00:00:00:00:00/ed tag 0 dma 4096 in
Feb 29 02:03:48 ordinador kernel: [  167.308071]          res
51/40:00:28:e7:ce/00:00:00:00:00/ed Emask 0x9 (media error)
Feb 29 02:03:48 ordinador kernel: [  167.308076] ata6.00: status: { DRDY
ERR }
Feb 29 02:03:48 ordinador kernel: [  167.308079] ata6.00: error: { UNC }
Feb 29 02:03:48 ordinador kernel: [  167.324815] ata6.00: configured for
UDMA/133
Feb 29 02:03:48 ordinador kernel: [  167.324834] sd 5:0:0:0: [sda]
Unhandled sense code
Feb 29 02:03:48 ordinador kernel: [  167.324838] sd 5:0:0:0: [sda]
Feb 29 02:03:48 ordinador kernel: [  167.324842] Result: hostbyte=DID_OK
driverbyte=DRIVER_SENSE
Feb 29 02:03:48 ordinador kernel: [  167.324845] sd 5:0:0:0: [sda]
Feb 29 02:03:48 ordinador kernel: [  167.324848] Sense Key : Medium Error
[current] [descriptor]
Feb 29 02:03:48 ordinador kernel: [  167.324853] Descriptor sense data with
sense descriptors (in hex):
Feb 29 02:03:48 ordinador kernel: [  167.324856]         72 03 11 04 00 00
00 0c 00 0a 80 00 00 00 00 00
Feb 29 02:03:48 ordinador kernel: [  167.324869]         0d ce e7 28
Feb 29 02:03:48 ordinador kernel: [  167.324875] sd 5:0:0:0: [sda]
Feb 29 02:03:48 ordinador kernel: [  167.324879] Add. Sense: Unrecovered
read error - auto reallocate failed
Feb 29 02:03:48 ordinador kernel: [  167.324883] sd 5:0:0:0: [sda] CDB:
Feb 29 02:03:48 ordinador kernel: [  167.324886] Read(10): 28 00 0d ce e7
22 00 00 08 00
Feb 29 02:03:48 ordinador kernel: [  167.324897] end_request: I/O error,
dev sda, sector 231663400
Feb 29 02:03:48 ordinador kernel: [  167.324924] ata6: EH complete

tot i que de cop es passa hores sense reportar errors.

Ara li estic fent un smartctl -t long /dev/sda, però mentre l'acaba, us
vull fer una pregunta... vaig encarregant disc dur nou?

Salut

Ricard

Respondre per correu electrònic a