Hallo zusammen, danke an Florian für die ausführliche Kommentierung des smartctl-Protokolls.
Ich stimme Florian in allen Punkten außer einem zu: > > 191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age > > Always - 1632878 > > Ist eigentlich die Anzahl der Fehler, die durch Stürze verursacht > wurden. Der Wert gibt so hoch aber keinen Sinn - würde ich als "zeichnet > die Platte nicht Sinnvoll auf" einstufen. Da es sich hier um ein Notebook handelt, werden hier nicht nur Abstürze der Festplatte vom Tisch auf den Boden aufgezeichnet, sondern jegliche Bewegungen. Meines Erachtens deutet dieser Wert darauf hin, dass der Rechner beim Transport nicht runtergefahren, sondern nur zugeklappt und dann mitgenommen wird. Durch das dauernde Tragen des Notebooks bei laufender Platte kommt es zu Erschütterungen, die auf Dauer die Festplatte zerstören. Ein Kollege von mir hat das in seiner Beratertätigkeit exzessiv so gemacht und nach kurzer Zeit die Festplatte geschrottet, was - weil ohne Backup - zu Totalverlust der Daten führte. @Thorsten: Fährst Du den Rechner vor dem Transport runter? Viele Grüße Georg > Gesendet: Samstag, 03. April 2021 um 14:22 Uhr > Von: "Florian Knodt" <lug...@adlerweb.info> > An: trolug@trolug.de > Betreff: Re: Festplatte unzuverlässig, > > Moin, > > dann beschränke ich mal auf das Wichtigste. Nich Alle Felder sind bei > allen Platten verfügbar, zudem ist das hier spezifisch für Festplatten. > Bei SSDs wäre z.B. die Abnutzung noch sehr wichtig. > > > === START OF INFORMATION SECTION === > > In dem Abschnitt stehen Hersteller, Modell, Größe, Seriennummer, etc. > Sollte man wenn möglich immer nochmal gegenprüfen, ob man die richtige > Platte erwischt hat. > > > 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail > > Always - 0 > > Für alle folgenden Zeilen gilt: In der ersten Spalte steht der Name > (Raw_Read_Error_Rate), ganz am Ende die menschenlesbare Zahl (0). > > Hier geht es um die Anzahl der Lesefehler. Eine hohe Anzahl kann darauf > hindeuten, dass es Probleme mit den Leseköpfen gibt. Alles >1 heißt, > dass irgendwas mit der Hardware nicht stimmt(e). Kann eine einmale Sache > wie z.B. ein Sturz gewesen sein, der mit Glück keine weiteren Schäden > anrichtet. Dauerhaftere Defekte oder Altersschwäche merkt man wenn die > Zahl über die Zeit steigt. Hier gab es bisher keine Fehler, also Alles OK > > > 4 Start_Stop_Count 0x0032 094 094 000 Old_age > > Always - 6654 > > 12 Power_Cycle_Count 0x0032 096 096 000 Old_age > > Always - 4180 > > Die Platte wurde 6654x aus und wieder eingeschaltet. 4180x war es durch > Strom aus/an. Mehr kann z.B. durch Standbyeinstellungen kommen. Häufiges > Einschalten kann zu Abnutzung führen. Ist aber erst mal nur rein > informativ (Old_age). > > > 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail > > Always - 0 > > 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age > > Always - 0 > > Nu wird es interessant. Ein Reallocated Secor heißt, dass der Controller > der Festplatte festgestellt hat, dass ein Sektor der Festplatte nicht > mehr funktioniert. Auch hier kann es durch einmalige Ereignisse oder > Alter auftreten. In dem Fall kann er auf einen Reservesektor > zurückgreifen und zukünftig den nutzen. Wenn so etwas auftritt ist das > ein sehr guter Zeitpunkt seine Backups schon mal zu suchen. Hier: 0 > Sektoren betroffen und 0 Ereignisse bekannt, alles OK > > > 198 Offline_Uncorrectable 0x0030 100 253 000 Old_age > > Offline - 0 > > Wenn ein Sektor sich nicht retten lässt geht er offline. Wenn das > Betriebssystem versucht dort zu lesen oder schreiben gibt es einen > Fehler. Nix betroffen, alles Gut. > > > 197 Current_Pending_Sector 0x0032 200 200 000 Old_age > > Always - 0 > > Das ist die Corstufe zu Reallocated: Das sind Sektoren, welche zwar noch > funktionieren, aber dem Controller auffällig geworden sind. Wenn wenig > los ist wird der Controller diese üblicherweise nochmal genauer prüfen > und die Daten ggf. in Sicherheit bringen. > > > 9 Power_On_Hours 0x0032 073 073 000 Old_age > > Always - 20327 > > 20327 Stunden lief die Platte, also knapp 2.5 Jahre. Ist rein > informativ. Bei mir gehen Platten üblicherweise in <2 Monaten oder >5 > Jahren kaputt, würde ich also jetzt auch nicht als auffällig einstufen. > > > 191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age > > Always - 1632878 > > Ist eigentlich die Anzahl der Fehler, die durch Stürze verursacht > wurden. Der Wert gibt so hoch aber keinen Sinn - würde ich als "zeichnet > die Platte nicht Sinnvoll auf" einstufen. > > > 194 Temperature_Celsius 0x0022 121 076 000 Old_age > > Always - 26 > > Temperatur halt. 26°C ist OK. Grobe Hausnummer: >40°C wäre bedenklich. > > > 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age > > Always - 0 > > Das wären Fehler in der Übertragung. Die Daten wurden Fehlerfrei > gelesen, gingen aber auf dem Weg zwischen Platte und Rechner kaputt. > Üblicherweise kaputte Kabel oder ähnliches. > > > No Errors Logged > > ...ist dann nochmal die Bestätigung: Der Hardware ist kein Fehler bekannt. > > > Also Zusammenfassung: Auf Hardwareseite sieht da eigentlich alles sauber > aus. Es wurde kein Fehler aufgezeichnet. Ich würde da eher vermuten, > dass die beobachteten Fehler im Dateisystem durch andere Probleme > verursacht wurden (Kernel-Abstürze? Stromausfälle? Softwaredefekte?). > Man könnte wenn man sicher gehen will nochmal einen Selbsttest machen > (Start: smartctl -t long -C /dev/sda # Status/Ergebnis: smartctl -l > selftest /dev/sda # Dauert bei der Platte ca. 157 Minuten), aber ehrlich > gesagt würde ich da so ganz oder Anzeichen eines Fehlers auch nix erwarten. > > Florian > >