Re: Festplatte unzuverlässig

2021-04-03 Diskussionsfäden Florian Knodt
Moin,

On 03.04.2021 14:34, g.maub...@gmx.de wrote:
> Da es sich hier um ein Notebook handelt, werden hier nicht nur Abstürze der 
> Festplatte vom Tisch auf den Boden aufgezeichnet, sondern jegliche 
> Bewegungen. Meines Erachtens deutet dieser Wert darauf hin, dass der Rechner 
> beim Transport nicht runtergefahren, sondern nur zugeklappt und dann 
> mitgenommen wird. Durch das dauernde Tragen des Notebooks bei laufender 
> Platte kommt es zu Erschütterungen, die auf Dauer die Festplatte zerstören. 

Hm, prinzipiell ja, der G-Sensor löst natülich auch bei Bewegungen aus,
allerdings sollte bei allem mit Relevanz dann die Platte automatisch in
eine Parkposition zurückfallen um Kopfschäden zu vermeiden. Das würde
dann aber mMn auch im Start_Stop_Count aufschlagen.

Am Ende dient die Zahl auch eher als Anhaltspunkt. Jeder Hersteller hat
da eigene Ideen was eine Bewegung ist. WD hat den Ruf da eher jedne
Luftzug zu beachten. Ich erinnere an gewisse Videos eines Datacenters,
in dem die Luftvibrationen durch lautes Sprechen als zusätzliche
Positionslatenz der Festplatten in den Statistiken sichtbar ist.

Florian



Re: Festplatte unzuverlässig,

2021-04-03 Diskussionsfäden Florian Knodt
Moin,

dann beschränke ich mal auf das Wichtigste. Nich Alle Felder sind bei
allen Platten verfügbar, zudem ist das hier spezifisch für Festplatten.
Bei SSDs wäre z.B. die Abnutzung noch sehr wichtig.

> === START OF INFORMATION SECTION ===

In dem Abschnitt stehen Hersteller, Modell, Größe, Seriennummer, etc.
Sollte man wenn möglich immer nochmal gegenprüfen, ob man die richtige
Platte erwischt hat.

>   1 Raw_Read_Error_Rate 0x002f   200   200   051Pre-fail
> Always   -   0

Für alle folgenden Zeilen gilt: In der ersten Spalte steht der Name
(Raw_Read_Error_Rate), ganz am Ende die menschenlesbare Zahl (0).

Hier geht es um die Anzahl der Lesefehler. Eine hohe Anzahl kann darauf
hindeuten, dass es Probleme mit den Leseköpfen gibt. Alles >1 heißt,
dass irgendwas mit der Hardware nicht stimmt(e). Kann eine einmale Sache
wie z.B. ein Sturz gewesen sein, der mit Glück keine weiteren Schäden
anrichtet. Dauerhaftere Defekte oder Altersschwäche merkt man wenn die
Zahl über die Zeit steigt. Hier gab es bisher keine Fehler, also Alles OK

>   4 Start_Stop_Count0x0032   094   094   000Old_age
> Always   -   6654
>  12 Power_Cycle_Count   0x0032   096   096   000Old_age
> Always   -   4180

Die Platte wurde 6654x aus und wieder eingeschaltet. 4180x war es durch
Strom aus/an. Mehr kann z.B. durch Standbyeinstellungen kommen. Häufiges
Einschalten kann zu Abnutzung führen. Ist aber erst mal nur rein
informativ (Old_age).

>   5 Reallocated_Sector_Ct   0x0033   200   200   140Pre-fail
> Always   -   0
> 196 Reallocated_Event_Count 0x0032   200   200   000Old_age
> Always   -   0

Nu wird es interessant. Ein Reallocated Secor heißt, dass der Controller
der Festplatte festgestellt hat, dass ein Sektor der Festplatte nicht
mehr funktioniert. Auch hier kann es durch einmalige Ereignisse oder
Alter auftreten. In dem Fall kann er auf einen Reservesektor
zurückgreifen und zukünftig den nutzen. Wenn so etwas auftritt ist das
ein sehr guter Zeitpunkt seine Backups schon mal zu suchen. Hier: 0
Sektoren betroffen und 0 Ereignisse bekannt, alles OK

> 198 Offline_Uncorrectable   0x0030   100   253   000Old_age
> Offline  -   0

Wenn ein Sektor sich nicht retten lässt geht er offline. Wenn das
Betriebssystem versucht dort zu lesen oder schreiben gibt es einen
Fehler. Nix betroffen, alles Gut.

> 197 Current_Pending_Sector  0x0032   200   200   000Old_age
> Always   -   0

Das ist die Corstufe zu Reallocated: Das sind Sektoren, welche zwar noch
funktionieren, aber dem Controller auffällig geworden sind. Wenn wenig
los ist wird der Controller diese üblicherweise nochmal genauer prüfen
und die Daten ggf. in Sicherheit bringen.

>   9 Power_On_Hours  0x0032   073   073   000Old_age
> Always   -   20327

20327 Stunden lief die Platte, also knapp 2.5 Jahre. Ist rein
informativ. Bei mir gehen Platten üblicherweise in <2 Monaten oder >5
Jahren kaputt, würde ich also jetzt auch nicht als auffällig einstufen.

> 191 G-Sense_Error_Rate  0x0032   001   001   000Old_age
> Always   -   1632878

Ist eigentlich die Anzahl der Fehler, die durch Stürze verursacht
wurden. Der Wert gibt so hoch aber keinen Sinn - würde ich als "zeichnet
die Platte nicht Sinnvoll auf" einstufen.

> 194 Temperature_Celsius 0x0022   121   076   000Old_age
> Always   -   26

Temperatur halt. 26°C ist OK. Grobe Hausnummer: >40°C wäre bedenklich.

> 199 UDMA_CRC_Error_Count0x0032   200   200   000Old_age
> Always   -   0

Das wären Fehler in der Übertragung. Die Daten wurden Fehlerfrei
gelesen, gingen aber auf dem Weg zwischen Platte und Rechner kaputt.
Üblicherweise kaputte Kabel oder ähnliches.

> No Errors Logged

...ist dann nochmal die Bestätigung: Der Hardware ist kein Fehler bekannt.


Also Zusammenfassung: Auf Hardwareseite sieht da eigentlich alles sauber
aus. Es wurde kein Fehler aufgezeichnet. Ich würde da eher vermuten,
dass die beobachteten Fehler im Dateisystem durch andere Probleme
verursacht wurden (Kernel-Abstürze? Stromausfälle? Softwaredefekte?).
Man könnte wenn man sicher gehen will nochmal einen Selbsttest machen
(Start: smartctl -t long -C /dev/sda # Status/Ergebnis: smartctl -l
selftest /dev/sda # Dauert bei der Platte ca. 157 Minuten), aber ehrlich
gesagt würde ich da so ganz oder Anzeichen eines Fehlers auch nix erwarten.

Florian



Re: Festplatte unzuverlässig,

2021-04-03 Diskussionsfäden Florian Knodt
Moin,

On 03.04.2021 11:28, Thorsten Kern wrote:
> Kann ich von einen hardwaredefekt ausgehen

Ich würde erst mal mit smartctl -a /dev/sda die Parameter der Platte
anschauen. Dort ist z.B. zu sehen ob es defekte Blöcke (=Platte kaputt)
oder Übertragungsfehler (Kabel nicht richtig drin?) die Ursache sind.

> und daher mittels
> dd if=/dev/sda  of=/dev/sdb die platte klonen
> um mir die Arbeit des neuaufsetzen zu sparen,
> oder kann ich mir direkt das klonen sparen?

Klonen kann funktionieren, ich würde wenn aber ddrescue empfehlen, das
kommt mit kaputten Quellen besser klar. Da du allerdings ext4 verwendest
hast du keinen "Dateischutz". Wenn eine Datei durch die defekten Blöcke
beschädigt wurde kann das nicht automatisch festgestellt werden. Schäden
bleiben im Zweifel also Verborgen so lange du nicht selbst prüfst. Wenn
du also einen sicherern Datenbestand haben willst wäre das Backup die
bessere Wahl.

Florian



Re: Re: Festplatte unzuverlässig

2021-04-03 Diskussionsfäden Thorsten Kern
Hallo,

auch von mir ein Dankeschön für die Erläuterung von Florian.

Zur Frage von Georg,

Nein , Tatsächlich fahre ich den Laptop nicht immer herunter, wenn er
transportiert wurde.
Ich bin bis heute der Auffassung gewesen, das dieser in
Energiesparmodus ist und alle Komponenten in Ruhestellung sind
(einschließlich Festplatte), nur der Arbeitsspeicher arbeitet, indem
er den Geräte-Betriebszustand  im Arbeitsspeicher behält(und natürlich
das Keyboard zum wieder aufwecken).

Mit diesen Informationen kann ich nun direkt meine Entscheidung , wie
es weiter geht, mitteilen:
1.) DIe bisherige Platte wird als defekt deklariert!
2.) auf der baugleichen Platte wird das System neu wieder aufgesetzt.
3.) Zum Transport wird zukünftig sichergestellt, dass der Laptop
heruntergefahren ist, und nicht nur Klappe geschlossen/ Ruhezustand!
Daten sind keine verloren gegangen, da ich aufgrund der
Systemaktualisierung sowieso schon alles gesichert hatte.

Ich wünsche euch ein frohes Osterfest
(falls mir nicht doch noch vorher eine Frage auf der Zunge/tastatur
liegt, mit der ich euch behelligen kann)

mit freundlichen Gruß aus Lindlar

Thorsten Kern

Am Sa., 3. Apr. 2021 um 14:34 Uhr schrieb :
>
> Hallo zusammen,
>
> danke an Florian für die ausführliche Kommentierung des smartctl-Protokolls.
>
> Ich stimme Florian in allen Punkten außer einem zu:
>
> > > 191 G-Sense_Error_Rate  0x0032   001   001   000Old_age
> > > Always   -   1632878
> >
> > Ist eigentlich die Anzahl der Fehler, die durch Stürze verursacht
> > wurden. Der Wert gibt so hoch aber keinen Sinn - würde ich als "zeichnet
> > die Platte nicht Sinnvoll auf" einstufen.
>
> Da es sich hier um ein Notebook handelt, werden hier nicht nur Abstürze der 
> Festplatte vom Tisch auf den Boden aufgezeichnet, sondern jegliche 
> Bewegungen. Meines Erachtens deutet dieser Wert darauf hin, dass der Rechner 
> beim Transport nicht runtergefahren, sondern nur zugeklappt und dann 
> mitgenommen wird. Durch das dauernde Tragen des Notebooks bei laufender 
> Platte kommt es zu Erschütterungen, die auf Dauer die Festplatte zerstören. 
> Ein Kollege von mir hat das in seiner Beratertätigkeit exzessiv so gemacht 
> und nach kurzer Zeit die Festplatte geschrottet, was - weil ohne Backup - zu 
> Totalverlust der Daten führte.
>
> @Thorsten: Fährst Du den Rechner vor dem Transport runter?
>
> Viele Grüße
>
> Georg
>
> > Gesendet: Samstag, 03. April 2021 um 14:22 Uhr
> > Von: "Florian Knodt" 
> > An: trolug@trolug.de
> > Betreff: Re: Festplatte unzuverlässig,
> >
> > Moin,
> >
> > dann beschränke ich mal auf das Wichtigste. Nich Alle Felder sind bei
> > allen Platten verfügbar, zudem ist das hier spezifisch für Festplatten.
> > Bei SSDs wäre z.B. die Abnutzung noch sehr wichtig.
> >
> > > === START OF INFORMATION SECTION ===
> >
> > In dem Abschnitt stehen Hersteller, Modell, Größe, Seriennummer, etc.
> > Sollte man wenn möglich immer nochmal gegenprüfen, ob man die richtige
> > Platte erwischt hat.
> >
> > >   1 Raw_Read_Error_Rate 0x002f   200   200   051Pre-fail
> > > Always   -   0
> >
> > Für alle folgenden Zeilen gilt: In der ersten Spalte steht der Name
> > (Raw_Read_Error_Rate), ganz am Ende die menschenlesbare Zahl (0).
> >
> > Hier geht es um die Anzahl der Lesefehler. Eine hohe Anzahl kann darauf
> > hindeuten, dass es Probleme mit den Leseköpfen gibt. Alles >1 heißt,
> > dass irgendwas mit der Hardware nicht stimmt(e). Kann eine einmale Sache
> > wie z.B. ein Sturz gewesen sein, der mit Glück keine weiteren Schäden
> > anrichtet. Dauerhaftere Defekte oder Altersschwäche merkt man wenn die
> > Zahl über die Zeit steigt. Hier gab es bisher keine Fehler, also Alles OK
> >
> > >   4 Start_Stop_Count0x0032   094   094   000Old_age
> > > Always   -   6654
> > >  12 Power_Cycle_Count   0x0032   096   096   000Old_age
> > > Always   -   4180
> >
> > Die Platte wurde 6654x aus und wieder eingeschaltet. 4180x war es durch
> > Strom aus/an. Mehr kann z.B. durch Standbyeinstellungen kommen. Häufiges
> > Einschalten kann zu Abnutzung führen. Ist aber erst mal nur rein
> > informativ (Old_age).
> >
> > >   5 Reallocated_Sector_Ct   0x0033   200   200   140Pre-fail
> > > Always   -   0
> > > 196 Reallocated_Event_Count 0x0032   200   200   000Old_age
> > > Always   -   0
> >
> > Nu wird es interessant. Ein Reallocated Secor heißt, dass der Controller
> > der Festplatte festgestellt hat, dass ein Sektor der Festplatte nicht
> > mehr funktioniert. Auch hier kann es durch einmalige Ereignisse oder
> > Alter auftreten. In dem Fall kann er auf einen Reservesektor
> > zurückgreifen und zukünftig den nutzen. Wenn so etwas auftritt ist das
> > ein sehr guter Zeitpunkt seine Backups schon mal zu suchen. Hier: 0
> > Sektoren betroffen und 0 Ereignisse bekannt, alles OK
> >
> > > 198 Offline_Uncorrectable   0x0030   100   253   000Old_age
> > > Offline  -   0
> >
> > Wenn ein Sektor sich nicht retten 

Re: Festplatte unzuverlässig,

2021-04-03 Diskussionsfäden Jonas Stein

Hallo Thorsten,

also da steht
diese magnetische Festplatte hat bereits 20327 Betriebsstunden runter.
Typisch ist, dass die Hochlaufzeit mit zunehmendem Alter steigt

3 Spin_Up_Time  0x0027   205   166   021  Pre-fail Always 741

Das ist aber erstmal nicht kritisch.

Entscheidend ist die Zahl der Reallozierten Sektoren.

5 Reallocated_Sector_Ct   0x0033   200   200   140Pre-fail
Always -  0

Also noch 0, das ist gut. Wenn der Wert nicht mehr Null ist, solle man 
schnell zu einer neuen Festplatte wechseln.

Die anderen Werte sehen auch nicht auffällig aus.

Trotzdem, lohnt es sich sie gegen eine SSD auzutauschen.
Der Geschwindigkeitsvorteil ist enorm.



Folgener Part aus Deiner ersten Mail wundert mich etwas

Group descriptor 2806 checksum is 0x5648, should be 0x1e5a.  FIXED.
Group descriptor 2807 checksum is 0x43de, should be 0x0bcc.  FIXED.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
fsck: Warning... fsck.ext4 for device /dev/sda7 exited with signal 9.


Warum hat fsck mit sig 9 terminiert? Das ist ein SIGKILL, hast Du das 
mit Kill beendet? Lief ein Shutdown?


siehe https://de.wikipedia.org/wiki/Signal_(Unix)

Es sieht eher danach aus, dass das Dateisystem Fehler hat.

Beste Grüße,

--
Jonas Stein



Re: Festplatte unzuverlässig,

2021-04-03 Diskussionsfäden Randy Andy

Hallo Thorsten,

was man im Vorfeld noch alles prüfen sollte, das mir so ad hoc in den 
Sinn zu deiner Problematik kommt:


- Die Belegung, also den Füllgrad deiner Linux-Partition sda7 z.B. mit:
# df -h
Denn ist diese mehr als ca. 95% gefüllt könnte das eventuell auch 
derartiges Bewirken.


- Im BIOS des Rechners unbedingt Smart auf enabled stellen, also 
aktivieren, falls es dafür eine Option dort gibt oder unklar ist ob es 
aktiv ist. Nur so kann SMART automatische Reparaturen in Form von Sector 
remapping bewirken, falls noch genügend Reserve-Sektoren auf der Platte 
zur Verfügung stehen und es sich nicht um ein anderweitiges irreparables 
Fehlerbild handelt.


Dass deine Partition sda4 nicht auftaucht ist ganz normal bei msdos- 
Partitionstabellen mit erweitertem Partionsschema unter Verwendung 
logischer Partitionen. //also immer wenn man mehr als 4 primäre 
Partitionen verwendet.


Normaler Weise kann es dann nach drei primären Partitionen mit sda5 als 
erster logischer Partition weitergehen. Es muss aber kein Fehler sein 
dass diese nicht auftaucht, so kann sie denn z.B. als versteckt markiert 
sein oder wurde gelöscht.


Eventuell ist deine sda5 auch eine Wiederherstellungspartition von 
Windows - die wird bei Laptops gerne versteckt mitausgeliefert und wird 
dann über Boot-Tastenkombinationen zur Wiederherstellung angesprochen.


Deine sda6 ist jedenfalls auch eine Partition, die noch "irgendwie" zu 
deiner Windows-Installation gehört.



Mehr Auskunft darüber könnte z.B. eine Befehl wie:
# parted -l
oder
# sfdisk -d /dev/sda
liefern


Detailliertere Information rund um die Hintergründe findest Du auch in 
einem Artikel, den ich mal hier vor langer Zeit verfasst hatte und der 
weiterhin Gültigkeit besitzt und dir eventuell nützliches Wissen dazu 
vermitteln kann.

http://www.freiesmagazin.de/ftp/2013/freiesMagazin-2013-10.pdf

Wenngleich sich manche Befehle dank neuere Optionen heutzutage etwas 
leichter umsetzten ließen, ich denke dabei z.B. auch an den Befehl zum 
laufenden Status von dd, den man heute dank der Option

# status=progress ganz leicht implementieren kann.

Darin findest du dann auch nützliche Hinweise wie z.B. notwendige dd 


rescue parameter zu deiner eventuell notwendig werdenden Vorgehensweise.


Deine SMART Parameter wurden ja mittlerweile schon gut von Florian 
erklärt, das erspart mir darauf näher eingehen zu müssen - 
sehr schön. ;-)

Vielleicht noch als kleine Ergänzung dazu:

In der Regel starte ich bei vermuteten physischen Festplattenproblemen 
meist erst mal mit einem kurzen Test, der nur zwei Minuten benötigt so:

# smartctl -t short /dev/sdx

Die Endzeit des Tests wird einem präzise vorhergesagt, prüfen mit date 
ob sie schon abgelaufen ist. (gilt natürlich umso mehr für den  
test. ;-)
Danach dann dessen Ergebnisse auslesen wie schon zuvor von Florian 
beschrieben.


Wie gesagt, ist SMART nicht auf dem PC aktiv, passiert auch kein 
remapping, dann wird bei Fehlern gern rebootet bzw. man hängt in einem 
endless Fehlerloop da auch reparable Hardware-Fehler nicht korrigiert 
werden können.
Nichtsdestotrotz immer ein Wink mit dem Zaunpfahl deiner Festplatte, 
sich mal um das Thema Backup zu kümmern, bevor es ganz zu spät ist.
Ich hab aber auch manche Festplatte, die nach dem dann aktivierten SMART 
im BIOS und erfolgreichen remapping seit Jahren weiter funktioniert, 
aber sicher gemäß Murphy nur deshalb, weil ich ein Backup davon 
habe. ;-)



Wünsche ansonsten aber viel Erfolg beim österlichen
[D]e[s]aster-Recovery! ;-)

Gruß, Andy.






Am 03.04.21 um 11:28 schrieb Thorsten Kern:

Hallo,

nachdem ich im März mein Laptop neu aufgesetzt habe,
(Mailthema: "Neues Linux auf meinen Laptop / allgemein Empfehlung für
neue Linuxbenutzer")

habe ich nun mit plötzlichen Neustarts zu kämpfen.
Mittlerweile komme ich nur noch zum Desktop nach der Anmeldung,
nachdem der Desktop erscheint und ich einen Befehl ausführen möchte,
geht der Rechner aus und startet neu.

Ich habe eine baugleiche Festplatte ( Window 7) eingebaut und gestartet,
hier arbeitet der Laptop , ohne das er von alleine neustartet.

Ich habe nun die bisherige Festplatte mit einen USB Adapter an einen
Raspberry Pi angeschlossen

sudo blkid -o list -w /dev/null sagt:
(nur sda Einträge hierher kopiert)
/dev/sda1  ntfs  PQSERVICE
/dev/sda2  ntfs  SYSTEM RESERVED
/dev/sda3  ntfs  Acer
/dev/sda6  vfat
/dev/sda7  ext4

sda1-sda3 sind die Partitionen von Windows 10

ich kann nicht sagen, was sda6 beinhaltet
nach mounten findet
ls
'$RECYCLE.BIN'   BOOTEX.LOG  'System Volume Information'

und was mit sda 4 und sda5 ist weiß ich auch nicht

sudo fsck /dev/sda7 meldet :

Group descriptor 2806 checksum is 0x5648, should be 0x1e5a.  FIXED.
Group descriptor 2807 checksum is 0x43de, should be 0x0bcc.  FIXED.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking 

Aw: Re: Festplatte unzuverlässig

2021-04-03 Diskussionsfäden G . Maubach
Hallo zusammen,

danke an Florian für die ausführliche Kommentierung des smartctl-Protokolls.

Ich stimme Florian in allen Punkten außer einem zu:

> > 191 G-Sense_Error_Rate  0x0032   001   001   000Old_age
> > Always   -   1632878
> 
> Ist eigentlich die Anzahl der Fehler, die durch Stürze verursacht
> wurden. Der Wert gibt so hoch aber keinen Sinn - würde ich als "zeichnet
> die Platte nicht Sinnvoll auf" einstufen.

Da es sich hier um ein Notebook handelt, werden hier nicht nur Abstürze der 
Festplatte vom Tisch auf den Boden aufgezeichnet, sondern jegliche Bewegungen. 
Meines Erachtens deutet dieser Wert darauf hin, dass der Rechner beim Transport 
nicht runtergefahren, sondern nur zugeklappt und dann mitgenommen wird. Durch 
das dauernde Tragen des Notebooks bei laufender Platte kommt es zu 
Erschütterungen, die auf Dauer die Festplatte zerstören. Ein Kollege von mir 
hat das in seiner Beratertätigkeit exzessiv so gemacht und nach kurzer Zeit die 
Festplatte geschrottet, was - weil ohne Backup - zu Totalverlust der Daten 
führte.

@Thorsten: Fährst Du den Rechner vor dem Transport runter?

Viele Grüße

Georg

> Gesendet: Samstag, 03. April 2021 um 14:22 Uhr
> Von: "Florian Knodt" 
> An: trolug@trolug.de
> Betreff: Re: Festplatte unzuverlässig,
>
> Moin,
> 
> dann beschränke ich mal auf das Wichtigste. Nich Alle Felder sind bei
> allen Platten verfügbar, zudem ist das hier spezifisch für Festplatten.
> Bei SSDs wäre z.B. die Abnutzung noch sehr wichtig.
> 
> > === START OF INFORMATION SECTION ===
> 
> In dem Abschnitt stehen Hersteller, Modell, Größe, Seriennummer, etc.
> Sollte man wenn möglich immer nochmal gegenprüfen, ob man die richtige
> Platte erwischt hat.
> 
> >   1 Raw_Read_Error_Rate 0x002f   200   200   051Pre-fail
> > Always   -   0
> 
> Für alle folgenden Zeilen gilt: In der ersten Spalte steht der Name
> (Raw_Read_Error_Rate), ganz am Ende die menschenlesbare Zahl (0).
> 
> Hier geht es um die Anzahl der Lesefehler. Eine hohe Anzahl kann darauf
> hindeuten, dass es Probleme mit den Leseköpfen gibt. Alles >1 heißt,
> dass irgendwas mit der Hardware nicht stimmt(e). Kann eine einmale Sache
> wie z.B. ein Sturz gewesen sein, der mit Glück keine weiteren Schäden
> anrichtet. Dauerhaftere Defekte oder Altersschwäche merkt man wenn die
> Zahl über die Zeit steigt. Hier gab es bisher keine Fehler, also Alles OK
> 
> >   4 Start_Stop_Count0x0032   094   094   000Old_age
> > Always   -   6654
> >  12 Power_Cycle_Count   0x0032   096   096   000Old_age
> > Always   -   4180
> 
> Die Platte wurde 6654x aus und wieder eingeschaltet. 4180x war es durch
> Strom aus/an. Mehr kann z.B. durch Standbyeinstellungen kommen. Häufiges
> Einschalten kann zu Abnutzung führen. Ist aber erst mal nur rein
> informativ (Old_age).
> 
> >   5 Reallocated_Sector_Ct   0x0033   200   200   140Pre-fail
> > Always   -   0
> > 196 Reallocated_Event_Count 0x0032   200   200   000Old_age
> > Always   -   0
> 
> Nu wird es interessant. Ein Reallocated Secor heißt, dass der Controller
> der Festplatte festgestellt hat, dass ein Sektor der Festplatte nicht
> mehr funktioniert. Auch hier kann es durch einmalige Ereignisse oder
> Alter auftreten. In dem Fall kann er auf einen Reservesektor
> zurückgreifen und zukünftig den nutzen. Wenn so etwas auftritt ist das
> ein sehr guter Zeitpunkt seine Backups schon mal zu suchen. Hier: 0
> Sektoren betroffen und 0 Ereignisse bekannt, alles OK
> 
> > 198 Offline_Uncorrectable   0x0030   100   253   000Old_age
> > Offline  -   0
> 
> Wenn ein Sektor sich nicht retten lässt geht er offline. Wenn das
> Betriebssystem versucht dort zu lesen oder schreiben gibt es einen
> Fehler. Nix betroffen, alles Gut.
> 
> > 197 Current_Pending_Sector  0x0032   200   200   000Old_age
> > Always   -   0
> 
> Das ist die Corstufe zu Reallocated: Das sind Sektoren, welche zwar noch
> funktionieren, aber dem Controller auffällig geworden sind. Wenn wenig
> los ist wird der Controller diese üblicherweise nochmal genauer prüfen
> und die Daten ggf. in Sicherheit bringen.
> 
> >   9 Power_On_Hours  0x0032   073   073   000Old_age
> > Always   -   20327
> 
> 20327 Stunden lief die Platte, also knapp 2.5 Jahre. Ist rein
> informativ. Bei mir gehen Platten üblicherweise in <2 Monaten oder >5
> Jahren kaputt, würde ich also jetzt auch nicht als auffällig einstufen.
> 
> > 191 G-Sense_Error_Rate  0x0032   001   001   000Old_age
> > Always   -   1632878
> 
> Ist eigentlich die Anzahl der Fehler, die durch Stürze verursacht
> wurden. Der Wert gibt so hoch aber keinen Sinn - würde ich als "zeichnet
> die Platte nicht Sinnvoll auf" einstufen.
> 
> > 194 Temperature_Celsius 0x0022   121   076   000Old_age
> > Always   -   26
> 
> Temperatur halt. 26°C ist OK. Grobe Hausnummer: >40°C wäre bedenklich.
> 
> > 199 UDMA_CRC_Error_Count0x0032   200   200   

Graphisches Etherpad: Mural

2021-04-03 Diskussionsfäden G . Maubach
Hallo zusammen,

wir nutzen für unsere Meetings Etherpad, was text-basiert ist. Wenn wir einmal 
kreativ zusammenarbeiten wollen, könnten wir mit Mural arbeiten. Mural ist ein 
Online-Whiteboard für die Zusammenarbeit:

https://www.mural.co

Anbei ein 10 und ein 60 Minuten Tutorial:

10 Min: https://www.youtube.com/watch?v=3WF6lnDzdQI
60 Min: https://www.youtube.com/watch?v=x7xUlmY0EXw

Das ist leider nicht Open Source. Wenn Ihr eine Open Source Variante kennt, bin 
ich daran interessiert.

Viele Grüße

Georg





Re: Festplatte unzuverlässig,

2021-04-03 Diskussionsfäden Thorsten Kern
Moin,

Am Sa., 3. Apr. 2021 um 11:33 Uhr schrieb Florian Knodt :
>
> Moin,
>
> On 03.04.2021 11:28, Thorsten Kern wrote:
> > Kann ich von einen hardwaredefekt ausgehen
>
> Ich würde erst mal mit smartctl -a /dev/sda die Parameter der Platte
> anschauen. Dort ist z.B. zu sehen ob es defekte Blöcke (=Platte kaputt)
> oder Übertragungsfehler (Kabel nicht richtig drin?) die Ursache sind.

Hier die Ausgabe:

smartctl 6.6 2017-11-05 r4594 [armv6l-linux-5.4.83+] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Scorpio Blue Serial ATA (AF)
Device Model: WDC WD6400BPVT-22HXZT1
Serial Number:WD-WXA1A11E2110
LU WWN Device Id: 5 0014ee 6ab94e6a1
Firmware Version: 01.01A01
User Capacity:640.135.028.736 bytes [640 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate:5400 rpm
Device is:In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:Sat Apr  3 12:12:55 2021 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Status command failed: Die Wartezeit f_r die Verbindung ist abgelaufen
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status:  (   0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection:(15960) seconds.
Offline data collection
capabilities:(0x7b) SMART execute Offline immediate.
Auto Offline data collection
on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities:(0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability:(0x01) Error logging supported.
Short self-test routine
recommended polling time:(   2) minutes.
Extended self-test routine
recommended polling time:( 157) minutes.
Conveyance self-test routine
recommended polling time:(   5) minutes.
SCT capabilities:  (0x7035) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME  FLAG VALUE WORST THRESH TYPE
UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f   200   200   051Pre-fail
Always   -   0
  3 Spin_Up_Time0x0027   205   166   021Pre-fail
Always   -   741
  4 Start_Stop_Count0x0032   094   094   000Old_age
Always   -   6654
  5 Reallocated_Sector_Ct   0x0033   200   200   140Pre-fail
Always   -   0
  7 Seek_Error_Rate 0x002e   200   200   000Old_age
Always   -   0
  9 Power_On_Hours  0x0032   073   073   000Old_age
Always   -   20327
 10 Spin_Retry_Count0x0032   100   100   000Old_age
Always   -   0
 11 Calibration_Retry_Count 0x0032   100   100   000Old_age
Always   -   0
 12 Power_Cycle_Count   0x0032   096   096   000Old_age
Always   -   4180
191 G-Sense_Error_Rate  0x0032   001   001   000Old_age
Always   -   1632878
192 Power-Off_Retract_Count 0x0032   200   200   000Old_age
Always   -   268
193 Load_Cycle_Count0x0032   001   001   000Old_age
Always   -   912395
194 Temperature_Celsius 0x0022   121   076   000Old_age
Always   -   26
196 Reallocated_Event_Count 0x0032   200   200   000Old_age
Always   -   0
197 Current_Pending_Sector  0x0032   200   200   000Old_age
Always   -   0
198 Offline_Uncorrectable   0x0030   100   253   000Old_age
Offline  -   0
199 UDMA_CRC_Error_Count0x0032   200   200   000Old_age
Always   -   0
200 Multi_Zone_Error_Rate   0x0008   100   253  

Festplatte unzuverlässig,

2021-04-03 Diskussionsfäden Thorsten Kern
Hallo,

nachdem ich im März mein Laptop neu aufgesetzt habe,
(Mailthema: "Neues Linux auf meinen Laptop / allgemein Empfehlung für
neue Linuxbenutzer")

habe ich nun mit plötzlichen Neustarts zu kämpfen.
Mittlerweile komme ich nur noch zum Desktop nach der Anmeldung,
nachdem der Desktop erscheint und ich einen Befehl ausführen möchte,
geht der Rechner aus und startet neu.

Ich habe eine baugleiche Festplatte ( Window 7) eingebaut und gestartet,
hier arbeitet der Laptop , ohne das er von alleine neustartet.

Ich habe nun die bisherige Festplatte mit einen USB Adapter an einen
Raspberry Pi angeschlossen

sudo blkid -o list -w /dev/null sagt:
(nur sda Einträge hierher kopiert)
/dev/sda1  ntfs  PQSERVICE
/dev/sda2  ntfs  SYSTEM RESERVED
/dev/sda3  ntfs  Acer
/dev/sda6  vfat
/dev/sda7  ext4

sda1-sda3 sind die Partitionen von Windows 10

ich kann nicht sagen, was sda6 beinhaltet
nach mounten findet
ls
'$RECYCLE.BIN'   BOOTEX.LOG  'System Volume Information'

und was mit sda 4 und sda5 ist weiß ich auch nicht

sudo fsck /dev/sda7 meldet :

Group descriptor 2806 checksum is 0x5648, should be 0x1e5a.  FIXED.
Group descriptor 2807 checksum is 0x43de, should be 0x0bcc.  FIXED.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
fsck: Warning... fsck.ext4 for device /dev/sda7 exited with signal 9.

Kann ich von einen hardwaredefekt ausgehen, und daher mittels
dd if=/dev/sda  of=/dev/sdb die platte klonen
um mir die Arbeit des neuaufsetzen zu sparen,
oder kann ich mir direkt das klonen sparen?

mit freundlichen Gruß aus Lindlar
Thorsten Kern