SMART: Unterschied zwischen den Versionen

Aus Foxwiki
Robertquies (Diskussion | Beiträge)
K Textersetzung - „ “ durch „ “
 
(111 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
'''S'''elf-'''M'''onitoring, '''A'''nalysis and '''R'''eporting '''T'''echnology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung)


*'''S'''elf-Monitoring, '''A'''nalysis and '''R'''eporting '''T'''echnology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung)
=smart=
**ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
*Ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
**dient der Vorhersage eines möglichen Ausfalls des Speichermediums.  
*Dient der Vorhersage eines möglichen Ausfalls des Speichermediums.  
**dabei die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.
*Dabei werden die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.
*Alle aktuellen Festplatten und SSDs haben SMART Funktionalität.
*Alle aktuellen Festplatten und SSDs haben SMART Funktionalität.


Zeile 33: Zeile 34:
**Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen.  
**Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen.  
**Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate.
**Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate.
=wichtige Attribute=
{| class="wikitable" style="margin:0px; text-align:left;"
! Attribut
! Erklärung
|-
| Raw Read Error Rate
| Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche
|-
| Spin Up Time
| Zeit Stillstand bis volle Arbeitsumdrehung
|-
| Reallocated Sector
| Verschieben defekter Sektoren in Reserve-Sektoren
|-
| Seek Error Rate
| Fehler Ausrichtung Festplattenkopf
|-
| Power On Hours
| Laufzeit Festplatte
|-
| Power Cycle Count
| Anzahl Anschaltvorgänge
|-
| Multi Zone Error Rate
| Fehlerrate beim Schreiben
|}


=Auswertung=
=Auswertung=
Zeile 51: Zeile 80:
!colspan="2" scope="row"; | Legende
!colspan="2" scope="row"; | Legende
|-
|-
! scope="row" style="background:#F65858; |  
! scope="row" style="background:#ffbcbd; | A
| Ausfallsrelevanter Parameter.
| Ausfallsrelevanter Parameter.
|-
|-
! scope="row" style="background:#F9F9F9 |  
! scope="row" style="background:#F9F9F9 |  
| wenig bis nicht ausfallrelevanter Parameter
| Wenig bis nicht ausfallrelevanter Parameter.
|-
|-
! scope="row" | '''+'''
! scope="row" | '''+'''
| Je höher der Raw-Wert, desto besser
| Je höher der Raw-Wert, desto besser.
|-
|-
! scope="row" | '''-'''
! scope="row" | '''-'''
| Je niedriger der Raw-Wert, desto besser
| Je niedriger der Raw-Wert, desto besser.
|}
|}


{| class="wikitable sortable" summary="Überblick über verschiedene S.M.A.R.T.-Werte"
{| class="wikitable sortable" summary="Überblick über verschiedene S.M.A.R.T.-Werte"
!A?
!ID
!ID
!Hex
!Hex
Zeile 72: Zeile 102:
!Beschreibung
!Beschreibung
|-
|-
|
|01
|01
|0x01
|0x01
|'''(Raw) Read Error Rate'''
|'''Raw Read Error Rate'''
|Lesefehlerrate (roh)
|Lesefehlerrate (roh)
|data-sort-value="0"|'''-'''
|data-sort-value="0"|'''-'''
Zeile 81: Zeile 112:
* Problem mit der Plattenoberfläche
* Problem mit der Plattenoberfläche
|-
|-
|
|02
|02
|0x02
|0x02
Zeile 90: Zeile 122:
* Deutet stark auf bremsende Probleme im Laufwerk hin.
* Deutet stark auf bremsende Probleme im Laufwerk hin.
|-
|-
|
|03
|03
|0x03
|0x03
Zeile 99: Zeile 132:
* Deutet auf Probleme beim Motor oder den Plattenlagern hin.
* Deutet auf Probleme beim Motor oder den Plattenlagern hin.
|-
|-
|
|04
|04
|0x04
|0x04
Zeile 107: Zeile 141:
* Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby)
* Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby)
* Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet.
* Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet.
|- style="background:#F65858;"
|- style="background:#ffbcbd;"
|A
|05
|05
|0x05
|0x05
Zeile 118: Zeile 153:
* Ist dieser RAW-Zähler ungleich 0, ist Wahrscheinlichkeit für einen Ausfall 5-facht.
* Ist dieser RAW-Zähler ungleich 0, ist Wahrscheinlichkeit für einen Ausfall 5-facht.
|-
|-
|
|07
|07
|0x07
|0x07
Zeile 127: Zeile 163:
* Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin.
* Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin.
|-
|-
|
|09
|09
|0x09
|0x09
Zeile 135: Zeile 172:
* Laufleistung in Stunden oder Sekunden (inklusive Standby)
* Laufleistung in Stunden oder Sekunden (inklusive Standby)
* Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus.
* Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus.
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|10
|10
|0x0A
|0x0A
Zeile 144: Zeile 182:
* Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin.
* Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin.
|-
|-
|
|12
|12
|0x0C
|0x0C
Zeile 151: Zeile 190:
|
|
* Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist.
* Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist.
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|184
|184
|0xB8
|0xB8
Zeile 159: Zeile 199:
|
|
* Steigende Werte zeigen Parityfehler zwischen Speichermedium und Laufwerkcontroller an.
* Steigende Werte zeigen Parityfehler zwischen Speichermedium und Laufwerkcontroller an.
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|187
|187
|0xBB
|0xBB
Zeile 167: Zeile 208:
|
|
* Fehler welche durch die integrierte Vorwärtsfehlerkorrektur (ECC) nicht korrigiert werden konnten.
* Fehler welche durch die integrierte Vorwärtsfehlerkorrektur (ECC) nicht korrigiert werden konnten.
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|188
|188
|0xBC
|0xBC
Zeile 176: Zeile 218:
* Anzahl der Kommandoabbrüche wegen Zeitüberschreitung
* Anzahl der Kommandoabbrüche wegen Zeitüberschreitung
|-
|-
|
|193
|193
|0xC1
|0xC1
Zeile 188: Zeile 231:
* Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch.
* Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch.
|-
|-
|
|194
|194
|0xC2
|0xC2
Zeile 195: Zeile 239:
|
|
* Temperatur des Laufwerkes in °C
* Temperatur des Laufwerkes in °C
* Da manche Laufwerke auch Maximal- und Minimalwert speichern, ist eine frühere Unterkühlung oder Überhitzung während des Betriebes erkennbar. Der als raw-value angegebene Wert enthält dann alle drei Zahlen hintereinander.
* Der als raw-value angegebene Wert kann drei Werte enthalten Min-,Ist- und Max-Wert.  
* Hohe Temperaturen (ab 40 °C) haben erst nach drei Jahren Auswirkung. In diesem Jahr verdoppeln sie die Ausfallwahrscheinlichkeit. Danach verlieren sie ihre Bedeutung wieder. Über alle Alter gemittelt, sind Temperaturen unter 25 °C weit gefährlicher als solche über 40 °C. 20 °C verdoppeln, 15 °C verdreifachen die Ausfallrate; gemessen wurde dabei bis 52 °C. Manche Hersteller verwenden ungenaue oder falsch platzierte Sensoren.
* Hohe Temperaturen (ab 40°C) haben nur während des 3.Jahres Auswirkungen (Verdopplung Ausfallwahrscheinlichkeit), danach nicht mehr. Temperaturen unter 25°C sind weit gefährlicher als solche über 40°C. 20°C 2x, 15°C 3x so hohe Ausfallrate.
|-
|-
|
|195
|195
|0xC3
|0xC3
Zeile 205: Zeile 250:
|
|
* korrigierte Bitfehler beim Lesen
* korrigierte Bitfehler beim Lesen
* Kann auf Problem mit der Plattenoberfläche hindeuten.
* Kann auf Problem mit Plattenoberfläche hindeuten.
* Die hohe Datendichte heutiger Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt. Auch sehr hohe Werte hier sind also kein Grund zur Beunruhigung.
* Die hohe Datendichte von Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt. Sehr hohe Werte sind kein Grund zur Beunruhigung.
* Samsung-Laufwerke der P80-Serie tragen hier fälschlicherweise oft sehr niedrige Skalenwerte ein. Generell sind sehr hohe Raw-Werte üblich, die wegen Wechseln von einer Technik auf eine neuere (engl.: „technology change“) auch zwischen Modellen desselben Herstellers nicht vergleichbar sind. Sie steigen bei Lesevorgängen, da nur dann eine Fehlerkorrektur stattfindet. Ausfallrelevant sind nur die Skalenwerte. Selten werden die Werte auch „ECC On-the-fly“ genannt.''
|- style="background:#ffbcbd"
|- style="background:#F65858"
|A
|196
|196
|0xC4
|0xC4
Zeile 216: Zeile 261:
|
|
* Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren.
* Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren.
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|197
|197
|0xC5
|0xC5
Zeile 224: Zeile 270:
|
|
* Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition
* Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|198
|198
|0xC6
|0xC6
Zeile 233: Zeile 280:
* Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen.
* Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen.
|-
|-
|
|199
|199
|0xC7
|0xC7
Zeile 241: Zeile 289:
* Anzahl der aufgetretenen [[Zyklische Redundanzprüfung|CRC]]-Fehler
* Anzahl der aufgetretenen [[Zyklische Redundanzprüfung|CRC]]-Fehler
* Ursache können defekte Kabel, verschmutzte Kontakte, Übertaktung oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt.
* Ursache können defekte Kabel, verschmutzte Kontakte, Übertaktung oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt.
|- style="background:#F65858"
|- style="background:#ffbcbd"
|A
|201
|201
|0xC9
|0xC9
Zeile 251: Zeile 300:
|}
|}


Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive. Vollständige Listen finden sich im Literatur-Abschnitt der Weblinks.


=== Beispiel ===
*Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive.
Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über [[Serial ATA|Serial-ATA]] und ausgelesen mit den [[#S.M.A.R.T.-Programme im Vergleich|smartmontools]].
 
==Beispiel==
 
Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über Serial-ATA und ausgelesen mit den smartmontools.
 
{| class="wikitable" style="text-align: center;"
!style="background:#adffa9;"|'''Value'''
|ist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter).
|-
!style="background:#ff898b;"|'''Worst'''
|der bisher schlechteste Wert.
|-
!style="background:#FFDEAD;"|'''Threshold'''
|die Grenze, unter die der Wert nicht fallen darf.<!-- ?? -->
 
|-
|'''Typ'''
|steht für die Bedeutung des Parameters: „'''Pre-fail'''“ ist eine Warnung vor einem baldigen Ausfall, während „'''Old age'''“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien).
|-
|'''Updated'''
|zeigt an, ob der Wert permanent (always) oder erst durch einen [[#Selbsttest und Fehler-Logbuch|Selbsttest]] vom Typ „Offline data collection“ aktualisiert wird.
|-
|'''RAW Value'''
|ist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler.
|}
 


{| class="wikitable" style="text-align: center;"
{| class="wikitable" style="text-align: center;"
Zeile 260: Zeile 333:
!Parameter-ID
!Parameter-ID
!Parametername
!Parametername
!style="background:#98e5b3;"|Value (normalisierter aktueller Messwert)
!style="background:#adffa9;"|Value  
!style="background:#d5c39c;"|Worst (bisher schlechtester Wert)
!style="background:#ff898b;"|Worst  
!style="background:#dca799;"|Threshold (Grenzwert – Value sollte größer sein)
!style="background:#FFDEAD;"|Threshold  
!Typ (maximaler Messwert kurz vor dem Ausfall)
!Typ  
!Updated (Echtzeit- oder Messwert nach einem Selbsttest)
!Updated  
!RAW Value (eigentlicher Messwert)
!RAW Value  
!Bemerkung
!Bemerkung
|-
|-
|style="background: #ececec;"| 2
| 2
|style="background: #ececec;"| Throughput Performance
| '''Throughput Performance'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 050
|style="background: #ffedd3;"| 050
| Pre-fail
| Pre-fail
| Offline
| Offline
| 0
| 0
|&nbsp;
|  
|-
|-
|style="background: #ececec;"| 3
| 3
|style="background: #ececec;"| Spin Up Time
| '''Spin Up Time'''
|style="background: #e6fff0;"| 118
|style="background: #d4ffdc;"| 118
|style="background: #fff0c8;"| 118
|style="background: #ffd3d4;"| 118
|style="background: #ffebdc;"| 024
|style="background: #ffedd3;"| 024
| Pre-fail
| Pre-fail
| Always
| Always
Zeile 288: Zeile 361:
|Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden.
|Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden.
|-
|-
|style="background: #ececec;"| 4
| 4
|style="background: #ececec;"| Start Stop Count
| '''Start Stop Count'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 000
|style="background: #ffedd3;"| 000
| Old&nbsp;age
| Old age
| Always
| Always
| 772
| 772
|772 mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts.
|'''772''' mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts.
|-
|-
|style="background: #ececec;"| 5
| 5
|style="background: #ececec;"| Reallocated Sector Count
| '''Reallocated Sector Count'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 005
|style="background: #ffedd3;"| 005
| Pre-fail
| Pre-fail
| Always
| Always
| 55
| 55
|55 Sektoren wurden wegen Defekts gegen Reservesektoren ausgetauscht. Das Laufwerk schätzt das aber noch als problemlos ein (der Value ist nach wie vor 100) – vielleicht zu Unrecht.
|'''55''' Sektoren wegen Defekts gegen Reservesektoren ausgetauscht. Laufwerk schätzt das als problemlos ein.
|-
|-
|style="background: #ececec;"| 7
| 7
|style="background: #ececec;"| Seek Error Rate
| '''Seek Error Rate'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 067
|style="background: #ffedd3;"| 067
| Pre-fail
| Pre-fail
| Always
| Always
Zeile 318: Zeile 391:
|Bisher gab es keine Schreib-/Lesefehler.
|Bisher gab es keine Schreib-/Lesefehler.
|-
|-
|style="background: #ececec;"| 9
| 9
|style="background: #ececec;"| Power On Hours
| '''Power On Hours'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 000
|style="background: #ffedd3;"| 000
| Old age
| Old age
| Always
| Always
| 1775
| 1775
|Laufwerk wurde bisher 1775 Stunden mit Strom versorgt. Das umfasst auch Standbyphasen, in denen die Platten stillstanden. Wenn das Auswertungsprogramm das Festplattenmodell nicht kennt, muss man selbst einschätzen, ob der Wert Stunden, Minuten oder Sekunden darstellt.
|Laufwerk wurde bisher '''1775''' Stunden mit Strom versorgt. Umfasst auch Standbyphasen. Immer prüfen, ob der Wert Std., Min. oder Sek. darstellt.
|-
|-
|style="background: #ececec;"| 10
| 10
|style="background: #ececec;"| Spin Retry Count
| '''Spin Retry Count'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 060
|style="background: #ffedd3;"| 060
| Pre-fail
| Pre-fail
| Always
| Always
Zeile 338: Zeile 411:
|Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an.
|Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an.
|-
|-
|style="background: #ececec;"| 12
| 12
|style="background: #ececec;"| Power Cycle Count
| '''Power Cycle Count'''
|style="background: #e6fff0;"| 100
|style="background: #d4ffdc;"| 100
|style="background: #fff0c8;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffebdc;"| 000
|style="background: #ffedd3;"| 000
| Old age
| Old age
| Always
| Always
| 745
| 745
|Bisher wurde der PC mit dieser Festplatte 745-mal an- und ausgeschaltet.
|Bisher wurde der PC mit dieser Festplatte '''745'''-mal an- und ausgeschaltet.
|-
|-
|style="background: #ececec;"| 194
| 194
|style="background: #ececec;"| Temperature
| '''Temperature'''
|style="background: #e6fff0;"| 161
|style="background: #d4ffdc;"| 161
|style="background: #fff0c8;"| 161
|style="background: #ffd3d4;"| 161
|style="background: #ffebdc;"| 000
|style="background: #ffedd3;"| 000
| Old age
| Old age
| Always
| Always
| '''34'''<br />+('''10'''·2<sup>16</sup> + '''49'''·2<sup>32</sup>)
| 34<br /> 10<br /> 49
|Aktuelle Temperatur wäre hier 34&nbsp;°C. Bisherige Lebensmaxima des Laufwerkes waren 10&nbsp;°C bzw. 49&nbsp;°C. Value ist daher von 200 auf 161 gesunken.
|Aktuelle Temperatur wäre hier '''34'''°C. Bisherige Lebensmaxima des Laufwerkes waren '''10'''°C bzw. '''49'''°C. Value ist daher von 200 auf 161 gesunken.
|-
|-
|style="background: #ececec;"| 199
| 199
|style="background: #ececec;"| UDMA CRC Error Count
| '''UDMA CRC Error Count'''
|style="background: #e6fff0;"| 200
|style="background: #d4ffdc;"| 200
|style="background: #fff0c8;"| 253
|style="background: #ffd3d4;"| 253
|style="background: #ffebdc;"| 000
|style="background: #ffedd3;"| 000
| Old age
| Old age
| Always
| Always
| 730
| 730
||Bisher gab es 730 Übertragungsfehler zur Hauptplatine („mainboard“). Ursache ist entweder ein fehlerhafter Festplatten-Controller, ein defektes Anschlusskabel oder ein [[Wackelkontakt]].
||Bisher gab es '''730''' Übertragungsfehler zum Mainboard. Ursache: fehlerhafter Festplatten-Controller, defektes Anschlusskabel oder Wackelkontakt.
|}
|}


{| class="wikitable"
*Auswertung:  
!style="background:#98e5b3;"|Value
**Laufwerk ist in Ordnung.  
|ist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter).
**Kein Grenzwert erreicht.  
|-
**'''Reallocated Sector Count'''-Wert: Die 55 ausgewechselten Sektoren sind laut einer Google-Studie bedenklich.
!style="background:#d5c39c;"|Worst
**'''UDMA CRC Error Count'''-Wert: Besser Kabel tauschen. Wert danach im Auge behalten.
|der bisher schlechteste Wert.
|-
!style="background:#dca799;"|Threshold
|die Grenze, unter die der Wert nicht fallen darf.<!-- ?? -->
 
|-
!style="background:#ececec;"|Typ
|steht für die Bedeutung des Parameters: „Pre-fail“ ist eine Warnung vor einem baldigen Ausfall, während „Old age“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien).
|-
!style="background:#ececec;"|Updated
|zeigt an, ob der Wert permanent (always) oder erst durch einen [[#Selbsttest und Fehler-Logbuch|Selbsttest]] vom Typ „Offline data collection“ aktualisiert wird.
|-
!style="background:#ececec;"|RAW Value
|ist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler.
|}
 
==Beispiel==


=Quellen=
=Quellen=
[https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology| Wikipedia SMART]
[https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology Wikipedia SMART]


[https://www.thomas-krenn.com/de/wiki/SMART  Thomas Krenn SMART]
[https://www.thomas-krenn.com/de/wiki/SMART  Thomas Krenn SMART]


[https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl| Thomas Krenn SMART-Tests mit smartctl]
[https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl Thomas Krenn SMART-Tests mit smartctl]


[[Category:Hardware]]
[[Kategorie:SMART]]

Aktuelle Version vom 29. August 2022, 13:40 Uhr

Self-Monitoring, Analysis and Reporting Technology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung)

smart

  • Ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
  • Dient der Vorhersage eines möglichen Ausfalls des Speichermediums.
  • Dabei werden die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.
  • Alle aktuellen Festplatten und SSDs haben SMART Funktionalität.

Funktionsweise

  • Auswertung der überwachten Daten erfolgt beim Starten des Rechners durch
    • das BIOS,
    • andere Firmware,
    • oder durch spezielle Software.
  • SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten, etwa für die Temperatur.
  • Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden.
  • Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst, aber keine Warnungen mehr gemeldet.
  • Gespeichert werden die gesammelten Daten in einem reservierten, durch Programme nicht änderbaren Bereich der Festplatte.
  • Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen.
  • Verbaute Sensoren und Chipfunktionen erfassen die Werte.
  • Aktualisierung der Daten
    • "Online"-Parameter, die permanent notiert werden.
    • "Offline"-Parameter, die erst in Ruhepausen aktualisiert werden.

Informationswert

  • Liefern keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems.
  • Auf Massenspeicher wie Festplatten oder SSDs beschränkt.
  • Ist nicht normiert, sondern es ist den Herstellern überlassen, welche Parameter in welchen Grenzen überwacht werden.
  • Die Genauigkeit der Überwachung wird diskutiert.
    • Manche Temperatursensoren gelten als falsch platziert oder zu optimistisch eingestellt.
  • Ergebnis einer unabhängigen Google-Studie von 2006, Dauer über neun Monate, mit 100.000 Festplatten aller Hersteller:
    • Es sind 64 % aller Ausfälle mit SMART vorhersagbar.
    • Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen.
    • Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate.

wichtige Attribute

Attribut Erklärung
Raw Read Error Rate Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche
Spin Up Time Zeit Stillstand bis volle Arbeitsumdrehung
Reallocated Sector Verschieben defekter Sektoren in Reserve-Sektoren
Seek Error Rate Fehler Ausrichtung Festplattenkopf
Power On Hours Laufzeit Festplatte
Power Cycle Count Anzahl Anschaltvorgänge
Multi Zone Error Rate Fehlerrate beim Schreiben

Auswertung

Parameter

  • als Raw-Werte gespeichert
  • Raw-Wert wird zum besseren Verständnis in Werteskala von 0 bis 100, 200 oder 255 einsortiert
  • Werteskala
    • startet mit dem Skalenmaximum
    • bei Fehlern oder zunehmendem Alter nähern sich Werte (value) gegen 0
    • kritische Grenze (threshold) für möglichen Ausfall häufig weit über 0
wichtig:
Raw-Werte nicht verwechseln mit den Values der Werteskala.

RAW-Werte

Legende
A Ausfallsrelevanter Parameter.
Wenig bis nicht ausfallrelevanter Parameter.
+ Je höher der Raw-Wert, desto besser.
- Je niedriger der Raw-Wert, desto besser.
A? ID Hex Parametername (Englisch) Parametername (Deutsch) + - Beschreibung
01 0x01 Raw Read Error Rate Lesefehlerrate (roh) -
  • Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen
  • Problem mit der Plattenoberfläche
02 0x02 Throughput Performance Durchsatz +
  • allgemeiner Datendurchsatz bzw. Effizienz der Festplatte
  • Deutet stark auf bremsende Probleme im Laufwerk hin.
03 0x03 Spin Up Time Beschleunigungszeit -
  • Durchschnitt der Startzeit in (Milli-)Sekunden.
  • Deutet auf Probleme beim Motor oder den Plattenlagern hin.
04 0x04 Start/Stop Count Start/Stop-Vorgänge -
  • Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby)
  • Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet.
A 05 0x05 Reallocated Sectors Count wiederzugewiesene Sektoren -
  • Anzahl der verbrauchten Reservesektoren.
  • Deutet auf Oberflächenprobleme hin, da nur dann ein Reservesektor einen bisher verwendeten ersetzt.
  • Ist dieser RAW-Zähler ungleich 0, ist Wahrscheinlichkeit für einen Ausfall 5-facht.
07 0x07 Seek Error Rate Suchfehlerrate -
  • Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen.
  • Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin.
09 0x09 Power On Hours Count Zeit in Betrieb -
  • Laufleistung in Stunden oder Sekunden (inklusive Standby)
  • Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus.
A 10 0x0A Spin Retry Count Anlaufwiederholungen,
nur bei HDDs relevant
-
  • Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin.
12 0x0C Power Cycle Count Anzahl der Einschaltungen -
  • Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist.
A 184 0xB8 End-To-End error Ende-zu-Ende Fehler -
  • Steigende Werte zeigen Parityfehler zwischen Speichermedium und Laufwerkcontroller an.
A 187 0xBB Reported uncorrectable Error Gemeldete unkorrigierbare Fehler -
  • Fehler welche durch die integrierte Vorwärtsfehlerkorrektur (ECC) nicht korrigiert werden konnten.
A 188 0xBC Command Timeout Kommandos, welche nicht rechtzeitig ausgeführt werden konnten -
  • Anzahl der Kommandoabbrüche wegen Zeitüberschreitung
193 0xC1 Load Cycle Count

bzw. Load/Unload Cycle Count

Parkvorgänge -
  • Parkvorgänge der Schreib-Lese-Einheit auf die neben den Platten befindliche Plastikrampe.
  • Meist nur bei Notebooklaufwerken. Deutet auf Abnutzung hin; vorgesehen sind rund 300.000 – der Raw-Wert zeigt die bisherigen.
  • Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch.
194 0xC2 Drive Temperature Festplatten-Temperatur -
  • Temperatur des Laufwerkes in °C
  • Der als raw-value angegebene Wert kann drei Werte enthalten Min-,Ist- und Max-Wert.
  • Hohe Temperaturen (ab 40°C) haben nur während des 3.Jahres Auswirkungen (Verdopplung Ausfallwahrscheinlichkeit), danach nicht mehr. Temperaturen unter 25°C sind weit gefährlicher als solche über 40°C. 20°C 2x, 15°C 3x so hohe Ausfallrate.
195 0xC3 Hardware ECC Recovered gerettete Bitfehler -
  • korrigierte Bitfehler beim Lesen
  • Kann auf Problem mit Plattenoberfläche hindeuten.
  • Die hohe Datendichte von Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt. Sehr hohe Werte sind kein Grund zur Beunruhigung.
A 196 0xC4 Reallocation Event Count -
  • Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren.
A 197 0xC5 Current Pending Sector Count -
  • Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition
A 198 0xC6 Uncorrectable Sector Count Nicht korrigierbare Sektoren -
  • Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen.
199 0xC7 Ultra DMA CRC Error Count DMA-CRC-Fehler -
  • Anzahl der aufgetretenen CRC-Fehler
  • Ursache können defekte Kabel, verschmutzte Kontakte, Übertaktung oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt.
A 201 0xC9 Soft Read Error Rate -
  • Anzahl der nicht per Software korrigierbaren Lesefehler.


  • Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive.

Beispiel

Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über Serial-ATA und ausgelesen mit den smartmontools.

Value ist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter).
Worst der bisher schlechteste Wert.
Threshold die Grenze, unter die der Wert nicht fallen darf.
Typ steht für die Bedeutung des Parameters: „Pre-fail“ ist eine Warnung vor einem baldigen Ausfall, während „Old age“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien).
Updated zeigt an, ob der Wert permanent (always) oder erst durch einen Selbsttest vom Typ „Offline data collection“ aktualisiert wird.
RAW Value ist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler.


Parameter-ID Parametername Value Worst Threshold Typ Updated RAW Value Bemerkung
2 Throughput Performance 100 100 050 Pre-fail Offline 0
3 Spin Up Time 118 118 024 Pre-fail Always 294 Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden.
4 Start Stop Count 100 100 000 Old age Always 772 772 mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts.
5 Reallocated Sector Count 100 100 005 Pre-fail Always 55 55 Sektoren wegen Defekts gegen Reservesektoren ausgetauscht. Laufwerk schätzt das als problemlos ein.
7 Seek Error Rate 100 100 067 Pre-fail Always 0 Bisher gab es keine Schreib-/Lesefehler.
9 Power On Hours 100 100 000 Old age Always 1775 Laufwerk wurde bisher 1775 Stunden mit Strom versorgt. Umfasst auch Standbyphasen. Immer prüfen, ob der Wert Std., Min. oder Sek. darstellt.
10 Spin Retry Count 100 100 060 Pre-fail Always 0 Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an.
12 Power Cycle Count 100 100 000 Old age Always 745 Bisher wurde der PC mit dieser Festplatte 745-mal an- und ausgeschaltet.
194 Temperature 161 161 000 Old age Always 34
10
49
Aktuelle Temperatur wäre hier 34°C. Bisherige Lebensmaxima des Laufwerkes waren 10°C bzw. 49°C. Value ist daher von 200 auf 161 gesunken.
199 UDMA CRC Error Count 200 253 000 Old age Always 730 Bisher gab es 730 Übertragungsfehler zum Mainboard. Ursache: fehlerhafter Festplatten-Controller, defektes Anschlusskabel oder Wackelkontakt.
  • Auswertung:
    • Laufwerk ist in Ordnung.
    • Kein Grenzwert erreicht.
    • Reallocated Sector Count-Wert: Die 55 ausgewechselten Sektoren sind laut einer Google-Studie bedenklich.
    • UDMA CRC Error Count-Wert: Besser Kabel tauschen. Wert danach im Auge behalten.

Quellen

Wikipedia SMART

Thomas Krenn SMART

Thomas Krenn SMART-Tests mit smartctl