SMART: Unterschied zwischen den Versionen
K Textersetzung - „ “ durch „ “ |
|||
(159 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
'''S'''elf-'''M'''onitoring, '''A'''nalysis and '''R'''eporting '''T'''echnology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung) | |||
=smart= | |||
* | *Ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD) | ||
* | *Dient der Vorhersage eines möglichen Ausfalls des Speichermediums. | ||
* | *Dabei werden die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet. | ||
*Alle aktuellen Festplatten und SSDs haben SMART Funktionalität. | *Alle aktuellen Festplatten und SSDs haben SMART Funktionalität. | ||
Zeile 33: | Zeile 34: | ||
**Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen. | **Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen. | ||
**Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate. | **Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate. | ||
=wichtige Attribute= | |||
{| class="wikitable" style="margin:0px; text-align:left;" | |||
! Attribut | |||
! Erklärung | |||
|- | |||
| Raw Read Error Rate | |||
| Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche | |||
|- | |||
| Spin Up Time | |||
| Zeit Stillstand bis volle Arbeitsumdrehung | |||
|- | |||
| Reallocated Sector | |||
| Verschieben defekter Sektoren in Reserve-Sektoren | |||
|- | |||
| Seek Error Rate | |||
| Fehler Ausrichtung Festplattenkopf | |||
|- | |||
| Power On Hours | |||
| Laufzeit Festplatte | |||
|- | |||
| Power Cycle Count | |||
| Anzahl Anschaltvorgänge | |||
|- | |||
| Multi Zone Error Rate | |||
| Fehlerrate beim Schreiben | |||
|} | |||
=Auswertung= | =Auswertung= | ||
Zeile 48: | Zeile 77: | ||
===RAW-Werte=== | ===RAW-Werte=== | ||
{| class="wikitable" style="margin: | {| class="wikitable" style="margin:0px; text-align:left;" | ||
!colspan="2" scope="row"; | Legende | |||
! scope="row" | |||
|- | |- | ||
! scope="row" | | ! scope="row" style="background:#ffbcbd; | A | ||
| | | Ausfallsrelevanter Parameter. | ||
|- | |- | ||
! scope="row" | | ! scope="row" style="background:#F9F9F9 | | ||
| | | Wenig bis nicht ausfallrelevanter Parameter. | ||
|- | |- | ||
! scope="row" | | ! scope="row" | '''+''' | ||
| Je niedriger der Raw-Wert, desto besser | | Je höher der Raw-Wert, desto besser. | ||
|- | |||
! scope="row" | '''-''' | |||
| Je niedriger der Raw-Wert, desto besser. | |||
|} | |} | ||
{| class="wikitable sortable" summary="Überblick über verschiedene S.M.A.R.T.-Werte" | {| class="wikitable sortable" summary="Überblick über verschiedene S.M.A.R.T.-Werte" | ||
!A? | |||
!ID | !ID | ||
!Hex | !Hex | ||
!Parametername (Englisch) | !Parametername (Englisch) | ||
!Parametername (Deutsch) | !Parametername (Deutsch) | ||
! | !+ - | ||
!Beschreibung | !Beschreibung | ||
|- | |- | ||
| | |||
|01 | |01 | ||
|0x01 | |0x01 | ||
|''' | |'''Raw Read Error Rate''' | ||
|Lesefehlerrate (roh) | |Lesefehlerrate (roh) | ||
|data-sort-value="0"|'''-''' | |||
| | | | ||
* Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen | |||
* Problem mit der Plattenoberfläche | |||
|- | |||
| | | | ||
|02 | |02 | ||
|0x02 | |0x02 | ||
|'''Throughput Performance''' | |'''Throughput Performance''' | ||
|Durchsatz | |Durchsatz | ||
|data-sort-value="10"|'''+''' | |||
|data-sort-value="10"| | |||
| | | | ||
* allgemeiner Datendurchsatz bzw. Effizienz der Festplatte | * allgemeiner Datendurchsatz bzw. Effizienz der Festplatte | ||
* Deutet stark auf bremsende Probleme im Laufwerk hin. | * Deutet stark auf bremsende Probleme im Laufwerk hin. | ||
|- | |- | ||
| | |||
|03 | |03 | ||
|0x03 | |0x03 | ||
|'''Spin Up Time''' | |'''Spin Up Time''' | ||
|Beschleunigungszeit | |Beschleunigungszeit | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Durchschnitt der Startzeit in (Milli-)Sekunden. | * Durchschnitt der Startzeit in (Milli-)Sekunden. | ||
* Deutet auf Probleme beim Motor oder den Plattenlagern hin. | * Deutet auf Probleme beim Motor oder den Plattenlagern hin. | ||
|- | |- | ||
| | |||
|04 | |04 | ||
|0x04 | |0x04 | ||
|'''Start/Stop Count''' | |'''Start/Stop Count''' | ||
|Start/Stop-Vorgänge | |Start/Stop-Vorgänge | ||
|data-sort-value="0"|'''-''' | |||
| | | | ||
* Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby) | |||
* Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet. | * Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet. | ||
|- style="background:# | |- style="background:#ffbcbd;" | ||
|A | |||
|05 | |05 | ||
|0x05 | |0x05 | ||
|'''Reallocated Sectors Count''' | |'''Reallocated Sectors Count''' | ||
|wiederzugewiesene Sektoren | |wiederzugewiesene Sektoren | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl der verbrauchten Reservesektoren. | * Anzahl der verbrauchten Reservesektoren. | ||
* Deutet auf Oberflächenprobleme hin, da nur dann | * Deutet auf Oberflächenprobleme hin, da nur dann ein Reservesektor einen bisher verwendeten ersetzt. | ||
* | * Ist dieser RAW-Zähler ungleich 0, ist Wahrscheinlichkeit für einen Ausfall 5-facht. | ||
|- | |- | ||
| | |||
|07 | |07 | ||
|0x07 | |0x07 | ||
|'''Seek Error Rate''' | |'''Seek Error Rate''' | ||
|Suchfehlerrate | |Suchfehlerrate | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen. | * Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen. | ||
* Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin. | * Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin. | ||
|- | |- | ||
| | |||
|09 | |09 | ||
|0x09 | |0x09 | ||
|'''Power On Hours Count''' | |'''Power On Hours Count''' | ||
|Zeit in Betrieb | |Zeit in Betrieb | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Laufleistung in Stunden oder Sekunden (inklusive Standby) | * Laufleistung in Stunden oder Sekunden (inklusive Standby) | ||
* Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus. | * Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus. | ||
|- style="background:#ffbcbd" | |||
|- style="background:# | |A | ||
|10 | |10 | ||
|0x0A | |0x0A | ||
|'''Spin Retry Count''' | |'''Spin Retry Count''' | ||
|Anlaufwiederholungen,<br/>nur bei HDDs relevant | |Anlaufwiederholungen,<br/>nur bei HDDs relevant | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin. | * Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin. | ||
|- | |- | ||
| | |||
|12 | |12 | ||
|0x0C | |0x0C | ||
|'''Power Cycle Count''' | |'''Power Cycle Count''' | ||
|Anzahl der Einschaltungen | |Anzahl der Einschaltungen | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist. | * Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist. | ||
|- style="background:# | |- style="background:#ffbcbd" | ||
|A | |||
|184 | |184 | ||
|0xB8 | |0xB8 | ||
|'''End-To-End error''' | |'''End-To-End error''' | ||
|Ende-zu-Ende Fehler | |Ende-zu-Ende Fehler | ||
| | |data-sort-value="0"|'''-''' | ||
| | | | ||
* Steigende Werte zeigen Parityfehler zwischen Speichermedium und Laufwerkcontroller an. | |||
|- style="background:#ffbcbd" | |||
* Steigende Werte zeigen Parityfehler zwischen | |A | ||
|- style="background:# | |||
|187 | |187 | ||
|0xBB | |0xBB | ||
|'''Reported uncorrectable Error''' | |'''Reported uncorrectable Error''' | ||
|Gemeldete unkorrigierbare Fehler | |Gemeldete unkorrigierbare Fehler | ||
| | |data-sort-value="0"|'''-''' | ||
| | | | ||
* Fehler welche durch die integrierte Vorwärtsfehlerkorrektur (ECC) nicht korrigiert werden konnten. | |||
|- style="background:#ffbcbd" | |||
* Fehler welche durch die integrierte | |A | ||
|- style="background:# | |||
|188 | |188 | ||
|0xBC | |0xBC | ||
|'''Command Timeout''' | |'''Command Timeout''' | ||
|Kommandos welche nicht rechtzeitig ausgeführt werden konnten | |Kommandos, welche nicht rechtzeitig ausgeführt werden konnten | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl der Kommandoabbrüche wegen Zeitüberschreitung | * Anzahl der Kommandoabbrüche wegen Zeitüberschreitung | ||
|- | |- | ||
| | |||
|193 | |193 | ||
|0xC1 | |0xC1 | ||
|'''Load Cycle Count''' | |'''Load Cycle Count''' | ||
bzw. | bzw. | ||
'''Load/Unload Cycle Count''' | '''Load/Unload Cycle Count''' | ||
|Parkvorgänge | |Parkvorgänge | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Parkvorgänge der Schreib-Lese-Einheit auf die neben den Platten befindliche Plastikrampe. | * Parkvorgänge der Schreib-Lese-Einheit auf die neben den Platten befindliche Plastikrampe. | ||
* Meist nur bei Notebooklaufwerken. Deutet auf Abnutzung hin; vorgesehen sind rund 300.000 – der Raw-Wert zeigt die bisherigen. | * Meist nur bei Notebooklaufwerken. Deutet auf Abnutzung hin; vorgesehen sind rund 300.000 – der Raw-Wert zeigt die bisherigen. | ||
* Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch. | * Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch. | ||
|- | |- | ||
| | |||
|194 | |194 | ||
|0xC2 | |0xC2 | ||
|'''Drive Temperature''' | |'''Drive Temperature''' | ||
|Festplatten-Temperatur | |Festplatten-Temperatur | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Temperatur des Laufwerkes in °C | * Temperatur des Laufwerkes in °C | ||
* | * Der als raw-value angegebene Wert kann drei Werte enthalten Min-,Ist- und Max-Wert. | ||
* | * Hohe Temperaturen (ab 40°C) haben nur während des 3.Jahres Auswirkungen (Verdopplung Ausfallwahrscheinlichkeit), danach nicht mehr. Temperaturen unter 25°C sind weit gefährlicher als solche über 40°C. 20°C 2x, 15°C 3x so hohe Ausfallrate. | ||
|- | |- | ||
| | |||
|195 | |195 | ||
|0xC3 | |0xC3 | ||
|'''Hardware ECC Recovered''' | |'''Hardware ECC Recovered''' | ||
|gerettete Bitfehler | |gerettete Bitfehler | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* korrigierte Bitfehler beim Lesen | * korrigierte Bitfehler beim Lesen | ||
* Kann auf Problem mit | * Kann auf Problem mit Plattenoberfläche hindeuten. | ||
* Die hohe Datendichte | * Die hohe Datendichte von Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt. Sehr hohe Werte sind kein Grund zur Beunruhigung. | ||
|- style="background:#ffbcbd" | |||
|- style="background:# | |A | ||
|196 | |196 | ||
|0xC4 | |0xC4 | ||
|'''Reallocation Event Count''' | |'''Reallocation Event Count''' | ||
| | | | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren. | * Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren. | ||
|- style="background:# | |- style="background:#ffbcbd" | ||
|A | |||
|197 | |197 | ||
|0xC5 | |0xC5 | ||
|'''Current Pending Sector Count''' | |'''Current Pending Sector Count''' | ||
| | | | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition | * Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition | ||
|- style="background:# | |- style="background:#ffbcbd" | ||
|A | |||
|198 | |198 | ||
|0xC6 | |0xC6 | ||
|'''Uncorrectable Sector Count''' | |'''Uncorrectable Sector Count''' | ||
|Nicht korrigierbare Sektoren | |Nicht korrigierbare Sektoren | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen. | * Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen. | ||
|- | |- | ||
| | |||
|199 | |199 | ||
|0xC7 | |0xC7 | ||
|'''Ultra DMA CRC Error Count''' | |'''Ultra DMA CRC Error Count''' | ||
|DMA-CRC-Fehler | |DMA-CRC-Fehler | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl der aufgetretenen [[Zyklische Redundanzprüfung|CRC]]-Fehler | * Anzahl der aufgetretenen [[Zyklische Redundanzprüfung|CRC]]-Fehler | ||
* Ursache können defekte Kabel, verschmutzte Kontakte, | * Ursache können defekte Kabel, verschmutzte Kontakte, Übertaktung oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt. | ||
|- style="background:# | |- style="background:#ffbcbd" | ||
|A | |||
|201 | |201 | ||
|0xC9 | |0xC9 | ||
|'''Soft Read Error Rate''' | |'''Soft Read Error Rate''' | ||
| | | | ||
|data-sort-value="0"|'''-''' | |||
|data-sort-value="0"| | |||
| | | | ||
* Anzahl der nicht per Software korrigierbaren Lesefehler. | * Anzahl der nicht per Software korrigierbaren Lesefehler. | ||
|} | |} | ||
*Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive. | |||
Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über | |||
==Beispiel== | |||
Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über Serial-ATA und ausgelesen mit den smartmontools. | |||
{| class="wikitable" style="text-align: center;" | |||
!style="background:#adffa9;"|'''Value''' | |||
|ist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter). | |||
|- | |||
!style="background:#ff898b;"|'''Worst''' | |||
|der bisher schlechteste Wert. | |||
|- | |||
!style="background:#FFDEAD;"|'''Threshold''' | |||
|die Grenze, unter die der Wert nicht fallen darf.<!-- ?? --> | |||
|- | |||
|'''Typ''' | |||
|steht für die Bedeutung des Parameters: „'''Pre-fail'''“ ist eine Warnung vor einem baldigen Ausfall, während „'''Old age'''“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien). | |||
|- | |||
|'''Updated''' | |||
|zeigt an, ob der Wert permanent (always) oder erst durch einen [[#Selbsttest und Fehler-Logbuch|Selbsttest]] vom Typ „Offline data collection“ aktualisiert wird. | |||
|- | |||
|'''RAW Value''' | |||
|ist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler. | |||
|} | |||
{| class="wikitable" style="text-align: center;" | {| class="wikitable" style="text-align: center;" | ||
Zeile 306: | Zeile 333: | ||
!Parameter-ID | !Parameter-ID | ||
!Parametername | !Parametername | ||
!style="background:# | !style="background:#adffa9;"|Value | ||
!style="background:# | !style="background:#ff898b;"|Worst | ||
!style="background:# | !style="background:#FFDEAD;"|Threshold | ||
!Typ | !Typ | ||
!Updated | !Updated | ||
!RAW Value | !RAW Value | ||
!Bemerkung | !Bemerkung | ||
|- | |- | ||
| 2 | |||
| | | '''Throughput Performance''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 050 | ||
| Pre-fail | | Pre-fail | ||
| Offline | | Offline | ||
| 0 | | 0 | ||
| | | | ||
|- | |- | ||
| 3 | |||
| | | '''Spin Up Time''' | ||
|style="background: # | |style="background: #d4ffdc;"| 118 | ||
|style="background: # | |style="background: #ffd3d4;"| 118 | ||
|style="background: # | |style="background: #ffedd3;"| 024 | ||
| Pre-fail | | Pre-fail | ||
| Always | | Always | ||
Zeile 334: | Zeile 361: | ||
|Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden. | |Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden. | ||
|- | |- | ||
| 4 | |||
| | | '''Start Stop Count''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 000 | ||
| Old | | Old age | ||
| Always | | Always | ||
| 772 | | 772 | ||
|772 mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts. | |'''772''' mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts. | ||
|- | |- | ||
| 5 | |||
| | | '''Reallocated Sector Count''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 005 | ||
| Pre-fail | | Pre-fail | ||
| Always | | Always | ||
| 55 | | 55 | ||
|55 Sektoren | |'''55''' Sektoren wegen Defekts gegen Reservesektoren ausgetauscht. Laufwerk schätzt das als problemlos ein. | ||
|- | |- | ||
| 7 | |||
| | | '''Seek Error Rate''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 067 | ||
| Pre-fail | | Pre-fail | ||
| Always | | Always | ||
Zeile 364: | Zeile 391: | ||
|Bisher gab es keine Schreib-/Lesefehler. | |Bisher gab es keine Schreib-/Lesefehler. | ||
|- | |- | ||
| 9 | |||
| | | '''Power On Hours''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 000 | ||
| Old age | | Old age | ||
| Always | | Always | ||
| 1775 | | 1775 | ||
|Laufwerk wurde bisher 1775 Stunden mit Strom versorgt. | |Laufwerk wurde bisher '''1775''' Stunden mit Strom versorgt. Umfasst auch Standbyphasen. Immer prüfen, ob der Wert Std., Min. oder Sek. darstellt. | ||
|- | |- | ||
| 10 | |||
| | | '''Spin Retry Count''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 060 | ||
| Pre-fail | | Pre-fail | ||
| Always | | Always | ||
Zeile 384: | Zeile 411: | ||
|Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an. | |Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an. | ||
|- | |- | ||
| 12 | |||
| | | '''Power Cycle Count''' | ||
|style="background: # | |style="background: #d4ffdc;"| 100 | ||
|style="background: # | |style="background: #ffd3d4;"| 100 | ||
|style="background: # | |style="background: #ffedd3;"| 000 | ||
| Old age | | Old age | ||
| Always | | Always | ||
| 745 | | 745 | ||
|Bisher wurde der PC mit dieser Festplatte 745-mal an- und ausgeschaltet. | |Bisher wurde der PC mit dieser Festplatte '''745'''-mal an- und ausgeschaltet. | ||
|- | |- | ||
| 194 | |||
| | | '''Temperature''' | ||
|style="background: # | |style="background: #d4ffdc;"| 161 | ||
|style="background: # | |style="background: #ffd3d4;"| 161 | ||
|style="background: # | |style="background: #ffedd3;"| 000 | ||
| Old age | | Old age | ||
| Always | | Always | ||
| | | 34<br /> 10<br /> 49 | ||
|Aktuelle Temperatur wäre hier 34 | |Aktuelle Temperatur wäre hier '''34'''°C. Bisherige Lebensmaxima des Laufwerkes waren '''10'''°C bzw. '''49'''°C. Value ist daher von 200 auf 161 gesunken. | ||
|- | |- | ||
| 199 | |||
| | | '''UDMA CRC Error Count''' | ||
|style="background: # | |style="background: #d4ffdc;"| 200 | ||
|style="background: # | |style="background: #ffd3d4;"| 253 | ||
|style="background: # | |style="background: #ffedd3;"| 000 | ||
| Old age | | Old age | ||
| Always | | Always | ||
| 730 | | 730 | ||
||Bisher gab es 730 Übertragungsfehler | ||Bisher gab es '''730''' Übertragungsfehler zum Mainboard. Ursache: fehlerhafter Festplatten-Controller, defektes Anschlusskabel oder Wackelkontakt. | ||
|} | |} | ||
*Auswertung: | |||
**Laufwerk ist in Ordnung. | |||
**Kein Grenzwert erreicht. | |||
**'''Reallocated Sector Count'''-Wert: Die 55 ausgewechselten Sektoren sind laut einer Google-Studie bedenklich. | |||
**'''UDMA CRC Error Count'''-Wert: Besser Kabel tauschen. Wert danach im Auge behalten. | |||
=Quellen= | =Quellen= | ||
[https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology | [https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology Wikipedia SMART] | ||
[https://www.thomas-krenn.com/de/wiki/SMART Thomas Krenn SMART] | [https://www.thomas-krenn.com/de/wiki/SMART Thomas Krenn SMART] | ||
[https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl | [https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl Thomas Krenn SMART-Tests mit smartctl] | ||
[[ | [[Kategorie:SMART]] |
Aktuelle Version vom 29. August 2022, 13:40 Uhr
Self-Monitoring, Analysis and Reporting Technology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung)
smart
- Ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
- Dient der Vorhersage eines möglichen Ausfalls des Speichermediums.
- Dabei werden die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.
- Alle aktuellen Festplatten und SSDs haben SMART Funktionalität.
Funktionsweise
- Auswertung der überwachten Daten erfolgt beim Starten des Rechners durch
- das BIOS,
- andere Firmware,
- oder durch spezielle Software.
- SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten, etwa für die Temperatur.
- Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden.
- Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst, aber keine Warnungen mehr gemeldet.
- Gespeichert werden die gesammelten Daten in einem reservierten, durch Programme nicht änderbaren Bereich der Festplatte.
- Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen.
- Verbaute Sensoren und Chipfunktionen erfassen die Werte.
- Aktualisierung der Daten
- "Online"-Parameter, die permanent notiert werden.
- "Offline"-Parameter, die erst in Ruhepausen aktualisiert werden.
Informationswert
- Liefern keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems.
- Auf Massenspeicher wie Festplatten oder SSDs beschränkt.
- Ist nicht normiert, sondern es ist den Herstellern überlassen, welche Parameter in welchen Grenzen überwacht werden.
- Die Genauigkeit der Überwachung wird diskutiert.
- Manche Temperatursensoren gelten als falsch platziert oder zu optimistisch eingestellt.
- Ergebnis einer unabhängigen Google-Studie von 2006, Dauer über neun Monate, mit 100.000 Festplatten aller Hersteller:
- Es sind 64 % aller Ausfälle mit SMART vorhersagbar.
- Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen.
- Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate.
wichtige Attribute
Attribut | Erklärung |
---|---|
Raw Read Error Rate | Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche |
Spin Up Time | Zeit Stillstand bis volle Arbeitsumdrehung |
Reallocated Sector | Verschieben defekter Sektoren in Reserve-Sektoren |
Seek Error Rate | Fehler Ausrichtung Festplattenkopf |
Power On Hours | Laufzeit Festplatte |
Power Cycle Count | Anzahl Anschaltvorgänge |
Multi Zone Error Rate | Fehlerrate beim Schreiben |
Auswertung
Parameter
- als Raw-Werte gespeichert
- Raw-Wert wird zum besseren Verständnis in Werteskala von 0 bis 100, 200 oder 255 einsortiert
- Werteskala
- startet mit dem Skalenmaximum
- bei Fehlern oder zunehmendem Alter nähern sich Werte (value) gegen 0
- kritische Grenze (threshold) für möglichen Ausfall häufig weit über 0
wichtig: Raw-Werte nicht verwechseln mit den Values der Werteskala.
RAW-Werte
Legende | |
---|---|
A | Ausfallsrelevanter Parameter. |
Wenig bis nicht ausfallrelevanter Parameter. | |
+ | Je höher der Raw-Wert, desto besser. |
- | Je niedriger der Raw-Wert, desto besser. |
A? | ID | Hex | Parametername (Englisch) | Parametername (Deutsch) | + - | Beschreibung |
---|---|---|---|---|---|---|
01 | 0x01 | Raw Read Error Rate | Lesefehlerrate (roh) | - |
| |
02 | 0x02 | Throughput Performance | Durchsatz | + |
| |
03 | 0x03 | Spin Up Time | Beschleunigungszeit | - |
| |
04 | 0x04 | Start/Stop Count | Start/Stop-Vorgänge | - |
| |
A | 05 | 0x05 | Reallocated Sectors Count | wiederzugewiesene Sektoren | - |
|
07 | 0x07 | Seek Error Rate | Suchfehlerrate | - |
| |
09 | 0x09 | Power On Hours Count | Zeit in Betrieb | - |
| |
A | 10 | 0x0A | Spin Retry Count | Anlaufwiederholungen, nur bei HDDs relevant |
- |
|
12 | 0x0C | Power Cycle Count | Anzahl der Einschaltungen | - |
| |
A | 184 | 0xB8 | End-To-End error | Ende-zu-Ende Fehler | - |
|
A | 187 | 0xBB | Reported uncorrectable Error | Gemeldete unkorrigierbare Fehler | - |
|
A | 188 | 0xBC | Command Timeout | Kommandos, welche nicht rechtzeitig ausgeführt werden konnten | - |
|
193 | 0xC1 | Load Cycle Count
bzw. Load/Unload Cycle Count |
Parkvorgänge | - |
| |
194 | 0xC2 | Drive Temperature | Festplatten-Temperatur | - |
| |
195 | 0xC3 | Hardware ECC Recovered | gerettete Bitfehler | - |
| |
A | 196 | 0xC4 | Reallocation Event Count | - |
| |
A | 197 | 0xC5 | Current Pending Sector Count | - |
| |
A | 198 | 0xC6 | Uncorrectable Sector Count | Nicht korrigierbare Sektoren | - |
|
199 | 0xC7 | Ultra DMA CRC Error Count | DMA-CRC-Fehler | - |
| |
A | 201 | 0xC9 | Soft Read Error Rate | - |
|
- Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive.
Beispiel
Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über Serial-ATA und ausgelesen mit den smartmontools.
Value | ist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter). |
---|---|
Worst | der bisher schlechteste Wert. |
Threshold | die Grenze, unter die der Wert nicht fallen darf. |
Typ | steht für die Bedeutung des Parameters: „Pre-fail“ ist eine Warnung vor einem baldigen Ausfall, während „Old age“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien). |
Updated | zeigt an, ob der Wert permanent (always) oder erst durch einen Selbsttest vom Typ „Offline data collection“ aktualisiert wird. |
RAW Value | ist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler. |
Parameter-ID | Parametername | Value | Worst | Threshold | Typ | Updated | RAW Value | Bemerkung |
---|---|---|---|---|---|---|---|---|
2 | Throughput Performance | 100 | 100 | 050 | Pre-fail | Offline | 0 | |
3 | Spin Up Time | 118 | 118 | 024 | Pre-fail | Always | 294 | Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden. |
4 | Start Stop Count | 100 | 100 | 000 | Old age | Always | 772 | 772 mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts. |
5 | Reallocated Sector Count | 100 | 100 | 005 | Pre-fail | Always | 55 | 55 Sektoren wegen Defekts gegen Reservesektoren ausgetauscht. Laufwerk schätzt das als problemlos ein. |
7 | Seek Error Rate | 100 | 100 | 067 | Pre-fail | Always | 0 | Bisher gab es keine Schreib-/Lesefehler. |
9 | Power On Hours | 100 | 100 | 000 | Old age | Always | 1775 | Laufwerk wurde bisher 1775 Stunden mit Strom versorgt. Umfasst auch Standbyphasen. Immer prüfen, ob der Wert Std., Min. oder Sek. darstellt. |
10 | Spin Retry Count | 100 | 100 | 060 | Pre-fail | Always | 0 | Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an. |
12 | Power Cycle Count | 100 | 100 | 000 | Old age | Always | 745 | Bisher wurde der PC mit dieser Festplatte 745-mal an- und ausgeschaltet. |
194 | Temperature | 161 | 161 | 000 | Old age | Always | 34 10 49 |
Aktuelle Temperatur wäre hier 34°C. Bisherige Lebensmaxima des Laufwerkes waren 10°C bzw. 49°C. Value ist daher von 200 auf 161 gesunken. |
199 | UDMA CRC Error Count | 200 | 253 | 000 | Old age | Always | 730 | Bisher gab es 730 Übertragungsfehler zum Mainboard. Ursache: fehlerhafter Festplatten-Controller, defektes Anschlusskabel oder Wackelkontakt. |
- Auswertung:
- Laufwerk ist in Ordnung.
- Kein Grenzwert erreicht.
- Reallocated Sector Count-Wert: Die 55 ausgewechselten Sektoren sind laut einer Google-Studie bedenklich.
- UDMA CRC Error Count-Wert: Besser Kabel tauschen. Wert danach im Auge behalten.