SMART
- Self-Monitoring, Analysis and Reporting Technology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung)
- ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
- dient der Vorhersage eines möglichen Ausfalls des Speichermediums.
- dabei die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.
- Alle aktuellen Festplatten und SSDs haben SMART Funktionalität.
Funktionsweise
- Auswertung der überwachten Daten erfolgt beim Starten des Rechners durch
- das BIOS,
- andere Firmware,
- oder durch spezielle Software.
- SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten, etwa für die Temperatur.
- Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden.
- Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst, aber keine Warnungen mehr gemeldet.
- Gespeichert werden die gesammelten Daten in einem reservierten, durch Programme nicht änderbaren Bereich der Festplatte.
- Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen.
- Verbaute Sensoren und Chipfunktionen erfassen die Werte.
- Aktualisierung der Daten
- "Online"-Parameter, die permanent notiert werden.
- "Offline"-Parameter, die erst in Ruhepausen aktualisiert werden.
Informationswert
- Liefern keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems.
- Auf Massenspeicher wie Festplatten oder SSDs beschränkt.
- Ist nicht normiert, sondern es ist den Herstellern überlassen, welche Parameter in welchen Grenzen überwacht werden.
- Die Genauigkeit der Überwachung wird diskutiert.
- Manche Temperatursensoren gelten als falsch platziert oder zu optimistisch eingestellt.
- Ergebnis einer unabhängigen Google-Studie von 2006, Dauer über neun Monate, mit 100.000 Festplatten aller Hersteller:
- Es sind 64 % aller Ausfälle mit SMART vorhersagbar.
- Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen.
- Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate.
Auswertung
Parameter
- als Raw-Werte gespeichert
- Raw-Wert wird zum besseren Verständnis in Werteskala von 0 bis 100, 200 oder 255 einsortiert
- Werteskala
- startet mit dem Skalenmaximum
- bei Fehlern oder zunehmendem Alter nähern sich Werte (value) gegen 0
- kritische Grenze (threshold) für möglichen Ausfall häufig weit über 0
wichtig: Raw-Werte nicht verwechseln mit den Values der Werteskala.
RAW-Werte
Legende | |
---|---|
A | Ausfallsrelevanter Parameter. |
Wenig bis nicht ausfallrelevanter Parameter. | |
+ | Je höher der Raw-Wert, desto besser. |
- | Je niedriger der Raw-Wert, desto besser. |
A? | ID | Hex | Parametername (Englisch) | Parametername (Deutsch) | + - | Beschreibung |
---|---|---|---|---|---|---|
01 | 0x01 | Raw Read Error Rate | Lesefehlerrate (roh) | - |
| |
02 | 0x02 | Throughput Performance | Durchsatz | + |
| |
03 | 0x03 | Spin Up Time | Beschleunigungszeit | - |
| |
04 | 0x04 | Start/Stop Count | Start/Stop-Vorgänge | - |
| |
A | 05 | 0x05 | Reallocated Sectors Count | wiederzugewiesene Sektoren | - |
|
07 | 0x07 | Seek Error Rate | Suchfehlerrate | - |
| |
09 | 0x09 | Power On Hours Count | Zeit in Betrieb | - |
| |
A | 10 | 0x0A | Spin Retry Count | Anlaufwiederholungen, nur bei HDDs relevant |
- |
|
12 | 0x0C | Power Cycle Count | Anzahl der Einschaltungen | - |
| |
A | 184 | 0xB8 | End-To-End error | Ende-zu-Ende Fehler | - |
|
A | 187 | 0xBB | Reported uncorrectable Error | Gemeldete unkorrigierbare Fehler | - |
|
A | 188 | 0xBC | Command Timeout | Kommandos, welche nicht rechtzeitig ausgeführt werden konnten | - |
|
193 | 0xC1 | Load Cycle Count
bzw. Load/Unload Cycle Count |
Parkvorgänge | - |
| |
194 | 0xC2 | Drive Temperature | Festplatten-Temperatur | - |
| |
195 | 0xC3 | Hardware ECC Recovered | gerettete Bitfehler | - |
| |
A | 196 | 0xC4 | Reallocation Event Count | - |
| |
A | 197 | 0xC5 | Current Pending Sector Count | - |
| |
A | 198 | 0xC6 | Uncorrectable Sector Count | Nicht korrigierbare Sektoren | - |
|
199 | 0xC7 | Ultra DMA CRC Error Count | DMA-CRC-Fehler | - |
| |
A | 201 | 0xC9 | Soft Read Error Rate | - |
|
- Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive.