Zum Inhalt springen

SMART: Unterschied zwischen den Versionen

Aus Foxwiki
Keine Bearbeitungszusammenfassung
K Textersetzung - „==== Links ====“ durch „=== Links ===“
 
(16 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 2: Zeile 2:


== Beschreibung ==
== Beschreibung ==
; System zur Selbstüberwachung, Analyse und Statusmeldung
System zur Selbstüberwachung, Analyse und Statusmeldung
Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
* Industriestandard
* Vorhersage eines möglichen Ausfalls des Speichermediums
 
* Dabei werden die Werte verschiedener Sensoren mithilfe von unterschiedlichen Parametern ausgewertet
; Überwachung von Datenträgern
* Alle aktuellen Festplatten und SSDs haben SMART-Funktionalität
* Festplattenlaufwerken (HDD)  
* Solid-State-Drives (SSD)
 
; Vorhersage eines möglichen Ausfalls
* Werte werden mit Sensoren erfasst
* Alle aktuellen HDD/SSD-Datenträger sollten [[SMART]] unterstützen


== Funktionsweise ==
== Funktionsweise ==
Auswertung der überwachten Daten erfolgt beim Starten des Rechners durch
; Auswertung der Daten durch
* das BIOS
* [[BIOS]]/[[UEFI]]
* andere Firmware
* [[Firmware]]
* oder durch spezielle Software
* [[smartctl|Software]]


SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten, etwa für die Temperatur
; Grenzwerten
SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten
* etwa für die Temperatur


; Ausfall prognostizieren
Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden
Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden
* Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst, aber keine Warnungen mehr gemeldet
* Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst
* Aber keine Warnungen mehr gemeldet
 
; Speicherung der Daten
Speicherung der Daten
Gespeichert werden die gesammelten Daten in einem


Gespeichert werden die gesammelten Daten in einem reservierten, durch Programme nicht änderbaren Bereich der Festplatte
reservierten
, durch Programme nicht änderbaren Bereich der Festplatte


; Geschwindigkeit
Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen
Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen
* Verbaute Sensoren und Chipfunktionen erfassen die Werte


Verbaute Sensoren und Chipfunktionen erfassen die Werte
== Aktualisierung der Daten ==
 
{| class="wikitable options big"
Aktualisierung der Daten
! Parameter !! Eigenschaft
*"Online"-Parameter, die permanent notiert werden
|-
*"Offline"-Parameter, die erst in Ruhepausen aktualisiert werden
| Online || werden permanent notiert
|-
| Offline || werden im Ruhepausen aktualisiert
|}


==Informationswert==
==Informationswert==
Zeile 68: Zeile 87:
|}
|}


==Auswertung==
===Parameter===
*als '''Raw-Werte''' gespeichert
*'''Raw-Wert''' wird zum besseren Verständnis in '''Werteskala''' von '''0''' bis '''100''', '''200''' oder '''255''' einsortiert
*'''Werteskala'''
**startet mit dem Skalenmaximum
**bei Fehlern oder zunehmendem Alter nähern sich Werte ('''value''') gegen 0
**kritische Grenze ('''threshold''') für möglichen Ausfall häufig weit über 0
; Achtung
<blockquote>Raw-Werte nicht mit Values der Werteskala verwechseln!</blockquote>
====RAW-Werte====
{| class="wikitable" style="margin:0px; text-align:left;"
!colspan="2" scope="row"; | Legende
|-
! scope="row" style="background:#ffbcbd; | A
| Ausfallsrelevanter Parameter
|-
! scope="row" style="background:#F9F9F9 |
| Wenig bis nicht ausfallrelevanter Parameter
|-
! scope="row" | '''+'''
| Je höher der Raw-Wert, desto besser
|-
! scope="row" | '''-'''
| Je niedriger der Raw-Wert, desto besser
|}
{| class="wikitable sortable" summary="Überblick über verschiedene S.M.A.R.T.-Werte"
!A?
!ID
!Hex
!Parametername (Englisch)
!Parametername (Deutsch)
!+ -
!Beschreibung
|-
|
|01
|0x01
|'''Raw Read Error Rate'''
|Lesefehlerrate (roh)
|data-sort-value="0"|'''-'''
|
* Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen
* Problem mit der Plattenoberfläche
|-
|
|02
|0x02
|'''Throughput Performance'''
|Durchsatz
|data-sort-value="10"|'''+'''
|
* allgemeiner Datendurchsatz bzw. Effizienz der Festplatte
* Deutet stark auf bremsende Probleme im Laufwerk hin
|-
|
|03
|0x03
|'''Spin Up Time'''
|Beschleunigungszeit
|data-sort-value="0"|'''-'''
|
* Durchschnitt der Startzeit in (Milli-)Sekunden
* Deutet auf Probleme beim Motor oder den Plattenlagern hin
|-
|
|04
|0x04
|'''Start/Stop Count'''
|Start/Stop-Vorgänge
|data-sort-value="0"|'''-'''
|
* Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby)
* Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet
|- style="background:#ffbcbd;"
|A
|05
|0x05
|'''Reallocated Sectors Count'''
|wiederzugewiesene Sektoren
|data-sort-value="0"|'''-'''
|
* Anzahl der verbrauchten Reservesektoren
* Deutet auf Oberflächenprobleme hin, da nur dann ein Reservesektor einen bisher verwendeten ersetzt
* Ist dieser RAW-Zähler ungleich 0, ist Wahrscheinlichkeit für einen Ausfall 5-facht
|-
|
|07
|0x07
|'''Seek Error Rate'''
|Suchfehlerrate
|data-sort-value="0"|'''-'''
|
* Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen
* Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin
|-
|
|09
|0x09
|'''Power On Hours Count'''
|Zeit in Betrieb
|data-sort-value="0"|'''-'''
|
* Laufleistung in Stunden oder Sekunden (inklusive Standby)
* Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus
|- style="background:#ffbcbd"
|A
|10
|0x0A
|'''Spin Retry Count'''
|Anlaufwiederholungen,<br/>nur bei HDDs relevant
|data-sort-value="0"|'''-'''
|
* Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin
|-
|
|12
|0x0C
|'''Power Cycle Count'''
|Anzahl der Einschaltungen
|data-sort-value="0"|'''-'''
|
* Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist
|- style="background:#ffbcbd"
|A
|184
|0xB8
|'''End-To-End error'''
|Ende-zu-Ende Fehler
|data-sort-value="0"|'''-'''
|
* Steigende Werte zeigen Parityfehler zwischen Speichermedium und Laufwerkcontroller an
|- style="background:#ffbcbd"
|A
|187
|0xBB
|'''Reported uncorrectable Error'''
|Gemeldete unkorrigierbare Fehler
|data-sort-value="0"|'''-'''
|
* Fehler welche durch die integrierte Vorwärtsfehlerkorrektur (ECC) nicht korrigiert werden konnten
|- style="background:#ffbcbd"
|A
|188
|0xBC
|'''Command Timeout'''
|Kommandos, welche nicht rechtzeitig ausgeführt werden konnten
|data-sort-value="0"|'''-'''
|
* Anzahl der Kommandoabbrüche wegen Zeitüberschreitung
|-
|
|193
|0xC1
|'''Load Cycle Count'''
bzw
'''Load/Unload Cycle Count'''
|Parkvorgänge
|data-sort-value="0"|'''-'''
|
* Parkvorgänge der Schreib-Lese-Einheit auf die neben den Platten befindliche Plastikrampe
* Meist nur bei Notebooklaufwerken. Deutet auf Abnutzung hin; vorgesehen sind rund 300.000 – der Raw-Wert zeigt die bisherigen
* Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch
|-
|
|194
|0xC2
|'''Drive Temperature'''
|Festplatten-Temperatur
|data-sort-value="0"|'''-'''
|
* Temperatur des Laufwerkes in °C
* Der als raw-value angegebene Wert kann drei Werte enthalten Min-,Ist- und Max-Wert
* Hohe Temperaturen (ab 40°C) haben nur während des 3.Jahres Auswirkungen (Verdopplung Ausfallwahrscheinlichkeit), danach nicht mehr. Temperaturen unter 25°C sind weit gefährlicher als solche über 40°C. 20°C 2x, 15°C 3x so hohe Ausfallrate
|-
|
|195
|0xC3
|'''Hardware ECC Recovered'''
|gerettete Bitfehler
|data-sort-value="0"|'''-'''
|
* korrigierte Bitfehler beim Lesen
* Kann auf Problem mit Plattenoberfläche hindeuten
* Die hohe Datendichte von Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt. Sehr hohe Werte sind kein Grund zur Beunruhigung
|- style="background:#ffbcbd"
|A
|196
|0xC4
|'''Reallocation Event Count'''
|
|data-sort-value="0"|'''-'''
|
* Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren
|- style="background:#ffbcbd"
|A
|197
|0xC5
|'''Current Pending Sector Count'''
|
|data-sort-value="0"|'''-'''
|
* Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition
|- style="background:#ffbcbd"
|A
|198
|0xC6
|'''Uncorrectable Sector Count'''
|Nicht korrigierbare Sektoren
|data-sort-value="0"|'''-'''
|
* Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen
|-
|
|199
|0xC7
|'''Ultra DMA CRC Error Count'''
|DMA-CRC-Fehler
|data-sort-value="0"|'''-'''
|
* Anzahl der aufgetretenen [[Zyklische Redundanzprüfung|CRC]]-Fehler
* Ursache können defekte Kabel, verschmutzte Kontakte, Übertaktung oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt
|- style="background:#ffbcbd"
|A
|201
|0xC9
|'''Soft Read Error Rate'''
|
|data-sort-value="0"|'''-'''
|
* Anzahl der nicht per Software korrigierbaren Lesefehler
|}
*Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive
===Beispiel===
Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über Serial-ATA und ausgelesen mit den smartmontools
{| class="wikitable options"
!style="background:#adffa9;"|'''Value'''
|ist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter)
|-
!style="background:#ff898b;"|'''Worst'''
|der bisher schlechteste Wert
|-
!style="background:#FFDEAD;"|'''Threshold'''
|die Grenze, unter die der Wert nicht fallen darf.<!-- ?? -->
|-
|'''Typ'''
|steht für die Bedeutung des Parameters: „'''Pre-fail'''“ ist eine Warnung vor einem baldigen Ausfall, während „'''Old age'''“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien)
|-
|'''Updated'''
|zeigt an, ob der Wert permanent (always) oder erst durch einen [[#Selbsttest und Fehler-Logbuch|Selbsttest]] vom Typ „Offline data collection“ aktualisiert wird
|-
|'''RAW Value'''
|ist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler
|}
{| class="wikitable" style="text-align: center;"
|-style="background: #ececec;"
!Parameter-ID
!Parametername
!style="background:#adffa9;"|Value
!style="background:#ff898b;"|Worst
!style="background:#FFDEAD;"|Threshold
!Typ
!Updated
!RAW Value
!Bemerkung
|-
| 2
| '''Throughput Performance'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 050
| Pre-fail
| Offline
| 0
|
|-
| 3
| '''Spin Up Time'''
|style="background: #d4ffdc;"| 118
|style="background: #ffd3d4;"| 118
|style="background: #ffedd3;"| 024
| Pre-fail
| Always
| 294
|Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden
|-
| 4
| '''Start Stop Count'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 000
| Old age
| Always
| 772
|'''772''' mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts
|-
| 5
| '''Reallocated Sector Count'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 005
| Pre-fail
| Always
| 55
|'''55''' Sektoren wegen Defekts gegen Reservesektoren ausgetauscht. Laufwerk schätzt das als problemlos ein
|-
| 7
| '''Seek Error Rate'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 067
| Pre-fail
| Always
| 0
|Bisher gab es keine Schreib-/Lesefehler
|-
| 9
| '''Power On Hours'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 000
| Old age
| Always
| 1775
|Laufwerk wurde bisher '''1775''' Stunden mit Strom versorgt. Umfasst auch Standbyphasen. Immer prüfen, ob der Wert Std., Min. oder Sek. darstellt
|-
| 10
| '''Spin Retry Count'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 060
| Pre-fail
| Always
| 0
|Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an
|-
| 12
| '''Power Cycle Count'''
|style="background: #d4ffdc;"| 100
|style="background: #ffd3d4;"| 100
|style="background: #ffedd3;"| 000
| Old age
| Always
| 745
|Bisher wurde der PC mit dieser Festplatte '''745'''-mal an- und ausgeschaltet
|-
| 194
| '''Temperature'''
|style="background: #d4ffdc;"| 161
|style="background: #ffd3d4;"| 161
|style="background: #ffedd3;"| 000
| Old age
| Always
| 34<br /> 10<br /> 49
|Aktuelle Temperatur wäre hier '''34'''°C. Bisherige Lebensmaxima des Laufwerkes waren '''10'''°C bzw. '''49'''°C. Value ist daher von 200 auf 161 gesunken
|-
| 199
| '''UDMA CRC Error Count'''
|style="background: #d4ffdc;"| 200
|style="background: #ffd3d4;"| 253
|style="background: #ffedd3;"| 000
| Old age
| Always
| 730
||Bisher gab es '''730''' Übertragungsfehler zum Mainboard. Ursache: fehlerhafter Festplatten-Controller, defektes Anschlusskabel oder Wackelkontakt
|}
; Auswertung
* Laufwerk ist in Ordnung
* Kein Grenzwert erreicht
**'''Reallocated Sector Count'''-Wert: Die 55 ausgewechselten Sektoren sind laut einer Google-Studie bedenklich
**'''UDMA CRC Error Count'''-Wert: Besser Kabel tauschen. Wert danach im Auge behalten


<noinclude>
<noinclude>
Zeile 458: Zeile 95:
{{Special:PrefixIndex/smart}}
{{Special:PrefixIndex/smart}}


==== Links ====
=== Links ===
===== Weblinks =====
==== Weblinks ====
# [https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology Wikipedia SMART]
# https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
# [https://www.thomas-krenn.com/de/wiki/SMART Thomas Krenn SMART]
# https://www.thomas-krenn.com/de/wiki/SMART
# [https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl Thomas Krenn SMART-Tests mit smartctl]
# https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl


{{DEFAULTSORT:new}}
{{DEFAULTSORT:SMART}}
{{DISPLAYTITLE:new}}
{{DISPLAYTITLE:SMART}}


[[Kategorie:SMART]]
[[Kategorie:SMART]]


</noinclude>
</noinclude>

Aktuelle Version vom 22. März 2025, 02:24 Uhr

SMART - Self-Monitoring, Analysis and Reporting Technology

Beschreibung

System zur Selbstüberwachung, Analyse und Statusmeldung

  • Industriestandard
Überwachung von Datenträgern
  • Festplattenlaufwerken (HDD)
  • Solid-State-Drives (SSD)
Vorhersage eines möglichen Ausfalls
  • Werte werden mit Sensoren erfasst
  • Alle aktuellen HDD/SSD-Datenträger sollten SMART unterstützen

Funktionsweise

Auswertung der Daten durch
Grenzwerten

SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten

  • etwa für die Temperatur
Ausfall prognostizieren

Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden

  • Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst
  • Aber keine Warnungen mehr gemeldet
Speicherung der Daten

Speicherung der Daten Gespeichert werden die gesammelten Daten in einem

reservierten , durch Programme nicht änderbaren Bereich der Festplatte

Geschwindigkeit

Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen

  • Verbaute Sensoren und Chipfunktionen erfassen die Werte

Aktualisierung der Daten

Parameter Eigenschaft
Online werden permanent notiert
Offline werden im Ruhepausen aktualisiert

Informationswert

  • Liefern keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems
  • Auf Massenspeicher wie Festplatten oder SSDs beschränkt
  • Ist nicht normiert, sondern es ist den Herstellern überlassen, welche Parameter in welchen Grenzen überwacht werden
  • Die Genauigkeit der Überwachung wird diskutiert
    • Manche Temperatursensoren gelten als falsch platziert oder zu optimistisch eingestellt
  • Ergebnis einer unabhängigen Google-Studie von 2006, Dauer über neun Monate, mit 100.000 Festplatten aller Hersteller
    • Es sind 64 % aller Ausfälle mit SMART vorhersagbar
    • Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen
    • Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate

Wichtige Attribute

Attribut Erklärung
Raw Read Error Rate Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche
Spin Up Time Zeit Stillstand bis volle Arbeitsumdrehung
Reallocated Sector Verschieben defekter Sektoren in Reserve-Sektoren
Seek Error Rate Fehler Ausrichtung Festplattenkopf
Power On Hours Laufzeit Festplatte
Power Cycle Count Anzahl Anschaltvorgänge
Multi Zone Error Rate Fehlerrate beim Schreiben



Anhang

Siehe auch

  1. https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
  2. https://www.thomas-krenn.com/de/wiki/SMART
  3. https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl