Zum Inhalt springen

SMART: Unterschied zwischen den Versionen

Aus Foxwiki
Robertquies (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
K Textersetzung - „==== Links ====“ durch „=== Links ===“
 
(244 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
'''SMART''' - '''S'''elf-'''M'''onitoring, '''A'''nalysis and '''R'''eporting '''T'''echnology


*'''S'''elf-Monitoring, '''A'''nalysis and '''R'''eporting '''T'''echnology (dt. System zur Selbstüberwachung, Analyse und Statusmeldung)
== Beschreibung ==
**ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD)
System zur Selbstüberwachung, Analyse und Statusmeldung
**dient der Vorhersage eines möglichen Ausfalls des Speichermediums.
* Industriestandard
**dabei die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.


=== Übliche Parameter ===
; Überwachung von Datenträgern
Jeder Wert wird zuerst als ''Raw-Data'' gespeichert. Dieser wird dann zum besseren Verständnis auf einer Werteskala von 0 bis 100, 200 oder 255 einsortiert. Die unterschiedlichen Skalen dienen dabei einer feineren Abstufung, wo der Hersteller sie für sinnvoll erachtet. Mit dem Skalenmaximum startend, nähert sich der Wert (value) bei Fehlern oder zunehmendem Alter null. Häufig ist die kritische Grenze (Threshold) aber schon weit darüber angesiedelt.<ref>{{Internetquelle |autor=Michael Schmelzle |url=http://www.pcwelt.de/tipps/Diese_S.M.A.R.T.-Daten_sind_wichtig-Festplatten-8217564.html |titel=Diese S.M.A.R.T.-Daten sind wichtig |hrsg=IDG Tech Media GmbH |datum=2013-10-30 |zugriff=2017-04-05}}</ref>
* Festplattenlaufwerken (HDD)  
* Solid-State-Drives (SSD)


Nachstehende Tabelle zeigt die einzelnen Parameter und die Bewertung der jeweiligen Raw-Werte auf (nicht zu verwechseln mit den Values der Werteskala):
; Vorhersage eines möglichen Ausfalls
* Werte werden mit Sensoren erfasst
{| class="wikitable" style="margin:auto; text-align:center;"
* Alle aktuellen HDD/SSD-Datenträger sollten [[SMART]] unterstützen
|+ Legende der Raw-Werte
 
! scope="row" | A
== Funktionsweise ==
! style="background:#FED;" | [[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]] Ausfallsrelevanter Parameter. So vorhanden, können damit mögliche Ausfälle prognostiziert werden.
; Auswertung der Daten durch
* [[BIOS]]/[[UEFI]]
* [[Firmware]]
* [[smartctl|Software]]
 
; Grenzwerten
SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten
* etwa für die Temperatur
 
; Ausfall prognostizieren
Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden
* Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst
* Aber keine Warnungen mehr gemeldet
 
; Speicherung der Daten
Speicherung der Daten
Gespeichert werden die gesammelten Daten in einem
 
reservierten
, durch Programme nicht änderbaren Bereich der Festplatte
 
; Geschwindigkeit
Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen
* Verbaute Sensoren und Chipfunktionen erfassen die Werte
 
== Aktualisierung der Daten ==
{| class="wikitable options big"
! Parameter !! Eigenschaft
|-
|-
! scope="row" | I
| Online || werden permanent notiert
| Informierend, für die Ausfallsprognose wenig bis nicht relevanter Parameter
|-
|-
! scope="row" | [[Datei:Dark Green Arrow Up.svg|12px|center|alt=höher, besser]]
| Offline || werden im Ruhepausen aktualisiert
| Je höher der Raw-Wert, desto besser
|-
! scope="row" | [[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
| Je niedriger der Raw-Wert, desto besser
|}
|}


{| class="wikitable sortable" summary="Überblick über verschiedene S.M.A.R.T.-Werte und deren zugehörige Beschreibung"
==Informationswert==
!ID
 
!Hex
*Liefern keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems
!Parametername (Englisch)
*Auf Massenspeicher wie Festplatten oder SSDs beschränkt
!Parametername (Deutsch)
*Ist nicht normiert, sondern es ist den Herstellern überlassen, welche Parameter in welchen Grenzen überwacht werden
!A
*Die Genauigkeit der Überwachung wird diskutiert
!I
**Manche Temperatursensoren gelten als falsch platziert oder zu optimistisch eingestellt
!Besser
*Ergebnis einer unabhängigen Google-Studie von '''2006''', Dauer über '''neun Monate''', mit '''100.000 Festplatten''' aller Hersteller
!Beschreibung
**Es sind '''64 %''' aller Ausfälle mit SMART vorhersagbar
|-
**Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen
|01
**Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate
|0x01
|'''(Raw) Read Error Rate'''
|Lesefehlerrate (roh)
|
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen.


* Deutet auf Problem mit der Plattenoberfläche hin.
== Wichtige Attribute ==
* ''Einige Laufwerke haben hier sehr hohe Raw-Werte, die auch zwischen Modellen eines Herstellers nicht vergleichbar sind. Bei neueren [[Seagate]]-Laufwerken ist er fälschlicherweise identisch mit dem bei Hardware ECC Recovered. Ausfallrelevant sind nur die Skalenwerte.''
{| class="wikitable" style="margin:0px; text-align:left;"
! Attribut
! Erklärung
|-
|-
|02
| Raw Read Error Rate
|0x02
| Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche
|'''Throughput Performance'''
|Durchsatz
|
|
|data-sort-value="10"|[[Datei:Dark Green Arrow Up.svg|12px|center|alt=höher, besser]]
|
* allgemeiner Datendurchsatz bzw. Effizienz der Festplatte
* Deutet stark auf bremsende Probleme im Laufwerk hin.
|-
|-
|03
| Spin Up Time
|0x03
| Zeit Stillstand bis volle Arbeitsumdrehung
|'''Spin Up Time'''
|Beschleunigungszeit
|
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Durchschnitt der Startzeit in (Milli-)Sekunden.
* Deutet auf Probleme beim Motor oder den Plattenlagern hin.
* ''Bei fabrikneuen Maxtor- und Quantum-Laufwerken kam es hier im ersten Monat häufig zu Falschalarmen.''
|-
|-
|04
| Reallocated Sector
|0x04
| Verschieben defekter Sektoren in Reserve-Sektoren
|'''Start/Stop Count'''
|Start/Stop-Vorgänge
|
|ja
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby)
* Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet.
|- style="background:#FED;"
|05
|0x05
|'''Reallocated Sectors Count'''
|wiederzugewiesene Sektoren
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der verbrauchten Reservesektoren.
* Deutet auf Oberflächenprobleme hin, da nur dann automatisch ein Reservesektor einen bisher verwendeten ersetzt.
* ''Ist dieser RAW-Zähler ungleich null, ist die Wahrscheinlichkeit für einen Ausfall verfünffacht. Meist folgt dieser dem ersten „Reallocation Event“ binnen eines halben Jahres.''
|-
|-
|07
| Seek Error Rate
|0x07
| Fehler Ausrichtung Festplattenkopf
|'''Seek Error Rate'''
|Suchfehlerrate
|
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen.
* Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin.
* ''Auch vom Hersteller unerklärt, tragen hier einige fabrikneue Seagate-Laufwerke Skalenwerte weit unter 100 ein.''<ref>http://forums.storagereview.net/index.php?showtopic=20731</ref>
|-
|-
|09
| Power On Hours
|0x09
| Laufzeit Festplatte
|'''Power On Hours Count'''
|Zeit in Betrieb
|
|ja
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Laufleistung in Stunden oder Sekunden (inklusive Standby)
* Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus.
* ''Bei einigen Modellen von Maxtor, z. B. bei der Maxtor DiamondMax 10 6L250S0 sind das Minuten.''
|- style="background:#FED;"
|10
|0x0A
|'''Spin Retry Count'''
|Anlaufwiederholungen,<br/>nur bei HDDs relevant
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin.
|-
|-
|12
| Power Cycle Count
|0x0C
| Anzahl Anschaltvorgänge
|'''Power Cycle Count'''
|Anzahl der Einschaltungen
|
|ja
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist.
|- style="background:#FED;"
|184
|0xB8
|'''End-To-End error'''
|Ende-zu-Ende Fehler
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Steigende Werte zeigen Parityfehler zwischen den Speichermedium und Laufwerkcontroller an.
|- style="background:#FED;"
|187
|0xBB
|'''Reported uncorrectable Error'''
|Gemeldete unkorrigierbare Fehler
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Fehler welche durch die integrierte [[Vorwärtsfehlerkorrektur]] (ECC) nicht korrigiert werden konnten.
|- style="background:#FED;"
|188
|0xBC
|'''Command Timeout'''
|Kommandos welche nicht rechtzeitig ausgeführt werden konnten
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der Kommandoabbrüche wegen Zeitüberschreitung
|-
|-
|193
| Multi Zone Error Rate
|0xC1
| Fehlerrate beim Schreiben
|'''Load Cycle Count'''
|}
bzw.
 
 
<noinclude>
 
== Anhang ==
=== Siehe auch ===
{{Special:PrefixIndex/{{BASEPAGENAME}}/}}
{{Special:PrefixIndex/smart}}
 
=== Links ===
==== Weblinks ====
# https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
# https://www.thomas-krenn.com/de/wiki/SMART
# https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl
 
{{DEFAULTSORT:SMART}}
{{DISPLAYTITLE:SMART}}


'''Load/Unload Cycle Count'''
[[Kategorie:SMART]]
|Parkvorgänge
|
|ja
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Parkvorgänge der Schreib-Lese-Einheit auf die neben den Platten befindliche Plastikrampe.
* Meist nur bei Notebooklaufwerken. Deutet auf Abnutzung hin; vorgesehen sind rund 300.000 – der Raw-Wert zeigt die bisherigen.
* Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch. Kommt das Notebook zu Fall, stößt so die Schreib-Lese-Einheit nicht mehr auf die Magnetscheiben. Die Stoßfestigkeit wird auf rund 1000 [[Erdbeschleunigung|g]] verdreifacht. Auch das An- bzw. Ausschalten ist schonender, da die Einheit nicht schleifend auf einen Sonderbereich der Platten abgesenkt wird („[[Landezone (Festplatte)|Landing Zone]]“).<ref>[http://hddguru.com/content/en/articles/2006.02.17-Changing-headstack-Q-and-A/fig_13.jpg Bild: Schreib- Lesekopf in Parkposition]</ref>
|-
|194
|0xC2
|'''Drive Temperature'''
|Festplatten-Temperatur
|
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Temperatur des Laufwerkes in °C
* Da manche Laufwerke auch Maximal- und Minimalwert speichern, ist eine frühere Unterkühlung oder Überhitzung während des Betriebes erkennbar. Der als raw-value angegebene Wert enthält dann alle drei Zahlen hintereinander.
* ''Hohe Temperaturen (ab 40 °C) haben erst nach drei Jahren Auswirkung. In diesem Jahr verdoppeln sie die Ausfallwahrscheinlichkeit. Danach verlieren sie ihre Bedeutung wieder. Über alle Alter gemittelt, sind Temperaturen unter 25 °C weit gefährlicher als solche über 40 °C. 20 °C verdoppeln, 15 °C verdreifachen die Ausfallrate; gemessen wurde dabei bis 52 °C. Manche Hersteller verwenden ungenaue oder falsch platzierte Sensoren.<ref name="google_pdf" />''
|-
|195
|0xC3
|'''Hardware ECC Recovered'''
|gerettete Bitfehler
|
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* korrigierte Bitfehler beim Lesen
* Kann auf Problem mit der Plattenoberfläche hindeuten.
* Die hohe Datendichte heutiger Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt.<sup>[Beleg?]</sup> Auch sehr hohe Werte hier sind also kein Grund zur Beunruhigung.
* ''[[Samsung]]-Laufwerke der P80-Serie tragen hier fälschlicherweise oft sehr niedrige Skalenwerte ein. Generell sind sehr hohe Raw-Werte üblich, die wegen Wechseln von einer Technik auf eine neuere (engl.: „technology change“) auch zwischen Modellen desselben Herstellers nicht vergleichbar sind. Sie steigen bei Lesevorgängen, da nur dann eine Fehlerkorrektur stattfindet. Ausfallrelevant sind nur die Skalenwerte. Selten werden die Werte auch „ECC On-the-fly“ genannt.''
|- style="background:#FED;"
|196
|0xC4
|'''Reallocation Event Count'''
|
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren.
|- style="background:#FED;"
|197
|0xC5
|'''Current Pending Sector Count'''
|
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition
|- style="background:#FED;"
|198
|0xC6
|'''Uncorrectable Sector Count'''
|Nicht korrigierbare Sektoren
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen.
|-
|199
|0xC7
|'''Ultra DMA CRC Error Count'''
|DMA-CRC-Fehler
|
|ja
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der aufgetretenen [[Zyklische Redundanzprüfung|CRC]]-Fehler
* Ursache können defekte Kabel, verschmutzte Kontakte, [[Übertakten|Übertaktung]] oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt.
|- style="background:#FED;"
|201
|0xC9
|'''Soft Read Error Rate'''
|
|[[Datei:Nuvola apps important.svg|28px|center|link=|alt=Ausfallskritisch]]
|
|data-sort-value="0"|[[Datei:Dark Green Arrow Down.svg|12px|center|alt=niedriger, besser]]
|
* Anzahl der nicht per Software korrigierbaren Lesefehler.
|}


Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive. Vollständige Listen finden sich im Literatur-Abschnitt der Weblinks.
</noinclude>

Aktuelle Version vom 22. März 2025, 02:24 Uhr

SMART - Self-Monitoring, Analysis and Reporting Technology

Beschreibung

System zur Selbstüberwachung, Analyse und Statusmeldung

  • Industriestandard
Überwachung von Datenträgern
  • Festplattenlaufwerken (HDD)
  • Solid-State-Drives (SSD)
Vorhersage eines möglichen Ausfalls
  • Werte werden mit Sensoren erfasst
  • Alle aktuellen HDD/SSD-Datenträger sollten SMART unterstützen

Funktionsweise

Auswertung der Daten durch
Grenzwerten

SMART orientiert sich an vom Festplattenhersteller festgelegten Grenzwerten

  • etwa für die Temperatur
Ausfall prognostizieren

Nach einem längeren Zeitraum kann ein zu erwartender Ausfall prognostiziert werden

  • Wird SMART "abgeschaltet", werden weiterhin alle Daten erfasst
  • Aber keine Warnungen mehr gemeldet
Speicherung der Daten

Speicherung der Daten Gespeichert werden die gesammelten Daten in einem

reservierten , durch Programme nicht änderbaren Bereich der Festplatte

Geschwindigkeit

Die Überwachung verlangsamt die Festplatte nicht, da nur protokolliert wird, ohne korrigierend einzugreifen

  • Verbaute Sensoren und Chipfunktionen erfassen die Werte

Aktualisierung der Daten

Parameter Eigenschaft
Online werden permanent notiert
Offline werden im Ruhepausen aktualisiert

Informationswert

  • Liefern keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems
  • Auf Massenspeicher wie Festplatten oder SSDs beschränkt
  • Ist nicht normiert, sondern es ist den Herstellern überlassen, welche Parameter in welchen Grenzen überwacht werden
  • Die Genauigkeit der Überwachung wird diskutiert
    • Manche Temperatursensoren gelten als falsch platziert oder zu optimistisch eingestellt
  • Ergebnis einer unabhängigen Google-Studie von 2006, Dauer über neun Monate, mit 100.000 Festplatten aller Hersteller
    • Es sind 64 % aller Ausfälle mit SMART vorhersagbar
    • Die Beanspruchung der Festplatte hatte einen geringeren Einfluss auf ihre Haltbarkeit als angenommen
    • Nur im 1. und nach dem 4. Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate

Wichtige Attribute

Attribut Erklärung
Raw Read Error Rate Lesen-Fehlerrate, Problem Lese/Schreib-Köpfe/Plattenoberfläche
Spin Up Time Zeit Stillstand bis volle Arbeitsumdrehung
Reallocated Sector Verschieben defekter Sektoren in Reserve-Sektoren
Seek Error Rate Fehler Ausrichtung Festplattenkopf
Power On Hours Laufzeit Festplatte
Power Cycle Count Anzahl Anschaltvorgänge
Multi Zone Error Rate Fehlerrate beim Schreiben



Anhang

Siehe auch

Links

Weblinks

  1. https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
  2. https://www.thomas-krenn.com/de/wiki/SMART
  3. https://www.thomas-krenn.com/de/wiki/SMART_Tests_mit_smartctl