Zum Inhalt springen

Linux/RAID/Fehlerbehebung: Unterschied zwischen den Versionen

Aus Foxwiki
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 5: Zeile 5:
=== Details ermitteln ===
=== Details ermitteln ===
Dieses Beispiel zeigt eine ausgefallene Platte in einem RAID 6.
Dieses Beispiel zeigt eine ausgefallene Platte in einem RAID 6.
 
<syntaxhighlight lang="bash" highlight="1" line>
  Personalities : [raid6] [raid5] [raid4] [raid1] [linear] [multipath] [raid0] [raid10]
  Personalities : [raid6] [raid5] [raid4] [raid1] [linear] [multipath] [raid0] [raid10]
  md2 : active raid6 sdj1[7] sdi1[6] sdh1[5] sdg1[4] sdd1[3] sda1[0] sdb1[1] sdc1[2]
  md2 : active raid6 sdj1[7] sdi1[6] sdh1[5] sdg1[4] sdd1[3] sda1[0] sdb1[1] sdc1[2]
Zeile 11: Zeile 11:


  unused devices: <none>
  unused devices: <none>
</syntaxhighlight>


In diesem Fall wurde das fehlerhafte Gerät bereits automatisch entfernt.
In diesem Fall wurde das fehlerhafte Gerät bereits automatisch entfernt.


Genauere Details, u.a. den Namen des defekten Geräts kann mit mdadm ermittelt werden:
Genauere Details, u.a. den Namen des defekten Geräts kann mit mdadm ermittelt werden:
# mdadm --detail /dev/md2
<syntaxhighlight lang="bash" highlight="1" line>
sudo mdadm --detail /dev/md2
</syntaxhighlight>


=== Datenträger wechseln ===
=== Datenträger wechseln ===
; Achtung
; Achtung
<blockquote>* Bei einem RAID 0 äußert sich der Ausfall einer Platte im Totalausfall des gesamten RAID- Verbunds.* Das RAID 0 kann daher nicht mit den folgenden Anweisungen repariert werden, sondern muss neu aufgesetzt werden und die hoffentlich vorhandene Datensicherung eingespielt werden.
<blockquote>
* Bei einem RAID 0 äußert sich der Ausfall einer Platte im Totalausfall des gesamten RAID- Verbunds.
* Das RAID 0 kann daher nicht mit den folgenden Anweisungen repariert werden, sondern muss neu aufgesetzt werden und die hoffentlich vorhandene Datensicherung eingespielt werden
</blockquote>
</blockquote>


Zeile 25: Zeile 30:


Falls der Kernel das Gerät noch nicht aus dem Verbund entfernt hat (d.h. es wird beim Befehl mdadm --detail noch aufgeführt), muss es zunächst aus dem Verbund entfernt werden
Falls der Kernel das Gerät noch nicht aus dem Verbund entfernt hat (d.h. es wird beim Befehl mdadm --detail noch aufgeführt), muss es zunächst aus dem Verbund entfernt werden
<syntaxhighlight lang="bash" highlight="1" line>
sudo mdadm /dev/md2 --remove /dev/sdk1
</syntaxhighlight>


# mdadm /dev/md2 --remove /dev/sdk1
Nun kann die entsprechende Platte gewechselt werden
 
* Ist eine entsprechende Austauschplatte eingebaut, muss diese zunächst partitioniert werden
Nun kann die entsprechende Platte gewechselt werden.
* Die neue Partition muss mindestens die gleiche Anzahl an Sektoren aufweisen, wie die bereits genutzten Partitionen
* Ist eine entsprechende Austauschplatte eingebaut, muss diese zunächst partitioniert werden.
* Die neue Partition muss mindestens die gleiche Anzahl an Sektoren aufweisen, wie die bereits genutzten Partitionen.


Von einer bestehenden Platte erhält man die Sektorenzahl der Partitionen (hier am Beispiel von /dev/sda) mittels:
Von einer bestehenden Platte erhält man die Sektorenzahl der Partitionen (hier am Beispiel von /dev/sda) mittels:
# parted /dev/sda u s print
<syntaxhighlight lang="bash" highlight="1" line>
sudo parted /dev/sda u s print
</syntaxhighlight>


Ist die neue Platte entsprechend partitioniert, wird die neue Partition zum RAID-Verbund hinzugefügt (hier am Beispielaustausch von /dev/sdk1 in /dev/md2):
Ist die neue Platte entsprechend partitioniert, wird die neue Partition zum RAID-Verbund hinzugefügt (hier am Beispielaustausch von /dev/sdk1 in /dev/md2):
# mdadm /dev/md2 --add /dev/sdk1
<syntaxhighlight lang="bash" highlight="1" line>
* Im Hintergrund beginnt nun ein Rebuild, aus den noch vorhandenen Partitionen wird also der Inhalt für die neue Partition berechnet und geschrieben.
sudo mdadm /dev/md2 --add /dev/sdk1
</syntaxhighlight>
 
Im Hintergrund beginnt nun ein Rebuild, aus den noch vorhandenen Partitionen wird also der Inhalt für die neue Partition berechnet und geschrieben.
* Je nach RAID-Level und Größe dauert ein Rebuild mehrere Stunden bis Tage.
* Je nach RAID-Level und Größe dauert ein Rebuild mehrere Stunden bis Tage.
* Das System darf währenddessen neu gestartet oder heruntergefahren werden.
* Das System darf währenddessen neu gestartet oder heruntergefahren werden.
Zeile 46: Zeile 57:


In diesem Fall müssen diese mit dem Befehl...
In diesem Fall müssen diese mit dem Befehl...
# mdadm /dev/mdX --fail /dev/sdXY
<syntaxhighlight lang="bash" highlight="1" line>
* ...alle einzeln in den Modus [U_] versetzt werden.
sudo mdadm /dev/mdX --fail /dev/sdXY
</syntaxhighlight>


==Bootprobleme ==
...alle einzeln in den Modus [U_] versetzt werden.
 
== Bootprobleme ==
<syntaxhighlight lang="bash" highlight="1" line>
GRUB 2: unknown Filesystem
GRUB 2: unknown Filesystem
* Falls das System nicht bootet, nachdem man es auf ein RAID 1 kopiert, die /etc/fstab angepasst, die grub.cfg und die mdadm.conf korrekt erscheinen sowie das initramfs aktualisiert wurde, kann es helfen, GRUB 2 erneut zu installieren.* Dabei muss auf die Art der Partitionstabelle geachtet werden.* Die obige Anleitung nutzt GPT-Partitionstabellen.
</syntaxhighlight>
 
Falls das System nicht bootet, nachdem man es auf ein RAID 1 kopiert, die /etc/fstab angepasst, die grub.cfg und die mdadm.conf korrekt erscheinen sowie das initramfs aktualisiert wurde, kann es helfen, GRUB 2 erneut zu installieren
* Dabei muss auf die Art der Partitionstabelle geachtet werden
* Die obige Anleitung nutzt GPT-Partitionstabellen


== RAID startet nicht ==
== RAID startet nicht ==
mdadm: Cannot open /dev/sdXY: Device or resource busy
<syntaxhighlight lang="bash" highlight="1" line>
* Falls beim Erstellen eines RAIDs diese Meldung erscheint und mit den Partitionen bereits einmal ein RAID erstellt wurde, muss zunächst der alte Verbund aufgelöst werden.
mdadm: Cannot open /dev/sdXY: Device or resource busy
</syntaxhighlight>


==Fehler beim Update des Kernels nach Datenträgertausch ==
Falls beim Erstellen eines RAIDs diese Meldung erscheint und mit den Partitionen bereits einmal ein RAID erstellt wurde, muss zunächst der alte Verbund aufgelöst werden.


== Fehler beim Update des Kernels nach Datenträgertausch ==
  Grub-Konfigurationsdatei wird generiert …
  Grub-Konfigurationsdatei wird generiert …
  grub-probe: Warnung: Physischer Datenträger »(null)« konnte nicht gefunden werden.
  grub-probe: Warnung: Physischer Datenträger »(null)« konnte nicht gefunden werden.
  Einige Module könnten im Core-Abbild fehlen..
  Einige Module könnten im Core-Abbild fehlen..
  /usr/sbin/grub-probe: Warnung: Physischer Datenträger »(null)« konnte nicht gefunden werden. Einige Module könnten im Core-Abbild fehlen..
  /usr/sbin/grub-probe: Warnung: Physischer Datenträger »(null)« konnte nicht gefunden werden. Einige Module könnten im Core-Abbild fehlen..
* Treten nach dem Tausch einer Datenträger diese Fehler auf muss die Device Map von Grub neu geschrieben werden.* Dies geschieht mit:
* Treten nach dem Tausch einer Datenträger diese Fehler auf muss die Device Map von Grub neu geschrieben werden.
# grub-mkdevicemap
 
Dies geschieht mit
<syntaxhighlight lang="bash" highlight="1" line>
grub-mkdevicemap
</syntaxhighlight>


Geht alles glatt, darf keine Ausgabe erscheinen. Anschließend noch einmal Grub aktualisieren:
Geht alles glatt, darf keine Ausgabe erscheinen. Anschließend noch einmal Grub aktualisieren:
# update-grub
<syntaxhighlight lang="bash" highlight="1" line>
* Nun sollte der Fehler behoben sein und die Grubkonfiguration sich ohne Fehler aktualisieren.
sudo update-grub
</syntaxhighlight>
 
Nun sollte der Fehler behoben sein und die Grubkonfiguration sich ohne Fehler aktualisieren.


== Probelm RAID 127 ==
== Probelm RAID 127 ==
==== mdadm.conf anlegen  ====
==== mdadm.conf anlegen  ====
# mdadm --detail --scan >> /etc/mdadm/mdadm.conf
<syntaxhighlight lang="bash" highlight="1" line>
sudo mdadm --detail --scan >> /etc/mdadm/mdadm.conf
</syntaxhighlight>


==== Ermitteln der UUID des Raid Arrays. ====
==== Ermitteln der UUID des Raid Arrays  ====
# mdadm --detail /dev/md0
<syntaxhighlight lang="bash" highlight="1" line>
sudo mdadm --detail /dev/md0
</syntaxhighlight>


==== Anpassung der mdadm.conf  ====
==== Anpassung der mdadm.conf  ====
Die Option "name" aus der mdadm.conf entfernen
Die Option "name" aus der mdadm.conf entfernen
# vi /etc/mdadm/mdadm.conf
<syntaxhighlight lang="bash" highlight="1" line>
sudo vi /etc/mdadm/mdadm.conf
  ARRAY /dev/md0 UUID=XXXXXXXX:XXXXXXXX:XXXXXXXX:XXXXXXXX
  ARRAY /dev/md0 UUID=XXXXXXXX:XXXXXXXX:XXXXXXXX:XXXXXXXX
</syntaxhighlight>


==== Aktualisierung der initramfs  ====
==== Aktualisierung der initramfs  ====
# update-initramfs -u
<syntaxhighlight lang="bash" highlight="1" line>
sudo update-initramfs -u
</syntaxhighlight>


==== System neu starten  ====
==== System neu starten  ====
# systemctl reboot
<syntaxhighlight lang="bash" highlight="1" line>
sudo systemctl reboot
</syntaxhighlight>


== Datenträger-Reihenfolge ==
== Datenträger-Reihenfolge ==
Zeile 95: Zeile 133:


Damit die Konfiguration beim Booten verfügbar ist, muss schließlich noch die Initrd aktualisiert werden:
Damit die Konfiguration beim Booten verfügbar ist, muss schließlich noch die Initrd aktualisiert werden:
# update-initramfs -u -k all
<syntaxhighlight lang="bash" highlight="1" line>
sudo update-initramfs -u -k all
</syntaxhighlight>


<noinclude>
<noinclude>

Version vom 16. März 2025, 16:14 Uhr

Linux/RAID/Fehlerbehebung

Beschreibung

Datenträgerausfall

Details ermitteln

Dieses Beispiel zeigt eine ausgefallene Platte in einem RAID 6.

 Personalities : [raid6] [raid5] [raid4] [raid1] [linear] [multipath] [raid0] [raid10]
 md2 : active raid6 sdj1[7] sdi1[6] sdh1[5] sdg1[4] sdd1[3] sda1[0] sdb1[1] sdc1[2]
 3418688000 blocks super 1.2 level 6, 512k chunk, algorithm 2 [9/8] [UUUUUUUU_]

 unused devices: <none>

In diesem Fall wurde das fehlerhafte Gerät bereits automatisch entfernt.

Genauere Details, u.a. den Namen des defekten Geräts kann mit mdadm ermittelt werden:

sudo mdadm --detail /dev/md2

Datenträger wechseln

Achtung
  • Bei einem RAID 0 äußert sich der Ausfall einer Platte im Totalausfall des gesamten RAID- Verbunds.
  • Das RAID 0 kann daher nicht mit den folgenden Anweisungen repariert werden, sondern muss neu aufgesetzt werden und die hoffentlich vorhandene Datensicherung eingespielt werden

Ist das defekte Gerät (hier im Beispiel /dev/sdk1) ermittelt, kann die entsprechende Datenträger ausgetauscht werden:

Falls der Kernel das Gerät noch nicht aus dem Verbund entfernt hat (d.h. es wird beim Befehl mdadm --detail noch aufgeführt), muss es zunächst aus dem Verbund entfernt werden

sudo mdadm /dev/md2 --remove /dev/sdk1

Nun kann die entsprechende Platte gewechselt werden

  • Ist eine entsprechende Austauschplatte eingebaut, muss diese zunächst partitioniert werden
  • Die neue Partition muss mindestens die gleiche Anzahl an Sektoren aufweisen, wie die bereits genutzten Partitionen

Von einer bestehenden Platte erhält man die Sektorenzahl der Partitionen (hier am Beispiel von /dev/sda) mittels:

sudo parted /dev/sda u s print

Ist die neue Platte entsprechend partitioniert, wird die neue Partition zum RAID-Verbund hinzugefügt (hier am Beispielaustausch von /dev/sdk1 in /dev/md2):

sudo mdadm /dev/md2 --add /dev/sdk1

Im Hintergrund beginnt nun ein Rebuild, aus den noch vorhandenen Partitionen wird also der Inhalt für die neue Partition berechnet und geschrieben.

  • Je nach RAID-Level und Größe dauert ein Rebuild mehrere Stunden bis Tage.
  • Das System darf währenddessen neu gestartet oder heruntergefahren werden.
  • Ein Systemabsturz kann jedoch zu Datenverlust führen. Manchmal lässt sich der Vorgang beschleunigen.
Hinweis
Wurden Partitionen einer Platte von verschiedenen RAIDs genutzt, dann kann es vorkommen, dass eine verwendete Datenträger teilweise defekt ist und sich z. B. die Partition von md0 im Status [U_] befindet, während alle anderen im Status [UU] sind.

In diesem Fall müssen diese mit dem Befehl...

sudo mdadm /dev/mdX --fail /dev/sdXY

...alle einzeln in den Modus [U_] versetzt werden.

Bootprobleme

GRUB 2: unknown Filesystem

Falls das System nicht bootet, nachdem man es auf ein RAID 1 kopiert, die /etc/fstab angepasst, die grub.cfg und die mdadm.conf korrekt erscheinen sowie das initramfs aktualisiert wurde, kann es helfen, GRUB 2 erneut zu installieren

  • Dabei muss auf die Art der Partitionstabelle geachtet werden
  • Die obige Anleitung nutzt GPT-Partitionstabellen

RAID startet nicht

mdadm: Cannot open /dev/sdXY: Device or resource busy

Falls beim Erstellen eines RAIDs diese Meldung erscheint und mit den Partitionen bereits einmal ein RAID erstellt wurde, muss zunächst der alte Verbund aufgelöst werden.

Fehler beim Update des Kernels nach Datenträgertausch

Grub-Konfigurationsdatei wird generiert …
grub-probe: Warnung: Physischer Datenträger »(null)« konnte nicht gefunden werden.
Einige Module könnten im Core-Abbild fehlen..
/usr/sbin/grub-probe: Warnung: Physischer Datenträger »(null)« konnte nicht gefunden werden. Einige Module könnten im Core-Abbild fehlen..
  • Treten nach dem Tausch einer Datenträger diese Fehler auf muss die Device Map von Grub neu geschrieben werden.

Dies geschieht mit

grub-mkdevicemap

Geht alles glatt, darf keine Ausgabe erscheinen. Anschließend noch einmal Grub aktualisieren:

sudo update-grub

Nun sollte der Fehler behoben sein und die Grubkonfiguration sich ohne Fehler aktualisieren.

Probelm RAID 127

mdadm.conf anlegen

sudo mdadm --detail --scan >> /etc/mdadm/mdadm.conf

Ermitteln der UUID des Raid Arrays

sudo mdadm --detail /dev/md0

Anpassung der mdadm.conf

Die Option "name" aus der mdadm.conf entfernen

sudo vi /etc/mdadm/mdadm.conf
 ARRAY /dev/md0 UUID=XXXXXXXX:XXXXXXXX:XXXXXXXX:XXXXXXXX

Aktualisierung der initramfs

sudo update-initramfs -u

System neu starten

sudo systemctl reboot

Datenträger-Reihenfolge

Nach Änderung der Reihenfolge der Datenträger

Z.B. bei Austausch des Controllers, Umstecken der Kabel, Anschließen eines USB-Sticks, etc. ließe sich das RAID nicht mehr starten.

  • Auch dann nicht, wenn in den Superblöcken der RAID-Laufwerke die richtigen Metadaten (unabhängig von den Buchstabenbezeichnungen) gespeichert sind.
  • Dieses Problem lässt sich nur dann beheben, wenn die falschen Angaben in der mdadm.conf korrigiert oder explizit übergangen werden.

Damit die Konfiguration beim Booten verfügbar ist, muss schließlich noch die Initrd aktualisiert werden:

sudo update-initramfs -u -k all


Anhang

Siehe auch

Links

Weblinks
  1. https://wiki.ubuntuusers.de/Software-RAID