Linux/Datensicherung und -archivierung

Aus Foxwiki

Datensicherung und -archivierung - Beschreibung

Beschreibung

Motivation

Motivation und Zielsetzung

Die Aufgabe von IT-Systemen ist die Verarbeitung und Verwaltung digitaler Daten, die dazu vorübergehend oder dauerhaft auf Datenträgern gespeichert werden

  • Die Sicherung dieser Daten soll die Rückkehr in einen vorherigen Zustand gewährleisten
  • Die regelmäßige Sicherung des Datenbestandes zählt zu den wichtigsten Aufgaben eines Systemverwalters

Daten sind verschiedenen Einflüssen ausgesetzt

  • Dem Schichtenmodell entsprechend können auf jeder Ebene Anomalien auftreten
  • Defekte an der Hardware (Datenträger, Controller)
  • Fehler im Dateisystem
  • Fehler bei der Administration
  • Dateikorruption durch Schadsoftware
  • Ausfall des Systems
  • Fehlfunktion nach Update
  • Versehentliches Löschen von Daten

Um jeder dieser Situationen gerecht zu werden, ist es möglich, auf folgenden Ebenen Daten zu sichern

  • Datenträger
  • Partition
  • Dateisystem
  • Datenbanken

Strategie

Datensicherungsstrategien

Die Begriffe »Backup« und »Archiv« verwenden wir im weiteren Verlauf synonym

  • Allgemein bezeichnen wir als ein Archiv einen Container von Daten, der aufbewahrt wird, um genau auf diese Daten später zugreifen zu können
  • Archive legt man an, um momentan nicht benötigte Daten von der Festplatte zu verbannen oder um sie von einem Rechner auf einen anderen zu kopieren..

Die Motivation zu einem Backup resultiert aus anderen Überlegungen

  • Hier ist die Absicht, einen bestimmten Systemzustand aufzuzeichnen
  • Dabei bezieht man sich nicht auf den konkreten Inhalt einer Datei - wie bei Archiven - sondern ordnet eine Datei in die Schublade »wichtig« oder »unwichtig« ein, je nachdem, ob sie von meiner Backupstrategie betroffen sein wird oder nicht

Grundsätzlich werden zwei Arten des Backups unterschieden

  • Das volle Backup sichert stets den kompletten Bestand an Daten, während das inkrementelle Backup nur Daten archiviert, die innerhalb einer bestimmten Periode modifiziert wurden
  • Dabei steht die Periode meist für den Zeitraum seit der letzten Sicherung

Ein volles Backup ist wegen des hohen Bedarfs an Zeit (die Sicherung erfolgt meist auf ein Bandmedium) weniger für den täglichen Einsatz geeignet, deswegen entscheidet man sich heute meist für eine Mischform aus voller und inkrementeller Datensicherung

  • Hierbei wird zu einem Zeitpunkt der komplette Datenbestand gesichert und nachfolgend - in regelmäßigen Abständen - archiviert man nur die modifizierten Daten

Die tatsächlich gewählte Strategie des inkrementellen Backups hängt stark von der »Statik« der Daten und vom Sicherheitsbedürfnis des Administrators ab

  • Im einfachsten Fall betrifft das Backup jeweils alle modifizierten Daten seit dem letzten vollen Backup bis hin zum aktuellen Zeitpunkt
  • Das umgekehrte Verfahren ist die Aufzeichnung der Änderungen seit der letzten inkrementellen Sicherung
  • Während in ersterem Fall nur die Archive des vollen und letzten inkrementellen Backups aufbewahrt werden müssen, sind beim zweiten Vorgehen das volle Backup und sämtliche inkrementellen Datensicherungsarchive aufzuheben
  • In der Praxis findet man auch Archivierungsformen zwischen den beiden beschriebenen Extremen (Multilevel-Backups)

Bedenken Sie, dass ein Festplattenfehler Sie auch während der Aufzeichnung eines Backups ereilen kann. Überschreiben Sie daher niemals ihre aktuelle Sicherungskopie

Bei der Vorstellung der Backup-Werkzeuge beschränken wir uns auf Programme, die der GPL oder einer ähnlichen Lizenz unterstehen

  • In vielen Fällen lassen sie die Bedienfreundlichkeit kommerzieller Produkte vermissen, jedoch ist es durchaus möglich - die notwendigen Kenntnisse vorausgesetzt - diese in Skripten so zu kapseln, dass sie zum einen die Funktionalität und zum anderen die einfache Benutzbarkeit ausgereifter Werkzeuge erreichen

Medien

Medien für die Datensicherung

Zunächst ist einfach nachvollziehbar, dass die Speicherkapazität des Backupmediums dem aufkommenden Datenvolumen entsprechen muss

  • Ein volles Backup könnte man auch auf Disketten vornehmen, jedoch wird man des Wechsels sicherlich bald überdrüssig und die Diskette ist selbst schon Quelle des lauernden Datenverlusts
  • Wer kennt nicht das leidige »Can't read sector xxx.«? Besser geeignet - vorwiegend bei dem geringeren Datenaufkommen des inkrementellen Backups - sind ZIP-Disketten
Festplatten

Waren früher die Medien für einen Streamer die preiswerteste Alternative, so geht heute nichts über eine Festplatten

  • Dem System eigens für die Datensicherung eine eigene Platte zu spendieren, mag auf den ersten Blick befremdend erscheinen, jedoch erhält man für den Preis eines Streamers eine Menge Festplattenspeicher
  • Die weiteren Vorteile liegen im wahlfreien und wesentlich schnelleren Zugriff
  • Allerdings schützt die eingebaute Festplatte nur mäßig vor mutwilliger Sabotage, hier kann eine Datensicherung auf einem anderen Rechner (über das Netz) Abhilfe bringen

Die durch RAID-Systeme realisierbare Datenredundanz schützt nur vor Hardwareausfall einer Festplatte, hat also nichts mit einem Backup zu tun

Magnetbänder

Traditionell sind Magnetbänder (Quarter-Inch- und DAT-Streamer) weitverbreitet

  • Sowohl Kapazität als auch Zuverlässigkeit sprechen für dieses Medium
  • Leider lässt sich auf einem Band kein Dateisystem einrichten, sodass die Daten mithilfe spezieller Programme sequenziell auf dieses abgelegt werden müssen
  • Im Falle eines »Restores« muss demnach der gesamte Bandinhalt zurückgespielt werden, da ein wahlfreier Zugriff nicht möglich ist

Ein Magnetband muss vor dem Zugriff zurückgespult werden, hierzu nutzt man das Kommando mt mit der Option rewind

mt -f <Device> rewind

Es ist außerdem möglich, mehr als ein Archiv auf einem Band unterzubringen, immer vorausgesetzt, die Speicherkapazität setzt keine Schranken

# Band zur ersten Dateiende-Markierung spulen
mt -f <Device> fsf 1
# Band zur dritten Dateiende-Markierung spulen
mt -f <Device> fsf 3
# Band zur letzten Dateiende-Markierung spulen
mt -f <Device> eof


Während sich die »normale« CD-ROM oder DVD wegen der nur einmaligen Beschreibbarkeit eher als Medium zur reinen Archivierung eignet, kann die CD-RW und vor allem die DVD-RW durchaus für die alltägliche Datensicherung eingesetzt werden

  • Allerdings erfordern umfangreiche Backups, die die Kapazität einer einzelnen CD-ROM übersteigen, die Anwesenheit des Administrators

Daten

Welche Daten sollten gesichert werden?

Es lohnt sich, etwas Zeit in den Plan zu investieren, welche Daten denn überhaupt den Aufwand eines Backups rechtfertigen

Vielleicht beginnen wir mit Daten, die sichere Kandidaten sind

Da wären

  • Die Daten unter /home
  • Klar, die Benutzer ziehen sich ja täglich neue Daten aus dem Netz
  • Die Daten unter /etc
  • Oder haben Sie Interesse, Ihr System komplett neu konfigurieren zu müssen?
  • Die Daten unter /var
  • Hier liegen Protokolle, Mails, Druckaufträge, ...
  • also Daten, die permanenter Änderung unterliegen
  • Projektverzeichnisse, Datenbanken, ...

Als Daten, deren Aufzeichnung Sie sich getrost sparen können, sind all jene zu nennen, die ohnehin auf einem anderen Medium vorhanden sind, zum Beispiel die Daten der Linuxdistribution, die auf CD-ROM im Schrank liegen

  • Ebenso sollten Dateisysteme, die von entfernten Rechnern gemountet wurden, besser von dessen Backup-Strategie erfasst werden

Aber letztlich ist es die Ermessensfrage des Administrators, welche Daten er für sicherungswürdig erachtet

  • Eine Neuinstallation von Linux hat ja manchmal auch den Vorteil, etwas Ordnung im System zu schaffen.


Anhang

Siehe auch

Links

Weblinks