Linux/Datensicherung und -archivierung

Datensicherung und -archivierung - Beschreibung

Beschreibung

Motivation

Motivation und Zielsetzung

Die Aufgabe von IT-Systemen ist die Verarbeitung und Verwaltung digitaler Daten, die dazu vorübergehend oder dauerhaft auf Datenträgern gespeichert werden

Die Sicherung dieser Daten soll die Rückkehr in einen vorherigen Zustand gewährleisten
Die regelmäßige Sicherung des Datenbestandes zählt zu den wichtigsten Aufgaben eines Systemverwalters

Daten sind verschiedenen Einflüssen ausgesetzt

Dem Schichtenmodell entsprechend können auf jeder Ebene Anomalien auftreten
Defekte an der Hardware (Datenträger, Controller)
Fehler im Dateisystem
Fehler bei der Administration
Dateikorruption durch Schadsoftware
Ausfall des Systems
Fehlfunktion nach Update
Versehentliches Löschen von Daten

Um jeder dieser Situationen gerecht zu werden, ist es möglich, auf folgenden Ebenen Daten zu sichern

Datenträger
Partition
Dateisystem
Datenbanken

Strategie

Datensicherungsstrategien

Die Begriffe Backup und Archiv verwenden wir im weiteren Verlauf synonym

Allgemein bezeichnen wir als ein Archiv einen Container von Daten, der aufbewahrt wird, um genau auf diese Daten später zugreifen zu können
Archive legt man an, um momentan nicht benötigte Daten von der Festplatte zu verbannen oder um sie von einem Rechner auf einen anderen zu kopieren..

Die Motivation zu einem Backup resultiert aus anderen Überlegungen

Hier ist die Absicht, einen bestimmten Systemzustand aufzuzeichnen
Dabei bezieht man sich nicht auf den konkreten Inhalt einer Datei - wie bei Archiven - sondern ordnet eine Datei in die Schublade wichtig oder unwichtig ein, je nachdem, ob sie von meiner Backupstrategie betroffen sein wird oder nicht

Grundsätzlich werden zwei Arten des Backups unterschieden

Das volle Backup sichert stets den kompletten Bestand an Daten, während das inkrementelle Backup nur Daten archiviert, die innerhalb einer bestimmten Periode modifiziert wurden
Dabei steht die Periode meist für den Zeitraum seit der letzten Sicherung

Ein volles Backup ist wegen des hohen Bedarfs an Zeit (die Sicherung erfolgt meist auf ein Bandmedium) weniger für den täglichen Einsatz geeignet, deswegen entscheidet man sich heute meist für eine Mischform aus voller und inkrementeller Datensicherung

Hierbei wird zu einem Zeitpunkt der komplette Datenbestand gesichert und nachfolgend - in regelmäßigen Abständen - archiviert man nur die modifizierten Daten

Die tatsächlich gewählte Strategie des inkrementellen Backups hängt stark von der Statik der Daten und vom Sicherheitsbedürfnis des Administrators ab

Im einfachsten Fall betrifft das Backup jeweils alle modifizierten Daten seit dem letzten vollen Backup bis hin zum aktuellen Zeitpunkt
Das umgekehrte Verfahren ist die Aufzeichnung der Änderungen seit der letzten inkrementellen Sicherung
Während in ersterem Fall nur die Archive des vollen und letzten inkrementellen Backups aufbewahrt werden müssen, sind beim zweiten Vorgehen das volle Backup und sämtliche inkrementellen Datensicherungsarchive aufzuheben
In der Praxis findet man auch Archivierungsformen zwischen den beiden beschriebenen Extremen (Multilevel-Backups)

Bedenken Sie, dass ein Festplattenfehler Sie auch während der Aufzeichnung eines Backups ereilen kann. Überschreiben Sie daher niemals ihre aktuelle Sicherungskopie

Bei der Vorstellung der Backup-Werkzeuge beschränken wir uns auf Programme, die der GPL oder einer ähnlichen Lizenz unterstehen

In vielen Fällen lassen sie die Bedienfreundlichkeit kommerzieller Produkte vermissen, jedoch ist es durchaus möglich - die notwendigen Kenntnisse vorausgesetzt - diese in Skripten so zu kapseln, dass sie zum einen die Funktionalität und zum anderen die einfache Benutzbarkeit ausgereifter Werkzeuge erreichen

Medien

Medien für die Datensicherung

Zunächst ist einfach nachvollziehbar, dass die Speicherkapazität des Backupmediums dem aufkommenden Datenvolumen entsprechen muss

Ein volles Backup könnte man auch auf Disketten vornehmen, jedoch wird man des Wechsels sicherlich bald überdrüssig und die Diskette ist selbst schon Quelle des lauernden Datenverlusts
Wer kennt nicht das leidige Can't read sector xxx.? Besser geeignet - vorwiegend bei dem geringeren Datenaufkommen des inkrementellen Backups - sind ZIP-Disketten

Festplatten

Waren früher die Medien für einen Streamer die preiswerteste Alternative, so geht heute nichts über eine Festplatten

Dem System eigens für die Datensicherung eine eigene Platte zu spendieren, mag auf den ersten Blick befremdend erscheinen, jedoch erhält man für den Preis eines Streamers eine Menge Festplattenspeicher
Die weiteren Vorteile liegen im wahlfreien und wesentlich schnelleren Zugriff
Allerdings schützt die eingebaute Festplatte nur mäßig vor mutwilliger Sabotage, hier kann eine Datensicherung auf einem anderen Rechner (über das Netz) Abhilfe bringen

Die durch RAID-Systeme realisierbare Datenredundanz schützt nur vor Hardwareausfall einer Festplatte, hat also nichts mit einem Backup zu tun

Magnetbänder

Traditionell sind Magnetbänder (Quarter-Inch- und DAT-Streamer) weitverbreitet

Sowohl Kapazität als auch Zuverlässigkeit sprechen für dieses Medium
Leider lässt sich auf einem Band kein Dateisystem einrichten, sodass die Daten mithilfe spezieller Programme sequenziell auf dieses abgelegt werden müssen
Im Falle eines Restores muss demnach der gesamte Bandinhalt zurückgespielt werden, da ein wahlfreier Zugriff nicht möglich ist

Ein Magnetband muss vor dem Zugriff zurückgespult werden, hierzu nutzt man das Kommando mt mit der Option rewind

mt -f <Device> rewind

Es ist außerdem möglich, mehr als ein Archiv auf einem Band unterzubringen, immer vorausgesetzt, die Speicherkapazität setzt keine Schranken

# Band zur ersten Dateiende-Markierung spulen
mt -f <Device> fsf 1
# Band zur dritten Dateiende-Markierung spulen
mt -f <Device> fsf 3
# Band zur letzten Dateiende-Markierung spulen
mt -f <Device> eof

Während sich die normale CD-ROM oder DVD wegen der nur einmaligen Beschreibbarkeit eher als Medium zur reinen Archivierung eignet, kann die CD-RW und vor allem die DVD-RW durchaus für die alltägliche Datensicherung eingesetzt werden

Allerdings erfordern umfangreiche Backups, die die Kapazität einer einzelnen CD-ROM übersteigen, die Anwesenheit des Administrators

Daten

Welche Daten sollten gesichert werden?

Es lohnt sich, etwas Zeit in den Plan zu investieren, welche Daten denn überhaupt den Aufwand eines Backups rechtfertigen

Vielleicht beginnen wir mit Daten, die sichere Kandidaten sind

Da wären

Die Daten unter /home
Klar, die Benutzer ziehen sich ja täglich neue Daten aus dem Netz
Die Daten unter /etc
Oder haben Sie Interesse, Ihr System komplett neu konfigurieren zu müssen?
Die Daten unter /var
Hier liegen Protokolle, Mails, Druckaufträge, ...
also Daten, die permanenter Änderung unterliegen
Projektverzeichnisse, Datenbanken, ...

Als Daten, deren Aufzeichnung Sie sich getrost sparen können, sind all jene zu nennen, die ohnehin auf einem anderen Medium vorhanden sind, zum Beispiel die Daten der Linuxdistribution, die auf CD-ROM im Schrank liegen

Ebenso sollten Dateisysteme, die von entfernten Rechnern gemountet wurden, besser von dessen Backup-Strategie erfasst werden

Aber letztlich ist es die Ermessensfrage des Administrators, welche Daten er für sicherungswürdig erachtet

Eine Neuinstallation von Linux hat ja manchmal auch den Vorteil, etwas Ordnung im System zu schaffen.

Anhang

Siehe auch

Links

Weblinks