Dateisystem
topic kurze Beschreibung
Beschreibung
- Das Dateisystem ( oder Vorlage:Lang) ist eine Ablageorganisation auf einem [[Volume (Datenspeicher)|Vorlage:Lang]] wie etwa einem Datenträger eines Computers.
- Dateien können gespeichert, gelesen, verändert oder gelöscht werden (CRUD).
- Für den Nutzer müssen Dateiname und computerinterne Dateiadressen in Einklang gebracht werden.
- Das leichte Wiederfinden und das sichere Abspeichern sind wesentliche Aufgaben eines Dateisystems.
- Das Ordnungs- und Zugriffssystem berücksichtigt die Geräteeigenschaften und ist elementarer Bestandteil eines Computersystems oder eines Betriebssystems.
Begriff
Der Begriff „Dateisystem“ kann sich einerseits auf den gesamten übergeordneten Verzeichnisbaum, die Verzeichnisstruktur, beziehen, andererseits auf individuell einbindbare Dateisysteme, etwa auf Partitionen.[1][2] Da ein Dateisystem oft je Partition oder [[Volume (Datenspeicher)|Vorlage:Lang]] eingesetzt wird, findet sich der Begriff „Dateisystem“ auch oft als Synonym für „Partition“ wieder[3] – tatsächlich ist das Dateisystem jedoch der Inhalt und die Partition nur ein möglicher Rahmen, in dem der Speicherplatz als Vorlage:Lang dafür zur Verfügung gestellt wird.
Auf den meisten Betriebssystemen wird mehr als ein Dateisystem unterstützt. Jedes Dateisystem muss auf einem getrennt ansprechbaren logischen Vorlage:Lang untergebracht sein, etwa einer Partition oder einem zusätzlichen Datenträger wie einer Festplatte. Die Initialisierung dieses logischen getrennten Datenspeichers wird Formatierung genannt. Der Inhalt des Dateisystems wird durch Einhängen, Einbinden bzw. Mounten (von ) im laufenden Systems zugänglich gemacht.
Installation
Anwendungen
Syntax
Optionen
Parameter
Umgebungsvariablen
Exit-Status
Konfiguration
Dateien
Sicherheit
Dokumentation
RFC
Man-Pages
Info-Pages
Siehe auch
Links
Projekt-Homepage
Weblinks
Einzelnachweise
Testfragen
Testfrage 1
Testfrage 2
Testfrage 3
Testfrage 4
Testfrage 5
Wikipedia
- Dieser Artikel behandelt ein Dateisystem auf einem Volume
- Zu weiteren Bedeutungen siehe Dateisystem (Begriffsklärung)
Geschichte
Historisch gesehen sind schon die ersten Lochstreifen- (auf Film- später auf Papierstreifen) und Lochkarten-Dateien Dateisysteme. Sie bilden ebenso wie Magnetbandspeicher lineare Dateisysteme. Die später für die Massenspeicherung und schnellen Zugriff entwickelten Trommel- und Festplattenspeicher ermöglichten dann erstmals durch wahlfreien Zugriff auf beliebige Positionen im Dateisystem komplexere Dateisysteme. Diese Dateisysteme bieten die Möglichkeit, per Namen auf eine Datei zuzugreifen. Das Konzept der Dateisysteme wurde schließlich soweit abstrahiert, dass auch Zugriffe auf Dateien im Netz und auf Geräte, die virtuell als Datei verwaltet werden, über Dateisysteme durchgeführt werden können. Somit sind Anwendungsprogramme in der Lage, auf diese unterschiedlichen Datenquellen über eine einheitliche Schnittstelle zuzugreifen.
Arten von Dateisystemen
Lineare Dateisysteme
Die historisch ersten Dateisysteme waren lineare Dateisysteme auf Lochband oder Lochkarte sowie die noch heute für die Sicherung von Daten eingesetzten Magnetbandsysteme.
Hierarchische Dateisysteme
Frühe Dateisysteme (CP/M, Apple DOS, Commodore DOS) hatten nur ein einzelnes Verzeichnis, das dann Verweise auf alle Dateien des Massenspeichers enthielt. Mit wachsender Kapazität der Datenträger wurde es immer schwieriger, den Überblick über hunderte und tausende Dateien zu bewahren, deshalb wurde das Konzept der Unterverzeichnisse eingeführt. Ein hierarchisches Dateisystem wurde für das Betriebssystem Multics entwickelt und, nachdem dessen Entwicklung eingestellt wurde, von AT&T Unix Version 1 von 1971 übernommen. Damit war die Grundlage für die meisten modernen Dateisysteme gelegt, die im Wurzelverzeichnis neben regulären Dateien auch Verweise auf weitere Verzeichnisse, die Unterverzeichnisse, enthalten können, mit möglicherweise wiederum weiteren Unterverzeichnissen.
Dadurch entsteht eine Verzeichnisstruktur, die oft als Verzeichnisbaum dargestellt wird. Das Festplattenlaufwerk C: unter Windows beinhaltet beispielsweise neben Dateien wie boot.ini und ntldr auch Verzeichnisse wie Programme, Dokumente und Einstellungen usw. Ein Verzeichnis wie zum Beispiel Eigene Dateien kann dann wieder Unterverzeichnisse wie Eigene Bilder oder Texte enthalten. In Texte können dann beispielsweise die normalen Dateien Brief1.txt und Brief2.txt stehen.
Die Verzeichnisse werden auch Ordner genannt und sind, je nach Betriebssystem, durch umgekehrten Schrägstrich (englisch Vorlage:Lang) „\“ (DOS, Windows, TOS), Schrägstrich (englisch Vorlage:Lang) „/“ (Unix, Linux, macOS, AmigaOS), Punkt „.“ (OpenVMS) oder Doppelpunkt „:“ (ältere Mac-OS-Versionen) getrennt. Da sich eine Hierarchie von Verzeichnissen und Dateien ergibt, spricht man hier von hierarchischen Dateisystemen. Den Weg durch das Dateisystem, angegeben durch Verzeichnisnamen, die mit den Trennzeichen voneinander getrennt werden, nennt man Pfad. Auf die Datei Brief1.txt kann mit
C:\Dokumente und Einstellungen\benutzername\Eigene Dateien\Texte\Brief1.txt
(Windows 2000/XP)C:\Users\benutzername\Eigene Dokumente\Brief1.txt
(Ab Windows Vista)/Users/benutzername/Texte/Brief1.txt
(Mac OS X)Macintosh HD:Dokumente:Texte:Brief 1
(Classic Mac OS)/home/benutzername/Texte/Brief1.txt
(Unix/Linux)Laufwerksname:verzeichnis/unterverzeichnis/Brief1.txt
(AmigaOS)DISK$Laufwerksname:[USERS.benutzername]Brief1.TXT;1
(OpenVMS)
zugegriffen werden. Bei DOS/Windows gibt es Laufwerksbuchstaben gefolgt von einem Doppelpunkt, die den Pfaden innerhalb des Dateisystems vorangestellt werden. Jeder Datenträger bekommt seinen eigenen Buchstaben, zum Beispiel meist C: für die erste Partition der ersten Festplatte. Bei Unix gibt es keine Laufwerksbuchstaben, sondern nur einen einzigen Verzeichnisbaum. Die einzelnen Datenträger werden dort an bestimmten Stellen im Baum eingehängt (Kommando mount), so dass alle Datenträger zusammen den Gesamtbaum ergeben. Windows-Varianten, die auf Windows NT basieren, arbeiten intern ebenfalls mit einem solchen Baum, dieser Baum wird aber gegenüber dem Anwender verborgen.
Unter AmigaOS erfolgt eine Mischung der Ansätze von DOS und Unix. Die nach Unix-Nomenklatur bezeichneten Laufwerke werden mit Doppelpunkt angesprochen (df0:, hda1:, sda2:). Darüber hinaus können logische Doppelpunkt-Laufwerksbezeichnungen wie LIBS:
per ASSIGN
unabhängig vom physischen Datenträger vergeben werden.
Die Verzeichnispfade von OpenVMS unterscheiden sich stark von Unix-, DOS- und Windows-Pfaden. Zuerst nennt OpenVMS die Geräteart, z. B. bezeichnet „DISK$
“ einen lokalen Datenträger. Der Laufwerksname (bis zu 255 Zeichen lang) wird angefügt und mit einem Doppelpunkt abgeschlossen. Der Verzeichnis-Teil wird in eckige Klammern gesetzt. Die Unterverzeichnisse werden durch Punkte getrennt, z. B. „[USERS.Verzeichnis.Verzeichnis2]
“. Am Ende des Pfads folgt der Dateiname, beispielsweise „Brief1.TXT;1
“. Dessen erster Teil ist ein sprechender Name und bis zu 39 Zeichen lang. Nach einem Punkt folgt der dreistellige Dateityp, ähnlich wie bei Windows. Am Ende wird die Version der Datei, getrennt durch ein Semikolon „;“, angefügt.
Häufig bezeichnet der Begriff Dateisystem nicht nur die Struktur und die Art, wie die Daten auf einem Datenträger organisiert werden, sondern allgemein den ganzen Baum mit mehreren verschiedenen Dateisystemen (Festplatte, CD-ROM, …). Korrekterweise müsste man hier von einem Namensraum sprechen, der von verschiedenen Teilnamensräumen (den Dateisystemen der eingebundenen Datenträger) gebildet wird, da aber dieser Namensraum sehr dateibezogen ist, wird häufig nur vom Dateisystem gesprochen.
Netzwerkdateisystem
siehe Netzwerkdateisystem
Spezielle virtuelle Dateisysteme
Das open-read-Modell lässt sich auch auf Geräte und Objekte anwenden, die normalerweise nicht über Dateisysteme angesprochen werden. Dadurch wird der Zugriff auf diese Objekte identisch mit dem Zugriff auf normale Dateien, was dem Unix-Konzept Vorlage:Lang entspricht und dadurch den Vorteil bringt, diese Daten in gleicher Weise wie etwa Konfigurationsdateien nutzen zu können.
Unter den derzeitigen Linux-Kernels (u. a. Version 2.6) lassen sich System- und Prozessinformation über das virtuelle proc-Dateisystem abfragen und ändern. Die virtuelle Datei /proc/cpuinfo
liefert zum Beispiel Informationen über den Prozessor. Unter Linux gibt es einige solcher Pseudo-Dateisysteme. Dazu zählen u. a. sysfs, usbfs oder devpts; unter einigen BSDs gibt es ein kernfs. All diese Dateisysteme enthalten nur rein virtuell vorhandene Dateien mit Informationen oder Geräten, die auf eine „Datei“ abgebildet werden.
Der Kernel gaukelt hier quasi die Existenz einer Datei vor, wie sie auch auf einem Massenspeicher vorhanden sein könnte.
Dateien in ramfs oder tmpfs und ähnlichen Dateisystemen existieren demgegenüber tatsächlich, werden aber nur im Arbeitsspeicher gehalten. Sie werden aus Geschwindigkeitsgründen und aus logisch-technischen Gründen während der Boot-Phase eingesetzt.
Neben Linux gibt es auch für diverse andere Betriebssysteme sogenannte RAM-Disks, mit denen ein komplettes virtuelles Laufwerk im Arbeitsspeicher realisiert wird, vor allem aus Geschwindigkeitsgründen.
Besonderheiten
Viele moderne Dateisysteme haben das Prinzip der Datei verallgemeinert, so dass man in einer Datei nicht nur eine Folge von Bytes, einen sogenannten Vorlage:Lang (von englisch data stream für Datenstrom), sondern mehrere solcher Folgen (alternative Datenströme) abspeichern kann. Dadurch ist es möglich, Teile einer Datei zu bearbeiten, ohne eventuell vorhandene andere Teile, die sehr groß sein können, verschieben zu müssen.
Problematisch ist die mangelnde Unterstützung von multiplen Streams. Das äußert sich zum einen darin, dass alternative Daten beim Transfer auf andere Dateisysteme (ISO 9660, FAT, ext2) ohne Warnung verloren gehen, zum anderen darin, dass kaum ein Werkzeug diese unterstützt, weshalb man die dort gespeicherten Daten nicht ohne Weiteres einsehen kann und beispielsweise Virenscanner dort abgespeicherte Viren übersehen.
Aus der Tatsache, dass der Hauptdatenstrom von Änderungen an den anderen Strömen nicht berührt wird, ergeben sich Vorteile für die Performance, den Platzbedarf und die Datensicherheit.
Nicht nur unter Inode-basierten Dateisystemen sind Sparse-Dateien, Hardlinks und symbolische Verknüpfungen möglich.
Für Massenspeicher wie CD-ROM oder DVD gibt es eigene Dateisysteme, die Betriebssystem-übergreifend Anwendung finden, vor allem ISO 9660, weitere siehe unten bei Besonderheiten.
Dateisysteme aus dem Unix-Bereich kennen besondere Gerätedateien. Deren Namen sind dabei oft per Übereinkommen festgelegt, sie können nach Belieben umbenannt werden; so haben zum Beispiel auch die Tastatur, Maus und andere Schnittstellen spezielle Dateinamen, auf die mit Vorlage:Lang, Vorlage:Lang, Vorlage:Lang zugegriffen werden kann, sogar der Hauptspeicher hat einen Dateinamen, /dev/mem
. (Die Unix-Philosophie dazu lautet: „Alles ist eine Datei, und wenn nicht, sollte es eine Datei sein.“)
In anderen Betriebssystemen (wie unter MS-DOS ab Version 2.0) gibt es ebenfalls Gerätedateien: COM:
, CON:
, LPT:
, PRN:
und andere. Diese Geräte können analog zu einer Datei geöffnet und über eine Zugriffsnummer (Handle) gelesen und beschrieben werden. Sie haben aber verständlicherweise keinen Dateizeiger. Im Unterschied zu den Blockgeräten (auch „Laufwerke“ genannt: A:
, B:
, C:
usw.) enthalten sie keine Dateien, sondern verhalten sich selbst – mit gewissen Einschränkungen – wie Dateien. Diese Pseudodateien existieren seit PC DOS 2.0 bzw. MS-DOS 2.0, das stark von UNIX beeinflusst wurde. Unter Berücksichtigung der DOS-Gerätetreiberspezifikation[1] ist es dem Benutzer möglich, eigene Gerätetreiber zu schreiben, sie per DEVICE-Befehl zu laden und über ebensolche Pseudodateinamen anzusprechen. Diese besonderen Dateinamen waren in der Vergangenheit öfters Anlass von Sicherheitsproblemen, da die entsprechenden Namen zum Teil einigen Applikationen nicht bekannt waren und daher nicht herausgefiltert wurden, aber zum Teil auch weil der Zugriffsschutz auf die damit assoziierten Geräte unzureichend geregelt war.
Darüber hinaus existieren Dateisysteme, die mehrere darunterliegende Speichermedien („Vorlage:Lang“) überspannen können (z. B. die Dateisysteme ZFS und Btrfs), die eine Versionierung von Dateien schon inhärent ermöglichen (z. B. VMS) oder deren Größe zur Laufzeit geändert werden kann (z. B. AIX).
Manche Dateisysteme bieten Verschlüsselungsfunktionen an, Umfang und Sicherheit der Funktionen variieren dabei.
Assoziative Dateiverwaltung
Vorlage:Hauptartikel Diese werden häufig fälschlicherweise als Datenbankdateisysteme oder SQL-Dateisysteme bezeichnet, hierbei handelt es sich eigentlich nicht um Dateisysteme, sondern um Informationen eines Dateisystems, die in aufgewerteter Form in einer Datenbank gespeichert und in, für den Anwender intuitiver Form, über das virtuelle Dateisystem des Betriebssystems dargestellt werden.
Sicherheitsaspekte
Das Dateisystem darf von sich aus keine Daten verlieren oder ungewollt überschreiben. Insbesondere zwei Fälle bringen Gefahren mit sich:
Wenn im Multitasking mehrere Aufgaben gleichzeitig anstehen, muss das Dateisystem die einzelnen Aktionen sauber auseinanderhalten, damit nichts durcheinanderkommt. Wenn die Aufgaben auch noch dieselbe Datei ansprechen, sei es nur lesend oder auch schreibend, werden typischerweise entsprechende Sperrmechanismen (Vorlage:Lang) zur Verfügung gestellt oder automatisch in Kraft gesetzt, um Konflikte zu vermeiden. Gleichzeitige Zugriffe von mehreren Seiten z. B. auf eine große Datenbankdatei sind aber auch der Normalfall, so dass man neben globalen Sperren, die die ganze Datei betreffen, auch solche nur für einzelne Datensätze (Vorlage:Lang) benutzen kann.
Wenn ein Laufwerk gerade auf ein Speichermedium schreibt und die Betriebsspannung in diesem Moment ausfällt, dann besteht die Gefahr, dass nicht nur die eigentlichen Daten unvollständig geschrieben werden, sondern dass vor allem die organisatorischen Einträge im Verzeichnis nicht mehr korrekt aktualisiert werden. Um diese Gefahr zumindest möglichst klein zu halten, wird einerseits per Hardware versucht, genug Energiepuffer (Kondensatoren in der Versorgung) bereitzuhalten, so dass ein Arbeitsvorgang noch zu Ende geführt werden kann, andererseits ist die Software so ausgelegt, dass die Arbeitsschritte möglichst „atomar“ ausgelegt sind, das heißt die empfindliche Zeitspanne mit unvollständigen Dateneinträgen so kurz wie möglich gehalten wird. Wenn dies im Extremfall dann doch nicht hilft, gibt es als neuere Entwicklung sogenannte Journaling-Dateisysteme, die in einem zusätzlichen Bereich des Speichermediums Buch über jeden Arbeitsschritt führen, so dass im Nachhinein rekonstruiert werden kann, was noch erledigt werden konnte und was nicht mehr.
Eigene Gesichtspunkte gibt es bei Flash-Speichern, indem diese beim Löschen und Wiederbeschreiben einem Verschleiß ausgesetzt sind, der je nach Typ nur ca. 100.000 bis 1.000.000 Schreibzyklen zulässt. Dabei können in der Regel nicht einzelne Bytes für sich gelöscht werden, sondern meist nur ganze Blöcke (von je nach Modell variierender Größe) auf einmal. Das Dateisystem kann hier daraufhin optimiert werden, dass es die Schreibvorgänge möglichst gleichmäßig über den gesamten Speicherbereich des Flash-Bausteins verteilt und beispielsweise nicht einfach immer bei Adresse 0 anfängt zu schreiben. Stichwort: Wear-Leveling-Algorithmen.
Dem Aspekt der Datensicherheit gegenüber Ausspähung durch Unberechtigte dienen Dateisysteme, die alle Daten verschlüsseln können, ohne dass andere Schichten des Betriebssystems dafür Aufwand zu treiben bräuchten.
Eine weitere Gefahrenquelle für die Integrität der Daten besteht in Schreibaktionen, die von irgendwelcher Software unter Umgehung des Dateisystems direkt auf physische Adressen auf dem Speichermedium erfolgen. Bei älteren Betriebssystemen war das ohne weiteres möglich und führte zu entsprechend häufigen Datenverlusten. Neuere Betriebssysteme können diese tieferen Ebenen wesentlich effektiver vor unautorisiertem Zugriff schützen, so dass mit den Rechten eines Normalbenutzers gar kein direkter Zugriff auf physische Medienadressen mehr erlaubt ist. Wenn bestimmte Diagnose- oder Reparatur-Dienstprogramme (Vorlage:Lang) so einen Zugriff doch benötigen, müssen sie mit Administratorrechten ausgestattet sein.
Lebenszyklusaspekte
Bei der Migration von Dateibeständen, etwa aufgrund einer Systemablösung, müssen häufig Dateien von einem Dateisystem auf ein anderes übernommen werden. Das ist im Allgemeinen ein schwieriges Unterfangen, denn viele Dateisysteme sind untereinander funktional nicht kompatibel, d. h. das Zieldateisystem kann nicht alle Dateien mit allen Attributen aufnehmen, die auf dem Quelldateisystem gespeichert sind. Ein Beispiel hierfür wäre die Migration von NTFS-Dateien mit Alternate Data Streams auf ein Dateisystem ohne Unterstützung für solche Streams.
Siehe auch
Weblinks
- Vergleich und Gegenüberstellung aller Dateisysteme (englische Wikipedia)
- disktype erkennt den Dateisystemtyp
Linux: