Textdatei/Verwendung
Verwendung
Der ursprüngliche und einfachste Verwendungsfall von Textdateien ist die Übermittlung des enthaltenen Textes als eigentliche Information ()
- Textdateien können aber unter Anwendung eines im Vorhinein festzulegenden formalen Aufbaus dazu genutzt werden, komplexere Daten zu übermitteln
- Die Datei ist dann meist nicht mehr primär für die direkte Nutzung durch den Anwender gedacht, sondern wird durch ein bestimmtes Programm weiterverarbeitet oder durch einen Systemadministrator gepflegt
In vielen Fällen werden auf diese Weise heute Textdateien genutzt, in denen eigentlich Binärdateien prädestiniert erscheinen, weil nur eine maschinelle Weiterverarbeitung erfolgt
- Der ausschlaggebende Nachteil der Binärdateien hier ist, dass deren Struktur über Systemgrenzen hinweg noch weit inhomogener als die von Textdateien ist (siehe beispielsweise Byte-Reihenfolge)
- Dafür haben Textdateien den Nachteil, dass zur Speicherung derselben Information mehr Speicherplatz erforderlich ist und dass die Daten vielfach bei einer Weiterverarbeitung erst wieder ins binäre Format konvertiert werden müssen
- Da aber – vor allem durch das Internet – der systemübergreifende Austausch von Daten immer bedeutender geworden ist, ist eine Datenspeicherung in Textdateien heute vielfach üblich
Auch für durch Administratoren oder privilegierte Benutzer zu pflegende Konfigurationsdateien wird häufig das Textformat verwendet
- Bei einem binären Format wäre jeweils ein spezielles Konfigurationsprogramm erforderlich, bei Verwendung des Textformats kann die Konfigurationsdatei direkt mittels eines Texteditors bearbeitet werden
Tabellarische Daten
Textdateien werden aus verschiedenen Gründen zur Speicherung von Daten mit tabellarischer Struktur verwendet
- So strukturierte Dateien können mit einem Tabellenkalkulationsprogramm (beispielsweise Calc aus den Paketen LibreOffice und Apache OpenOffice oder Microsoft Excel) weiterverarbeitet werden. Datenbankdaten werden häufig auf diese Weise exportiert, um diese zwischen meist unterschiedlichen Anwendungsprogrammen auszutauschen – auch wenn heute das XML-Format für einen solchen Fall prädestiniert erscheint
Es gibt verschiedene Verfahren zur tabellarischen Anordnung der Daten in Textdateien, von denen die folgenden die gebräuchlichsten sind
- Trennung der Spalten durch Tabulator: Das Tabulatorzeichen, ein spezielles Steuerzeichen, wird innerhalb einer Zeile zur Kennzeichnung der Spaltengrenzen verwendet
- CSV-Format: Dieses Format, das ursprünglich Vorlage:Lang bedeutete, ist ähnlich der Trennung durch Tabulatorzeichen, nur wird in der Regel im englischen Sprachraum eben das Komma, im deutschen aber der Strichpunkt als Trennzeichen verwendet
- Festlegung einer konstanten Anzahl Zeichen pro Spalte: Um eine solche Datei verwenden zu können, muss bekannt sein, welche Breite jede einzelne Spalte hat
- Diese Definition wird selbst nicht in der Datei gespeichert
XML
XML (Extensible Markup Language) ist ein Meta-Dateiformat
- Es definiert also, in welchem Format definiert wird, wie die Struktur einer Datei aussieht
XML ist dabei bewusst ein Textformat und soll für Mensch und Maschine gleichermaßen lesbar sein, auch soll ein systemübergreifender Austausch von XML-Daten problemlos ermöglicht werden
XML-Dateien sind also grundsätzlich Textdateien, deren grobe Strukturierung standardisiert ist und die vor allem zum Datenaustausch oder zur Datenspeicherung verwendet werden – der genaue Verwendungszweck wird von XML selbst nicht vorgegeben
- Ein Beispiel für ein auf XML basierendes Format ist SVG (Vorlage:Lang), ein Grafikformat, das somit im Prinzip lesbar in einer Textdatei codiert ist
Die Dateiformate der Textverarbeitungen OpenDocument (OpenOffice.org) und Office Open XML (der neueren Versionen von Microsoft Word, erkennbar an der Dateierweiterung .docx
statt .doc
) basieren auf XML, und die gespeicherten Dateien sind demzufolge Textdateien
- Dabei ist aber zu beachten, dass der „Text“, der bei direkter Bearbeitung einer solchen Datei sichtbar wird, nicht der „eigentliche“ Textinhalt des Dokuments ist, sondern die Beschreibung des Textdokuments auf einer Metaebene
Weitere Dateiformate
Neben XML-Formaten existieren noch einige meist ältere, recht weit verbreitete Auszeichnungssprachen, die häufig verwendet und in Form einer Textdatei gespeichert werden
Das Dateiformat definiert unter anderem Zugehörigkeit, Aufgabe und Klasse der Datei (Betriebssystemdatei oder Videodatei usw.)
In welchem Dateiformat eine Datei gespeichert wurde, lässt sich an ihrer Dateinamenserweiterung erkennen (etwa „*.exe“ für ein ausführbares Computerprogramm oder „*.wmv“ für ein Windows Metafile)
- Die wichtigsten Dateiformate für Textdateien sind
Dateiformat | Dateiendung |
---|---|
Textdatei | *.txt |
Microsoft Word | *.doc |
Office Open XML | *.docx und andere |
Microsoft Access | *.acc |
Microsoft PowerPoint | *.ppt und andere |
OpenDocument | *.odt und andere |
Apple Pages | *.pages |
Portable Document Format | |
Rich Text Format | *.rtf |
Microsoft Excel | *.xls und andere |
Extensible Markup Language | *.xml |
- HTML, die Sprache zur Gestaltung von Inhalten im World Wide Web, ist von der Struktur her verwandt mit XML
- Rich Text Format (RTF) ist eine Sprache zum Austausch von formatiertem Text zwischen Textverarbeitungsprogrammen, auch auf unterschiedlichen Plattformen
- TeX und LaTeX stellen ein Textsatzsystem dar, das zur Textgestaltung eine spezielle Sprache verwendet, die in Textdateien codiert wird
- PostScript ist ein Dateiformat, das professionelle Druckformatierungen ermöglicht und in Form einer Textdatei gespeichert wird
- Die Binärdaten enthaltener Grafiken werden als hexadezimale Ziffern in Text umgesetzt
- Da viele Drucker dieses Format direkt interpretieren können, geben viele Textverarbeitungs- oder Desktop-Publishing-Programme ihre Ergebnisse im PostScript-Format aus
- PostScript wird allerdings in einigen Bereichen von PDF verdrängt
Daneben existieren noch viele weitere und auch proprietäre Formate, deren Aufbau sich nur bei Verfügbarkeit einer entsprechenden Spezifikation erschließt