Textdatei/Verwendung

Aus Foxwiki

Verwendung

Der ursprüngliche und einfachste Verwendungsfall von Textdateien ist die Übermittlung des enthaltenen Textes als eigentliche Information ()

  • Textdateien können aber unter Anwendung eines im Vorhinein festzulegenden formalen Aufbaus dazu genutzt werden, komplexere Daten zu übermitteln
  • Die Datei ist dann meist nicht mehr primär für die direkte Nutzung durch den Anwender gedacht, sondern wird durch ein bestimmtes Programm weiterverarbeitet oder durch einen Systemadministrator gepflegt

In vielen Fällen werden auf diese Weise heute Textdateien genutzt, in denen eigentlich Binärdateien prädestiniert erscheinen, weil nur eine maschinelle Weiterverarbeitung erfolgt

  • Der ausschlaggebende Nachteil der Binärdateien hier ist, dass deren Struktur über Systemgrenzen hinweg noch weit inhomogener als die von Textdateien ist (siehe beispielsweise Byte-Reihenfolge)
  • Dafür haben Textdateien den Nachteil, dass zur Speicherung derselben Information mehr Speicherplatz erforderlich ist und dass die Daten vielfach bei einer Weiterverarbeitung erst wieder ins binäre Format konvertiert werden müssen
  • Da aber – vor allem durch das Internet – der systemübergreifende Austausch von Daten immer bedeutender geworden ist, ist eine Datenspeicherung in Textdateien heute vielfach üblich

Auch für durch Administratoren oder privilegierte Benutzer zu pflegende Konfigurationsdateien wird häufig das Textformat verwendet

  • Bei einem binären Format wäre jeweils ein spezielles Konfigurationsprogramm erforderlich, bei Verwendung des Textformats kann die Konfigurationsdatei direkt mittels eines Texteditors bearbeitet werden

Tabellarische Daten

Textdateien werden aus verschiedenen Gründen zur Speicherung von Daten mit tabellarischer Struktur verwendet

Es gibt verschiedene Verfahren zur tabellarischen Anordnung der Daten in Textdateien, von denen die folgenden die gebräuchlichsten sind

  • Trennung der Spalten durch Tabulator: Das Tabulatorzeichen, ein spezielles Steuerzeichen, wird innerhalb einer Zeile zur Kennzeichnung der Spaltengrenzen verwendet
  • CSV-Format: Dieses Format, das ursprünglich Vorlage:Lang bedeutete, ist ähnlich der Trennung durch Tabulatorzeichen, nur wird in der Regel im englischen Sprachraum eben das Komma, im deutschen aber der Strichpunkt als Trennzeichen verwendet
  • Festlegung einer konstanten Anzahl Zeichen pro Spalte: Um eine solche Datei verwenden zu können, muss bekannt sein, welche Breite jede einzelne Spalte hat
  • Diese Definition wird selbst nicht in der Datei gespeichert

XML

XML (Extensible Markup Language) ist ein Meta-Dateiformat

  • Es definiert also, in welchem Format definiert wird, wie die Struktur einer Datei aussieht

XML ist dabei bewusst ein Textformat und soll für Mensch und Maschine gleichermaßen lesbar sein, auch soll ein systemübergreifender Austausch von XML-Daten problemlos ermöglicht werden

XML-Dateien sind also grundsätzlich Textdateien, deren grobe Strukturierung standardisiert ist und die vor allem zum Datenaustausch oder zur Datenspeicherung verwendet werden – der genaue Verwendungszweck wird von XML selbst nicht vorgegeben

  • Ein Beispiel für ein auf XML basierendes Format ist SVG (Vorlage:Lang), ein Grafikformat, das somit im Prinzip lesbar in einer Textdatei codiert ist

Die Dateiformate der Textverarbeitungen OpenDocument (OpenOffice.org) und Office Open XML (der neueren Versionen von Microsoft Word, erkennbar an der Dateierweiterung .docx statt .doc) basieren auf XML, und die gespeicherten Dateien sind demzufolge Textdateien

  • Dabei ist aber zu beachten, dass der „Text“, der bei direkter Bearbeitung einer solchen Datei sichtbar wird, nicht der „eigentliche“ Textinhalt des Dokuments ist, sondern die Beschreibung des Textdokuments auf einer Metaebene

Weitere Dateiformate

Neben XML-Formaten existieren noch einige meist ältere, recht weit verbreitete Auszeichnungssprachen, die häufig verwendet und in Form einer Textdatei gespeichert werden

Das Dateiformat definiert unter anderem Zugehörigkeit, Aufgabe und Klasse der Datei (Betriebssystemdatei oder Videodatei usw.)

In welchem Dateiformat eine Datei gespeichert wurde, lässt sich an ihrer Dateinamenserweiterung erkennen (etwa „*.exe“ für ein ausführbares Computerprogramm oder „*.wmv“ für ein Windows Metafile)

  • Die wichtigsten Dateiformate für Textdateien sind


Dateiformat Dateiendung
Textdatei *.txt
Microsoft Word *.doc
Office Open XML *.docx und andere
Microsoft Access *.acc
Microsoft PowerPoint *.ppt und andere
OpenDocument *.odt und andere
Apple Pages *.pages
Portable Document Format *.pdf
Rich Text Format *.rtf
Microsoft Excel *.xls und andere
Extensible Markup Language *.xml
  • HTML, die Sprache zur Gestaltung von Inhalten im World Wide Web, ist von der Struktur her verwandt mit XML
  • Rich Text Format (RTF) ist eine Sprache zum Austausch von formatiertem Text zwischen Textverarbeitungsprogrammen, auch auf unterschiedlichen Plattformen
  • TeX und LaTeX stellen ein Textsatzsystem dar, das zur Textgestaltung eine spezielle Sprache verwendet, die in Textdateien codiert wird
  • PostScript ist ein Dateiformat, das professionelle Druckformatierungen ermöglicht und in Form einer Textdatei gespeichert wird
  • Die Binärdaten enthaltener Grafiken werden als hexadezimale Ziffern in Text umgesetzt
  • Da viele Drucker dieses Format direkt interpretieren können, geben viele Textverarbeitungs- oder Desktop-Publishing-Programme ihre Ergebnisse im PostScript-Format aus
  • PostScript wird allerdings in einigen Bereichen von PDF verdrängt

Daneben existieren noch viele weitere und auch proprietäre Formate, deren Aufbau sich nur bei Verfügbarkeit einer entsprechenden Spezifikation erschließt