Textdatei: Unterschied zwischen den Versionen

Aus Foxwiki
Zeile 50: Zeile 50:
* Dies liegt daran, dass bei Textdateien die [[Entropie (Informationstheorie)|Informationsdichte]] geringer ist als bei den meisten Binärdateien, was die gängigen Komprimierungsalgorithmen ausnutzen – beispielsweise durch Verwendung der [[Huffman-Kodierung]]
* Dies liegt daran, dass bei Textdateien die [[Entropie (Informationstheorie)|Informationsdichte]] geringer ist als bei den meisten Binärdateien, was die gängigen Komprimierungsalgorithmen ausnutzen – beispielsweise durch Verwendung der [[Huffman-Kodierung]]


== Nutzung ==
<noinclude>
'''Speichern'''<br />
Das ''Speichern'' einer Textdatei geschieht mit Hilfe eines [[Datenspeicher]]s, der ein bestimmtes Dateiformat unterstützt
* Dazu wird das [[Menü (Computer)|Menü]] „Speichern“ ausgewählt, das für die Speicherung sorgt
* Moderne [[Betriebssystem]]e ordnen über das Dateiformat [[Anwendungssoftware|Anwendungen]] zu, welche die Dateien interpretieren können
 
'''Lesen und Bearbeiten'''<br />
Unter [[Unixoides System|unixoiden Betriebssystemen]] erkennt das Programm bzw.&nbsp;die Bibliothek [[file]], ob es sich um eine für die textuelle Bearbeitung geeignete Datei handelt, unabhängig von der [[Dateinamenserweiterung]]
* Unter [[Microsoft Windows|Windows]] und im Vorläufersystem [[MS-DOS]] (beide von [[Microsoft]]) dienen die [[Liste von Kommandozeilenbefehlen (DOS)|Kommandozeilenbefehle]] <code>TYPE</code> und <code>[[more (Kommandozeilenbefehl)|MORE]]</code> der Anzeige von Textdateien
* Unter allen Betriebssystemen gibt es [[Texteditor]]en zur direkten Anzeige und Bearbeitung von Textdateien auf der [[Kommandozeile]], beispielsweise [[less (Unix)|less]], [[ed (Texteditor)|ed]], [[vi]] oder [[Nano (Texteditor)|Nano]] unter unixoiden Betriebssystemewn
* Dabei ermöglichen praktisch alle Texteditoren, in einer Datei direkt nach speziellen Textinhalten zu suchen
* Viele, insbesondere grafische, Texteditoren bieten auch eine Unterstützung bei der Darstellung spezieller Dateiformate, so werden verschiedene [[Syntax]]elemente entsprechend ihrer Bedeutung [[Syntaxhervorhebung|hervorgehoben]] (beispielsweise durch Einfärbungen)
* Mithilfe eines Texteditors kann eine Datei im Regelfall auch [[Drucker (Gerät)|gedruckt]] werden
 
Die Bearbeitung in einem grafischen Texteditor erfolgt durch Aufruf des [[Menü (Computer)|Menüs]] „Öffnen“
* Durch Suchen und Ersetzen lässt sich die zu ändernde Passage finden; der gesamte Dateiinhalt kann verändert werden
* Sowohl bei der Anzeige in einem Texteditor als auch beim Ausdrucken kann das Problem auftreten, dass die Einrückung von Zeilen nicht korrekt dargestellt wird
* Dies liegt meist daran, dass in der Datei das [[Tabulatorzeichen]] enthalten ist, für das nicht einheitlich definiert ist, wie weit die Einrückung erfolgen soll
* Um wie viele Zeichen eingerückt wird, ist deshalb eine [[Konfiguration (Computer)|Konfigurationsinformation]] des Editors oder Druckers
* Erschwerend kommt hinzu, dass bei der Anzeige im Texteditor der Unterschied zwischen Leerzeichen und einem Tabulatorzeichen meist nicht oder nur schwer ersichtlich ist
 
Texteditoren fügen häufig automatisch „weiche“ [[Zeilenumbruch|Zeilenumbrüche]] ein, wenn die Breite des verwendeten [[Fenster (Computer)|Bildschirmfensters]] zur Anzeige der gesamten Zeile nicht ausreicht
* Auch bei Druckausgabe kann es zum Einfügen solcher „weichen“ Zeilenumbrüche kommen
* Diese Zeilenumbrüche sind nicht in der Datei selbst enthalten und können bei Ausgabe auf einem anderen Medium an anderer Stelle erfolgen
* Oft sind diese vom Anwender nur schwer von den eigentlichen, „harten“ Zeilenumbrüchen zu unterscheiden – also den Zeilenumbrüchen, die der Anwender selbst –&nbsp;beispielsweise unter Verwendung der [[Eingabetaste|entsprechenden Taste]]&nbsp;– in der Datei eingefügt hat und die auch in der Datei gespeichert werden
 
Die Texte können entweder auf einem [[Computer]] eingesehen werden oder durch den [[Drucker (Gerät)|Drucker]] auf Papier gebracht werden
 
'''Datenübertragung'''<br />
Die [[Datenübertragung]] über das [[Internet]] (durch [[Download]] bzw. [[Upload]]) ist für Laien kompliziert, zumal sie im Hintergrund geschieht
* Das [[Transmission Control Protocol]] (TCP) zerlegt eine zu versendende Datei in einzelne kleinere [[Datenpaket]]e und versendet diese getrennt voneinander über das Internet
* Dabei kann ein Datenpaket verschiedene [[Point of Presence|Knotenpunkte]] im Internet (wie [[Hostrechner]], [[Server]]) durchlaufen, weil an jedem Knotenpunkt der optimale Weg für das Paket neu bestimmt wird
 
Da unterwegs die ursprüngliche [[Reihenfolge]] nicht eingehalten werden muss, hat das TCP auch die Aufgabe, die ursprüngliche Reihenfolge beim empfangenden [[Endgerät]] wiederherzustellen
* Das [[Internet Protocol]] (IP) regelt die korrekte Adressierung (Rechnerarchitektur)|Adressierung der Datenpakete, damit die im Internet angeschlossenen Computer eindeutig identifiziert werden können
* Die Datenübertragung der [[Digitale Daten|digitalen Daten]] beginnt mit dem Upload beim [[Absender]] und endet mit dem Download beim [[Empfänger (Information)|Empfänger]]


<noinclude>
== Anhang ==
== Anhang ==
=== Siehe auch ===
=== Siehe auch ===

Version vom 4. November 2024, 13:37 Uhr

Textdatei - Datei, die darstellbare Zeichen enthält

Beschreibung

95 ASCII-Zeichen, weiße Schrift auf schwarzem Grund
Die 95 druckbaren Zeichen des ursprünglichen ASCII

Als Textdatei wird in der Informationstechnik eine Datei bezeichnet, die darstellbare Zeichen enthält und zum Speichern, Bearbeiten, zur Datenübertragung und Lesen dient

Allgemeines

Die Zeichen können durch Steuerzeichen wie Zeilen- und Seitenwechsel untergliedert sein

Umgangssprachliche Verwendung

Im Gegensatz zu dieser fachsprachlichen Definition des Begriffs Textdatei, bei der das Dateiformat ausschlaggebend ist, orientiert sich die umgangssprachliche Verwendung des Begriffs häufig primär am für den Endbenutzer sichtbaren Inhalt der Datei: Dabei werden etwas unscharf alle Dateien als „Textdatei“ bezeichnet, die mit dem Ziel erstellt wurden, einen lesbaren Text zu präsentieren, unabhängig davon, in welcher Form sie gespeichert werden

  • Bei den von üblicher Textverarbeitungs- oder Publishingsoftware bei Speicherung erzeugten Dateien handelt es sich jedoch häufig um komplexe Dateiformate, die neben dem Text Metainformation zur Beschreibung des Textlayouts, der Struktur und der verwendeten Schriften enthalten; zudem können Bilder oder Grafiken eingebettet sein
  • Deshalb handelt es sich um keine Textdateien im fachsprachlichen Sinn, da die Dateiformate häufig binär sind und zur Anzeige eine spezielle Software erforderlich ist

Bei einer Textdatei im fachsprachlichen Sinn wird die Menge der verfügbaren Zeichen durch die zugrunde liegende Codierung bestimmt

  • Am gebräuchlichsten sind hierbei ASCII oder UTF-8, eine Codierung des Unicode
  • Eine solche Textdatei muss dabei nicht notwendigerweise Text enthalten – es kann sich beispielsweise auch um ASCII-Art handeln, also um Piktogramme auf Basis der verfügbaren Zeichen
  • Wenn es sich jedoch um Text handelt und zum Verständnis der Bedeutung weder besondere Verarbeitungsschritte noch die Kenntnis einer speziellen Notation erforderlich sind, wird der Inhalt als Plain text bezeichnet
  • Die Zeichenmenge wird aber auch häufig durch eine natürliche oder formale Sprache eingeschränkt
  • Textdateien, die eine bestimmte Notation erfordern – wie beispielsweise HTML-Dateien – können zwar mit einem einfachen Texteditor bearbeitet werden, jedoch gibt es hierfür oft spezielle Programme, die die Bearbeitung erleichtern – beispielsweise durch besondere Hervorhebungen oder automatische Formatierungen

Binär-/Textdatei

Abgrenzung von Binär- und Textdateien
Binärdatei

Das Gegenstück zur Textdatei ist eine Binärdatei

  • Im Grunde werden auch Textdateien binär gespeichert, die Begriffe werden jedoch komplementär verwendet, denn die Interpretation des binären Inhalts ist ausschlaggebend: Bei einer Textdatei wird der Inhalt als sequenzielle Folge von Zeichen eines Zeichensatzes interpretiert, bei einer Binärdatei ist eine beliebige anderweitige Interpretation des Inhalts möglich

Folglich ist eine Textdatei im Gegensatz zu einer Binärdatei ohne die Verwendung spezieller Programme lesbar und kann mit einem einfachen Texteditor – wie beispielsweise mit Notepad unter Windows oder vi oder Nano unter Unix – betrachtet und bearbeitet werden

Bei vielen Betriebssystemen existieren Konventionen in Bezug auf die Endung von Dateinamen zur Kennzeichnung des Dateityps

  • Unter Windows und macOS wird dem Namen einer Textdatei meist die Endung .txt angehängt, auch bei anderen Betriebssystemen wie beispielsweise Linux wird diese Dateiendung teilweise verwendet

Die zur Standardisierung des technischen Formats von E-Mails entworfenen Multipurpose Internet Mail Extensions (MIME) definieren sogenannte Medientypen, die mittlerweile neben dem E-Mail-Verkehr auch in vielen anderen Bereichen zur Kennzeichnung des Dateityps verwendet werden

  • Der Medientyp text kennzeichnet dabei Text
  • Die vollständige Typangabe wird noch um einen Subtyp ergänzt, der den Verwendungszweck des Textes spezifiziert
  • Bei Textdateien, die direkt den „eigentlichen“ Text enthalten, der nicht für eine bestimmte maschinelle Weiterverarbeitung bestimmt ist, lautet die vollständige Typangabe text/plain

Für den in einer Textdatei enthaltenen Text können keine besonderen Formatierungen wie beispielsweise Hervorhebungen durch Fettdarstellung festgelegt werden

Eine mit einer Textverarbeitung (wie beispielsweise Microsoft Word oder LibreOffice Writer) erstellte Datei ist im Normalfall keine Textdatei,

selbst wenn ausschließlich Text erfasst wurde, da der Text nur unter Verwendung eines geeigneten Textverarbeitungssystems wieder angezeigt und bearbeitet werden kann
  • Auch ein im PostScript (.ps), Portable Document Format (PDF, .pdf) oder TeX-DVI (.dvi) vorliegender Text ist keine Textdatei, weil diese codierte Formatinformationen enthält, die auch binär sein können
  • Ebenso handelt es sich bei Texten, die mittels eines Scanners eingelesen werden, nicht um Textdateien
  • Diese sind vielmehr Bilddateien, sofern sie nicht nach dem Scan-Vorgang mittels einer Texterkennungs-Software (OCR, Vorlage:Lang) in eine Textdatei umgewandelt werden

Bei einer Datenkomprimierung kann bei Textdateien im Regelfall eine erheblich größere Einsparung bei der Speichergröße erzielt werden als bei Binärdateien

  • Dies liegt daran, dass bei Textdateien die Informationsdichte geringer ist als bei den meisten Binärdateien, was die gängigen Komprimierungsalgorithmen ausnutzen – beispielsweise durch Verwendung der Huffman-Kodierung


Anhang

Siehe auch

Links

Weblinks
  1. https://de.wikipedia.org/wiki/Textdatei