LPIC101/103.2 Textströme mit Filtern verarbeiten: Unterschied zwischen den Versionen

Aus Foxwiki
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 58: Zeile 58:


===sort===
===sort===
Sortiert die Zeilen von Text- und anderen Dateien.


===uniq===
Zeigt nur die einzigartigen Zeilen einer Datei.


===uniq===
===split===
===split===
Spaltet Dateien in mehrere. Die Angaben sind Standardmäßig Zeilenbasiert, können aber auch Dateigrößenorientiert sein (split -b). Standardangabe ist ein Split nach 1000 Zeilen.
===cut,paste===
===cut,paste===
Cut schneidet Spalten einer Textdatei aus. Es ist jedoch nicht mit dem Windows "Ausschneiden" zu verwechseln, da die Spalten in der Originaldatei bestehen bleiben. Zum erfolgreichen ausschneiden der Spalten benötigt man eine Angabe der Spalte (z.B. "-f2") und einen sogenannten Delimiter, welcher die Spalten voneinander trennt (z.B. "d:", also hier ein Doppelpunkt).
Der Befehl Paste fügt zwei oder mehr Dateien zusammen. Im Gegensatz zu cat werden diese horizontal zusammengefügt.
===sed===
===sed===
Der sed Editor gehört nicht in diese Kapitel und wird nur der Vollständigkeit halber erwähnt.
===tr===
===tr===
Der Befehl tr steht für translate und ist am besten durch die Funktion "Suchen und Ersetzen" aus Excel zu vergleichen. Es werden bestimmte Zeichen oder Wörter einer Datei durch andere ersetzt.
===md5sum,sha256sum,sha512sum===
===md5sum,sha256sum,sha512sum===
 
Die drei genannten Befehle arbeiten alle nach derselben Syntax und haben den gleichen Zweck. Sie erstellen Prüfsummen für die jeweilige Datei, welche wiederum wichtig für Datenintegrität,-sicherheit und -authentizität sind. Es lassen sich mit den jeweiligen Befehlen auch die entsprechenden Hashwerte auslesen.


[[Category:Linux:LPIC:101]]
[[Category:Linux:LPIC:101]]
[[Category:Linux]]
[[Category:Linux]]

Version vom 11. November 2019, 14:39 Uhr

DIESE SEITE BEFINDET SICH IN ENTWICKLUNG

Einleitung

In diesem Artikel geht es darum, wie man Textströme und Textdateien mit Filtern verarbeiten könnt. Zu diesem Thema werden 2 Fragen in der IHK Prüfung (LPIC-1 Version 5) gestellt. Dies entspricht 3,33% der Gesamtwertung.

Begriffsklärung

Was ist ein Textstrom? Ein Textstrom ist eine Textdatei, die fortlaufend verändert wird, beispielsweise von einem Prozess.
Beispiel : /var/log/syslog

Was ist der Unterschied zu einer Textdatei? Ein Textstrom ist eine Textdatei. In der Regel meint man mit einer Textdatei eine Datei, welche nicht von einem laufenden Prozess oder einem anderen Benutzer verändert wird.

Was ist ein Filter Ein Filter ist ein Programm, welches die Ausgabe eines Befehls als Eingabe verwertet. Es wird in Linux mit einer sogenannten Pipe gekennzeichnet. So schaut eine Pipe in der Kommandozeile aus : |


Relevante Filter

Die folgenden Filter sind relevant. Sie werden exemplarisch anhand der syslog Datei erklärt.

cat

Eines der Standardbefehle bei der Arbeit in dem Linux-Terminal. Von der Namensbedeutung her ist der Befehl ursprünglich dazu gedacht, Dateien vertikal zusammenzufügen (concatenate, verketten). In der Praxis wird er aber oft verwendet um den Inhalt einer Datei komplett auszugeben auf dem Terminal.

Beispiel : cat /var/log/syslog
Gibt die komplette Syslog Datei auf dem Terminal aus

bzcat,xzcat und zcat

Möchte man eine komprimierte Datei im Terminal ausgeben, kann man einen dieser drei Befehle verwenden. Der Befehl verhält sich ansonsten ähnlich wie cat. Dabei verwendet bzcat das Kompressionsprogrammm bzip2, xzcat das Programm xz (beide Verlinken lediglich auf das Programm). zcat ist eine eigenständiges Programm und wird in der Regel für die gleichen Programme wie gzip verwendet.

Zusatzinfo
bzip2
Dieser Algorithmus ist leistungsfähiger als gzip und wird gerne für große Datenmengen verwendet.
xz


head

Dieser Befehl zeigt die ersten (Standardmäßig 10) Zeilen einer Textdatei.

tail

Dieser Befehl zeigt die letzten (Standardmäßig 10) Zeilen einer Textdatei.

less

Dieser Befehl zeigt eine Textdatei Seitenweise. Man kann – im Gegensatz zum veralteten Befehl "more" – vor- und zurücknavigieren.

nl

Dieser Befehl setzt vor die Zeilen einer Textdatei eine Nummer zur besseren Ablesbarkeit.

wc

Dieser Befehl zählt die Wörter einer Textdatei.

hexdump

Wandelt die Ausgabe einer Datei in Hexadezimal-, Oktal-, Dezimalzahlen oder ASCII Zeichen um. Es kann nahezu alles als Eingabe verwendet werden, auch Binärdateien. Die Voreinstellung ist Hexadezimal.

od

Tut das gleiche wie hexdump. Einige Distributionen arbeiten mit hexdump, andere mit od und wieder andere mit beiden. Die Voreinstellung ist Oktal. Od hat verglichen mit hexdump etwas weniger Funktionen.

sort

Sortiert die Zeilen von Text- und anderen Dateien.

uniq

Zeigt nur die einzigartigen Zeilen einer Datei.

split

Spaltet Dateien in mehrere. Die Angaben sind Standardmäßig Zeilenbasiert, können aber auch Dateigrößenorientiert sein (split -b). Standardangabe ist ein Split nach 1000 Zeilen.

cut,paste

Cut schneidet Spalten einer Textdatei aus. Es ist jedoch nicht mit dem Windows "Ausschneiden" zu verwechseln, da die Spalten in der Originaldatei bestehen bleiben. Zum erfolgreichen ausschneiden der Spalten benötigt man eine Angabe der Spalte (z.B. "-f2") und einen sogenannten Delimiter, welcher die Spalten voneinander trennt (z.B. "d:", also hier ein Doppelpunkt). Der Befehl Paste fügt zwei oder mehr Dateien zusammen. Im Gegensatz zu cat werden diese horizontal zusammengefügt.

sed

Der sed Editor gehört nicht in diese Kapitel und wird nur der Vollständigkeit halber erwähnt.

tr

Der Befehl tr steht für translate und ist am besten durch die Funktion "Suchen und Ersetzen" aus Excel zu vergleichen. Es werden bestimmte Zeichen oder Wörter einer Datei durch andere ersetzt.


md5sum,sha256sum,sha512sum

Die drei genannten Befehle arbeiten alle nach derselben Syntax und haben den gleichen Zweck. Sie erstellen Prüfsummen für die jeweilige Datei, welche wiederum wichtig für Datenintegrität,-sicherheit und -authentizität sind. Es lassen sich mit den jeweiligen Befehlen auch die entsprechenden Hashwerte auslesen.