tr - in Texte systematisch Zeichen durch andere Zeichen ersetzen


Der Befehl tr (von translate = umwandeln oder transliterate = transliterieren) dient dazu, in Texten systematisch Zeichen durch andere Zeichen zu ersetzen. So ist es beispielweise möglich, alle Großbuchstaben einer Datei durch Kleinbuchstaben zu ersetzen oder mehrere aufeinander folgende Leerzeichen durch ein einziges zu ersetzen. Für komplexere Ersetzungen, z. B.  für ganze Wörter, empfiehlt sich das wesentlich mächtigere sed.

tr ist ein Unix-Kommando, dessen Name eine Abkürzung für translate (deutsch: übersetzen) ist, das bestimmte Zeichen aus einem Datenstrom ersetzt oder entfernt.

Das Werkzeug liest den Datenstrom der Standardeingabe, schreibt auf die Standardausgabe und benötigt je nach Modus ein (Löschen und Komprimieren) oder zwei (Ersetzen) Argumente.

Sollen Zeichen ersetzt werden, werden zwei Argumente benötigt, zuerst die zu ersetzenden Zeichen, im zweiten die neuen.

Einfaches Beispiel

Ersetzen eines Buchstabens durch einen anderen

echo Maus | tr M H

Mit folgendem Befehl werden Groß- in Kleinbuchstaben umgewandelt:

echo 'FLÜSTERN' | tr A-ZÄÖÜ a-zäöü

oder auch

echo 'FLÜSTERN' | tr [:upper:]ÄÖÜ [:lower:]äöü



… und umgekehrt:

echo 'schreien' | tr a-zäöü A-ZÄÖÜ

Bestimmte Zeichen, hier alle Zahlen in der Datei datei.txt, lassen sich mit der Option -d löschen:

tr -d '0-9' < datei.txt

Soll aus mehrere aufeinanderfolgenden Leerzeichen ein einzelnes gemacht werden, kann man die Option -s verwenden:

echo 'd b' |tr -s ' '
d b

Um alle Zeichen zu entfernen, die nicht einer bestimmten Zeichengruppe angehören, kann die Option -c benutzt werden. Im folgenden Beispiel werden alle Zeichen entfernt, die keine Buchstaben sind:

echo 'Die drei ??? treffen die 12 Geschworenen!' | tr -cd '[:alpha:]' > datei
cat datei

Mit Hilfe von tr lässt sich ein Text auch sehr leicht Rot13 chiffrieren und dechiffieren:

echo 'Morgen bringen wir Cäsar um' | tr [a-zA-Z] [n-za-mN-ZA-M]
Zbetra oevatra jve Päfne hz

Und wieder zurück:

echo 'Zbetra oevatra jve Päfne hz' | tr [a-zA-Z] [n-za-mN-ZA-M]
Morgen bringen wir Cäsar um

Um in einer Datei Zeichen zu ändern und das Ergebnis in eine zweite Datei zu schreiben, können Umleitungen eingesetzt werden. Mit dem folgenden Befehl werden alle Vorkommen des Buchstabens a in datei1 in den Buchstaben b umgewandelt und das Ergebnis in datei2 geschrieben:

tr a b < datei1 > datei2

Der folgende Befehl entfernt alle Wagenrückläufe („Carriage Return“, mehr unter Zeichensatz-Konverter) und konvertiert so eine Datei datei1 vom Windows- in das Unixformat:

tr -d '\r' < datei1 > ausgabedatei

Alle mehrfach aufeinander folgenden Zeilenumbrüche („new line“) in datei1 werden in jeweils einen umgewandelt:

tr -s '\n' < datei1 > ausgabedatei

Der folgende Befehl führt dazu, dass alle kommaseparierten Elemente einer CSV-Datei datei.csv jeweils in einer neuen Zeile erscheinen:

tr ',' '\n' < datei.csv


$ echo Meyer | tr y i

Es sind mehrfache Ersetzungen einzelner Zeichen auf einmal möglich. Z.B. ersetzt

tr 'abcd' 'jkmn'

alle vorkommenden a durch j, b durch k usw.

Im Alphabet aufeinanderfolgende Zeichen lassen sich dabei mit einem Bindestrich angeben:

tr 'a-d' 'jkmn'

Mit dem Operator s werden alle hintereinander folgenden identischen Zeichen durch ein einzelnes ersetzt. Beispiel:

echo muuuuh | tr -s u

Der Operand d löscht alle im ersten Argument angegebenen Zeichen

tr -d '\r'

wobei \r für ein Carriage Return (Bytewert 13) steht. Mit diesem Befehl wird dieses unter Unix nicht verwendete Umbruchzeichen ersatzlos entfernt.

Ist ein c angegeben, so gilt die Umkehrung, also hier

tr -cd '[:alnum:]'

wobei der Ausdruck [:alnum:] für alle alphanumerischen Zeichen steht. Somit werden alle nicht alphanumerischen Zeichen entfernt.

Und folgendes ist seine Syntax:

tr [OPTION]... SET1 [SET2]

hier ist, was SET bedeutet:

SETs are specified as strings of characters. Most represent themselves. Interpreted sequences are: \NNN character with octal value NNN (1 to 3 octal digits)

\\ backslash
\a audible BEL
\b backspace
\f form feed
\n new line
\r return
\t horizontal tab
\v vertical tab

Option Beschreibung
-c, -C oder --complement Komplement der angegebenen Zeichenfolge
-d oder --delete Löschen (nicht Ersetzen) von Zeichen
-s oder --squeeze-repeats Mehrere identische aufeinanderfolgende Zeichen durch ein einzelnes ersetzen
-t oder --truncate-set1 Beschneide zunächst den ersten Datensatz auf die Länge des zweiten Datensatzes


Option Beschreibung
\\ Backslash
\b Rücktaste
\n Zeilenumbruch
\t Horizontaler Tab
[:alpha:] Alle Buchstaben
[:blank:] Alle horizontalen Leerzeichen
[:digit:] Alle Zahlen
[:lower:] Alle Kleinbuchstuben
[:upper:] Alle Großbuchstaben

Weitere Angaben sind der Manpage zu entnehmen. Man beachte, dass die Zsh die eckigen Klammern z. B.  in [:blank:] als Wildcard-Parameter interpretiert und sie daher nicht an tr weitergibt. Benutzer der Zsh sollten solche Argument daher in einfache oder doppelte Anführungszeichen einschließen.




