Bash/Expansion von Dateinamen
topic - Kurzbeschreibung
Beschreibung
Nach der Wortaufteilung sucht Bash jedes Wort nach den Zeichen "*", "?" und "[" ab, sofern nicht die Option -f gesetzt wurde.
Wenn eines dieser Zeichen auftaucht, wird das Wort als PATTERN betrachtet und durch eine alphabetisch sortierte Liste von Dateinamen ersetzt, die dem Muster entsprechen.
Wenn keine passenden Dateinamen gefunden werden und die Shell-Option nullglob deaktiviert ist, wird das Wort unverändert gelassen.
Wenn die Option nullglob gesetzt ist und keine Übereinstimmungen gefunden werden, wird das Wort entfernt.
Wenn die Shell-Option nocaseglob aktiviert ist, wird die Übereinstimmung ohne Rücksicht auf die Groß- und Kleinschreibung der Buchstaben durchgeführt.
Wenn ein Muster für die Generierung von Dateinamen verwendet wird, muss das Zeichen "." am Anfang eines Dateinamens oder unmittelbar nach einem Schrägstrich explizit abgeglichen werden, es sei denn, die Shell-Option dotglob ist gesetzt.
Beim Abgleich eines Dateinamens muss das Schrägstrichzeichen immer explizit abgeglichen werden. In anderen Fällen wird das "."-Zeichen nicht besonders behandelt.
Die Shell-Variable GLOBIGNORE kann verwendet werden, um die Menge der Dateinamen einzuschränken, die einem Muster entsprechen.
Wenn GLOBIGNORE gesetzt ist, wird jeder übereinstimmende Dateiname, der auch mit einem der Muster in GLOBIGNORE übereinstimmt, aus der Liste der Übereinstimmungen entfernt.
Die Dateinamen . und .. werden immer ignoriert, auch wenn GLOBIGNORE gesetzt ist.
Das Setzen von GLOBIGNORE hat jedoch den Effekt, dass die Shell-Option dotglob aktiviert wird, so dass alle anderen Dateinamen, die mit einem "." beginnen, übereinstimmen.
Um das alte Verhalten des Ignorierens von Dateinamen, die mit einem "." beginnen, zu erhalten, machen Sie ".*" zu einem der Muster in GLOBIGNORE. Die Option dotglob ist deaktiviert, wenn GLOBIGNORE nicht gesetzt ist.
Metazeichen und Globbing
Damit man beim Angeben von z. B. Dateinamen nicht alle Namen eintippen muss, sondern die Dateien auch alle oder nach bestimmten Kriterien auswählen kann, gibt es Metazeichen (Jokerzeichen, Wildcards).
Metazeichen sind Zeichen mit erweiterter Bedeutung
Expansion von Dateinamen
Im Gegensatz zu anderen Systemen (z. B. Windows) werden Metazeichen von der Shell durch alle passenden Dateinamen ersetzt, bevor sie die Befehlszeile ausführt. Dies führt zu einem für Windows-Anwender ungewohntem Verhalten.
Metazeichen werden von der Shell ersetzt
Vorteile* liegt darin, dass, dass nahezu jedes UNIX-Kommando als Dateiangabe eine beliebige Menge von Dateien als Parameter haben kann.
- So sind in Programmen keine Systemaufrufe nötig, die auf die Verzeichnisinformation zugreifen; es wird lediglich eine Schleife benötigt, welche die einzelnen Dateien nacheinander bearbeitet.
Praktisches Globbing
Ganz schlecht
chmod a+r witzig1.jpg chmod a+r witzig2.jpg chmod a+r witzig3.jpg
Besser
chmod a+r witzig1.jpg witzig2.jpg witzig3.jpg
Super
chmod a+r *.jpg
Es gibt folgende Metazeichen
* | Der Stern steht für eine beliebige Zeichenfolge - oder für überhaupt kein Zeichen.
"ab*" steht für alle Dateinamen, die mit "ab" anfangen, auch für "ab" selbst ("ab", "abc", "abcd", "abxyz", usw.). |
? | Das Fragezeichen steht für genau ein beliebiges Zeichen. Zum Beispiel
"?bc" steht für alle Dateinamen mit 3 Zeichen, die auf "bc" enden ("abc", "bbc", "1bc", "vbc", "xbc", usw.), nicht jedoch für "bc". |
[...] | Im einfachsten Fall steht es für genau ein Zeichen aus der Menge (bspw. "[aeiou]" für einen Vokal).
Diese Angabe kann negiert werden ("alle außer diese Zeichen"), indem das erste Zeichen nach [ ein ! oder ^ ist ("[!abc]" bzw. "[^abc]"). Anstatt einzelne Zeichen aufzuzählen, lassen sich Bereiche angeben ("[a-z]" meint alle Kleinbuchstaben). |
Wichtig!
Der * ist ein gefährliches Zeichen, Tippfehler könne zum Fiasko führen, wenn aus Versehen ein Leerzeichen zuviel getippt wird.
rm a* löscht beispielsweise alle Dateien, die mit "a" anfangen. rm a * löscht dagegen erst die Datei "a" und dann alle Dateien im Verzeichnis.
Zeichenbereiche
Außer grep und Regulären Ausdrücken, gibt es eine gute Auswahl an pattern matching, dass die Shell direkt durchführen kann, ohne dass dafür externe Programme eingesetzt werden müssen.
Bekannt sind sicherlich das Sternchen (asterisk) „*“ und das Fragezeichen (question mark) „?“, die jede Zeichenkette oder jeden Buchstaben filtern. Um diese Sonderzeichen als Literale zu filtern müssen sie maskiert werden:
touch "*" ls "*" *
But you can also use the square braces to match any enclosed character or range of characters, if pairs of characters are separated by a hyphen. An example:
ls -ld [a-cx-z]* drwxr-xr-x 2 dirkwagner dirkwagner 4096 Jul 20 2002 app-defaults/ drwxrwxr-x 4 dirkwagner dirkwagner 4096 May 25 2002 arabic/ drwxrwxr-x 2 dirkwagner dirkwagner 4096 Mar 4 18:30 bin/ drwxr-xr-x 7 dirkwagner dirkwagner 4096 Sep 2 2001 crossover/ drwxrwxr-x 3 dirkwagner dirkwagner 4096 Mar 22 2002 xml/
This lists all files in dirkwagner's home directory, starting with "a", "b", "c", "x", "y" or "z".
If the first character within the braces is "!" or "^", any character not enclosed will be matched.
To match the dash ("-"), include it as the first or last character in the set.
The sorting depends on the current locale and of the value of the LC_COLLATE variable, if it is set.
Mind that other locales might interpret "[a-cx-z]" as "[aBbCcXxYyZz]" if sorting is done in dictionary order.
If you want to be sure to have the traditional interpretation of ranges, force this behavior by setting LC_COLLATE or LC_ALL to "C".
Nullglob
Ohne Match wird das Argument unverändert übernommen. Dieses Verhalten lässt sich mit der Shelloption nullglob beeinflussen.
Match - gefundene Dateien werden übernommen
echo a1*.jpg a1.jpg a10.jpg a11.jpg
Kein Match - Argument bleibt unverändert
echo b1*.jpg b1*.jpg
Dotfiles
Der Punkt am Anfang von Dateinamen stellt eine Ausnahme dar, er muss explizit angegeben werden (wegen der Verzeichnisreferenzen "." bzw. ".." und der Tatsache, dass Dateien, die mit einem Punkt beginnen, normalerweise nicht angezeigt werden). * Dateien, die mit "." beginnen sind versteckt
- Shell Globbing ignoriert die "Dotfiles"
- Punkt muss explizit genannt werden
echo .* . .. .bash_history .bash_profile .bashrc
Globbing und Brace Expansion
Brace Expansion hat starke Ähnlichkeit mit Globbing doch die angegebenen Dateinamen müssen nicht existieren.
ls a1.jpg a10.jpg a11.jpg a2.jpg a3.jpg a4.jpg
"{name1,name2}" - Alternativen aufzählen
echo a{2,10}.jpg a2.jpg a10.jpg
Zeichenklassen
Zeichenklassen können mit folgender Syntax in eckigen Klammen angegeben [:CLASS:]. Dabei wird CLASS nach POSIX-Standard angegeben und kann folgende Werte annehmen:
"alnum", "alpha", "ascii", "blank", "cntrl", "digit", "graph", "lower", "print", "punct", "space", "upper", "word" or "xdigit"
ls -ld digit:* drwxrwxr-x 2 dirkwagner dirkwagner 4096 Apr 20 13:45 2/
ls -ld upper:* drwxrwxr-- 3 dirkwagner dirkwagner 4096 Sep 30 2001 Nautilus/ drwxrwxr-x 4 dirkwagner dirkwagner 4096 Jul 11 2002 OpenOffice.org1.0/ -rw-rw-r-- 1 dirkwagner dirkwagner 997376 Apr 18 15:39 Schedule.sdc
Wenn die Shell-Option extglob aktiviert ist, werden erweiterte pattern matching Operatoren erkannt.
Extglob (erweitertes Globbing)
Die ksh88 führte zusätzlich die erweiterte Mustererkennung ein. Diese sind vergleichbar mit der Leistung Regulärer Ausdrücke, die Notation ist ähnlich, aber nicht gleich. Wenn die Shelloption extglob eingeschaltet ist, unterstützt auch die Bash diese Optionen.
Wenn möglich, sollte die erweiterte Mustererkennung regulären Ausdrücken vorgezogen werden, da diese effizienter und damit deutlich schneller ausgewertet werden können. Die Muster sind eine Liste von Zeichenketten, die durch | getrennt sind.
Das Zeichen vor der öffnenden Klammer reguliert die Auswertung des Musters:
?(Muster-Liste) | Kein oder ein Auftreten eines Musters |
*(Muster-Liste) | Kein oder mehrere Auftreten eines Musters |
+(Muster-Liste) | Ein oder mehrere Auftreten eines Musters |
@(Muster-Liste) | Genau ein Auftreten eines Musters |
!(Muster-Liste) | Alle außer den angegebenen Mustern |
Die erweiterte Mustererkennung kann mit Standard-Shell-Wildcards kombiniert und verschachtelt werden.