Zum Inhalt springen

RegEx/Anwendungen: Unterschied zwischen den Versionen

Aus Foxwiki
 
(46 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
'''RegEx/Anwendungen''' - Beispiele
==  Einfache Ausdrücke ==
{| class="wikitable sortable options"
{| class="wikitable sortable options"
|-
|  | Haus
|  | Die Zeichenfolge "Haus"
|-
|  | ^Haus
|  | "Haus" am Zeilenanfang
|-
|  | Haus$
|  | "Haus" am Zeilenende
|-
|  | ^Haus$
|  | "Haus" als einziges Wort in einer Zeile
|-
|  | [Hh]aus
|  | "Haus" oder "haus"
|-
|  | Ha[unl]s
|  | "Haus", "Hals" oder "Hans"
|-
|  | [^HML]aus
|  | Weder "Haus", noch "Maus", noch "Laus", dafür aber andere Zeichenfolgen, welche "aus" enthalten
|-
|  | Ha.s
|  | Der dritte Buchstabe ist ein beliebiges Zeichen
|-
|  | ^...$
|  | Jede Zeile mit genau drei Zeichen
|-
|  | ^\.
|  | Jede Zeile, die mit einem Punkt beginnt
|-
|  | ^\.[a-z][a-z]
|  | Jede Zeile, die mit einem Punkt und zwei Kleinbuchstaben beginnt
|-
|  | ^\.[a-z]\{2\}
|  | Wie oben, jedoch nur in grep und sed zulässig
|-
|  | ^[^.]
|  | Jede Zeile, die nicht mit einem Punkt beginnt
|-
|  | Fehler*
|  | "Fehle"(!), "Fehler", "Fehlers", etc
|-
|  | "Wort"
|  | Ein Wort in Anführunszeichen
|-
|  | "*Wort"*
|  | Ein Wort mit beliebig vielen (auch keinen) Anführungszeichen
|-
|  | [A-Z][A-Z]*
|  | Ein oder mehrere Großbuchstaben.
|-
|  | [A-Z]+
|  | Wie oben, jedoch nur in egrep und awk zulässig
|-
|  | [A-Z].*
|  | Ein Großbuchstabe, gefolgt von keinem oder beliebig vielen Zeichen
|-
|  | [A-Z]*
|  | Kein, ein oder mehrere Großbuchstaben
|-
|  | [a-zA-Z]
|  | Ein Buchstabe
|-
|  | [^0-9a-zA-Z]
|  | Symbole (weder Buchstaben noch Zahlen)
|-
|  | [0-9a-zA-Z]
|  | Jedes alphanumerische Zeichen
|-
|}
== Beispiele ==
{| class="wikitable sortable options gnu"
|-
|-
! Aufgabe !! Suchen !! Ersetzen !! Beschreibung
! Aufgabe !! Suchen !! Ersetzen !! Beschreibung
|-
| Absätze zusammenführen || ([a-zäüöß,-])\n([a-zäüöß]) || \1 \2||
|-
|-
| Absätze aufbrechen || \. ([a-zA-Z])  || . \n\* \1||  
| Absätze aufbrechen || \. ([a-zA-Z])  || . \n\* \1||  
|-
|-
| Absätze zusammenführen || ([a-zäüöß,.-])\n([a-zäüöß]) || \1 \2||
| Leerzeilen in Aufzählungen  || \n\n([a-z]) || \n* \1||
|-
|-
| Leerzeilen in Aufzählungen entfernen || \n\n([a-z]) || \n* \1||
| Alleinstehende Aufzählungspunkte || ^\* $  ||||
|-
| Alleinstehende Aufzählungspunkte entfernen || ^\* $  ||||
|-
|-
| Leere Absätze löschen || \n\n\n  || \n\n||
| Leere Absätze löschen || \n\n\n  || \n\n||
|-
|-
| Zeilenwechsel nach Überschriften entfernen || =\n\n  || =\n||
| Zeilenwechsel nach Überschriften || =\n\n  || =\n||
|-
|-
| style-Attribute entfernen || style=".*;" ||||
| style-Attribute || style=".*;" ||||
|-
|-
| HTML-Kontainer || \<div.*\>(.*)\</div\> || \1||
| HTML-Kontainer || \<div.*\>(.*)\</div\> || \1||
Zeile 27: Zeile 104:
| HTML-br || <nowiki>\<br/\></nowiki> || \n||
| HTML-br || <nowiki>\<br/\></nowiki> || \n||
|-
|-
| Anker entfernen || \{\{Anker.*\}\}  ||||
| Anker || \{\{anchor.*\}\}  ||||
|-
| Anker || \{\{anker.*\}\}  ||||
|-
| Referenzen  || \<ref\>.*\</ref\> ||||
|-
|-
| Referenzen entfernen || \<ref\>.*\</ref\> ||||
| Referenzen || <nowiki><ref name=.*</ref></nowiki> ||||
|-
|-
| Referenzen entfernen || <nowiki><ref name=.*</ref></nowiki> ||||
| Referenzen || <nowiki><ref name=.*/></nowiki> ||||
|-
|-
| Tabelle formatieren || <nowiki>\{\|</nowiki>  || <nowiki>{| class="wikitable sortable options"</nowiki>||
| Tabelle formatieren || <nowiki>\{\|</nowiki>  || <nowiki>{| class="wikitable sortable options"</nowiki>||
|-
|-
| Non Braking Spaces entfernen || &amp;nbsp; ||||
| Non Braking Spaces || &amp;nbsp; ||||
|-
|-
| Images entfernen || \[\[Image:.*\]\]  || ''||
| Images || \[\[Image:.*\]\]  || ''||
|-
|-
| Images durch alt-Text ersetzen || \[\[Image:.*\|alt="(.*)"\]\]  || \1||
| Images durch alt-Text ersetzen || \[\[Image:.*\|alt="(.*)"\]\]  || \1||
|-
|-
| Führende Leerzeichen entfernen || ^ * || ''||
| Führende Leerzeichen || ^ * || ''||
|-
|-
| Manpage Überschriften formatieren || ^(<nowiki>[[:upper:]]</nowiki>{2,}[ /_]?[[:upper:] ]*)$ || <nowiki>== \1 ==</nowiki>||
| Manpage Überschriften in Wiki-Überschriften || ^(<nowiki>[[:upper:]]</nowiki>{2,}[ /_]?[[:upper:] ]*)$ || <nowiki>== \1 ==</nowiki>||
|-
|-
| Manpage Optionen in erste Tabellenzelle || <nowiki>(^-[A-Za-z0-9] ?[A-Za-z_\[\]:]*)</nowiki> || | \1||
| Manpage Optionen in erste Tabellenzelle || <nowiki>(^-[A-Za-z0-9] ?[A-Za-z_\[\]:]*)</nowiki> || | \1||
Zeile 51: Zeile 132:
| Wikitable Spalten tauschen (Erste/Zweite) || <nowiki>(.*) \|\|(.*)$</nowiki> || <nowiki> |\2 |\1 </nowiki>||
| Wikitable Spalten tauschen (Erste/Zweite) || <nowiki>(.*) \|\|(.*)$</nowiki> || <nowiki> |\2 |\1 </nowiki>||
|-
|-
| Führende Nummern in Wiki-Überschriften entfernen || <nowiki>= ([0-9]*\.)* ([A-Z]){1}</nowiki> || <nowiki>= \2</nowiki>||
| Führende Nummern in Wiki-Überschriften || <nowiki>= ([0-9]*\.)* ([A-Z]){1}</nowiki> || <nowiki>= \2</nowiki>||
|-
|-
| Leerzeichen am Zeilenende ersetzen || <nowiki>( $)</nowiki> ||||
| Leerzeichen am Zeilenende ersetzen || <nowiki>( $)</nowiki> ||||
|-
| Optionen in Wiki-Spalten || <nowiki> ^-(.*), --(.*)\n </nowiki> || <nowiki> |-\n| -\1 || --\2 ||  </nowiki>
|}
|}


Zeile 59: Zeile 142:
{| class="wikitable sortable"
{| class="wikitable sortable"
|-
|-
! Gruppe !! Suchen !! Ersetzen
! Suchen !! Ersetzen
|-
|-
| Abkürzungen || bzw\. || beziehungsweise
| bzw\. || beziehungsweise
|-
|-
| Abkürzungen || u\.U\. ||  gegebenenfalls
| u\.U\. ||  gegebenenfalls
|-
|-
| Abkürzungen || d\.h\. || das bedeutet,
| d\.h\. || das bedeutet,
|-
|-
| Abkürzungen || z\.B\. || etwa
| z\.B\. || etwa
|-
|-
| Abkürzungen || <nowiki>z\.&amp;nbsp;B\.</nowiki> || etwa
| <nowiki>z\.&amp;nbsp;B\.</nowiki> || etwa
|-
|-
| Abkürzungen || u\.a\. || unter anderem
| u\.a\. || unter anderem
|-
|-
| Abkürzungen || ggf\. || gegebenenfalls
| ggf\. || gegebenenfalls
|-
|-
| Abkürzungen || usw\. || und so weiter  
| usw\. || und so weiter  
|}
|}


; Test
==  [[egrep]]/[[awk]] ==
{| class="wikitable sortable"
{| class="wikitable sortable options"
|-
| <nowiki>[567]</nowiki>
| Eine der Zahlen 5, 6 oder 7
|-
| <nowiki>fuenf|sechs|sieben</nowiki>
| Eines der Worte fünf, sechs oder sieben
|-
| <nowiki>80[234]?86></nowiki>
| "8086", "80286", "80386", "80486"  
|-
|-
! Aufgabe !! Suchen !! Ersetzen
|  <nowiki>F(ahr|lug)zeug</nowiki>
| "Fahrzeug" oder "Flugzeug"
|-
|-
| Optionen in Wiki-Spalten || <nowiki> ^-(.*), --(.*)\n </nowiki> || <nowiki> |-\n| -\1 || --\2 ||  </nowiki>
|}
|}


== Einfache Ausdrücke ==
== [[sed]]/[[grep]] ==
{| class="wikitable sortable options"
{| class="wikitable sortable options"
|-
|-
| | Haus
| <nowiki>0\{5,\}*</nowiki> || Fünf oder mehr Nullen in Folge
| | Die Zeichenfolge "Haus"
|-
|-
| | ^Haus
| <nowiki>[0-9]-[0-9]\{3\}-[0-9]\{5\}-[0-9X]*</nowiki> || ISBN-Nummern in der Form n-nnn-nnnnn-n, das letzte Zeichen kann auch ein X sein
| | "Haus" am Zeilenanfang
|}
 
== [[vim]] ==
{| class="wikitable sortable options"
|-
|-
| | Haus$
| \<The
| | "Haus" am Zeilenende
| Wörter wie "Theater" oder "Thema"  
|-
|-
| | ^Haus$
| ung\>
| | "Haus" als einziges Wort in einer Zeile
| Wörter wie "Teilung" oder "Endung"  
|-
|-
| | [Hh]aus
| \<Wort\>
| | "Haus" oder "haus"
| Das Wort "Wort"  
|-
|-
| Ha[unl]s
|  s/.*/( & )/
| | "Haus", "Hals" oder "Hans"
| Leerzeichen wurden durch _ Tabulatoren durch TAB eretzt. Ex-Befehle werden mit Doppelpunkt eingeleitet.
|-
|-
| | [^HML]aus
| s/.*/mv & &.old/
|  | Weder "Haus", noch "Maus", noch "Laus", dafür aber andere Zeichenfolgen, welche "aus" enthalten
| Wiederholt die ganze Zeile, fügt aber Klammern hinzu
|-
|  | Ha.s
|  | Der dritte Buchstabe ist ein beliebiges Zeichen
|-
|  | ^...$
| | Jede Zeile mit genau drei Zeichen
|-
|-
| | ^\.
| /^$/d
| | Jede Zeile, die mit einem Punkt beginnt
| Formt eine Wortliste (ein Wort pro Zeile) zu mv-Befehlen um
|-
|-
| | ^\.[a-z][a-z]
| /^[_TAB]*$/d
| | Jede Zeile, die mit einem Punkt und zwei Kleinbuchstaben beginnt
| Löscht Leerzeilen
|-
|-
| | ^\.[a-z]\{2\}
| / */ /g
| | Wie oben, jedoch nur in grep und sed zulässig
| Löscht Leerzeilen und Zeilen, die nur aus Leerzeichen oder Tabulatoren bestehen
|-
|-
| | ^[^.]
| :s/[0-9]/Element &:/
| | Jede Zeile, die nicht mit einem Punkt beginnt
| Wandelt ein oder mehrere Leerzeichen in ein Leerzeichen um
|-
|-
| | Fehler*
| :s
| | "Fehle"(!), "Fehler", "Fehlers", etc
| Wandelt (in der aktuellen Zeile) eine Zahl in ein Label für ein Element um
|-
|-
| | "Wort"
| :&
| | Ein Wort in Anführunszeichen
| Wiederholt die Substitution beim ersten Vorkommen
|-
|-
| | "*Wort"*
| :sg
| | Ein Wort mit beliebig vielen (auch keinen) Anführungszeichen
| Wie oben
|-
|-
| | [A-Z][A-Z]*
| :&g
| | Ein oder mehrere Großbuchstaben.
| Wie oben, aber für alle Vorkommen in einer Zeile
|-
|-
| | [A-Z]+
| :%&g
| Wie oben, jedoch nur in egrep und awk zulässig
| Wie oben  
|-
|-
| | [A-Z].*
| :.,$s/Wort/\U&/g
| | Ein Großbuchstabe, gefolgt von keinem oder beliebig vielen Zeichen
| Wiederholt die Substitution im ganzen Puffer
|-
|-
| | [A-Z]*
| :%s/.*/\L&/
| | Kein, ein oder mehrere Großbuchstaben
| Wandelt von der aktuellen bis zur letzten Zeile das Wort Wort in Großschreibung um
|-
|-
| | [a-zA-Z]
| :s/\<./\u&/g
| | Ein Buchstabe
| Wandelt die gesamte Datei in Kleinschreibung um
|-
|-
| | [^0-9a-zA-Z]
| :%s/ja/nein/g
| | Symbole (weder Buchstaben noch Zahlen)
| Wandelt den ersten Buchstaben jedes Wortes in der aktuellen Zeile in Großschreibung um
|-
|-
| | [0-9a-zA-Z]
| :%s/Ja/~/g
| | Jedes alphanumerische Zeichen
| Ersetzt das Wort ja durch nein. | Ersetzt global ein anderes Wort (Ja) durch nein (Wiederverwendung des vorherigen Ersatzmusters)
|-
|-
|}
|}
==  Beispiele für egrep- oder awk-Muster ==
[567]
* Eine der Zahlen 5, 6 oder 7
fuenf|sechs|sieben
* Eines der Worte fünf, sechs oder sieben
80[234]?86>
* "8086", "80286", "80386", "80486"
F(ahr|lug)zeug
* "Fahrzeug" oder "Flugzeug"
==  Beispiele für vi-Muster ==
\<The
* Wörter wie "Theater" oder "Thema"
ung\>
* Wörter wie "Teilung" oder "Endung"
\<Wort\>
* Das Wort "Wort"
==  Beispiele für sed- oder grep-Muster ==
0\{5,\}* Fünf oder mehr Nullen in Folge
[0-9]-[0-9]\{3\}-[0-9]\{5\}-[0-9X]* ISBN-Nummern in der Form n-nnn-nnnnn-n, das letzte Zeichen kann auch ein X sein
==  VIM-Beispiele ==
Leerzeichen wurden durch _ Tabulatoren durch TAB eretzt. Ex-Befehle werden mit Doppelpunkt eingeleitet.# <tt>'''s/.*/( & )/'''
Wiederholt die ganze Zeile, fügt aber Klammern hinzu
'''s/.*/mv & &.old/'''
Formt eine Wortliste (ein Wort pro Zeile) zu mv-Befehlen um
'''/^$/d'''
Löscht Leerzeilen
'''/^[_TAB]*$/d'''
Löscht Leerzeilen und Zeilen, die nur aus Leerzeichen oder Tabulatoren bestehen
'''/ */ /g'''
Wandelt ein oder mehrere Leerzeichen in ein Leerzeichen um
''':s/[0-9]/Element &:/'''
Wandelt (in der aktuellen Zeile) eine Zahl in ein Label für ein Element um
''':s'''
Wiederholt die Substitution beim ersten Vorkommen
''':&'''
Wie oben
''':sg'''
Wie oben, aber für alle Vorkommen in einer Zeile
''':&g'''
Wie oben
''':%&g'''
Wiederholt die Substitution im ganzen Puffer
''':.,$s/Wort/\U&/g'''
Wandelt von der aktuellen bis zur letzten Zeile das Wort Wort in Großschreibung um
''':%s/.*/\L&/'''
Wandelt die gesamte Datei in Kleinschreibung um
''':s/\<./\u&/g'''
Wandelt den ersten Buchstaben jedes Wortes in der aktuellen Zeile in Großschreibung um
''':%s/ja/nein/g'''
Ersetzt das Wort ja durch nein
''':%s/Ja/~/g'''
Ersetzt global ein anderes Wort (Ja) durch nein (Wiederverwendung des vorherigen Ersatzmusters)


[[Kategorie:Bash/Scripting]]
[[Kategorie:Bash/Scripting]]
[[Kategorie:Regular Expression]]
[[Kategorie:Regular Expression]]
[[Kategorie:MediaWiki]]
[[Kategorie:MediaWiki/Anleitung]]
[[Kategorie:MediaWiki/Vorlagen]]

Aktuelle Version vom 28. Januar 2025, 11:04 Uhr

RegEx/Anwendungen - Beispiele

Einfache Ausdrücke

Haus Die Zeichenfolge "Haus"
^Haus "Haus" am Zeilenanfang
Haus$ "Haus" am Zeilenende
^Haus$ "Haus" als einziges Wort in einer Zeile
[Hh]aus "Haus" oder "haus"
Ha[unl]s "Haus", "Hals" oder "Hans"
[^HML]aus Weder "Haus", noch "Maus", noch "Laus", dafür aber andere Zeichenfolgen, welche "aus" enthalten
Ha.s Der dritte Buchstabe ist ein beliebiges Zeichen
^...$ Jede Zeile mit genau drei Zeichen
^\. Jede Zeile, die mit einem Punkt beginnt
^\.[a-z][a-z] Jede Zeile, die mit einem Punkt und zwei Kleinbuchstaben beginnt
^\.[a-z]\{2\} Wie oben, jedoch nur in grep und sed zulässig
^[^.] Jede Zeile, die nicht mit einem Punkt beginnt
Fehler* "Fehle"(!), "Fehler", "Fehlers", etc
"Wort" Ein Wort in Anführunszeichen
"*Wort"* Ein Wort mit beliebig vielen (auch keinen) Anführungszeichen
[A-Z][A-Z]* Ein oder mehrere Großbuchstaben.
[A-Z]+ Wie oben, jedoch nur in egrep und awk zulässig
[A-Z].* Ein Großbuchstabe, gefolgt von keinem oder beliebig vielen Zeichen
[A-Z]* Kein, ein oder mehrere Großbuchstaben
[a-zA-Z] Ein Buchstabe
[^0-9a-zA-Z] Symbole (weder Buchstaben noch Zahlen)
[0-9a-zA-Z] Jedes alphanumerische Zeichen

Beispiele

Aufgabe Suchen Ersetzen Beschreibung
Absätze zusammenführen ([a-zäüöß,-])\n([a-zäüöß]) \1 \2
Absätze aufbrechen \. ([a-zA-Z]) . \n\* \1
Leerzeilen in Aufzählungen \n\n([a-z]) \n* \1
Alleinstehende Aufzählungspunkte ^\* $
Leere Absätze löschen \n\n\n \n\n
Zeilenwechsel nach Überschriften =\n\n =\n
style-Attribute style=".*;"
HTML-Kontainer \<div.*\>(.*)\</div\> \1
HTML-Kontainer \<tt\>(.*)\</tt\> \1
HTML-Kontainer \<span\>(.*)\</span\> \1
HTML-Kontainer \</*nowiki\>
HTML-br \<br/\> \n
Anker \{\{anchor.*\}\}
Anker \{\{anker.*\}\}
Referenzen \<ref\>.*\</ref\>
Referenzen <ref name=.*</ref>
Referenzen <ref name=.*/>
Tabelle formatieren \{\| {| class="wikitable sortable options"
Non Braking Spaces &nbsp;
Images \[\[Image:.*\]\]
Images durch alt-Text ersetzen alt="(.*)"\]\] \1
Führende Leerzeichen ^ *
Manpage Überschriften in Wiki-Überschriften ^([[:upper:]]{2,}[ /_]?[[:upper:] ]*)$ == \1 ==
Manpage Optionen in erste Tabellenzelle (^-[A-Za-z0-9] ?[A-Za-z_\[\]:]*) \1
TODOs auskommentieren ^^('''TODO: '''.*$) ^<!-- \1 -->
Wikitable Spalten tauschen (Erste/Zweite) (.*) \|\|(.*)$ |\2 |\1
Führende Nummern in Wiki-Überschriften = ([0-9]*\.)* ([A-Z]){1} = \2
Leerzeichen am Zeilenende ersetzen ( $)
Optionen in Wiki-Spalten ^-(.*), --(.*)\n |-\n| -\1 || --\2 ||
Abkürzungen
Suchen Ersetzen
bzw\. beziehungsweise
u\.U\. gegebenenfalls
d\.h\. das bedeutet,
z\.B\. etwa
z\.&nbsp;B\. etwa
u\.a\. unter anderem
ggf\. gegebenenfalls
usw\. und so weiter

egrep/awk

[567] Eine der Zahlen 5, 6 oder 7
fuenf|sechs|sieben Eines der Worte fünf, sechs oder sieben
80[234]?86> "8086", "80286", "80386", "80486"
F(ahr|lug)zeug "Fahrzeug" oder "Flugzeug"

sed/grep

0\{5,\}* Fünf oder mehr Nullen in Folge
[0-9]-[0-9]\{3\}-[0-9]\{5\}-[0-9X]* ISBN-Nummern in der Form n-nnn-nnnnn-n, das letzte Zeichen kann auch ein X sein

vim

\<The Wörter wie "Theater" oder "Thema"
ung\> Wörter wie "Teilung" oder "Endung"
\<Wort\> Das Wort "Wort"
s/.*/( & )/ Leerzeichen wurden durch _ Tabulatoren durch TAB eretzt. Ex-Befehle werden mit Doppelpunkt eingeleitet.
s/.*/mv & &.old/ Wiederholt die ganze Zeile, fügt aber Klammern hinzu
/^$/d Formt eine Wortliste (ein Wort pro Zeile) zu mv-Befehlen um
/^[_TAB]*$/d Löscht Leerzeilen
/ */ /g Löscht Leerzeilen und Zeilen, die nur aus Leerzeichen oder Tabulatoren bestehen
:s/[0-9]/Element &:/ Wandelt ein oder mehrere Leerzeichen in ein Leerzeichen um
:s Wandelt (in der aktuellen Zeile) eine Zahl in ein Label für ein Element um
:& Wiederholt die Substitution beim ersten Vorkommen
:sg Wie oben
:&g Wie oben, aber für alle Vorkommen in einer Zeile
:%&g Wie oben
:.,$s/Wort/\U&/g Wiederholt die Substitution im ganzen Puffer
:%s/.*/\L&/ Wandelt von der aktuellen bis zur letzten Zeile das Wort Wort in Großschreibung um
:s/\<./\u&/g Wandelt die gesamte Datei in Kleinschreibung um
:%s/ja/nein/g Wandelt den ersten Buchstaben jedes Wortes in der aktuellen Zeile in Großschreibung um
:%s/Ja/~/g Ersetzt global ein anderes Wort (Ja) durch nein (Wiederverwendung des vorherigen Ersatzmusters)