RegEx/Anwendungen: Unterschied zwischen den Versionen

Aus Foxwiki
Keine Bearbeitungszusammenfassung
K Textersetzung - „Kategorie:RegEx“ durch „Kategorie:Regular Expression“
 
(38 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
== Regular Expressions ==
; Aufgaben
=== Beispiele ===
{| class="wikitable sortable options"
{| class="wikitable sortable options"
|-
|-
Zeile 5: Zeile 9:
| Absätze aufbrechen || \. ([a-zA-Z])  || . \n\* \1||  
| Absätze aufbrechen || \. ([a-zA-Z])  || . \n\* \1||  
|-
|-
| Leerzeilen in Aufzählungen entfernen || \n\n([a-z]) || \n* \1||
| Absätze zusammenführen || ([a-zäüöß,-])\n([a-zäüöß]) || \1 \2||
|-
|-
| Alleinstehende Aufzählungspunkte entfernen || ^\* $  ||||
| Leerzeilen in Aufzählungen  || \n\n([a-z]) || \n* \1||
|-
| Alleinstehende Aufzählungspunkte || ^\* $  ||||
|-
|-
| Leere Absätze löschen || \n\n\n  || \n\n||
| Leere Absätze löschen || \n\n\n  || \n\n||
|-
|-
| Zeilenwechsel nach Überschriften entfernen || =\n\n  || =\n||
| Zeilenwechsel nach Überschriften || =\n\n  || =\n||
|-
|-
| style-Attribute entfernen || style=".*;" ||||
| style-Attribute || style=".*;" ||||
|-
|-
| HTML-Kontainer || \<div.*\>(.*)\</div\> || \1||
| HTML-Kontainer || \<div.*\>(.*)\</div\> || \1||
Zeile 25: Zeile 31:
| HTML-br || <nowiki>\<br/\></nowiki> || \n||
| HTML-br || <nowiki>\<br/\></nowiki> || \n||
|-
|-
| Anker entfernen || \{\{.*\}\} ||||
| Anker || \{\{anchor.*\}\}   ||||
|-
|-
| Referenzen entfernen || \<ref\>.*\</ref\> ||||
| Anker  || \{\{anker.*\}\||||
|-
|-
| Referenzen entfernen || <nowiki><ref name=".*" /></nowiki> ||||
| Referenzen || \<ref\>.*\</ref\> ||||
|-
|-
| Tabelle formatieren || <nowiki>\{\|</nowiki> || <nowiki>\{\| class="wikitable sortable options"</nowiki>||
| Referenzen  || <nowiki><ref name=.*</ref></nowiki> ||||
|-
|-
| Non Braking Spaces entfernen || &amp;nbsp; ||||
| Referenzen  || <nowiki><ref name=.*/></nowiki> ||||
|-
|-
| Images entfernen || \[\[Image:.*\]\]  || ''||
| Tabelle formatieren || <nowiki>\{\|</nowiki>  || <nowiki>{| class="wikitable sortable options"</nowiki>||
|-
| Non Braking Spaces  || &amp;nbsp; ||||
|-
| Images || \[\[Image:.*\]\]  || ''||
|-
|-
| Images durch alt-Text ersetzen || \[\[Image:.*\|alt="(.*)"\]\]  || \1||
| Images durch alt-Text ersetzen || \[\[Image:.*\|alt="(.*)"\]\]  || \1||
|-
|-
| Führende Leerzeichen entfernen || ^ * || ''||
| Führende Leerzeichen || ^ * || ''||
|-
|-
| Absätze zusammenführen || ([a-zäüöß,--])\n([a-zäüöß]) || \1 \2||
| Manpage Überschriften in Wiki-Überschriften  || ^(<nowiki>[[:upper:]]</nowiki>{2,}[ /_]?[[:upper:] ]*)$ || <nowiki>== \1 ==</nowiki>||
|-
| Manpage Überschriften formatieren || ^(<nowiki>[[:upper:]]</nowiki>{2,}[ /_]?[[:upper:] ]*)$ || <nowiki>== \1 ==</nowiki>||
|-
|-
| Manpage Optionen in erste Tabellenzelle || <nowiki>(^-[A-Za-z0-9] ?[A-Za-z_\[\]:]*)</nowiki> || | \1||
| Manpage Optionen in erste Tabellenzelle || <nowiki>(^-[A-Za-z0-9] ?[A-Za-z_\[\]:]*)</nowiki> || | \1||
Zeile 49: Zeile 57:
| TODOs auskommentieren ||  <nowiki>^^('''TODO: '''.*$)</nowiki> ||  <nowiki> ^<!-- \1 --> </nowiki>||
| TODOs auskommentieren ||  <nowiki>^^('''TODO: '''.*$)</nowiki> ||  <nowiki> ^<!-- \1 --> </nowiki>||
|-
|-
| Spalten tauschen (Erste/Zweite) || <nowiki>(.*) \|\|(.*)$</nowiki> || <nowiki> |\2 |\1 </nowiki>||
| Wikitable Spalten tauschen (Erste/Zweite) || <nowiki>(.*) \|\|(.*)$</nowiki> || <nowiki> |\2 |\1 </nowiki>||
|-
|-
| Führende Nummern in Wiki-Überschriften entfernen || <nowiki>= ([0-9]*\.)* ([A-Z]){1}</nowiki> || <nowiki>= \2</nowiki>||
| Führende Nummern in Wiki-Überschriften || <nowiki>= ([0-9]*\.)* ([A-Z]){1}</nowiki> || <nowiki>= \2</nowiki>||
|-
|-
| Leerzeichen am Zeilenende ersetzen || <nowiki> ([^ ]) $ </nowiki> || \1 ||
| Leerzeichen am Zeilenende ersetzen || <nowiki>( $)</nowiki> ||||
|}
|}


Zeile 59: Zeile 67:
{| class="wikitable sortable"
{| class="wikitable sortable"
|-
|-
! Gruppe !! Suchen !! Ersetzen
! Suchen !! Ersetzen
|-
|-
| Abkürzungen || bzw\. || beziehungsweise
| bzw\. || beziehungsweise
|-
|-
| Abkürzungen || u\.U\. ||  gegebenenfalls
| u\.U\. ||  gegebenenfalls
|-
|-
| Abkürzungen || d\.h\. || das bedeutet,
| d\.h\. || das bedeutet,
|-
|-
| Abkürzungen || z\.B\. || etwa
| z\.B\. || etwa
|-
|-
| Abkürzungen || <nowiki>z\.&amp;nbsp;B\.</nowiki> || etwa
| <nowiki>z\.&amp;nbsp;B\.</nowiki> || etwa
|-
|-
| Abkürzungen || u\.a\. || unter anderem
| u\.a\. || unter anderem
|-
|-
| Abkürzungen || ggf\. || gegebenenfalls
| ggf\. || gegebenenfalls
|-
|-
| Abkürzungen || usw\. || und so weiter  
| usw\. || und so weiter  
|}
|}


Zeile 83: Zeile 91:
! Aufgabe !! Suchen !! Ersetzen
! Aufgabe !! Suchen !! Ersetzen
|-
|-
| TEST || <nowiki> ^-(.*), --(.*)\n </nowiki> || <nowiki> | -\1 || --\2 </nowiki>
| Optionen in Wiki-Spalten || <nowiki> ^-(.*), --(.*)\n </nowiki> || <nowiki> |-\n| -\1 || --\2 ||  </nowiki>
|}
|}


==  Einfache Übungen ==
==  Einfache Ausdrücke ==
{| class="wikitable sortable"
{| class="wikitable sortable options"
|-
|-
|  | #
|  | Haus
 
|  | <tt>'''Haus'''</tt>
|  | Die Zeichenfolge "Haus"
|  | Die Zeichenfolge "Haus"
|-
|-
|  | #
|  | ^Haus
 
|  | <tt>'''^Haus'''</tt>
|  | "Haus" am Zeilenanfang
|  | "Haus" am Zeilenanfang
|-
|-
|  | #
|  | Haus$
 
|  | <tt>'''Haus$'''</tt>
|  | "Haus" am Zeilenende
|  | "Haus" am Zeilenende
|-
|-
|  | #
|  | ^Haus$
 
|  | <tt>'''^Haus$'''</tt>
|  | "Haus" als einziges Wort in einer Zeile
|  | "Haus" als einziges Wort in einer Zeile
|-
|-
|  | #
|  | [Hh]aus
 
|  | <tt>'''[Hh]aus'''</tt>
|  | "Haus" oder "haus"
|  | "Haus" oder "haus"
|-
|-
|  | #
|  | Ha[unl]s
 
|  | <tt>'''Ha[unl]s'''</tt>
|  | "Haus", "Hals" oder "Hans"
|  | "Haus", "Hals" oder "Hans"
|-
|-
|  | #
|  | [^HML]aus
 
|  | <tt>'''[^HML]aus'''</tt>
|  | Weder "Haus", noch "Maus", noch "Laus", dafür aber andere Zeichenfolgen, welche "aus" enthalten
|  | Weder "Haus", noch "Maus", noch "Laus", dafür aber andere Zeichenfolgen, welche "aus" enthalten
|-
|-
|  | #
|  | Ha.s
 
|  | <tt>'''Ha.s'''</tt>
|  | Der dritte Buchstabe ist ein beliebiges Zeichen
|  | Der dritte Buchstabe ist ein beliebiges Zeichen
|-
|-
|  | #
|  | ^...$
 
|  | <tt>'''^...$'''</tt>
|  | Jede Zeile mit genau drei Zeichen
|  | Jede Zeile mit genau drei Zeichen
|-
|-
|  | #
|  | ^\.
 
|  | <tt>'''^\.'''</tt>
|  | Jede Zeile, die mit einem Punkt beginnt
|  | Jede Zeile, die mit einem Punkt beginnt
|-
|-
|  | #
|  | ^\.[a-z][a-z]
 
|  | <tt>'''^\.[a-z][a-z]'''</tt>
|  | Jede Zeile, die mit einem Punkt und zwei Kleinbuchstaben beginnt
|  | Jede Zeile, die mit einem Punkt und zwei Kleinbuchstaben beginnt
|-
|-
|  | #
|  | ^\.[a-z]\{2\}
 
|  | <tt>'''^\.[a-z]\{2\}'''</tt>
|  | Wie oben, jedoch nur in grep und sed zulässig
|  | Wie oben, jedoch nur in grep und sed zulässig
|-
|-
|  | #
|  | ^[^.]
 
|  | <tt>'''^[^.]'''</tt>
|  | Jede Zeile, die nicht mit einem Punkt beginnt
|  | Jede Zeile, die nicht mit einem Punkt beginnt
|-
|-
|  | #
|  | Fehler*
 
|  | <tt>'''Fehler*'''</tt>
|  | "Fehle"(!), "Fehler", "Fehlers", etc
|  | "Fehle"(!), "Fehler", "Fehlers", etc
|-
|-
|  | #
|  | "Wort"
 
|  | <tt>'''"Wort"'''</tt>
|  | Ein Wort in Anführunszeichen
|  | Ein Wort in Anführunszeichen
|-
|-
|  | #
|  | "*Wort"*
 
|  | <tt>'''"*Wort"*'''</tt>
|  | Ein Wort mit beliebig vielen (auch keinen) Anführungszeichen
|  | Ein Wort mit beliebig vielen (auch keinen) Anführungszeichen
|-
|-
|  | #
|  | [A-Z][A-Z]*
 
|  | <tt>'''[A-Z][A-Z]*'''</tt>
|  | Ein oder mehrere Großbuchstaben.
|  | Ein oder mehrere Großbuchstaben.
|-
|-
|  | #
|  | [A-Z]+
 
|  | <tt>'''[A-Z]+'''</tt>
|  | Wie oben, jedoch nur in egrep und awk zulässig
|  | Wie oben, jedoch nur in egrep und awk zulässig
|-
|-
|  | #
|  | [A-Z].*
 
|  | <tt>'''[A-Z].*'''</tt>
|  | Ein Großbuchstabe, gefolgt von keinem oder beliebig vielen Zeichen
|  | Ein Großbuchstabe, gefolgt von keinem oder beliebig vielen Zeichen
|-
|-
|  | #
|  | [A-Z]*
 
|  | <tt>'''[A-Z]*'''</tt>
|  | Kein, ein oder mehrere Großbuchstaben
|  | Kein, ein oder mehrere Großbuchstaben
|-
|-
|  | #
|  | [a-zA-Z]
 
|  | <tt>'''[a-zA-Z]'''</tt>
|  | Ein Buchstabe
|  | Ein Buchstabe
|-
|-
|  | #
|  | [^0-9a-zA-Z]
 
|  | <tt>'''[^0-9a-zA-Z]'''</tt>
|  | Symbole (weder Buchstaben noch Zahlen)
|  | Symbole (weder Buchstaben noch Zahlen)
|-
|-
|  | #
|  | [0-9a-zA-Z]
 
|  | <tt>'''[0-9a-zA-Z]'''</tt>
|  | Jedes alphanumerische Zeichen
|  | Jedes alphanumerische Zeichen
|-
|-
|}
|}
==  Beispiele für egrep- oder awk-Muster ==
[567] * Eine der Zahlen 5, 6 oder 7


  fuenf|sechs|sieben * Eines der Worte fünf, sechs oder sieben
== egrep- oder awk-Muster ==
Eine der Zahlen 5, 6 oder 7
[567]


  80[234]?86> * "8086", "80286", "80386", "80486"
Eines der Worte fünf, sechs oder sieben
  fuenf|sechs|sieben


F(ahr|lug)zeug * "Fahrzeug" oder "Flugzeug"
"8086", "80286", "80386", "80486"
80[234]?86>


==  Beispiele für vi-Muster ==
"Fahrzeug" oder "Flugzeug"
\<The * Wörter wie "Theater" oder "Thema"
F(ahr|lug)zeug


ung\> * Wörter wie "Teilung" oder "Endung"
== sed- oder grep-Muster ==
 
\<Wort\> * Das Wort "Wort"
 
== Beispiele für sed- oder grep-Muster ==
  0\{5,\}* Fünf oder mehr Nullen in Folge
  0\{5,\}* Fünf oder mehr Nullen in Folge


Zeile 228: Zeile 187:


==  VIM-Beispiele ==
==  VIM-Beispiele ==
Leerzeichen wurden durch _ Tabulatoren durch TAB eretzt. Ex-Befehle werden mit Doppelpunkt eingeleitet.# <tt>'''s/.*/( & )/'''
\<The
* Wörter wie "Theater" oder "Thema"
 
ung\>
* Wörter wie "Teilung" oder "Endung"
 
\<Wort\>
* Das Wort "Wort"
 
Leerzeichen wurden durch _ Tabulatoren durch TAB eretzt. Ex-Befehle werden mit Doppelpunkt eingeleitet.
'''s/.*/( & )/'''


Wiederholt die ganze Zeile, fügt aber Klammern hinzu
Wiederholt die ganze Zeile, fügt aber Klammern hinzu
Zeile 279: Zeile 248:
[[Kategorie:Bash/Scripting]]
[[Kategorie:Bash/Scripting]]
[[Kategorie:Regular Expression]]
[[Kategorie:Regular Expression]]
[[Kategorie:Linux/Dateien]]
[[Kategorie:MediaWiki/Anleitung]]
[[Kategorie:IT-Grundlagen]]
[[Kategorie:MediaWiki/Vorlagen]]
[[Kategorie:MediaWiki]]

Aktuelle Version vom 15. Oktober 2024, 10:57 Uhr

Regular Expressions

Aufgaben

Beispiele

Aufgabe Suchen Ersetzen Beschreibung
Absätze aufbrechen \. ([a-zA-Z]) . \n\* \1
Absätze zusammenführen ([a-zäüöß,-])\n([a-zäüöß]) \1 \2
Leerzeilen in Aufzählungen \n\n([a-z]) \n* \1
Alleinstehende Aufzählungspunkte ^\* $
Leere Absätze löschen \n\n\n \n\n
Zeilenwechsel nach Überschriften =\n\n =\n
style-Attribute style=".*;"
HTML-Kontainer \<div.*\>(.*)\</div\> \1
HTML-Kontainer \<tt\>(.*)\</tt\> \1
HTML-Kontainer \<span\>(.*)\</span\> \1
HTML-Kontainer \</*nowiki\>
HTML-br \<br/\> \n
Anker \{\{anchor.*\}\}
Anker \{\{anker.*\}\}
Referenzen \<ref\>.*\</ref\>
Referenzen <ref name=.*</ref>
Referenzen <ref name=.*/>
Tabelle formatieren \{\| {| class="wikitable sortable options"
Non Braking Spaces &nbsp;
Images \[\[Image:.*\]\]
Images durch alt-Text ersetzen alt="(.*)"\]\] \1
Führende Leerzeichen ^ *
Manpage Überschriften in Wiki-Überschriften ^([[:upper:]]{2,}[ /_]?[[:upper:] ]*)$ == \1 ==
Manpage Optionen in erste Tabellenzelle (^-[A-Za-z0-9] ?[A-Za-z_\[\]:]*) \1
TODOs auskommentieren ^^('''TODO: '''.*$) ^<!-- \1 -->
Wikitable Spalten tauschen (Erste/Zweite) (.*) \|\|(.*)$ |\2 |\1
Führende Nummern in Wiki-Überschriften = ([0-9]*\.)* ([A-Z]){1} = \2
Leerzeichen am Zeilenende ersetzen ( $)
Abkürzungen
Suchen Ersetzen
bzw\. beziehungsweise
u\.U\. gegebenenfalls
d\.h\. das bedeutet,
z\.B\. etwa
z\.&nbsp;B\. etwa
u\.a\. unter anderem
ggf\. gegebenenfalls
usw\. und so weiter
Test
Aufgabe Suchen Ersetzen
Optionen in Wiki-Spalten ^-(.*), --(.*)\n |-\n| -\1 || --\2 ||

Einfache Ausdrücke

Haus Die Zeichenfolge "Haus"
^Haus "Haus" am Zeilenanfang
Haus$ "Haus" am Zeilenende
^Haus$ "Haus" als einziges Wort in einer Zeile
[Hh]aus "Haus" oder "haus"
Ha[unl]s "Haus", "Hals" oder "Hans"
[^HML]aus Weder "Haus", noch "Maus", noch "Laus", dafür aber andere Zeichenfolgen, welche "aus" enthalten
Ha.s Der dritte Buchstabe ist ein beliebiges Zeichen
^...$ Jede Zeile mit genau drei Zeichen
^\. Jede Zeile, die mit einem Punkt beginnt
^\.[a-z][a-z] Jede Zeile, die mit einem Punkt und zwei Kleinbuchstaben beginnt
^\.[a-z]\{2\} Wie oben, jedoch nur in grep und sed zulässig
^[^.] Jede Zeile, die nicht mit einem Punkt beginnt
Fehler* "Fehle"(!), "Fehler", "Fehlers", etc
"Wort" Ein Wort in Anführunszeichen
"*Wort"* Ein Wort mit beliebig vielen (auch keinen) Anführungszeichen
[A-Z][A-Z]* Ein oder mehrere Großbuchstaben.
[A-Z]+ Wie oben, jedoch nur in egrep und awk zulässig
[A-Z].* Ein Großbuchstabe, gefolgt von keinem oder beliebig vielen Zeichen
[A-Z]* Kein, ein oder mehrere Großbuchstaben
[a-zA-Z] Ein Buchstabe
[^0-9a-zA-Z] Symbole (weder Buchstaben noch Zahlen)
[0-9a-zA-Z] Jedes alphanumerische Zeichen

egrep- oder awk-Muster

Eine der Zahlen 5, 6 oder 7

[567]

Eines der Worte fünf, sechs oder sieben

fuenf|sechs|sieben 

"8086", "80286", "80386", "80486"

80[234]?86> 

"Fahrzeug" oder "Flugzeug"

F(ahr|lug)zeug

sed- oder grep-Muster

0\{5,\}* Fünf oder mehr Nullen in Folge
[0-9]-[0-9]\{3\}-[0-9]\{5\}-[0-9X]* ISBN-Nummern in der Form n-nnn-nnnnn-n, das letzte Zeichen kann auch ein X sein

VIM-Beispiele

\<The 
  • Wörter wie "Theater" oder "Thema"
ung\> 
  • Wörter wie "Teilung" oder "Endung"
\<Wort\> 
  • Das Wort "Wort"

Leerzeichen wurden durch _ Tabulatoren durch TAB eretzt. Ex-Befehle werden mit Doppelpunkt eingeleitet.

s/.*/( & )/

Wiederholt die ganze Zeile, fügt aber Klammern hinzu

s/.*/mv & &.old/

Formt eine Wortliste (ein Wort pro Zeile) zu mv-Befehlen um

/^$/d

Löscht Leerzeilen

/^[_TAB]*$/d

Löscht Leerzeilen und Zeilen, die nur aus Leerzeichen oder Tabulatoren bestehen

/ */ /g

Wandelt ein oder mehrere Leerzeichen in ein Leerzeichen um

:s/[0-9]/Element &:/

Wandelt (in der aktuellen Zeile) eine Zahl in ein Label für ein Element um

:s

Wiederholt die Substitution beim ersten Vorkommen

:&

Wie oben

:sg

Wie oben, aber für alle Vorkommen in einer Zeile

:&g

Wie oben

:%&g

Wiederholt die Substitution im ganzen Puffer

:.,$s/Wort/\U&/g

Wandelt von der aktuellen bis zur letzten Zeile das Wort Wort in Großschreibung um

:%s/.*/\L&/

Wandelt die gesamte Datei in Kleinschreibung um

:s/\<./\u&/g

Wandelt den ersten Buchstaben jedes Wortes in der aktuellen Zeile in Großschreibung um

:%s/ja/nein/g

Ersetzt das Wort ja durch nein

:%s/Ja/~/g

Ersetzt global ein anderes Wort (Ja) durch nein (Wiederverwendung des vorherigen Ersatzmusters)