Sonderzeichen: Unterschied zwischen den Versionen

Aktuelle Version vom 23. Juni 2026, 22:43 Uhr

Ein Sonderzeichen ist (in der Typografie/Typometrie und der digitalen Datenverarbeitung) ein Schriftzeichen, das weder ein Buchstabe noch eine Ziffer ist.

Beschreibung

Abweichende Bedeutungen und schwankende Bedeutung

Zu den Sonderzeichen werden zum Teil auch die nicht-druckenden Zeichen gezählt, die bei der Gestaltung einer Druckvorlage als Orientierungshilfe dienen, wie zum Beispiel Leerzeichen, zum Teil gerade nicht.

Etwas unklar ist, ob beispielsweise Umlaute Sonderzeichen sind, unter der angegebenen Definition hängt dies mit der Streitfrage zusammen, ob etwa "Ä" ein eigenständiger, von "A" zu unterscheidender Buchstabe ist, vgl. Deutsches Alphabet #Umstrittene Zahl der Buchstaben. Im Schwedischen, Finnischen und Estnischen hingegen gilt Ä als eigenständiger Buchstabe. Zum Teil werden auch Ziffern zu den Sonderzeichen gerechnet.

Griechische Buchstaben können Symbole sein, wenn sie nicht zum Bilden griechischer Wörter, sondern als Variablen (beispielsweise in der Statistik σ für die Standardabweichung) oder Konstanten (beispielsweise für die Kreiszahl π) verwendet werden.

Als "Eingeben von Sonderzeichen" werden häufig Eingabemethoden (auf Computertastaturen) beschrieben (auf Webseiten mit dem Titel "Sonderzeichen", siehe #Weblinks und Eingabemethode #Weblinks), wobei die Eingabe sämtlicher Zeichen ohne ASCII-Code behandelt wird, einschließlich von Buchstaben nicht-deutscher Sprachen. Häufig wird etwa der dänische Kleinbuchstabe ø explizit als Beispiel aufgeführt.

Zu den Sonderzeichen gehören Interpunktionszeichen

Sonderzeichen und Technik

Vorlage:Überarbeiten titel1="Zeichenkodierung" im Artikel Typografie für digitale Texte In den frühen Zeiten der Informationstechnik war die Beschränkung von Zeichensätzen auf 7 oder 8 Bit technisch bedingt. Um die vielen damit verbundenen Probleme - so musste zur Einführung des Euro-Symbols ein anderes Zeichen aus ISO 8859-15, einer 8-Bit-Erweiterung von ASCII, herausgenommen werden - zu vermeiden, wird heute zunehmend eine höhere Bitzahl je Zeichen verwandt.

Allerdings gibt es keinen klaren Zusammenhang zwischen dem Begriff Sonderzeichen und Fortschritten in der Kodierungstechnik. Von den 94 druckbaren ASCII-Zeichen sind 32 Sonderzeichen, also recht genau ein Drittel. Symbole für einfachere mathematische Aussagen sind unter ihnen bereits vorhanden, und hinsichtlich der Satzzeichen hat Unicode (s. u.) den bereits in ASCII kodierten (aus deutscher Sicht) nur die typografischen Varianten des waagrechten Strichs (Viertelgeviertstrich, Halbgeviertstrich, Geviertstrich, Minuszeichen), der Anführungszeichen und der Auslassungspunkte hinzugefügt (die vorher bereits mit TeX aus 7-Bit-Zeichensätzen verfügbar waren). Die Terminologie ist nicht klar hinsichtlich der Frage, ob es sich überhaupt bei der Mehrzahl der gegenüber ASCII neu kodierten Zeichen um Sonderzeichen handelt (beispielsweise bei Umlauten, s. o.).

Die Verwendung von ASCII-Sonderzeichen benötigt gegenüber der der ASCII-Buchstaben und -Ziffern auch keine besondere Technologie. In den Quellcode digitaler Texte kann man die meisten (oder viele) ASCII-Sonderzeichen (Interpunktionszeichen, mathematische Zeichen) ebenso umstandslos einbetten wie die Buchstaben und Ziffern. Jedoch haben bei verschiedenen Technologien (Dateinamen, Programmierung, URL-Kodierung, weitere folgen) bestimmte ASCII-Sonderzeichen eine spezielle syntaktische Funktion (etwa als "reservierte Zeichen" bezeichnet), die ihre Darstellung etwas erschwert. Man verwendet für solche Zwecke gerade ASCII-Sonderzeichen, um Anwendern die Texteingabe möglichst wenig zu erschweren.

Ein anderer Gesichtspunkt ist die Tastaturbelegung. Schon zu Zeiten der Schreibmaschine unterschieden sich die deutsche und die amerikanische Tastatur hauptsächlich in der Anordnung bzw. dem Vorhandensein von Sonderzeichen. Durch Tastenkombinationen wird auf Computertastaturen in den gängigen Betriebssystemen die Menge der direkt in den Quellcode einfügbaren Zeichen erweitert. Es ist eine terminologische Frage, ob alle so zusätzlich verfügbare Zeichen Sonderzeichen sind.

Unabhängig vom Begriff des Sonderzeichens ist manchen Technologien noch anzumerken, dass sie ursprünglich nur für ASCII-Zeichen entworfen wurden, wenn auch eher für Programmierer als für Anwender.

Im 80-Zeichen-Code der IBM-Lochkarte wurden Zahlen, Buchstaben, und Ziffern in unterschiedlichen Weisen dargestellt.

Unicode

Auf modernen Systemen lassen sich auch recht entlegene Sonderzeichen ohne große Umstände benutzen. Dabei haben sich (aus der Not heraus) verschiedene Methoden entwickelt.

Unicode gilt als die modernste und generischste Form der Umsetzung. Jedes Zeichen auf dieser Welt, ob es nun ein Recycling-Symbol oder ein chinesisches Schriftzeichen ist, bekommt einen Platz in den Unicode-Tabellen und wird auf einem Rechner als ein oder mehr Bytes umfassende Speicherstelle abgebildet. Jedes Unicode-Zeichen hat eine eigene Nummer. In den Zeichentabellen findet sich etwa:

HTML

Zeichenentitäten

Zeichenentitäten machen es möglich, Tausende verschiedener Zeichen mit in ASCII kodierten HTML-Dateien darzustellen. So können jedenfalls Buchstabenvarianten, Symbole und Interpunktionszeichen dargestellt werden, für die 7 Bit nicht ausreichen. - Im Artikel Entitäten in Auszeichnungssprachen wird die Thematik allgemeiner behandelt.

Numerische Zeichenentitäten

In HTML kann man ein Zeichen mit der Unicode-Position NUM durch den Code &#NUM; (NUM dezimal geschrieben) in die Browseransicht befördern, alternativ durch &#xHNUM;, wenn HNUM die hexadezimale Notation für NUM ist,

Beispiel &#60; bzw. &#x3C; für das mathematische "kleiner-als"-Zeichen "<", das in ASCII wie in Unicode die Position 60 hat. Man spricht in diesem Fall von numerischen Zeichenentitäten. Sie beginnen mit &# (dem Ampersand-Zeichen, gefolgt vom Doppelkreuz) und enden mit ; (Semikolon). Sowohl ASCII-Zeichen als auch praktisch sämtliche Zeichen, die man "Sonderzeichen" nennen könnte, sind auf diese Weise darstellbar.

Benannte Zeichenentitäten und "HTML-eigene" Zeichen

Für einzelne Zeichen, die besonders häufig benötigt werden, sind benannte Zeichenentitäten eingeführt worden, deren "Namen" leicht zu merken sind. Z. B. kann das "kleiner-als" Zeichen auch durch < dargestellt werden, der "Name" lt ist eine Abkürzung für "less than". Der Code beginnt wieder mit & und endet mit ;, aber das Doppelkreuz fehlt.

Voriges betrifft hauptsächlich nicht in ASCII kodierte Zeichen. Von den 32 ASCII-Sonderzeichen müssen eigentlich nur drei so behandelt werden:

das "kleiner-als"-Zeichen - s. o.
das "größer-als"-Zeichen - Gegenstück zum vorigen, so werden die HTML-"Tags" gebildet (<ELTNAME ATTR>TEXT</ELTNAME>) - darstellbar durch >
das &, welches ein Entity selbst einleitet - darstellbar durch &.

Diese Zeichen werden als "HTML-eigene" Zeichen bezeichnet, man könnte sie auch "reservierte Zeichen" (wie bei der URL-Kodierung) nennen.

Im Zusammenhang mit Attributwerten kann es außerdem sinnvoll sein, das " ("behelfsmäßiges doppeltes Anführungszeichen") durch " und das ' ("behelfsmäßiges einfaches Anführungszeichen") durch ' ("Apostroph") zu ersetzen. Wenn hochwertige Typografie angestrebt wird, sind diese Maßnahmen allerdings nicht ausreichend.

Benannte Zeichenentitäten erleichtern jedenfalls das Erstellen von HTML-Dateien mit einem Texteditor. Die so dargestellten Zeichen umfassen Buchstabenvarianten (mit diakritischen Zeichen), mathematische Symbole (die auch Pfeile und griechische Buchstaben sein können), und typografische Varianten von Interpunktionszeichen (→ Satzzeichen). 1995 wurden "Benennungen" für die über ASCII hinausgehenden Zeichen in ISO 8859-1 eingeführt, 1999 weitere für einzelne Unicode-Zeichen, siehe Benannte Zeichenentitäten im Artikel Entitäten in Auszeichnungssprachen.

Angabe der Quellcode-Kodierung

Außerdem können HTML-Betrachter (Browser) angewiesen werden, nicht in ASCII kodierten Text intentionsgemäß umzusetzen, indem man die Kodierung des Quelltexts im Dateikopf explizit angibt:

 <meta http-equiv="content-type" content="text/html; charset=UTF-8">

Alternativ zu UTF-8 können auch ISO-8859-Varianten angegeben werden. In beiden Fällen werden Zeichen-Entitäts-Referenzen überflüssig, nur noch auf &, <, > (und "/') ist zu achten.

Beide Methoden - Benutzung von Entities und Angabe der Zeichenkodierung - können problemlos gleichzeitig verwendet werden.

Was ist besser?

Der Artikel Entitäten in Auszeichnungssprachen diskutiert die beiden dargestellten Möglichkeiten, Nicht-ASCII-Zeichen (seien es Buchstaben, Numerale oder Sonderzeichen) in den Abschnitten Zukunft der Zeichenentitäten und Anmerkung. (Stand Mitte Februar 2016.)

Punycode

Punycode Um Umlaute und andere Sonderzeichen in Domainnamen darstellen zu können, hat man das Verfahren Punycode entwickelt, welches zusammen mit Nameprep den Standard für internationalisierte Domain-Namen (IDN) ergibt. Dabei werden Nicht-ASCII-Zeichen durch Bindestriche ersetzt und deren Repräsentation an das Ende des Wortes angehängt.

Anwendung

Aufruf

Optionen

Argumente

Umgebung

Rückgabewert

Konfiguration

Dateien

Sicherheit

Dokumentation

RFC

Man-Page

Info-Pages

Siehe auch

Links

Projekt-Homepage

Weblinks

https://de.wikipedia.org/wiki/Sonderzeichen

HTML und Unicode

Zusatz-Makro-Paketgerman
Paket inputenc
Hilfe:Sonderzeichenreferenz der deutschsprachigen Wikipedia
ZEICHEN.TV - Sonderzeichen in HTML und Unicode mit Suchfunktion
ASCII, DOS-Latin-1, Windows-1252 und HTML-Entitäten von Torsten Horn

Literatur

Johannes Bergerhausen, Siri Poarangan: decodeunicode: Die Schriftzeichen der Welt Hermann Schmidt, Mainz, 2011, ISBN 978-3874398138. Mit allen Sonderzeichen aller Schriftsysteme
Helmut Hiller, Stephan Füssel: Wörterbuch des Buches. 7. grundlegend überarbeitete Auflage. Vittorio Klostermann, Frankfurt am Main 2006, ISBN 3-465-03495-3
Ursula Rautenberg (Hrsg.): Reclams Sachlexikon des Buches. 2. verbesserte Auflage. Philipp Reclam jun., Stuttgart 2003, ISBN 3-15-010542-0
The Unicode Consortium: The Unicode Standard, Version 6.0.0. The Unicode Consortium, Mountain View CA, 2011, ISBN 978-1-936213-01-6

@@ Zeile 5: / Zeile 5: @@
 Zu den Sonderzeichen werden zum Teil auch die nicht-druckenden Zeichen gezählt, die bei der Gestaltung einer Druckvorlage als Orientierungshilfe dienen, wie zum Beispiel [[Leerzeichen]], zum Teil gerade ''nicht.''
-Etwas unklar ist, ob z. B. [[Umlaut]]e Sonderzeichen sind, unter der angegebenen Definition hängt dies mit der Streitfrage zusammen, ob etwa „Ä“ ein eigenständiger, von „A“ zu unterscheidender Buchstabe ist, vgl. ''[[Deutsches Alphabet #Umstrittene Zahl der Buchstaben]].'' Im [[Schwedische Sprache|Schwedischen]], [[Finnische Sprache|Finnischen]] und [[Estnische Sprache|Estnischen]] hingegen gilt [[Ä]] als eigenständiger Buchstabe.<!-- noch mehr in en.wikipedia.org/wiki/Ä#Usage -->
+Etwas unklar ist, ob beispielsweise [[Umlaut]]e Sonderzeichen sind, unter der angegebenen Definition hängt dies mit der Streitfrage zusammen, ob etwa "Ä" ein eigenständiger, von "A" zu unterscheidender Buchstabe ist, vgl. ''[[Deutsches Alphabet #Umstrittene Zahl der Buchstaben]].'' Im [[Schwedische Sprache|Schwedischen]], [[Finnische Sprache|Finnischen]] und [[Estnische Sprache|Estnischen]] hingegen gilt [[Ä]] als eigenständiger Buchstabe.<!-- noch mehr in en.wikipedia.org/wiki/Ä#Usage -->
 Zum Teil werden auch ''Ziffern'' zu den Sonderzeichen gerechnet.
-[[Griechische Buchstaben]] können ''Symbole'' sein, wenn sie nicht zum Bilden griechischer Wörter, sondern als [[Variable (Mathematik)|Variablen]] (z. B. in der Statistik σ für die [[Varianz (Stochastik)#Beziehung zur Standardabweichung|Standardabweichung]]) oder [[Mathematische Konstante|Konstanten]] (z. B. für die [[Kreiszahl]] π) verwendet werden.<!-- und lateinische Buchstaben? -->
+[[Griechische Buchstaben]] können ''Symbole'' sein, wenn sie nicht zum Bilden griechischer Wörter, sondern als [[Variable (Mathematik)|Variablen]] (beispielsweise in der Statistik σ für die [[Varianz (Stochastik)#Beziehung zur Standardabweichung|Standardabweichung]]) oder [[Mathematische Konstante|Konstanten]] (beispielsweise für die [[Kreiszahl]] π) verwendet werden.<!-- und lateinische Buchstaben? -->
-Als „Eingeben von Sonderzeichen“ werden häufig [[Eingabemethode]]n (auf Computer[[tastatur]]en) beschrieben (auf Webseiten mit dem Titel „Sonderzeichen“, siehe ''[[#Weblinks]]'' und ''[[Eingabemethode #Weblinks]]''), wobei die Eingabe sämtlicher Zeichen ohne [[ASCII]]-Code behandelt wird, einschließlich von Buchstaben nicht-deutscher Sprachen. Häufig wird etwa der dänische [[Kleinbuchstabe]] [[ø]] explizit als Beispiel aufgeführt.
+Als "Eingeben von Sonderzeichen" werden häufig [[Eingabemethode]]n (auf Computer[[tastatur]]en) beschrieben (auf Webseiten mit dem Titel "Sonderzeichen", siehe ''[[#Weblinks]]'' und ''[[Eingabemethode #Weblinks]]''), wobei die Eingabe sämtlicher Zeichen ohne [[ASCII]]-Code behandelt wird, einschließlich von Buchstaben nicht-deutscher Sprachen. Häufig wird etwa der dänische [[Kleinbuchstabe]] [[ø]] explizit als Beispiel aufgeführt.
 Zu den Sonderzeichen gehören [[Interpunktionszeichen]]
@@ Zeile 16: / Zeile 16: @@
 == Sonderzeichen und Technik ==
 {{Überarbeiten|2=Dieser Abschnitt|grund=Klärung Beziehung zu [[Zeichenkodierung]], [[Funktionszeichen]].}}
-{{Hauptartikel|Typografie für digitale Texte#Zeichenkodierung|titel1=„Zeichenkodierung“ im Artikel Typografie für digitale Texte}}
+[[Typografie für digitale Texte#Zeichenkodierung|titel1="Zeichenkodierung" im Artikel Typografie für digitale Texte]]
-In den frühen Zeiten der [[Informationstechnik]] war die Beschränkung von [[Zeichensatz|Zeichensätzen]] auf 7 oder 8 [[Bit]] technisch bedingt. Um die vielen damit verbundenen Probleme – so musste zur Einführung des Euro-Symbols ein anderes Zeichen aus [[ISO 8859-15]], einer 8-Bit-Erweiterung von [[American Standard Code for Information Interchange|ASCII]], herausgenommen werden – zu vermeiden, wird heute zunehmend eine höhere Bitzahl je Zeichen verwandt.
+In den frühen Zeiten der [[Informationstechnik]] war die Beschränkung von [[Zeichensatz|Zeichensätzen]] auf 7 oder 8 [[Bit]] technisch bedingt. Um die vielen damit verbundenen Probleme - so musste zur Einführung des Euro-Symbols ein anderes Zeichen aus [[ISO 8859-15]], einer 8-Bit-Erweiterung von [[American Standard Code for Information Interchange|ASCII]], herausgenommen werden - zu vermeiden, wird heute zunehmend eine höhere Bitzahl je Zeichen verwandt.
-Allerdings gibt es keinen klaren Zusammenhang zwischen dem Begriff ''Sonderzeichen'' und Fortschritten in der Kodierungstechnik. Von den 94 druckbaren ASCII-Zeichen sind 32 Sonderzeichen, also recht genau ein Drittel. Symbole für einfachere mathematische Aussagen sind unter ihnen bereits vorhanden, und hinsichtlich der Satzzeichen hat Unicode (s. u.) den bereits in ASCII kodierten (aus deutscher Sicht) nur die typografischen Varianten des waagrechten Strichs ([[Viertelgeviertstrich]], [[Halbgeviertstrich]], [[Geviertstrich]], [[Minuszeichen]]), der [[Anführungszeichen]] und der [[Auslassungspunkte]] hinzugefügt (die vorher bereits mit [[TeX]] aus 7-Bit-Zeichensätzen verfügbar waren). Die Terminologie ist nicht klar hinsichtlich der Frage, ob es sich überhaupt bei der Mehrzahl der gegenüber ASCII neu kodierten Zeichen um ''Sonderzeichen'' handelt (z. B. bei Umlauten, s. o.).
+Allerdings gibt es keinen klaren Zusammenhang zwischen dem Begriff ''Sonderzeichen'' und Fortschritten in der Kodierungstechnik. Von den 94 druckbaren ASCII-Zeichen sind 32 Sonderzeichen, also recht genau ein Drittel. Symbole für einfachere mathematische Aussagen sind unter ihnen bereits vorhanden, und hinsichtlich der Satzzeichen hat Unicode (s. u.) den bereits in ASCII kodierten (aus deutscher Sicht) nur die typografischen Varianten des waagrechten Strichs ([[Viertelgeviertstrich]], [[Halbgeviertstrich]], [[Geviertstrich]], [[Minuszeichen]]), der [[Anführungszeichen]] und der [[Auslassungspunkte]] hinzugefügt (die vorher bereits mit [[TeX]] aus 7-Bit-Zeichensätzen verfügbar waren). Die Terminologie ist nicht klar hinsichtlich der Frage, ob es sich überhaupt bei der Mehrzahl der gegenüber ASCII neu kodierten Zeichen um ''Sonderzeichen'' handelt (beispielsweise bei Umlauten, s. o.).
-Die Verwendung von ASCII-Sonderzeichen benötigt gegenüber der der ASCII-Buchstaben und -Ziffern auch keine besondere Technologie. In den Quellcode digitaler Texte kann man die meisten (oder viele) ASCII-Sonderzeichen (Interpunktionszeichen, mathematische Zeichen) ebenso umstandslos einbetten wie die Buchstaben und Ziffern. Jedoch haben bei verschiedenen Technologien ([[Dateiname]]n, Programmierung, [[URL-Kodierung]], weitere folgen) bestimmte ASCII-Sonderzeichen eine spezielle [[Syntax|syntaktische]] Funktion (etwa als „reservierte Zeichen“ bezeichnet), die ihre ''Darstellung'' etwas erschwert. Man verwendet für solche Zwecke gerade ASCII-''Sonderzeichen'', um Anwendern die Texteingabe möglichst wenig zu erschweren.
+Die Verwendung von ASCII-Sonderzeichen benötigt gegenüber der der ASCII-Buchstaben und -Ziffern auch keine besondere Technologie. In den Quellcode digitaler Texte kann man die meisten (oder viele) ASCII-Sonderzeichen (Interpunktionszeichen, mathematische Zeichen) ebenso umstandslos einbetten wie die Buchstaben und Ziffern. Jedoch haben bei verschiedenen Technologien ([[Dateiname]]n, Programmierung, [[URL-Kodierung]], weitere folgen) bestimmte ASCII-Sonderzeichen eine spezielle [[Syntax|syntaktische]] Funktion (etwa als "reservierte Zeichen" bezeichnet), die ihre ''Darstellung'' etwas erschwert. Man verwendet für solche Zwecke gerade ASCII-''Sonderzeichen'', um Anwendern die Texteingabe möglichst wenig zu erschweren.
-Ein anderer Gesichtspunkt ist die [[Tastaturbelegung]]. Schon zu Zeiten der [[Schreibmaschine]] unterschieden sich die deutsche und die amerikanische Tastatur hauptsächlich in der Anordnung bzw. dem Vorhandensein von ''Sonderzeichen.'' Durch [[Tastenkombination]]en wird auf Computertastaturen in den gängigen Betriebssystemen die Menge der direkt in den Quellcode einfügbaren Zeichen erweitert. Es ist eine terminologische Frage, ob alle so zusätzlich verfügbare Zeichen ''Sonderzeichen'' sind.
+Ein anderer Gesichtspunkt ist die [[Tastaturbelegung]]. Schon zu Zeiten der [[Schreibmaschine]] unterschieden sich die deutsche und die amerikanische Tastatur hauptsächlich in der Anordnung bzw.&nbsp;dem Vorhandensein von ''Sonderzeichen.'' Durch [[Tastenkombination]]en wird auf Computertastaturen in den gängigen Betriebssystemen die Menge der direkt in den Quellcode einfügbaren Zeichen erweitert. Es ist eine terminologische Frage, ob alle so zusätzlich verfügbare Zeichen ''Sonderzeichen'' sind.
 Unabhängig vom Begriff des Sonderzeichens ist manchen Technologien noch anzumerken, dass sie ursprünglich nur für ASCII-Zeichen entworfen wurden, wenn auch eher für Programmierer als für Anwender.<!--HTML, TeX, ...-->
@@ Zeile 36: / Zeile 36: @@
 == HTML ==
 === Zeichenentitäten ===
-Zeichenentitäten machen es möglich, Tausende verschiedener Zeichen mit in ASCII kodierten HTML-Dateien darzustellen. So können jedenfalls Buchstabenvarianten, Symbole und Interpunktionszeichen dargestellt werden, für die 7 Bit nicht ausreichen. – Im Artikel ''[[Entitäten in Auszeichnungssprachen]]'' wird die Thematik allgemeiner behandelt.
+Zeichenentitäten machen es möglich, Tausende verschiedener Zeichen mit in ASCII kodierten HTML-Dateien darzustellen. So können jedenfalls Buchstabenvarianten, Symbole und Interpunktionszeichen dargestellt werden, für die 7 Bit nicht ausreichen. - Im Artikel ''[[Entitäten in Auszeichnungssprachen]]'' wird die Thematik allgemeiner behandelt.
 ==== Numerische Zeichenentitäten ====
 In HTML kann man ein Zeichen mit der [[Unicode]]-Position <code>''NUM''</code> durch den Code <code>&#''NUM'';</code> (<code>''NUM''</code> [[dezimal]] geschrieben) in die Browseransicht befördern, alternativ durch <code>&#x''HNUM'';</code>, wenn <code>''HNUM''</code> die [[hexadezimal]]e Notation für <code>''NUM''</code> ist,
-  Beispiel <syntaxhighlight lang="html" inline>&#60;</syntaxhighlight> bzw. <syntaxhighlight lang="html" inline>&#x3C;</syntaxhighlight> für das mathematische „kleiner-als“-Zeichen „&#x3C;“, das in ASCII wie in Unicode die Position 60 hat. Man spricht in diesem Fall von ''numerischen'' [[Entitäten in Auszeichnungssprachen#Zeichen-Entitäten|Zeichenentitäten]]. Sie beginnen mit <code>&#</code> (dem [[Ampersand]]-Zeichen, gefolgt vom [[Doppelkreuz (Schriftzeichen)|Doppelkreuz]]) und enden mit <code>;</code> ([[Semikolon]]). Sowohl ASCII-Zeichen als auch praktisch sämtliche Zeichen, die man „Sonderzeichen“ nennen könnte, sind auf diese Weise darstellbar.
+  Beispiel <syntaxhighlight lang="html" inline copy>&#60;</syntaxhighlight> bzw.&nbsp;<syntaxhighlight lang="html" inline copy>&#x3C;</syntaxhighlight> für das mathematische "kleiner-als"-Zeichen "&#x3C;", das in ASCII wie in Unicode die Position 60 hat. Man spricht in diesem Fall von ''numerischen'' [[Entitäten in Auszeichnungssprachen#Zeichen-Entitäten|Zeichenentitäten]]. Sie beginnen mit <code>&#</code> (dem [[Ampersand]]-Zeichen, gefolgt vom [[Doppelkreuz (Schriftzeichen)|Doppelkreuz]]) und enden mit <code>;</code> ([[Semikolon]]). Sowohl ASCII-Zeichen als auch praktisch sämtliche Zeichen, die man "Sonderzeichen" nennen könnte, sind auf diese Weise darstellbar.
-==== Benannte Zeichenentitäten und „HTML-eigene“ Zeichen ====
+==== Benannte Zeichenentitäten und "HTML-eigene" Zeichen ====
-Für einzelne Zeichen, die besonders häufig benötigt werden, sind [[Entitäten in Auszeichnungssprachen#benannte Zeichenentität|'''benannte''' Zeichenentitäten]] eingeführt worden, deren „Namen“ leicht zu merken sind. Z. B. kann das „kleiner-als“ Zeichen auch durch <syntaxhighlight lang="html" inline>&lt;</syntaxhighlight> dargestellt werden, der „Name“ <code>lt</code> ist eine Abkürzung für „less than“. Der Code beginnt wieder mit <code>&</code> und endet mit <code>;</code>, aber das Doppelkreuz fehlt.
+Für einzelne Zeichen, die besonders häufig benötigt werden, sind [[Entitäten in Auszeichnungssprachen#benannte Zeichenentität|'''benannte''' Zeichenentitäten]] eingeführt worden, deren "Namen" leicht zu merken sind. Z. B. kann das "kleiner-als" Zeichen auch durch <syntaxhighlight lang="html" inline copy>&lt;</syntaxhighlight> dargestellt werden, der "Name" <code>lt</code> ist eine Abkürzung für "less than". Der Code beginnt wieder mit <code>&</code> und endet mit <code>;</code>, aber das Doppelkreuz fehlt.
 Voriges betrifft hauptsächlich ''nicht in ASCII'' kodierte Zeichen. Von den ''32 ASCII-Sonderzeichen'' müssen eigentlich nur drei so behandelt werden:
-* das „kleiner-als“-Zeichen – s. o.
+* das "kleiner-als"-Zeichen - s. o.
-* das „größer-als“-Zeichen – Gegenstück zum vorigen, so werden die HTML-[[Auszeichnungselement|„Tags“]] gebildet (<code><''ELTNAME ATTR''>''TEXT''</''ELTNAME''></code>) – darstellbar durch <syntaxhighlight lang="html" inline>&gt;</syntaxhighlight>
+* das "größer-als"-Zeichen - Gegenstück zum vorigen, so werden die HTML-[[Auszeichnungselement|"Tags"]] gebildet (<code><''ELTNAME ATTR''>''TEXT''</''ELTNAME''></code>) - darstellbar durch <syntaxhighlight lang="html" inline copy>&gt;</syntaxhighlight>
-* das <code>&</code>, welches ein [[Entitäten in Auszeichnungssprachen|Entity]] selbst einleitet – darstellbar durch <syntaxhighlight lang="html" inline>&amp;</syntaxhighlight>.
+* das <code>&</code>, welches ein [[Entitäten in Auszeichnungssprachen|Entity]] selbst einleitet - darstellbar durch <syntaxhighlight lang="html" inline copy>&amp;</syntaxhighlight>.
-Diese Zeichen werden als „HTML-eigene“ Zeichen bezeichnet, man könnte sie auch „reservierte Zeichen“ (wie bei der [[URL-Kodierung]]) nennen.
+Diese Zeichen werden als "HTML-eigene" Zeichen bezeichnet, man könnte sie auch "reservierte Zeichen" (wie bei der [[URL-Kodierung]]) nennen.
-Im Zusammenhang mit Attributwerten kann es außerdem sinnvoll sein, das <code>"</code> („behelfsmäßiges doppeltes Anführungszeichen“) durch <syntaxhighlight lang="html" inline>&quot;</syntaxhighlight> und das <code>'</code> („behelfsmäßiges einfaches Anführungszeichen“) durch <syntaxhighlight lang="html" inline>&apos;</syntaxhighlight> („Apostroph“) zu ersetzen. Wenn hochwertige Typografie angestrebt wird, sind diese Maßnahmen allerdings nicht ausreichend.
+Im Zusammenhang mit Attributwerten kann es außerdem sinnvoll sein, das <code>"</code> ("behelfsmäßiges doppeltes Anführungszeichen") durch <syntaxhighlight lang="html" inline copy>&quot;</syntaxhighlight> und das <code>'</code> ("behelfsmäßiges einfaches Anführungszeichen") durch <syntaxhighlight lang="html" inline copy>&apos;</syntaxhighlight> ("Apostroph") zu ersetzen. Wenn hochwertige Typografie angestrebt wird, sind diese Maßnahmen allerdings nicht ausreichend.
 Benannte Zeichenentitäten erleichtern jedenfalls das Erstellen von HTML-Dateien mit einem Texteditor. Die so dargestellten Zeichen umfassen Buchstabenvarianten (mit diakritischen Zeichen), mathematische Symbole (die auch Pfeile und griechische Buchstaben sein können), und typografische Varianten von [[Interpunktionszeichen]] (→ ''[[Satzzeichen]]'').
-wurden „Benennungen“ für die über ASCII hinausgehenden Zeichen in [[ISO 8859-1]] eingeführt, 1999 weitere für einzelne [[Unicode]]-Zeichen, siehe ''[[Entitäten in Auszeichnungssprachen#Benannte Zeichenentitäten|Benannte Zeichenentitäten]]'' im Artikel ''[[Entitäten in Auszeichnungssprachen]].''
+wurden "Benennungen" für die über ASCII hinausgehenden Zeichen in [[ISO 8859-1]] eingeführt, 1999 weitere für einzelne [[Unicode]]-Zeichen, siehe ''[[Entitäten in Auszeichnungssprachen#Benannte Zeichenentitäten|Benannte Zeichenentitäten]]'' im Artikel ''[[Entitäten in Auszeichnungssprachen]].''
 === Angabe der Quellcode-Kodierung ===
@@ Zeile 66: / Zeile 66: @@
 Alternativ zu <code>UTF-8</code> können auch [[ISO 8859|ISO-8859]]-Varianten angegeben werden. In beiden Fällen werden Zeichen-Entitäts-Referenzen überflüssig, nur noch auf <code>&</code>, <code><</code>, <code>></code> (und <code>"</code>/<code>'</code>) ist zu achten.
-Beide Methoden – Benutzung von Entities und Angabe der Zeichenkodierung – können problemlos gleichzeitig verwendet werden.
+Beide Methoden - Benutzung von Entities und Angabe der Zeichenkodierung - können problemlos gleichzeitig verwendet werden.
 === Was ist besser? ===
@@ Zeile 72: / Zeile 72: @@
 == Punycode ==
-{{Hauptartikel|Punycode}}
+[[Punycode]]
 Um Umlaute und andere Sonderzeichen in [[Domain (Internet)|Domain]]namen darstellen zu können, hat man das Verfahren ''Punycode'' entwickelt, welches zusammen mit Nameprep den Standard für [[Internationalisierter_Domainname|internationalisierte Domain-Namen]] (IDN) ergibt. Dabei werden Nicht-ASCII-Zeichen durch Bindestriche ersetzt und deren Repräsentation an das Ende des Wortes angehängt.
 == Anwendung ==
-== Syntax ==
+== Aufruf ==
 === Optionen ===
-=== Parameter ===
+=== Argumente ===
-=== Umgebungsvariablen ===
+=== Umgebung ===
-=== Exit-Status ===
+=== Rückgabewert ===
 == Konfiguration ==
 === Dateien ===
@@ Zeile 86: / Zeile 86: @@
 == Dokumentation ==
 === RFC ===
-=== Man-Pages ===
+=== Man-Page ===
 === Info-Pages ===
 == Siehe auch ==
@@ Zeile 97: / Zeile 97: @@
 * https://de.wikipedia.org/wiki/Sonderzeichen
 ; HTML und Unicode
-* [http://ctan.org/pkg/german Zusatz-Makro-Paketgerman]
+* [https://ctan.org/pkg/german Zusatz-Makro-Paketgerman]
-* [http://ctan.org/pkg/inputenc Paket inputenc]
+* [https://ctan.org/pkg/inputenc Paket inputenc]
 * [[Hilfe:Sonderzeichenreferenz]] der deutschsprachigen Wikipedia
-* [http://www.zeichen.tv ZEICHEN.TV] – Sonderzeichen in HTML und Unicode mit Suchfunktion
+* [https://www.zeichen.tv ZEICHEN.TV] - Sonderzeichen in HTML und Unicode mit Suchfunktion
-* [http://www.torsten-horn.de/techdocs/ascii.htm ASCII, DOS-Latin-1, Windows-1252 und HTML-Entitäten] von Torsten Horn
+* [https://www.torsten-horn.de/techdocs/ascii.htm ASCII, DOS-Latin-1, Windows-1252 und HTML-Entitäten] von Torsten Horn
-<!-- BAUSTELLE * [http://www.decodeunicode.org/ decodeunicode.org] – alle 98.000 Zeichen des Unicode-Standards 5.0 mit Abbildungen und Informationen (Uni Mainz) -->
+<!-- BAUSTELLE * [https://www.decodeunicode.org/ decodeunicode.org] - alle 98.000 Zeichen des Unicode-Standards 5.0 mit Abbildungen und Informationen (Uni Mainz) -->
-=== Einzelnachweise ===
-<references />
 == Literatur ==
 * Johannes Bergerhausen, Siri Poarangan: ''decodeunicode: Die Schriftzeichen der Welt'' Hermann Schmidt, Mainz, 2011, ISBN 978-3874398138. Mit allen Sonderzeichen aller Schriftsysteme
 * Helmut Hiller, [[Stephan Füssel]]: ''Wörterbuch des Buches.'' 7. grundlegend überarbeitete Auflage. Vittorio Klostermann, Frankfurt am Main 2006, ISBN 3-465-03495-3
 * [[Ursula Rautenberg]] (Hrsg.): ''Reclams Sachlexikon des Buches.'' 2. verbesserte Auflage. Philipp Reclam jun., Stuttgart 2003, ISBN 3-15-010542-0
-* The Unicode Consortium: ''[http://www.unicode.org/versions/Unicode6.0.0/ The Unicode Standard, Version 6.0.0]''. The Unicode Consortium, Mountain View CA, 2011, ISBN 978-1-936213-01-6
+* The Unicode Consortium: ''[https://www.unicode.org/versions/Unicode6.0.0/ The Unicode Standard, Version 6.0.0]''. The Unicode Consortium, Mountain View CA, 2011, ISBN 978-1-936213-01-6
-== Testfragen ==
-<div class="toccolours mw-collapsible mw-collapsed">
-''Testfrage 1''
-<div class="mw-collapsible-content">'''Antwort1'''</div>
-</div>
-<div class="toccolours mw-collapsible mw-collapsed">
-''Testfrage 2''
-<div class="mw-collapsible-content">'''Antwort2'''</div>
-</div>
-<div class="toccolours mw-collapsible mw-collapsed">
-''Testfrage 3''
-<div class="mw-collapsible-content">'''Antwort3'''</div>
-</div>
-<div class="toccolours mw-collapsible mw-collapsed">
-''Testfrage 4''
-<div class="mw-collapsible-content">'''Antwort4'''</div>
-</div>
-<div class="toccolours mw-collapsible mw-collapsed">
-''Testfrage 5''
-<div class="mw-collapsible-content">'''Antwort5'''</div>
-</div>
 [[Kategorie:Zeichenkodierung]]

Dirkwagner (Diskussion | Beiträge)