Daten: Unterschied zwischen den Versionen
Die Seite wurde neu angelegt: „Kategorie:IT-Grundlagen“ |
Keine Bearbeitungszusammenfassung |
||
Zeile 1: | Zeile 1: | ||
'''topic''' - Kurzbeschreibung | |||
== Beschreibung == | |||
== Installation == | |||
== Syntax == | |||
=== Optionen === | |||
=== Parameter === | |||
=== Umgebungsvariablen === | |||
=== Exit-Status === | |||
== Anwendungen == | |||
=== Fehlerbehebung === | |||
== Konfiguration == | |||
=== Dateien === | |||
== Siehe auch == | |||
=== Unterseiten === | |||
{{Special:PrefixIndex/{{BASEPAGENAME}}}} | |||
=== Sicherheit === | |||
=== Dokumentation === | |||
==== RFC ==== | |||
==== Man-Pages ==== | |||
==== Info-Pages ==== | |||
=== Links === | |||
==== Einzelnachweise ==== | |||
<references /> | |||
==== Projekt ==== | |||
==== Weblinks ==== | |||
== Testfragen == | |||
<div class="toccolours mw-collapsible mw-collapsed"> | |||
''Testfrage 1'' | |||
<div class="mw-collapsible-content">'''Antwort1'''</div> | |||
</div> | |||
<div class="toccolours mw-collapsible mw-collapsed"> | |||
''Testfrage 2'' | |||
<div class="mw-collapsible-content">'''Antwort2'''</div> | |||
</div> | |||
<div class="toccolours mw-collapsible mw-collapsed"> | |||
''Testfrage 3'' | |||
<div class="mw-collapsible-content">'''Antwort3'''</div> | |||
</div> | |||
<div class="toccolours mw-collapsible mw-collapsed"> | |||
''Testfrage 4'' | |||
<div class="mw-collapsible-content">'''Antwort4'''</div> | |||
</div> | |||
<div class="toccolours mw-collapsible mw-collapsed"> | |||
''Testfrage 5'' | |||
<div class="mw-collapsible-content">'''Antwort5'''</div> | |||
</div> | |||
= TMP = | |||
'''Daten''' bezeichnet als Plural von ''Datum'' [[Tatsache|Fakten]], [[Zeitpunkt]]e oder [[Kalenderdatum|kalendarische Zeitangaben]]. Als [[Pluralwort]] steht es für durch [[Beobachtung]]en, [[Messung]]en u. a. gewonnene [[Zahl|[Zahlen]werte]] sowie darauf beruhende Angaben oder formulierbare [[Befund (Sachverständiger)|Befunde]].<ref name="Duden_Daten" /> | |||
== Allgemeines == | |||
Während ''Daten'' in der [[Umgangssprache]] [[Gegebenheit]]en, [[Tatsache]]n oder [[Ereignis]]se sind, sind ''Daten'' in der [[Fachsprache]] [[Zeichen]], die eine [[Information]] darstellen.<ref name="Proebster" /> In verschiedenen [[Fachgebiet]]en wie z. B. der [[Informatik]], der [[Mathematik]], der [[Wirtschaftstheorie]], der [[Neurowissenschaft]] oder den [[Biowissenschaften]] sind unterschiedliche – meist ähnliche – Definitionen gebräuchlich. Eine einheitliche Definition gibt es bisher nicht.<ref name="Witt" /><ref>{{Internetquelle |autor=Sebastian Kraska |url=https://www.iitr.de/blog/datenschutz-definition-was-sind-daten/6760/ |titel=Datenschutz-Definition: Was sind Daten? |werk=Das Datenschutz-Blog |datum=2013-01-01 |sprache=de-DE |abruf=2023-02-21}}</ref> Das liegt auch daran, dass die verschiedenen Fachgebiete dem Begriff ''Daten'' einen unterschiedlichen [[Begriffsinhalt]] zuordnen, der nur dieses Fachgebiet betrifft. | |||
Im [[Datenschutzrecht]] sind im Wesentlichen die [[Personenbezogene Daten|personenbezogenen Daten]] gemeint, d. h. Angaben über [[natürliche Person]]en, z. B. das Geburtsdatum oder der Wohnort. | |||
Für die [[Datenverarbeitung]] und (Wirtschafts-)Informatik werden Daten als Zeichen (oder [[Symbol]]e) definiert, die Informationen darstellen und die dem Zweck der Verarbeitung dienen.<ref name="Gabler">{{Internetquelle |url=http://wirtschaftslexikon.gabler.de/Archiv/54483/daten-v5.html |titel=Daten |werk=Gabler Wirtschaftslexikon |abruf=2011-02-27}}</ref><ref name="einf-inf">Heinz-Peter Gumm, Manfred Sommer: ''Einführung in die Informatik.'' 10. Auflage. Oldenbourg Verlag, ISBN 978-3-486-70641-3, S. 4 f.</ref> | |||
Die Wirtschaftstheorie beschreibt Daten als diejenigen [[volkswirtschaft]]lichen Gegebenheiten, die einen wesentlichen Einfluss auf den Ablauf der [[Wirtschaft]] haben, selbst dabei aber nicht beeinflusst werden.<ref name="Gabler" /><ref>D. v. Erffa: ''Taschenlexikon der Wirtschaft''. [http://books.google.de/books?id=Dg655Y6hyKQC&pg=PA65&dq=daten+gegebenheit&hl=de&sa=X&ei=YnrSUpmGL8motAaL5oGYAQ&ved=0CEUQ6AEwAzgU#v=onepage&q=daten%20gegebenheit&f=false books.google.de] „Daten“ beziehungsweise erläuternd z. B. in G. Blümle u. a.: ''Perspektiven einer kulturellen Ökonomik'', Band 1. LIT Verlag, Münster 2004, ISBN 3-8258-6137-6, [http://books.google.de/books?id=R51tzpLbrlwC&pg=PA72&dq=Daten+Datenkranz+Eucken+Gegebenheit&hl=de&sa=X&ei=BtHXUsD_GIjLswbpzIGYCw&ved=0CDYQ6AEwAA#v=onepage&q=Daten%20Datenkranz%20Eucken%20Gegebenheit&f=false books.google.de] ''Datenbegriff von Eucken.''</ref> | |||
== {{Anker|Wortherkunft}} Etymologie und Sprachgebrauch == | |||
''Daten'' oder zuvor ''Data'' sind eigentlich Pluralbildungen von ''Datum'',<ref>{{Deutsches Wörterbuch |Lemma=datum, n. |Band=2 |Sp= |lemid=GD00911}}</ref> das als [[Lehnwort]] aus dem [[Latein]]ischen zurückgeht auf ''datum'' ‚gegeben‘ ([[Partizip Perfekt Passiv|PPP]] zu lat. ''dare'' ‚geben‘) bzw. [[Substantivierung|substantiviert]] ‚das Gegebene‘.<ref>siehe „Daten“ und „Datum“ in Kluge: ''[[Etymologisches Wörterbuch der deutschen Sprache]].'' 23. Auflage, S. 163f.</ref> Auf wichtigeren Schriftstücken war in der üblichen Einleitungsformel vermerkt „datum …“ („gegeben (am) …“) mit <nowiki><Zeitangabe></nowiki> und eventueller <nowiki><Ortsangabe></nowiki> – womit deren Inhalt „das Gegebene“ wurde. Die Pluralform ''Daten'' zu ''Datum'' folgt anderen Wörtern lateinischen Ursprungs wie ''Studien'' – ''Studium'' oder ''Individuen'' – ''Individuum''. | |||
Da sich in der [[Deutsche Sprache|deutschen Sprache]] die Bedeutung von „Datum“ im allgemeinen Sprachgebrauch eingeengt hat auf [[Kalenderdatum]], wird für die Pluralbildung im Sinne von Zeitpunkten oft nicht die Wortform „Daten“ benutzt, sondern stattdessen von „Datumsangaben“ oder „[[Termin]]en“ gesprochen. Umgekehrt werden für die Einzahl von „Daten“ im weiteren Sinn als eine gegebene Messung, Information oder Zeichen(kette) dann Wörter wie „Wert“, „Angabe“ oder „Datenelement“ verwendet. Es handelt sich also um ein [[Pluraletantum]].<ref name="Duden_Daten" /> | |||
; Daten im Unterschied zu Information | |||
Obwohl diese beiden Ausdrücke in der Umgangssprache oft [[Synonymie|synonym]] benutzt werden, unterscheidet die [[Informationstheorie]] beide dem Begriff nach grundlegend voneinander.<ref>{{Internetquelle |url=https://informatikstandards.de/ |titel=Startseite - Bildungsstandards Informatik |abruf=2023-02-21}}</ref> Details und Beispiele siehe → [[Information#Verwandte Begriffe|Information]]. | |||
== Recht == | |||
Das deutsche Recht verwendet an verschiedenen Stellen den Datenbegriff als [[Rechtsbegriff]]. Verwendet wird der Begriff etwa im [[Personenbezogene Daten|Datenschutz]] (Art. 4 Nr. 1 [[DSGVO]]) oder im [[Strafrecht (Deutschland)|Strafrecht]] unter „[[Ausspähen von Daten]]“ ({{§|202a|stgb|juris}} [[Strafgesetzbuch (Deutschland)|StGB]]); „Daten“ in diesem Sinn sind „nur solche, die elektronisch, magnetisch oder sonst nicht unmittelbar wahrnehmbar gespeichert sind oder übermittelt werden.“ Diese strafrechtliche Bestimmung von Daten stellt auf die technische Sicht von Daten als maschinenlesbar codierte Zeichen ab, die an ein Speicher- oder Übertragungsmedium gebunden sind. Davon zu unterscheiden ist eine semantische Dimension von Daten als Träger von Informationen. Diese Unterscheidung hat auch eine rechtliche Bedeutung. Die Frage nach dem rechtlichen Schutz für den Informationsgehalt von Daten führt in den Anwendungsbereich des geistigen Eigentums (Urheberrecht, gewerblicher Rechtsschutz) oder des Datenschutzes. Unbefugte Veränderungen der Codierung auf einem Datenträger sind dagegen als Eingriff in das Sacheigentum am Datenträger anzusehen und damit sachenrechtlich und ggf. auch strafrechtlich relevant. | |||
[[Eigentum]] an Daten: Ein dem Sacheigentum (§{{§|903|bgb|juris}} ff. [[Bürgerliches Gesetzbuch|BGB]]) entsprechendes Eigentum an Daten kennt das Recht in Deutschland nicht. Da die Eigentumsvorschriften auf eine ausschließliche Zuordnung einer nicht beliebig vermehrbaren und eindeutig identifizierbaren Sache ausgerichtet sind, passen sie nicht zum Charakter von Daten als beliebig, fast ohne Kosten vermehrbares, nicht-rivales Gut. Wohl aber erkennt das geltende Recht ein Eigentum an [[Datenträger]]n an. Noch nicht abschließend geklärt ist bisher, inwieweit sich das Eigentum am Datenträger oder an einem Daten produzierenden Gerät auf die gespeicherten bzw. produzierten Daten erstreckt. | |||
Das [[österreich]]ische Kernstrafrecht kennt den Datenbegriff seit der Einführung des {{§|126a|StGB|RIS-B|DokNr=NOR40093647}} StGB (Datenbeschädigung). Im Laufe der Zeit wurden weitere Tatbestände hinzugefügt, sodass heute auch der betrügerische Datenverarbeitungsmissbrauch ({{§|148a|StGB|RIS-B|DokNr=NOR40059228}} StGB), Datenfälschung ({{§|225a|StGB|RIS-B|DokNr=NOR40033824}} StGB), die Störung der Funktionsfähigkeit eines Computersystems ({{§|126b|StGB|RIS-B|DokNr=NOR40093648}} StGB) und diverse Vorfelddelikte (ua {{§|118a|StGB|RIS-B|DokNr=NOR40093646}}, {{§|119a|StGB|RIS-B|DokNr=NOR40033808}} und {{§|126c|StGB|RIS-B|DokNr=NOR40050382}} StGB) bestraft werden können.<ref>Susanne Reindl-Krauskopf: ''Computerstrafrecht im Überblick.'' 2. Auflage. Facultas Verlag, Wien 2009, ISBN 978-3-7089-0523-5, S. 8f.</ref> | |||
Ferner findet sich eine differenzierte Darstellung des Begriffs im {{§|4|DSG|RIS-B|DokNr=NOR40113702}} Datenschutzgesetz 2000 (DSG). So wird zwischen personenbezogenen und nicht personenbezogenen Daten unterschieden, wobei nur erstere durch das DSG geschützt werden. | |||
== Informatik == | |||
Laut Definition der inzwischen abgelösten Norm [[Deutsches Institut für Normung|DIN]] [[Liste der DIN-Normen/DIN 1–49999#DIN 40000–49999|44300]] Nr. 19 waren Daten (ab 1985) „Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.“ | |||
Gemäß Terminologie der geltenden Norm des internationalen Technologiestandards ISO/IEC 2382-1 für Informationstechnik (seit 1993) sind Daten – ''Data'': „a reinterpretable representation of information in a formalized manner, suitable for communication, interpretation, or processing“ – eine wieder interpretierbare Darstellung von Information in formalisierter Art, geeignet zur Kommunikation, Interpretation oder Verarbeitung. | |||
In der [[Informatik]] und [[Datenverarbeitung]] versteht man ''Daten'' gemeinhin als ([[Maschinenlesbar|maschinen]]-)lesbare und -bearbeitbare, in der Regel [[Digitaldaten|digitale]] Repräsentation von [[Information]]. Ihr Inhalt wird dazu meist zunächst in [[Zeichen]] bzw. [[Zeichenkette]]n [[Kodierung|kodiert]], deren Aufbau strengen Regeln folgt, der sogenannten [[Syntax]]. Um aus Daten wieder die ''Informationen'' zu abstrahieren, müssen sie in einem Bedeutungskontext interpretiert werden.<ref name="einf-inf" /> So kann eine Ziffernfolge wie „[[123456]]“ zum Beispiel in Abhängigkeit vom Kontext für eine [[Telefonnummer]], eine [[Kontonummer]] oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Die betrachtete Zeichenfolge „123456“ oder auch „11110001001000000“ als solche kann nur als Aneinanderreihung von Ziffern erkannt werden; ihre konkrete Bedeutung wird erst im jeweils passenden Kontext (siehe [[Semantik]]) klar. | |||
Die [[Speicher]]ung von Daten erfolgt auf [[Datenspeicher]]n, wie z. B. Festplatten, DVDs, Flash-Speichern oder auch Magnetbändern, früher z. B. auch [[Lochkarte]]n. Diese Datenträger gelten als [[Hardware]], während die auf oder in ihnen enthaltenen Daten als „immaterieller Begriff“ zu verstehen sind.<ref>{{Internetquelle |url=http://www.cr-online.de/ |titel=Internetregulierung |sprache=de |abruf=2023-02-21}}</ref><ref>{{Literatur |Titel=Digitale Identität: Die naive Datenkuh |Sammelwerk=Der Tagesspiegel Online |ISSN=1865-2263 |Online=https://www.tagesspiegel.de/meinung/die-naive-datenkuh-1915681.html |Abruf=2023-02-21}}</ref> | |||
Die Form der Darstellung von Daten nennt man [[Kodierung]], die Menge der dabei möglichen Zeichen nennt man Code[[alphabet]] (z. B. [[UTF-8]]). Daten können unterschiedlich kodiert sein, d. h. in unterschiedlichen [[Code]]s notieren, aber dennoch die gleiche Information repräsentieren.<ref>Peter Rechenberg, Gustav Pomberger: ''Informatik Handbuch.'' 4. Auflage. Carl Hanser Verlag, München, ISBN 978-3-446-40185-3, S. 189.</ref><ref name="FavreB">{{Literatur |Autor=Bernard Favre-Bulle |Titel=Information und Zusammenhang: Informationsfluss in Prozessen der Wahrnehmung, des Denkens und der Kommunikation |Verlag=Springer Vienna |Datum=2001-04-11 |ISBN=978-3-211-83468-8 |Online=https://books.google.de/books?id=ypvIlUW8MQMC&pg=PA35&lpg=PA35&hl=de |Abruf=2023-02-21}}</ref> In der heutigen Digitaltechnik hat sich die Kodierung in [[Binärcode|binärer Form]] fast ausschließlich durchgesetzt. Ein [[Bit]] ist dabei die kleinste Informationseinheit. Grundsätzlich ist neben Binärcode auch die Verwendung von Alphabeten mit mehr als zwei Symbolen möglich. | |||
* Gebräuchliche Speicherzellen kennen nur die Zustände „an“ und „aus“, die als „1“ und „0“ und damit als die Basiswerte des Binärsystems interpretiert werden. | |||
* Speicherzellen mit mehr als einem Bit pro Zelle finden sich in Flash-Speichern, z. B. die [[MLC-Speicherzelle|MLC-]] oder [[TLC-Speicherzelle]]. | |||
* Speicherzellen für überlagerte Quantenzustände, sogenannte [[Qubit]]s, befinden sich noch im Forschungsstadium. | |||
=== Kategorisierung von Daten === | |||
Man unterscheidet: | |||
* [[Datenstruktur|strukturierte Daten]]: Die Daten (zum Beispiel in [[Datenbank]]en oder [[Datei]]en) weisen eine gleichartige Struktur auf, {{Siehe auch|Datenmodell}} | |||
* [[semistrukturierte Daten]] (z. B. [[Extensible Markup Language]] (XML)) oder | |||
* [[unstrukturierte Daten]] (beispielsweise Dokumente, beliebige Texte, Grafiken). | |||
Nach dem ''Grad ihrer Beständigkeit'' unterscheidet man: | |||
* ''Transiente Daten'' (flüchtig, übergangsweise) versus ''persistente Daten'' (dauerhafter). | |||
* [[Eingabe und Ausgabe|Eingabedaten und Ausgabedaten]] bzw. zu speichernde versus gespeicherte Daten. | |||
Nach dem Grad der [[Digitalisierung]] unterscheidet man: | |||
* [[Analoge Daten]], die nicht digital zur Verfügung stehen und | |||
* [[digitale Daten]], die digital zur Verfügung stehen. | |||
Nach dem [[Aggregation (Wirtschaft)|Aggregationsgrad]] unterscheidet man: | |||
* [[Mikrodaten]] auf unterster statistischer Ebene wie [[personenbezogene Daten]] | |||
* [[Makrodaten]] auf höchster statistischer Ebene wie [[Bevölkerung]]. | |||
;Weitere Begriffe für Datenarten: | |||
* Anwendungsdaten sind fachlich-funktional zu verarbeitende Daten – im Gegensatz zu technischen Daten (wie Installationsdaten, [[Programmcode]], [[Ausführbare Datei]]en usw.) Anwendungsdaten lassen sich unterscheiden nach Stammdaten, Bewegungsdaten und Bestandsdaten; siehe auch [[Stammdaten#Eigenschaften der Stamm- und Bewegungsdaten|Stammdaten]]. | |||
* [[Neartime-Daten]] sind Kopien von aktuellen Daten mit etwas geringerer Aktualität als die Originaldaten (in [[Echtzeit]] Realtime-Daten). | |||
* [[Datensicherung|Sicherungsdaten]] sind zur Sicherheit kopierte Datenbestände, auf die bei Bedarf, z. B. zur Wiederherstellung irrtümlich gelöschter Daten zurückgegriffen werden kann. | |||
* Originäre versus abgeleitete Daten: Originär sind erst- und einmalig vorhandene Daten. Aus ihnen können Summen, Kopien oder andere Konstrukte gebildet (abgeleitet) werden. | |||
* Serielle Daten (auch sequentielle Daten genannt): Die Daten werden nicht unter dem Managementsystem einer [[Datenbank]] (DBMS) verwaltet, sondern in einer Standard-Dateiform des [[Betriebssystem]]s gespeichert und verarbeitet. In der Regel ist dabei ein [[Direktzugriff]] nicht möglich; die Daten müssen dann der Reihe nach geschrieben bzw. gelesen werden. | |||
* Historische Daten: Der Datenbestand zu bestimmten Zeitpunkten (z. B. Stand vor Änderungen, Stand zum Jahresanfang) kann getrennt gespeichert und später in bestimmten Funktionen (z. B. Bildschirmanzeige, Vergleichen alt vs. aktuell) verwendet werden. | |||
=== Formen der Verarbeitung von Daten === | |||
Als ''Datenoperationen'' beim Speichern von Daten sind nach dem Prinzip „[[CRUD]]“ das erstmalige Erfassen von Daten (c''reate''), das Lesen (r''ead''), das Verändern (u''pdate'') und das Löschen (d''elete'') zu unterscheiden. Gegenstand solcher Operationen ist zumeist eine bestimmte ''Gruppe von Daten'' (wie eine Kundenadresse, Bestellung etc.), die z. B. nach den Regeln der [[Datenmodellierung]] gebildet wurde. Diese datentechnischen Operationen werden durch [[Computerprogramm]]e ausgelöst, d. h. über entsprechende, in diesen enthaltene [[Anweisung (Programmierung)|Befehle]] (als Teil eines [[Implementierung|implementierten]] [[Algorithmus]]) vorgegeben. Die Operationen sind einerseits selbst Input-/Output-Befehle in Bezug auf den Datenbestand, sie stehen zum Teil aber auch im Zusammenhang mit [[Eingabe und Ausgabe]] seitens der [[Benutzer]] des Computerprogramms. | |||
Zweck der Speicherung von Daten ist in der Regel ihre spätere ''Nutzung''. Dabei lässt sich die einfache Wiedergabe (z. B. in Form von Anzeigen oder Listen) unterscheiden von dem Auswerten, bei dem die Daten in unterschiedliche logische, mathematische oder darstellende Verfahren einfließen (z. B. zur Summenbildung, Durchschnittsberechnung, Differenzbildung, [[Datenabgleich]], als grafische Diagramme usw.). | |||
Eine besondere Form der Daten-Verarbeitung sind der ''Datenimport'' (Dateiimport) und ''Datenexport'' (Dateiexport) als gängige Methode zum [[Datenaustausch]] zwischen verschiedenen Systemen. Hierbei ist unter Umständen auch eine [[Konvertierung (Informatik)|Datenkonvertierung]] erforderlich, wenn Ausgangs- und Zielsystem unterschiedliche [[Datenformat]]e oder [[Dateiformat]]e verwenden. | |||
=== {{Anker|Ebenen}} Betrachtungs- und Wirkungsebenen für Daten === | |||
[[Datei:Datenbegriffe.png|mini|Wie Daten entstehen und welche Begriffe/Bezeichnungen dabei auftreten können]] | |||
Der Begriff „Daten“ tritt in unterschiedlichen, miteinander im Zusammenhang stehenden Wirkungs- und Betrachtungsebenen auf. Dies sind im Wesentlichen: | |||
* Im ''[[Datenmanagement]]'' werden allgemeine Rahmenbedingungen für das Arbeiten mit den Daten festgelegt und im [[Systemumgebung|laufenden Betrieb]] angewendet, zum Beispiel: Wer gilt als Eigentümer der Daten? Wo und wie entstehen die Daten oder werden sie genutzt? Wer darf auf sie zugreifen ([[Datensicherheit]]); Regeln und Maßnahmen für den [[Datenschutz]] und die [[Datensicherung]]; unternehmensweite Modelle und Namenskonventionen; Einsatzkonzepte für Datenwerkzeuge usw. | |||
* ''Datendesign:'' Vornehmlich bei [[Softwareentwicklung]] im Rahmen von [[Projekt]]en spielen Daten, neben der [[Funktionalität (Produkt)|Funktionalität]] der Programme, eine zentrale Rolle. Unter Einsatz individuell hierfür verfügbarer Verfahren und Werkzeuge werden dabei Details der [[Datenarchitektur]] festgelegt, z. B.: Welche Daten kennt die Software? Wie stehen sie untereinander im [[Datenmodellierung|Zusammenhang]]? Gibt es sie bereits? Werden sie in Datenbanken oder in Dateien verwaltet/gespeichert? Pflicht- oder optional mögliches Feld? Welche [[Datentyp]]en und [[Datenstruktur]]en sind zu bilden? Welche Ausprägungen und Inhalte kann ein [[Attribut (Programmierung)|Attribut]] annehmen? | |||
* ''Technische [[Implementierung]]'': | |||
** Die Ergebnisse der Designfestlegungen werden (bei Speicherung in einem [[Datenbank]]system) in ein ''[[Datenbankmodell]]'' eingestellt, als Grundlage für die Verarbeitung und Verwaltung der Daten, die die Datenbank aufnehmen soll. | |||
** In der ''[[Programmierung]]'' entsteht der [[Programmcode]], über dessen [[Anweisung (Programmierung)|Befehle]] Daten verarbeitet werden. Mit sogenannten [[Deklaration (Programmierung)|Deklarationen]] werden Datenstrukturen mit ihren einzelnen [[Datenfeld]]ern so angeordnet, dass sie die Daten aufnehmen können, und dass bei der [[Compiler|Übersetzung]] Befehle erzeugt werden, wie es den Feldeigenschaften (Position, Länge, Datenformat usw.) entspricht. | |||
* ''Tatsächliche Daten:'' Hier werden die Daten tatsächlich gespeichert und von den Programmen benutzt. | |||
=== Daten in der Programmierung === | |||
Daten sind vornehmlich Quelle und Ziel der Verarbeitung in [[Computerprogramm]]en. Dazu sind im Programm, d. h. in dessen [[Quelltext]], dem Verarbeitungszweck entsprechende [[Deklaration (Programmierung)|Deklarationen]] und [[Anweisung (Programmierung)|Befehle]] erforderlich. Diese können, abhängig von der [[Programmiersprache]], erhebliche [[Syntax|syntaktische]] und auch sprachlich-begriffliche (semantische) Unterschiede aufweisen. Wichtige datenbezogenen Begriffe sind hier (jeweils mit Synonymen, ähnlichen Begriffen und ''Beispiel'' angegeben): | |||
* Datenbestand: Dort werden Daten gespeichert, von einem Programm erzeugt, verändert oder gelöscht und/oder von dort gelesen (siehe auch [[CRUD]]). Ähnlich: [[Datenbank]], [[Datei]], [[Datenbasis]]; ''Beispiel: Kundenadressen, Bestelldaten.'' | |||
* [[Datensatz]]: Fasst die auf ein [[Objekt (Programmierung)|Objekt]] ([[Entität]]) bezogenen Angaben/Werte zusammen. Ähnliche Begriffe: [[Tupel]], [[Verbund (Datentyp)|Verbund]], [[Recordset]]; ''Beispiel: Adresse eines bestimmten Kunden.'' | |||
* [[Datenfeld]]: Eine einzelne, elementare, zu einem Datensatz gehörende Angabe oder Information. ''Beispiel: Geburtsdatum, Mehrwertsteuersatz in Prozent, Postleitzahl.'' Ähnlich: [[Variable (Programmierung)|Variable]], [[Konstante (Programmierung)|Konstante]], Feld. | |||
* [[Datenstruktur]]: Zusammenfassung mehrerer Datenfelder zu einer Gruppe. Vertreter: [[Verbund (Datentyp)|Verbund]] (Datengruppe), [[Feld (Datentyp)|Array/Tabelle]], [[Stapelspeicher|Stack]]; ''Beispiel: Telefonnummer(n) des Kunden, Ländercode, Vorwahl, Tel-Nr,'' gegebenenfalls ''Durchwahl'' | |||
* [[Datentyp]]: Klassifizierung für Datenfelder und -strukturen, zum Beispiel Text, numerisch/Gleitkomma, Array. Hieran orientieren sich die Befehle (Methoden, Funktionen), die auf die Datenfelder angewendet werden können. Ähnlich: [[Datenformat]]; ''Beispiel: Postleitzahl ist ein numerisches Feld'' | |||
Weitere Datenbegriffe, denen in der [[Programmierung]] / [[Softwaretechnik|Softwareentwicklung]] eine wesentliche Bedeutung zukommt, sind beispielsweise: [[Datenmodellierung]], [[Eingabe und Ausgabe]], [[Datenfluss]], …<!-- bitte nur wesentliche (und auch Laien interessierende) Begriffe ergänzen --> | |||
=== Statistik === | |||
Seit der Jahrtausendwende soll der Anteil der digitalen Daten den der analogen Aufzeichnungsbestände überschritten haben.<ref>{{Internetquelle |url=http://www.martinhilbert.net/worldinfocapacity-html |titel=The World’s Technological Capacity to Store, Communicate, and Compute Information |hrsg=martinhilbert.net |abruf=2015-09-29}}</ref> Im Jahre 2020 wurden etwa 60 Zettabytes (6*10<sup>22</sup> [[Bytes]] = 60 Billionen Gigabytes) an digitalen Daten erzeugt und weiterverwendet.<ref>{{Internetquelle |autor=IDC Corporate |url=https://www.idc.com/getdoc.jsp?containerId=prUS46286020 |titel=Global DataSphere Forecast |datum=2020-01-21 |sprache=en |abruf=2021-02-20 |archiv-url=https://web.archive.org/web/20211206002711/https://www.idc.com/getdoc.jsp?containerId=prUS46286020 |archiv-datum=2021-12-06 |offline=ja |archiv-bot=2023-04-08 22:04:22 InternetArchiveBot }}</ref> Das Gesamtvolumen wuchs in den letzten zehn Jahren um mehr als das zwanzigfache und wächst zurzeit jährlich etwa um 25 %. In Blu-ray Discs ausgedrückt (25 GB, 2.500 TB/m^3, 1,5 TB/kg, Acryl 1,2 t/m^3) entspricht dies dem Gewicht der Giseh-Pyramide, wobei der “Datenhaufen” deren Größe übersteigt. | |||
Auch in den nächsten Jahren wird sich der weltweite Datenverkehr voraussichtlich vervielfachen,<ref>{{Internetquelle |url=http://www.spiegel.de/netzwelt/web/weltweiter-datenverkehr-soll-sich-bis-2016-vervierfachen-a-836495.html |titel=Datenverkehrprognose für 2016 |werk=[[Spiegel Online]] |abruf=2013-05-04}}</ref> ebenso wie der Anteil an „dunkler Information“,<ref>{{Internetquelle |url=https://www.heise.de/tp/features/34-Gigabyte-der-taegliche-Informationskonsum-eines-US-Amerikaners-3383731.html |titel=34 Gigabyte – der tägliche Informationskonsum |werk=[[Telepolis]] |abruf=2016-08-22}}</ref> was bedeutet, dass immer mehr Information zwischen Maschinen ausgetauscht wird. Für 2020 wird „die Menge an Daten, die erstellt, vervielfältigt und konsumiert werden, bei etwa 40 Zettabytes liegen – und damit 50-mal so hoch sein wie noch vor drei Jahren“.<ref>{{Internetquelle |url=https://www.welt.de/wirtschaft/webwelt/article118099520/Datenvolumen-verdoppelt-sich-alle-zwei-Jahre.html |titel=Datenvolumen verdoppelt sich alle zwei Jahre |werk=[[Die Welt|Welt Online]] |datum=2013-07-16 |abruf=2015-11-24}}</ref> | |||
== Betriebs- und Volkswirtschaftslehre == | |||
In [[Betriebswirtschaftslehre|Betriebs-]] und [[Volkswirtschaftslehre]] versteht man unter Daten gegebene und meist durch den [[Entscheidungsträger]] nicht beeinflussbare ökonomische Größen. Beide Wissenschaften nehmen die etymologische Herkunft des Wortes ({{laS|datum}}, ‚das Gegebene‘) wörtlich. Die [[Umwelteinfluss|Umwelteinflüsse]] auf diese Entscheidungen teilt man in ''endogene Faktoren'' wie die innerbetriebliche Akzeptanz von Unternehmensentscheidungen oder die Störanfälligkeit bei der Durchführung der Leistungsprozesse und ''exogene Faktoren'' ein. Hierzu gehören ''naturbedingte'' (Angaben zum [[Klima]] und [[Wetterdaten]]) und ''gesellschaftsbedingte Daten'' (wie [[Gesetz]]e, [[Tarifvertrag|Tarifverträge]], [[Aktionsparameter]] der [[Wettbewerb (Wirtschaft)|Konkurrenten]], [[Lieferant]]en und [[Kunde|Abnehmer]] oder [[Institution]]en), die nicht als Reaktion auf eigene Aktionsparameter zu verstehen sind.<ref>[https://books.google.de/books?id=5PWHBwAAQBAJ&pg=PA56&dq=datenparameter+umwelt&hl=de&sa=X&redir_esc=y#v=onepage&q=datenparameter%20%20&f=false Gerhard Vogler, ''Allgemeine Betriebswirtschaftslehre'', 1976, S. 55.]</ref> Unterbleibt jeglicher Beeinflussungsversuch durch den Entscheidungsträger, handelt es sich wie bei den naturbedingten Gegebenheiten auch bei den gesellschaftsbedingten um [[Datenparameter]]. Sie sind insbesondere die durch die äußere Umgebung eines Unternehmens ([[Markt]], [[Staat]], [[Zentralbank]], [[Aufsichtsbehörde]]n, [[Ausland]]) festgelegten Rahmenbedingungen, welche zumindest kurzfristig weder direkt noch indirekt durch eigene [[Entscheidung]]en beeinflussbar sind. Der Entscheidungsrahmen sieht mithin die Entscheidungsumwelt als ein unveränderliches Datum an. | |||
Als wesentliche Entscheidungsgrundlage dienen [[Unternehmensdaten]], die ein [[Unternehmen]] bei seiner [[Tätigkeit]] innerhalb eines [[Geschäftsjahr]]es sammelt. Sie werden unterteilt nach [[Operative Daten|operativen Daten]], die zur Abwicklung des [[Operatives Geschäft|operativen Geschäfts]] dienen und [[dispositive Daten]], die das [[Management]] für [[Managemententscheidung]]en benötigt. Lediglich ein geringer Teil aus dem [[Rechnungswesen]] gelangt im Rahmen der [[Publizitätspflicht]] aus [[Bilanzrecht (Deutschland)|bilanzrechtlichen]] Gründen durch [[Veröffentlichung]] im [[Jahresabschluss]] oder in [[Quartalsbericht]]en an die interessierte [[Öffentlichkeit]]. | |||
Unterschieden wird in beiden Wissenschaften zwischen „harten“ und [[Weiche Daten|weichen Daten]], je nachdem, ob sie mit [[Quantifizierung|quantifizierenden]] [[Messmethode]]n als [[Messzahl]]en gewonnen werden oder ob sie [[person]]en- und/oder [[situation]]sabhängig und für unterschiedliche [[Interpretation]]en zugänglich sind. | |||
== Technik == | |||
* [[Technische Daten]] sind Daten, welche die wesentlichen technischen Merkmale von [[Gegenstand|Gegenständen]] beschreiben. Als Gegenstände kommen insbesondere alle technisch orientierten [[Anlage (Technik)|Anlagen]], [[Arbeitsgerät]]e, [[Arbeitsmittel]], [[Betriebsmittel (Produktion)|Betriebsmittel]], [[Bauteil (Technik)|Bauteile]], [[Computer]], [[Haushaltsgerät]]e, [[Maschine]]n, [[Produktionsmittel]], [[Transportmittel]], [[Verkehrsmittel]], [[Ware]]n oder [[Werkstoff]]e in Betracht. Technische Daten sind technische Angaben zu einem Gerät wie beispielsweise [[Abmessungen]], [[Masse (Physik)|Gewicht]], [[Leistung (Physik)|Leistung]] oder [[Verbrauch]] ([[Endenergieverbrauch|Energieverbrauch]] wie [[Stromverbrauch]] oder [[Wasserverbrauch]])<ref>{{Literatur |Autor=Anette Dralle, Werner Wolski |Titel=Kompaktwörterbuch Deutsch als Fremdsprache |Verlag=PONS GmbH |Datum=2019 |ISBN=978-3-12-516226-6 |Online=https://books.google.com/books?id=6_WADwAAQBAJ&newbks=0&printsec=frontcover&pg=PA240&dq=%22technische+Daten%22&hl=de |Abruf=2023-02-21}}</ref> oder auch [[Inhaltsstoff]]e in [[Arzneimittel]]n, [[Genussmittel]]n, [[Getränk]]en, [[Kosmetik]]a sowie [[Lebensmittel|Lebens-]] und [[Nahrungsmittel]]n. Technische Daten ergeben sich unter anderem aus [[Bauanleitung]]en, [[Baubeschreibung (Bauvertrag)|Baubeschreibungen]], [[Gebrauchsanleitung]]en, [[Handbuch|Manuals]], [[Packungsbeilage]]n, [[Schaltplan|Schaltplänen]] usw. | |||
* Im Bereich der [[Telemedien]] unterscheidet man [[Nutzungsdaten]], [[Randdaten]] oder [[Verkehrsdaten]]. | |||
* [[Umweltdaten]] geben Auskunft über den [[Zustand (Physik)|Zustand]] und die [[Messreihe|Entwicklung]] der [[Umwelt]] und können [[empirisch]] durch [[Messung]] [[Datenerhebung|erhoben]] werden. | |||
== Beispiele == | |||
=== Daten im allgemeinen Sinn === | |||
* Inhalte von [[Lexikon|Lexika]] und Büchern | |||
* Die an einem [[Thermometer]] angezeigte Temperatur | |||
* Die [[Jahresring]]e eines Baumes oder ähnliche biologische (messbare) Merkmale | |||
* Die (gemessene) Geschwindigkeit eines vorbeifahrenden Fahrzeugs | |||
* Antworten bei [[Befragung|Umfragen]], [[Volkszählung]]en – auf die Fragen in Fragebögen | |||
* Ergebnisse von Experimenten in den Naturwissenschaften, technische Fakten | |||
* Pressearchive von Zeitungsverlagen | |||
* Der Inhalt von Schriftstücken (z. B. Briefe, Notizen, Protokolle usw.) | |||
=== Daten in der Informatik === | |||
* Bits und Bytes, zum Beispiel: | |||
** bei der Speicherung auf Datenträgern wie Festplatten, USB-Sticks oder DVDs | |||
** bei der Übertragung über das Internet oder an das Mobiltelefon | |||
* als [[Zeichenkette]]n bzw. Texte in [[Textdatei]]en | |||
* als [[Binärdatei]]en (z. B. [[Maschinencode]], [[Datenbank]]inhalte, digitale Fotos, Tonaufnahmen oder Videos usw.) | |||
== Siehe auch == | |||
* [[Basisdaten]] | |||
* [[Big Data]] | |||
* [[Data Science]] | |||
* [[Data-Mining]] | |||
* [[Datagramm]] | |||
* [[Datenhehlerei]] | |||
* [[Informationsqualität]] | |||
* [[Metadaten]] | |||
* [[Paradaten]] | |||
* [[Dunkles Zeitalter der Digitalisierung]] | |||
== Literatur == | |||
* Katharina Morik, Walter Krämer (Hrsg.): ''Daten – wem gehören sie, wer speichert sie, wer darf auf sie zugreifen?'' (Nordrhein-Westfälische Akademie der Wissenschaften und der Künste: Reihe S; 16) F. Schöningh Verlag, Paderborn [2018], ISBN 978-3-506-79248-8. | |||
* Herbert E. Wiegand: ''Wörterbuchforschung.'' Teilband 1. de Gruyter, Berlin 1998, ISBN 3-11-013584-1, Kapitel 1.5.2.2: »Bemerkungen zum Gebrauch von ''Daten'' und ''Information''« (S. 160–171) ([http://books.google.de/books?id=KqwD2RjaNesC&pg=PA163&dq=daten+gegebenheit&hl=de&sa=X&ei=7HnSUsDiF4jOswae44GoBQ&ved=0CD4Q6AEwAjgK#v=onepage&q=daten%20gegebenheit&f=false Einblick in den Referenztext via Google Books]). | |||
== Weblinks == | |||
{{Wiktionary}} | |||
== Einzelnachweise == | |||
<references responsive> | |||
<ref name="Duden_Daten"> | |||
{{Internetquelle |url=https://www.duden.de/rechtschreibung/Daten |titel=Duden {{!}} Daten {{!}} Rechtschreibung, Bedeutung, Definition, Herkunft |sprache=de |abruf=2023-02-21}} | |||
</ref> | |||
<ref name="Proebster"> | |||
{{Literatur |Autor=Walter E. Proebster |Titel=Rechnernetze: Technik, Protokolle, Systeme, Anwendungen |Verlag=Oldenbourg |Datum=2002 |ISBN=978-3-486-25777-9 |Online=https://books.google.de/books?id=HiNyreewXzoC&pg=PA59&lpg=PA59&dq=Definition:Daten&source=bl&ots=gnCGN5QXrk&sig=30FI2ee75V-ONEzFAE5v56fPo34&hl=de&sa=X&ei=3b_OUuOOJZHDswbVwoD4DA |Abruf=2023-02-21}} | |||
</ref> | |||
<ref name="Witt"> | |||
{{Literatur |Autor=Bernhard C. Witt |Titel=Datenschutz kompakt und verständlich: Eine praxisorientierte Einführung |Verlag=Springer-Verlag |Datum=2010-04-14 |ISBN=978-3-8348-9653-7 |Online=https://books.google.de/books?id=_NoYxjz6lF8C&pg=PA4&dq=%22daten+definition%22&hl=de&sa=X&ei=MZXJUv-tL4GNtAb57YDABQ |Abruf=2023-02-21}} | |||
</ref> | |||
</references> | |||
{{Normdaten|TYP=s|GND=4135391-2}} | |||
{{Rechtshinweis}} | |||
[[Kategorie:Daten| ]] | |||
[[Kategorie:Abstraktum]] | |||
[[Kategorie:Semiotik]] | |||
[[Kategorie:Datenanalyse]] | |||
[[Kategorie:Statistik]] | |||
[[Kategorie:Betriebswirtschaftslehre]] | |||
[[Kategorie:Volkswirtschaftslehre]] | |||
[[Kategorie:IT-Grundlagen]] | [[Kategorie:IT-Grundlagen]] |
Version vom 12. April 2023, 12:26 Uhr
topic - Kurzbeschreibung
Beschreibung
Installation
Syntax
Optionen
Parameter
Umgebungsvariablen
Exit-Status
Anwendungen
Fehlerbehebung
Konfiguration
Dateien
Siehe auch
Unterseiten
- Daten
- Daten verschlüsseln
- Datenbank
- Datenbank/Kryptografie
- Datenerfassung
- Datenfluss
- Datenkapselung (Netzwerktechnik)
- Datenpaket
- Datenschutz
- Datensicherheit
- Datensicherung
- Datensicherung/Aufbewahrung
- Datensicherung/Echtzeitanwendungen
- Datensicherung/Geschichte
- Datensicherung/Programm
- Datensicherung/Recht
- Datensicherung/Richtlinie
- Datensicherung/Sicherungsarten
- Datensicherung/Speichermedien
- Datensicherung/Strategie
- Datenspeicher
- Datenstrom
- Datenstruktur
- Datentyp
- Datenverkehr
- Datenübermittlung
- Datenübertragung
Sicherheit
Dokumentation
RFC
Man-Pages
Info-Pages
Links
Einzelnachweise
Projekt
Weblinks
Testfragen
Testfrage 1
Testfrage 2
Testfrage 3
Testfrage 4
Testfrage 5
TMP
Daten bezeichnet als Plural von Datum Fakten, Zeitpunkte oder kalendarische Zeitangaben. Als Pluralwort steht es für durch Beobachtungen, Messungen u. a. gewonnene [Zahlen]werte sowie darauf beruhende Angaben oder formulierbare Befunde.[1]
Allgemeines
Während Daten in der Umgangssprache Gegebenheiten, Tatsachen oder Ereignisse sind, sind Daten in der Fachsprache Zeichen, die eine Information darstellen.[2] In verschiedenen Fachgebieten wie z. B. der Informatik, der Mathematik, der Wirtschaftstheorie, der Neurowissenschaft oder den Biowissenschaften sind unterschiedliche – meist ähnliche – Definitionen gebräuchlich. Eine einheitliche Definition gibt es bisher nicht.[3][4] Das liegt auch daran, dass die verschiedenen Fachgebiete dem Begriff Daten einen unterschiedlichen Begriffsinhalt zuordnen, der nur dieses Fachgebiet betrifft.
Im Datenschutzrecht sind im Wesentlichen die personenbezogenen Daten gemeint, d. h. Angaben über natürliche Personen, z. B. das Geburtsdatum oder der Wohnort.
Für die Datenverarbeitung und (Wirtschafts-)Informatik werden Daten als Zeichen (oder Symbole) definiert, die Informationen darstellen und die dem Zweck der Verarbeitung dienen.[5][6]
Die Wirtschaftstheorie beschreibt Daten als diejenigen volkswirtschaftlichen Gegebenheiten, die einen wesentlichen Einfluss auf den Ablauf der Wirtschaft haben, selbst dabei aber nicht beeinflusst werden.[5][7]
Vorlage:Anker Etymologie und Sprachgebrauch
Daten oder zuvor Data sind eigentlich Pluralbildungen von Datum,[8] das als Lehnwort aus dem Lateinischen zurückgeht auf datum ‚gegeben‘ (PPP zu lat. dare ‚geben‘) bzw. substantiviert ‚das Gegebene‘.[9] Auf wichtigeren Schriftstücken war in der üblichen Einleitungsformel vermerkt „datum …“ („gegeben (am) …“) mit <Zeitangabe> und eventueller <Ortsangabe> – womit deren Inhalt „das Gegebene“ wurde. Die Pluralform Daten zu Datum folgt anderen Wörtern lateinischen Ursprungs wie Studien – Studium oder Individuen – Individuum.
Da sich in der deutschen Sprache die Bedeutung von „Datum“ im allgemeinen Sprachgebrauch eingeengt hat auf Kalenderdatum, wird für die Pluralbildung im Sinne von Zeitpunkten oft nicht die Wortform „Daten“ benutzt, sondern stattdessen von „Datumsangaben“ oder „Terminen“ gesprochen. Umgekehrt werden für die Einzahl von „Daten“ im weiteren Sinn als eine gegebene Messung, Information oder Zeichen(kette) dann Wörter wie „Wert“, „Angabe“ oder „Datenelement“ verwendet. Es handelt sich also um ein Pluraletantum.[1]
- Daten im Unterschied zu Information
Obwohl diese beiden Ausdrücke in der Umgangssprache oft synonym benutzt werden, unterscheidet die Informationstheorie beide dem Begriff nach grundlegend voneinander.[10] Details und Beispiele siehe → Information.
Recht
Das deutsche Recht verwendet an verschiedenen Stellen den Datenbegriff als Rechtsbegriff. Verwendet wird der Begriff etwa im Datenschutz (Art. 4 Nr. 1 DSGVO) oder im Strafrecht unter „Ausspähen von Daten“ (Vorlage:§ StGB); „Daten“ in diesem Sinn sind „nur solche, die elektronisch, magnetisch oder sonst nicht unmittelbar wahrnehmbar gespeichert sind oder übermittelt werden.“ Diese strafrechtliche Bestimmung von Daten stellt auf die technische Sicht von Daten als maschinenlesbar codierte Zeichen ab, die an ein Speicher- oder Übertragungsmedium gebunden sind. Davon zu unterscheiden ist eine semantische Dimension von Daten als Träger von Informationen. Diese Unterscheidung hat auch eine rechtliche Bedeutung. Die Frage nach dem rechtlichen Schutz für den Informationsgehalt von Daten führt in den Anwendungsbereich des geistigen Eigentums (Urheberrecht, gewerblicher Rechtsschutz) oder des Datenschutzes. Unbefugte Veränderungen der Codierung auf einem Datenträger sind dagegen als Eingriff in das Sacheigentum am Datenträger anzusehen und damit sachenrechtlich und ggf. auch strafrechtlich relevant.
Eigentum an Daten: Ein dem Sacheigentum (§Vorlage:§ ff. BGB) entsprechendes Eigentum an Daten kennt das Recht in Deutschland nicht. Da die Eigentumsvorschriften auf eine ausschließliche Zuordnung einer nicht beliebig vermehrbaren und eindeutig identifizierbaren Sache ausgerichtet sind, passen sie nicht zum Charakter von Daten als beliebig, fast ohne Kosten vermehrbares, nicht-rivales Gut. Wohl aber erkennt das geltende Recht ein Eigentum an Datenträgern an. Noch nicht abschließend geklärt ist bisher, inwieweit sich das Eigentum am Datenträger oder an einem Daten produzierenden Gerät auf die gespeicherten bzw. produzierten Daten erstreckt.
Das österreichische Kernstrafrecht kennt den Datenbegriff seit der Einführung des Vorlage:§ StGB (Datenbeschädigung). Im Laufe der Zeit wurden weitere Tatbestände hinzugefügt, sodass heute auch der betrügerische Datenverarbeitungsmissbrauch (Vorlage:§ StGB), Datenfälschung (Vorlage:§ StGB), die Störung der Funktionsfähigkeit eines Computersystems (Vorlage:§ StGB) und diverse Vorfelddelikte (ua Vorlage:§, Vorlage:§ und Vorlage:§ StGB) bestraft werden können.[11]
Ferner findet sich eine differenzierte Darstellung des Begriffs im Vorlage:§ Datenschutzgesetz 2000 (DSG). So wird zwischen personenbezogenen und nicht personenbezogenen Daten unterschieden, wobei nur erstere durch das DSG geschützt werden.
Informatik
Laut Definition der inzwischen abgelösten Norm DIN 44300 Nr. 19 waren Daten (ab 1985) „Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.“
Gemäß Terminologie der geltenden Norm des internationalen Technologiestandards ISO/IEC 2382-1 für Informationstechnik (seit 1993) sind Daten – Data: „a reinterpretable representation of information in a formalized manner, suitable for communication, interpretation, or processing“ – eine wieder interpretierbare Darstellung von Information in formalisierter Art, geeignet zur Kommunikation, Interpretation oder Verarbeitung.
In der Informatik und Datenverarbeitung versteht man Daten gemeinhin als (maschinen-)lesbare und -bearbeitbare, in der Regel digitale Repräsentation von Information. Ihr Inhalt wird dazu meist zunächst in Zeichen bzw. Zeichenketten kodiert, deren Aufbau strengen Regeln folgt, der sogenannten Syntax. Um aus Daten wieder die Informationen zu abstrahieren, müssen sie in einem Bedeutungskontext interpretiert werden.[6] So kann eine Ziffernfolge wie „123456“ zum Beispiel in Abhängigkeit vom Kontext für eine Telefonnummer, eine Kontonummer oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Die betrachtete Zeichenfolge „123456“ oder auch „11110001001000000“ als solche kann nur als Aneinanderreihung von Ziffern erkannt werden; ihre konkrete Bedeutung wird erst im jeweils passenden Kontext (siehe Semantik) klar.
Die Speicherung von Daten erfolgt auf Datenspeichern, wie z. B. Festplatten, DVDs, Flash-Speichern oder auch Magnetbändern, früher z. B. auch Lochkarten. Diese Datenträger gelten als Hardware, während die auf oder in ihnen enthaltenen Daten als „immaterieller Begriff“ zu verstehen sind.[12][13]
Die Form der Darstellung von Daten nennt man Kodierung, die Menge der dabei möglichen Zeichen nennt man Codealphabet (z. B. UTF-8). Daten können unterschiedlich kodiert sein, d. h. in unterschiedlichen Codes notieren, aber dennoch die gleiche Information repräsentieren.[14][15] In der heutigen Digitaltechnik hat sich die Kodierung in binärer Form fast ausschließlich durchgesetzt. Ein Bit ist dabei die kleinste Informationseinheit. Grundsätzlich ist neben Binärcode auch die Verwendung von Alphabeten mit mehr als zwei Symbolen möglich.
- Gebräuchliche Speicherzellen kennen nur die Zustände „an“ und „aus“, die als „1“ und „0“ und damit als die Basiswerte des Binärsystems interpretiert werden.
- Speicherzellen mit mehr als einem Bit pro Zelle finden sich in Flash-Speichern, z. B. die MLC- oder TLC-Speicherzelle.
- Speicherzellen für überlagerte Quantenzustände, sogenannte Qubits, befinden sich noch im Forschungsstadium.
Kategorisierung von Daten
Man unterscheidet:
- strukturierte Daten: Die Daten (zum Beispiel in Datenbanken oder Dateien) weisen eine gleichartige Struktur auf, Vorlage:Siehe auch
- semistrukturierte Daten (z. B. Extensible Markup Language (XML)) oder
- unstrukturierte Daten (beispielsweise Dokumente, beliebige Texte, Grafiken).
Nach dem Grad ihrer Beständigkeit unterscheidet man:
- Transiente Daten (flüchtig, übergangsweise) versus persistente Daten (dauerhafter).
- Eingabedaten und Ausgabedaten bzw. zu speichernde versus gespeicherte Daten.
Nach dem Grad der Digitalisierung unterscheidet man:
- Analoge Daten, die nicht digital zur Verfügung stehen und
- digitale Daten, die digital zur Verfügung stehen.
Nach dem Aggregationsgrad unterscheidet man:
- Mikrodaten auf unterster statistischer Ebene wie personenbezogene Daten
- Makrodaten auf höchster statistischer Ebene wie Bevölkerung.
- Weitere Begriffe für Datenarten
- Anwendungsdaten sind fachlich-funktional zu verarbeitende Daten – im Gegensatz zu technischen Daten (wie Installationsdaten, Programmcode, Ausführbare Dateien usw.) Anwendungsdaten lassen sich unterscheiden nach Stammdaten, Bewegungsdaten und Bestandsdaten; siehe auch Stammdaten.
- Neartime-Daten sind Kopien von aktuellen Daten mit etwas geringerer Aktualität als die Originaldaten (in Echtzeit Realtime-Daten).
- Sicherungsdaten sind zur Sicherheit kopierte Datenbestände, auf die bei Bedarf, z. B. zur Wiederherstellung irrtümlich gelöschter Daten zurückgegriffen werden kann.
- Originäre versus abgeleitete Daten: Originär sind erst- und einmalig vorhandene Daten. Aus ihnen können Summen, Kopien oder andere Konstrukte gebildet (abgeleitet) werden.
- Serielle Daten (auch sequentielle Daten genannt): Die Daten werden nicht unter dem Managementsystem einer Datenbank (DBMS) verwaltet, sondern in einer Standard-Dateiform des Betriebssystems gespeichert und verarbeitet. In der Regel ist dabei ein Direktzugriff nicht möglich; die Daten müssen dann der Reihe nach geschrieben bzw. gelesen werden.
- Historische Daten: Der Datenbestand zu bestimmten Zeitpunkten (z. B. Stand vor Änderungen, Stand zum Jahresanfang) kann getrennt gespeichert und später in bestimmten Funktionen (z. B. Bildschirmanzeige, Vergleichen alt vs. aktuell) verwendet werden.
Formen der Verarbeitung von Daten
Als Datenoperationen beim Speichern von Daten sind nach dem Prinzip „CRUD“ das erstmalige Erfassen von Daten (create), das Lesen (read), das Verändern (update) und das Löschen (delete) zu unterscheiden. Gegenstand solcher Operationen ist zumeist eine bestimmte Gruppe von Daten (wie eine Kundenadresse, Bestellung etc.), die z. B. nach den Regeln der Datenmodellierung gebildet wurde. Diese datentechnischen Operationen werden durch Computerprogramme ausgelöst, d. h. über entsprechende, in diesen enthaltene Befehle (als Teil eines implementierten Algorithmus) vorgegeben. Die Operationen sind einerseits selbst Input-/Output-Befehle in Bezug auf den Datenbestand, sie stehen zum Teil aber auch im Zusammenhang mit Eingabe und Ausgabe seitens der Benutzer des Computerprogramms.
Zweck der Speicherung von Daten ist in der Regel ihre spätere Nutzung. Dabei lässt sich die einfache Wiedergabe (z. B. in Form von Anzeigen oder Listen) unterscheiden von dem Auswerten, bei dem die Daten in unterschiedliche logische, mathematische oder darstellende Verfahren einfließen (z. B. zur Summenbildung, Durchschnittsberechnung, Differenzbildung, Datenabgleich, als grafische Diagramme usw.).
Eine besondere Form der Daten-Verarbeitung sind der Datenimport (Dateiimport) und Datenexport (Dateiexport) als gängige Methode zum Datenaustausch zwischen verschiedenen Systemen. Hierbei ist unter Umständen auch eine Datenkonvertierung erforderlich, wenn Ausgangs- und Zielsystem unterschiedliche Datenformate oder Dateiformate verwenden.
Vorlage:Anker Betrachtungs- und Wirkungsebenen für Daten
Der Begriff „Daten“ tritt in unterschiedlichen, miteinander im Zusammenhang stehenden Wirkungs- und Betrachtungsebenen auf. Dies sind im Wesentlichen:
- Im Datenmanagement werden allgemeine Rahmenbedingungen für das Arbeiten mit den Daten festgelegt und im laufenden Betrieb angewendet, zum Beispiel: Wer gilt als Eigentümer der Daten? Wo und wie entstehen die Daten oder werden sie genutzt? Wer darf auf sie zugreifen (Datensicherheit); Regeln und Maßnahmen für den Datenschutz und die Datensicherung; unternehmensweite Modelle und Namenskonventionen; Einsatzkonzepte für Datenwerkzeuge usw.
- Datendesign: Vornehmlich bei Softwareentwicklung im Rahmen von Projekten spielen Daten, neben der Funktionalität der Programme, eine zentrale Rolle. Unter Einsatz individuell hierfür verfügbarer Verfahren und Werkzeuge werden dabei Details der Datenarchitektur festgelegt, z. B.: Welche Daten kennt die Software? Wie stehen sie untereinander im Zusammenhang? Gibt es sie bereits? Werden sie in Datenbanken oder in Dateien verwaltet/gespeichert? Pflicht- oder optional mögliches Feld? Welche Datentypen und Datenstrukturen sind zu bilden? Welche Ausprägungen und Inhalte kann ein Attribut annehmen?
- Technische Implementierung:
- Die Ergebnisse der Designfestlegungen werden (bei Speicherung in einem Datenbanksystem) in ein Datenbankmodell eingestellt, als Grundlage für die Verarbeitung und Verwaltung der Daten, die die Datenbank aufnehmen soll.
- In der Programmierung entsteht der Programmcode, über dessen Befehle Daten verarbeitet werden. Mit sogenannten Deklarationen werden Datenstrukturen mit ihren einzelnen Datenfeldern so angeordnet, dass sie die Daten aufnehmen können, und dass bei der Übersetzung Befehle erzeugt werden, wie es den Feldeigenschaften (Position, Länge, Datenformat usw.) entspricht.
- Tatsächliche Daten: Hier werden die Daten tatsächlich gespeichert und von den Programmen benutzt.
Daten in der Programmierung
Daten sind vornehmlich Quelle und Ziel der Verarbeitung in Computerprogrammen. Dazu sind im Programm, d. h. in dessen Quelltext, dem Verarbeitungszweck entsprechende Deklarationen und Befehle erforderlich. Diese können, abhängig von der Programmiersprache, erhebliche syntaktische und auch sprachlich-begriffliche (semantische) Unterschiede aufweisen. Wichtige datenbezogenen Begriffe sind hier (jeweils mit Synonymen, ähnlichen Begriffen und Beispiel angegeben):
- Datenbestand: Dort werden Daten gespeichert, von einem Programm erzeugt, verändert oder gelöscht und/oder von dort gelesen (siehe auch CRUD). Ähnlich: Datenbank, Datei, Datenbasis; Beispiel: Kundenadressen, Bestelldaten.
- Datensatz: Fasst die auf ein Objekt (Entität) bezogenen Angaben/Werte zusammen. Ähnliche Begriffe: Tupel, Verbund, Recordset; Beispiel: Adresse eines bestimmten Kunden.
- Datenfeld: Eine einzelne, elementare, zu einem Datensatz gehörende Angabe oder Information. Beispiel: Geburtsdatum, Mehrwertsteuersatz in Prozent, Postleitzahl. Ähnlich: Variable, Konstante, Feld.
- Datenstruktur: Zusammenfassung mehrerer Datenfelder zu einer Gruppe. Vertreter: Verbund (Datengruppe), Array/Tabelle, Stack; Beispiel: Telefonnummer(n) des Kunden, Ländercode, Vorwahl, Tel-Nr, gegebenenfalls Durchwahl
- Datentyp: Klassifizierung für Datenfelder und -strukturen, zum Beispiel Text, numerisch/Gleitkomma, Array. Hieran orientieren sich die Befehle (Methoden, Funktionen), die auf die Datenfelder angewendet werden können. Ähnlich: Datenformat; Beispiel: Postleitzahl ist ein numerisches Feld
Weitere Datenbegriffe, denen in der Programmierung / Softwareentwicklung eine wesentliche Bedeutung zukommt, sind beispielsweise: Datenmodellierung, Eingabe und Ausgabe, Datenfluss, …
Statistik
Seit der Jahrtausendwende soll der Anteil der digitalen Daten den der analogen Aufzeichnungsbestände überschritten haben.[16] Im Jahre 2020 wurden etwa 60 Zettabytes (6*1022 Bytes = 60 Billionen Gigabytes) an digitalen Daten erzeugt und weiterverwendet.[17] Das Gesamtvolumen wuchs in den letzten zehn Jahren um mehr als das zwanzigfache und wächst zurzeit jährlich etwa um 25 %. In Blu-ray Discs ausgedrückt (25 GB, 2.500 TB/m^3, 1,5 TB/kg, Acryl 1,2 t/m^3) entspricht dies dem Gewicht der Giseh-Pyramide, wobei der “Datenhaufen” deren Größe übersteigt.
Auch in den nächsten Jahren wird sich der weltweite Datenverkehr voraussichtlich vervielfachen,[18] ebenso wie der Anteil an „dunkler Information“,[19] was bedeutet, dass immer mehr Information zwischen Maschinen ausgetauscht wird. Für 2020 wird „die Menge an Daten, die erstellt, vervielfältigt und konsumiert werden, bei etwa 40 Zettabytes liegen – und damit 50-mal so hoch sein wie noch vor drei Jahren“.[20]
Betriebs- und Volkswirtschaftslehre
In Betriebs- und Volkswirtschaftslehre versteht man unter Daten gegebene und meist durch den Entscheidungsträger nicht beeinflussbare ökonomische Größen. Beide Wissenschaften nehmen die etymologische Herkunft des Wortes (Vorlage:LaS, ‚das Gegebene‘) wörtlich. Die Umwelteinflüsse auf diese Entscheidungen teilt man in endogene Faktoren wie die innerbetriebliche Akzeptanz von Unternehmensentscheidungen oder die Störanfälligkeit bei der Durchführung der Leistungsprozesse und exogene Faktoren ein. Hierzu gehören naturbedingte (Angaben zum Klima und Wetterdaten) und gesellschaftsbedingte Daten (wie Gesetze, Tarifverträge, Aktionsparameter der Konkurrenten, Lieferanten und Abnehmer oder Institutionen), die nicht als Reaktion auf eigene Aktionsparameter zu verstehen sind.[21] Unterbleibt jeglicher Beeinflussungsversuch durch den Entscheidungsträger, handelt es sich wie bei den naturbedingten Gegebenheiten auch bei den gesellschaftsbedingten um Datenparameter. Sie sind insbesondere die durch die äußere Umgebung eines Unternehmens (Markt, Staat, Zentralbank, Aufsichtsbehörden, Ausland) festgelegten Rahmenbedingungen, welche zumindest kurzfristig weder direkt noch indirekt durch eigene Entscheidungen beeinflussbar sind. Der Entscheidungsrahmen sieht mithin die Entscheidungsumwelt als ein unveränderliches Datum an.
Als wesentliche Entscheidungsgrundlage dienen Unternehmensdaten, die ein Unternehmen bei seiner Tätigkeit innerhalb eines Geschäftsjahres sammelt. Sie werden unterteilt nach operativen Daten, die zur Abwicklung des operativen Geschäfts dienen und dispositive Daten, die das Management für Managemententscheidungen benötigt. Lediglich ein geringer Teil aus dem Rechnungswesen gelangt im Rahmen der Publizitätspflicht aus bilanzrechtlichen Gründen durch Veröffentlichung im Jahresabschluss oder in Quartalsberichten an die interessierte Öffentlichkeit.
Unterschieden wird in beiden Wissenschaften zwischen „harten“ und weichen Daten, je nachdem, ob sie mit quantifizierenden Messmethoden als Messzahlen gewonnen werden oder ob sie personen- und/oder situationsabhängig und für unterschiedliche Interpretationen zugänglich sind.
Technik
- Technische Daten sind Daten, welche die wesentlichen technischen Merkmale von Gegenständen beschreiben. Als Gegenstände kommen insbesondere alle technisch orientierten Anlagen, Arbeitsgeräte, Arbeitsmittel, Betriebsmittel, Bauteile, Computer, Haushaltsgeräte, Maschinen, Produktionsmittel, Transportmittel, Verkehrsmittel, Waren oder Werkstoffe in Betracht. Technische Daten sind technische Angaben zu einem Gerät wie beispielsweise Abmessungen, Gewicht, Leistung oder Verbrauch (Energieverbrauch wie Stromverbrauch oder Wasserverbrauch)[22] oder auch Inhaltsstoffe in Arzneimitteln, Genussmitteln, Getränken, Kosmetika sowie Lebens- und Nahrungsmitteln. Technische Daten ergeben sich unter anderem aus Bauanleitungen, Baubeschreibungen, Gebrauchsanleitungen, Manuals, Packungsbeilagen, Schaltplänen usw.
- Im Bereich der Telemedien unterscheidet man Nutzungsdaten, Randdaten oder Verkehrsdaten.
- Umweltdaten geben Auskunft über den Zustand und die Entwicklung der Umwelt und können empirisch durch Messung erhoben werden.
Beispiele
Daten im allgemeinen Sinn
- Inhalte von Lexika und Büchern
- Die an einem Thermometer angezeigte Temperatur
- Die Jahresringe eines Baumes oder ähnliche biologische (messbare) Merkmale
- Die (gemessene) Geschwindigkeit eines vorbeifahrenden Fahrzeugs
- Antworten bei Umfragen, Volkszählungen – auf die Fragen in Fragebögen
- Ergebnisse von Experimenten in den Naturwissenschaften, technische Fakten
- Pressearchive von Zeitungsverlagen
- Der Inhalt von Schriftstücken (z. B. Briefe, Notizen, Protokolle usw.)
Daten in der Informatik
- Bits und Bytes, zum Beispiel:
- bei der Speicherung auf Datenträgern wie Festplatten, USB-Sticks oder DVDs
- bei der Übertragung über das Internet oder an das Mobiltelefon
- als Zeichenketten bzw. Texte in Textdateien
- als Binärdateien (z. B. Maschinencode, Datenbankinhalte, digitale Fotos, Tonaufnahmen oder Videos usw.)
Siehe auch
- Basisdaten
- Big Data
- Data Science
- Data-Mining
- Datagramm
- Datenhehlerei
- Informationsqualität
- Metadaten
- Paradaten
- Dunkles Zeitalter der Digitalisierung
Literatur
- Katharina Morik, Walter Krämer (Hrsg.): Daten – wem gehören sie, wer speichert sie, wer darf auf sie zugreifen? (Nordrhein-Westfälische Akademie der Wissenschaften und der Künste: Reihe S; 16) F. Schöningh Verlag, Paderborn [2018], ISBN 978-3-506-79248-8.
- Herbert E. Wiegand: Wörterbuchforschung. Teilband 1. de Gruyter, Berlin 1998, ISBN 3-11-013584-1, Kapitel 1.5.2.2: »Bemerkungen zum Gebrauch von Daten und Information« (S. 160–171) (Einblick in den Referenztext via Google Books).
Weblinks
Einzelnachweise
- ↑ 1,0 1,1
- ↑ Vorlage:Literatur
- ↑ Vorlage:Literatur
- ↑
- ↑ 5,0 5,1
- ↑ 6,0 6,1 Heinz-Peter Gumm, Manfred Sommer: Einführung in die Informatik. 10. Auflage. Oldenbourg Verlag, ISBN 978-3-486-70641-3, S. 4 f.
- ↑ D. v. Erffa: Taschenlexikon der Wirtschaft. books.google.de „Daten“ beziehungsweise erläuternd z. B. in G. Blümle u. a.: Perspektiven einer kulturellen Ökonomik, Band 1. LIT Verlag, Münster 2004, ISBN 3-8258-6137-6, books.google.de Datenbegriff von Eucken.
- ↑ Vorlage:Deutsches Wörterbuch
- ↑ siehe „Daten“ und „Datum“ in Kluge: Etymologisches Wörterbuch der deutschen Sprache. 23. Auflage, S. 163f.
- ↑
- ↑ Susanne Reindl-Krauskopf: Computerstrafrecht im Überblick. 2. Auflage. Facultas Verlag, Wien 2009, ISBN 978-3-7089-0523-5, S. 8f.
- ↑
- ↑ Vorlage:Literatur
- ↑ Peter Rechenberg, Gustav Pomberger: Informatik Handbuch. 4. Auflage. Carl Hanser Verlag, München, ISBN 978-3-446-40185-3, S. 189.
- ↑ Vorlage:Literatur
- ↑
- ↑
- ↑
- ↑
- ↑
- ↑ Gerhard Vogler, Allgemeine Betriebswirtschaftslehre, 1976, S. 55.
- ↑ Vorlage:Literatur