SQL/Abfragen

SQL/Abfrage

Beschreibung

Die grundlegenden Befehle und Begriffe werden anhand des folgenden Beispiels erklärt:

ER-Diagramm:

Relationen:

`Student`
`MatrNr`	`Name`
`26120`	`Fichte`
`25403`	`Jonas`
`27103`	`Fauler`

`hoert`
`MatrNr`	`VorlNr`
`25403`	`5001`
`26120`	`5001`
`26120`	`5045`

`Vorlesung`
`VorlNr`	`Titel`	`PersNr`
`5001`	`ET`	`15`
`5022`	`IT`	`12`
`5045`	`DB`	`12`

`Professor`
`PersNr`	`Name`
`12`	`Wirth`
`15`	`Tesla`
`20`	`Urlauber`

Einfache Abfrage

SELECT *
 FROM Student;

listet alle Spalten und alle Zeilen der Tabelle Student auf.

Ergebnis:

`MatrNr`	`Name`
`26120`	`Fichte`
`25403`	`Jonas`
`27103`	`Fauler`

Abfrage mit Spaltenauswahl

,

SELECT VorlNr,
    Titel
 FROM Vorlesung;

listet die Spalten VorlNr und Titel aller Zeilen der Tabelle Vorlesung auf.

Ergebnis:

`VorlNr`	`Titel`
`5001`	`ET`
`5022`	`IT`
`5045`	`DB`

Abfrage mit eindeutigen Werten (`DISTINCT`)

SELECT DISTINCT MatrNr
 FROM hoert;

listet nur unterschiedliche Einträge der Spalte MatrNr aus der Tabelle hoert auf. Dies zeigt die Matrikelnummern aller Studenten, die mindestens eine Vorlesung hören, wobei mehrfach auftretende Matrikelnummern nur einmal ausgegeben werden.

Ergebnis:

`MatrNr`
`25403`
`26120`

Abfrage mit Umbenennung (`AS`)

SELECT MatrNr AS Matrikelnummer,
    Name
 FROM Student;

listet die Spalten MatrNr und Name aller Zeilen der Tabelle Student auf. MatrNr wird beim Anzeigeergebnis als Matrikelnummer aufgeführt.

Ergebnis:

`Matrikelnummer`	`Name`
`26120`	`Fichte`
`25403`	`Jonas`
`27103`	`Fauler`

Abfrage mit Filter (`WHERE`)

SELECT VorlNr,
    Titel
 FROM Vorlesung
 WHERE Titel = 'ET';

listet VorlNr und Titel aller derjenigen Zeilen der Tabelle Vorlesung auf, deren Titel ET ist.

Die solchermaßen strukturierte, häufig verwendete Anweisung wird nach den Anfangsbuchstaben auch als "SFW-Block" bezeichnet.

Ergebnis:

`VorlNr`	`Titel`
`5001`	`ET`

Abfrage mit Filter nach Inhalt (`WHERE ... LIKE ...`)

SELECT Name
 FROM Student
 WHERE Name LIKE 'F%';

listet die Namen aller Studenten auf, deren Name mit F beginnt (im Beispiel: Fichte und Fauler).

LIKE kann mit verschiedenen Platzhaltern verwendet werden: _ steht für ein einzelnes beliebiges Zeichen, % steht für eine beliebige Zeichenfolge. Manche Datenbanksysteme bieten weitere solche Wildcard-Zeichen an, etwa für Zeichenmengen.

Ergebnis:

`Name`
`Fichte`
`Fauler`

Abfrage mit Filter und Sortierung (`ORDER BY`)

 SELECT Vorname,
     Name,
     StrasseNr,
     Plz,
     Ort
  FROM Student
  WHERE Plz = '20095'
ORDER BY Name;

listet Vorname, Name, StrasseNr, Plz und Ort aller Studenten aus dem angegebenen Postleitzahlbereich aufsteigend sortiert nach Name auf.

Abfrage mit verknüpften Tabellen (`,` und `INNER JOIN`)

SELECT Vorlesung.VorlNr,
    Vorlesung.Titel,
    Professor.PersNr,
    Professor.Name
 FROM Professor,
    Vorlesung
 WHERE Professor.PersNr = Vorlesung.PersNr;

Die Aufzählung hinter FROM legt die Datenquellen fest: an dieser Stelle können mithilfe sogenannter JOINs mehrere Tabellen miteinander verknüpft werden, sodass Daten aus verschiedenen Tabellen zusammengeführt und angezeigt werden.

In diesem Beispiel wird ein "innerer natürlicher Verbund" (NATURAL INNER JOIN) verwendet: Alle Datensätze aus den Tabellen Professor und Vorlesung, die den gleichen Wert im Feld PersNr haben. Professoren ohne Vorlesung und Vorlesungen ohne Professor werden damit nicht angezeigt.

Dies ist äquivalent zu:

  SELECT Vorlesung.VorlNr,
      Vorlesung.Titel,
      Professor.PersNr,
      Professor.Name
   FROM Professor
INNER JOIN Vorlesung
    ON Professor.PersNr = Vorlesung.PersNr;

Vorsicht: Nicht alle Implementierungen verstehen beide Schreibweisen, die Oracle-Schreibweise FROM Professor, Vorlesung gilt als veraltet und ist weniger verbreitet. Sie entspricht auch nicht dem ANSI-Standard und sollte deshalb vermieden werden. Aus historischen Gründen ist sie jedoch noch häufig anzutreffen.

Tabellen können nicht nur über Schlüsselfelder, sondern über beliebige Felder miteinander verknüpft werden, wie das folgende, fachlich unsinnige Beispiel zeigt:

SELECT Vorlesung.Titel,
    Professor.Name
 FROM Professor,
    Vorlesung
 WHERE Professor.Name <> Vorlesung.Titel

Das Ergebnis erhält die Kombinationen aller Professoren und aller Vorlesungen, wo der Name des Professors vom Titel der Vorlesung abweicht - das sind einfach alle (keine Vorlesung heißt wie ein Professor):

`Titel`	`Name`
`ET`	`Tesla`
`ET`	`Wirth`
`ET`	`Urlauber`
`IT`	`Tesla`
`IT`	`Wirth`
`IT`	`Urlauber`
`DB`	`Tesla`
`DB`	`Wirth`
`DB`	`Urlauber`

Linker äußerer Verbund (`LEFT OUTER JOIN`)

     SELECT Professor.PersNr,
        Professor.Name,
        Vorlesung.VorlNr,
        Vorlesung.Titel
      FROM Professor
LEFT OUTER JOIN Vorlesung
       ON Professor.PersNr = Vorlesung.PersNr;

ergibt alle Datensätze der Tabelle Professor verbunden mit den Datensätzen der Tabelle Vorlesung, die den jeweils gleichen Wert im Feld PersNr haben. Professoren ohne Vorlesung sind enthalten, die Vorlesungsspalten im Ergebnis haben dann den Wert NULL. Vorlesungen ohne Professor sind nicht enthalten.

Die folgende Abfrage liefert nur diejenigen Datensätze, zu denen kein passender Datensatz im linken äußeren Verbund existiert (alle Professoren, die keine Vorlesungen halten):

     SELECT Professor.PersNr,
        Professor.Name
      FROM Professor
LEFT OUTER JOIN Vorlesung
       ON Professor.PersNr = Vorlesung.PersNr
     WHERE Vorlesung.PersNr IS NULL;

Das Gleiche kann mittels einer Unterabfrage erreicht werden:

SELECT Professor.PersNr,
    Professor.Name
 FROM Professor
 WHERE NOT EXISTS (SELECT *
           FROM Vorlesung
          WHERE PersNr = Professor.PersNr);

Gruppierung mit Aggregat-Funktionen (`GROUP BY`)

     SELECT Professor.PersNr,
        Professor.Name,
        COUNT(Vorlesung.PersNr) AS Anzahl
      FROM Professor
LEFT OUTER JOIN Vorlesung
       ON Professor.PersNr = Vorlesung.PersNr
    GROUP BY Professor.Name,
        Professor.PersNr;

zählt die Anzahl der Vorlesungen pro Professor mit Hilfe der Aggregat-Funktion COUNT.

Bemerkung: COUNT(Professor.PersNr) oder COUNT(*) wären falsch (NULL-Werte sollen nicht mitgezählt werden).

Zusammenfassung eines `SELECT`

Zusammengefasst kann man die wichtigsten Elemente einer SQL-SELECT-Abfrage etwa so beschreiben:

SELECT [DISTINCT] Auswahlliste [AS Spaltenalias]
FROM Quelle [ [AS] Tabellenalias], evtl. mit JOIN-Verknüpfungen
[WHERE Where-Klausel]
[GROUP BY ein oder mehrere Group-by-Attribute]
[HAVING Having-Klausel]
[ORDER BY ein oder mehrere Sortierungsattribute mit [ASC|DESC]];

Erläuterung:

DISTINCT: Gibt an, dass aus der Ergebnisrelation gleiche Ergebnistupel entfernt werden sollen. Es wird also jeder Datensatz nur einmal ausgegeben, auch wenn er mehrfach in der Tabelle vorkommt. Sonst liefert SQL eine Multimenge zurück.
Auswahlliste: Bestimmt, welche Spalten der Quelle auszugeben sind (* für alle) und ob Aggregatsfunktionen anzuwenden sind. Wie bei allen anderen Aufzählungen werden die einzelnen Elemente mit Komma (,) voneinander getrennt.
Quelle: Gibt an, wo die Daten herkommen. Es können Relationen und Sichten angegeben werden und miteinander als kartesisches Produkt oder als Verbund (JOIN, ab SQL-92) verknüpft werden. Mit der zusätzlichen Angabe eines Namens können Relationen für die Abfrage umbenannt werden (vgl. Beispiele).
WHERE-Klausel: bestimmt Bedingungen, auch Filter genannt, unter denen die Daten ausgegeben werden sollen. In SQL ist hier auch die Angabe von Unterabfragen möglich, so dass SQL streng relational vollständig wird.
GROUP BY-Attribut: Legt fest, ob unterschiedliche Werte als einzelne Zeilen ausgegeben werden sollen (GROUP BY = Gruppierung) oder aber die Feldwerte der Zeilen durch Aggregationen wie Addition (SUM), Durchschnitt (AVG), Minimum (MIN), Maximum (MAX) zu einem Ergebniswert zusammengefasst werden, der sich auf die Gruppierung bezieht.
Having-Klausel: Ist wie die WHERE-Klausel, nur dass sich die angegebene Bedingung auf das Ergebnis einer Aggregationsfunktion bezieht, zum Beispiel HAVING SUM (Betrag) > 0.
Sortierungsattribut: nach ORDER BY werden Attribute angegeben, nach denen sortiert werden soll. Die Standardvoreinstellung ist ASC, das bedeutet aufsteigende Sortierung, DESC ist absteigende Sortierung.

Mengenoperatoren können auf mehrere SELECT-Abfragen angewandt werden, die gleich viele Attribute haben und bei denen die Datentypen der Attribute übereinstimmen:

UNION: Vereinigt die Ergebnismengen. In einigen Implementierungen werden mehrfach vorkommende Ergebnistupel wie bei DISTINCT entfernt, ohne dass UNION DISTINCT geschrieben werden muss beziehungsweise darf.
UNION ALL: Vereinigt die Ergebnismengen. Mehrfach vorkommende Ergebnistupel bleiben erhalten. Einige Implementierungen interpretieren aber UNION wie UNION ALL und verstehen das ALL möglicherweise nicht und geben eine Fehlermeldung aus.
EXCEPT: Liefert die Tupel, die in einer ersten, jedoch nicht in einer zweiten Ergebnismenge enthalten sind. Mehrfach vorkommende Ergebnistupel werden entfernt.
MINUS: Ein analoger Operator wie EXCEPT, der von manchen SQL-Dialekten alternativ benutzt wird.
INTERSECT: Liefert die Schnittmenge zweier Ergebnismengen. Mehrfach vorkommende Ergebnistupel werden entfernt.

Beschreibung

Einfache Abfrage

Abfrage mit Spaltenauswahl

Abfrage mit eindeutigen Werten (DISTINCT)

Abfrage mit Umbenennung (AS)

Abfrage mit Filter (WHERE)

Abfrage mit Filter nach Inhalt (WHERE ... LIKE ...)

Abfrage mit Filter und Sortierung (ORDER BY)

Abfrage mit verknüpften Tabellen (, und INNER JOIN)

Linker äußerer Verbund (LEFT OUTER JOIN)

Gruppierung mit Aggregat-Funktionen (GROUP BY)

Zusammenfassung eines SELECT

Abfrage mit eindeutigen Werten (`DISTINCT`)

Abfrage mit Umbenennung (`AS`)

Abfrage mit Filter (`WHERE`)

Abfrage mit Filter nach Inhalt (`WHERE ... LIKE ...`)

Abfrage mit Filter und Sortierung (`ORDER BY`)

Abfrage mit verknüpften Tabellen (`,` und `INNER JOIN`)

Linker äußerer Verbund (`LEFT OUTER JOIN`)

Gruppierung mit Aggregat-Funktionen (`GROUP BY`)

Zusammenfassung eines `SELECT`