PostgreSQL: Unterschied zwischen den Versionen

Aus Foxwiki
Keine Bearbeitungszusammenfassung
K Textersetzung - „Man-Pages“ durch „Man-Page“
 
(29 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
'''PostgreSQL''' (postgres)- [[Freie Software|freies]], [[Objektrelationale Datenbank|objektrelationales Datenbankmanagementsystem]] (ORDBMS)
== Beschreibung ==
* Entwicklung begann in den 1980er Jahren
* seit 1997 wird die Software von einer [[Open Source|Open-Source]]-[[Gemeinschaft|Community]] weiterentwickelt
{| class="wikitable options float"
{| class="wikitable options float"
|-
|-
Zeile 11: Zeile 17:
| Website || [https://www.postgresql.org/ www.postgresql.org]
| Website || [https://www.postgresql.org/ www.postgresql.org]
|}
|}
; PostgreSQL
[[Freie Software|freies]], [[Objektrelationale Datenbank|objektrelationales Datenbankmanagementsystem]] (ORDBMS). Seine Entwicklung begann in den 1980er Jahren, seit 1997 wird die Software von einer [[Open Source|Open-Source]]-[[Gemeinschaft|Community]] weiterentwickelt.
* kurz '''Postgres'''


; <nowiki>SQL:2011</nowiki>
; <nowiki>SQL:2011</nowiki>
PostgreSQL ist weitgehend konform mit dem [[SQL]]-Standard SQL:2011, das heißt, der Großteil der Funktionen ist verfügbar und verhält sich wie definiert. ostgreSQL ist vollständig [[ACID]]-konform (inklusive der [[Data Definition Language]]) und unterstützt erweiterbare [[Datentyp]]en, [[Datenbankoperator|Operatoren]], Funktionen und [[Aggregation (OLAP)|Aggregate]]. Obwohl sich die Entwicklergemeinde sehr eng an den SQL-Standard hält, gibt es dennoch eine Reihe von PostgreSQL-spezifischen Funktionalitäten, wobei in der Dokumentation bei jeder Eigenschaft ein Hinweis erfolgt, ob dies dem SQL-Standard entspricht, oder ob es sich um eine spezifische Erweiterung handelt. Darüber hinaus verfügt PostgreSQL über ein umfangreiches Angebot an Erweiterungen durch Dritthersteller, wie zum Beispiel [[PostGIS]] zur Verwaltung von [[Geodaten]].
PostgreSQL ist weitgehend konform mit dem [[SQL]]-Standard SQL:2011, das heißt, der Großteil der Funktionen ist verfügbar und verhält sich wie definiert
PostgreSQL ist in den meisten [[Linux-Distribution]]en enthalten, allerdings oft in der Version, die bei Erscheinen des Release aktuell war. Aktuellere Versionen gibt es für viele Linux-Distributionen in von der PostgreSQL Developer Group bereitgestellten Repositories. [[Apple]] liefert von der Version [[Mac OS X Lion]] (10.7) an PostgreSQL als Standarddatenbank aus.
* ostgreSQL ist vollständig [[ACID]]-konform (inklusive der [[Data Definition Language]]) und unterstützt erweiterbare [[Datentyp]]en, [[Datenbankoperator|Operatoren]], Funktionen und [[Aggregation (OLAP)|Aggregate]]
 
* Obwohl sich die Entwicklergemeinde sehr eng an den SQL-Standard hält, gibt es dennoch eine Reihe von PostgreSQL-spezifischen Funktionalitäten, wobei in der Dokumentation bei jeder Eigenschaft ein Hinweis erfolgt, ob dies dem SQL-Standard entspricht, oder ob es sich um eine spezifische Erweiterung handelt
== Geschichte ==
* Darüber hinaus verfügt PostgreSQL über ein umfangreiches Angebot an Erweiterungen durch Dritthersteller, wie zum Beispiel [[PostGIS]] zur Verwaltung von [[Geodaten]]
[[Datei:Timeline postgresql.png|mini|PostgreSQL-Zeitleiste]]
PostgreSQL ist in den meisten [[Linux-Distribution]]en enthalten, allerdings oft in der Version, die bei Erscheinen des Release aktuell war
PostgreSQL, zuvor bekannt unter dem Namen Postgres, später Postgres95, entstand aus einer Datenbankentwicklung der [[University of California, Berkeley|University of California]] in [[Berkeley]]. Den Anfang stellte dabei das [[Ingres (Datenbanksystem)|Ingres]]-Projekt dar, wobei der Hauptverantwortliche [[Michael Stonebraker]] 1982 die Universität verließ, um Ingres kommerziell zu vertreiben. Nachdem Stonebraker 1985 wieder zur Universität zurückgekehrt war, startete er das Post-Ingres-Projekt, um die Probleme der damaligen Datenbankmanagementsysteme zu korrigieren. Die [[Codebasis]] des ersten Postgres ist dabei eine andere als die von Ingres.
* Aktuellere Versionen gibt es für viele Linux-Distributionen in von der PostgreSQL Developer Group bereitgestellten Repositories. [[Apple]] liefert von der Version [[Mac OS X Lion]] (10.7) an PostgreSQL als Standarddatenbank aus
 
1989 wurde die erste Version von Postgres fertiggestellt.
 
Im Jahre 1994 wurde Postgres von den Studenten Andrew Yu und Jolly Chen um einen [[SQL]]-[[Interpreter]] erweitert und die Software als [[Open Source]] unter dem Namen ''Postgres95'' freigegeben. Der Postgres95-Code entsprach dem ANSI-C-Standard und wurde um 25 % verkleinert, weiterhin wurden Leistung und Zuverlässigkeit verbessert. Postgres95, Version 1.0.x war im [[Wisconsin Benchmark]] 30 bis 50 Prozent schneller als Postgres, Version 4.2.
 
Im Zuge der Entwicklung des [[World Wide Web]] verstärkte sich das Interesse an Datenbanken. 1996 erhielt Postgres seinen neuen Namen PostgreSQL. Die erste unter diesem Namen veröffentlichte Version ist 6.0. Seither wurde PostgreSQL fortlaufend weiterentwickelt.


== Eigenschaften ==
== Eigenschaften ==
Zeile 35: Zeile 31:
* Referentielle [[Integritätsbedingung|Integrität]] (unter anderem [[Constraint]]s, Fremdschlüssel)
* Referentielle [[Integritätsbedingung|Integrität]] (unter anderem [[Constraint]]s, Fremdschlüssel)
* Mengenoperationen
* Mengenoperationen
* Sehr umfangreiches Angebot an [[Datentyp]]en, auch über den im ANSI/ISO Standard beschriebenen hinaus. Beispielsweise können [[IP-Adresse]]n, [[MAC-Adresse]]n, zweidimensionale geometrische Figuren (Kreis, Linie, Polygon usw.) und Bereiche (von/bis) gespeichert werden.
* Sehr umfangreiches Angebot an [[Datentyp]]en, auch über den im ANSI/ISO Standard beschriebenen hinaus
* Beispielsweise können [[IP-Adresse]]n, [[MAC-Adresse]]n, zweidimensionale geometrische Figuren (Kreis, Linie, Polygon usw.) und Bereiche (von/bis) gespeichert werden
* Maximale Datenbankgröße nur durch zur Verfügung stehenden Speicher begrenzt
* Maximale Datenbankgröße nur durch zur Verfügung stehenden Speicher begrenzt
* [[Sicht (Datenbank)|Views]], die mit Hilfe von Regeln (Rules und Triggers) auch schreibfähig sein können ''(Updatable Views)''
* [[Sicht (Datenbank)|Views]], die mit Hilfe von Regeln (Rules und Triggers) auch schreibfähig sein können ''(Updatable Views)''
Zeile 43: Zeile 40:
* Export und Import sowohl von Daten als auch von Datenbankstrukturen (Schemata)
* Export und Import sowohl von Daten als auch von Datenbankstrukturen (Schemata)
* Erweiterbarkeit durch Funktionen, selbstdefinierbare Datentypen und Operatoren
* Erweiterbarkeit durch Funktionen, selbstdefinierbare Datentypen und Operatoren
* Asynchrone und synchrone [[Replikation (Datenverarbeitung)|Replikation]]. Der Vorteil der synchronen Replikation liegt in der Sicherstellung, dass die Transaktion mindestens auf zwei Servern tatsächlich ausgeführt wurde, womit eine vollständige Sicherung jederzeit garantiert werden kann (Hot Standby). Diese Ausfallsicherheit wird naturgemäß durch eine längere Wartezeit auf das [[Commit]] erkauft. Daher gibt es auch die Möglichkeit, besonders wichtige Geschäftsprozesse wie finanzielle Transaktionen synchron zu replizieren, und bei weniger wichtigen Transaktionen, wie der Aufzeichnung der Benutzerinteraktionen, die sehr viel schnellere asynchrone Replikation zu nutzen.
* Asynchrone und synchrone [[Replikation (Datenverarbeitung)|Replikation]]
* Der Vorteil der synchronen Replikation liegt in der Sicherstellung, dass die Transaktion mindestens auf zwei Servern tatsächlich ausgeführt wurde, womit eine vollständige Sicherung jederzeit garantiert werden kann (Hot Standby)
* Diese Ausfallsicherheit wird naturgemäß durch eine längere Wartezeit auf das [[Commit]] erkauft
* Daher gibt es auch die Möglichkeit, besonders wichtige Geschäftsprozesse wie finanzielle Transaktionen synchron zu replizieren, und bei weniger wichtigen Transaktionen, wie der Aufzeichnung der Benutzerinteraktionen, die sehr viel schnellere asynchrone Replikation zu nutzen


=== Erweiterungen ===
=== Erweiterungen ===
Eine Reihe von durch den [[Benutzer]] zu installierenden Zusatzmodulen steht zur Verfügung, darunter mit GiST (Generalized Search Tree) eine universelle [[Schnittstelle]], um Such- und Sortierverfahren in weiten Grenzen selbst definieren zu können. Eine Anwendung davon ist [[PostGIS]], das geografische Objekte und Datenstrukturen verwalten und damit als Datenbank für [[Geoinformationssystem]]e (GIS) dienen kann. Eine andere GiST-Anwendung ist [[OpenFTS]] ([[Open Source]] Full Text Search), das [[Volltextrecherche]] in DB-Objekten erlaubt.
Eine Reihe von durch den [[Benutzer]] zu installierenden Zusatzmodulen steht zur Verfügung, darunter mit GiST (Generalized Search Tree) eine universelle [[Schnittstelle]], um Such- und Sortierverfahren in weiten Grenzen selbst definieren zu können
* Eine Anwendung davon ist [[PostGIS]], das geografische Objekte und Datenstrukturen verwalten und damit als Datenbank für [[Geoinformationssystem]]e (GIS) dienen kann
* Eine andere GiST-Anwendung ist [[OpenFTS]] ([[Open Source]] Full Text Search), das [[Volltextrecherche]] in DB-Objekten erlaubt


Eine Reihe von Erweiterungen beschäftigt sich mit [[Rechnerverbund|Clustering]] und [[Replikation (Datenverarbeitung)|Replizierung]], dem parallelen Einsatz und Abgleich verteilter DB-[[Server]].
Eine Reihe von Erweiterungen beschäftigt sich mit [[Rechnerverbund|Clustering]] und [[Replikation (Datenverarbeitung)|Replizierung]], dem parallelen Einsatz und Abgleich verteilter DB-[[Server]]


Viele Erweiterungen bieten zusätzliche Datentypen an, beispielsweise solche für [[IBAN]]s, [[ISBN]]s, [[European Article Number|EANs]]. Einige Erweiterungen sind im Lieferumfang des Projekts bereits enthalten und brauchen lediglich für die jeweilige Datenbank (nicht den Server an sich) aktiviert zu werden.
Viele Erweiterungen bieten zusätzliche Datentypen an, beispielsweise solche für [[IBAN]]s, [[ISBN]]s, [[European Article Number|EANs]]
* Einige Erweiterungen sind im Lieferumfang des Projekts bereits enthalten und brauchen lediglich für die jeweilige Datenbank (nicht den Server an sich) aktiviert zu werden


=== Grenzwerte ===
=== Grenzwerte ===
In diesem Abschnitt werden einige Beschränkungen einer älteren Version beschrieben. Da inzwischen neuere Releases bereitgestellt wurden, könnten einige davon weggefallen sein.
In diesem Abschnitt werden einige Beschränkungen einer älteren Version beschrieben
* Da inzwischen neuere Releases bereitgestellt wurden, könnten einige davon weggefallen sein


Die hier beschriebenen Beschränkungen betreffen die Versionen 8.4 bis 9.5:
Die hier beschriebenen Beschränkungen betreffen die Versionen 8.4 bis 9.5


* maximale Größe der Datenbank: unbeschränkt
* maximale Größe der Datenbank: unbeschränkt
Zeile 66: Zeile 70:


=== Upgrade der Datenbank ===
=== Upgrade der Datenbank ===
Jede [[Versionsnummer#Aufbau und Bedeutung|Nebenversionsnummer]] wird von der PostgreSQL-Entwickler-[[Online-Community|Community]] fünf Jahre lang weitergepflegt. Revisionen enthalten Leistungsverbesserungen und Fehlerbereinigungen, aber niemals neue Funktionen. Die älteste derzeit (Stand 11/2023) noch gepflegte Versionslinie ist 11, die im Oktober 2018 erschien.
Jede [[Versionsnummer#Aufbau und Bedeutung|Nebenversionsnummer]] wird von der PostgreSQL-Entwickler-[[Online-Community|Community]] fünf Jahre lang weitergepflegt
 
* Revisionen enthalten Leistungsverbesserungen und Fehlerbereinigungen, aber niemals neue Funktionen
Bei einer Software-Aktualisierung müssen bestehende Datenbanken vorher gesichert, danach in der neuen PostgreSQL-Version neu angelegt und die Daten aus der vorherigen Sicherung eingespielt werden. Dies ist dann erforderlich, wenn sich erste Stelle der Versionsnummer geändert hat, nicht jedoch bei Änderungen der zweiten Stelle.
* Die älteste derzeit (Stand 11/2023) noch gepflegte Versionslinie ist 11, die im Oktober 2018 erschien
 
Alle noch unterstützten Versionen liefern ein Werkzeug namens pg_upgrade mit, welches das Datenverzeichnis ohne das vorher notwendige Sichern und Wiedereinspielen der Datenbank aktualisieren kann.
 
Nach einem Import größerer Datenmengen in eine Datenbank sollte der Befehl „<code>ANALYZE</code>“ ausgeführt werden, damit die Analyse Tabelle „pg_statistics“ richtig befüllt wird. Unterbleibt diese Analyse, kann dies zu Performanzproblemen führen.
Ansonsten wird dies, genau wie das Kommando „<code>VACUUM</code>“ zur Freigabe von Speicherplatz (eine Art [[Garbage Collection]]) in regelmäßigen Abständen automatisch durchgeführt.
=== Versionen ===
{| class="wikitable"
|+
!Version
!Veröffentlicht am
!Beschreibung / Anmerkung
|-
|7.4
|17. November 2003
|
|-
|8.0
|19. Januar 2005
|Von der Version 8.0 an unterstützt PostgreSQL [[Microsoft Windows|Windows]]. Eine weitere Neuerung ist die Unterstützung von Sicherungspunkten (Savepoints). Mit diesen ist es möglich, eine Transaktion an einem vorher gespeicherten Sicherungspunkt fortzusetzen, falls diese durch einen [[Fehler]] abgebrochen wurde.
|-
|8.3
|Februar 2008
|Version 8.3 brachte eine Reihe von Leistungsverbesserungen sowie Funktionserweiterungen, darunter:
* [[Volltextrecherche]], die bisher als Zusatzprodukt verfügbar war, ist nun in den Kern der DB integriert.
* [[Extensible Markup Language|XML]]-Verarbeitung wird durch einen XML-Datentypen unterstützt, der jeweils ein XML-Dokument enthält; bei Abfragen können nun etwa SQL- mit [[XPath]]-Queries in einer Transaktion kombiniert werden. Dieses Verfahren wurde 2006 bei [[Db2]] von IBM vorgestellt.
* Datentypen [[Aufzählungstyp|ENUM]] und [[Universally Unique Identifier|UUID]].
|-
|9.0
|September 2010
|Version 9.0 brachte Funktionen für Replikation und Hot-Standby und Verbesserungen bei Sicherheit, Monitoring und speziellen Datentypen.
|-
|9.1
|12.&nbsp;September 2011
|Version 9.1 brachte eine Verbesserung der Hochverfügbarkeit bei Betrieb von mehreren Servern mit Hilfe synchroner Replikation, Zugriff auf fremde Datenquellen, spaltenweise linguistisch korrekte Sortierbarkeit, Einbindung von Erweiterungen sowie eine Reihe weiterer Verbesserungen.
|-
|9.2
|10.&nbsp;September 2012
|Version 9.2 enthält in erster Linie neue Funktionalitäten zur Verbesserung der Performance.
|-
|9.3
|9.&nbsp;September 2013
|Wesentliche Verbesserungen sind im Bereich der Unterstützung von [[JavaScript Object Notation|JSON]], bei [[Sicht (Datenbank)#Materialized View|materialisierten Views]] und beschreibbaren [[Sicht (Datenbank)|Views]].
|-
|9.4
|18.&nbsp;Dezember 2014
|Beschleunigte Verarbeitung von JSON-Daten durch das binäre Format JSONB.
|-
|9.5
|7.&nbsp;Januar 2016
|Row-level security control, Block Range Indexes (BRIN), <span style="font-family:monospace;">IMPORT FOREIGN SCHEMA</span>, pg_rewind hinzugefügt.
|-
|9.6
|29.&nbsp;September 2016
|Die wichtigsten Änderungen betreffen vertikale („scale-up“) als auch horizontale („scale-out“) Skalierung, parallelisierte Abfragen, Phrasensuche und Verbesserungen bei synchroner Replikation, sowie generelle verbesserte Performance und Benutzerfreundlichkeit.
|-
|10
|5.&nbsp;Oktober 2017
|Die wichtigsten Änderungen betreffen deklarative Partitionierung, logische Replikation, verbesserte Abfrage-Parallelisierung und bessere Password-Hashes.
|-
|11
|18.&nbsp;Oktober 2018
| rowspan="4" |Es wurde weiter die Robustheit und die Leistung für die Partitionierung, die Unterstützung von Transaktionen in gespeicherten Prozeduren und die Abfrageparallelität in parallel laufenden Abfragen verbessert. Es gibt nun auch eine Just-in-Time-Kompilierung (JIT) für Ausdrücke.
|-
|11.3
|9. Mai 2019
|-
|11.4
|20. Juni 2019
|-
|11.5
|8. August 2019
|-
|12
|3.&nbsp;Oktober 2019
|Verbesserung in der Abfragegeschwindigkeit und Abfrage von SQL/JSON-Ausdrücken. Mit dieser Version ist es nun auch möglich, das Table-Storage auszutauschen.
|-
|13
|25.&nbsp;September 2020
 
|Die Veränderungen betreffen:
 
* Geringerer Speicherplatzbedarf durch Deduplikation in B-tree Indexen
* Verbesserte Leistung bei Abfragen, welche Aggregatfunktionen oder partitionierte Tabellen verwenden
 
* Vakuumieren von Indexen wird parallelisiert ausgeführt.
|-
|14
|30.&nbsp;September 2021
|Die Veränderungen betreffen:
* Komfort beim Umgang mit JSON-Daten und Multi-Ranges
* Performance für ressourcenintensive Lasten
* Verbesserungen für verteilte Datenbanken, Administration und Fortschrittsanalyse
* SQL Performance, Konformität und Komfort
* Sicherheit (vordefinierte Rollen, Passwortstandard SCRAM-SHA-256 als Standard)
|-
|15
|13.&nbsp;Oktober 2022
|
* SQL MERGE Befehl
* Verbesserte Sortieralgorithmen
* Server Logging ist nun auch im JSON Format verfügbar
 
* Das <code>public</code>-Schema gehört jetzt immer dem jeweiligen Datenbank-Eigentümer, andere Rollen haben kein Schreibrecht mehr darauf.
|-
|16
|14.&nbsp;September 2023
|
* Parallelisierung von Full und Right Outer Hash Joins sowie der Funktionen <code>string_agg()</code> und <code>array_agg()</code>
* Logische Replikation auch von Standby Servern
* SQL/JSON Konstruktoren und Identity Funktionen
 
* weitere Statistiken über Tabellen
 
* Optionen für das <code>GRANT</code>-Kommando


* Reguläre Ausdrücke in der Datei <code>pg_hba.conf</code> für die Zugriffssteuerung
Bei einer Software-Aktualisierung müssen bestehende Datenbanken vorher gesichert, danach in der neuen PostgreSQL-Version neu angelegt und die Daten aus der vorherigen Sicherung eingespielt werden
* Dies ist dann erforderlich, wenn sich erste Stelle der Versionsnummer geändert hat, nicht jedoch bei Änderungen der zweiten Stelle


|-
Alle noch unterstützten Versionen liefern ein Werkzeug namens pg_upgrade mit, welches das Datenverzeichnis ohne das vorher notwendige Sichern und Wiedereinspielen der Datenbank aktualisieren kann
|}


Nach einem Import größerer Datenmengen in eine Datenbank sollte der Befehl „<code>ANALYZE</code>“ ausgeführt werden, damit die Analyse Tabelle „pg_statistics“ richtig befüllt wird
* Unterbleibt diese Analyse, kann dies zu Performanzproblemen führen
Ansonsten wird dies, genau wie das Kommando „<code>VACUUM</code>“ zur Freigabe von Speicherplatz (eine Art [[Garbage Collection]]) in regelmäßigen Abständen automatisch durchgeführt
== Softwarewerkzeuge ==
== Softwarewerkzeuge ==
PostgreSQL selbst läuft als Hintergrundprozess und kann auf verschiedene Weise interaktiv bedient werden.
PostgreSQL selbst läuft als Hintergrundprozess und kann auf verschiedene Weise interaktiv bedient werden
Für die [[kommandozeile]]norientierte Bedienung und in Scripts wird die [[Konsolenanwendung]] ''psql'' mit der Installation mitgeliefert. Programme mit [[Grafische Benutzeroberfläche|grafischer Benutzeroberfläche]] zur Bedienung und Verwaltung der Datenbank werden auf dem Serverrechner meist nicht installiert, sondern auf Clientrechnern: [[Freie Software|freie Produkte]] sind etwa [[PgAdmin]] Daneben werden eine Vielzahl von kommerziellen Werkzeugen angeboten, die auch grafische [[Computer-aided software engineering|CASE]]-Modellierung, Im- und Export-Funktionen oder DB-Monitoring bieten.
Für die [[kommandozeile]]norientierte Bedienung und in Scripts wird die [[Konsolenanwendung]] ''psql'' mit der Installation mitgeliefert
Ein [[MySQL]]-Migrationshilfswerkzeug ist in jedem freien PostgreSQL-Downloadpaket von EnterpriseDB enthalten. Für viele andere Datenbanksysteme gibt es Migrationsunterstützung, insbesondere für Umsteiger von Oracle.
* Programme mit [[Grafische Benutzeroberfläche|grafischer Benutzeroberfläche]] zur Bedienung und Verwaltung der Datenbank werden auf dem Serverrechner meist nicht installiert, sondern auf Clientrechnern: [[Freie Software|freie Produkte]] sind etwa [[PgAdmin]] Daneben werden eine Vielzahl von kommerziellen Werkzeugen angeboten, die auch grafische [[Computer-aided software engineering|CASE]]-Modellierung, Im- und Export-Funktionen oder DB-Monitoring bieten
Ein [[MySQL]]-Migrationshilfswerkzeug ist in jedem freien PostgreSQL-Downloadpaket von EnterpriseDB enthalten
* Für viele andere Datenbanksysteme gibt es Migrationsunterstützung, insbesondere für Umsteiger von Oracle


Ein wichtiges Werkzeug zur Konfiguration der Datenbank ist das Python Script „pgtune“.
; pgtune
Ein wichtiges Werkzeug zur Konfiguration der Datenbank ist das Python Script „pgtune“
Die Standardeinstellungen der Datenbank sind oftmals nicht auf die verwendete Hardware angepasst, sondern so eingestellt, dass das System auf quasi jedem Rechner startet. „pgtune“ zeigt Lösungsvorschläge auf, wie man die Datenbank „tunen“ kann, um die Leistung der Datenbank deutlich zu steigern. Es gibt ein Online Tool um die wichtigsten Einstellungen der Datenbank zu ermitteln. Anfänger tun sich oftmals schwer, die geeigneten Konfigurationsparameter zu ermitteln.
* Die Standardeinstellungen der Datenbank sind oftmals nicht auf die verwendete Hardware angepasst, sondern so eingestellt, dass das System auf quasi jedem Rechner startet. „pgtune“ zeigt Lösungsvorschläge auf, wie man die Datenbank „tunen“ kann, um die Leistung der Datenbank deutlich zu steigern
Das Tool wurde ursprünglich von Greg Smith (2ndQuadrant, mittlerweile EnterpriseDB) entwickelt.
* Es gibt ein Online Tool um die wichtigsten Einstellungen der Datenbank zu ermitteln
* Anfänger tun sich oftmals schwer, die geeigneten Konfigurationsparameter zu ermitteln
* Das Tool wurde ursprünglich von Greg Smith (2ndQuadrant, mittlerweile EnterpriseDB) entwickelt


== Preise und Auszeichnungen ==


An PostgreSQL wurden in der Vergangenheit zahlreiche Preise vergeben.
<noinclude>
Nicht zuletzt erhielt das Projekt den ''Lifetime Achievement Award'' im Rahmen der [[O’Reilly Open Source Convention]] 2019.


== Anhang ==
=== Siehe auch ===
{{Special:PrefixIndex/{{BASEPAGENAME}}}}
==== Dokumentation ====
===== Man-Page =====
===== Info-Pages =====
==== Links ====
===== Projekt =====
# [https://www.postgresql.org/ www.postgresql.org] – offizielle Webpräsenz (englisch)
# [http://www.postgres.de/ www.postgres.de] – deutsche Website betreffs PostgreSQL


== Weblinks ==
===== Weblinks =====
* [https://postgres.fm/ Postgres.fm], eine Podcastserie zum Thema PostgreSQL
# https://de.wikipedia.org/wiki/PostgreSQL
# https://wiki.postgresql.org/wiki/Apt
# [https://postgres.fm/ Postgres.fm], eine Podcastserie zum Thema PostgreSQL


=== Produkt ===
; Werkzeuge und Erläuterungen
* [https://www.postgresql.org/ www.postgresql.org] – offizielle Webpräsenz (englisch)
# [https://pgxn.org/ PGXN] (englisch) – PostgreSQL Extension Network
* [http://www.postgres.de/ www.postgres.de] – deutsche Website betreffs PostgreSQL
# Vortrag vom [[Chaos Computer Club]] Ulm: [https://ulm.ccc.de/ChaosSeminar/2006/11_PostgreSQL ''PostgreSQL – Ein Elephant vergisst nie''] (Video, Audio)
# [[Podcast]]: [https://ulm.ccc.de/dev/radio/detail?id=74 /dev/radio zu PostgreSQL]
# [http://sql-info.de/postgresql/FAQ_german.html FAQ auf sql-info.de]


=== Werkzeuge und Erläuterungen ===
* [https://pgxn.org/ PGXN] (englisch) – PostgreSQL Extension Network
* Vortrag vom [[Chaos Computer Club]] Ulm: [https://ulm.ccc.de/ChaosSeminar/2006/11_PostgreSQL ''PostgreSQL – Ein Elephant vergisst nie''] (Video, Audio)
* [[Podcast]]: [https://ulm.ccc.de/dev/radio/detail?id=74 /dev/radio zu PostgreSQL]
* [http://sql-info.de/postgresql/FAQ_german.html FAQ auf sql-info.de]
[[Kategorie:Freies Datenbankmanagementsystem]]
[[Kategorie:PostgreSQL| ]]
[[Kategorie:PostgreSQL| ]]
[[Kategorie:Unix-Software]]
[[Kategorie:Linux-Software]]
[[Kategorie:MacOS-Software]]
[[Kategorie:Windows-Software]]
[[Kategorie:Relationales Datenbankmanagementsystem]]
# https://de.wikipedia.org/wiki/PostgreSQL
# https://wiki.postgresql.org/wiki/Apt


[[Kategorie:Postgresql]]
</noinclude>

Aktuelle Version vom 6. November 2024, 12:40 Uhr

PostgreSQL (postgres)- freies, objektrelationales Datenbankmanagementsystem (ORDBMS)

Beschreibung

  • Entwicklung begann in den 1980er Jahren
  • seit 1997 wird die Software von einer Open-Source-Community weiterentwickelt
Hersteller PostgreSQL Global Development Group
Betriebssystem Unix-Derivate, Linux, Microsoft Windows, macOS
Kategorie Datenbanksystem, Server
Lizenz PostgreSQL Lizenz vergleichbar der BSD-Lizenz oder der MIT-Lizenz
Website www.postgresql.org
SQL:2011

PostgreSQL ist weitgehend konform mit dem SQL-Standard SQL:2011, das heißt, der Großteil der Funktionen ist verfügbar und verhält sich wie definiert

  • ostgreSQL ist vollständig ACID-konform (inklusive der Data Definition Language) und unterstützt erweiterbare Datentypen, Operatoren, Funktionen und Aggregate
  • Obwohl sich die Entwicklergemeinde sehr eng an den SQL-Standard hält, gibt es dennoch eine Reihe von PostgreSQL-spezifischen Funktionalitäten, wobei in der Dokumentation bei jeder Eigenschaft ein Hinweis erfolgt, ob dies dem SQL-Standard entspricht, oder ob es sich um eine spezifische Erweiterung handelt
  • Darüber hinaus verfügt PostgreSQL über ein umfangreiches Angebot an Erweiterungen durch Dritthersteller, wie zum Beispiel PostGIS zur Verwaltung von Geodaten

PostgreSQL ist in den meisten Linux-Distributionen enthalten, allerdings oft in der Version, die bei Erscheinen des Release aktuell war

  • Aktuellere Versionen gibt es für viele Linux-Distributionen in von der PostgreSQL Developer Group bereitgestellten Repositories. Apple liefert von der Version Mac OS X Lion (10.7) an PostgreSQL als Standarddatenbank aus

Eigenschaften

  • Umfassendes Transaktionskonzept, das Multiversion Concurrency Control (MVCC) unterstützt
  • Ermöglicht komplexe Abfragen mit Unterabfragen (Subselects), auch geschachtelt
  • Referentielle Integrität (unter anderem Constraints, Fremdschlüssel)
  • Mengenoperationen
  • Sehr umfangreiches Angebot an Datentypen, auch über den im ANSI/ISO Standard beschriebenen hinaus
  • Beispielsweise können IP-Adressen, MAC-Adressen, zweidimensionale geometrische Figuren (Kreis, Linie, Polygon usw.) und Bereiche (von/bis) gespeichert werden
  • Maximale Datenbankgröße nur durch zur Verfügung stehenden Speicher begrenzt
  • Views, die mit Hilfe von Regeln (Rules und Triggers) auch schreibfähig sein können (Updatable Views)
  • Trigger, Funktionen und gespeicherte Prozeduren (stored procedures) sind in verschiedenen Sprachen möglich: PL/pgSQL, PL/c, PL/Tcl, PL/Python, PL/Perl, PL/Java, PL/PHP, PL/Ruby, PL/R, PL/sh, PL/Scheme, PL/Parrot, PL/V8 (derzeit noch experimentell)
  • Schnittstellen zu vielen Programmiersprachen, unter anderem C, C++, Object Pascal, Java/JDBC, Tcl, PHP, Perl, Python, Ruby, Xojo sowie zu ODBC und .Net-Framework
  • Lauffähig auf vielen Unix-Plattformen, von Version 8.0 an auch nativ unter Microsoft Windows
  • Export und Import sowohl von Daten als auch von Datenbankstrukturen (Schemata)
  • Erweiterbarkeit durch Funktionen, selbstdefinierbare Datentypen und Operatoren
  • Asynchrone und synchrone Replikation
  • Der Vorteil der synchronen Replikation liegt in der Sicherstellung, dass die Transaktion mindestens auf zwei Servern tatsächlich ausgeführt wurde, womit eine vollständige Sicherung jederzeit garantiert werden kann (Hot Standby)
  • Diese Ausfallsicherheit wird naturgemäß durch eine längere Wartezeit auf das Commit erkauft
  • Daher gibt es auch die Möglichkeit, besonders wichtige Geschäftsprozesse wie finanzielle Transaktionen synchron zu replizieren, und bei weniger wichtigen Transaktionen, wie der Aufzeichnung der Benutzerinteraktionen, die sehr viel schnellere asynchrone Replikation zu nutzen

Erweiterungen

Eine Reihe von durch den Benutzer zu installierenden Zusatzmodulen steht zur Verfügung, darunter mit GiST (Generalized Search Tree) eine universelle Schnittstelle, um Such- und Sortierverfahren in weiten Grenzen selbst definieren zu können

Eine Reihe von Erweiterungen beschäftigt sich mit Clustering und Replizierung, dem parallelen Einsatz und Abgleich verteilter DB-Server

Viele Erweiterungen bieten zusätzliche Datentypen an, beispielsweise solche für IBANs, ISBNs, EANs

  • Einige Erweiterungen sind im Lieferumfang des Projekts bereits enthalten und brauchen lediglich für die jeweilige Datenbank (nicht den Server an sich) aktiviert zu werden

Grenzwerte

In diesem Abschnitt werden einige Beschränkungen einer älteren Version beschrieben

  • Da inzwischen neuere Releases bereitgestellt wurden, könnten einige davon weggefallen sein

Die hier beschriebenen Beschränkungen betreffen die Versionen 8.4 bis 9.5

  • maximale Größe der Datenbank: unbeschränkt
  • maximale Größe einer Tabelle: 32 TB
  • maximale Größe eines Datensatzes: 1,6 TB
  • maximale Größe einer Zelle: 1 GB
  • maximale Anzahl Zeilen pro Tabelle: unbeschränkt
  • VARCHAR- und TEXT-Spalten können nicht größer als 1 GB sein
  • Die maximale Anzahl der Spalten pro Tabelle ist abhängig von den verwendeten Datentypen und liegt zwischen 250 und 1600

Upgrade der Datenbank

Jede Nebenversionsnummer wird von der PostgreSQL-Entwickler-Community fünf Jahre lang weitergepflegt

  • Revisionen enthalten Leistungsverbesserungen und Fehlerbereinigungen, aber niemals neue Funktionen
  • Die älteste derzeit (Stand 11/2023) noch gepflegte Versionslinie ist 11, die im Oktober 2018 erschien

Bei einer Software-Aktualisierung müssen bestehende Datenbanken vorher gesichert, danach in der neuen PostgreSQL-Version neu angelegt und die Daten aus der vorherigen Sicherung eingespielt werden

  • Dies ist dann erforderlich, wenn sich erste Stelle der Versionsnummer geändert hat, nicht jedoch bei Änderungen der zweiten Stelle

Alle noch unterstützten Versionen liefern ein Werkzeug namens pg_upgrade mit, welches das Datenverzeichnis ohne das vorher notwendige Sichern und Wiedereinspielen der Datenbank aktualisieren kann

Nach einem Import größerer Datenmengen in eine Datenbank sollte der Befehl „ANALYZE“ ausgeführt werden, damit die Analyse Tabelle „pg_statistics“ richtig befüllt wird

  • Unterbleibt diese Analyse, kann dies zu Performanzproblemen führen

Ansonsten wird dies, genau wie das Kommando „VACUUM“ zur Freigabe von Speicherplatz (eine Art Garbage Collection) in regelmäßigen Abständen automatisch durchgeführt

Softwarewerkzeuge

PostgreSQL selbst läuft als Hintergrundprozess und kann auf verschiedene Weise interaktiv bedient werden Für die kommandozeilenorientierte Bedienung und in Scripts wird die Konsolenanwendung psql mit der Installation mitgeliefert

  • Programme mit grafischer Benutzeroberfläche zur Bedienung und Verwaltung der Datenbank werden auf dem Serverrechner meist nicht installiert, sondern auf Clientrechnern: freie Produkte sind etwa PgAdmin Daneben werden eine Vielzahl von kommerziellen Werkzeugen angeboten, die auch grafische CASE-Modellierung, Im- und Export-Funktionen oder DB-Monitoring bieten

Ein MySQL-Migrationshilfswerkzeug ist in jedem freien PostgreSQL-Downloadpaket von EnterpriseDB enthalten

  • Für viele andere Datenbanksysteme gibt es Migrationsunterstützung, insbesondere für Umsteiger von Oracle
pgtune

Ein wichtiges Werkzeug zur Konfiguration der Datenbank ist das Python Script „pgtune“

  • Die Standardeinstellungen der Datenbank sind oftmals nicht auf die verwendete Hardware angepasst, sondern so eingestellt, dass das System auf quasi jedem Rechner startet. „pgtune“ zeigt Lösungsvorschläge auf, wie man die Datenbank „tunen“ kann, um die Leistung der Datenbank deutlich zu steigern
  • Es gibt ein Online Tool um die wichtigsten Einstellungen der Datenbank zu ermitteln
  • Anfänger tun sich oftmals schwer, die geeigneten Konfigurationsparameter zu ermitteln
  • Das Tool wurde ursprünglich von Greg Smith (2ndQuadrant, mittlerweile EnterpriseDB) entwickelt



Anhang

Siehe auch

Dokumentation

Man-Page
Info-Pages

Links

Projekt
  1. www.postgresql.org – offizielle Webpräsenz (englisch)
  2. www.postgres.de – deutsche Website betreffs PostgreSQL
Weblinks
  1. https://de.wikipedia.org/wiki/PostgreSQL
  2. https://wiki.postgresql.org/wiki/Apt
  3. Postgres.fm, eine Podcastserie zum Thema PostgreSQL
Werkzeuge und Erläuterungen
  1. PGXN (englisch) – PostgreSQL Extension Network
  2. Vortrag vom Chaos Computer Club Ulm: PostgreSQL – Ein Elephant vergisst nie (Video, Audio)
  3. Podcast: /dev/radio zu PostgreSQL
  4. FAQ auf sql-info.de