Transmission Control Protocol: Unterschied zwischen den Versionen

Aus Foxwiki
NicoLehmann (Diskussion | Beiträge)
 
(301 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{| class="wikitable float-right"
'''Transmission Control Protocol''' (TCP)
|-
!colspan="2" style="background:#C0C0FF; font-size:larger;"| TCP (Transmission Control Protocol)
|-
! Familie:
| Internetprotokollfamilie
|-
! Einsatzgebiet:
| Zuverlässiger bidirektionaler<br />Datentransport
|-


! Netzwerk-IP-Transportprotokoll:
== Beschreibung ==
| TCP| Hypertext Transfer Protocol ('''HTTP'''), Simple Mail Transfer Protocol ('''SMTP''')
; Transportprotokoll
{| class="wikitable options"
|-
|-
! Standards:
! Funktionen !! Beschreibung
| RFC 793 (1981)<br />RFC 7323 (2014)
|}
 
Das '''Transmission Control Protocol''' ('''TCP''', ''Übertragungssteuerungsprotokoll'') ist ein Netzwerkprotokoll, das definiert, auf welche Art und Weise Daten zwischen Netzwerkkomponenten ausgetauscht werden sollen.
 
=Geschichte=
 
*Entwickelt von Robert E. Kahn und Vinton G. Cerf als Forschungsarbeit.
*Beginn 1973, erste Standardisierung 1981 als [https://tools.ietf.org/html/rfc793 ''RFC 793''].
*Danach gab es viele Erweiterungen, diese werden bis heute in RFCs spezifiziert.
 
=Was ist TCP=
*Ist ein zuverlässiges, verbindungsorientiertes, paketvermitteltes (nicht ''paketvermittelnd'') Transportprotokoll.
*TCP ermöglicht die Übertragung eines Datenstroms.
*Im Unterschied zum verbindungslosen [[Netzwerke:UDP | User Datagram Protokoll (UDP)]] stellt TCP eine Verbindung zwischen zwei Endpunkten (Sockets) einer Netzverbindung her.
**Auf dieser Verbindung können in beide Richtungen Daten übertragen werden.
 
== Vorteile ==
*Netzwerküberlastungskontrolle.
*Zuverlässige Datenübertragung:
**erkennt verlorene Segmente, doppelte Segmente und fehlerhafte Segmente.
 
== Allgemeines ==
TCP ist im Prinzip eine Ende-zu-Ende-Verbindung in Vollduplex.
*Kann auch als zwei Halbduplexverbindungen betrachtet werden (Informationsfluss in beide Richtungen (allerdings nicht gleichzeitig)).
*Die Daten in Gegenrichtung können zusätzliche Steuerungsinformationen enthalten.
*Anwendungen, die TCP häufig nutzen, sind zum Beispiel Webbrowser und Webserver.
 
=== TCP-Software ===
*Übernimmt Verbindungsverwaltung sowie die Datenübertragung.
*Netz-Protokollstack des Betriebssystems.
*Anwendungsprogramme nutzen Sockets. 
 
==== Software-Schnitstelle ====
*bei Windows in extra einzubindenden Programmbibliotheken („Winsock.dll“ bzw. „wsock32.dll“).
*Linux und andere unixoide Betriebssysteme enthalten einen Socketlayer im Betriebssystemkern (Zugriff über Systemaufrufe).
 
== TCP-Verbindung ==
*Jede TCP-Verbindung wird eindeutig durch zwei Endpunkte identifiziert.
**Ein Endpunkt stellt ein geordnetes Paar dar (IP-Adresse und Port).
**Ein solches Paar bildet eine bidirektionale Software-Schnittstelle (Socket).
TCP-Verbindungen werden durch vier Werte (einem Quadrupel) eindeutig identifiziert:
 
(Quell-IP-Adresse, Quell-Port, Ziel-IP-Adresse, Ziel-Port)
 
=== Beispiel ===
#Ein Serverprozess erzeugt einen Socket auf Port 80 (''bind'').
#*Markiert diesen für eingehende Verbindungen (''listen'').
#*Fordert vom Betriebssystem die nächste anstehende Verbindung an (''accept'').
#*Diese Anforderung blockiert den Serverprozess zunächst, da noch keine Verbindung existiert.
#Die erste Verbindungsanfrage kommt und wird vom Betriebssystem angenommen, die Verbindung kommt zustande.
#Jetzt wird diese Verbindung durch das Quadrupel identifiziert.
##Der Serverprozess wird aufgeweckt und ihm ein Handle für diese Verbindung überreicht.
##Üblich startet der Serverprozess einen Kindprozess, dem er die Behandlung der Verbindung delegiert.
##Der Serverprozess fährt mit einer weiterer ''Accept''-Anforderung an das Betriebssystem fort.
*Dadurch ist es möglich, dass ein Webserver mehrere Verbindungen von verschiedenen Rechnern annehmen kann.
 
=== Ports ===
*Portnummern sind Dualsystem 16-Bit-Zahlen und reichen von 0 bis 65535.
*Ports von 0 bis 1023 sind reserviert
**Vergeben von '''I'''nternet '''A'''ssigned '''N'''umbers '''A'''uthority (IANA)
**z.B. ist Port 80 für '''H'''yper'''t'''ext '''T'''ransfer '''P'''rotocol (HTTP) reserviert.
*Das Benutzen der vordefinierten Ports ist nicht bindend.
**Jeder Administrator kann bspw. einen FTP-Server (normalerweise Port 21) auch auf einem beliebigen Port laufen lassen.
*Mehrfaches ''listen'' auf demselben Port ist nicht möglich.
 
== Aufbau des TCP-Headers ==
=== Allgemeines ===
*Das TCP-Segment besteht immer aus zwei Teilen: dem  Header  und der Nutzlast.
*Die Nutzlast enthält die zu übertragenden Daten.
**Die wiederum Protokollinformationen der Anwendungsschicht, wie HTTP oder FTP, entsprechen können.
*Der Header enthält für die Steuerung der Kommunikation erforderliche Daten.
*Da das Options-Feld in der Regel nicht genutzt wird, hat ein typischer Header eine Größe von 20 Byte.
 
== Felder des TCP-Header ==
[[Datei:TCP Header.svg|mini|550px| Aufbau des TCP-Headers]]
 
{| class="wikitable"
! Feld !! Funktion !! Größe
|-----
| Source Port (Quellport)
|
*Gibt die Portnummer auf der Senderseite an
| 2 Byte
|-----
| Destinations Port (Zielport)
|
*Gibt die Portnummer auf der Empfängerseite an.
| 2 Byte
|-----
| Sequence Number
|
*Sequenznummer des ersten Daten-Oktett dieses TCP-Segments, dient zur Sortierung <br/> Oder die Initialisierungs-Sequenznummer falls das SYN-Flag gesetzt ist
| 4 Byte
|-----
| Acknowledgement Number
|
*Gibt die '' Sequenznummer '' an, die der Absender dieses TCP-Segments als Nächstes erwartet <br/> Sie ist nur gültig, falls das ACK-Flag  gesetzt ist.
| 4 Byte
|-----
| Data Offset
|
*Gibt die ''Länge des TCP-Headers'' in 32-Bit-Blöcken an (ohne Nutzdaten). <br/>
*Hiermit wird die Startadresse der Nutzdaten angezeigt.
| 4 Bit
|-----
| Reserved
|
*Ist für zukünftige Verwendungen reserviert.
*Alle Bits müssen null sein.
| 4 Bit
|-----
| Control-Flags
|
*Zweiwertige Variablen mit den Zuständen ''gesetzt'' und ''nicht gesetzt''.
*Kennzeichnung für die wichtigen Zustände der Kommunikation und Weiterverarbeitung der Daten.
| 8 Bit
|-----
| (Receive) Window
|
*Ist die Anzahl der Bytes die der Sender dieses TCP-Segments bereit ist zu empfangen.
*Beginnend bei dem durch das ''Acknowledgementfeld'' indizierten Daten-Oktett.
| 2 Byte
|-----
| Checksum
|
*Dient zur Erkennung von Übertragungsfehlern.
*Wird über den TCP-Header, die Daten und einen Pseudo-Header berechnet.
*Der Header besteht aus Ziel-IP, Quell-IP, TCP-Protokollkennung (0x0006) und der Länge des TCP-Headers inkl. Nutzdaten (in Bytes).
| 2 Byte
|-----
| Urgent Pointer
|
*Nur gültig, wenn das URG-Flag gesetzt ist.
*Die Urgent-Daten beginnen sofort nach dem Header
*Zusammen mit der Sequenz-Nummer gibt dieser Wert die Position des ersten Bytes ''nach'' den Urgent-Daten an.
| 2 Byte
|-----
| Options
|
*Unterschiedlich groß und enthält Zusatzinformationen.
*Müssen ein Vielfaches von 32 Bit lang sein, ansonsten muss mit Nullbits aufefüllt werden (''Padding'').
*Ermöglicht Verbindungsdaten auszuhandeln, die nicht im TCP-Header enthalten sind, wie z.B. die Maximalgröße des Nutzdatenfeldes.
| 0–40 Byte
|}
 
== TCP-Flags ==
{| class="wikitable"
! Feld !! Funktion !! Größe
|-----
| ECE-Flag (ECN-Echo)
|
* Teilt dem Sender mit, dass das Netzwerk überlastet ist und die Senderate reduziert werden muss.
* Werden für  Explicit Congestion Notification (ECN) benötigt
| 1 Bit
|-----
| CRW-Flag (''Congestion Window Reduced'')
|
* Teilt dem Empfänger mit das die Senderate reduziert wurde.
| 1 Bit
|-----
| URG-Flag (''Urgent'')
|
*Die Daten nach dem Header werden sofort von der Anwendung bearbeitet.
*Anwendung unterbricht die Datenverarbeitung des aktuellen TCP-Segments und liest alle Bytes nach dem Header bis zu dem Byte, auf das das ''Urgent-Pointer ''-Feld zeigt, aus.
*Kann verwendet werden, um eine Anwendung auf dem Empfänger abzubrechen.
*In der Regel wird dieses Flag nicht ausgewertet.
| 1 Bit
|-----
| ACK-Flag (''Acknowledgment'')
|
* Hat in Verbindung mit der ''Acknowledgment''-Nummer die Aufgabe, den Empfang von TCP-Segmenten bestätigen.
* Die ''Acknowledgment''-Nummer ist nur gültig, wenn das Flag gesetzt ist.
| 1 Bit
|-----
| PSH-Flag (RFC 1122 & RFC 793)
|
* Sowohl der ausgehende, als auch der eingehende Puffer wird übergangen.
* Hilft den Datenstrom von TCP effizienter zu verarbeiten, indem die empfangende Applikation gezielter aufgeweckt werden kann.
| 1 Bit
|-----
| RST-Flag (''Reset'')
|
* Wird verwendet, wenn eine Verbindung abgebrochen werden soll.
* z.B. bei technischen Problemen oder zur Abweisung unerwünschter Verbindungen
* Oder bei nicht geöffneten Ports, es wird kein ICMP-Paket mit „Port Unreachable“ verschickt.
| 1 Bit
|-----
| SYN-Flag (''Synchronize'')
|
* Pakete mit diesem Flag initiieren eine Verbindung.
* Dient der Synchronisation von ''Sequenznummern'' beim Verbindungsaufbau.
* Server antwortet normalerweise mit SYN+ACK oder RST.
| 1 Bit
|-----
| FIN-Flag (''finish'')
|
* Schlussflag, dient zur Freigabe der Verbindung, zeigt an, dass keine Daten vom Sender kommen.
* FIN- und SYN-Flags haben Sequenznummern, damit diese in der richtigen Reihenfolge abgearbeitet werden.
| 1 Bit
|-----
|}
 
== Verbindungsaufbau und -abbau ==
=== Allgemein ===
Ein Server, der seinen Dienst anbietet, erzeugt einen Endpunkt (Socket) mit der Portnummer und seiner IP-Adresse.
*Bezeichnet als "''passive open''" oder "''listen''".
 
Ein Client, der eine Verbindung aufbauen will, erzeugt einen Endpunkt (Socket) mit seiner IP-Adresse und einer eigenen, noch freien Portnummer.
*Mit der Adresse des Servers und dem Port kann dann eine Verbindung aufgebaut werden.
 
Während der Datenübertragungsphase sind die Rollen von Client und Server (aus TCP-Sicht) vollkommen symmetrisch.
*Bezeichnet als "''active open''"
Jeder der beiden beteiligten Rechner einen Verbindungsabbau einleiten.
 
=== Verbindungsaufbau ===
[[Datei:Tcp-handshake.svg|mini|500px| TCP-Handshake]]
 
#Der Client sendet dem Server ein ''SYN''-Paket mit einer Sequenznummer ''x''.
#*Die Sequenznummern sind für die Sicherstellung einer vollständigen Übertragung in der richtigen Reihenfolge und ohne Duplikate wichtig.
#*Ein Paket, dessen ''SYN-Bit'' im Header gesetzt ist.
#*Die Start-Sequenznummer ist eine beliebige zufällige Zahl, abhängig von der TCP-Implementierung.  <br/> <br/>
#Der Server empfängt das Paket und antwortet.
#*Port geschlossen, antwortet er mit einem TCP-RST, ein Signal, dass keine Verbindung aufgebaut werden kann.
#*Port geöffnet, bestätigt er den Erhalt des ersten SYN-Pakets und stimmt dem Verbindungsaufbau zu, indem er ein SYN/ACK-Paket zurückschickt.
#**Ein Paket, mit ACK-Flag im TCP-Header, welche die Sequenznummer ''x+1'' des SYN-Pakets im Header enthalten.
#**Der Server sendet im Gegenzug seine Start-Sequenznummer ''y'', diese ist unabhängig von der Start-Sequenznummer des Clients. <br/> <br/>
#Der Client bestätigt den Erhalt des SYN/ACK-Pakets durch ein eigenes ACK-Pakets mit der Sequenznummer ''x+1''.
#*Wird auch als „Forward Acknowledgement“ bezeichnet.
#*Aus Sicherheitsgründen sendet der Client die Sequenznummer des Servers + 1 im ACK-Segment zurück. <br/> <br/>
#Die Verbindung ist damit aufgebaut.
 
==== Verbindungsaufbau Beispiel ====
<br/>
{| style="text-align:center"
|-
|-
|width="60px"| 1. || SYN-SENT ||width="60px"| → || <SEQ=100><CTL=SYN> ||width="60px"| → || SYN-RECEIVED
| Zuverlässig ||
|-
|-
| 2. || SYN/ACK-RECEIVED || ← || <SEQ=300><ACK=101><CTL=SYN,ACK> || ← || SYN/ACK-SENT
| Verbindungsorientiert ||
|-
|-
| 3. || ACK-SENT || → || <SEQ=101><ACK=301><CTL=ACK> || → || ESTABLISHED
| Datenströme || Übertragung von Datenströmen
|}
|}
<br/>
*Nach Aufbau ist die Verbindung für beide Kommunikationspartner gleichberechtigt
*Man kann einer bestehenden Verbindung auf TCP-Ebene nicht ansehen, wer der Server und wer der Client ist.
*Eine Unterscheidung dieser beiden Rollen in der weiteren Betrachtung keine Bedeutung mehr.


=== Verbindungsabbau ===
; TCP stell eine Verbindung zwischen zwei Endpunkten (Sockets) einer Netzverbindung her
[[Datei:TCP-Teardown.svg|mini|500px| TCP-Teardown]]
* Auf dieser Verbindung können in beide Richtungen Daten übertragen werden
* Unterschied zu UDP (verbindungslos [[Netzwerke:UDP | User Datagram Protokoll (UDP)]])


*Der Verbindungsabbau kann ''beidseitig'' oder ''schrittweise einseitig'' erfolgen.
; Vorteile
*Der geregelte Verbindungsabbau erfolgt dem Verbindungsaufbau ähnlich.
* [[Transmission Control Protocol/Überlastungskontrolle|Überlastungskontrolle]]
*#Statt dem SYN-Bits kommt das FIN-Bit zum Einsatz, welches anzeigt, dass keine Daten mehr vom Sender kommen werden.
* Zuverlässige Datenübertragung
*#Der Erhalt des Pakets wird mit ACK bestätigt und der Empfänger des FIN-Pakets sendet zuletzt seinerseits ein FIN-Paket.
** erkennt verlorene, doppelte und fehlerhafte Segmente
*#Dieses FIN-Paket wird ihm zuletzt bestätigt.


*Ein verkürztes ist Verfahren möglich, bei dem FIN und ACK genau wie beim Verbindungsaufbau im selben Paket untergebracht werden.
; Allgemeines
* TCP ist im Prinzip eine Ende-zu-Ende-Verbindung in Vollduplex
* Kann auch als zwei Halbduplexverbindungen betrachtet werden (Informationsfluss in beide Richtungen (allerdings nicht gleichzeitig))
* Die Daten in Gegenrichtung können zusätzliche Steuerungsinformationen enthalten
* Anwendungen, die TCP häufig nutzen, sind zum Beispiel Webbrowser und Webserver


=== Halb geschlossene Verbindungen ===
; TCP-Software
*Der Verbindungsabbau erfolgt schrittweise einseitig.
* Übernimmt Verbindungsverwaltung sowie die Datenübertragung
*Erlaubt der Gegenseite nach der einseitigen Trennung noch Daten zu übertragen.
* Netz-Protokollstack des Betriebssystems
* Anwendungsprogramme nutzen Sockets


=== Halb offene Verbindungen ===
==== Entwicklung ====
*wenn eine Seite abstürzt, ohne dass die verbleibende Seite dies erfährt.
* Entwickelt von Robert E. Kahn und Vinton G. Cerf als Forschungsarbeit
*Effekt: Betriebssystemressourcen werden nicht freigegeben.  
* Beginn 1973, erste Standardisierung 1981 als [https://tools.ietf.org/html/rfc793 ''RFC 793'']
*Ursprung: TCP-Verbindungen von der Protokollseite bestehen, bis sie abgebaut werden.
* Danach gab es viele Erweiterungen, diese werden bis heute in RFCs spezifiziert


==== Maximum segment lifetime (MSL)====
== Das Transmission Control Protocol arbeitet auf dem OSI-04 ==
*Die maximale Zeit, die ein Segment im Netzwerk verbringen kann, bevor es verworfen wird.
* TCP verwendet 16-Bit Portnummern zur Adressierung
*Nach dem Senden des letzten ACKs wechselt der Client in einen zwei MSL andauernden Wartezustand (''wait state''), in dem alle verspäteten Segmente verworfen werden.
* Zusätzlich zur Adressierung übernimmt es weitere Aufgaben
**Dadurch wird sichergestellt, dass keine verspäteten Segmente als Teil einer neuen Verbindung fehlinterpretiert werden können.  
* Verbindungsmanagement (Three-Way-Handshake)
**Außerdem wird eine korrekte Verbindungsterminierung sichergestellt.  
* Verbindungsaufbau/-abbau
*Geht ACK ''y+1'' verloren, läuft beim Server der Timer ab, und das LAST_ACK-Segment wird erneut übertragen.
* Fehlerkontrolle (-korrektur)
* Flußkontrolle (Flow Control)
* verhindert, dass der Empfänger von einem Sender schneller Daten erhält, als er entgegennehmen kann
* Netzwerk-Überlastkontrolle (Congestion Control)
* verhindert, dass es zu einer Überlastsituation im Netz kommt, die zum vollständigen Zusammenbruch des Netzes führen könnte (congestion collapse)
* bei Erkennen einer Überlastsituation (Paketverlust!) wird vom Sender die Datenrate gedrosselt
* transparente Übertragung von byte streams
* Anwendungen, die TCP benutzen, sollen nicht merken, dass die Daten in Form von Paketen übertragen werden
* Mutliplexing
* Mehrfachnutzung einer Verbindung
* Verbindungsorientiertes Protokoll
* Beinhaltet verschiedene Algorithmen zur Fehlererkennung und -behandlung
* Sequenznummern
* Quittungsnummern
* Anzeigen (Flags)
* Die richtige Reihenfolge der Daten ist garantiert
* Bietet der Anwendungsschicht einen zuverlässigen Transportdienst
* RFC 793. J. Postel. Transmission Control Protocol. 1981
* setzt direkt auf dem Internet Protokoll (IP) auf
* IP Protokoll Nr.: 06
* Theoretisch ist es möglich TCP mit einem beliebigen Protokoll der Schicht 3 zu kombinieren
* Praktisch wird TCP allerdings immer in IP gekapselt
* garantiert eine fehlergesicherte, zuverlässige Transportverbindung zwischen zwei Rechnersystemen (Ende zu Ende Kontrolle)


=== Puffer ===
=== TCP im DoD-Modell ===
*Beim Datenversand über TCP werden zwei Puffer verwendet.
* Rolle von TCP im OSI-Referenzmodell
#Senderseitig übermittelt die Applikation die Sendedaten an TCP und dieses puffert die Daten.
#Effizient werden mehrere kleine Übertragungen in Form einer einzigen großen gesendet.
#Empfängerseitig landen die empfangenen Daten im Puffer, dieser verfolgt ähnliche Ziele.
*Wenn von TCP mehrere einzelne Pakete empfangen wurden, ist es besser, diese zusammengefügt an die Applikation weiterzugeben.


=== Drei-Wege-Handschlag ===
=== Eigenschaften von TCP ===
*Typisch werden Antworten auf das erste SYN- bzw. FIN-Paket zu einem einzelnen Paket zusammengefasst (SYN/ACK bzw. FIN/ACK).
* Vollduplex-Verbindung
**Theoretisch wäre auch das Versenden zweier separater Pakete denkbar.
* stellt eine “byte pipe” zur Verfügung - unstrukturierter Datenstrom
*In diesem Fall müssen nur noch drei Pakete versendet werden, man spricht vom Drei-Wege-Handschlag.
* Folgenummern sind Bytenummern
*Das Zusammenfassen des FIN-Pakets und ACK-Pakets ist problematisch.
* Sliding Window-Protokoll
**Das Fin-Paket signalisiert „keine weiteren Daten“.
* Variable Grösse des Sendefensters bestimmt durch das Maximum von:
*Allerdings kann der Sender des FIN-Pakets weiterhin Daten empfangen wollen (halb geschlossenen Verbindung).
* Angabe des Empfängers (receiver window size)
<br/>
* Congestion window size, abhängig von einer lokalen Schätzung der Netzbelastung -> “Slow Start” Algorithmus
; Überlegung
#Den Beginn einer HTTP-Anfrage im SYN-Paket mitschicken, weitere Daten nach Verbindungsaufbau.
#Im letzten HTTP-Request-Paket die Verbindung mittels FIN schließen.
*In der Praxis nicht angewendet da:
**Wenn der Browser die Verbindung auf diese Art schließt, würde möglicherweise der Server die Verbindung schließen, anstatt die Anfrage vollständig zu beantworten.


[[Datei:Tcp verbindung.png|mini| Verwaltung der TCP-Verbindungen als endlicher Automat]]
== Basismechanismen ==
* Unterteilt den byte stream in Einheiten
* die jeweils in einem IP Paket übertragen werden, diese Einheiten heißen Segmente
* Segmente haben eine variable Länge
* Die maximale Segmentgrösse wird bei der Verbindungserstellung festgelegt
* Jedes Segment hat eine Folgenummer, die seine Position im Datenstrom in Bytes spezifiziert
* Abgesendete Segmente müssen innerhalb einer bestimmten Zeit bestätigt werden (adaptiv geschätzte Round Trip Time)
* Bestätigungen werden verzögert gesendet (ca. 200 ms)
* Wenn keine Bestätigung über den erfolgreichen Empfang dieses Paketes innerhalb der Timer-Laufzeit eintrifft, wird die Übertragung wiederholt
* Jedes Segment hat eine Ende-zu-Ende-Prüfsumme
* Fehlerhaft empfangene Segmente werden ignoriert
* Empfänger ordnet empfangene Segmente entsprechend ihrer Folgenummer
* Duplikate werden ignoriert


== Datenübertragung ==
== Socket-Schnittstelle ==
[[Datei:Tcp daten.svg|mini| 450px | Segmentierung der Nutzdaten]]
* De-facto-Standard für TCP/IP Programmierschnittstelle
* Zugang zu TCP, UDP und (eingeschränkt) IP
* Unterstützung verschiedener Protokolle
* Protocol familiy
* Address familiy
* Abstraktion für Kommunikationsendpunkte
* sockets
… mit verschiedenen Kommunikationseigenschaften
* socket types (stream socket, datagram socket)
* Benennung/Adressierung von Kommunikations-endpunkten
* name binding
* Können benutzt werden wie Dateideskriptoren


=== TCP-/IP-Segment-Größe ===
== Verbindungen und Verbindungsendpunkte ==
*Typischerweise eine Größe von maximal 1500Bytes .
* Eine TCP-Verbindung wird durch ein Paar von Adressen und Port-Nummern identifiziert (Verbindungsendpunkte):
*Muss in die darunter liegende Übertragungsschicht passen, das  Internetprotokoll  (IP).
* IP-Adresse und Port-Nummer Host A
*IP-Pakete sind zwar bis 65.535Bytes (64KiB ) spezifiziert, werden aber meist über Ethernet übertragen.
* IP-Adresse und Port-Nummer Host B
**Bei Ethernet ist die Größe der (Layer-3-)Nutzdaten auf 64 bis 1500Bytes festgelegt (bei Jumbo Frames höher).
* Jede Verbindung wird durch ein Paar von Verbindungsendpunkten eindeutig identifiziert
*TCP- und IP-Protokoll definieren jeweils einen Header von 20Bytes Größe.
* mehrere Verbindung zwischen den gleichen Hosts sind dadurch gleichzeitig möglich
*Für die (Applikations-)Nutzdaten bleiben in einem TCP/IP-Paket also 1460Bytes übrig.
*Da die meisten Internet-Anschlüsse DSL verwenden, kommt zusätzlich das Point-to-Point Protocol (PPP) zwischen IP und Ethernet zur Anwendung (8Bytes).


Die Nutzdaten reduzieren sich also auf insgesamt 1500− 20− 20− 8 =1452Bytes  Maximum Segment Size (MSS).
== Segmente, Datenströme und Sequenznummern ==
*Dies entspricht einer maximalen Nutzdatenrate von 96,8 %.
* Erhaltung der Reihenfolge
* Nummerierung:
* Zufallszahl auf beiden Seiten (32 Bit)
* Seq.nr. := Initiale Seq.nr. + Byte-Position im Datenstrom
* TCP betrachtet einen Datenstrom als Sequenz von Bytes, die für die Übertragung in TCP-Segmente eingeteilt werden
* Jedes Segment wird dann in der Regel auf ein IP-Paket abgebildet
* Größe eines Segmentes bei lokaler Übertragung gemäß physikalischem Netz (MTU)
* Ist diese nicht angegeben oder kann sie nicht ermittelt werden, dann wird ein Standartwert von 536 Bytes verwandt


=== Aufteilen der Anwendungsdaten auf TCP-/IP-Segmente ===
== Allgemeines ==
# Empfänger und Sender einigen sich vor dem Datenaustausch über das Options-Feld auf die Größe der Maximum Segment Size (MSS).
TCP ist im Prinzip eine [[Ende-zu-Ende-Verbindung]] in [[Vollduplex]], welche die Übertragung der Informationen in beide Richtungen zulässt, analog zu einem Telefongespräch
# Als Beispiel legt ein Webserver einen 7Kilobyte großen Datenblock im Puffer ab.
* Diese Verbindung kann auch als zwei [[Duplex (Nachrichtentechnik)|Halbduplexverbindungen]], bei denen Informationen in beide Richtungen (allerdings nicht gleichzeitig) fließen können, betrachtet werden
#* Um mit einem 1460Byte großen Nutzdatenfeld 7Kilobyte Daten zu versenden:
* Die Daten in Gegenrichtung können dabei zusätzliche Steuerungsinformationen enthalten
#*# Teilt die TCP-Software die Daten auf mehrere Pakete auf
* Die Verwaltung dieser Verbindung sowie die Datenübertragung werden von der TCP-Software übernommen
#*# Fügt einen TCP-Header hinzu und versendet die TCP-Segmente.
* Die TCP-Software ist üblicherweise im Netz-Protokollstack des Betriebssystems angesiedelt
#* Dieser Vorgang wird Segmentierung genannt.
* Anwendungsprogramme benutzen eine Schnittstelle dazu, meist [[Socket (Software)|Sockets]], die sich (je nach Betriebssystem unterschiedlich) beispielsweise bei [[Microsoft Windows]] in extra einzubindenden [[Programmbibliothek]]en („[[Winsock]].dll“ bzw. „wsock32.dll“) befinden. [[Linux]] und viele andere [[Unixoides System|unixoide Betriebssysteme]] enthalten einen Socketlayer im Betriebssystemkern
# Der Datenblock im Puffer wird in fünf Segmente aufgeteilt, diese werden nacheinander abgeschickt.
* Auf den Socketlayer wird über Systemaufrufe zugegriffen
## Jedes Segment erhält durch die TCP-Software einen TCP-Header.
* Anwendungen, die TCP häufig nutzen, sind zum Beispiel [[Webbrowser]] und [[Webserver]]
# Segmente kommen nicht zwingend in richtiger Reihenfolge an.
# Um die Segmente wieder zu sortieren, ist jedes Segment nummeriert.  
#* Bei der Zuordnung der Segmente im Empfänger wird die Sequenznummer herangezogen.
#Die TCP-Software des Empfängers bestätigt die einwandfrei angekommenen TCP-Segmente.
#*Andernfalls werden die Pakete neu angefordert.


=== Beispiel einer TCP-/IP-Datenübertragung ===
Jede TCP-Verbindung wird eindeutig durch zwei Endpunkte identifiziert
[[Datei:Tcp transfer.png|mini|450px| Beispiel eines Datentransfers]]
* Ein Endpunkt stellt ein [[geordnetes Paar]] dar, bestehend aus [[IP-Adresse]] und [[Port (Protokoll)|Port]]
#Der Sender schickt sein erstes TCP-Segment mit einer Sequenznummer SEQ=1 und einer Nutzdatenlänge von 1460Bytes an den Empfänger.
* Ein solches Paar bildet eine bidirektionale [[Software]]-Schnittstelle und wird auch als [[Socket (Software)|Socket]] bezeichnet
#Der Empfänger bestätigt es mit einem TCP-Header, ohne Daten, mit ACK=1461 und fordert das zweite TCP-Segment ab dem Byte Nummer 1461 an.
* Somit wird eine TCP-Verbindung durch vier Werte (einem Quadrupel) identifiziert:
#Sender schickt es dann mit einem TCP-Segment und SEQ=1461 an den Empfänger.
#Empfäner bestätigt es wieder mit einem ACK=2921.


*Der Empfänger braucht nicht jedes TCP-Segment zu bestätigen, wenn diese zusammenhängend sind.
(Lokaler Rechner, Lokaler Port, Entfernter Rechner, Entfernter Port)
*Empfängt er die TCP-Segmente 1–5, so braucht er nur das letzte TCP-Segment zu bestätigen.
*Fehlt zum Beispiel das 3. Segment, kann er nur die 1 und die 2 bestätigen, 4 und 5 jedoch noch nicht.
**Da der Sender keine Bestätigung für die 3 bekommt, läuft sein Timer ab, und er verschickt die 3 noch einmal.
**Kommt die 3 beim Empfänger an, so bestätigt er alle fünf TCP-Segmente, wenn beide die TCP-Option Selective ACK (SACK) unterstützen.
*Der Sender startet für jedes TCP-Segment, welches er auf die Reise schickt, einen Retransmission Timer.


=== Retransmission Timer ===
Dabei kommt es auf das gesamte Quadrupel an
*Zur Feststellung, wann ein Paket im Netzwerk verloren gegangen ist, wird vom Sender ein Timeout verwendet, bis zu dem das ACK der Gegenseite eingetroffen sein muss.
* Beispielsweise können zwei verschiedene Prozesse auf demselben Rechner denselben lokalen Port benutzen und dabei sogar mit demselben Rechner auf der gegenüberliegenden Seite kommunizieren, sofern die beteiligten Prozesse auf der anderen Seite unterschiedliche Ports benutzen
**Timeout zu niedrig, Pakete werden doppelt geschickt.
* In einem solchen Fall würde es sich um zwei verschiedene Verbindungen handeln, deren Quadrupel sich nur in einem von vier Werten unterscheidet: dem Port auf der gegenüberliegenden Seite
**Timeout zu hoch, velorene Pakete werden zu spät neu geschickt.


*Aufgrund unterschiedlicher Laufzeiten der IP-Pakete ist nur ein dynamischer Timer sinnvoll.
Verbindung 1: (Lokaler Rechner, Port x, Entfernter Rechner, Port y)
Verbindung 2: (Lokaler Rechner, Port x, Entfernter Rechner, Port z)


=== Zusammenhang von Flusssteuerung und Staukontrolle ===
Ein Serverprozess erzeugt beispielsweise einen Socket (''socket bind'') auf Port 80, markiert diesen für eingehende Verbindungen (''listen'') und fordert vom Betriebssystem die nächste anstehende Verbindung an (''accept'')
*In den folgenden zwei Abschnitten werden die TCP-Konzepte zur Flusssteuerung und Staukontrolle (oder Überlaststeuerung) erläutert.
* Diese Anforderung blockiert den Serverprozess zunächst, da noch keine Verbindung existiert
*Dabei werden das '' Sliding Window '' und das '' Congestion Window '' eingeführt.
* Kommt dann die erste Verbindungsanfrage durch einen Client an, wird sie vom Betriebssystem angenommen, so dass die Verbindung zustande kommt
*Der Sender wählt als tatsächliche Sendefenstergröße das Minimum aus beiden Fenstern.
* Ab jetzt wird diese Verbindung durch das oben beschriebene Quadrupel identifiziert
*Es werden ARQ-Protokolle (Automatic Repeat reQuest) für eine zuverlässige Datenübertragung eingesetzt.


=== Flusssteuerung ===
Schließlich wird der Serverprozess aufgeweckt und ihm ein Handle für diese Verbindung überreicht. Üblicherweise startet der Serverprozess anschließend einen Kindprozess, zu dem er die Behandlung der Verbindung delegiert
[[Datei:Sliding window.svg|mini| Sliding Window]]
* Er selbst setzt dann seine Arbeit mit einer weiteren ''Accept''-Anforderung an das Betriebssystem fort
Dadurch ist es möglich, dass ein Webserver mehrere Verbindungen von verschiedenen Rechnern annehmen kann
* Mehrfaches ''listen'' auf demselben Port ist nicht möglich. Üblicherweise bestimmt das Programm auf der [[Client]]seite den Port nicht selbst, sondern lässt ihn sich vom Betriebssystem zuweisen


Da Daten aus dem Puffer gelesen werden, ändert sich der Füllstand des Puffers ständig.
Ports sind [[Dualsystem|16-Bit-Zahlen]] (Portnummern) und reichen von 0 bis 65535
* Deshalb ist es notwendig, den Datenfluss dem Füllstand entsprechend zu steuern.
* Ports von 0 bis 1023 sind reserviert ([[Well Known Ports]] und werden von der [[Internet Assigned Numbers Authority|IANA]] vergeben, z.&nbsp;B.&nbsp;ist Port 80 für das im [[World Wide Web|WWW]] verwendete [[Hypertext Transfer Protocol|HTTP]] reserviert
** Dies geschieht mit dem '' Sliding Window '' und dessen Größe.
* Das Benutzen der vordefinierten Ports ist nicht bindend
* Der Puffer des Senders wird auf auf 10 Segmente erweitert.
* So kann jeder Administrator beispielsweise einen FTP-Server (normalerweise Port 21) auch auf einem beliebigen anderen Port laufen lassen


== Datenintegrität und Zuverlässigkeit ==
Im Gegensatz zum verbindungslosen [[User Datagram Protocol|UDP]] [[Implementation|implementiert]] TCP einen bidirektionalen, byte-orientierten, zuverlässigen Datenstrom zwischen zwei Endpunkten
* Das darunterliegende Protokoll ([[Internet Protocol|IP]]) ist paketorientiert, wobei [[Datenpaket]]e verlorengehen können, in verkehrter Reihenfolge ankommen dürfen und sogar doppelt empfangen werden können
* TCP wurde entwickelt, um mit der Unsicherheit der darunterliegenden Schichten umzugehen
* Es prüft daher die Integrität der Daten mittels der [[Prüfsumme]] im Paketkopf und stellt die Reihenfolge durch [[Sequenznummer]]n sicher
* Der Sender [[Sendewiederholung|wiederholt]] das Senden von Paketen, falls keine Bestätigung innerhalb einer bestimmten Zeitspanne ([[Timeout (Netzwerktechnik)|Timeout]]) eintrifft
* Die Daten der Pakete werden beim Empfänger in einem [[Puffer (Informatik)|Puffer]] in der richtigen Reihenfolge zu einem Datenstrom zusammengefügt und doppelte Pakete verworfen


;Im Sliding Window (a) werden gerade die Segmente 1–5 übertragen.
Der [[Datentransfer]] kann selbstverständlich jederzeit nach dem „Aufbau einer Verbindung“ gestört, verzögert oder ganz unterbrochen werden
# Obwohl der Puffer voll ist, werden die nächsten Daten (ab Byte 7301) mit ACK=7301 angefordert.
* Das Übertragungssystem läuft dann in einen Timeout
#* Das nächste Segment kann nicht mehr verarbeitet werden.
* Der vorab getätigte „Verbindungsaufbau“ stellt also keinerlei Gewähr für eine nachfolgende, dauerhaft gesicherte Übertragung dar
#* Mit dem Window-Feld (=0) teilt er dem Sender mit, dass keine Daten mehr verschickt werden sollen.
# Die Anwendung liest die Segmente 1–5 aus dem Puffer, es werden 7300Byte frei.
# Er kann die restlichen Segmente 6–10 mit einem TCP-Header (SEQ=1, ACK=7301, Window=7300), beim Sender anfordern.
# Der Sender weiß nun, dass er maximal fünf Segmente schicken kann, und verschiebt das Window um fünf Segmente nach rechts (Sliding Window (b)).
# Die Segmente 6–10 werden nun alle zusammen als ''Burst'' verschickt.
# Beim Ankommen aller TCP-Segmente beim Empfänger, quittiert er sie (SEQ=1 und ACK=14601) und fordert die nächsten Daten an.


=== Überlaststeuerung/Staukontrolle (Congestion Control) ===
=== Bestätigungen ===
Die jeweilige Länge des Puffers, bis zu der keine Lücke im Datenstrom existiert, wird bestätigt (''windowing'')
* Dadurch ist das Ausnutzen der Netz-Bandbreite auch bei großen Strecken möglich
* Bei einer Übersee- oder Satellitenverbindung dauert das Eintreffen des ersten ACK-Signals aus technischen Gründen bisweilen mehrere 100&nbsp;Millisekunden, in dieser Zeit können unter Umständen mehrere hundert Pakete gesendet werden
* Der Sender kann den Empfängerpuffer füllen, bevor die erste Bestätigung eintrifft
* Alle Pakete im Puffer können gemeinsam bestätigt werden
* Bestätigungen können zusätzlich zu den Daten in den [[#Aufbau des TCP-Headers|TCP-Header]] des entgegengesetzten Datenstroms eingefügt werden (''piggybacking''), falls der Empfänger ebenfalls Daten für den Sender bereithält


*Wird eine Verbindung stark belastet, werden immer mehr Pakete verworfen.
<noinclude>
*Durch die Wiederholung steigt wiederum die Belastung, dies sorgt (ohne Maßnahmen) für einen Datenstau.
*Die Verlustrate wird von einem IP-Netzwerk ständig beobachtet.
*Normalerweise wird eine TCP/IP-Verbindung langsam gestartet (Slow-Start) und die Senderate schrittweise erhöht, bis zum Datenverlust.
*Ein Datenverlust verringert die Senderate, ohne Verlust wird sie wiederum erhöht.


==== Algorithmus zur Überlaststeuerung ====
== Anhang ==
Gehen bei einer bestimmten Fenstergröße Pakete verloren, kann das festgestellt werden, wenn der Sender innerhalb einer bestimmten Zeit (Timeout) kein ACK erhält.
=== Siehe auch ===
*Man muss davon ausgehen, dass das Paket aufgrund zu hoher Netzlast von einem Router im Netz verworfen wurde (Stau im Netz).
{{Special:PrefixIndex/Transmission Control Protocol}}
*Um den Stau aufzulösen, müssen alle beteiligten Sender ihre Netzlast reduzieren.
----
 
* [[Liste der standardisierten Ports]]
Dazu werden im RFC 2581 vier Algorithmen definiert:
* [[Stream Control Transmission Protocol]] (SCTP)
#''slow start''
#''congestion avoidance''
#''fast retransmit''
#''fast recovery'',
*''slow start'' und ''congestion avoidance'' werden zusammen verwendet.
*''fast retransmit'' und ''fast recovery'' werden zusammen verwendet, sind eine Erweiterung von ''slow start'' und ''congestion avoidance''.
 
==== Slow Start Slow Start und Congestion Avoidance ====
[[Datei:TCPSlowStartundCongestionAvoidance.svg|mini|450px|Grafische Darstellung des Slow-Start-Algorithmus]]
 
*Der Slow-Start-Algorithmus dient zur Bestimmung des ''congestion window''.
*Da die momentane Auslastung des Netzes nicht bekannt ist, wird mit kleinen Datenmengen begonnen.
 
#Der Algorithmus startet mit einem kleinen Fenster, von einer Maximum Segment Size (MSS), in dem Datenpakete vom Sender zum Empfänger übertragen werden.
#Der Empfänger sendet ACK an den Sender zurück.
#Für jedes empfangene ACK wird die Größe des ''congestion window'' um eine MSS erhöht.
#*Dies führt innerhalb einer Roundtrip-Zeit zu einer Verdopplung des Congestion Windows.
#Dieses exponentielle Wachstum wird so lange fortgesetzt, bis der ''Slow-Start Threshold'' erreicht wird.
#*Die Phase des exponentiellen Wachstums wird auch ''Slow Start Phase'' genannt.
#Danach wird das Congestion Window nur noch um eine MSS erhöht, wenn alle Pakete aus dem Fenster erfolgreich übertragen wurden.
#*Es wächst pro Roundtrip-Zeit nur noch um eine MSS, also nur noch linear.
#**Diese Phase wird als ''Congestion Avoidance Phase'' bezeichnet.
#*Das Wachstum wird beendet, wenn das vom Empfänger festgelegte Empfangsfenster erreicht worden ist.
 
 
Kommt es zu einem Timeout, wird das ''congestion window'' auf 1 zurückgesetzt, der ''slow-start threshold'' wird auf die Hälfte der gesendeten, unquittierten Pakete herabgesetzt (Flight Size).
*Die Phase des exponentiellen Wachstums wird also verkürzt.
*Das Fenster wächst bei häufigen Paketverlusten nur langsam.
 
==== Fast-Retransmit und Fast-Recovery ====
*Werden eingesetzt, um nach Paketverlust schneller auf die Stau-Situation zu reagieren.
*Empfänger informiert den Sender, wenn Pakete außer der Reihe ankommen und somit dazwischen ein Paketverlust vorliegt.
*Der Empfänger bestätigt das letzte korrekte Paket erneut für jedes weitere ankommende Paket außer der Reihe.
*Man spricht dabei von ''Dup-Acks'' (''duplicate acknowledgments''),
**Mehrere aufeinanderfolgende Nachrichten, welche dasselbe Datensegment ACKen.
*Der Sender bemerkt die duplizierten ACKS, und nach dem dritten Duplikat sendet er sofort, vor Ablauf des Timers, das verlorene Paket erneut.
**Da nicht auf den Timerablauf gewartet werden muss, heißt das Prinzip ''Fast Retransmit''.
*Dup-Acks: auch Hinweise darauf, dass ein Paketverlust stattfand, dennoch die folgenden Pakete angekommen sind.
*Das Sendefenster wird nach dem Fehler nur halbiert (kein Slow-Start)


=== Dokumentation ===
==== RFC ====
{| class="wikitable sortable options"
|-
! RFC !! Titel
|-
| [https://www.rfc-editor.org/info/rfc793 793] || Transmission Control Protocol
|-
| [https://www.rfc-editor.org/info/rfc1071 107] || Berechnen der Prüfsumme für IP, UDP und TCP
|-
| [https://www.rfc-editor.org/info/rfc1122 1122] || Fehlerbehebungen bei TCP
|-
| [https://www.rfc-editor.org/info/rfc1323 1323] || Erweiterungen bei TCP
|-
| [https://www.rfc-editor.org/info/rfc2018 2018] || TCP SACK – Selective Acknowledgment Options
|-
| [https://www.rfc-editor.org/info/rfc3168 3168] || Explicit Congestion Notification
|-
| [https://www.rfc-editor.org/info/rfc5482 54829] || TCP User Timeout Option
|-
| [https://www.rfc-editor.org/info/rfc5681 5681] || TCP Congestion Control – TCP-Überlastkontrolle
|-
| [https://www.rfc-editor.org/info/rfc7414 7414] || Übersicht zu TCP RFCs
|-
| [https://www.rfc-editor.org/info/rfc7323 7323] || 2014
|}


Zusätzlich kann das Sendefenster noch um die Anzahl der Dup-Acks erhöht werden,
=== Links ===
*Jedes Dup-Ack steht für ein weiteres Paket, welches den Empfänger erreicht hat.
==== Weblinks ====
*Dadurch kann nach dem Fehler schneller wieder die volle Sendeleistung erreicht werden.
# [http://www.cs.berkeley.edu/~brewer/cs262/cong-avoid.pdf Congestion Avoidance and Control]
*Das Prinzip nennt man ''Fast-Recovery''.
# [http://www.warriorsofthe.net/ Warriors of the net] (Film zu TCP)


[[Kategorie:Netzwerke]]
[[Kategorie:TCP]]
</noinclude>

Aktuelle Version vom 28. Januar 2024, 14:54 Uhr

Transmission Control Protocol (TCP)

Beschreibung

Transportprotokoll
Funktionen Beschreibung
Zuverlässig
Verbindungsorientiert
Datenströme Übertragung von Datenströmen
TCP stell eine Verbindung zwischen zwei Endpunkten (Sockets) einer Netzverbindung her
Vorteile
Allgemeines
  • TCP ist im Prinzip eine Ende-zu-Ende-Verbindung in Vollduplex
  • Kann auch als zwei Halbduplexverbindungen betrachtet werden (Informationsfluss in beide Richtungen (allerdings nicht gleichzeitig))
  • Die Daten in Gegenrichtung können zusätzliche Steuerungsinformationen enthalten
  • Anwendungen, die TCP häufig nutzen, sind zum Beispiel Webbrowser und Webserver
TCP-Software
  • Übernimmt Verbindungsverwaltung sowie die Datenübertragung
  • Netz-Protokollstack des Betriebssystems
  • Anwendungsprogramme nutzen Sockets

Entwicklung

  • Entwickelt von Robert E. Kahn und Vinton G. Cerf als Forschungsarbeit
  • Beginn 1973, erste Standardisierung 1981 als RFC 793
  • Danach gab es viele Erweiterungen, diese werden bis heute in RFCs spezifiziert

Das Transmission Control Protocol arbeitet auf dem OSI-04

  • TCP verwendet 16-Bit Portnummern zur Adressierung
  • Zusätzlich zur Adressierung übernimmt es weitere Aufgaben
  • Verbindungsmanagement (Three-Way-Handshake)
  • Verbindungsaufbau/-abbau
  • Fehlerkontrolle (-korrektur)
  • Flußkontrolle (Flow Control)
  • verhindert, dass der Empfänger von einem Sender schneller Daten erhält, als er entgegennehmen kann
  • Netzwerk-Überlastkontrolle (Congestion Control)
  • verhindert, dass es zu einer Überlastsituation im Netz kommt, die zum vollständigen Zusammenbruch des Netzes führen könnte (congestion collapse)
  • bei Erkennen einer Überlastsituation (Paketverlust!) wird vom Sender die Datenrate gedrosselt
  • transparente Übertragung von byte streams
  • Anwendungen, die TCP benutzen, sollen nicht merken, dass die Daten in Form von Paketen übertragen werden
  • Mutliplexing
  • Mehrfachnutzung einer Verbindung
  • Verbindungsorientiertes Protokoll
  • Beinhaltet verschiedene Algorithmen zur Fehlererkennung und -behandlung
  • Sequenznummern
  • Quittungsnummern
  • Anzeigen (Flags)
  • Die richtige Reihenfolge der Daten ist garantiert
  • Bietet der Anwendungsschicht einen zuverlässigen Transportdienst
  • RFC 793. J. Postel. Transmission Control Protocol. 1981
  • setzt direkt auf dem Internet Protokoll (IP) auf
  • IP Protokoll Nr.: 06
  • Theoretisch ist es möglich TCP mit einem beliebigen Protokoll der Schicht 3 zu kombinieren
  • Praktisch wird TCP allerdings immer in IP gekapselt
  • garantiert eine fehlergesicherte, zuverlässige Transportverbindung zwischen zwei Rechnersystemen (Ende zu Ende Kontrolle)

TCP im DoD-Modell

  • Rolle von TCP im OSI-Referenzmodell

Eigenschaften von TCP

  • Vollduplex-Verbindung
  • stellt eine “byte pipe” zur Verfügung - unstrukturierter Datenstrom
  • Folgenummern sind Bytenummern
  • Sliding Window-Protokoll
  • Variable Grösse des Sendefensters bestimmt durch das Maximum von:
  • Angabe des Empfängers (receiver window size)
  • Congestion window size, abhängig von einer lokalen Schätzung der Netzbelastung -> “Slow Start” Algorithmus

Basismechanismen

  • Unterteilt den byte stream in Einheiten
  • die jeweils in einem IP Paket übertragen werden, diese Einheiten heißen Segmente
  • Segmente haben eine variable Länge
  • Die maximale Segmentgrösse wird bei der Verbindungserstellung festgelegt
  • Jedes Segment hat eine Folgenummer, die seine Position im Datenstrom in Bytes spezifiziert
  • Abgesendete Segmente müssen innerhalb einer bestimmten Zeit bestätigt werden (adaptiv geschätzte Round Trip Time)
  • Bestätigungen werden verzögert gesendet (ca. 200 ms)
  • Wenn keine Bestätigung über den erfolgreichen Empfang dieses Paketes innerhalb der Timer-Laufzeit eintrifft, wird die Übertragung wiederholt
  • Jedes Segment hat eine Ende-zu-Ende-Prüfsumme
  • Fehlerhaft empfangene Segmente werden ignoriert
  • Empfänger ordnet empfangene Segmente entsprechend ihrer Folgenummer
  • Duplikate werden ignoriert

Socket-Schnittstelle

  • De-facto-Standard für TCP/IP Programmierschnittstelle
  • Zugang zu TCP, UDP und (eingeschränkt) IP
  • Unterstützung verschiedener Protokolle
  • Protocol familiy
  • Address familiy
  • Abstraktion für Kommunikationsendpunkte
  • sockets

… mit verschiedenen Kommunikationseigenschaften

  • socket types (stream socket, datagram socket)
  • Benennung/Adressierung von Kommunikations-endpunkten
  • name binding
  • Können benutzt werden wie Dateideskriptoren

Verbindungen und Verbindungsendpunkte

  • Eine TCP-Verbindung wird durch ein Paar von Adressen und Port-Nummern identifiziert (Verbindungsendpunkte):
  • IP-Adresse und Port-Nummer Host A
  • IP-Adresse und Port-Nummer Host B
  • Jede Verbindung wird durch ein Paar von Verbindungsendpunkten eindeutig identifiziert
  • mehrere Verbindung zwischen den gleichen Hosts sind dadurch gleichzeitig möglich

Segmente, Datenströme und Sequenznummern

  • Erhaltung der Reihenfolge
  • Nummerierung:
  • Zufallszahl auf beiden Seiten (32 Bit)
  • Seq.nr. := Initiale Seq.nr. + Byte-Position im Datenstrom
  • TCP betrachtet einen Datenstrom als Sequenz von Bytes, die für die Übertragung in TCP-Segmente eingeteilt werden
  • Jedes Segment wird dann in der Regel auf ein IP-Paket abgebildet
  • Größe eines Segmentes bei lokaler Übertragung gemäß physikalischem Netz (MTU)
  • Ist diese nicht angegeben oder kann sie nicht ermittelt werden, dann wird ein Standartwert von 536 Bytes verwandt

Allgemeines

TCP ist im Prinzip eine Ende-zu-Ende-Verbindung in Vollduplex, welche die Übertragung der Informationen in beide Richtungen zulässt, analog zu einem Telefongespräch

  • Diese Verbindung kann auch als zwei Halbduplexverbindungen, bei denen Informationen in beide Richtungen (allerdings nicht gleichzeitig) fließen können, betrachtet werden
  • Die Daten in Gegenrichtung können dabei zusätzliche Steuerungsinformationen enthalten
  • Die Verwaltung dieser Verbindung sowie die Datenübertragung werden von der TCP-Software übernommen
  • Die TCP-Software ist üblicherweise im Netz-Protokollstack des Betriebssystems angesiedelt
  • Anwendungsprogramme benutzen eine Schnittstelle dazu, meist Sockets, die sich (je nach Betriebssystem unterschiedlich) beispielsweise bei Microsoft Windows in extra einzubindenden Programmbibliotheken („Winsock.dll“ bzw. „wsock32.dll“) befinden. Linux und viele andere unixoide Betriebssysteme enthalten einen Socketlayer im Betriebssystemkern
  • Auf den Socketlayer wird über Systemaufrufe zugegriffen
  • Anwendungen, die TCP häufig nutzen, sind zum Beispiel Webbrowser und Webserver

Jede TCP-Verbindung wird eindeutig durch zwei Endpunkte identifiziert

  • Ein Endpunkt stellt ein geordnetes Paar dar, bestehend aus IP-Adresse und Port
  • Ein solches Paar bildet eine bidirektionale Software-Schnittstelle und wird auch als Socket bezeichnet
  • Somit wird eine TCP-Verbindung durch vier Werte (einem Quadrupel) identifiziert:
(Lokaler Rechner, Lokaler Port, Entfernter Rechner, Entfernter Port)

Dabei kommt es auf das gesamte Quadrupel an

  • Beispielsweise können zwei verschiedene Prozesse auf demselben Rechner denselben lokalen Port benutzen und dabei sogar mit demselben Rechner auf der gegenüberliegenden Seite kommunizieren, sofern die beteiligten Prozesse auf der anderen Seite unterschiedliche Ports benutzen
  • In einem solchen Fall würde es sich um zwei verschiedene Verbindungen handeln, deren Quadrupel sich nur in einem von vier Werten unterscheidet: dem Port auf der gegenüberliegenden Seite
Verbindung 1: (Lokaler Rechner, Port x, Entfernter Rechner, Port y)
Verbindung 2: (Lokaler Rechner, Port x, Entfernter Rechner, Port z)

Ein Serverprozess erzeugt beispielsweise einen Socket (socket bind) auf Port 80, markiert diesen für eingehende Verbindungen (listen) und fordert vom Betriebssystem die nächste anstehende Verbindung an (accept)

  • Diese Anforderung blockiert den Serverprozess zunächst, da noch keine Verbindung existiert
  • Kommt dann die erste Verbindungsanfrage durch einen Client an, wird sie vom Betriebssystem angenommen, so dass die Verbindung zustande kommt
  • Ab jetzt wird diese Verbindung durch das oben beschriebene Quadrupel identifiziert

Schließlich wird der Serverprozess aufgeweckt und ihm ein Handle für diese Verbindung überreicht. Üblicherweise startet der Serverprozess anschließend einen Kindprozess, zu dem er die Behandlung der Verbindung delegiert

  • Er selbst setzt dann seine Arbeit mit einer weiteren Accept-Anforderung an das Betriebssystem fort

Dadurch ist es möglich, dass ein Webserver mehrere Verbindungen von verschiedenen Rechnern annehmen kann

  • Mehrfaches listen auf demselben Port ist nicht möglich. Üblicherweise bestimmt das Programm auf der Clientseite den Port nicht selbst, sondern lässt ihn sich vom Betriebssystem zuweisen

Ports sind 16-Bit-Zahlen (Portnummern) und reichen von 0 bis 65535

  • Ports von 0 bis 1023 sind reserviert (Well Known Ports und werden von der IANA vergeben, z. B. ist Port 80 für das im WWW verwendete HTTP reserviert
  • Das Benutzen der vordefinierten Ports ist nicht bindend
  • So kann jeder Administrator beispielsweise einen FTP-Server (normalerweise Port 21) auch auf einem beliebigen anderen Port laufen lassen

Datenintegrität und Zuverlässigkeit

Im Gegensatz zum verbindungslosen UDP implementiert TCP einen bidirektionalen, byte-orientierten, zuverlässigen Datenstrom zwischen zwei Endpunkten

  • Das darunterliegende Protokoll (IP) ist paketorientiert, wobei Datenpakete verlorengehen können, in verkehrter Reihenfolge ankommen dürfen und sogar doppelt empfangen werden können
  • TCP wurde entwickelt, um mit der Unsicherheit der darunterliegenden Schichten umzugehen
  • Es prüft daher die Integrität der Daten mittels der Prüfsumme im Paketkopf und stellt die Reihenfolge durch Sequenznummern sicher
  • Der Sender wiederholt das Senden von Paketen, falls keine Bestätigung innerhalb einer bestimmten Zeitspanne (Timeout) eintrifft
  • Die Daten der Pakete werden beim Empfänger in einem Puffer in der richtigen Reihenfolge zu einem Datenstrom zusammengefügt und doppelte Pakete verworfen

Der Datentransfer kann selbstverständlich jederzeit nach dem „Aufbau einer Verbindung“ gestört, verzögert oder ganz unterbrochen werden

  • Das Übertragungssystem läuft dann in einen Timeout
  • Der vorab getätigte „Verbindungsaufbau“ stellt also keinerlei Gewähr für eine nachfolgende, dauerhaft gesicherte Übertragung dar

Bestätigungen

Die jeweilige Länge des Puffers, bis zu der keine Lücke im Datenstrom existiert, wird bestätigt (windowing)

  • Dadurch ist das Ausnutzen der Netz-Bandbreite auch bei großen Strecken möglich
  • Bei einer Übersee- oder Satellitenverbindung dauert das Eintreffen des ersten ACK-Signals aus technischen Gründen bisweilen mehrere 100 Millisekunden, in dieser Zeit können unter Umständen mehrere hundert Pakete gesendet werden
  • Der Sender kann den Empfängerpuffer füllen, bevor die erste Bestätigung eintrifft
  • Alle Pakete im Puffer können gemeinsam bestätigt werden
  • Bestätigungen können zusätzlich zu den Daten in den TCP-Header des entgegengesetzten Datenstroms eingefügt werden (piggybacking), falls der Empfänger ebenfalls Daten für den Sender bereithält


Anhang

Siehe auch


Dokumentation

RFC

RFC Titel
793 Transmission Control Protocol
107 Berechnen der Prüfsumme für IP, UDP und TCP
1122 Fehlerbehebungen bei TCP
1323 Erweiterungen bei TCP
2018 TCP SACK – Selective Acknowledgment Options
3168 Explicit Congestion Notification
54829 TCP User Timeout Option
5681 TCP Congestion Control – TCP-Überlastkontrolle
7414 Übersicht zu TCP RFCs
7323 2014

Links

Weblinks

  1. Congestion Avoidance and Control
  2. Warriors of the net (Film zu TCP)