Wget: Unterschied zwischen den Versionen
KKeine Bearbeitungszusammenfassung |
|||
Zeile 2: | Zeile 2: | ||
= Beschreibung = | = Beschreibung = | ||
''wget'' ist nicht interaktiv. Es unterstützt HTTP-, HTTPS- und FTP-Protokolle sowie den Abruf über HTTP-Proxys. | |||
* Es kann im Hintergrund arbeiten, während der Benutzer nicht angemeldet ist. | |||
* So können Sie einen Abruf starten und die Verbindung zum System trennen, während Wget die Arbeit beendet. | |||
* Im Gegensatz dazu erfordern die meisten Webbrowser die ständige Anwesenheit des Benutzers, was bei der Übertragung einer großen Datenmenge ein großes Hindernis darstellen kann. | |||
Wget kann Links in HTML-, XHTML- und CSS-Seiten folgen | |||
* um lokale Versionen von entfernten Websites zu erstellen | |||
* wobei die Verzeichnisstruktur der ursprünglichen Website vollständig wiederhergestellt wird. | |||
* Dies wird manchmal auch als "rekursives Herunterladen" bezeichnet. | |||
* Dabei beachtet Wget den Robot Exclusion Standard (/robots.txt). | |||
* Wget kann angewiesen werden, die Links in den heruntergeladenen Dateien so umzuwandeln, dass sie auf die lokalen Dateien verweisen, damit sie offline betrachtet werden können. | |||
* Wget wurde so konzipiert, dass es auch bei langsamen oder instabilen Netzwerkverbindungen stabil arbeitet. | |||
* Wenn ein Download aufgrund eines Netzwerkproblems fehlschlägt, wird er so lange wiederholt, bis die gesamte Datei abgerufen wurde. | |||
* Wenn der Server eine Wiederholung unterstützt, weist es den Server an, den Download an der Stelle fortzusetzen, an der er unterbrochen wurde. | |||
= Installation = | = Installation = |
Version vom 15. März 2022, 17:34 Uhr
wget ist ein freies Dienstprogramm zum nicht-interaktiven Herunterladen von Dateien aus dem Internet.
Beschreibung
wget ist nicht interaktiv. Es unterstützt HTTP-, HTTPS- und FTP-Protokolle sowie den Abruf über HTTP-Proxys.
- Es kann im Hintergrund arbeiten, während der Benutzer nicht angemeldet ist.
- So können Sie einen Abruf starten und die Verbindung zum System trennen, während Wget die Arbeit beendet.
- Im Gegensatz dazu erfordern die meisten Webbrowser die ständige Anwesenheit des Benutzers, was bei der Übertragung einer großen Datenmenge ein großes Hindernis darstellen kann.
Wget kann Links in HTML-, XHTML- und CSS-Seiten folgen
- um lokale Versionen von entfernten Websites zu erstellen
- wobei die Verzeichnisstruktur der ursprünglichen Website vollständig wiederhergestellt wird.
- Dies wird manchmal auch als "rekursives Herunterladen" bezeichnet.
- Dabei beachtet Wget den Robot Exclusion Standard (/robots.txt).
- Wget kann angewiesen werden, die Links in den heruntergeladenen Dateien so umzuwandeln, dass sie auf die lokalen Dateien verweisen, damit sie offline betrachtet werden können.
- Wget wurde so konzipiert, dass es auch bei langsamen oder instabilen Netzwerkverbindungen stabil arbeitet.
- Wenn ein Download aufgrund eines Netzwerkproblems fehlschlägt, wird er so lange wiederholt, bis die gesamte Datei abgerufen wurde.
- Wenn der Server eine Wiederholung unterstützt, weist es den Server an, den Download an der Stelle fortzusetzen, an der er unterbrochen wurde.
Installation
Syntax
$ wget [URL]
Parameter
- URL
Optionen
Konfiguration
Dateien
Anwendungen
Anhalten und fortsetzen
Anhalten
[Strg] + c
Fortsetzen
$ wget -c [URL]
Ziel-Dateinamen
Dateien werden mit ihrem Originalnamen im aktuellen Verzeichnis gespeichert. Mit -O kann ein anderes Ziel angegeben werden.
$ wget -O [file-name] [URL]
Protokolldatei
Wenn Sie möchten, können Sie die Nachrichten/Informationen, die wget beim stdout produziert, auch in eine Protokolldatei umleiten. Dies kann mit der Kommandozeilenoption -o (Kleinbuchstaben) erfolgen.
$ wget -o [log-filename] [URL]
Download-Geschwindigkeit
Während Sie wget verwenden, können Sie auch die Download-Geschwindigkeit begrenzen. Dies kann mit der Option -limit-rate geschehen, die einen Wert erfordert, der den Betrag in Form von Bytes pro Sekunde angibt. Die Menge kann in Bytes, Kilobytes mit dem Suffix „k“ oder Megabyte mit dem Suffix „m“ angegeben werden.
$ wget –limit-rate==[amount] [URL]
Timeout
Read Timeout ist die Zeitspanne (in Sekunden), in der wget nach Daten sucht (falls keine Daten empfangen werden), bevor der Download neu gestartet wird. Standardmäßig beträgt der Lese-Timeout 900 Sekunden, aber Sie können dies mit der Option -read-timeout ändern.
$ wget –read-timeout==[time in seconds] [URL]
Download-Versuche
Wann immer Ihr Download aufgrund einer schlechten Internetverbindung oder eines anderen Fehlers unterbrochen wird, versucht das Tool, den Download selbst fortzusetzen. Standardmäßig versucht das Dienstprogramm 20 Mal und stoppt dann. Wenn Sie jedoch die Anzahl der Versuche erhöhen oder verringern möchten, können Sie dies mit der Befehlszeilenoption -t tun.
$ wget -t [no.-of-retries-you want] [URL]
Debug-Informationen
Wenn Sie möchten, können Sie auch den Befehl wget verwenden, um zusätzliche Informationen zum Downloadvorgang anzuzeigen. Diese Informationen sind nützlich für Debugging-Zwecke, wenn das Tool nicht ordnungsgemäß funktioniert. Auf die Funktion kann über die Befehlszeilenoption –debug oder -d zugegriffen werden.
$ wget –debug [URL]
Fortschrittsanzeige
Wenn Sie möchten, können Sie auch die Download-Fortschrittsanzeige ändern, die wget in der Ausgabe anzeigt. Es gibt zwei Arten von Fortschrittsanzeigen: Balken (Standard) und Punkt. Wenn der Ausgang jedoch nicht auf dem Terminal (TTY) angezeigt wird, wird standardmäßig die Punktanzeige verwendet.
Mit der Option –Fortschritt können Sie die Art des Kennzeichens wählen, falls Sie das Standardverhalten überschreiben möchten. Zum Beispiel:
$ wget --progress==dot [URL]
Dokumentation
Man-Pages
Info-Pages
Links
Intern
Weblinks
Kontrollfragen
Testfrage 1
Testfrage 2
Testfrage 3
Testfrage 4
Testfrage 5