Linux - Dateien und Internetseiten via wget herunterladen

Bei wget handelt es sich um ein sehr umfangreiches Tool zum Download von Datein bis hin zu kompletten Webseiten aus dem Netz. GNU Wget unterstützt HTTP, HTTPS sowie FTP.

Der Befehl umfasst unzählige Optionen. Wir gehen hier nur mal auf die wichtigsten ein, möchtet Ihr Euch tiefer mit wget beschäftigen, findet Ihr unter wget –help eine Übersicht der Optionen.

Die Syntax von GNU Wget

wget <Optionen> <URL>

Option Erläuterung
-h –help Anzeigen der umfangreichen Optionen des Befehls
-c –continue Wiederaufnahme des Downloads
-t –tries=Zahl Anzahl der Versuche
-r –recursive Download von verlinkten Dateien
-p –page-requisites Lädt alle benötigten Dateien zum anzeigen der Webseite herunter
-k –convert-links Umwandlung von Links in lokale Verknpüfungen
–limit-rate=Rate Limitierung der Bandbreite k=KiloByte / m=MegaByte
–no-check-certificate Das Zertifikat einer Seite wird nicht geprüft

Die klassische Variante, wie mit Hilfe von wget eine Datei heruntergeladen werden kann.

wget <URL>

Beispiel
wget https://linux42.de/robots.txt

Um mehrere Dateien herunterzuladen, gibt man die URL's hintereinander an

wget <URL1> <URL2> <URL3>

Bricht ein Download ab, kann man diesen mit Hilfe der Option -c wieder aufnehmen.

wget -c <URL>

Wird eine Verbindung öfters unterbrochen, kann wget mit der Option -t auch vorgegeben, wie es den Download versuchen soll.

wget -t 10 <URL>

Um eine Internetseite komplett mit allen Dateien herunterzuladen und diese offline lesen zu können verwendet man den Befehl:

wget -rpk <URL>

Wget verwendet die volle ihm zur Verfügung stehende Bandbreite. Eine Beschränkung ist mit folgender Option möglich.

wget –limit-rate=(k=KiloByte/m=MegaByte) <URL>

Beispiel
wget –limit-rate=50k https://linux42.de/robots.txt

Ist ein Zertifikat auf einer Webseite nicht mehr gültig, gibt wget einen Fehler aus. Dies kann wie folgt umgangen werden.

wget –no-check-certificate <URL>


GNU Wget stellt eine endlose Palette an Möglichkeiten zur Verfügung, Daten aus dem Netz herunterzuladen. Die Optionen lassen sich beliebig mit einander kombinieren und somit auch anspruchsvolle Download-Vorgaben umsetzen.

Informationen zu GNU General Public License


Wir haben die hier gezeigten Anleitung sorgfältig erstellt und in unserer Testumgebungen ausgiebig getestet.
Wer sich entschließt diese Anleitungen für sich selbst umzusetzen, führt diese auf eigene Verantwortung durch.
Der Ersteller des Artikels, sowie der Seitenbetreiber, haftet nicht für eventuelle Schäden an Hard- und/oder Software oder damit zusammenhängenden Schäden\\

2021/03/06 23:11 · rsb

Geben Sie Ihren Kommentar ein. Wiki-Syntax ist zugelassen:
C F​ R P᠎ P
 
  • wiki/linux/datenaustausch/wget.txt
  • Zuletzt geändert: 2021/09/18 06:06
  • von rsb