Linux - Dateien und Internetseiten via wget herunterladen
Bei wget handelt es sich um ein sehr umfangreiches Tool zum Download von Datein bis hin zu kompletten Webseiten aus dem Netz. GNU Wget unterstützt HTTP, HTTPS sowie FTP.
Der Befehl umfasst unzählige Optionen. Wir gehen hier nur mal auf die wichtigsten ein, möchtet Ihr Euch tiefer mit wget beschäftigen, findet Ihr unter wget –help eine Übersicht der Optionen.
Syntax
Die Syntax von GNU Wget
wget <Optionen> <URL>
Optionen
Option | Erläuterung | |
-h | –help | Anzeigen der umfangreichen Optionen des Befehls |
-c | –continue | Wiederaufnahme des Downloads |
-t | –tries=Zahl | Anzahl der Versuche |
-r | –recursive | Download von verlinkten Dateien |
-p | –page-requisites | Lädt alle benötigten Dateien zum anzeigen der Webseite herunter |
-k | –convert-links | Umwandlung von Links in lokale Verknpüfungen |
–limit-rate=Rate | Limitierung der Bandbreite k=KiloByte / m=MegaByte | |
–no-check-certificate | Das Zertifikat einer Seite wird nicht geprüft |
Beispiele
Download einer Datei
Die klassische Variante, wie mit Hilfe von wget eine Datei heruntergeladen werden kann.
wget <URL>
Beispiel
wget https://linux42.de/robots.txt
Um mehrere Dateien herunterzuladen, gibt man die URL's hintereinander an
wget <URL1> <URL2> <URL3>
Bricht ein Download ab, kann man diesen mit Hilfe der Option -c wieder aufnehmen.
wget -c <URL>
Wird eine Verbindung öfters unterbrochen, kann wget mit der Option -t auch vorgegeben, wie es den Download versuchen soll.
wget -t 10 <URL>
Download einer Webseite
Um eine Internetseite komplett mit allen Dateien herunterzuladen und diese offline lesen zu können verwendet man den Befehl:
wget -rpk <URL>
Beeinflussung des Downloads
Wget verwendet die volle ihm zur Verfügung stehende Bandbreite. Eine Beschränkung ist mit folgender Option möglich.
wget –limit-rate=(k=KiloByte/m=MegaByte) <URL>
Beispiel
wget –limit-rate=50k https://linux42.de/robots.txt
Ist ein Zertifikat auf einer Webseite nicht mehr gültig, gibt wget einen Fehler aus. Dies kann wie folgt umgangen werden.
wget –no-check-certificate <URL>
Fazit
GNU Wget stellt eine endlose Palette an Möglichkeiten zur Verfügung, Daten aus dem Netz herunterzuladen. Die Optionen lassen sich beliebig mit einander kombinieren und somit auch anspruchsvolle Download-Vorgaben umsetzen.
Informationen zu GNU General Public License
Haftungsausschluss
Wir haben die hier gezeigten Anleitung sorgfältig erstellt und in unserer Testumgebungen ausgiebig getestet.
Wer sich entschließt diese Anleitungen für sich selbst umzusetzen, führt diese auf eigene Verantwortung durch.
Der Ersteller des Artikels, sowie der Seitenbetreiber, haftet nicht für eventuelle Schäden an Hard- und/oder Software oder damit zusammenhängenden Schäden\\
Diskussion