====== Linux - Dateien und Internetseiten via wget herunterladen ====== Bei **wget** handelt es sich um ein sehr umfangreiches Tool zum Download von Datein bis hin zu kompletten Webseiten aus dem Netz. **GNU Wget** unterstützt **HTTP, HTTPS** sowie **FTP**. \\ \\ Der Befehl umfasst unzählige Optionen. Wir gehen hier nur mal auf die wichtigsten ein, möchtet Ihr Euch tiefer mit **wget** beschäftigen, findet Ihr unter **wget --help** eine Übersicht der Optionen. \\ \\ ===== Syntax ===== Die Syntax von GNU Wget wget \\ ==== Optionen ==== | ** Option ** || ** Erläuterung ** | | -h | --help | Anzeigen der umfangreichen Optionen des Befehls | | -c | --continue | Wiederaufnahme des Downloads | | -t | --tries=Zahl | Anzahl der Versuche | | -r | --recursive | Download von verlinkten Dateien | | -p | --page-requisites | Lädt alle benötigten Dateien zum anzeigen der Webseite herunter | | -k | --convert-links | Umwandlung von Links in lokale Verknpüfungen | | | --limit-rate=Rate | Limitierung der Bandbreite k=KiloByte / m=MegaByte | | | --no-check-certificate | Das Zertifikat einer Seite wird nicht geprüft | ===== Beispiele ===== ==== Download einer Datei ==== Die klassische Variante, wie mit Hilfe von wget eine Datei heruntergeladen werden kann. wget \\ \\ ** Beispiel ** \\ wget https://linux42.de/robots.txt \\ Um mehrere Dateien herunterzuladen, gibt man die URL's hintereinander an wget \\ Bricht ein Download ab, kann man diesen mit Hilfe der Option -c wieder aufnehmen. wget -c \\ Wird eine Verbindung öfters unterbrochen, kann wget mit der Option -t auch vorgegeben, wie es den Download versuchen soll. wget -t 10 \\ ==== Download einer Webseite ==== Um eine Internetseite komplett mit allen Dateien herunterzuladen und diese offline lesen zu können verwendet man den Befehl: wget -rpk \\ ==== Beeinflussung des Downloads ==== Wget verwendet die volle ihm zur Verfügung stehende Bandbreite. Eine Beschränkung ist mit folgender Option möglich. wget --limit-rate=(k=KiloByte/m=MegaByte) \\ \\ ** Beispiel ** \\ wget --limit-rate=50k https://linux42.de/robots.txt Ist ein Zertifikat auf einer Webseite nicht mehr gültig, gibt wget einen Fehler aus. Dies kann wie folgt umgangen werden. wget --no-check-certificate \\ ---- ===== Fazit ===== **GNU Wget** stellt eine endlose Palette an Möglichkeiten zur Verfügung, Daten aus dem Netz herunterzuladen. Die Optionen lassen sich beliebig mit einander kombinieren und somit auch anspruchsvolle Download-Vorgaben umsetzen. Informationen zu [[https://de.wikipedia.org/wiki/GNU_General_Public_License|GNU General Public License]] ---- {{page>impressum:ausschluss#Haftungsausschluss}} ---- ~~DISCUSSION~~