====== Linux - Dateien und Internetseiten via wget herunterladen ======
Bei **wget** handelt es sich um ein sehr umfangreiches Tool zum Download von Datein bis hin zu kompletten Webseiten aus dem Netz. **GNU Wget** unterstützt **HTTP, HTTPS** sowie **FTP**. \\
\\
Der Befehl umfasst unzählige Optionen. Wir gehen hier nur mal auf die wichtigsten ein, möchtet Ihr Euch tiefer mit **wget** beschäftigen, findet Ihr unter **wget --help** eine Übersicht der Optionen. \\
\\
===== Syntax =====
Die Syntax von GNU Wget
wget \\
==== Optionen ====
| ** Option ** || ** Erläuterung ** |
| -h | --help | Anzeigen der umfangreichen Optionen des Befehls |
| -c | --continue | Wiederaufnahme des Downloads |
| -t | --tries=Zahl | Anzahl der Versuche |
| -r | --recursive | Download von verlinkten Dateien |
| -p | --page-requisites | Lädt alle benötigten Dateien zum anzeigen der Webseite herunter |
| -k | --convert-links | Umwandlung von Links in lokale Verknpüfungen |
| | --limit-rate=Rate | Limitierung der Bandbreite k=KiloByte / m=MegaByte |
| | --no-check-certificate | Das Zertifikat einer Seite wird nicht geprüft |
===== Beispiele =====
==== Download einer Datei ====
Die klassische Variante, wie mit Hilfe von wget eine Datei heruntergeladen werden kann.
wget \\
\\
** Beispiel ** \\
wget https://linux42.de/robots.txt \\
Um mehrere Dateien herunterzuladen, gibt man die URL's hintereinander an
wget \\
Bricht ein Download ab, kann man diesen mit Hilfe der Option -c wieder aufnehmen.
wget -c \\
Wird eine Verbindung öfters unterbrochen, kann wget mit der Option -t auch vorgegeben, wie es den Download versuchen soll.
wget -t 10 \\
==== Download einer Webseite ====
Um eine Internetseite komplett mit allen Dateien herunterzuladen und diese offline lesen zu können verwendet man den Befehl:
wget -rpk \\
==== Beeinflussung des Downloads ====
Wget verwendet die volle ihm zur Verfügung stehende Bandbreite. Eine Beschränkung ist mit folgender Option möglich.
wget --limit-rate=(k=KiloByte/m=MegaByte) \\
\\
** Beispiel ** \\
wget --limit-rate=50k https://linux42.de/robots.txt
Ist ein Zertifikat auf einer Webseite nicht mehr gültig, gibt wget einen Fehler aus. Dies kann wie folgt umgangen werden.
wget --no-check-certificate \\
----
===== Fazit =====
**GNU Wget** stellt eine endlose Palette an Möglichkeiten zur Verfügung, Daten aus dem Netz herunterzuladen. Die Optionen lassen sich beliebig mit einander kombinieren und somit auch anspruchsvolle Download-Vorgaben umsetzen.
Informationen zu [[https://de.wikipedia.org/wiki/GNU_General_Public_License|GNU General Public License]]
----
{{page>impressum:ausschluss#Haftungsausschluss}}
----
~~DISCUSSION~~