Python bietet mehrere Möglichkeiten, um Dateien aus dem Internet herunterzuladen. Dies kann über HTTP mit dem Paket urllib oder der Anforderungsbibliothek erfolgen. In diesem Lernprogramm wird erläutert, wie Sie diese Bibliotheken verwenden, um Dateien mit Python von URLs herunterzuladen.
Die Anforderungsbibliothek ist eine der beliebtesten Bibliotheken in Python. Anfragen können Sie senden HTTP / 1.1-Anforderungen, ohne dass Sie Abfragezeichenfolgen manuell zu Ihren URLs hinzufügen oder Ihre POST-Daten formularkieren müssen.
Mit der Anforderungsbibliothek können Sie viele Funktionen ausführen, darunter:
Als Erstes müssen Sie die Bibliothek installieren. Es ist so einfach wie:
Pip-Installationsanfragen
Um zu testen, ob die Installation erfolgreich war, können Sie einen einfachen Test in Ihrem Python-Interpreter durchführen, indem Sie einfach Folgendes eingeben:
Importanfragen
Wenn die Installation erfolgreich war, werden keine Fehler angezeigt.
HTTP-Anforderungen umfassen:
Das Erstellen von Anfragen ist sehr einfach (siehe unten).
Anforderungen importieren req = request.get ("http://www.google.com")
Der obige Befehl ruft die Google-Webseite auf und speichert die Informationen in derreq
Variable. Wir können dann auch andere Attribute erhalten.
Um beispielsweise zu erfahren, ob das Abrufen der Google-Website erfolgreich war, werden wir den Statuscode abfragen.
Anforderungen importieren req = request.get ("http://www.google.com") req.status_code 200 # 200 bedeutet eine erfolgreiche Anfrage
Was ist, wenn wir die Kodierungsart der Google-Webseite herausfinden möchten?
erforderliche Kodierung nach ISO-8859-1
Möglicherweise möchten Sie auch den Inhalt der Antwort erfahren.
req.text
Dies ist nur ein abgeschnittener Inhalt der Antwort.
'