J'ai besoin de télécharger tous les fichiers sous ces liens où seul le nom de la banlieue change constamment dans chaque lien.
Juste une référence https://www.data.vic.gov.au/data/dataset/2014-town-and-community-profile-for-thornbury-suburb
Tous les fichiers sous ce lien de recherche: https://www.data.vic.gov.au/data/dataset?q=2014+town+and+community+profile
Des possibilités?
Merci :)
Vous pouvez télécharger un fichier comme celui-ci
import urllib2
response = urllib2.urlopen('http://www.example.com/file_to_download')
html = response.read()
Pour obtenir tous les liens dans une page
from bs4 import BeautifulSoup
import requests
r = requests.get("http://site-to.crawl")
data = r.text
soup = BeautifulSoup(data)
for link in soup.find_all('a'):
print(link.get('href'))
vous pouvez le faire de deux manières 1. par code 2. par logiciel
1. par code
en utilisant des bibliothèques Web Scrapper comme BeautifulSoup, JSoup
si cela ne fonctionne pas ou si vous devez cliquer sur des boutons pour pouvoir utiliser Selenium.
Logiciel 2.by
utilisez _ {Internet Download Manager} _ Fonction Grabber pour ce faire