Téléchargez tous les fichiers sur le site

Question

J'ai besoin de télécharger tous les fichiers sous ces liens où seul le nom de la banlieue change constamment dans chaque lien.

Juste une référence https://www.data.vic.gov.au/data/dataset/2014-town-and-community-profile-for-thornbury-suburb

Tous les fichiers sous ce lien de recherche: https://www.data.vic.gov.au/data/dataset?q=2014+town+and+community+profile

Des possibilités?

Merci :)

naren · Accepted Answer

Vous pouvez télécharger un fichier comme celui-ci

import urllib2 response = urllib2.urlopen('http://www.example.com/file_to_download') html = response.read()

Pour obtenir tous les liens dans une page

from bs4 import BeautifulSoup import requests r = requests.get("http://site-to.crawl") data = r.text soup = BeautifulSoup(data) for link in soup.find_all('a'): print(link.get('href'))

Mohmmad Mansuri · Answer

vous pouvez le faire de deux manières 1. par code 2. par logiciel

1. par code

en utilisant des bibliothèques Web Scrapper comme BeautifulSoup, JSoup

si cela ne fonctionne pas ou si vous devez cliquer sur des boutons pour pouvoir utiliser Selenium.

Logiciel 2.by

utilisez _ {Internet Download Manager} _ Fonction Grabber pour ce faire