web-dev-qa-db-fra.com

Téléchargez tous les fichiers sur le site

J'ai besoin de télécharger tous les fichiers sous ces liens où seul le nom de la banlieue change constamment dans chaque lien.

Juste une référence https://www.data.vic.gov.au/data/dataset/2014-town-and-community-profile-for-thornbury-suburb

Tous les fichiers sous ce lien de recherche: https://www.data.vic.gov.au/data/dataset?q=2014+town+and+community+profile

Des possibilités?

Merci :)

5
Bharath

Vous pouvez télécharger un fichier comme celui-ci

import urllib2
response = urllib2.urlopen('http://www.example.com/file_to_download')
html = response.read()

Pour obtenir tous les liens dans une page

from bs4 import BeautifulSoup

import requests
r  = requests.get("http://site-to.crawl")
data = r.text
soup = BeautifulSoup(data)

for link in soup.find_all('a'):
    print(link.get('href'))
11
naren

vous pouvez le faire de deux manières 1. par code 2. par logiciel 

1. par code 

en utilisant des bibliothèques Web Scrapper comme BeautifulSoup, JSoup

si cela ne fonctionne pas ou si vous devez cliquer sur des boutons pour pouvoir utiliser Selenium.

Logiciel 2.by 

utilisez _ {Internet Download Manager} _ Fonction Grabber pour ce faire 

0
Mohmmad Mansuri