J'essaie d'utiliser Python pour télécharger le code source HTML d'un site Web, mais je reçois cette erreur.
Traceback (most recent call last):
File "C:\Users\Sergio.Tapia\Documents\NetBeansProjects\DICParser\src\WebDownload.py", line 3, in <module>
file = urllib.urlopen("http://www.python.org")
AttributeError: 'module' object has no attribute 'urlopen'
Je suis le guide ici: http://www.boddie.org.uk/python/HTML.html
import urllib
file = urllib.urlopen("http://www.python.org")
s = file.read()
f.close()
#I'm guessing this would output the html source code?
print(s)
J'utilise Python 3.
Cela fonctionne dans Python 2.x.
Pour Python 3, regardez dans le docs :
import urllib.request
with urllib.request.urlopen("http://www.python.org") as url:
s = url.read()
# I'm guessing this would output the html source code ?
print(s)
Une solution compatible Python 2 + 3 est:
import sys
if sys.version_info[0] == 3:
from urllib.request import urlopen
else:
# Not Python 3 - today, it is most likely to be Python 2
# But note that this might need an update when Python 4
# might be around one day
from urllib import urlopen
# Your code where you can use urlopen
with urlopen("http://www.python.org") as url:
s = url.read()
print(s)
import urllib.request as ur
s = ur.urlopen("http://www.google.com")
sl = s.read()
print(sl)
Dans Python v3, "urllib.request" est un module en lui-même. Par conséquent, "urllib" ne peut pas être utilisé ici.
Pour que ' dataX = rllib.urlopen (url) .read () ' fonctionne en python (cela aurait été correct pour python 2) vous devez simplement changer 2 petites choses.
1: L'instruction urllib elle-même (ajoutez la demande au milieu):
dataX = urllib.request.urlopen(url).read()
2: L'instruction import la précédant (remplacez 'import urlib' par:
import urllib.request
Et cela devrait fonctionner en python3:)
import urllib.request as ur
filehandler = ur.urlopen ('http://www.google.com')
for line in filehandler:
print(line.strip())
Solution pour python3:
from urllib.request import urlopen
url = 'http://www.python.org'
file = urlopen(url)
html = file.read()
print(html)
Pour python 3, essayez quelque chose comme ceci:
import urllib.request
urllib.request.urlretrieve('http://crcv.ucf.edu/THUMOS14/UCF101/UCF101/v_YoYo_g19_c02.avi', "video_name.avi")
Il téléchargera la vidéo dans le répertoire de travail actuel
Une des manières possibles de le faire:
import urllib
...
try:
# Python 2
from urllib2 import urlopen
except ImportError:
# Python 3
from urllib.request import urlopen
votre code utilisé dans python2.x, vous pouvez utiliser comme ceci:
from urllib.request import urlopen
urlopen(url)
à propos, suggérez un autre modèle appelé request est plus convivial, vous pouvez utiliser pip install, et utiliser comme ceci:
import requests
requests.get(url)
requests.post(url)
Je pensais que c'était facile à utiliser, je suis débutant aussi .... hahah