J'essaie d'importer le paquet nltk dans python 2.7
import nltk
stopwords = nltk.corpus.stopwords.words('english')
print(stopwords[:10])
En cours d'exécution, cela me donne l'erreur suivante:
LookupError:
**********************************************************************
Resource 'corpora/stopwords' not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
C'est pourquoi j'ai ouvert mon python termin et fait ce qui suit:
import nltk
nltk.download()
Ce qui me donne:
showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml
Cependant, cela ne semble pas s'arrêter. Et le relancer me donne toujours la même erreur. Des pensées où cela ne va pas?
Vous essayez actuellement de télécharger chaque élément dans les données nltk, ce qui peut prendre beaucoup de temps. Vous pouvez essayer de télécharger uniquement les mots vides dont vous avez besoin:
import nltk
nltk.download('stopwords')
Les uns comme mentionné ici par Kurt Bourbaki mais dans la ligne de commande:
python -m nltk.downloader stopwords
Vous pouvez le faire séparément dans la console.
Cela vous donnera un résultat.
import nltk
nltk.download('stopwords')
J'ai utilisé la console jupyter lorsque j'ai fait face à ce problème.
Si votre PC utilise un proxy pour la connectivité, essayez ceci:
import nltk
nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))
nltk.download('stopwords')
Vous pouvez entrer ceci en ligne de commande pour Python 3:
python3 -m nltk.downloader stopwords