Corpus / mots vides non trouvés lors de l'importation de la bibliothèque nltk

Question

J'essaie d'importer le paquet nltk dans python 2.7

 import nltk stopwords = nltk.corpus.stopwords.words('english') print(stopwords[:10])

En cours d'exécution, cela me donne l'erreur suivante:

LookupError: ********************************************************************** Resource 'corpora/stopwords' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download()

C'est pourquoi j'ai ouvert mon python termin et fait ce qui suit:

import nltk nltk.download()

Ce qui me donne:

showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

Cependant, cela ne semble pas s'arrêter. Et le relancer me donne toujours la même erreur. Des pensées où cela ne va pas?

Kurt Bourbaki · Answer

Vous essayez actuellement de télécharger chaque élément dans les données nltk, ce qui peut prendre beaucoup de temps. Vous pouvez essayer de télécharger uniquement les mots vides dont vous avez besoin:

import nltk nltk.download('stopwords')

Rafael Valero · Answer

Les uns comme mentionné ici par Kurt Bourbaki mais dans la ligne de commande:

python -m nltk.downloader stopwords

Umesh · Answer

Vous pouvez le faire séparément dans la console.
Cela vous donnera un résultat.

import nltk nltk.download('stopwords')

J'ai utilisé la console jupyter lorsque j'ai fait face à ce problème.

R Kumar · Answer

Si votre PC utilise un proxy pour la connectivité, essayez ceci:

import nltk nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD')) nltk.download('stopwords')

Ehsan · Answer

Vous pouvez entrer ceci en ligne de commande pour Python 3:

python3 -m nltk.downloader stopwords