Erreur de recherche NLTK

Question

En exécutant un script Python utilisant NLTK, j’ai eu ceci:

Traceback (most recent call last): File "cpicklesave.py", line 56, in <module> pos = nltk.pos_tag(words) File "/usr/lib/python2.7/site-packages/nltk/tag/__init__.py", line 110, in pos_tag tagger = PerceptronTagger() File "/usr/lib/python2.7/site-packages/nltk/tag/perceptron.py", line 140, in __init__ AP_MODEL_LOC = str(find('taggers/averaged_perceptron_tagger/'+PICKLE)) File "/usr/lib/python2.7/site-packages/nltk/data.py", line 641, in find raise LookupError(resource_not_found) LookupError: ********************************************************************** Resource u'taggers/averaged_perceptron_tagger/averaged_perceptro n_tagger.pickle' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download() Searched in: - '/root/nltk_data' - '/usr/share/nltk_data' - '/usr/local/share/nltk_data' - '/usr/lib/nltk_data' - '/usr/local/lib/nltk_data' **********************************************************************

Quelqu'un peut-il expliquer le problème?

user2314737 · Accepted Answer

Utilisation

>>> nltk.download()

installer le module manquant (le Perceptron Tagger ).

(Vérifiez également les réponses à Echec du chargement de english.pickle avec nltk.data.load )

Posuer · Answer

La première réponse disait que le module manquant est 'the Perceptron Tagger', son nom dans nltk.download est 'averageaged_perceptron_tagger'

Vous pouvez utiliser ceci pour corriger l'erreur

nltk.download('averaged_perceptron_tagger')

alvas · Answer

TL; DR

import nltk nltk.download('averaged_perceptron_tagger')

Ou pour télécharger tous les packages + data + docs:

import nltk nltk.download('all')

Voir Comment télécharger les données NLTK?

Rayudu Yarlagadda · Answer

Problème: erreur de recherche lors de l'extraction du vectoriseur de comptage à partir de scikit learn. Ci-dessous l'extrait de code.

from sklearn.feature_extraction.text import CountVectorizer bow_transformer = CountVectorizer(analyzer=text_process).fit(X)

Solution: essayez d'exécuter le code ci-dessous, puis essayez d'installer les mots vides de la boîte à outils de traitement du langage naturel corpora!

import nltk nltk.download()

ishwardgret · Answer

Vous pouvez télécharger le module manquant NLTK juste en

import nltk nltk.download()

Cela va afficher l'écran de téléchargement NLTK. S'il indique une erreur d'échec de la vérification du certificat SSL. Ensuite, cela devrait fonctionner en désactivant la vérification SSL avec le code ci-dessous!

import nltk import ssl try: _create_unverified_https_context = ssl._create_unverified_context except AttributeError: pass else: ssl._create_default_https_context = _create_unverified_https_context nltk.download()

Lucas Azevedo · Answer

Installer toutes les ressources nltk sur une ligne:

python3 -c "import nltk; nltk.download('all')"

les données seront sauvegardées dans ~/nltk_data

Lucky Sunda · Answer

Parfois, même en écrivant nltk.download('module_name'), il n'est pas téléchargé. À ce moment-là, vous pouvez ouvrir python en mode interactif, puis télécharger en utilisant nltk.download('module_name') _.