En exécutant un script Python utilisant NLTK, j’ai eu ceci:
Traceback (most recent call last):
File "cpicklesave.py", line 56, in <module>
pos = nltk.pos_tag(words)
File "/usr/lib/python2.7/site-packages/nltk/tag/__init__.py", line 110, in pos_tag
tagger = PerceptronTagger()
File "/usr/lib/python2.7/site-packages/nltk/tag/perceptron.py", line 140, in __init__
AP_MODEL_LOC = str(find('taggers/averaged_perceptron_tagger/'+PICKLE))
File "/usr/lib/python2.7/site-packages/nltk/data.py", line 641, in find
raise LookupError(resource_not_found)
LookupError:
**********************************************************************
Resource u'taggers/averaged_perceptron_tagger/averaged_perceptro
n_tagger.pickle' not found. Please use the NLTK Downloader to
obtain the resource: >>> nltk.download()
Searched in:
- '/root/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
**********************************************************************
Quelqu'un peut-il expliquer le problème?
Utilisation
>>> nltk.download()
installer le module manquant (le Perceptron Tagger ).
(Vérifiez également les réponses à Echec du chargement de english.pickle avec nltk.data.load )
La première réponse disait que le module manquant est 'the Perceptron Tagger', son nom dans nltk.download est 'averageaged_perceptron_tagger'
Vous pouvez utiliser ceci pour corriger l'erreur
nltk.download('averaged_perceptron_tagger')
TL; DR
import nltk
nltk.download('averaged_perceptron_tagger')
Ou pour télécharger tous les packages + data + docs:
import nltk
nltk.download('all')
Problème: erreur de recherche lors de l'extraction du vectoriseur de comptage à partir de scikit learn. Ci-dessous l'extrait de code.
from sklearn.feature_extraction.text import CountVectorizer
bow_transformer = CountVectorizer(analyzer=text_process).fit(X)
Solution: essayez d'exécuter le code ci-dessous, puis essayez d'installer les mots vides de la boîte à outils de traitement du langage naturel corpora!
import nltk
nltk.download()
Vous pouvez télécharger le module manquant NLTK juste en
import nltk
nltk.download()
Cela va afficher l'écran de téléchargement NLTK. S'il indique une erreur d'échec de la vérification du certificat SSL. Ensuite, cela devrait fonctionner en désactivant la vérification SSL avec le code ci-dessous!
import nltk
import ssl
try:
_create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
pass
else:
ssl._create_default_https_context = _create_unverified_https_context
nltk.download()
Installer toutes les ressources nltk sur une ligne:
python3 -c "import nltk; nltk.download('all')"
les données seront sauvegardées dans ~/nltk_data
Parfois, même en écrivant nltk.download('module_name')
, il n'est pas téléchargé. À ce moment-là, vous pouvez ouvrir python en mode interactif, puis télécharger en utilisant nltk.download('module_name')
_.