web-dev-qa-db-fra.com

Erreur de recherche NLTK

En exécutant un script Python utilisant NLTK, j’ai eu ceci:

Traceback (most recent call last):
  File "cpicklesave.py", line 56, in <module>
    pos = nltk.pos_tag(words)
  File "/usr/lib/python2.7/site-packages/nltk/tag/__init__.py", line 110, in pos_tag
    tagger = PerceptronTagger()
  File "/usr/lib/python2.7/site-packages/nltk/tag/perceptron.py", line 140, in __init__
    AP_MODEL_LOC = str(find('taggers/averaged_perceptron_tagger/'+PICKLE))
  File "/usr/lib/python2.7/site-packages/nltk/data.py", line 641, in find
    raise LookupError(resource_not_found)
LookupError:
**********************************************************************
  Resource u'taggers/averaged_perceptron_tagger/averaged_perceptro
  n_tagger.pickle' not found.  Please use the NLTK Downloader to
  obtain the resource:  >>> nltk.download()
  Searched in:
    - '/root/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************

Quelqu'un peut-il expliquer le problème?

24
Shiv Shankar

Utilisation

>>> nltk.download()

installer le module manquant (le Perceptron Tagger ).

(Vérifiez également les réponses à Echec du chargement de english.pickle avec nltk.data.load )

32
user2314737

La première réponse disait que le module manquant est 'the Perceptron Tagger', son nom dans nltk.download est 'averageaged_perceptron_tagger'

Vous pouvez utiliser ceci pour corriger l'erreur

nltk.download('averaged_perceptron_tagger')

30
Posuer

TL; DR

import nltk
nltk.download('averaged_perceptron_tagger')

Ou pour télécharger tous les packages + data + docs:

import nltk
nltk.download('all')

Voir Comment télécharger les données NLTK?

15
alvas

Problème: erreur de recherche lors de l'extraction du vectoriseur de comptage à partir de scikit learn. Ci-dessous l'extrait de code.

from sklearn.feature_extraction.text import CountVectorizer
bow_transformer = CountVectorizer(analyzer=text_process).fit(X)

Solution: essayez d'exécuter le code ci-dessous, puis essayez d'installer les mots vides de la boîte à outils de traitement du langage naturel corpora!

import nltk
nltk.download()
1
Rayudu Yarlagadda

Vous pouvez télécharger le module manquant NLTK juste en

import nltk
nltk.download()

Cela va afficher l'écran de téléchargement NLTK. S'il indique une erreur d'échec de la vérification du certificat SSL. Ensuite, cela devrait fonctionner en désactivant la vérification SSL avec le code ci-dessous!

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()
1
ishwardgret

Installer toutes les ressources nltk sur une ligne:

python3 -c "import nltk; nltk.download('all')"

les données seront sauvegardées dans ~/nltk_data

1
Lucas Azevedo

Parfois, même en écrivant nltk.download('module_name'), il n'est pas téléchargé. À ce moment-là, vous pouvez ouvrir python en mode interactif, puis télécharger en utilisant nltk.download('module_name') _.

0
Lucky Sunda