web-dev-qa-db-fra.com

erreur de téléchargement à l'aide de nltk.download ()

J'expérimente le package NLTK en utilisant Python. J'ai essayé de télécharger NLTK en utilisant nltk.download(). J'ai ce genre de message d'erreur. Comment résoudre ce problème? Merci.

Le système que j'ai utilisé est Ubuntu installé sous VMware. Le IDE est Spyder.

enter image description here

Après avoir utilisé nltk.download('all'), il peut télécharger certains packages, mais il reçoit un message d'erreur lors du téléchargement de oanc_masc

enter image description here

15
user288609

Pour télécharger un ensemble de données/modèles particulier, utilisez la fonction nltk.download(), par ex. si vous cherchez à télécharger le tokenizer de phrases punkt, utilisez:

$ python3
>>> import nltk
>>> nltk.download('punkt')

Si vous n'êtes pas sûr des données/modèles dont vous avez besoin, vous pouvez commencer avec la liste de base des données + modèles avec:

>>> import nltk
>>> nltk.download('popular')

Il téléchargera une liste de ressources "populaires".

Assurez-vous que vous disposez de la dernière version de NLTK car elle est en constante amélioration et maintient en permanence:

$ pip install --upgrade nltk

ÉDITÉ

Si quelqu'un évite les erreurs de téléchargement de jeux de données plus volumineux depuis nltk, depuis https://stackoverflow.com/a/38135306/610569

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.Zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

Et si quelqu'un veut trouver nltk_data répertoire, voir https://stackoverflow.com/a/36383314/610569

Et pour configurer nltk_data chemin d'accès, voir https://stackoverflow.com/a/22987374/610569

21
alvas

Depuis la ligne de commande, après avoir importé nltk, essayez

nltk.download('popular', halt_on_error=False)

Après une erreur, il vous demandera de réessayer le package cassé, refusez simplement avec n et il continuera avec les packages appropriés.

7
tolgayilmaz