J'expérimente le package NLTK en utilisant Python. J'ai essayé de télécharger NLTK en utilisant nltk.download()
. J'ai ce genre de message d'erreur. Comment résoudre ce problème? Merci.
Le système que j'ai utilisé est Ubuntu installé sous VMware. Le IDE est Spyder.
Après avoir utilisé nltk.download('all')
, il peut télécharger certains packages, mais il reçoit un message d'erreur lors du téléchargement de oanc_masc
Pour télécharger un ensemble de données/modèles particulier, utilisez la fonction nltk.download()
, par ex. si vous cherchez à télécharger le tokenizer de phrases punkt
, utilisez:
$ python3
>>> import nltk
>>> nltk.download('punkt')
Si vous n'êtes pas sûr des données/modèles dont vous avez besoin, vous pouvez commencer avec la liste de base des données + modèles avec:
>>> import nltk
>>> nltk.download('popular')
Il téléchargera une liste de ressources "populaires".
Assurez-vous que vous disposez de la dernière version de NLTK
car elle est en constante amélioration et maintient en permanence:
$ pip install --upgrade nltk
Si quelqu'un évite les erreurs de téléchargement de jeux de données plus volumineux depuis nltk
, depuis https://stackoverflow.com/a/38135306/610569
$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.Zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python
>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')
Et si quelqu'un veut trouver nltk_data
répertoire, voir https://stackoverflow.com/a/36383314/610569
Et pour configurer nltk_data
chemin d'accès, voir https://stackoverflow.com/a/22987374/610569
Depuis la ligne de commande, après avoir importé nltk, essayez
nltk.download('popular', halt_on_error=False)
Après une erreur, il vous demandera de réessayer le package cassé, refusez simplement avec n et il continuera avec les packages appropriés.