Existe-t-il un modèle doc2vec pré-formé avec un grand ensemble de données, comme Wikipedia ou similaire?
Je n'en connais pas de bon. Il y en a un lié de ce projet , mais:
Bien que cela prenne beaucoup de temps et une quantité importante de RAM de travail, il existe un ordinateur portable Jupyter démontrant la création d'un Doc2Vec
modèle de Wikipedia inclus dans gensim:
https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-wikipedia.ipynb
Donc, je recommanderais de corriger les erreurs dans votre tentative. (Et, si vous réussissez à créer un modèle et que vous souhaitez le documenter pour d'autres, vous pouvez le télécharger quelque part pour que d'autres puissent le réutiliser.)
Oui! Je pourrais trouver deux modèles doc2vec pré-formés à ce lien
mais je n'ai toujours pas trouvé de modèle doc2vec pré-formé qui est formé sur les tweets