Comment installer correctement pdftotext?
Je reçois le message d'erreur ci-dessous lors de l'installation de pdftotext dans Python 3.6. J'ai également essayé d'installer le package manuellement en téléchargeant le fichier Zip mais j'ai toujours la même erreur.
pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory
error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_AMD64\\cl.exe' failed with exit status 2
J'ai trouvé de l'aide dans le fichier Readme.md du package pdftotext:
1) Installez les dépendances du système d'exploitation:
sur Debian, Ubuntu et ses amis:
Sudo apt-get update
Sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev
sur Fedora, Red Hat et ses amis:
Sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config
2) Effectuez l'installation normale:
pip install pdftotext
et cela a fonctionné pour moi.
La commande ci-dessous a résolu le problème pour moi.
Sudo apt-get install libpoppler-cpp-dev
https://blog.droidzone.in/2018/05/01/install-pdftotext-python-extension-error/
Et pour Mac OS: Brew Installer Poppler
J'essaie de comprendre comment installer pdftotext sur Win10 depuis quelques jours. Les recherches sur Internet ne m'ont rien donné. Donc, pour ceux qui ont besoin de savoir, voici l'installation de pdftotext sur Win10 avec Anaconda. YMMV.
Installez Anaconda Python. Il existe de nombreux articles sur l'installation d'Anaconda, donc je ne l'explorerai pas ici.
Essayez d'exécuter pip install pdftotext, vous obtiendrez une erreur indiquant que Microsoft Visual C++ est requis.
Naviguez dans un navigateur pour http://visualstudio.Microsoft.com/downloads . Sous l'onglet Outils pour Visual Studio 2019, téléchargez les outils de génération pour Visual Studio 2019. Vous installerez ensuite les outils en cochant la case d'option Outils de génération C++ et en cliquant sur Installer.
Vous devriez maintenant obtenir l'installation de pip pour dépasser l'erreur VC++. Malheureusement, vous obtiendrez maintenant l'erreur "Impossible d'ouvrir le fichier inclus:" poppler/cpp/poppler-document.h ". C'est parce que vous manquez les bibliothèques poppler.
Retournez aux internets! Vous aurez besoin de poppler pour Windows. Au moment d'écrire ces lignes, votre meilleure option est http://blog.alivate.com.au/poppler-windows . Prenez le dernier binaire et décompressez-le. Si vous regardez l'erreur, pip recherche le fichier d'en-tête dans {répertoire Anaconda3}\include\poppler\cpp\poppler-document.h. Regardez donc dans l'archive que vous venez de décompresser. Dans le dossier include, vous verrez un répertoire poppler. Si vous descendez dans le répertoire cpp, vous y trouverez le fichier poppler-document.h.
J'ai copié tout le répertoire poppler dans le dossier Anaconda3\include, alors faites-le.
Si vous essayez de réexécuter l'installation de pip, vous obtiendrez toujours une tonne d'erreurs! Mais ce ne sont pas les erreurs que vous avez vues précédemment, mais cette erreur recherche une bibliothèque liée manquante, poppler-cpp.lib. Une recherche dans Conda installe sur une autre machine a trouvé ce fichier dans le package poppler. Alors
conda install -c conda-forge poppler
Qui va installer notre fichier poppler-cpp.lib. Ensuite, nous pouvons copier le fichier depuis son répertoire d'origine dans {répertoire Anaconda3}\Library\lib\poppler-cpp.lib et le coller là où pdftotext l'attend dans {répertoire Anaconda3}\libs.
Si nous faisons à nouveau l'installation de pdftotext par pip, la voici! Je suis sûr que quelqu'un trouvera un moyen d'affiner un peu cela, mais pour l'instant nous avons une bibliothèque pdftotext Python sur Win10.
Ces instructions peuvent être trouvées, avec des captures d'écran, sur mon blog https://coder.haus/2019/09/27/installing-pdftotext-through-pip-on-windows-10/
Solution simple pour Windows:
\poppler-0.68.0\bin
vers le chemin dans les variables d'environnement.C'est tout. Redémarrez votre environnement, par exemple, un ordinateur portable jupyter, un vscode, etc.
Pour les utilisateurs d'Ubuntu
Sudo apt-get install libpoppler58=0.41.0-0ubuntu1 libpoppler-dev libpoppler-cpp-dev
travaillé pour moi