J'ai essayé beaucoup de choses, mais j'échoue toujours lorsque j'essaie d'installer le package textract sur mon Windows en utilisant la commande pip.
J'obtiens l'erreur suivante:
Je ne sais pas quoi faire, donc je serai vraiment reconnaissant pour tout conseil. Je vous remercie
Volé à ici :
Nécessaire pour installer d'abord swig depuis conda (miniconda)
conda install swig
Puis téléchargé le Zip EbookLib 0.15 à partir des versions
https://github.com/aerkalov/ebooklib/releases
Après l'avoir décompressé, j'ai supprimé manuellement (j'ai utilisé notepad ++) le caractère unicode dans le fichier README.md. (le caractère unicode est sur la ligne 44)
Et puis installé le module avec pip.
cd to_unzipped_folder_path_here
pip install .
Et enfin
pip install textract
(Windows 10, Python 3.7) J'ai eu plus de problèmes que d'autres, mais cela s'appuie sur les réponses précédentes:
Assurez-vous que le compilateur Microsoft Visual Studio C++ pour Python est installé
python -m pip install --upgrade pip setuptools wheel
pip install six --upgrade
Téléchargez la version 0.15 d'EbookLib:
Télécharger Swig:
cd dans le dossier Ebooklib décompressé à partir de l'invite: par exemple C:> cd "C:\Users\username\Desktop\ebooklib-0.15"
exécutez l'installation pour EbookLib: pip install.
exécuter l'installation de textract: pip install textract
La sortie doit être:
C:\Users\username\Desktop\ebooklib-0.15>pip install textract
Collecting textract
Requirement already satisfied: docx2txt==0.6 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6)
Requirement already satisfied: beautifulsoup4==4.5.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (4.5.3)
Requirement already satisfied: EbookLib==0.15 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.15)
Requirement already satisfied: xlrd==1.0.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.0.0)
Requirement already satisfied: SpeechRecognition==3.6.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (3.6.3)
Requirement already satisfied: six==1.10.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.10.0)
Collecting pocketsphinx==0.1.3 (from textract)
Using cached https://files.pythonhosted.org/packages/93/5f/a968e5d53d25e32deb78c3e169fd8612ecf53cc76e32cb40e19be35696af/pocketsphinx-0.1.3.tar.bz2
Requirement already satisfied: chardet==2.3.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (2.3.0)
Requirement already satisfied: argcomplete==1.8.2 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.8.2)
Requirement already satisfied: python-pptx==0.6.5 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6.5)
Requirement already satisfied: lxml in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from EbookLib==0.15->textract) (4.3.3)
Requirement already satisfied: XlsxWriter>=0.5.7 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (1.1.8)
Requirement already satisfied: Pillow>=2.6.1 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (6.0.0)
Building wheels for collected packages: pocketsphinx
Building wheel for pocketsphinx (setup.py) ... done
Stored in directory: C:\Users\username\AppData\Local\pip\Cache\wheels\38\80\4f\ddc3e8c2b788f2c7f1d625ae870f6bafd3038ff04a3445a2f8
Successfully built pocketsphinx
Installing collected packages: pocketsphinx, textract
Successfully installed pocketsphinx-0.1.3 textract-1.6.1
C:\Users\username\Desktop\ebooklib-0.15>
Au moment d'écrire ces lignes, jsonschema aura des dépendances conflictuelles avec textract. Les erreurs suivantes sont également survenues lorsque j'ai essayé de comprendre l'installation appropriée:
ERROR: requests 2.22.0 has requirement chardet<3.1.0,>=3.0.2, but you'll have chardet 2.3.0 which is incompatible.
ERROR: camelot-py 0.7.2 has requirement chardet>=3.0.4, but you'll have chardet 2.3.0 which is incompatible.
ERROR: Command "python setup.py Egg_info" failed with error code 1 in C:\Users\username\AppData\Local\Temp\pip-install-msmb9od3\EbookLib\
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 1671: character maps to <undefined>
error: command 'C:\\Users\\username\\AppData\\Local\\Programs\\Python\\Python37\\swig.exe' failed with exit status 1
ERROR: Failed building wheel for pocketsphinx
error: command 'swig.exe' failed: No such file or directory
(1) : Error: Unable to find 'swig.swg'
(3) : Error: Unable to find 'python.swg'
Pas la solution la plus élégante mais ça marche!
pip install git+https://github.com/jpweytjens/textract
Merci à jpweytjens
La solution est beaucoup plus simple maintenant que le projet semble avoir été repris par une autre personne (j'ai récemment recommencé à mettre à jour le projet il y a 3 mois lorsque j'ai écrit cette réponse.)
Vous pouvez maintenant aller sur https://github.com/deanmalmgren/textract/releases et télécharger v1.6.2
qui ne fournit que des mises à jour des exigences par rapport à la v1.6.1 (correction de l'erreur de débogage unicode) ou v1.6.3
qui est le dernier (au moment où j'écris ceci.)
Une fois téléchargé, extrayez, cd [folder extracted to]
et pip install .
Gardez à l'esprit que lorsque les exigences sont mises à jour, du code malveillant peut être inséré dans les dépendances et le mettre à jour à vos risques et périls.