web-dev-qa-db-fra.com

Impossible d'installer textract sur Windows

J'ai essayé beaucoup de choses, mais j'échoue toujours lorsque j'essaie d'installer le package textract sur mon Windows en utilisant la commande pip.

J'obtiens l'erreur suivante:

error

Je ne sais pas quoi faire, donc je serai vraiment reconnaissant pour tout conseil. Je vous remercie

7

Volé à ici :

Nécessaire pour installer d'abord swig depuis conda (miniconda)

conda install swig

Puis téléchargé le Zip EbookLib 0.15 à partir des versions

https://github.com/aerkalov/ebooklib/releases

Après l'avoir décompressé, j'ai supprimé manuellement (j'ai utilisé notepad ++) le caractère unicode dans le fichier README.md. (le caractère unicode est sur la ligne 44)

Et puis installé le module avec pip.

cd to_unzipped_folder_path_here
pip install .

Et enfin

pip install textract
11
Marcus Mann

(Windows 10, Python 3.7) J'ai eu plus de problèmes que d'autres, mais cela s'appuie sur les réponses précédentes:

  1. Assurez-vous que le compilateur Microsoft Visual Studio C++ pour Python est installé

  2. python -m pip install --upgrade pip setuptools wheel

  3. pip install six --upgrade

  4. Téléchargez la version 0.15 d'EbookLib:

    • Décompressez le fichier .Zip Pour éviter les erreurs d'encodage, modifiez l'affectation de variable "long_description" pour qu'elle soit "long_description = open ('README.md', encoding =" utf-8 "). Read (),"
  5. Télécharger Swig:

    • http://www.swig.org/download.html
    • Décompressez le fichier .zip
    • Copiez le fichier swig.exe dans le chemin Python: par exemple "C:\Users\username\AppData\Local\Programs\Python\Python37"
    • Copiez le dossier "typemaps" dans le dossier python "Lib": par exemple "C:\Program Files\swigwin-4.0.0\Lib\typemaps" -> "C:\Users\nom d'utilisateur\AppData\Local\Programs\Python\Python37\Lib\"
    • Copiez les fichiers "* .swg" dans le dossier python "Lib": par exemple "C:\Program Files\swigwin-4.0.0\Lib * .swg" -> "C:\Users\username\AppData\Local\Programs\Python\Python37\Lib\"
    • Copiez tous les fichiers swig python dans le dossier python "Lib": par exemple, "C:\Program Files\swigwin-4.0.0\Lib\python * "->" C:\Users\username\AppData\Local\Programs\Python\Python37\Lib\"
  6. cd dans le dossier Ebooklib décompressé à partir de l'invite: par exemple C:> cd "C:\Users\username\Desktop\ebooklib-0.15"

  7. exécutez l'installation pour EbookLib: pip install.

  8. exécuter l'installation de textract: pip install textract

La sortie doit être:

C:\Users\username\Desktop\ebooklib-0.15>pip install textract
Collecting textract
Requirement already satisfied: docx2txt==0.6 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6)
Requirement already satisfied: beautifulsoup4==4.5.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (4.5.3)
Requirement already satisfied: EbookLib==0.15 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.15)
Requirement already satisfied: xlrd==1.0.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.0.0)
Requirement already satisfied: SpeechRecognition==3.6.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (3.6.3)
Requirement already satisfied: six==1.10.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.10.0)
Collecting pocketsphinx==0.1.3 (from textract)
  Using cached https://files.pythonhosted.org/packages/93/5f/a968e5d53d25e32deb78c3e169fd8612ecf53cc76e32cb40e19be35696af/pocketsphinx-0.1.3.tar.bz2
Requirement already satisfied: chardet==2.3.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (2.3.0)
Requirement already satisfied: argcomplete==1.8.2 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.8.2)
Requirement already satisfied: python-pptx==0.6.5 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6.5)
Requirement already satisfied: lxml in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from EbookLib==0.15->textract) (4.3.3)
Requirement already satisfied: XlsxWriter>=0.5.7 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (1.1.8)
Requirement already satisfied: Pillow>=2.6.1 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (6.0.0)
Building wheels for collected packages: pocketsphinx
  Building wheel for pocketsphinx (setup.py) ... done
  Stored in directory: C:\Users\username\AppData\Local\pip\Cache\wheels\38\80\4f\ddc3e8c2b788f2c7f1d625ae870f6bafd3038ff04a3445a2f8
Successfully built pocketsphinx
Installing collected packages: pocketsphinx, textract
Successfully installed pocketsphinx-0.1.3 textract-1.6.1

C:\Users\username\Desktop\ebooklib-0.15>

Au moment d'écrire ces lignes, jsonschema aura des dépendances conflictuelles avec textract. Les erreurs suivantes sont également survenues lorsque j'ai essayé de comprendre l'installation appropriée:

ERROR: requests 2.22.0 has requirement chardet<3.1.0,>=3.0.2, but you'll have chardet 2.3.0 which is incompatible.
ERROR: camelot-py 0.7.2 has requirement chardet>=3.0.4, but you'll have chardet 2.3.0 which is incompatible.

ERROR: Command "python setup.py Egg_info" failed with error code 1 in C:\Users\username\AppData\Local\Temp\pip-install-msmb9od3\EbookLib\
    UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 1671: character maps to <undefined>
error: command 'C:\\Users\\username\\AppData\\Local\\Programs\\Python\\Python37\\swig.exe' failed with exit status 1

ERROR: Failed building wheel for pocketsphinx
error: command 'swig.exe' failed: No such file or directory
  (1) : Error: Unable to find 'swig.swg'
  (3) : Error: Unable to find 'python.swg'
1
Joe H

Pas la solution la plus élégante mais ça marche!

pip install git+https://github.com/jpweytjens/textract

Merci à jpweytjens

0
Marco Cerliani

La solution est beaucoup plus simple maintenant que le projet semble avoir été repris par une autre personne (j'ai récemment recommencé à mettre à jour le projet il y a 3 mois lorsque j'ai écrit cette réponse.)

Vous pouvez maintenant aller sur https://github.com/deanmalmgren/textract/releases et télécharger v1.6.2 qui ne fournit que des mises à jour des exigences par rapport à la v1.6.1 (correction de l'erreur de débogage unicode) ou v1.6.3 qui est le dernier (au moment où j'écris ceci.)

Une fois téléchargé, extrayez, cd [folder extracted to] et pip install .

Gardez à l'esprit que lorsque les exigences sont mises à jour, du code malveillant peut être inséré dans les dépendances et le mettre à jour à vos risques et périls.

0
Ryan Schaefer