web-dev-qa-db-fra.com

Python: Installez Tesseract pour Windows 7

Mon objectif est d'utiliser OCR dans Python 2.7 en utilisant Tesseract sur un ordinateur Windows 7, mais je rencontre des problèmes en ce qui concerne le processus d'installation. J'ai essayé de suivre les instructions ici mais le lien vers "tesseract-core-yyyymmdd.exe" et "tesseract-langs-yyyymmdd.exe" n'existe plus et je ne trouve pas ces fichiers .exe ailleurs en ligne. Voici ce que j'ai fait jusqu'à présent:

  1. tesseract installé à partir de son exécutable à partir de la page officielle de tesseract-ocr.
  2. installé via les paquets pip "wand", "PIL", "pyocr".

Maintenant, si je fais ce qui suit en Python:

from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io

Pas de problème pour charger ces paquets mais pyocr.get_available_tools() me donne une liste vide. Je suis sûr que cela a à voir avec les fichiers .exe d'installation manquants ci-dessus. Où puis-je les trouver? Est-ce autre chose qui me manque?

4
Plug4

J'ai juste essayé de mettre en place pytesseract et ça marche! J'ai installé Windows 10 et Python 2.7.

tout ce que vous devez faire:

  1. Téléchargez Visual Basic C++ à partir de http://aka.ms/vcpython27 et installez-le (étape d'installation commune).
  2. Téléchargez tesseract à partir de python via ce lien https://pypi.python.org/pypi/pytesseract

  3. Unizip le fichier.

  4. Allez dans le répertoire qui contient le fichier unizip

  5. Exécutez cette commande "python setup.py install" 

  6. (Supplémentaire) pour vérifier s’il est installé, accédez à votre shell python et exécutez la commande "import pytesseract".

J'espère que ca fonctionne !! Remarque pytesseract est basé sur Google OCR, il fonctionne de la même manière que tesseract.

3
Asha Magenta

Étape [1] Pour installer tesseract, veuillez visiter 

_ { https://github.com/UB-Mannheim/tesseract/wiki } _

Les derniers installateurs peuvent être téléchargés ici: p. Ex., tesseract-ocr-setup-3.05.02-20180621.exe, tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe, tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608 .exe (64 bits)

Step [2] Téléchargez le compilateur Microsoft Visual C++ pour Python 2.7 à partir du lien indiqué ci-dessous https://download.Microsoft.com/download/7/9/6/796EF2E4-801B-4FC4 -AB28-B59FBF6D907B/VCForPython27.msi

Étape [3] Installez pytesseract pour la liaison de tesseract à l'aide de pip

pip install pytesseract

Étape [4] De plus, vous pouvez installer une bibliothèque de traitement d'image en python, par exemple, pillow:

pip install pillow

salutations!! vous avez terminé!! :)

1
Shashank Singh

Installez les deux et vous avez terminé

Fichiers binaires de: https://github.com/UB-Mannheim/tesseract/wiki

Python Wrapper d'ici: https://pypi.python.org/pypi/pytesseract

0
Abhishek