Mon objectif est d'utiliser OCR dans Python 2.7 en utilisant Tesseract sur un ordinateur Windows 7, mais je rencontre des problèmes en ce qui concerne le processus d'installation. J'ai essayé de suivre les instructions ici mais le lien vers "tesseract-core-yyyymmdd.exe" et "tesseract-langs-yyyymmdd.exe" n'existe plus et je ne trouve pas ces fichiers .exe ailleurs en ligne. Voici ce que j'ai fait jusqu'à présent:
Maintenant, si je fais ce qui suit en Python:
from wand.image import Image
from PIL import Image as PI
import pyocr
import pyocr.builders
import io
Pas de problème pour charger ces paquets mais pyocr.get_available_tools()
me donne une liste vide. Je suis sûr que cela a à voir avec les fichiers .exe d'installation manquants ci-dessus. Où puis-je les trouver? Est-ce autre chose qui me manque?
J'ai juste essayé de mettre en place pytesseract et ça marche! J'ai installé Windows 10 et Python 2.7.
tout ce que vous devez faire:
Téléchargez tesseract à partir de python via ce lien https://pypi.python.org/pypi/pytesseract
Unizip le fichier.
Allez dans le répertoire qui contient le fichier unizip
Exécutez cette commande "python setup.py install"
(Supplémentaire) pour vérifier s’il est installé, accédez à votre shell python et exécutez la commande "import pytesseract".
J'espère que ca fonctionne !! Remarque pytesseract est basé sur Google OCR, il fonctionne de la même manière que tesseract.
Étape [1] Pour installer tesseract, veuillez visiter
_ { https://github.com/UB-Mannheim/tesseract/wiki } _
Les derniers installateurs peuvent être téléchargés ici: p. Ex., tesseract-ocr-setup-3.05.02-20180621.exe, tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe, tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608 .exe (64 bits)
Step [2] Téléchargez le compilateur Microsoft Visual C++ pour Python 2.7 à partir du lien indiqué ci-dessous https://download.Microsoft.com/download/7/9/6/796EF2E4-801B-4FC4 -AB28-B59FBF6D907B/VCForPython27.msi
Étape [3] Installez pytesseract pour la liaison de tesseract à l'aide de pip
pip install pytesseract
Étape [4] De plus, vous pouvez installer une bibliothèque de traitement d'image en python, par exemple, pillow:
pip install pillow
salutations!! vous avez terminé!! :)
Installez les deux et vous avez terminé
Fichiers binaires de: https://github.com/UB-Mannheim/tesseract/wiki
Python Wrapper d'ici: https://pypi.python.org/pypi/pytesseract