J'essaie d'utiliser pytesseract en python, mais je finis toujours par l'erreur:
"TesseractNotFoundError: tesseract n'est pas installé ou il ne se trouve pas dans votre chemin"
pytesseract et tesseract sont installés dans le système. Je suis nouveau sur Python donc j'apprécierai vraiment si quelqu'un peut m'aider avec cette
J'ai essayé d'ajouter à la variable de chemin comme d'autres l'ont mentionné, mais j'ai toujours reçu la même erreur. ce qui a bien fonctionné a été d’ajouter ceci à mon script:
pytesseract.pytesseract.tesseract_cmd = r "C:\Fichiers de programme .__ (x86)\Tesseract-OCR\tesseract.exe"
J'ai eu cette erreur parce que j'ai installé pytesseract
avec pip
mais j'ai oublié de l'installer avec apt
. dans cette situation, installez-le avec ces commandes:
Sudo apt update
Sudo apt install tesseract-ocr
Sudo apt install libtesseract-dev
tesseract-ocr
est probablement absent de votre ordinateur. Vérifiez les instructions d'installation ici: https://github.com/tesseract-ocr/tesseract/wiki
Sur un Mac, vous pouvez simplement installer en utilisant homebrew:
brew install tesseract
Il devrait bien fonctionner après cela
Je suis sous Mac OS et ai installé tesseract avec brew, alors voici mon point de vue. Puisque pytesseract est juste la façon dont vous pouvez accéder à tesseract à partir de python, vous devez spécifier où tesseract se trouve déjà sur votre ordinateur.
Pour Mac OS
Essayez de trouver où se trouve tesseract.exe si vous l'avez installé à l'aide de brew, sur votre utilisation du terminal:
>brew list tesseract
Cela devrait indiquer où se trouve votre tesseract.exe, quelque part plus ou moins semblable à
> /usr/local/Cellar/tesseract/3.05.02/bin/tesseract
Ensuite, en suivant leurs instructions :
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
pytesseract.pytesseract.tesseract_cmd = r '/ usr/local/Cellar/tesseract/3.05.02/bin/tesseract'
devrait faire l'affaire!
Une chose simple qui a réellement fonctionné pour moi dans Jupyter Notebook, était d'utiliser double barre oblique inversée au lieu d'une seule barre oblique inversée dans le chemin d'accès pytesseract.pytesseract.tesseract_cmd:
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
J'ai rencontré le même problème. J'espère que vous avez installé depuis https://github.com/UB-Mannheim/tesseract/wiki et que vous avez également effectué l'installation pip pytesseract.
Si tout va bien, vous devriez voir le chemin C:\Program Files (x86)\Tesseract-OCR où tesseract.exe est disponible.
L’ajout d’une variable de chemin ne m’a pas aidé; j’ai ajouté une nouvelle variable portant le nom tesseract dans les variables d’environnement portant la valeur C:\Program Files (x86)\Tesseract-OCR\tesseract.exe
Maintenant, ouvrez la fenêtre de commande et tapez simplement tesseract, cela devrait fonctionner et vous donner des informations d'utilisation.
Importez simplement pytesseract et cette ligne devrait vous permettre de lire une chaîne de texte.
text = pytesseract.image_to_string (im, config = config)
prendre plaisir!
Vous pouvez télécharger la configuration de tesseract-ocr en utilisant le lien suivant,
Ensuite, ajoutez une nouvelle variable avec le nom tesseract dans les variables d'environnement avec la valeur C:\Program Files (x86)\Tesseract-OCR\tesseract.exe.
Installez tesseract à partir de https://github.com/UB-Mannheim/tesseract/wiki et ajoutez le chemin de tesseract.exe à la variable d'environnement Path.
Je suis confronté au même problème. Je viens d'utiliser cette commande qui va m'aider.
Sudo apt install tesseract-ocr
Sous l'environnement Windows 10, la méthode suivante fonctionne pour moi:
https://github.com/tesseract-ocr/tesseract/wiki Téléchargez tesseract et installez-le. La version Windows est disponible ici: https://github.com/UB-Mannheim/tesseract/wiki
Recherchez le fichier de script pytesseract.py dans C:\Users\User\Anaconda3\Lib\site-packages\pytesseract et ouvrez-le . Modifiez le code suivant de tesseract_cmd = 'tesseract'
en: tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
Vous pouvez également avoir besoin d'ajouter la variable d'environnement D:/Program Files (x86)/Tesseract-OCR/
Voila!
Petite erreur - je savais que je devais ouvrir/fermer ma cmd pour que le chemin mis à jour réponde. En utilisant Jupyter Notebook, je devais arrêter le client et le réinitialiser également.
Importez-vous
from tesseract import image_to_string
Ne pas importer de pytesseract
J'utilise actuellement Windows et je devais développer un analyseur syntaxique PDF, mais l'ajout d'une nouvelle variable d'environnement via sysdm.cpl
seul ne fonctionnait pas. Pour les autres utilisateurs Windows, je suggère fortement d’ajouter également C:\Program Files (x86)\Tesseract-OCR
à votre profile.ps1
(si vous utilisez Powershell).
Je faisais également face au même problème, ajoutez simplement C:\Program Files (x86)\Tesseract-OCR
à votre variable de chemin. Si cela ne fonctionne toujours pas, ajoutez C:\Program Files (x86)\Tesseract-OCR\tessdata
à votre variable de chemin dans une nouvelle ligne. Et n'oubliez pas de redémarrer votre ordinateur après avoir ajouté la variable de chemin.