web-dev-qa-db-fra.com

Pytesseract: "Erreur TesseractNotFound: tesseract n'est pas installé ou il ne se trouve pas sur votre chemin", comment puis-je résoudre ce problème?

J'essaie d'exécuter un code de base très simple en python.

from PIL import Image
import pytesseract

im = Image.open("sample1.jpg")

text = pytesseract.image_to_string(im, lang = 'eng')

print(text)

Voici à quoi cela ressemble, j'ai en fait installé tesseract pour Windows via l'installateur. Je suis très nouveau sur Python et je ne sais pas comment procéder.

Toute orientation ici serait très utile. J'ai essayé de redémarrer mon application Spyder mais en vain.

12
Jed Bartlet

Je vois les étapes sont dispersées dans différentes réponses. Sur la base de mon expérience récente avec cette erreur pytesseract sous Windows, écrivez différentes étapes dans l’ordre pour faciliter la résolution de l’erreur:

1 . Installez tesseract à l'aide du programme d'installation Windows disponible à l'adresse suivante: https://github.com/UB-Mannheim/tesseract/wiki

2 . Notez le chemin du tesseract à partir du chemin d'installation installation.Default au moment où cette modification a été effectuée: C:\Users\USER\AppData\Local\Tesseract-OCR. Cela peut changer, veuillez vérifier le chemin d'installation.

3 . pip install pytesseract

4 . définissez le chemin tesseract dans le script avant d'appeler image_to_string:

pytesseract.pytesseract.tesseract_cmd = r'C:\Users\USER\AppData\Local\Tesseract-OCR\tesseract.exe'

22
Nafeez Quraishi

Dans les fenêtres:

pip install tesseract

pip install tesseract-ocr

et vérifiez le fichier qui est stocké dans votre fichier usr/appdata/local/programmes/site-pakages/python/python36/lib/pytesseract/pytesseract.py et compilez-le

7
Kumar S

D'abord, vous devez installer le binaire:

Sur Linux

Sudo apt update
Sudo apt install tesseract-ocr
Sudo apt install libtesseract-dev

Sur mac

brew install tesseract

Sur Windows

téléchargez le binaire depuis https://github.com/UB-Mannheim/tesseract/wiki . Ajoutez ensuite pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe' à votre script.

Ensuite, vous devriez installer le paquet python en utilisant pip:

pip install tesseract
pip install tesseract-ocr

références: https://pypi.org/project/pytesseract/ (section INSTALLATION) et https://github.com/tesseract-ocr/tesseract/wiki#installation

6
Ali

De https://pypi.org/project/pytesseract/ :

pytesseract.pytesseract.tesseract_cmd = '<full_path_to_your_tesseract_executable>'
# Include the above line, if you don't have tesseract executable in your PATH
# Example tesseract_cmd: 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract'
5
GeorgPoe

Pour Windows uniquement


1 - Vous devez installer Tesseract OCR sur votre ordinateur.

l'obtenir d'ici. https://github.com/UB-Mannheim/tesseract/wiki

Téléchargez la version appropriée.

2 - Enregistrez le chemin tesseract dans votre environnement système. c'est-à-dire modifier les variables système.

3 - pip installer pytesseract et pip installer tesseract

4 - Ajoutez cette ligne à votre script python

pytesseract.pytesseract.tesseract_cmd = 'C:\\OCR\\Tesseract-OCR\\tesseract.exe' ^ votre chemin peut être différent.

5 - Runt le code.

5
Mujeeb Ishaque

vous pouvez installer ce paquet ... https://github.com/UB-Mannheim/tesseract/wiki après cela, vous devez aller par ce chemin C:\Program Files (x86)\Tesseract-OCR\tesseract.exe puis exécutez le fichier tesseract. Je crois que ceci vous aidera...

2
Kumar S

Vous auriez besoin d'installer tesseract.

https://github.com/tesseract-ocr/tesseract/wiki

Consultez la documentation ci-dessus sur l'installation.

1
Kenstars

Sur mac (fonctionne pour moi)

brew install tesseract
1
fuwiak
# {Windows 10 instructions}
# before you use the script you need to install the dependence
# 1. download the tesseract from the official link:
#   https://github.com/UB-Mannheim/tesseract/wiki
# 2. install the tesseract
#   i chosed this path
#       *replace the user string in the below path with you name of user that you are using in your current machine
#       C:\Users\user\AppData\Local\Tesseract-OCR\
# 3. Install the  pillow for your python version
# * the best way for me is to install is this form(i'am using python3.7 version and in my CMD i run this version of python by     typing py -3.7):
# * if you are using another version of python first look how you start the python from you CMD
# * for some machine the run of python from the CMD is different
    # [examples]
    # =================================
    # PYTHON VERSION 3.7
    # python
    # python3.7
    # python -3.7
    # python 3.7
    # python3
    # python -3
    # python 3
    # py3.7
    # py -3.7
    # py 3.7
    # py3
    # py -3
    # py 3
    # PYTHON VERSION 3.6
    # python
    # python3.6
    # python -3.6
    # python 3.6
    # python3
    # python -3
    # python 3
    # py3.6
    # py -3.6
    # py 3.6
    # py3
    # py -3
    # py 3
    # PYTHON VERSION 2.7
    # python
    # python2.7
    # python -2.7
    # python 2.7
    # python2
    # python -2
    # python 2
    # py2.7
    # py -2.7
    # py 2.7
    # py2
    # py -2
    # py 2
    # ================================
# we are using pip to install the dependences
# because for me i start the python version 3.7 with the following line 
    # py -3.7
# open the CMD in windows machine and type the following line:
    # py -3.7 -m pip install pillow
# 4. Install the  pytesseract and tesseract for your python version
# * the best way for me is to install is this form(i'am using python3.7 version and in my CMD i run this version of python by     typing py -3.7):
# we are using pip to install the dependences
# open the CMD in windows machine and type the following lines:
    # py -3.7 -m pip install pytesseract
    # py -3.7 -m pip install tesseract


#!/usr/bin/python
from PIL import Image
import pytesseract
import os
import getpass

def extract_text_from_image(image_file_name_arg):

    # IMPORTANT
    # if you have followed my instructions to install this dependence in above text explanatin
    # for my machine is
    # if you don't put the right path for tesseract.exe the script will not work
    username = getpass.getuser()
    # here above line get the username for your machine automatically
    tesseract_exe_path_installation="C:\\Users\\"+username+"\\AppData\\Local\\Tesseract-OCR\\tesseract.exe"
    pytesseract.pytesseract.tesseract_cmd=tesseract_exe_path_installation

# specify the direction of your image files manually or use line bellow if the images are in the script directory in     folder  images
    # image_dir="D:\\GIT\\ai_example\\extract_text_from_image\\images"
    image_dir=os.getcwd()+"\\images"
    dir_seperator="\\"
    image_file_name=image_file_name_arg
    # if your image are in different format change the extension(ex. ".png")
    image_ext=".jpg"
    image_path_dir=image_dir+dir_seperator+image_file_name+image_ext

    print("=============================================================================")
    print("image used is in the following path dir:")
    print("\t"+image_path_dir)
    print("=============================================================================")

    img=Image.open(image_path_dir)
    text=pytesseract.image_to_string(img, lang="eng")
    print(text)

# change the name "image_1" whith the name without extension for your image name
# image_file_name_arg="image_1"
image_file_name_arg="image_2"
# image_file_name_arg="image_3"
# image_file_name_arg="image_4"
# image_file_name_arg="image_5"
extract_text_from_image(image_file_name_arg)

# ==================================
# CREATED BY: SHERIFI
# e-mail: [email protected]
# git-link for script: https://github.com/sherifi/ai_example.git
# ==================================
0
Sherifi

Utilisez la commande suivante pour installer tesseract

pip install tesseract

0
Codemaker

Sous Windows, le chemin de commande doit être redirigé pour une installation Windows tesseract par défaut.

  1. Dans le système 32 bits, ajoutez cette ligne après les commandes d'importation.
pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe' 
  1. Dans le système 64 bits, ajoutez cette ligne à la place.
 pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files\Tesseract-OCR\tesseract.exe'
0
Desmond Tung

Étape 1:

Installez tesseract sur votre système conformément au système d'exploitation. Les derniers installateurs sont disponibles sur https://github.com/UB-Mannheim/tesseract/wiki

Étape 2: Installez les bibliothèques de dépendances suivantes à l'aide de: pip install pytesseract pip install opencv-python pip install numpy

Étape 3: exemple de code

import cv2
import numpy as np
import pytesseract
from PIL import Image
from pytesseract import image_to_string

# Path of working folder on Disk Replace with your working folder
src_path = "C:\\Users\\<user>\\PycharmProjects\\ImageToText\\input\\"
# If you don't have tesseract executable in your PATH, include the 
following:
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract- 
OCR/tesseract'
TESSDATA_PREFIX = 'C:/Program Files (x86)/Tesseract-OCR'

def get_string(img_path):
    # Read image with opencv
    img = cv2.imread(img_path)

    # Convert to gray
    img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # Apply dilation and erosion to remove some noise
    kernel = np.ones((1, 1), np.uint8)
    img = cv2.dilate(img, kernel, iterations=1)
    img = cv2.erode(img, kernel, iterations=1)

    # Write image after removed noise
    cv2.imwrite(src_path + "removed_noise.png", img)

    #  Apply threshold to get image with only black and white
    #img = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 31, 2)

    # Write the image after apply opencv to do some ...
    cv2.imwrite(src_path + "thres.png", img)

    # Recognize text with tesseract for python
    result = pytesseract.image_to_string(Image.open(src_path + "thres.png"))

    # Remove template file
    #os.remove(temp)

    return result


print('--- Start recognize text from image ---')
print(get_string(src_path + "image.png") )

print("------ Done -------")
0
user3642503