web-dev-qa-db-fra.com

Installation de Tesseract-OCR sur CentOS 6

J'essaie d'installer Tesseract-OCR sur mon serveur, cependant, lorsque j'installe tout ce que je pense être le bon dépôt. Quand j'essaye de l'installer le paquet n'est pas trouvé

J'ai essayé d'ajouter rpmforge mais en vain. Des idées de quelqu'un qui a déjà fait ou est familier avec l'ajout et la recherche dans les pensions?

8
William

J'ai utilisé ces instructions qui ont fonctionné correctement dans Centos

Installer les bibliothèques OCR Tesseract à partir de sources situées dans Centos

Téléchargez les sources Leptonica et Teseract:

$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

Configurez, compilez, installez les bibliothèques: 

 $ tar xzvf leptonica-1.69.tar.gz      
 $ cd leptonica-1.69      
 $ ./configure
 $ make
 $ Sudo make install

 $ tar xzf tesseract-ocr-3.02.02.tar.gz
 $ cd tesseract-3.01
 $ ./autogen.sh
 $ ./configure
 $ make
 $ Sudo make install
 $ Sudo ldconfig

Téléchargez les langues (anglais) et copiez-les dans le dossier tessdata: 

$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz       
$ tar xzf tesseract-ocr-3.02.eng.tar.gz       
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

et en profiter;)

7
Yusef Mohamadi

Je recommande d'essayer d'installer à partir de rpm ici: http://pkgs.org/download/tesseract Il existe également plusieurs dépendances: libpng-devel, libjpeg-devel, libtiff-devel, zlib et leptonica . Les 2 derniers se trouvent également sur le site RPM

5
user3133914

Cela a fonctionné pour moi:

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch

tesseract ne se trouve pas dans le référentiel epel mais dans le référentiel epel-testing qui n'est pas activé par défaut.

4
Little Gecko

J'ai écrit un script bash pour installer Tesseract 3.05 sur Centos 7. Celui-ci récupère et installe toutes les dépendances et installe également les fichiers de langue en anglais, hindi, bengali et thaï.

Code disponible sur GitHub

https://github.com/EisenVault/install-tesseract-redhat-centos

J'espère que cela t'aides.

4
Vipul Swarup

Installer les bibliothèques OCR de Tesseract à partir de sources (à jour le 14 juillet 2018)

Téléchargez les sources Leptonica et Teseract:

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

Configurez, compilez, installez Leptonica:

$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & Sudo make install

Configurez, compilez, installez Tesseract:

$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & Sudo make install & Sudo ldconfig

Télécharger le fichier de langue:

Je télécharge le fichier de langue anglaise (eng.traineddata) ici. Vous pouvez voir la liste complète des fichiers de langue ici et télécharger en fonction de vos besoins. Https://github.com/tesseract-ocr/tesseract/wiki/Files#data-files-for- version-302

Téléchargez les langues (anglais) et copiez-les dans le dossier tessdata:

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

Maintenant votre OCR Tesseract est installé et prêt à être utilisé! Exemple:

$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

Prendre plaisir!!!

3
Neeraj Kumar

entrez la description de l'image ici

miam installer --nogpgcheck tesseract

après l'installation pour tester, entrez la commande suivante: tesseract --version 

0
iwilldo