J'essaie d'installer Tesseract-OCR sur mon serveur, cependant, lorsque j'installe tout ce que je pense être le bon dépôt. Quand j'essaye de l'installer le paquet n'est pas trouvé
J'ai essayé d'ajouter rpmforge mais en vain. Des idées de quelqu'un qui a déjà fait ou est familier avec l'ajout et la recherche dans les pensions?
J'ai utilisé ces instructions qui ont fonctionné correctement dans Centos
Installer les bibliothèques OCR Tesseract à partir de sources situées dans Centos
Téléchargez les sources Leptonica et Teseract:
$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
Configurez, compilez, installez les bibliothèques:
$ tar xzvf leptonica-1.69.tar.gz
$ cd leptonica-1.69
$ ./configure
$ make
$ Sudo make install
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-3.01
$ ./autogen.sh
$ ./configure
$ make
$ Sudo make install
$ Sudo ldconfig
Téléchargez les langues (anglais) et copiez-les dans le dossier tessdata:
$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
et en profiter;)
Je recommande d'essayer d'installer à partir de rpm ici: http://pkgs.org/download/tesseract Il existe également plusieurs dépendances: libpng-devel, libjpeg-devel, libtiff-devel, zlib et leptonica . Les 2 derniers se trouvent également sur le site RPM
Cela a fonctionné pour moi:
/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch
tesseract ne se trouve pas dans le référentiel epel mais dans le référentiel epel-testing qui n'est pas activé par défaut.
J'ai écrit un script bash pour installer Tesseract 3.05 sur Centos 7. Celui-ci récupère et installe toutes les dépendances et installe également les fichiers de langue en anglais, hindi, bengali et thaï.
Code disponible sur GitHub
https://github.com/EisenVault/install-tesseract-redhat-centos
J'espère que cela t'aides.
Installer les bibliothèques OCR de Tesseract à partir de sources (à jour le 14 juillet 2018)
Téléchargez les sources Leptonica et Teseract:
$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz
Configurez, compilez, installez Leptonica:
$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & Sudo make install
Configurez, compilez, installez Tesseract:
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & Sudo make install & Sudo ldconfig
Télécharger le fichier de langue:
Je télécharge le fichier de langue anglaise (eng.traineddata) ici. Vous pouvez voir la liste complète des fichiers de langue ici et télécharger en fonction de vos besoins. Https://github.com/tesseract-ocr/tesseract/wiki/Files#data-files-for- version-302
Téléchargez les langues (anglais) et copiez-les dans le dossier tessdata:
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
Maintenant votre OCR Tesseract est installé et prêt à être utilisé! Exemple:
$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng
Prendre plaisir!!!
entrez la description de l'image ici
miam installer --nogpgcheck tesseract
après l'installation pour tester, entrez la commande suivante: tesseract --version