Ceci est avant tout une simple curiosité, mais existe-t-il des implémentations OCR en Java pur? Je suis curieux de savoir comment cela fonctionnerait uniquement en Java, et l’OCR en général m’intéresse, alors j’aimerais voir comment il est mis en œuvre dans un langage que je comprends très bien. Naturellement, cela impliquerait que l'implémentation soit open source, mais je suis toujours intéressé par les solutions propriétaires, car je pourrais au moins vérifier les performances dans ce cas.
J'ai vu un couple qui peut être utilisé dans Java (comme Asprise ) mais il ne semble pas que ce soit une pure Java implémentation ... Y a-t-il?
Je recommande d'essayer le projet Java OCR sur sourceforge.net. Je l’ai développé à l’origine et j’ai n blog à ce sujet .
Depuis que je l'ai mis sur sourceforge, ses fonctionnalités ont été étendues et considérablement améliorées grâce au travail remarquable d'un chercheur/développeur bénévole.
Essayez, et si vous ne l'aimez pas, vous pouvez toujours l'améliorer!
Si vous recherchez une option très extensible ou si vous avez un domaine de problème spécifique, vous pouvez envisager de le faire vous-même à l’aide du moteur neural orienté objet Java . Une autre référence JOONE .
Je l'ai utilisé avec succès dans un projet personnel pour identifier la lettre à partir d'une image telle que this , vous pouvez trouver toute la source du composant OCR de mon application sur github, ici .
Nous avons testé quelques moteurs d’OCR avec Java, tels que Tesseract, Asprise, Abbyy, etc. Dans notre analyse, Abbyy a donné les meilleurs résultats.
Il existe une grande variété de bibliothèques OCR. Cependant, mon expérience est que les principales implémentations commerciales, ABBYY, Omnipage et ReadIris, surpassent de loin l'implémentation open source ou d'autres mises en œuvre mineures. Ces bibliothèques commerciales ne sont pas principalement conçues pour fonctionner avec Java, bien que ce soit bien sûr possible.
Bien sûr, si votre intérêt est d’apprendre le code, les implémentations open-source feront l'affaire.
Je viens de trouver celui-ci (ne le sait pas, pas testé, vérifiez par vous-même)
Comme vous n'en avez besoin que par curiosité, vous pouvez vous renseigner sur la source de cet applet.
Il fait OCR des caractères manuscrits avec un réseau neuronal