C'est un sujet intéressant. Fondamentalement, j'ai une image qui contient du texte. Comment extraire le texte de l'image?
J'ai déjà essayé beaucoup de choses, mais tout ce que je fais est très fastidieux et ne fonctionne généralement pas. Je me demande simplement s'il existe un moyen assez facile de le faire.
Je suis tombé sur ceci: http://sourceforge.net/projects/javaocr/ . J'ai essayé cela pendant des heures, mais je ne peux pas le faire prendre une Image
et la transformer en une String
de texte à partir de l'image.
Merci d'avance à tous!
Vous devez vous pencher sur les implémentations d'OCR Java. Jetez un oeil à cette question: Java OCR
Tess4J , un wrapper JNA autour du moteur Tesseract, prend en charge les API qui prennent des données BufferedImage, File ou image en entrée et renvoient String en sortie.
Vous avez besoin d’une bibliothèque de reconnaissance optique de caractères (OCR) ou écrivez la vôtre. Découvrez this SO question.
Essayez cette bibliothèque de reconnaissance de caractères: http://sourceforge.net/projects/javaocr/