Actuellement, j'utilise un modèle d'apprentissage profond qui est appelé "Yolov2" pour la détection d'objets, et je veux l'utiliser pour extraire du texte et l'utiliser pour l'enregistrer sur le disque, mais je ne sais pas comment faire, si quelqu'un en sait plus sur ça, s'il vous plaît me conseiller
J'utilise Tensorflow
Merci
Si vous utilisez le modèle pré-formé, vous devrez enregistrer ces sorties et saisir les images dans un réseau de reconnaissance de caractères, si vous utilisez un réseau neuronal ou une autre approche.
Ce que vous faites est la "reconnaissance de texte de scène". Vous pouvez consulter le texte de lecture dans la nature avec les réseaux de neurones convolutifs papier , voici un démo et page d'accueil . L'utilisateur de Github chongyangtao dispose d'un ensemble liste de ressources sur le sujet.
J'ai une question similaire et je crée un modèle de détection de chiffres avec l'ensemble de données svhn. Ce n'est pas encore un projet terminé, mais il semble bien fonctionner. Vous pouvez voir le code sur Détecteur à chiffres Yolo .