Comment pourrais-je prendre MP3 et convertir le discours en texte?
J'ai quelques notes enregistrées d'une conférence et de réunions (l'enregistrement est composé d'une seule voix, qui est la mienne). J'ai pensé qu'il serait plus facile et intellectuellement intéressant de convertir un texte en utilisant la parole en outils texte plutôt que de simplement transcrire à la main. Je sais qu'il existe des technologies, notamment pour les applications VoIP utilisant Asterisk et Podcasts, mais que sont-elles et comment puis-je les utiliser?
Open Source: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Commercial: Dragon NaturallySpeaking (Windows)
.NET peut le faire avec son espace de noms System.Speech.
Vous devez d’abord convertir au format .wav ou capturer l’audio en direct à partir du micro.
Des détails sur la mise en œuvre peuvent être trouvés ici: Transcription de l’audio avec .NET
Dragon NaturallySpeaking semble prendre en charge l'entrée MP3.
Si vous voulez un version open source (je pense qu’il existe des projets d’intégration Asterisk basés sur celui-ci).
En retard à la fête, donc répondant plus pour référence future.
Les avancées sur le terrain + l'état d'esprit et l'agenda de Mozilla ont conduit à ces deux projets à cette fin:
Ce dernier dispose d'un ensemble de données de 12 Go à télécharger. Le premier permet de former un modèle avec vos propres fichiers audio à ma compréhension