web-dev-qa-db-fra.com

API de synthèse vocale et de synthèse vocale?

Existe-t-il une liste complète des API connues pour les environnements de bureau ou de navigateur?

15
Halst

Je vais reprendre et mettre à jour une réponse de Reconnaissance vocale en C, Java ou PHP? . C’est loin d’être complet, mais c’est peut-être un début pour vous.


Après avoir observé ces questions pendant quelques mois, j'ai constaté que la plupart des choix des développeurs se décomposaient comme suit:

Utilisateurs Windows - utilisez les fonctionnalités System.Speech de .Net ou Microsoft.Speech et installez les outils de reconnaissance gratuits fournis par Microsoft. Windows 7 comprend un moteur de parole complet. D'autres sont téléchargeables gratuitement. Il existe une API C++ pour les mêmes moteurs que SAPI. Voir à http://msdn.Microsoft.com/en-us/magazine/cc163663.aspx . ou http://msdn.Microsoft.com/en-us/library/ms723627(v=vs.85).aspx . Plus d'informations sur les moteurs Microsoft pour Windows Quelle est la différence entre System.Speech.Recognition et Microsoft.Speech.Recognition?

Les gens de Linux - Sphinx semble avoir une bonne suite. Voir http://cmusphinx.sourceforge.net/ et http://cmusphinx.sourceforge.net/wiki/

Produits commerciaux - Nuance , Loquendo , AT & T , IBM , autres. Chacun fournit ses propres SDK et bibliothèques pour différentes langues.

Service en ligne - Nuance , Yapme , ispeech.org , vlingo , autres. Nuance a amélioré son programme de développement et vous donnera désormais un accès gratuit à leurs services pour le développement. Yap (je crois) a été récemment acheté - acheté par Amazon , il est donc possible que certains changements apparaissent.

Bien sûr, cela peut aussi être utile - http://fr.wikipedia.org/wiki/List_of_speech_recognition_software

Il existe une API vocale Java. Voir javax.speech.recognition dans l'API Java Speech http://Java.Sun.com/products/Java-media/speech/forDevelopers/jsapi-guide/Recognition.html . Je crois que vous devez encore trouver un moteur de parole qui supporte cette API. Je ne pense pas que Sphinx le supporte pleinement - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

Il y a beaucoup d'autres SO quesitons: Besoin d'outils de synthèse de parole et de reconnaissance vocale pour Linux et pyspeech (python) - Transcrire des fichiers mp3? qui parle de http://code.google.com/p/pyspeech/ . Vous pouvez également consulter http://code.google.com/p/dragonfly/

31
Michael Levy

Les principaux fournisseurs d'API de synthèse vocale (génération de voix) sont YAKiToMe! et iSpeech. YAKiToMe! C’est celui que j’utilise parce que j’aime la qualité de leur voix et qu’elles sont les moins chères (généralement gratuites). Ils soutiennent les locuteurs hommes et femmes dans plusieurs langues. Certains fournisseurs de voix, comme Acapella, Nuance, Loquendo et iVona, ont une voix décente, mais ont tendance à être coûteux à utiliser.

2
Richard

Voici comment vous pouvez le faire: Remarque: il s'agit d'une api de google, elle ne fonctionne donc que dans le navigateur Chrome.

(Voir la démonstration en direct et télécharger le code source complet ici http://purpledesign.in/blog/?p=33 )

définir un bouton

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

et définir ce que vous voulez faire dans une fonction de votre fichier javascript

Comme ça

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

Ici

<textarea> id="test"></textarea>

Le discours est écrit dans la zone de texte

1
Raj Sharma