web-dev-qa-db-fra.com

Quels sont les codes de langue dans la mise en œuvre par Chrome de l'API de reconnaissance vocale HTML5?

Chrome a mis en œuvre l'API de reconnaissance vocale HTML5. Beaucoup de langues sont supportées. Je veux savoir quelles langues sont prises en charge et le code correspondant à chaque langue utilisé dans l'attribut lang de l'élément HTML.

Par exemple:

  • Polonais (pl-PL)
  • Turc (tr-TR)

Je vous remercie!

27
weilou

Ok, s'il n'est pas publié, nous pouvons au moins essayer de comprendre ceci… .. Laissez-moi vous mettre ce tableau pour le début et nous l'affinerons si quelqu'un a plus d'informations.

Je suppose que les langues prises en charge doivent être similaires à celles prises en charge par la recherche vocale et que Google utilise des codes de langue standard et ce, de manière cohérente, dans ses services.

J'ai consulté des langues prises en charge par la recherche vocale sur wikipedia

J'ai trouvé des codes de langue ici , sur page des paramètres de langue de Google et ici

EDIT: J'ai expérimenté le service de reconnaissance vocale d’arrière-plan. J'ai effectué une série de tests au cours desquels j'ai transmis le même échantillon de langage anglais à l'API, mais spécifié un dialecte différent à chaque fois. Ça ressemble à:

  • Si une langue n'est pas prise en charge, la reconnaissance revient à en-US (on dirait qu'elle reconnaît que l'échantillon est en anglais)
  • Si un dialecte n'est pas pris en charge (ou n'existe pas), la reconnaissance revient au dialecte principal ou en-US dans certains cas.
  • Le dialecte principal peut être spécifié comme première partie de l'identifiant. Donc 'en-US' et 'en' donnent les mêmes résultats.
  • La reconnaissance de certaines langues, comme le chinois et le japonais, donne des résultats en anglais, bien que différents en anglais, ce qui est étrange. L’échantillon est probablement très différent du chinois et le service est intelligent pour le comprendre.

Je traite un dialecte comme pris en charge si la reconnaissance donne un résultat différent d'en-US et du dialecte principal pour la langue. Néanmoins, pour le vérifier à 100%, nous devons analyser des échantillons pour chaque langue.

Légende

  • + Surtout pris en charge, car test donne un résultat différent de celui en-US et du dialecte principal.
  • .+ Absent sur wikipedia mais surtout supporté, car le test donne un résultat différent de l'en-US et du dialecte principal.
  • +? Surtout pris en charge car il est répertorié sur wikipedia. Mais le test sur mon échantillon donne un résultat identique au dialecte principal. Donc, il s’agit d’un coin ou d’un code de langue erroné.
  • .+? Non répertorié sur wikipedia mais semble avoir été pris en charge, car le test donne un résultat différent de celui en-US et du dialecte principal.Langues.

  • + basque eu
  • + Bulgare bg
  • + Catalan ca
  • + arabe (Égypte) ar-EG
  • + arabe (Jordanie) ar-JO
  • +? arabe (Koweït) ar-KW
  • + arabe (Liban) ar-LB
  • +? Arabe (Qatar) ar-QA
  • + arabe (UAE) ar-AE
  • + arabe (Maroc) ar-MA
  • .+ Arabe (Iraq) ar-IQ
  • .+ arabe (Algérie) ar-DZ
  • .+ arabe (Bahreïn) ar-BH
  • .+ arabe (Lybie) ar-LY
  • .+ arabe (Oman) ar-OM
  • .+ arabe (Arabie Saoudite) ar-SA
  • .+ arabe (Tunisie) ar-TN
  • .+ arabe (Yémen) ar-YE
  • .+ tchèque cs
  • + néerlandais nl-NL
  • + Anglais (Australie) en-AU
  • + English (Canada) en-CA
  • +? Anglais (Inde) en-IN
  • + Anglais (Nouvelle Zélande) en-NZ
  • + Anglais (Afrique du Sud) en-ZA
  • + Anglais (UK) en-GB
  • + English (US) en-US
  • + finlandais fi
  • + français fr-FR
  • + galicien gl
  • + allemand de-DE
  • + hébreu he
  • + hongrois hu
  • + islandais est
  • + italien it-IT
  • + indonésien id
  • + japonais ja
  • + coréen ko
  • + Latin la
  • + chinois mandarin zh-CN
  • + Taiwan traditionnel zh-TW
  • + Chine simplifiée zh-CN?
  • +? Hong Kong simplifié zh-HK
  • + Yue Chinois (Hong Kong traditionnel) zh-yue
  • + Malaysian ms-MY
  • + norvégien non-non
  • + polonais pl
  • + Pig Latin xx-piglatin
  • +? portugais pt-PT
  • + portugais (brasil) pt-BR
  • .+ roumain ro-RO
  • + russe ru
  • + serbe sr-SP
  • + Slovak sk
  • + Espagnol (Argentine) es-AR
  • + espagnol (Bolivie) es-BO
  • + espagnol (Chili) es-CL
  • +? espagnol (Colombie) es-CO
  • +? espagnol (Costa Rica) es-CR
  • +? Espagnol (République dominicaine) es-DO
  • + espagnol (Équateur) es-EC
  • + espagnol (Salvador) es-SV
  • + Espagnol (Guatemala) es-GT
  • + Espagnol (Honduras) es-HN
  • + Espagnol (Mexique) es-MX
  • + espagnol (Nicaragua) es-NI
  • + espagnol (Panama) es-PA
  • + espagnol (Paraguay) es-PY
  • + espagnol (Pérou) es-PE
  • + espagnol (Porto Rico) es-PR
  • + espagnol (Espagne) es-ES
  • + Espagnol (US) es-US
  • + Espagnol (Uruguay) es-UY
  • + Espagnol (Venezuela) es-VE
  • + suédois sv-SE
  • + turc tr
  • + zoulou zu
  • + Zulu zu
47
Sergey Zyuzin

Je sais que ceci est un ancien post, mais comme cette information est difficile à trouver, je pensais publier une liste pour tous ceux qui cherchaient peut-être. S'il vous plaît laissez une note si vous trouvez des erreurs ou des omissions. 

{
  "Afrikaans": [
    ["South Africa", "af-ZA"]
  ],
  "Arabic" : [
    ["Algeria","ar-DZ"],
    ["Bahrain","ar-BH"],
    ["Egypt","ar-EG"],
    ["Israel","ar-IL"],
    ["Iraq","ar-IQ"],
    ["Jordan","ar-JO"],
    ["Kuwait","ar-KW"],
    ["Lebanon","ar-LB"],
    ["Morocco","ar-MA"],
    ["Oman","ar-OM"],
    ["Palestinian Territory","ar-PS"],
    ["Qatar","ar-QA"],
    ["Saudi Arabia","ar-SA"],
    ["Tunisia","ar-TN"],
    ["UAE","ar-AE"]
  ],
  "Basque": [
    ["Spain", "eu-ES"]
  ],
  "Bulgarian": [
    ["Bulgaria", "bg-BG"]
  ],
  "Catalan": [
    ["Spain", "ca-ES"]
  ],
  "Chinese Mandarin": [
    ["China (Simp.)", "cmn-Hans-CN"],
    ["Hong Kong SAR (Trad.)", "cmn-Hans-HK"],
    ["Taiwan (Trad.)", "cmn-Hant-TW"]
  ],
  "Chinese Cantonese": [
    ["Hong Kong", "yue-Hant-HK"]
  ],
  "Croatian": [
    ["Croatia", "hr_HR"]
  ],
  "Czech": [
    ["Czech Republic", "cs-CZ"]
  ],
  "Danish": [
    ["Denmark", "da-DK"]
  ],
  "English": [
    ["Australia", "en-AU"],
    ["Canada", "en-CA"],
    ["India", "en-IN"],
    ["Ireland", "en-IE"],
    ["New Zealand", "en-NZ"],
    ["Philippines", "en-PH"],
    ["South Africa", "en-ZA"],
    ["United Kingdom", "en-GB"],
    ["United States", "en-US"]
  ],
  "Farsi": [
    ["Iran", "fa-IR"]
  ],
  "French": [
    ["France", "fr-FR"]
  ],
  "Filipino": [
    ["Philippines", "fil-PH"]
  ],
  "Galician": [
    ["Spain", "gl-ES"]
  ],
  "German": [
    ["Germany", "de-DE"]
  ],
  "Greek": [
    ["Greece", "el-GR"]
  ],
  "Finnish": [
    ["Finland", "fi-FI"]
  ],
  "Hebrew" :[
    ["Israel", "he-IL"]
  ],
  "Hindi": [
    ["India", "hi-IN"]
  ],
  "Hungarian": [
    ["Hungary", "hu-HU"]
  ],
  "Indonesian": [
    ["Indonesia", "id-ID"]
  ],
  "Icelandic": [
    ["Iceland", "is-IS"]
  ],
  "Italian": [
    ["Italy", "it-IT"],
    ["Switzerland", "it-CH"]
  ],
  "Japanese": [
    ["Japan", "ja-JP"]
  ],
  "Korean": [
    ["Korea", "ko-KR"]
  ],
  "Lithuanian": [
    ["Lithuania", "lt-LT"]
  ],
  "Malaysian": [
    ["Malaysia", "ms-MY"]
  ],
  "Dutch": [
    ["Netherlands", "nl-NL"]
  ],
  "Norwegian": [
    ["Norway", "nb-NO"]
  ],
  "Polish": [
    ["Poland", "pl-PL"]
  ],
  "Portuguese": [
    ["Brazil", "pt-BR"],
    ["Portugal", "pt-PT"]
  ],
  "Romanian": [
    ["Romania", "ro-RO"]
  ],
  "Russian": [
    ["Russia", "ru-RU"]
  ],
  "Serbian": [
    ["Serbia", "sr-RS"]
  ],
  "Slovak": [
    ["Slovakia", "sk-SK"]
  ],
  "Slovenian": [
    ["Slovenia", "sl-SI"]
  ],
  "Spanish": [
    ["Argentina", "es-AR"],
    ["Bolivia", "es-BO"],
    ["Chile", "es-CL"],
    ["Colombia", "es-CO"],
    ["Costa Rica", "es-CR"],
    ["Dominican Republic", "es-DO"],
    ["Ecuador", "es-EC"],
    ["El Salvador", "es-SV"],
    ["Guatemala", "es-GT"],
    ["Honduras", "es-HN"],
    ["México", "es-MX"],
    ["Nicaragua", "es-NI"],
    ["Panamá", "es-PA"],
    ["Paraguay", "es-PY"],
    ["Perú", "es-PE"],
    ["Puerto Rico", "es-PR"],
    ["Spain", "es-ES"],
    ["Uruguay", "es-UY"],
    ["United States", "es-US"],
    ["Venezuela", "es-VE"]
  ],
  "Swedish": [
    ["Sweden", "sv-SE"]
  ],
  "Thai": [
    ["Thailand", "th-TH"]
  ],
  "Turkish": [
    ["Turkey", "tr-TR"]
  ],
  "Ukrainian": [
    ["Ukraine", "uk-UA"]
  ],
  "Vietnamese": [
    ["Viet Nam", "vi-VN"]
  ],
  "Zulu": [
    ["South Africa", "zu-ZA"]
  ]
}

Edit: J'ai également trouvé cette liste, qui est probablement plus récente: https://cloud.google.com/speech-to-text/docs/languages ​​

8
TimHayes

Utilisez le code suivant pour obtenir toutes les voix disponibles pour l'API de parole dans votre navigateur:

var voices = speechSynthesis.getVoices();
      for(var i = 0; i < voices.length; i++ ) {
        console.log("Voice " + i.toString() + ' ' + voices[i].name + ' ' + voices[i].uri);
      }

À l'heure actuelle, seuls Chrome et Safari prennent en charge l'API Web Speech (bien que Safari ne prenne en charge que les fonctionnalités de synthèse vocale). Curieusement, Firefox OS supporte TTS, mais pas la version du navigateur.

La liste des langues dépend du navigateur sur lequel vous vous trouvez, en fonction de la documentation et de mes tests (utilisateur dépendant de l'agent).

Dans Safari, de nombreuses langues sont également disponibles (plus de 40 ans, je crois). Dans Chrome, vous obtenez actuellement la liste suivante:

Voice 0 Google US English undefined

Voice 1 Google UK English Male indéfini

Voice 2 Google UK English Femmes non définie

Voice 3 Google Español non défini

Voice 4 Google Français undefined

Voice 5 Google Italiano undefined

Voice 6 Google Deutsch non défini

Voice 7 Google Télécharger undefined

Voice 8 Google 의 non défini

Voice 9 Google 中 的 undefined

Voice 10 natif indéfini

4
mesosteros

Ici, vous avez @ Timhayes dans un LinkedHashMap où vous pouvez récupérer les valeurs. En utilisant LinkedHashMap, je peux obtenir la position de la carte.

    LinkedHashMap<String,String> country = new LinkedHashMap<String,String>();


    country.put("South Africa", "af-ZA");
    country.put("Algeria", "ar-DZ");
    country.put("Bahrain", "ar-BH");
    country.put("Egypt", "ar-EG");
    country.put("Israel", "ar-IL");
    country.put("Iraq", "ar-IQ");
    country.put("Jordan", "ar-JO");
    country.put("Kuwait", "ar-KW");
    country.put("Lebanon", "ar-LB");
    country.put("Morocco", "ar-MA");
    country.put("Oman", "ar-OM");
    country.put("Palestinian Territory", "ar-PS");
    country.put("Qatar", "ar-QA");
    country.put("Saudi Arabia", "ar-SA");
    country.put("Tunisia", "ar-TN");
    country.put("UAE", "ar-AE");
    country.put("Spain", "eu-ES");
    country.put("Bulgaria", "bg-BG");
    country.put("Spain", "ca-ES");
    country.put("China (Simp.)", "cmn-Hans-CN");
    country.put("Hong Kong SAR (Trad.)", "cmn-Hans-HK");
    country.put("Taiwan (Trad.)", "cmn-Hant-TW");
    country.put("Hong Kong", "yue-Hant-HK");
    country.put("Croatia", "hr_HR");
    country.put("Czech Republic", "cs-CZ");
    country.put("Denmark", "da-DK");
    country.put("Australia", "en-AU");
    country.put("Canada", "en-CA");
    country.put("India", "en-IN");
    country.put("Ireland", "en-IE");
    country.put("New Zealand", "en-NZ");
    country.put("Philippines", "en-PH");
    country.put("South Africa", "en-ZA");
    country.put("United Kingdom", "en-GB");
    country.put("United States", "en-US");
    country.put("Iran", "fa-IR");
    country.put("France", "fr-FR");
    country.put("Philippines", "fil-PH");
    country.put("Spain", "gl-ES");
    country.put("Germany", "de-DE");
    country.put("Greece", "el-GR");
    country.put("Finland", "fi-FI");
    country.put("Israel", "he-IL");
    country.put("India", "hi-IN");
    country.put("Hungary", "hu-HU");
    country.put("Indonesia", "id-ID");
    country.put("Iceland", "is-IS");
    country.put("Italy", "it-IT");
    country.put("Switzerland", "it-CH");
    country.put("Japan", "ja-JP");
    country.put("Korea", "ko-KR");
    country.put("Lithuania", "lt-LT");
    country.put("Malaysia", "ms-MY");
    country.put("Netherlands", "nl-NL");
    country.put("Norway", "nb-NO");
    country.put("Poland", "pl-PL");
    country.put("Brazil", "pt-BR");
    country.put("Portugal", "pt-PT");
    country.put("Romania", "ro-RO");
    country.put("Russia", "ru-RU");
    country.put("Serbia", "sr-RS");
    country.put("Slovakia", "sk-SK");
    country.put("Slovenia", "sl-SI");
    country.put("Argentina", "es-AR");
    country.put("Bolivia", "es-BO");
    country.put("Chile", "es-CL");
    country.put("Colombia", "es-CO");
    country.put("Costa Rica", "es-CR");
    country.put("Dominican Republic", "es-DO");
    country.put("Ecuador", "es-EC");
    country.put("El Salvador", "es-SV");
    country.put("Guatemala", "es-GT");
    country.put("Honduras", "es-HN");
    country.put("México", "es-MX");
    country.put("Nicaragua", "es-NI");
    country.put("Panamá", "es-PA");
    country.put("Paraguay", "es-PY");
    country.put("Perú", "es-PE");
    country.put("Puerto Rico", "es-PR");
    country.put("Spain", "es-ES");
    country.put("Uruguay", "es-UY");
    country.put("United States", "es-US");
    country.put("Venezuela", "es-VE");
    country.put("Sweden", "sv-SE");
    country.put("Thailand", "th-TH");
    country.put("Turkey", "tr-TR");
    country.put("Ukraine", "uk-UA");
    country.put("Viet Nam", "vi-VN");
    country.put("South Africa", "zu-ZA");
0
Waffles.Inc