Changer les caractères étrangers en leur équivalent romain

Question

J'utilise php et je me demandais s'il y avait un moyen prédéfini de convertir des caractères étrangers en leurs alternatives non étrangères.

Des caractères tels que ê, ë, é résultant tous en 'e'.
Je recherche une fonction qui prendrait une chaîne et la retournerait sans les caractères spéciaux.
Toutes les idées seraient grandement appréciées!

Edgar Zag&#243;rski · Accepted Answer

Après avoir échoué à trouver des convertisseurs appropriés, j'ai créé ma propre collection qui convient à mes besoins, y compris ma conversion cyrillique préférée qui, par défaut, a de nombreuses variantes.

function transliterateString($txt) { $transliterationTable = array('á' => 'a', 'Á' => 'A', 'à' => 'a', 'À' => 'A', 'ă' => 'a', 'Ă' => 'A', 'â' => 'a', 'Â' => 'A', 'å' => 'a', 'Å' => 'A', 'ã' => 'a', 'Ã' => 'A', 'ą' => 'a', 'Ą' => 'A', 'ā' => 'a', 'Ā' => 'A', 'ä' => 'ae', 'Ä' => 'AE', 'æ' => 'ae', 'Æ' => 'AE', 'ḃ' => 'b', 'Ḃ' => 'B', 'ć' => 'c', 'Ć' => 'C', 'ĉ' => 'c', 'Ĉ' => 'C', 'č' => 'c', 'Č' => 'C', 'ċ' => 'c', 'Ċ' => 'C', 'ç' => 'c', 'Ç' => 'C', 'ď' => 'd', 'Ď' => 'D', 'ḋ' => 'd', 'Ḋ' => 'D', 'đ' => 'd', 'Đ' => 'D', 'ð' => 'dh', 'Ð' => 'Dh', 'é' => 'e', 'É' => 'E', 'è' => 'e', 'È' => 'E', 'ĕ' => 'e', 'Ĕ' => 'E', 'ê' => 'e', 'Ê' => 'E', 'ě' => 'e', 'Ě' => 'E', 'ë' => 'e', 'Ë' => 'E', 'ė' => 'e', 'Ė' => 'E', 'ę' => 'e', 'Ę' => 'E', 'ē' => 'e', 'Ē' => 'E', 'ḟ' => 'f', 'Ḟ' => 'F', 'ƒ' => 'f', 'Ƒ' => 'F', 'ğ' => 'g', 'Ğ' => 'G', 'ĝ' => 'g', 'Ĝ' => 'G', 'ġ' => 'g', 'Ġ' => 'G', 'ģ' => 'g', 'Ģ' => 'G', 'ĥ' => 'h', 'Ĥ' => 'H', 'ħ' => 'h', 'Ħ' => 'H', 'í' => 'i', 'Í' => 'I', 'ì' => 'i', 'Ì' => 'I', 'î' => 'i', 'Î' => 'I', 'ï' => 'i', 'Ï' => 'I', 'ĩ' => 'i', 'Ĩ' => 'I', 'į' => 'i', 'Į' => 'I', 'ī' => 'i', 'Ī' => 'I', 'ĵ' => 'j', 'Ĵ' => 'J', 'ķ' => 'k', 'Ķ' => 'K', 'ĺ' => 'l', 'Ĺ' => 'L', 'ľ' => 'l', 'Ľ' => 'L', 'ļ' => 'l', 'Ļ' => 'L', 'ł' => 'l', 'Ł' => 'L', 'ṁ' => 'm', 'Ṁ' => 'M', 'ń' => 'n', 'Ń' => 'N', 'ň' => 'n', 'Ň' => 'N', 'ñ' => 'n', 'Ñ' => 'N', 'ņ' => 'n', 'Ņ' => 'N', 'ó' => 'o', 'Ó' => 'O', 'ò' => 'o', 'Ò' => 'O', 'ô' => 'o', 'Ô' => 'O', 'ő' => 'o', 'Ő' => 'O', 'õ' => 'o', 'Õ' => 'O', 'ø' => 'oe', 'Ø' => 'OE', 'ō' => 'o', 'Ō' => 'O', 'ơ' => 'o', 'Ơ' => 'O', 'ö' => 'oe', 'Ö' => 'OE', 'ṗ' => 'p', 'Ṗ' => 'P', 'ŕ' => 'r', 'Ŕ' => 'R', 'ř' => 'r', 'Ř' => 'R', 'ŗ' => 'r', 'Ŗ' => 'R', 'ś' => 's', 'Ś' => 'S', 'ŝ' => 's', 'Ŝ' => 'S', 'š' => 's', 'Š' => 'S', 'ṡ' => 's', 'Ṡ' => 'S', 'ş' => 's', 'Ş' => 'S', 'ș' => 's', 'Ș' => 'S', 'ß' => 'SS', 'ť' => 't', 'Ť' => 'T', 'ṫ' => 't', 'Ṫ' => 'T', 'ţ' => 't', 'Ţ' => 'T', 'ț' => 't', 'Ț' => 'T', 'ŧ' => 't', 'Ŧ' => 'T', 'ú' => 'u', 'Ú' => 'U', 'ù' => 'u', 'Ù' => 'U', 'ŭ' => 'u', 'Ŭ' => 'U', 'û' => 'u', 'Û' => 'U', 'ů' => 'u', 'Ů' => 'U', 'ű' => 'u', 'Ű' => 'U', 'ũ' => 'u', 'Ũ' => 'U', 'ų' => 'u', 'Ų' => 'U', 'ū' => 'u', 'Ū' => 'U', 'ư' => 'u', 'Ư' => 'U', 'ü' => 'ue', 'Ü' => 'UE', 'ẃ' => 'w', 'Ẃ' => 'W', 'ẁ' => 'w', 'Ẁ' => 'W', 'ŵ' => 'w', 'Ŵ' => 'W', 'ẅ' => 'w', 'Ẅ' => 'W', 'ý' => 'y', 'Ý' => 'Y', 'ỳ' => 'y', 'Ỳ' => 'Y', 'ŷ' => 'y', 'Ŷ' => 'Y', 'ÿ' => 'y', 'Ÿ' => 'Y', 'ź' => 'z', 'Ź' => 'Z', 'ž' => 'z', 'Ž' => 'Z', 'ż' => 'z', 'Ż' => 'Z', 'þ' => 'th', 'Þ' => 'Th', 'µ' => 'u', 'а' => 'a', 'А' => 'a', 'б' => 'b', 'Б' => 'b', 'в' => 'v', 'В' => 'v', 'г' => 'g', 'Г' => 'g', 'д' => 'd', 'Д' => 'd', 'е' => 'e', 'Е' => 'E', 'ё' => 'e', 'Ё' => 'E', 'ж' => 'zh', 'Ж' => 'zh', 'з' => 'z', 'З' => 'z', 'и' => 'i', 'И' => 'i', 'й' => 'j', 'Й' => 'j', 'к' => 'k', 'К' => 'k', 'л' => 'l', 'Л' => 'l', 'м' => 'm', 'М' => 'm', 'н' => 'n', 'Н' => 'n', 'о' => 'o', 'О' => 'o', 'п' => 'p', 'П' => 'p', 'р' => 'r', 'Р' => 'r', 'с' => 's', 'С' => 's', 'т' => 't', 'Т' => 't', 'у' => 'u', 'У' => 'u', 'ф' => 'f', 'Ф' => 'f', 'х' => 'h', 'Х' => 'h', 'ц' => 'c', 'Ц' => 'c', 'ч' => 'ch', 'Ч' => 'ch', 'ш' => 'sh', 'Ш' => 'sh', 'щ' => 'sch', 'Щ' => 'sch', 'ъ' => '', 'Ъ' => '', 'ы' => 'y', 'Ы' => 'y', 'ь' => '', 'Ь' => '', 'э' => 'e', 'Э' => 'e', 'ю' => 'ju', 'Ю' => 'ju', 'я' => 'ja', 'Я' => 'ja'); return str_replace(array_keys($transliterationTable), array_values($transliterationTable), $txt); }

Alix Axel · Answer

J'ai codé cette fonction qui utilise la table de traduction des entités HTML intégrée dans PHP to romanize chars:

function Unaccent($string) { if (strpos($string = htmlentities($string, ENT_QUOTES, 'UTF-8'), '&') !== false) { $string = html_entity_decode(preg_replace('~&([a-z]{1,2})(?:acute|cedil|circ|Grave|lig|orn|ring|slash|tilde|uml);~i', '$1', $string), ENT_QUOTES, 'UTF-8'); } return $string; }

Il fonctionne en appliquant htmlentities() puis en supprimant les suffixes d'entités communes, un exemple simple:

 - ã = &atilde; -> a - Ã = &Atilde; -> A - õ = &otilde; -> o - Õ = &Otilde; -> O - æ = &aelig; -> ae - Æ = &AElig; -> AE

Attention, pour que cela fonctionne correctement, vos fichiers doivent être encodés en UTF-8 (pas de nomenclature évidemment).

Voir aussi mon autre réponse pour un autre exemple.

PuReWebDev · Answer

Ma première recommandation est la fonction iconv. À savoir parce qu'il est intégré à PHP, il ne nécessite donc aucune bibliothèque externe ou tierce. De plus, c'est une fonction qui est conçue pour faire précisément ce que vous essayez d'accomplir (accepter le jeu de caractères en entrée et sortir un autre jeu de caractères, en passant spécifiquement de UTF-8 à ASCII). Voici un exemple de la façon d'appeler cette fonction:

$clean_ascii_output = iconv('UTF-8', 'ASCII//TRANSLIT', $utf8_input);

Plus d'informations sur les spécificités de cette fonction PHP peut être trouvée ici: http://php.net/manual/en/function.iconv.php

Remarque: La fonction iconv accepte les entrées de chaîne, vous voudrez donc parcourir les données et les analyser de telle sorte que vous passiez une entrée de chaîne.

Ariel · Answer

Essayez iconv() http://www.php.net/manual/en/function.iconv.php avec l'option //TRANSLIT, Ou

recode_string() http://www.php.net/manual/en/function.recode-string.php , ou

mb_convert_encoding() http://www.php.net/manual/en/function.mb-convert-encoding.php

infralabs · Answer

J'espère que cela sera utile à n'importe qui: https://github.com/infralabs/DiacriticsRemovePHP

Cette classe supprime les signes diacritiques des chaînes contenant des caractères spéciaux Latin-1 Supplement, Latin Extended-A et Latin Extended-B.

utilisation:

$specialCharacters = ""; $specialCharacters .= "Latin-1 Supplement".PHP_EOL; $specialCharacters .= "ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿ".PHP_EOL; $specialCharacters .= "Latin Extended-A".PHP_EOL; $specialCharacters .= "ĀāĂăĄąĆćĈĉĊċČčĎďĐđĒēĔĕĖėĘęĚěĜĝĞğĠġĢģĤĥĦħĨĩĪīĬĭĮįİıĲĳĴĵĶķĸĹĺĻļĽľĿŀŁłŃńŅņŇňŉŊŋŌōŎŏŐőŒœŔŕŖŗŘřŚśŜŝŞşŠšŢţŤťŦŧŨũŪūŬŭŮůŰűŲųŴŵŶŷŸŹźŻżŽžſ".PHP_EOL; $specialCharacters .= "Latin Extended-B".PHP_EOL; $specialCharacters .= "ƒǺǻǼǽǾǿ".PHP_EOL; $specialCharacters .= "Latin Extended Additional".PHP_EOL; $specialCharacters .= "ẀẁẂẃẄẅỲỳ".PHP_EOL; print "<pre>"; print removeDiacritics($specialCharacters).PHP_EOL; print "</pre>";

source:

Supplément Latin-1

ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ × ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö ÷ øùúûüýþÿþÿ

Latin Extended-A

ĀāĂăĄąĆćĈĉĊċČčĎďĐđĒēĔĕĖėĘęĚěĜĝĞğĠġĢģĤĥĦħĨĩĪīĬĭĮįİıĲĳĴĵĶķĸĹĺĻļĽľĿŀŁłŃńŅņŇňŉŊŋŌōŎŏŐőŒœŔŕŖŗŘřŚśŜŝŞşŠšŢţŤťŦŧŨũŪūŬŭŮůŰűŲųŴŵŶŷŸŹźŻżŽžſ

Latin étendu-B

ƒǺǻǼǽǾǿ

Latin étendu supplémentaire

ẀẁẂẃẄẅỲỳ

résultat:

Supplément Latin-1

AAAAAAAECEEEEIIIIDNOOOOO × OUUUUYTHssaaaaaaaeceeeeiiiidnooooo ÷ ouuuuythy

Latin Extended-A

AaAaAaCcCcCcCdDDDeeEeEeEeEeGgGgGgGgHhHhIiIiIiIiIiĲijJjKkĸLlLlLlLlLNNnnnnnnnnnoooooOEoeRrrRRRRSUZUsUsUs

Latin étendu-B

fAaAEaeOo

Latin étendu supplémentaire

WwWwWwYy

Michał Kosmulski · Answer

La façon la plus générique de résoudre ce problème est d'utiliser Normalisation Unicode car cela fonctionne automatiquement sur tous les accents - vous n'avez pas à préparer la liste à l'avance. Je ne sais pas s'il est facilement disponible en PHP, je l'ai utilisé en C et en Java. Essentiellement, vous transformez d'abord la chaîne de sorte que tous les caractères accentués soient représentés par un caractère normal plus une marque diacritique dite de composition (une bibliothèque intégrée ou externe devrait fournir cette fonction), puis supprimez les diacritiques de composition (à l'aide d'une bibliothèque spécialisée, en utilisant des propriétés de caractères fournies par le langage ou en utilisant des extensions d'expressions régulières).

sanette · Answer

J'ai vu cette vieille question et je ne sais toujours pas quelle est la meilleure réponse. Au cas où cela pourrait aider les autres, voici un tableau que j'ai composé automatiquement à partir de

http://www.fileformat.info/info/charset/UTF-8/list.htm

array ("À" => "A", "Á" => "A", "Â" => "A", "Ã" => "A", "Ä" => "A", "Å" => "A", "Æ" => "AE", "Ç" => "C", "È" => "E", "É" => "E", "Ê" => "E", "Ë" => "E", "Ì" => "I", "Í" => "I", "Î" => "I", "Ï" => "I", "Ð" => "ETH", "Ñ" => "N", "Ò" => "O", "Ó" => "O", "Ô" => "O", "Õ" => "O", "Ö" => "O", "Ø" => "O", "Ù" => "U", "Ú" => "U", "Û" => "U", "Ü" => "U", "Ý" => "Y", "Þ" => "THORN", "ß" => "s", "à" => "a", "á" => "a", "â" => "a", "ã" => "a", "ä" => "a", "å" => "a", "æ" => "ae", "ç" => "c", "è" => "e", "é" => "e", "ê" => "e", "ë" => "e", "ì" => "i", "í" => "i", "î" => "i", "ï" => "i", "ð" => "eth", "ñ" => "n", "ò" => "o", "ó" => "o", "ô" => "o", "õ" => "o", "ö" => "o", "ø" => "o", "ù" => "u", "ú" => "u", "û" => "u", "ü" => "u", "ý" => "y", "þ" => "thorn", "ÿ" => "y", "Ā" => "A", "ā" => "a", "Ă" => "A", "ă" => "a", "Ą" => "A", "ą" => "a", "Ć" => "C", "ć" => "c", "Ĉ" => "C", "ĉ" => "c", "Ċ" => "C", "ċ" => "c", "Č" => "C", "č" => "c", "Ď" => "D", "ď" => "d", "Đ" => "D", "đ" => "d", "Ē" => "E", "ē" => "e", "Ĕ" => "E", "ĕ" => "e", "Ė" => "E", "ė" => "e", "Ę" => "E", "ę" => "e", "Ě" => "E", "ě" => "e", "Ĝ" => "G", "ĝ" => "g", "Ğ" => "G", "ğ" => "g", "Ġ" => "G", "ġ" => "g", "Ģ" => "G", "ģ" => "g", "Ĥ" => "H", "ĥ" => "h", "Ħ" => "H", "ħ" => "h", "Ĩ" => "I", "ĩ" => "i", "Ī" => "I", "ī" => "i", "Ĭ" => "I", "ĭ" => "i", "Į" => "I", "į" => "i", "İ" => "I", "ı" => "i", "Ĵ" => "J", "ĵ" => "j", "Ķ" => "K", "ķ" => "k", "ĸ" => "kra", "Ĺ" => "L", "ĺ" => "l", "Ļ" => "L", "ļ" => "l", "Ľ" => "L", "ľ" => "l", "Ŀ" => "L", "ŀ" => "l", "Ł" => "L", "ł" => "l", "Ń" => "N", "ń" => "n", "Ņ" => "N", "ņ" => "n", "Ň" => "N", "ň" => "n", "ŉ" => "n", "Ŋ" => "ENG", "ŋ" => "eng", "Ō" => "O", "ō" => "o", "Ŏ" => "O", "ŏ" => "o", "Ő" => "O", "ő" => "o", "Ŕ" => "R", "ŕ" => "r", "Ŗ" => "R", "ŗ" => "r", "Ř" => "R", "ř" => "r", "Ś" => "S", "ś" => "s", "Ŝ" => "S", "ŝ" => "s", "Ş" => "S", "ş" => "s", "Š" => "S", "š" => "s", "Ţ" => "T", "ţ" => "t", "Ť" => "T", "ť" => "t", "Ŧ" => "T", "ŧ" => "t", "Ũ" => "U", "ũ" => "u", "Ū" => "U", "ū" => "u", "Ŭ" => "U", "ŭ" => "u", "Ů" => "U", "ů" => "u", "Ű" => "U", "ű" => "u", "Ų" => "U", "ų" => "u", "Ŵ" => "W", "ŵ" => "w", "Ŷ" => "Y", "ŷ" => "y", "Ÿ" => "Y", "Ź" => "Z", "ź" => "z", "Ż" => "Z", "ż" => "z", "Ž" => "Z", "ž" => "z", "ſ" => "s", "ƀ" => "b", "Ɓ" => "B", "Ƃ" => "B", "ƃ" => "b", "Ƅ" => "SIX", "ƅ" => "six", "Ɔ" => "O", "Ƈ" => "C", "ƈ" => "c", "Ɖ" => "D", "Ɗ" => "D", "Ƌ" => "D", "ƌ" => "d", "ƍ" => "delta", "Ǝ" => "E", "Ə" => "SCHWA", "Ɛ" => "E", "Ƒ" => "F", "ƒ" => "f", "Ɠ" => "G", "Ɣ" => "GAMMA", "ƕ" => "hv", "Ɩ" => "IOTA", "Ɨ" => "I", "Ƙ" => "K", "ƙ" => "k", "ƚ" => "l", "ƛ" => "lambda", "Ɯ" => "M", "Ɲ" => "N", "ƞ" => "n", "Ɵ" => "O", "Ơ" => "O", "ơ" => "o", "Ƣ" => "OI", "ƣ" => "oi", "Ƥ" => "P", "ƥ" => "p", "Ƨ" => "TWO", "ƨ" => "two", "Ʃ" => "ESH", "ƫ" => "t", "Ƭ" => "T", "ƭ" => "t", "Ʈ" => "T", "Ư" => "U", "ư" => "u", "Ʊ" => "UPSILON", "Ʋ" => "V", "Ƴ" => "Y", "ƴ" => "y", "Ƶ" => "Z", "ƶ" => "z", "Ʒ" => "EZH", "Ƹ" => "EZH", "ƹ" => "ezh", "ƺ" => "ezh", "Ƽ" => "FIVE", "ƽ" => "five", "Ǆ" => "DZ", "ǅ" => "D", "ǆ" => "dz", "Ǉ" => "LJ", "ǈ" => "L", "ǉ" => "lj", "Ǌ" => "NJ", "ǋ" => "N", "ǌ" => "nj", "Ǎ" => "A", "ǎ" => "a", "Ǐ" => "I", "ǐ" => "i", "Ǒ" => "O", "ǒ" => "o", "Ǔ" => "U", "ǔ" => "u", "Ǖ" => "U", "ǖ" => "u", "Ǘ" => "U", "ǘ" => "u", "Ǚ" => "U", "ǚ" => "u", "Ǜ" => "U", "ǜ" => "u", "ǝ" => "e", "Ǟ" => "A", "ǟ" => "a", "Ǡ" => "A", "ǡ" => "a", "Ǣ" => "AE", "ǣ" => "ae", "Ǥ" => "G", "ǥ" => "g", "Ǧ" => "G", "ǧ" => "g", "Ǩ" => "K", "ǩ" => "k", "Ǫ" => "O", "ǫ" => "o", "Ǭ" => "O", "ǭ" => "o", "Ǯ" => "EZH", "ǯ" => "ezh", "ǰ" => "j", "Ǳ" => "DZ", "ǲ" => "D", "ǳ" => "dz", "Ǵ" => "G", "ǵ" => "g", "Ƕ" => "HWAIR", "Ƿ" => "WYNN", "Ǹ" => "N", "ǹ" => "n", "Ǻ" => "A", "ǻ" => "a", "Ǽ" => "AE", "ǽ" => "ae", "Ǿ" => "O", "ǿ" => "o", "Ȁ" => "A", "ȁ" => "a", "Ȃ" => "A", "ȃ" => "a", "Ȅ" => "E", "ȅ" => "e", "Ȇ" => "E", "ȇ" => "e", "Ȉ" => "I", "ȉ" => "i", "Ȋ" => "I", "ȋ" => "i", "Ȍ" => "O", "ȍ" => "o", "Ȏ" => "O", "ȏ" => "o", "Ȑ" => "R", "ȑ" => "r", "Ȓ" => "R", "ȓ" => "r", "Ȕ" => "U", "ȕ" => "u", "Ȗ" => "U", "ȗ" => "u", "Ș" => "S", "ș" => "s", "Ț" => "T", "ț" => "t", "Ȝ" => "YOGH", "ȝ" => "yogh", "Ȟ" => "H", "ȟ" => "h", "Ƞ" => "N", "ȡ" => "d", "Ȣ" => "OU", "ȣ" => "ou", "Ȥ" => "Z", "ȥ" => "z", "Ȧ" => "A", "ȧ" => "a", "Ȩ" => "E", "ȩ" => "e", "Ȫ" => "O", "ȫ" => "o", "Ȭ" => "O", "ȭ" => "o", "Ȯ" => "O", "ȯ" => "o", "Ȱ" => "O", "ȱ" => "o", "Ȳ" => "Y", "ȳ" => "y", "ȴ" => "l", "ȵ" => "n", "ȶ" => "t", "ȷ" => "j", "ȸ" => "db", "ȹ" => "qp", "Ⱥ" => "A", "Ȼ" => "C", "ȼ" => "c", "Ƚ" => "L", "Ⱦ" => "T", "ȿ" => "s", "ɀ" => "z", "Ɂ" => "STOP", "ɂ" => "stop", "Ƀ" => "B", "Ʉ" => "U", "Ʌ" => "V", "Ɇ" => "E", "ɇ" => "e", "Ɉ" => "J", "ɉ" => "j", "Ɋ" => "Q", "ɋ" => "q", "Ɍ" => "R", "ɍ" => "r", "Ɏ" => "Y", "ɏ" => "y", "ɐ" => "a", "ɑ" => "alpha", "ɒ" => "alpha", "ɓ" => "b", "ɔ" => "o", "ɕ" => "c", "ɖ" => "d", "ɗ" => "d", "ɘ" => "e", "ə" => "schwa", "ɚ" => "schwa", "ɛ" => "e", "ɜ" => "e", "ɝ" => "e", "ɞ" => "e", "ɟ" => "j", "ɠ" => "g", "ɡ" => "script", "ɣ" => "gamma", "ɤ" => "rams", "ɥ" => "h", "ɦ" => "h", "ɧ" => "heng", "ɨ" => "i", "ɩ" => "iota", "ɫ" => "l", "ɬ" => "l", "ɭ" => "l", "ɮ" => "lezh", "ɯ" => "m", "ɰ" => "m", "ɱ" => "m", "ɲ" => "n", "ɳ" => "n", "ɵ" => "barred", "ɷ" => "omega", "ɸ" => "phi", "ɹ" => "r", "ɺ" => "r", "ɻ" => "r", "ɼ" => "r", "ɽ" => "r", "ɾ" => "r", "ɿ" => "r", "ʂ" => "s", "ʃ" => "esh", "ʄ" => "j", "ʅ" => "squat", "ʆ" => "esh", "ʇ" => "t", "ʈ" => "t", "ʉ" => "u", "ʊ" => "upsilon", "ʋ" => "v", "ʌ" => "v", "ʍ" => "w", "ʎ" => "y", "ʐ" => "z", "ʑ" => "z", "ʒ" => "ezh", "ʓ" => "ezh", "ʚ" => "e", "ʞ" => "k", "ʠ" => "q", "ʣ" => "dz", "ʤ" => "dezh", "ʥ" => "dz", "ʦ" => "ts", "ʧ" => "tesh", "ʨ" => "tc", "ʩ" => "feng", "ʪ" => "ls", "ʫ" => "lz", "ʮ" => "h", "ʯ" => "h")