Langues prises en charge par les glyphes "latin" vs "latin-étendu" dans les polices sur Google Web Fonts?

Question

Google Web Fonts Select Character Sets

Certaines polices sur Google Web Fonts prennent en charge plusieurs "jeux de caractères". Le fait est que si la police Web que j'utilise ne sert que les glyphes "latins", les utilisateurs qui traduisent la page dans une langue dont les glyphes ne sont pas pris en charge remarqueront clairement le texte foiré.

J'aimerais que mes polices Web prennent en charge les langues les plus populaires au monde, à l'exception de l'anglais, par exemple, l'espagnol, l'allemand, le français, etc.

À cette fin, je voudrais savoir, dans quelles langues exactement, le "latin" et le "latin étendu" s'adressent individuellement.

Je m'attends à ce que la réponse ressemble à ceci:

Latin Character Set & Supported Languages: - .......... - .......... - .......... Latin-Extended Character Set & Supported Languages: - .......... - .......... - ..........

Je n'ai pas pu trouver ces informations dans la documentation de Google Web Fonts, ni sur Google.

Jan Turoň · Accepted Answer

Latin

aka Unicode Latin1-Supplement (U + 0080 à U + 00FF) est destiné à prendre en charge les langues d'Europe occidentale (comme vous l'avez mentionné le français, l'allemand, l'espagnol, l'irlandais, l'islandais, les langues des pays scandinaves et par coïncidence également d'autres langues mentionnées dans la liste ci-dessous; l'anglais britannique manque le signe £ couramment utilisé, l'anglais américain est pris en charge par la norme ASCII). ASCII (127 premiers caractères, 95 d'entre eux sont des graphèmes U + 0020 à U + 007E) a été placé comme le tout premier bloc en Unicode nommé Latin de base. Ce bloc est considéré comme faisant partie de " Latin "et est généralement pris en charge même dans les polices non latines pour afficher correctement le nom de la police sur les systèmes basés sur le latin.

Latin étendu

Latin étendu signifie pratiquement bloquer Latin-Extended-A (U + 0100 à U + 017F) qui devrait prendre en charge tous les textes écrits en latin courants. Latin1-Extended-B contient principalement la prise en charge de la phonétique et des langues écrites en latin africain, mais également 3 caractères pour le roumain et l'azerbaïdjanais mentionnés ci-dessous (peuvent être remplacés par des caractères de l'extension A). Il existe des extensions C, D et E encore plus exotiques (252 caractères au total), mais elles ne sont jamais utilisées dans les textes électroniques courants.

La plupart des langues utilisant ce bloc utilisent également des caractères de "Latin" (Latin1-Supplément), donc les polices "Latin-Extended" devraient contiennent un surensemble de caractères "Latin", mais ce n'est pas garanti: le plus la police contient de caractères, plus sa taille est grande (les polices couvrant l'ensemble BMP peut dépasser 10 Mo, pas bon pour les polices Web). Par conséquent, pas tous les caractères du bloc Latin-Extended-A doit être présent dans la catégorie Latin-Extended , en particulier dans les polices très stylisées: cela dépend du but de la police ou des motifs de son auteur. la police prend en charge une langue spécifique, essayez d'afficher les caractères de la liste ci-dessous.

Prise en charge des langues

Dans la liste ci-dessous, je ne compte pas:

digraphes qui sont généralement remplacés par des caractères séparés (Æ est pris en charge par Latin1-Supplement)
alphabets non latins car la question porte sur le latin contre le latin étendu
langues minoritaires et mortes (elfdalien, féroïen, cachoube, monténégrin, livonien, ladin, frioulan, romanche, sami, haut et bas-sorabe, alphabets latins indiens natifs )
Alphabets ASCII (comme le néerlandais ou le gaélique) entièrement pris en charge par ASCII (toute police courante)
caractères historiques non utilisés dans les dernières versions des alphabets (comme les accents Grave doubles)

Veuillez commenter s'il manque quelque chose d'important ou si une langue minoritaire est utilisée dans la communication électronique.

Latin

Albanais Ç, Ë
Catalan À, É, È, Í, Ï, Ó, Ò, Ú, Ü, Ç
danois , norvégien Æ, Å, Ø
finnois Å, Ä, Ö, Š, Ž (les deux derniers de Extended-A sont rarement utilisés, peuvent utiliser S, Z, alors Latin1-Supplement est suffisant )
Français Æ, Œ, Â, À, É, È, Ê, Ë, Ç, Î, Ï, Ô, Ù, Û, Ü, Ÿ , "," (Rarement utilisé Œ, Ÿ de Extended-A, le reste incluant ÿ en latin1-supplément)
Allemand Ä, Ö, Ü, ß
islandais Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð
irlandais Á, É, Í, Ó, Ú
Sardaigne Ç
espagnol et galicien Ñ, ¿, ¡
suédois Å, Ä, Ö

Latin étendu

Azerbaïdjanais Ç, Ğ, I (minuscule sans point), İ, Ö, Ş, Ü, Ə (le dernier de Extended-B est remplaçable par Ä, puis même alphabet que le turc)
serbe , bosniaque et croate Ć, Č, Đ, Š, Ž
tchèque Á, Č, Ď, Ě, É, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
Anglais £, ¢
Estonien Ä, Ö, Õ, Ü, Š, Ž
Espéranto Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
hongrois Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
Letton Ā, Č, Ē, Ģ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
Lituanien Ą, Č, Ę, Ė, Š, Ų, Ū, Ž
polonais Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
portugais Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú
roumain Ă, Â, Î, Ș, Ț (les 2 derniers sont en latin étendu B, peuvent utiliser Ş, Ţ de étendu A)
slovaque Ä, Á, Č, Ď, É, Í, Ĺ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý , Ž
slovène Č, Š, Ž
Turc Ç, Ğ, I (minuscule sans point), İ, Ö, Ş, Ü
vietnamien Ă, Â, Đ, Ê, Ô, Ơ, Ư (le premier et les deux derniers en Extended-B plus la combinaison des tonalités 0x300 et 0x301, voir combinant les signes diacritiques ci-dessous, a une catégorie spéciale sur les polices google)
Gallois Â, Ê, Î, Ô, Û, Ŵ, Ŷ

Combinaison de signes diacritiques

Alternativement, la police peut prendre en charge le bloc Combining Diacritical Marks: U + 0300 à U + 036F. Par exemple, Ř peut être tapé soit comme U+0158 (aka caractère précomposé) ou comme R + U+030C. Un programme prenant en charge Unicode doit à la fois afficher et traiter de la même manière qu'un caractère autonome, mais si le programme ou la police ne prend pas en charge repertoire, la marque diacritique combinante pourrait finir par être un peu déplacée, voir ceci très détaillé Q&R Unicode sur ce sujet.

Autres personnages à considérer

Fraktur allemand , encore couramment utilisé (c'est-à-dire sur la plupart des panneaux de signalisation de Salzbourg), contient plusieurs variantes "s" qui ne sont pas en Unicode, les polices ne peuvent pas les afficher sous forme de glyphes et les mapper avec d'autres caractères ( pas une bonne idée). Il y a d'autres symboles exotiques qui pourraient être utiles dans les textes électroniques (quand j'étais enfant, on m'a appris "Ch" comme graphème en alphabet tchèque après "h". Ce n'est pas en Unicode (Lj slovène similaire, Nj est en Unicode ), et comme les textes électroniques prévalaient en République tchèque au milieu des années 90, ils ne sont plus mis en valeur, mais dans la langue tchèque, la séquence "ch" est toujours triée après "h", informations plus intéressantes ici ).

Polices utiles avec prise en charge multilingue

Vous voudrez peut-être personnaliser certaines polices (si leur licence le permet) par le service Font Squirrel ou les utiliser comme sauvegarde. Il existe un large éventail de polices gratuites pour commencer:

J'aime vraiment Nice Quivira police de type ouvert avec 11 + k caractères, 1,5 Mo
arial Unicode est installé sur de nombreux ordinateurs (fait partie de MS Office, 50k + caractères, 22 Mo)
il y a un projet Noto par Google qui contient TOUS les caractères unicode les plus récents en serif, sans-serif et les polices UI bien triés par support de blocs (1,1 Go)
en tant que police de sauvegarde de dernier recours, vous pouvez envisager un Unifont laid (50 + k caractères, mais seulement 11 Mo et les périphériques intégrés conviviaux)