web-dev-qa-db-fra.com

caractères spéciaux (émoticônes) dans un fichier texte

J'ai un fichier txt d'une conversation exporté de WhatsApp. WhatsApp prend en charge les émoticônes dans leur conversation, et la conversation exportée contient également, à ma grande surprise, ces émoticônes! Autrement dit, si j'ouvre le fichier texte dans un éditeur de texte (Text Wrangler sur Mac 10.8), je peux voir les émoticônes. Le fichier texte est codé en UTF-8 et il n'y a aucune ressource associée au fichier que je peux dire.

Quelqu'un peut-il m'expliquer comment ces émoticônes sont incluses dans le fichier texte et comment elles sont interprétées avec précision par l'éditeur de texte? Est-ce que cela est lié à l'encodage des caractères? Des ressources supplémentaires sont-elles incluses avec le fichier texte?

17
Sean Connolly

Unicode contient des sections qui spécifient les emoji en tant que "caractères". Ce sont des caractères normaux, vous n'avez besoin que d'une police qui peut les afficher. Voir également la FAQ Unicode Emoji .

Dans un fichier texte, les caractères sont essentiellement codés sous forme de nombres sous forme d'octets. Pour les afficher visuellement sur un écran d'ordinateur, vous avez besoin d'une police qui contient le glyphe visuel pour rendre ce personnage. Étant donné que le processus est toujours identificateur numérique → police → glyphe visible , il devrait être assez évident qu'un "caractère" peut être quelque chose de visuel, y compris des emoji ou tout autre autre image.

character viewer

25
deceze