Je travaille sur le décodage de texte. J'essaie de trouver le code de caractère pour le caractère —
, pour ne pas être confondu avec -
, en ASCII. J'ai essayé sans succès. Est-ce que quelqu'un sait comment le convertir?
Citation de wiki ( Em dash )
Lorsqu'un tiret électronique n'est pas disponible, comme dans le jeu de caractères ASCII, un double ("-") ou un triple trait d'union ("---") est utilisé. En Unicode, le tiret est U + 2014 (décimal 8212).
Le caractère tiret ne fait pas partie du jeu de caractères ASCII.
—
est connu comme un Em Dash. Son code de caractère est \u2014
. Ce n'est pas un caractère ASCII, vous ne pouvez donc pas le décoder avec le jeu de caractères ASCII car il ne figure pas dans la table de caractères ASCII. Vous voudrez probablement utiliser UTF8 à la place.
Ce caractère n'existe pas en ASCII, mais uniquement en Unicode, généralement codé en UTF-8.
En UTF-8, les caractères sont codés en séquences de 2 ou 3 octets (ou parfois plus longtemps), où aucun des deux ou trois octets n’est un code ASCII valide, où tous sont en dehors du ASCII plage de 0 à 127.
On soupçonne que ce qui précède ne répond que partiellement à votre question, mais dans l’affirmative, c’est probablement parce que votre question n’est que partiellement posée par inadvertance. Pour plus de détails, vous pouvez élargir votre question avec plus de détails.
Le caractère —
ne fait pas partie du jeu ASCII.
Mais si vous cherchez à le convertir en un autre format (comme U + hex), vous pouvez utiliser this outil en ligne. Mettez votre personnage dans la première case verte et cliquez sur "Convertir" (au dessus de la case)
plus bas, vous trouverez un certain nombre de codes différents, notamment U + hex:
U+2014
N'hésitez pas à modifier cette réponse si le lien est rompu ou à laisser un commentaire afin que je puisse trouver un remplaçant.