Lors de la création de sites Web, les caractères spéciaux doivent être pris en compte. HTML, le langage de balisage utilisé pour écrire des pages Web, fournit son propre moyen d'inclure des caractères spéciaux non normaux. Ces caractères incluent des marques d’accent, des symboles spéciaux, etc.
Cela s’explique par la nature de l’enregistrement des fichiers de page Web. Afin de minimiser la taille du fichier et de fournir l'expérience la plus cohérente possible sur tous les ordinateurs, un codage est utilisé pour mapper chaque caractère sur une représentation binaire (numérique). La valeur binaire de chaque caractère est stockée séquentiellement dans le fichier. par conséquent, plus l'encodage autorise de caractères, plus le fichier est volumineux - de manière exponentielle. (Pour plus d'informations, consultez: http://en.wikipedia.org/wiki/Character_encoding )
Lorsqu'un fichier est enregistré avec un codage incorrect, les caractères spéciaux sont mal représentés car un codage incorrect ne permet pas de mapper correctement le caractère. Cela peut être corrigé en modifiant le codage que vous utilisez pour lire le fichier. L'encodage dans lequel IMDb enregistre ses fichiers est apparemment différent de celui envoyé à votre navigateur. Les caractères sont donc restitués avec des ordures.
La raison pour laquelle le caractère apparaît correct sur l'autre page est parce que la personne qui l'a écrit comprend le fonctionnement de HTML. Comme je l'ai dit plus tôt, HTML fournit un moyen de représenter des caractères spéciaux à l'aide de caractères non spéciaux.
Par exemple, pour rendre un coeur en HTML, vous pouvez taper ♥
lors de l'écriture d'une page Web. Le résultat ressemble à ♥, ce qui est clairement un caractère spécial. Pourtant, la façon dont je l'ai tapé dans ce document n'exigeait aucun caractère spécial. Cela élimine essentiellement le problème de l'encodage des caractères qui ne correspond pas, car vous devriez ne jamais avoir besoin de taper des caractères spéciaux lors de l'écriture d'une page Web.
Un grand nombre de sites Web autorisant les entrées d'utilisateurs, tels que Facebook et Twitter, reformateront automatiquement ces caractères en HTML pour qu'ils apparaissent correctement lorsqu'ils sont visualisés via votre navigateur Web. Apparemment, IMDb ne fait pas cela. Je voudrais noter que la page avec le caractère en désordre a été soumise par un utilisateur, tandis que l'autre page est une page officielle d'IMDb, qui a probablement été écrite par quelqu'un qui a compris comment HTML représente les caractères spéciaux.