web-dev-qa-db-fra.com

Qu'est-ce que l'ajout de caractères grenouille à mes URL?

En parcourant la section "Erreurs d'exploration" de Google Webmaster Tools, j'ai découvert un ensemble d'erreurs 500 très étranges en référence à mon site:

Froggy URLs

J'ai pu retrouver ces caractères et, apparemment, ce sont les deux premiers caractères de l'Unicode Private Use Area . Il est juste arrivé que ma police les mappe à une grenouille portant une petite couronne et un symbole qui ressemble au chiffre 7.

Ces symboles n'apparaissent que sur les adresses des fichiers non HTML; documents bureautiques, PDF, etc. - mais ils n'apparaissent pas simplement dans le nom du fichier.

D'où viennent ces symboles et comment puis-je m'en débarrasser pour que Google puisse explorer correctement mon site?

Quelques informations de base:

  • Utilisation de Web Server exécutant WS2K3 avec IIS6 et PHP 5.3.8
  • Le codage du site est UTF-8
  • Ces symboles n'apparaissent pas sur la page ou dans la source
8
Jacob Hume

Ce n'est qu'une hypothèse, mais une possibilité est que quelqu'un d'autre connecte à vos fichiers avec du code défectueux. Je sais que chaque fois que j'ai reçu des requêtes douteuses sur mes sites, j'ai toujours été en mesure de les retrouver grâce au lien masqué de quelqu'un d'autre. (Il est vraiment irritant que les araignées n'incluent pas les en-têtes Http-Referer pour nous permettre d'identifier plus facilement la source de ces URL).

4
Peter Taylor