Dans Google Webmaster Tools, j'ai remarqué que ma page d'accueil avait été indexée à deux reprises:
example.com/
example.com/?chocaid=397
Je sais que je pourrais résoudre ce problème en utilisant le type de lien canonical
, mais je me demande: d'où vient ce paramètre?
Plusieurs sites ont des pages indexées avec ce paramètre/cette valeur même: https://duckduckgo.com/?q=chocaid%3D397 .
J'ai cherché des similitudes entre ces sites. mais n’a pas trouvé de conclusion concluante: c’est souvent la une, mais pas dans tous les cas. Certains sont NSFW, mais pas tous. Lorsque l'URL d'un domaine a ce paramètre, souvent, les autres sous-domaines du même domaine l'ont également.
Quelle est la nouveauté de votre domaine? Il se peut très bien que c’était une requête populaire sur l’ancien domaine et que vous obteniez donc toujours des "visiteurs". Cela correspond-il à une page valide ou à une page 404? Si vous obtenez beaucoup de résultats là-bas et qu'il s'agit d'un 404, je le remapperais (utilisez un fichier .htaccess) sur votre page d'accueil ou quelque chose du genre.
Bien que je n'ai pas de réponse précise à ce sujet, j'ai découvert quelques points intéressants qui pourraient aider à mieux cerner le problème:
Ma meilleure hypothèse serait qu'il existe/existait un site de nettoyage qui ajoute cette URL à tous les liens trouvés. Certes, les liens externes semblent être l'explication la plus plausible de leur origine, et les annuaires sont peu probables car ils sont ajoutés à des pages assez aléatoires.
C'est peut-être Googlebot qui tente d'accéder à jQuery/Javascript et d'explorer tout ce qu'il peut. Il y a eu récemment un article dans lequel une personne a demandé de l'aide parce que Googlebot explorait des URL non valides sur son site. John M a expliqué comment Googlebot pouvait rechercher davantage d'URL à analyser à partir de scripts sur leur site. Il travaille pour Google Webmaster Tools. Vous avez à peu près répondu à votre propre question en définissant la balise canonique.
Cela pourrait provenir d'un fournisseur d'annonces que vous pourriez avoir. J'ai le même problème et le seul endroit possible d'où il provient est celui d'un fournisseur de contenu injectant des logiciels malveillants au moyen de codes javascript.