web-dev-qa-db-fra.com

D'où provient le paramètre d'URL "? Chocaid = 397"?

Dans Google Webmaster Tools, j'ai remarqué que ma page d'accueil avait été indexée à deux reprises:

  • example.com/
  • example.com/?chocaid=397

Je sais que je pourrais résoudre ce problème en utilisant le type de lien canonical, mais je me demande: d'où vient ce paramètre?

Plusieurs sites ont des pages indexées avec ce paramètre/cette valeur même: https://duckduckgo.com/?q=chocaid%3D397 .

J'ai cherché des similitudes entre ces sites. mais n’a pas trouvé de conclusion concluante: c’est souvent la une, mais pas dans tous les cas. Certains sont NSFW, mais pas tous. Lorsque l'URL d'un domaine a ce paramètre, souvent, les autres sous-domaines du même domaine l'ont également.

Exemples

Entrée Wikipedia

enter image description here

Microsoft Codeplex

enter image description here

9
unor

Quelle est la nouveauté de votre domaine? Il se peut très bien que c’était une requête populaire sur l’ancien domaine et que vous obteniez donc toujours des "visiteurs". Cela correspond-il à une page valide ou à une page 404? Si vous obtenez beaucoup de résultats là-bas et qu'il s'agit d'un 404, je le remapperais (utilisez un fichier .htaccess) sur votre page d'accueil ou quelque chose du genre.

1
Kyros

Bien que je n'ai pas de réponse précise à ce sujet, j'ai découvert quelques points intéressants qui pourraient aider à mieux cerner le problème:

  • Les liens apparaissent également dans Bing et Yahoo, ce qui n’a rien à voir avec Google.
  • Ils apparaissent sur des wikis, des blogs Tumblr, des blogs Wordpress et d'autres sites, et ne seront donc pas ajoutés via un exploit dans un logiciel particulier.
  • Ils apparaissent sur des sites Tumblr de très mauvaise qualité, et il est donc peu probable qu’ils aient reçu de la publicité. De même, il est peu probable que les articles de Wikipédia soient promus via des publicités.

Ma meilleure hypothèse serait qu'il existe/existait un site de nettoyage qui ajoute cette URL à tous les liens trouvés. Certes, les liens externes semblent être l'explication la plus plausible de leur origine, et les annuaires sont peu probables car ils sont ajoutés à des pages assez aléatoires.

1
Richard B

C'est peut-être Googlebot qui tente d'accéder à jQuery/Javascript et d'explorer tout ce qu'il peut. Il y a eu récemment un article dans lequel une personne a demandé de l'aide parce que Googlebot explorait des URL non valides sur son site. John M a expliqué comment Googlebot pouvait rechercher davantage d'URL à analyser à partir de scripts sur leur site. Il travaille pour Google Webmaster Tools. Vous avez à peu près répondu à votre propre question en définissant la balise canonique.

1
Anagio

Cela pourrait provenir d'un fournisseur d'annonces que vous pourriez avoir. J'ai le même problème et le seul endroit possible d'où il provient est celui d'un fournisseur de contenu injectant des logiciels malveillants au moyen de codes javascript.

0
Raymund