J'ai un problème que je n'ai pas rencontré auparavant. Sur un site Web sur lequel je travaille, www.example.com
, j'ai plusieurs liens d'affiliation de la forme www.example.com/out/blahblah
La redirection est un 302, car j'ai entendu dire que 302 est le type de redirection recommandé pour les liens d'affiliation.
Le problème est que si je fais un site: example.com inurl:out
search, je peux voir les URL redirigées dans serp, avec le titre et la méta description de l'URL ciblée.
Je n'ai pas remarqué jusqu'à aujourd'hui. Et, par curiosité, j’ai consulté d’autres grands sites qui, je le sais, ont des liens d’affiliation et j’ai remarqué que la même chose arrivait à certains d’entre eux. Cependant, certains n'ont pas indexé ces liens et d'autres avec le message "cette page est bloquée par robots.txt" car ils l'ont probablement.
exemple: voyez comment yoast.com a/out/bloqué dans les robots et affiche le message suivant: https://www.google.com/search?q=site%3Ayoast.com+inurl%3Aout&rlz=1C1GIGM_enRO664RO664&oq = site% 3Ayoast.com + inurl% 3Aout & aqs = chrome.0.69i59j69i58.6783j0j4 & sourceid = chrome & es_sm = 93 & ie = UTF-8
idem pour les médias spécialisés: https://www.google.com/search?q=site:nutsandboltsmedia.com+inurl:go&rlz=1C1GIGM_enRO664RO664&biw=1920&bih=995&noj=1&filter=
et consultez le site www.drachils.com qui a exactement le problème que j'ai: https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=site%3Acarriedils. com% 20inurl% 3Ago
Quelle est la cause de cela? Des recommandations?
Cela fait longtemps que Google indexe environ 302 URL de redirection.
Il y a des années, cela était utilisé par les chapeaux noirs pour "détourner" des listes. Ils pourraient créer un lien qui 302 serait redirigé vers une autre page et Google mettrait parfois leur URL de redirection dans les SERP à la place de la page légitime. Le chapeau noir modifierait alors la redirection (ou même la masquerait) et volerait le trafic organique provenant des résultats de recherche Google.
Google a modifié ses algorithmes pour privilégier la page réelle 99% du temps au lieu de la redirection. Maintenant, 302 détournements ne fonctionnent plus. Matt Cutts en a discuté sur son blog . Il donne un exemple de la raison pour laquelle Google peut vouloir indexer occasionnellement la redirection plutôt que la page de destination:
Prenons un exemple de la fraction du temps pendant laquelle nous pouvons nous réserver le droit d’afficher la page source pour une redirection 302 hors domaine. Si vous exécutez wget sur
www.sfgiants.com
, vous obtiendrez une redirection 302 vers un autre domaine et l'URL que vous obtiendrez sera plutôt moche:http://sanfrancisco.giants.mlb.com/NASApp/mlb/index.jsp?c_id=sf
. Sachez que vous êtes probablement propriétaire du site ou webmaster pendant une seconde et essayez de vous mettre à la place d'un utilisateur habituel dans la rue. Si nous avions un test de goût, combien d'utilisateurs préfèreraient cliquer sursfgiants.com
et combien préféreraient cliquer sursanfrancisco.giants.mlb.com/NASApp/mlb/index.jsp?c_id=sf
? Les utilisateurs normaux aiment généralement les URL courtes et propres. Ils sont moins susceptibles de dire "mlb.com
? Je me demande ce que cela représente? Hmm. Peut-être la ligue majeure de baseball? Est-ce que c'est le nom sous licence officielle, je me le demande? C'est probablement. Oui, il semble quesanfrancisco.giants.mlb.com/NASApp/mlb/index.jsp?c_id=sf
soit l'URL correcte de ma requête. ”
Donc, si vous avez une URL qui redirige, Google peut choisir de l'indexer. Ils peuvent choisir de le faire, en particulier si l’URL de destination n’est pas explorable. Pour ce faire, Google doit pouvoir analyser l'URL.
Pour les URL de redirection répertoriées dans , le fichier robots.txt est un autre cas complètement. Google peut choisir d'indexer une URL répertoriée dans le fichier robots.txt , même s'il ne peut pas l'explorer s'il a l'impression que les liens entrants lui sont associés. assez important. Dans ce cas, il utilise le texte d'ancrage des liens dans les SERP et n'explore pas du tout l'URL. Google n'a pas connaissance que l'URL redirige. C'est le cas des trois exemples concrets que vous donnez. Si je recherche les pages de destination par leur nom, je peux trouver les pages de destination sur le site normal.
La plupart du temps, ces URL bloquées dans le fichier robots.txt n'apparaîtront que pour les recherches site:
. (Je suis presque sûr d'avoir vu John Mueller de Google le dire, mais je ne trouve pas la référence pour le moment.)
Donc, si vous ne souhaitez pas que vos liens d’affiliation apparaissent dans les résultats de la recherche, il apparaît que ni les redirections 302 ni le fichier robots.txt n’est une solution à toute épreuve . Je recommanderais que chaque lien d'affiliation sur votre site ait l'attribut rel=nofollow
. Dans ce cas, il est beaucoup moins probable que Google attribue aux URL suffisamment de jus de lien pour pouvoir être indexées.