Je m'excuse pour le titre, mais je ne peux pas vraiment l'expliquer. Voici ce que je demande
Puis-je avoir des URL spécifiques à la référencement dans mon sitemap.xml qui auront des liens canoniques vers les URL réelles?.
E.g: sitemap xml a une URL de /foo/bar?seo=true
et le contenu a un lien canonique à /foo/bar
La raison pour laquelle nous envisageons cette option:
Nous avons un javascript SPA, qui doit être pré-rend pour les bots. Pour éviter la surcharge de vérifier chaque demande, nous avons pensé que nous pouvions utiliser sitemap.xml pour rediriger les bots vers une URL de référencement spécifique, qui passerait par un pré-rédacteur (par exemple: phantomjs) et renverrait le contenu réel, qui un lien canonique vers l'URL actuelle.
Vous pouvez le faire, mais vous n'obtiendrez pas la garantie que l'expérience des utilisateurs ne sera pas altérée, ce qui amènera un utilisateur à accéder à votre site Web en ajoutant ?seo=true
à sa demande.
Pour faire un exemple, Google spécifiez que
Nous essayons de respecter cela, mais ne pouvons pas le garantir dans tous les cas.
ce qui signifie que vous devriez alors vérifier qu'ils sont des utilisateurs réels plutôt que des bots. Pour être juste, à mon humble avis, je ne m'attendrais pas à ce que cela se produise aussi souvent, ce qui pourrait effectivement réduire les frais généraux en raison du nombre réduit de demandes nécessitant un traitement spécial.
De plus, vous n'êtes pas sûr qu'un bot accède à votre site Web via un lien (qui peut être externe à votre site Web) plutôt que d'utiliser le plan du site, et dans ce cas, vous ne servirez pas la page pré-affichée. Bien que vous ayez un sitemap, l’algorithme du robot peut décider d’explorer immédiatement la page sans consulter le sitemap (du moins à ce moment).
Vous pouvez utiliser le paramètre (?) Dans votre sitemap XML, comme ?seo=true
ou des mots similaires.
Vous pouvez ajouter le même paramètre à la question ci-dessus et vous verrez s'afficher la même page,
http://webmasters.stackexchange.com/questions/102669/can-i-use-sitemap-xml-to-redirect-bots-to-seo-specific-urls?seo=true
Lorsque Googlebot voit votre URL de paramètre dans le plan du site et commence à explorer, il voit une balise de lien canonique, qui pointe vers l'URL autre que le paramètre. Ils vous affecteront par conséquent de préférence pour l'indexation de cette page Web (/foo/bar
) et non de l'actuelle (/foo/bar?seo=true
). .
N'hésitez pas à utiliser l'URL de paramètre dans le plan Sitemap, mais ne l'utilisez pas sur la structure de lien interne. J'ai vu de nombreuses pages Web indexer ce paramètre. C'est simplement parce que la priorité de Google que la structure de lien est comparable à une balise de lien canonique.
Avez-vous essayé d'utiliser une règle htaccess pour appliquer des paramètres supplémentaires $ _GET lorsque votre site Web est demandé par Google?
De ceci réponse de débordement de pile :
RewriteEngine On
RewriteCond %{HTTP_REFERER} ^(.*)\.google\.(.*) [NC]
RewriteRule ^(.*)$ https://www.my-site.it/$1 [L,R]