Aujourd'hui, j'ai tenté une recherche sur l'un de mes sites Web car je pensais avoir une page sur ceci ou cela et utiliser les éléments suivants dans ma recherche:
site:m2osw.com upload
J'ai commencé à regarder à travers les résultats et je ne pouvais pas trouver la page que je cherchais, mais j'ai remarqué qu'un de mes sites Web, nous allons dire "blah.m2osw.com", est apparu dans les résultats!
Cela a été une grosse surprise pour moi car ce site a depuis longtemps l'URL canonique correcte et pointe vers un domaine différent. Quelque chose comme ça:
<link rel="canonical"
type="text/html"
title="Home Page"
href="https://exdox.com"/>
Je pensais que chaque fois que vous auriez un canonique, cela demanderait à Google d’aller là-bas, mais maintenant, j’ai un doute et je pense que ces canoniques ne fonctionnent peut-être pas entre domaines? Je pensais avoir lu quelque part le meilleur moyen d'avoir un site de test n'importe où et de diriger le site de test vers le site réel afin que Google indexe le site réel et non le site de test ...
Savez-vous si ce canonique semble correct depuis https://blah.m2osw.com
ou s'il me faudrait ajouter autre chose (c'est-à-dire les robots = NOINDEX par exemple ...)
<meta rel="canonical" type="text/html" title="Home Page" href="https://exdox.com"/>
Ceci est une erreur. Cela devrait être un élément link
, pas un élément meta
. Par exemple:
<link rel="canonical" href="https://exdox.com">
Les attributs type
et title
dans ce contexte ne sont pas pertinents.
“Site:” renvoie-t-il des pages qui ne seraient autrement pas renvoyées?
Cependant, c'est correct. L'opérateur Google site:
renvoie en effet des URL qui ne seraient normalement pas renvoyées lors d'une recherche Google normale. L'élément de lien rel="canonical"
n'empêche pas nécessairement les deux pages d'être indexées , mais il indique à Google qu'il devrait renvoyer la page canonique dans les SERP lorsque cela est possible. (L'opérateur site:
renvoie les pages qui sont indexées .) Le respect de ces conseils par Google est toutefois du ressort de Google. Si Google ne pense pas (de par sa propre analyse) que l'URL déclarée "canonique" n'est pas réellement canonique (c'est-à-dire suffisamment similaire), elle pourrait être ignorée. De Google Webmaster Central Blog - Gestion de la duplication de contenu entre domaines légitime
Bien que l'élément de lien rel = "canonique" soit perçu comme un indice et non comme une directive absolue, nous essayons de le suivre lorsque cela est possible.
UPDATE: S'il s'agit d'un "site de test", alors oui, il ne devrait probablement pas être indexé du tout et la balise rel="canonical"
est principalement sans importance. Vous devez soit noindex
(balises robots meta
ou X-Robots-Tag
en-tête de réponse HTTP) ou bloquer en robots.txt
ou restreindre l'accès d'une autre manière (pwd, restriction IP, etc.). .
Savez-vous si ce canonique semble correct depuis https://blah.m2osw.com
C'est un exemple de question vraiment amusante;)
Jusqu'au point: