web-dev-qa-db-fra.com

"Site:" renvoie-t-il des pages qui ne seraient autrement pas renvoyées?

Aujourd'hui, j'ai tenté une recherche sur l'un de mes sites Web car je pensais avoir une page sur ceci ou cela et utiliser les éléments suivants dans ma recherche:

site:m2osw.com upload

J'ai commencé à regarder à travers les résultats et je ne pouvais pas trouver la page que je cherchais, mais j'ai remarqué qu'un de mes sites Web, nous allons dire "blah.m2osw.com", est apparu dans les résultats!

Cela a été une grosse surprise pour moi car ce site a depuis longtemps l'URL canonique correcte et pointe vers un domaine différent. Quelque chose comme ça:

<link rel="canonical"
      type="text/html"
      title="Home Page"
      href="https://exdox.com"/>

Je pensais que chaque fois que vous auriez un canonique, cela demanderait à Google d’aller là-bas, mais maintenant, j’ai un doute et je pense que ces canoniques ne fonctionnent peut-être pas entre domaines? Je pensais avoir lu quelque part le meilleur moyen d'avoir un site de test n'importe où et de diriger le site de test vers le site réel afin que Google indexe le site réel et non le site de test ...

Savez-vous si ce canonique semble correct depuis https://blah.m2osw.com ou s'il me faudrait ajouter autre chose (c'est-à-dire les robots = NOINDEX par exemple ...)

4
Alexis Wilke
<meta rel="canonical"
  type="text/html"
  title="Home Page"
  href="https://exdox.com"/>

Ceci est une erreur. Cela devrait être un élément link, pas un élément meta. Par exemple:

<link rel="canonical" href="https://exdox.com">

Les attributs type et title dans ce contexte ne sont pas pertinents.

“Site:” renvoie-t-il des pages qui ne seraient autrement pas renvoyées?

Cependant, c'est correct. L'opérateur Google site: renvoie en effet des URL qui ne seraient normalement pas renvoyées lors d'une recherche Google normale. L'élément de lien rel="canonical" n'empêche pas nécessairement les deux pages d'être indexées , mais il indique à Google qu'il devrait renvoyer la page canonique dans les SERP lorsque cela est possible. (L'opérateur site: renvoie les pages qui sont indexées .) Le respect de ces conseils par Google est toutefois du ressort de Google. Si Google ne pense pas (de par sa propre analyse) que l'URL déclarée "canonique" n'est pas réellement canonique (c'est-à-dire suffisamment similaire), elle pourrait être ignorée. De Google Webmaster Central Blog - Gestion de la duplication de contenu entre domaines légitime

Bien que l'élément de lien rel = "canonique" soit perçu comme un indice et non comme une directive absolue, nous essayons de le suivre lorsque cela est possible.

UPDATE: S'il s'agit d'un "site de test", alors oui, il ne devrait probablement pas être indexé du tout et la balise rel="canonical" est principalement sans importance. Vous devez soit noindex (balises robots meta ou X-Robots-Tag en-tête de réponse HTTP) ou bloquer en robots.txt ou restreindre l'accès d'une autre manière (pwd, restriction IP, etc.). .

5
MrWhite

Savez-vous si ce canonique semble correct depuis https://blah.m2osw.com

C'est un exemple de question vraiment amusante;)

Jusqu'au point:

  • canonique est juste une recommandation. Cela signifie: Google décidera lui-même du contenu à afficher en tant que résultat de recherche - URL canonisée ou canonique.
  • le SERP Google construit pour une requête de site affiche les URL d'un domaine donné, qui sont pertinentes pour la partie de requête significative. Il pourrait apparaître à la fois des URL canoniques et canoniques - en fait, elles sont toutes les deux pertinentes pour une requête donnée, canoniques - plus, canonisées - moins.
  • Dans la requête "normale", Google s'abstiendrait d'afficher les URL canonisées en raison de leur moindre pertinence.
2
Evgeniy