web-dev-qa-db-fra.com

Que peut causer "Découvert - actuellement pas indexé" dans le nouveau GWT

Le nouveau GWT montre les liens de sitemaps divisés en nouvelles catégories. Deux qui me confondent: 1. Découvert - actuellement non indexé 2. Exploré - actuellement non indexé

Quelles en sont les raisons possibles et y at-il des implications pour l’ensemble du site? Est-ce un signe de Google que je devrais envisager de les supprimer?

enter image description here

13
Noam

Cela fait simplement partie du processus. Vous n'avez rien à faire tant que vous ne recevez pas d'erreurs.

Pour comprendre les catégories, vous devez comprendre le fonctionnement de l'indexation, ce qui se fait pratiquement de manière continue:

  • Googlebot récupère une page, ce qui signifie télécharger son contenu sur des serveurs Google. Lorsque cela se produit, la page est analysée .
  • Il met plus tard le contenu de la page téléchargée dans l'index. Cela signifie que la page est indexée .
  • Lors de l'exploration de la page, il trouve like et les place dans une file d'attente. Ces liens sont découverts .

Alors:

  • Découvert non indexé signifie que le lien a été ajouté à la file d'attente de choses que Googlebot peut finalement ramper. Étant donné que le Web est virtuellement infini et qu'il existe une hiérarchisation, il risque de ne jamais y parvenir.
  • Exploration non indexée signifie que la page a été téléchargée sur des serveurs Google mais que son contenu n'a pas été inséré dans l'index.
7
Itai

Google peut découvrir et explorer vos pages, mais cela ne veut pas dire qu'il les indexera nécessairement.

Il est possible que Google n'indexe pas une page pour de nombreuses raisons. Peut-être qu'il a trouvé un contenu en double. Peut-être ne pense-t-il pas qu'il offre suffisamment de valeur pour des requêtes de recherche spécifiques. Google a peut-être trouvé quelque chose dans votre page qui ne lui plaisait pas.

Quelle que soit la raison, Google n'a pas encore décidé d'indexer certaines des pages découvertes et explorées sur votre site. Il est normal que certaines de vos pages ne soient pas indexées. Certaines des pages de mes sites ne sont pas indexées alors que leur contenu est supérieur à celui de nombreuses pages indexées et que leur nombre de liens internes est considérable. Le système d'indexation de Google est un algorithme d'apprentissage automatique. Et ainsi, il peut décider de ne pas indexer certaines pages parfois pour diverses raisons inconnues.

2
Michael d

Googlebot a sa propre file d'attente, basée sur différents paramètres. C'est le message à propos de ces URL qui sont même en file d'attente.

enter image description here

Aj Cohn a une sorte d’opinion amusante sur le sens de ce message:

Découvert - actuellement non indexé semble indiquer qu’il le voit dans votre sitemap, mais en se basant sur son apparence, il ne va même pas chercher à l'explorer. "Essentiellement, tu es laide!" Ou peut-être qu’il s’agit simplement d’une mauvaise efficacité d’analyse.

Franchement, je ne suis pas tout à fait sûr que la définition de découvert soit exacte, car la plupart des exemples d’URL ayant ce statut ont une date de dernière analyse. Cela semble contredire la définition fournie.

1
Evgeniy

Même si Google a découvert l'URL, il ne pensait pas que c'était assez important pour passer du temps à explorer. Si vous souhaitez que cette page reçoive un trafic de recherche organique, envisagez de la relier davantage à partir de votre propre site Web. Assurez-vous de promouvoir ce contenu auprès d’autres personnes dans l’espoir de pouvoir gagner des backlinks provenant de sites Web externes. Les liens externes vers votre contenu indiquent à Google qu'une page est précieuse et considérée comme fiable, ce qui augmente les chances de l'indexation.

0
ts.tsogtgerel