web-dev-qa-db-fra.com

Pourquoi les moteurs de recherche n'indexent-ils pas mon contenu?

Ceci est un wiki général de la communauté catch-all paire de questions et réponses destinée à répondre aux questions concernant les raisons pour lesquelles un site ou des contenus de sites spécifiques n'apparaissent pas dans les moteurs de recherche. résultats

Si votre question était fermée en tant que duplicata de cette question et que vous estimiez que les informations fournies ici ne fournissaient pas une réponse suffisante, veuillez ouvrir la discussion sur Pro Webmasters Meta .

Mon site (ou des pages spécifiques sur mon site) n'apparaissent pas dans les résultats des moteurs de recherche.

Pourquoi mon contenu n'est-il pas indexé et que puis-je faire à ce sujet?

28
danlefree

Il existe un certain nombre de raisons pour lesquelles votre contenu peut ne pas apparaître dans les résultats de moteur de recherche. Toutefois, il est important de noter que le champ index d'un moteur de recherche peut contenir des pages qu'il n'affiche pas dans son page de résultats .

Comment savoir si votre contenu est effectivement indexé

En fait, il peut être difficile de savoir si votre contenu est indexé.

  • Recherchez tous les documents de votre site et voyez combien sont répertoriés
    • Google: entrez site:example.com (où example.com est votre domaine, il ne doit y avoir aucun espace après les deux points.)
    • Bing: entrez site: example.com
    • Yahoo: entrez site: example.com (ou utilisez le formulaire de recherche avancée)
  • Recherchez un document spécifique par une phrase unique de huit à douze mots et recherchez cette phrase entre guillemets. Par exemple, pour rechercher ce document, vous pouvez choisir de rechercher "le nombre de raisons pour lesquelles votre contenu peut ne pas apparaître dans les résultats des moteurs de recherche".
  • En plus de ce qui précède, recherchez des mots-clés en utilisant inurl: et intitle:, vous pouvez essayer quelque chose comme, keyword with another keyword inurl:example.com pour afficher les pages indexées uniquement pour le domaine spécifié.

    • Connectez-vous aux outils du webmaster pour voir les statistiques du moteur de recherche lui-même sur le nombre de pages indexées sur le site.
    • Outils Google pour les webmasters - Ces informations sont disponibles sous "Santé" "" Statut de l'index ". Si vous avez soumis des cartes de site, vous pouvez également voir combien de documents de chaque fichier de carte de site ont été indexés.
    • Outils pour les webmasters

Dans certains cas, les documents peuvent ne pas sembler être indexés via l'une de ces méthodes, mais vous pouvez les trouver dans l'index en utilisant d'autres méthodes. Par exemple, les outils pour les webmasters peuvent indiquer que peu de documents sont indexés même lorsque vous pouvez rechercher leurs phrases et rechercher les documents dans le moteur de recherche. Dans un tel cas, les documents sont réellement indexés.

Comment le contenu devient indexé

Avant d'indexer le contenu des moteurs de recherche, ils doivent le trouver à l'aide d'un robot d'indexation Web. Vous devez vérifier les journaux de votre serveur Web pour voir si les robots d'exploration des moteurs de recherche (identifiés par leur agent utilisateur - par exemple Googlebot =, Bing/MSNbot ) visitent votre site.

Les moteurs de recherche plus volumineux tels que Google et Bing explorent généralement les sites fréquemment, mais le robot peut ne pas être au courant des nouveaux sites. Vous pouvez informer les moteurs de recherche de l'existence de votre site en vous inscrivant en tant que webmaster ( Google Outils pour les webmasters , Outils Bing Webmaster ) ou, si le moteur de recherche ne fournit pas cette fonctionnalité. , soumettant un lien à ses robots d'exploration (par exemple, Yahoo ).

Depuis combien de temps votre site/contenu est-il en ligne?

Les moteurs de recherche peuvent indexer le contenu très rapidement après sa découverte. Toutefois, ces mises à jour sont parfois retardées. Des moteurs de recherche plus petits peuvent également être beaucoup moins réactifs et prendre des semaines pour indexer du nouveau contenu.

Si votre contenu n'est en ligne que depuis plusieurs jours et ne contient aucun lien provenant d'autres sites (ou que ses liens proviennent de sites non consultés par les robots d'exploration), il n'est probablement pas indexé. Si votre site Web n’est pas en ligne depuis plus de quelques mois, il est possible que les moteurs de recherche ne lui fassent pas suffisamment confiance pour en indexer encore beaucoup de contenu.

Le contenu a-t-il été exclu par le webmaster?

Cette étape est particulièrement importante si vous prenez le site Web de quelqu'un d'autre et qu'il existe un problème avec une page ou un répertoire spécifique: recherchez robots.txt et robots META exclusions. et supprimez-les si vous souhaitez que les robots d'exploration indexent le contenu exclu.

Existe-t-il un problème technique empêchant l’indexation de votre contenu?

Si vous avez un site établi mais que du contenu spécifique n'est pas indexé (il n'y a pas d'accès au robot d'exploration sur les URL où se trouve le contenu), les outils pour les webmasters fournis par Google et Bing peuvent fournir des informations de diagnostic utiles.

La documentation de Google Erreurs d'analyse fournit des informations détaillées sur les problèmes courants rencontrés par les robots d'indexation Web qui empêchent l'indexation du contenu. Si vous utilisez Google Webmaster Tools, vous recevez une alerte si l'un de ces problèmes est détecté sur votre site. .

Corrigez les erreurs et les erreurs de configuration le plus rapidement possible pour vous assurer que tout le contenu de votre site est indexé.

Le contenu est-il de mauvaise qualité?

Les moteurs de recherche n'indexent pas la plupart des pages explorées. Ils n'indexent que le contenu de la plus haute qualité. Les moteurs de recherche n'indexeront pas le contenu si:

  • C'est un spam, un charabia ou un non-sens.
  • On le trouve ailleurs. Lorsque les moteurs de recherche trouvent le contenu en double, ils ne choisissent qu'un seul des doublons à indexer. C'est généralement l'original qui a plus de réputation et de liens.
  • Il est maigre Il faut plus que quelques lignes de texte original. De préférence beaucoup plus. Les pages créées automatiquement avec peu de contenu, comme une page pour chacun de vos utilisateurs, ne seront probablement pas indexées.
  • Il n'a pas assez de réputation ou de liens. Une page peut être enfouie trop profondément dans votre site pour être classée. Toute page sans liens externes et comportant plus de quelques clics de la page d'accueil a peu de chances d'être indexée.

Certains de vos contenus sont-ils indexés, mais pas tous?

Si votre site contient des centaines de pages, Google ne choisira presque jamais d'indexer chaque page. Si votre site compte des dizaines de milliers de pages, il est très courant que Google choisisse de n'indexer qu'une petite partie de ces pages.

Google choisit le nombre de pages à indexer sur un site en fonction de la réputation générale du site et de la qualité du contenu. Google indexe généralement un pourcentage plus élevé d'un site au fil du temps, à mesure que la réputation du site grandit.

35
danlefree

Je pense que je n'ai pas besoin de répéter la même chose que celle indiquée ci-dessus, cependant si vous n'êtes pas familier avec le nouvel outil, voici la façon de le vérifier ci-dessous.

Vous pouvez vérifier si votre fichier robot.txt ne bloque pas le contenu en accédant à ancien Google Webmaster'stesteur de robots.txt Outil

enter image description here

Console de recherche Google (nouvelle version)

La console de recherche Google fournit des informations précieuses par rapport à l'ancienne version. Recherchez les problèmes directement depuis la console de recherche Google, que votre page soit explorée ou non, indexée ou non, en direct ou non, ainsi que les problèmes éventuels.

  1. Connectez-vous à votre site Web Console de recherche Google
  2. Si vous avez plusieurs propriétés de domaine, assurez-vous d'avoir sélectionné celle qui vous convient.

Outil obsolète dans Google Webmaster

This is outdated now

Voici comment vous pouvez passer par la nouvelle console de recherche

New Google Search Console

1
Deepak Mathur

Si vous avez un fichier robots.txt dans votre répertoire racine, cela pourrait indiquer à Google de ne pas indexer votre site.

Avez-vous vérifié pour cela?

Habituellement, il est prudent de simplement supprimer (ou renommer) ces fichiers, car on dirait que vous voulez être indexé.

IMPORTANT: Cela peut être un problème si vous essayez de faire fonctionner Google Adsense sur votre site.

Peu importe où vous mettez votre code spécial, si vous n'êtes pas indexé, on vous dira que votre site est en panne afin qu'ils ne puissent pas le vérifier.

0
SDsolar