web-dev-qa-db-fra.com

Les pages d'erreur sont-elles indexées?

Je viens de commencer à mettre des pages d'erreur personnalisées sur mon site. Mais ensuite, j'ai commencé à me demander si Google indexerait ces pages d'erreur. J'ai cherché cela et je n'ai rien eu, même pas cherché sur ce site, alors j'ai fait mes recherches. Google indexera-t-il mes pages d'erreur?

3
anonymous

Les pages qui renvoient un code 404 introuvable ou 410 disparu ne sont pas indexées par les moteurs de recherche.

Depuis le centre Google pour les webmasters:

Ce code de réponse HTTP indique clairement aux navigateurs et aux moteurs de recherche que la page n’existe pas. Par conséquent, le contenu de la page (le cas échéant) ne sera ni analysé ni indexé par les moteurs de recherche. Nous vous recommandons de toujours renvoyer un code de réponse 404 (Introuvable) ou 410 (Terminé) en réponse à une demande de page inexistante.

Plus d'informations peuvent être trouvées ici

Maintenant, si vous voulez supprimer des pages de Google, vous pouvez utiliser deux techniques.

  1. Utilisez le code d'erreur 404 ou 410
  2. Utiliser la balise méta noindex

Les codes d’erreur techniques ou la balise noindex sont utiles, mais pour les autres utilisateurs.

  1. Si vous avez des pages existantes, mais que vous ne voulez pas qu'elles soient indexées , par exemple privacy.html, vous devez ajouter la balise méta noindex.

    <meta name="robots" content="noindex">
    

    La prochaine fois que Google explorera ces pages, il les supprimera des résultats de la recherche. Plus d'informations sur la manière dont Google traite les balises méta Noindex peuvent être trouvées ici

  2. Si vous avez des pages qui existaient dans le passé et qui n'existent plus (par exemple, vous les avez supprimées), vous devez renvoyer un code d'erreur 404 ou 410 et n'utilise pas la balise méta noindex. Aucune balise méta index, Google dira que la page existe, mais je ne veux pas qu'elle soit indexée

    Le code HTML que vous renvoyez avec le code d'erreur ne joue aucun rôle, mais le code d'erreur que vous renvoyez est important.

    Google revérifiera ensuite la page et verra que le code n'est pas 200 mais 404 ou 410 et supprimera la page des index.

    Notez que Google doit redéfinir une page qui renvoie 404 ou 410 plusieurs fois avant de la supprimer complètement de l'index.

    Ceci est fait pour empêcher un webmaster de commettre une erreur et renvoyer des codes erronés par inadvertance, par exemple un dysfonctionnement de la base de données.

Pour résumer:

  • Sur les pages supprimées ou les URL n'ayant jamais existé, vous devez renvoyer un code d'erreur 404 ou 410 et ne pas utiliser la balise meta noindex, et attendre que Google les supprime. à partir des résultats de la recherche.
  • Sur les pages existantes que vous ne souhaitez pas qu'elles soient indexées, vous devez utiliser la balise meta noindex
3
krokola

La meilleure solution pour s’assurer qu’ils ne sont pas indexés est d’ajouter

<meta name="robots" content="noindex">

Si Google rencontre uniquement les pages en tant que pages d'erreur, il ne doit pas les indexer. Cependant, si elles étaient accessibles via le plan du site ou si elles comportaient des liens entrants, elles pourraient être indexées. Il est conseillé d'ajouter simplement la balise noindex pour éviter cela.

3
Jaryd Buggins