web-dev-qa-db-fra.com

Google continue à explorer les pages qui n'existent pas

J'ai créé un nouveau site Web simple qui a été mis en ligne il y a environ un mois et demi (en remplacement du dernier). Le site contient de nouvelles pages, comme par exemple le balisage de navigation:

<div class="header">
    <div class="navigation menu">
        <ul>
            <li><a href="index.php">Home page</a></li>
            <li><a href="products.php">Products</a></li>
            <li><a href="reference.php">Reference</a></li>
            <li><a href="about_us.php">About us</a></li>
            <li><a href="contact.php">Contact</a></li>
        </ul>
    </div>
</div>

Le problème est que Google crawlers continue à rechercher les anciennes pages que j'ai supprimées et qui ne se trouvent pas sur le serveur.

Je continue à supprimer erreurs d'analyse (marqué comme étant corrigé) dans les outils pour les webmasters, mais les robots continuent à essayer d'analyser ces pages.

Je crois que la dernière version du site Web est mise en cache quelque part, y a-t-il un moyen de le supprimer? (Je n'ai pas beaucoup d'expérience avec les outils Google pour les webmasters.)

2
Vucko

Cela va se passer pendant très longtemps. D'autres sites peuvent renvoyer à d'anciennes URL, ce qui incitera Google à les explorer et/ou votre site pourrait tout simplement avoir des problèmes (aux yeux de Google) et vous laisserait le doute sur le retour des pages. Quoi qu'il en soit, Google continue à explorer les anciennes pages pendant longtemps. Ce serait bien pire pour Google de cesser brutalement d'explorer vos pages après avoir reçu un lot de 404.

Si les pages n'existent pas vraiment et qu'il n'y a pas d'alternative, il est correct de renvoyer un 404 (non trouvé). Vous pouvez également renvoyer un 410 (Gone) à la place pour ces pages qui ne seront jamais renvoyées - cela indique nettement à Google que les pages ne sont pas renvoyées.

Notez que servir un 404 (ou 410) pour ces pages et les signaler comme telles dans GWT n’est pas nécessairement une mauvaise chose et n’affectera pas votre site de manière préjudiciable. Ceci est un rapport privé pour votre bénéfice.

Cependant, ce qui peut être mauvais pour le référencement, c’est s’il existe d’autres sites pointant sur votre ancienne page qui auraient autrement adopté le PageRank. En renvoyant un 404, ces sites ne pourront plus passer ce PageRank. Si vous avez d'autres pages pour celles qui ont été supprimées, 301 sont redirigés vers le nouvel emplacement afin de préserver votre classement, d'aider les moteurs de recherche à réindexer votre contenu et ... de satisfaire vos utilisateurs. Mais si vous avez simplement supprimé l'ancien contenu et ne l'avez pas remplacé, vous devez être prêt à accepter le succès potentiel du référencement.

3
MrWhite

Peut-être pas la meilleure ou la bonne façon de faire cela, mais j'avais le même problème. Ce que j’ai finalement fait, c’était une redirection vers la page d’accueil ou vers un site 404. Il me faudrait vérifier si j’ai toujours la redirection, mais je n’ai plus l’erreur d’analyse.

0
Rob