web-dev-qa-db-fra.com

Un site Web peut-il respecter les normes sans un seul lien renvoyant le statut 404?

D'après les outils de référencement de woorank.com, j'ai lu que ce n'est pas la meilleure pratique pour un site Web de ne pas avoir de page d'erreur 404 personnalisée. Mais voici pourquoi je ne l'ai pas sur un domaine.

Actuellement, une personne et moi-même gérons le contenu du domaine, ce qui inclut la génération et la suppression automatiques des URL.

Par exemple, supposons que le site concerne la nourriture et que l’autre personne décide d’ajouter des fruits au site. Ensuite, une page est générée automatiquement et cette URL est ensuite créée et accessible:

http://example.com/fruit

Puis il ajoute des pommes et des oranges. Ces URL sont ensuite créées:

http://example.com/fruit/apples
http://example.com/fruit/oranges

Puis il ajoute des légumes. Ces URL sont ensuite créées:

http://example.com/vegetables

Puis il ajoute des carottes et du céleri. Ces URL sont ensuite créées:

http://example.com/vegetables/carrots
http://example.com/vegetables/celery

Par conséquent, ces URL au total existeront:

http://example.com
http://example.com/fruit
http://example.com/fruit/apples
http://example.com/fruit/oranges
http://example.com/vegetables
http://example.com/vegetables/carrots
http://example.com/vegetables/celery

Plus tard, il décide de ne plus avoir de carottes ni d’oranges. Cela signifie que les URL accessibles sont maintenant:

http://example.com
http://example.com/fruit
http://example.com/fruit/apples
http://example.com/vegetables
http://example.com/vegetables/celery

et ceux-ci devraient retourner le statut 410:

http://example.com/fruit/oranges
http://example.com/vegetables/carrots

et dans un sens idéal, le reste des URL non répertoriées devrait renvoyer le statut 404.

Lorsqu'il décide de supprimer une catégorie d'aliments ou un aliment, il ne sera probablement plus jamais ajouté à l'avenir.

La seule façon de tirer cela correctement est de configurer mod_rewrite pour qu'il retourne le statut 404 par défaut aux URL non répertoriées. Les URL récemment supprimées doivent être stockées dans une base de données afin d'être vérifiées avant de renvoyer un 404.

Ma ligne dans .htaccess ressemblerait à ceci:

RewriteRule ^(.*)/(.*)$ /loadpage.php?foodcategory=$1&food=$2 [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^$ /homepage.php [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.*)$ - [R=404,L]

Ma question est alors la suivante ...

Est-il acceptable (standard) de donner une page avec le code d’état http 410 pour un domaine entier pour les URL qui n’existent pas ou dois-je donner un code d’état http 404 pour les URL qui n’existaient pas auparavant sur le domaine et base de données avec les anciennes URL qui sont supprimés et leur donner le statut http 410?

1
Mike

Un 404 ou 410 convient pour toute page ou URL qui n'existe pas. Vous n'êtes pas obligé de mélanger les deux, vous pouvez en choisir un seul.

Si la page a disparu, un 410 convient certainement, cependant, un 404 est automatique (et donc traditionnel) et correct. Sachez simplement que Google, par exemple, essaiera plusieurs fois avant de supprimer toute adresse URL de l'index. Dans l'intervalle, il sera supprimé des SERP pour tout ce qui ne semble pas être temporaire, c'est-à-dire répété plusieurs fois de manière cohérente. Lorsqu’un 404 est publié, Google échantillonne parfois plus souvent une page ou, dans le cas de plusieurs pages 404, échantillonne un ensemble plus large afin de s’assurer qu’il n’y aura pas de modification de site en gros à sa connaissance.

Je dirais que ce qui est le plus facile. Si vous pouvez 410 toutes les URL inexistantes, alors ce serait génial - sinon, optez pour un 404 qui devrait être plus facile mais qui nécessite globalement plus de tentatives infructueuses pour le même effet.

1
closetnoc

Selon Google et dans le contexte du référencement, dans le cas du 404, la page est conservée 24 heures avant d'être considérée comme supprimée. Dans le cas de 410, la page est considérée comme supprimée immédiatement.

Je suppose que pour un grand magasin en ligne, cela peut faire une différence pour les pages de produits qui ont disparu. Si le produit est interrompu, un 410 serait normal. En fait, il est possible de coder 410 codes http pour une catégorie de pages dans wordpress en utilisant php ou le plugin 410.

référence de Google: https://www.youtube.com/watch?v=xp5Nf8ANfOw

0
Nicolas Guérinet