web-dev-qa-db-fra.com

404 ou 302 Redirect - que faut-il utiliser pour une url qui pourrait être utilisée dans le futur mais non disponible pour le moment?

Mon site répertorie les blogs comme celui-ci

example.com/?status=blog&id=number

Je n'ai plus que 3 blogs (id=1, id=2 et id=3). J'ai vérifié mes fichiers de log et j'ai vu que les robots de recherche manipulaient les URL et se crawlaient. Comme

example.com/?status=blog&id=4

L'URL ci-dessus affiche simplement un message "Introuvable".

Quelle est la meilleure pratique du point de vue du référencement pour gérer cela?

Options que je considère par ordre de préférence:

  1. Utiliser un statut 404 avec une page personnalisée
  2. 302 au dernier blog disponible (par exemple, id=3 dans ce cas)
  3. Continuez simplement à afficher le message "Introuvable".
  4. Ne fais rien.

Veuillez noter que je peux écrire un autre blog et que id=4 peut être disponible à ce moment-là. Je suis ouvert à toute autre suggestion.

1
nandu kk

Ma seule préoccupation serait de savoir comment les bots trouvent ou manipulent les URL pour trouver les URL non disponibles. Pour moi, du point de vue du référencement, il s’agit d’une question complexe qui a potentiellement un impact sur les performances et la qualité perçue des sites Web.

Si ce problème avait été résolu, nous n'aurions pas à prendre en compte ces considérations. Le cas échéant, essayez de corriger les instructions données aux robots pour analyser votre site Web et la façon dont vous extrayez le contenu de la base de données pour éviter de générer du contenu automatisé ou des blogs sans contenu.

Après avoir vérifié votre code pour comprendre comment un bot peut demander de telles URL, essayez d’ajouter quelque chose comme ceci: Autoriser règles avant tout Interdire à votre fichier robots.txt:

.

.

Allow: /?status=blog&id=1/

Allow: /?status=blog&id=2/

Allow: /?status=blog&id=3/

Disallow: /*&id*

Dans la phase de développement de tout site Web, je recommande toujours aux gens de récupérer du contenu "à venir", de configurer la console de recherche Google et même d’analyses, avant de publier un nouveau blog/site. Cela permet d'explorer et d'indexer le nouveau site Web, ce qui est utile à des fins de référencement.

Si pour une raison quelconque vous ne pouvez pas résoudre le problème de l'exploration, je vous suggère de ne rien faire des solutions ci-dessus. En prenant le premier choix, vous générerez potentiellement un nombre presque infini de pages d'erreur 404, ce qui, du point de vue du référencement, est un signe de maintenance médiocre, de mauvaise qualité de l'utilisateur et d'une mauvaise expérience utilisateur. 302 est peut-être une bonne alternative, mais cela demandera beaucoup de ressources à vous et aux serveurs des robots (nous ne voulons pas qu’ils se fâchent contre nous, souvenez-vous de Skynet). Puisqu'il s'agit probablement d'un contenu/URL généré automatiquement, je suggérerai de mettre en œuvre l'approche de balise méta noindex, nofollow et de récupérer le code de réponse http 200. Vous pouvez également ajouter noindex, nofollow aux liens pointant vers les blogs. Eh bien, vous pourriez dire: "Attendez une minute, 200 réponses d’en-tête acceptent toujours des ressources", c’est vrai, mais croyez que les réponses 3xx coûtent plus cher.

1
Raul Reyes