J'ai un ensemble de pages dans les profils utilisateur qui, en fonction des actions de l'utilisateur, peuvent ou non contenir des informations. C'est essentiellement un flux de commentaires de l'utilisateur. Certains utilisateurs ajoutent des commentaires, d'autres non.
Les Webmasters de Google ont marqué les pages sans commentaires comme "Soft 404". Maintenant, ces pages ne sont pas des 404 car elles sont censées exister, mais elles ne possèdent pas encore de données. Quel est le code de statut http correct pour gérer ces types de pages existants, mais peut-être/ne pas contenir de données à l'avenir?
Le rapport Soft-404 rapporté (une page qui ressemble peut-être à un 404 mais renvoie un état 200 OK) est en réalité un rapport "utile" fourni par GWT. "Hé, votre site a servi une page qui n'a vraiment rien dessus?!" Ce n'est pas nécessairement un problème, à moins que votre page contienne un contenu valide que vous souhaitez indexer, ou que ce soit un vrai 404 (retourne un statut 404).
Comme vous l'avez dit, ces pages "ne contiennent aucune donnée", elles ne sont donc pas indexables de façon réaliste. Quand/si la page obtient du contenu, son statut devrait changer. Il est peu probable qu'un Soft-404 apparaisse dans les résultats de la recherche.
Quel est le code de statut http correct pour gérer ces types de pages existantes
Si une page existe, elle devrait renvoyer un statut 200 OK.
Quel est le code de statut http correct pour gérer ces types de pages existants, mais peut-être/ne pas contenir de données à l'avenir?
Si aucune donnée n'est présente, je spécifierais un noindex, suivez la directive. PHP exemple:
<?php if(empty($posts)): ?>
<meta name="robots" content="index, follow">
<?php endif; ?>
Lorsque le contenu est ajouté, la balise méta ci-dessus disparaît et Google est libre d'indexer la page. Cette méthode peut empêcher l’indexation d’un contenu mince ou inexistant.
En plus du manque total de données dans les zones de contenu ou de chaînes répétées dans les espaces vides, "Not Found" semble être le déclencheur général de Word pour soft 404.
Si cette chaîne existe, vous pouvez essayer de l'enlever et de la remplacer par d'autres drôles, comme "Ce mec n'est évidemment pas un commentaire Pioneer" ou "Les commentaires ne vont pas s'écrire vous-même ..." ou "Fatigué de regarder des pages blanches? Discutez avec ce mec. " ou "Si vous pouvez faire en sorte que ce mec ne vous donne pas un popsicle" - essayez de faire en sorte que 10+ d'entre eux changent entre les pages vues.
De cette façon, cela variera d’une page à l’autre, sera randomisé pour les cartouches vides et amusera/séduira les lecteurs.
Et pour gérer les robots, Wexford suggère noindex, ce qui est correct. Cependant, Google continuera à consulter, classer et mémoriser les pages. Mieux vaut travailler pour réduire son soft 404 pour commencer.