Je viens de rencontrer une erreur dans Google Webmaster Tools que je n'avais jamais vue auparavant. Je gère le site Web de mon groupe communautaire local (je joue du trombone). Une des pages du site contient une liste de nos prochaines performances. Il est alimenté par un plugin d'événements WordPress qui utilise une base de données d'événements à venir entrés via l'interface d'administration. Nous venons de terminer nos concerts d'été et d'automne et notre prochaine représentation sera notre concert de Noël. Je n'avais pas encore ajouté cela au site Web, donc il n'y a aucun événement à venir sur la page. En fait, le le texte sur la page dit :
Aucun événement à venir répertorié sous Performance. Consultez les événements passés pour cette catégorie ou consultez le calendrier complet.
Ensuite, dans les outils pour les webmasters de Google, cette page s’affiche en tant que "soft 404":
La page renvoie un statut 200 et Google indique qu'il 404 est "souple". Je n'aurais pas imaginé que Googlebot soit aussi sophistiqué pour analyser cette phrase en particulier. Googlebot est-il en mesure de détecter que le texte de la page indique qu'il n'y a actuellement aucun contenu et de le traiter comme une page 404 à cause de cela?
Si Google traite cette page comme un fichier 404 logiciel en raison du texte de la page, cela signifie-t-il que, comme pour les pages 404 standard, la page ne s'affiche pas dans les résultats de recherche?
Il semble que Google appelle cette page un "soft 404" basé sur le texte de cette page et le manque d’autre contenu. J'ai mis à jour la page en programmant de nouvelles performances. Les outils pour les webmasters de Google ne classent plus cette page comme étant un soft 404:
Il semble que l'URL soit une version non-www
, il est recommandé d'utiliser une réécriture externe pour forcer la version www
. Il se peut que votre site soit en réalité dupliqué aux yeux de Google et que la version non-www
apparaisse en double. Essayez de demander la même page avec www
et sans elle, si vous obtenez un résultat, vous présentez des doublons Google. Vous souhaitez également vérifier la présence de liens internes vers les versions de non-www
et corriger manuellement ces liens afin d'inclure le www
.
Remarque: je voudrais également voir le lien de l'onglet sur cet écran. Essayez d’explorer cette page en tant que Googlebot et publiez les résultats. J'ai vu Google faire des bêtises dans GWMT avec des URL. Le plus d'informations, mieux c'est.
Voici une liste des étapes à suivre pour corriger les soft 404 afin d’aider Googlebot et vos utilisateurs:
Pour les soft 404, déterminez si l'URL:
- Contient le contenu correct et renvoie correctement une réponse 200 (pas réellement un soft 404)
- Si 301 redirige vers une URL plus précise
- N’existe pas et doit renvoyer une réponse 404 ou 410
Confirmez que vous avez configuré la réponse HTTP appropriée en utilisant Fetch en tant que Googlebot dans les Outils pour les webmasters.
Si vous retournez maintenant des 404, vous pouvez personnaliser votre page 404 pour aider vos utilisateurs. widget 404 personnalisé peut vous aider.
J'espère que cela lien de Google donnera plus de détails.
Voici un source de "soft 404" sont expliqués.
Extrait:
Un "soft 404" se produit lorsqu'un serveur Web répond avec un code de réponse 200 OK HTTP pour une page qui n'existe pas plutôt que le 404 non trouvé approprié. Les Soft 404 peuvent limiter la couverture d'analyse d'un site par les moteurs de recherche, car ces URL en double peuvent être analysées au lieu de pages au contenu unique.
Je pense que Googlebot considère que votre page est dupliquée par une autre (probablement parce que le contenu est très fin dans votre page). C'est pourquoi Google ne passe pas son temps à indexer votre page (comme il le fait avec les pages de contenu en double). De plus, je ne pense pas que Googlebot puisse comprendre la signification de votre phrase dans la page.
Dans ce cas, Google conseille d'appliquer une redirection 301 vers une autre page ou d'appliquer une réponse HTTP 404 ou 410.