J'ai un fichier 404.html
Personnalisé sur mon site Web qui est servi avec un code d'état 404 lorsqu'aucune URL n'est trouvée, des trucs standard. Mais si vous visitez le chemin exact /404.html
Sur le serveur, le serveur dit "hé, il y a en fait un fichier là-bas" et vous montre la page 404 mais sans le code d'état 404.
Je voulais m'assurer que le chemin /404.html
Ne soit pas indexé accidentellement dans la recherche, j'ai donc ajouté une balise <meta name="robots" content="noindex">
.
Bien sûr, cela signifie que mes URL inexistantes ont également la balise meta noindex
Dans le cadre de la page 404. Existe-t-il un moyen que la présence de cette balise meta noindex
Puisse provoquer un problème pour les moteurs de recherche/robots d'exploration, ou cette configuration est-elle totalement correcte?
Il n'y a aucun problème à avoir un meta noindex
tag sur la page 404, pour empêcher l'indexation de 200 réponses OK.
S'il s'agissait d'une page PHP alors vous pourriez évidemment envoyer simplement un en-tête 404 Not Found dans le cadre de la réponse standard - pour vous assurer qu'il toujours renvoie un 404.
Vous pouvez également utiliser .htaccess
(mod_rewrite) pour forcer toute demande directe à 404.html
pour déclencher également un 404:
RewriteEngine On
RewriteCond %{ENV:REDIRECT_STATUS} ^$
RewriteRule ^404\.html$ - [R=404]
La directive RewriteCond
qui vérifie le REDIRECT_STATUS
La variable d'environnement est requise si vous souhaitez que votre 404 personnalisé soit servi (afin qu'il ne s'applique qu'aux demandes directes). Sinon, il y aura probablement une boucle de réécriture (erreur 500) lors de la tentative de diffusion du document d'erreur personnalisé et vous verrez la réponse 404 générée par le serveur standard (mais c'est toujours une 404).