web-dev-qa-db-fra.com

Googlebot déclare que l'accès est refusé sur une ressource inexistante

La console de recherche Google me dit:

Accès refusé

Googlebot n'a pas pu analyser votre URL, car votre serveur requiert une authentification pour accéder à la page ou empêche Googlebot d'accéder à votre site.

L'URL ressemble à ceci:

https://www.example.com/.html

J'ai vérifié l'URL en question et mon serveur répond effectivement avec une réponse et une page 403 Forbidden.

Ce n'est pas une URL dans notre sitemap.xml et nous ne l'avons jamais utilisé pour rien. Pour autant que je sache, cela n'a jamais été valable.

J'ai essayé le bouton "Marquer comme fixe" dans la console de recherche Google, mais le problème est revenu.

Des idées comment gérer correctement sans aucun effet néfaste de "lier le jus?" Merci!

MODIFIER:

Je crois avoir trouvé le problème. Cette ligne dans notre fichier de configuration Apache:

  RewriteRule htm$ /$1.html [R=301,L]

Il n'y a pas de parenthèses regex, donc $1 sera toujours vide. Donc, je crois que le problème est causé par de vieux backlinks frappant des URL obsolètes .htm.

Je l'ai remplacé par ceci:

  RewriteRule (.*)\.htm$ /$1.html [R=301,L]
3
Timothy B.

Votre serveur est probablement configuré pour rejeter (avec "403 Forbidden") toutes les demandes de fichiers, par exemple. tous les fichiers commençant par un point. Ce sont généralement des fichiers de configuration, comme .htaccess et .htpasswd, qui ne doivent en aucun cas être accessibles au public. Celles-ci sont naturellement "cachées" sous Linux, mais pas sous Windows.

Si vous avez accès à la configuration du serveur, vous pouvez le configurer, mais sinon, il s'agit d'un comportement normal. Parfois, le serveur est configuré pour bloquer uniquement les fichiers .ht*, mais sinon, un bloc "tous les fichiers contenant des points" devrait être bloqué.

J'ai essayé le bouton "Marquer comme fixe" dans la console de recherche Google, mais le problème est revenu.

À moins que vous n'ayez modifié la réponse sur votre serveur, cela n'est pas "corrigé" et ne doit pas être marqué comme tel dans GSC.

Ce n'est pas un problème".

3
DocRoot

Cela peut être dû à une condition de réécriture d’URL erronée.

Pour l'ignorer pour le moment jusqu'à ce que vous trouviez la résonance de ce lien.

Vous pouvez faire une redirection 301 (déplacée de façon permanente) pour cette URL particulière vers la page d'accueil.

0
Jatinder Kumar