web-dev-qa-db-fra.com

Comment empêcher Googlebot d'accéder à une page spécifique

Je me fais spammer par cette adresse IP: 66.249.79.70, et ce site Web me dit que cela provient de Google: https://ipinfo.io/66.249.79.70

Il remplit une de mes zones de saisie et continue à poster. Je souhaite empêcher ce bot (avec l'adresse IP: 66.249.79.xxx) d'accéder à une page spécifique (par exemple, www.example.com/blocked.php) à l'aide d'un fichier . Htaccess, comment puis-je procéder? Cependant, je ne veux pas bloquer complètement l'adresse IP, car je ne doute pas qu'elle provienne de Google.

2
arunwebber

Comme cela semble être le vrai Googlebot, la méthode recommandée pour bloquer l'accès/l'exploration est d'utiliser /robots.txt:

User-agent: googlebot
Disallow: /blocked.php

Toutefois, si vous souhaitez toujours bloquer cette adresse IP à l'aide de .htaccess, vous pouvez procéder comme suit, en haut du fichier racine .htaccess:

RewriteEngine On
RewriteCond %{REMOTE_ADDR} =66.249.79.70
RewriteRule ^blocked\.php - [F]

Cela retournera un "403 Interdit" lorsqu'un utilisateur avec l'adresse IP ci-dessus tente d'accéder à /blocked.php. Notez que "l'utilisateur/bot" continue toujours essaie d'accéder à l'URL en faisant une demande, alors qu'avec robots.txt, ils ne devraient même pas faire la demande (en supposant qu'ils obéissent au fichier robots.txt " standard "; ce que fait Googlebot).

Toutefois, sachez que Googlebot peut analyser à partir d’adresses IP différentes, il faudra donc peut-être le mettre à jour ultérieurement.


Si vous vouliez bloquer la plage des adresses IP désignées par 66.249.79.xxx, vous pouvez remplacer ce qui précède condition par:

RewriteCond %{REMOTE_ADDR} ^66\.249\.79\.

Cependant, cela pourrait bloquer plus que Googlebot et ne pas réussir à bloquer Googlebot autrement qu'en vérifiant l'adresse IP spécifique ci-dessus (Googlebot n'explore pas nécessairement sur un bloc IP continu).

5
MrWhite