web-dev-qa-db-fra.com

Google est-il responsable de th1s_1s_a_4o4.html?

J'ai consulté les archives du site mais je n'ai pas pu trouver de réponse à ma question. Récemment, j'ai recherché qui est responsable de th1s_1s_a_4o4.html, mais certains forums semblent suggérer que Google est derrière.

Dois-je faire quelque chose en particulier avec ce code, car je génère régulièrement des journaux d'erreurs et que je le vois plusieurs fois par semaine? J'exécute un fichier 404.php personnalisé dans mes thèmes WordPress et lorsque je vérifie mon répertoire 404.php avec var_dump(http_response_code());, je reçois un résultat int(404) réussi.

Dois-je faire autre chose et est-ce que ce serait mal de bloquer ceci dans mon fichier robots.txt, quelque chose comme:

User-Agent: *
Disallow: /th1s_1s_a_4o4.html

Est-ce que retourner un message pour un 404 affecte votre rang?

Trouvé ceci sur une page Facebook de verrouillage de site.

SiteLock - Sécurité du site Web Merci pour l'info. Après avoir examiné votre compte, vous avez un scanner gratuit fourni par votre hébergeur. Afin que nous puissions vérifier que votre page 404 est propre, nous essayons en réalité de provoquer une erreur 404 en adressant une demande à une page inexistante (par exemple, th1s_1s_a_4o4.html). S'il vous plaît laissez-nous savoir si vous avez d'autres questions!

5
Michael

Peu importe ce qui frappe votre site avec cette URL, il ne semble pas que ce soit Google. J'ai vérifié les journaux de mon serveur et aucun de mes sites n'a eu cette URL demandée le mois dernier. S'il s'agissait de Googlebot, j'attendrais de ce que theme demande une telle URL sur tous les sites analysés.

https://productforums.google.com/forum/#!topic/webmasters/MkfVFWOTl5I a un agent utilisateur provenant d'un tel hit: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/6.0)" qui n'est pas un agent utilisateur que Googlebot utiliserait utilisation.

Un répondeur de ce fil vérifie l'adresse IP du client et détermine que ce n'est pas une adresse IP utilisée par Google.

Il y a un indice là-bas sur pourquoi cela se produit cependant. Dans le cas où il a été posté, il y avait une URL de renvoi avec la demande: http://www.google.com/url?url=www.<censored-spam-site>.ca&yahoo.com. Il me semble qu’il s’agit d’un polluposteur qui tente d’obtenir du trafic sur son site en envoyant du spam à votre rapport 404 et à votre rapport de parrainage. Ils utilisent Google comme redirecteur pour donner à l'URL un aspect plus légitime. Ajoutons également yahoo juste pour faire bonne mesure.

Il est prudent d’ignorer le spam comme celui-ci.

2
Stephen Ostermiller

J'en ai eu un heurté ma porte. Qui que ce soit, ce n'est certainement pas Google. il l'utilise mais on dirait qu'il a piraté google et yahoo en fonction de la visite. Je bloque juste ces adresses IP quand ils font une requête étrange ou une requête à des choses qu'ils ne devraient pas voir.

  here is that output from my visitors, feel free to block him:

   IP: 67.212.188.154
   URL: /th1s_1s_a_4o4.html 
   Bytes: 321 
   status: 301
   referred:  http://www.google.com/url?url=www.mywebsite.com&yahoo.com 
    UserAgent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/6.0)
0
drtechno