web-dev-qa-db-fra.com

Google signale l'injection d'URL - mais l'URL signalée renvoie 404 même lorsqu'il est récupéré en tant que Google

Hier, nous avons découvert que dans Google Search, le site Web est signalé comme suit:

"Ce site peut être piraté."

C'est un site Web Joomla . Dans outils pour les webmasters , il existe un rapport sur les injections d'URL . Il n'y a qu'une seule URL qui y apparaît et cela ressemble à une page .html url dans le répertoire /cli de Joomla. J'ai suivi l'URL et tout ce que j'ai obtenu était une erreur 404 pour cette page. J'ai inspecté le répertoire cli via FTP et je n'y ai également rien trouvé.

Nous hébergeons sur un serveur dédié dédié avec un hôte de grande réputation et expérimenté. Nous mettons beaucoup sur la sécurité. Par exemple, nous exécutons quotidiennement des analyses de logiciels malveillants et des analyses de modifications de fichiers , nous avons: pare-feu strict règles et WAF activé, nous avons dernière version de Joomla installée et toutes les extensions que nous avons installées sont signalées comme non vulnérables. D'après les rapports des scanneurs, nous n'avons constaté aucune modification inattendue dans la structure des fichiers/répertoires. J'ai examiné le htaccess - rien de suspect ici.

J'ai essayé d'extraire en tant que Google l'URL indiquée. D'abord, il n'était pas autorisé, car le répertoire cli est interdit via robots.txt . J'ai changé le fichier temporaire robots.txt, puis j'ai essayé de nouveau et le robot Google a signalé qu'il s'agissait d'une page 404 .

J'ai également effectué la recherche site:example.com, mais cette URL n'apparaît pas dans les résultats - aucune autre URL inattendue n'y est également apparue.

J'ai également essayé d'accéder à cette URL via pingdom , gtmetrix , a VPN connexion utilisant quelques adresses IP différentes et tout ce que je reçois est un 404.

Donc, après avoir tout fait , Google le suggère, et plus encore, j'ai soumis une demande de révision dans des outils pour les webmasters .

Cependant, aujourd’hui, j’ai vérifié à nouveau le rapport sur les problèmes de sécurité des webmasters et que cette même URL s’affiche avec la date du dernier jour détecté. J'ai refait tous les tests à partir de zéro, mais cette URL n'existe toujours pas sur notre site Web. J'ai de nouveau soumis une demande de révision - demandant des commentaires et d'autres indices à Google - par exemple. une page de référence - vous ne savez pas si Google est en mesure de répondre via ce canal.

Mais comment Google peut-il voir cette URL comme une page existante de notre site Web? Ajoutez à cela que notre répertoire cli est interdit via robots.txt.

Aussi, que dois-je faire d'autre pour enlever la marque de ce site pourrait être piraté ?
Est-ce que cela ressemble à un bug/une erreur de Google?

De plus, je publie ici la partie de l'URL signalée par Google sous le nom Injection d'URL - car il se peut que quelqu'un de vous l'ait vue de nouveau:

/cli/Qv2-shopping_ocsU8.html

Toutes les entrées, les suggestions sont appréciées.

Mise à jour 1

J'ai également vérifié les journaux d'accès pour cette URL. La première entrée que j'ai trouvée était ma propre première tentative d'atteindre cette URL, après avoir trouvé des webmasters avec une réponse HTTP 404. Google ne sera signalé que plus tard, après avoir demandé à explorer cette URL - à nouveau connecté avec une réponse 404.

À ce jour, je ne sais pas du tout comment et pourquoi Google a découvert et signalé cette URL.

Mise à jour 2

Quelques jours plus tard et grâce à divers efforts, Google Webmasters Tools continue de signaler cette URL détectée.

Quoi d’autre que j’ai fait: Autoriser explicitement GoogleBot dans notre fichier robots.txt à accéder à ladite URL, comme auparavant il n’était pas autorisé à l’explorer, et à le récupérer en tant que google, il s’arrêtait à cause du fichier robots.txt. Alors maintenant, Google peut voir que cette URL est un 404.

Maintenant, dans le menu Problèmes de sécurité , voici la route que je prends:

  1. Je vois le rapport sur les URL injectées - détecté pour la dernière fois le 2016-11-22
    Cliquez sur Afficher les détails.

step 1

  1. Dans la fenêtre de détails, je vois l'option de récupération en tant que Google, sur laquelle je clique pour le faire.

step2

  1. La récupération en tant que Google renvoie une erreur 404 pour cette URL. step 3

    • J'ai maintes fois déclaré que les problèmes étaient résolus et demandaient une vérification - mais rien ne se produit et Google met toujours à jour le rapport en indiquant que cette URL est à nouveau détectée chaque jour.

Je suis hors d'autres idées de quoi faire ici.

2
FFrewin

Je ne sais pas si cela va aider mais j'ai quelques idées:

J'ai vu ce message sur des sites qui utilisaient un logiciel de test A/B basé sur JS, alors cela aidera peut-être.

Avez-vous vérifié si cette URL avait déjà existé ou s'il y avait des liens?

Essayez de configurer le serveur pour renvoyer un en-tête HTTP "" disparu "410.

1
adam-asdf