web-dev-qa-db-fra.com

Comment puis-je empêcher l'accès aux URL de spam et les supprimer de l'index de Google?

Lorsque j'ai commencé à gérer le site Web de mes amis, j'avais trouvé un dossier contenant de nombreux fichiers HTML avec des noms tels que: free-nasscamd-server-31day, gorilla-quentin-trollip-pdf, etc. En supposant que quelqu'un les ait piratés. à l'intérieur, j'avais supprimé ce dossier et tous ses fichiers HTML, et vérifié partout ailleurs pour m'assurer qu'il ne restait rien d'autre.

Deux mois plus tard, je trouve toujours dans mes journaux d’accès des adresses URL erronées qui essaient toujours d’être consultées, bien qu’elles renvoient maintenant des erreurs 404 puisque les pages n’existent pas.

Et quand je vais dans Google et que je tape site:{url}, il affiche également un tas d’URL usagées, telles que: {url}/pitchet-program-samsung-wave2/, {url}/rogue-pirates-of-the-caribbean-themes-nokia-x3torrent/, etc ...

  1. Comment puis-je empêcher la tentative d'accès à ces URL?

  2. Comment puis-je supprimer ces URL vides de Google?

1
user1795832

Robots.txt

Si vous avez des centaines, voire des milliers, d'URL, la méthode la plus simple consiste à utiliser robots.txt pour informer Google que ces URL ne doivent pas être indexées. . Cela obligera également Google à examiner les URL déjà répertoriées et, espérons-le, à les supprimer à temps. Il convient de noter que la suppression des URL peut prendre des semaines à des mois, en fonction du volume et de la fréquence à laquelle Google effectue des contrôles sur votre site.

Outils pour les webmasters

Si vous n'avez que quelques dizaines d'URL, la méthode la plus rapide et la plus simple pour supprimer des URL à faible volume consiste sans aucun doute à utiliser les outils pour les webmasters de Google , outil de suppression des url . , notez à nouveau qu’il s’agit d’une simple demande et que la mise en œuvre peut prendre un certain temps.

Prévention du piratage

Vous devez également rechercher la source de ces fichiers. La suppression des fichiers est un bon début mais la compréhension de la manière dont ils sont entrés est le facteur le plus important pour éviter que ce problème ne se reproduise. Votre hôte Web peut être en mesure de commenter plusieurs problèmes de sécurité. La plupart des problèmes sont exploits SQL , plugins obsolètes et systèmes de gestion de contenu, sécurité d'hébergement mutualisé faible, utilisation faible des mots de passe , brute-forcible systèmes de connexion (ceux qui n'interdisent pas après X tentatives). Vous pouvez également surveiller les problèmes de sécurité potentiels en consultant régulièrement une base de données d'exploitation Web Apps .

1
Simon Hayter

Deux choses: premièrement, si ces URL génèrent une erreur 404 parce que la ressource a été supprimée, Google essaiera ces ressources plusieurs fois avant de déterminer que les ressources sont supprimées. Cela prendra du temps, mais c’est le moyen le plus simple de supprimer ces ressources. Vous pouvez éventuellement spécifier dans le fichier .htaccess (en supposant Apache) et renvoyer une erreur 410. Ce serait plus rapide, mais nécessite du travail. Mon conseil est de laisser les erreurs 404 se produire et finalement, au moins pour Google, Bing, Yahoo! et similaires, ceux-ci vont disparaître. Cependant, vous ne pouvez pas arrêter d'autres demandes en raison de liens, etc. Les erreurs 404 sont ennuyeuses et polluent le fichier journal et les analyses. Je comprends donc que je veuille les supprimer. À défaut d’une erreur 410, la meilleure chose à faire est d’autoriser les erreurs 404. Il se peut que certaines de ces demandes ne disparaissent pas. La réalité est que vous ne pouvez rien y faire.

Deuxièmement, effectuez une analyse antivirus au niveau fichier de l’ensemble du système de fichiers, y compris root-kit, pour vous assurer qu’il n’ya pas de virus. De plus, il est probable qu'une vulnérabilité logicielle existe toujours. Vérifiez les versions des logiciels installés, notamment et les applications PHP et PHP. Mettez à jour le logiciel pour vous assurer que vous utilisez des versions sûres de tous les logiciels. Ces fichiers ne sont pas apparus dans le vide. Assurez-vous de boucher les trous sinon le problème continuera.

1
closetnoc