web-dev-qa-db-fra.com

Supprimer l'URL piratée de l'index Google ne fonctionne pas

Je continue à obtenir l'index de l'URL piraté par Google lorsque je tape site: mydomain.com.au

enter image description here

Mon site a été piraté auparavant (utilisait wordpress). Maintenant, il utilise JavaScript (React/Node) et construit à partir de zéro et hébergé sur un nouveau serveur.

Le seul lien entre l'ancien site et le nouveau est le nom de domaine.

Mon site fonctionne très bien dans la recherche bing, probablement parce que bing n'a pas indexé tous ces liens piratés sous mon nom de domaine.

Le nouveau site fonctionne depuis plus de 4 mois maintenant. Aucune de ces URL piratées ne prend personne d'autre que la page 404.

Et google ne le supprimera pas de son indexation? C'est choquant.

Aucun de ces liens ne mène à la page réelle. Ils conduisent tous les utilisateurs à la page 404. Récemment, j'ai réalisé que certains de ces liens de page piratés avaient déjà été soumis pour être supprimés à l'aide de l'outil de suppression d'URL. Ils s'affichent supprimés mais continuent d'apparaître dans Google lorsque je tape site: mydomain.com.au

J'ai entendu dire que cette page qui n'existe pas est automatiquement supprimée de l'index google dans les 3 mois, mais ce n'est pas le cas dans mon cas.

Je clique manuellement (parfois j'utilise l'outil de suppression d'url en vrac) pour collecter ces URL et soumettre à l'outil de suppression d'URL. Les prochaines heures ou maximum par jour Il semble propre en affichant uniquement les URL valides lorsque je tape site: mydomain.com.au Mais là encore, il commence à apparaître...

Quel choix ai-je? Que se passe-t-il et que dois-je faire pour aller de l'avant?

Je propose de supprimer l'URL depuis des mois maintenant. Dans la nouvelle console de recherche, cela montre que j'ai déjà supprimé près d'un million de liens ..

enter image description here

Pourquoi ces liens invalides sont indexés et pourquoi réapparaissent-ils? Veuillez partager vos réflexions, votre expérience et les solutions possibles. Merci!

1
Ryan Dhungel

Comme Jonh Mueller a déclaré l'année dernière :

De notre point de vue, à moyen/long terme, un 404 est le même qu'un 410 pour nous. Donc, dans ces deux cas, nous supprimons ces URL de notre index.

Nous réduisons généralement l'exploration d'un peu de ces URL afin de ne pas passer trop de temps à explorer des choses dont nous savons qu'elles n'existent pas.

S'ils ont retardé l'exploration des pages de votre 404 , cela pourrait expliquer pourquoi il faut autant de temps pour être supprimé de l'index de Google.

Cela se produit sur des sites avec des milliers d'URL et cela peut prendre des mois pour permettre à Google d'explorer et de les supprimer tous. On vous a dit d'utiliser 410 au lieu de 404 et c'est quelque chose que j'ai recommandé dans le passé, mais je crois que, dans ce scénario, cela ne fera aucune différence:

La différence subtile ici est qu'un 410 tombera parfois un peu plus vite qu'un 404. Mais généralement, nous parlons de l'ordre de quelques jours environ.

Donc, si vous supprimez simplement du contenu naturellement, c'est parfaitement bien d'utiliser l'un ou l'autre. Si vous avez déjà supprimé ce contenu il y a longtemps, il n'est pas déjà indexé, donc cela n'a pas d'importance pour nous si vous utilisez un 404 ou 410

Je vais mettre mon argent sur l'application d'un 301 redirect car, d'après mon expérience, ils sont généralement plus rapides que 410 mais, plutôt que cela, vous devriez être patient.


Mise à jour : Comme ces pages sont des URL piratées, un 301 redirect ne sera pas recommandé.

1
Emirodgar

Un de mes sites Web a récemment été piraté via WordPress, et pour être exact, le malware est venu via l'installation de WooCommerce. Google a bloqué mon site comme dangereux. L'indexation de Google était similaire à la vôtre.

Comment allez-vous:

  1. Nettoyez soigneusement votre site. Autrement dit, j'ai un certain nombre de domaines sur mon serveur et ce programme malveillant avait reproduit dans tous mes domaines des pages error.shtml supplémentaires à côté d'un autre fichier que je n'avais pas mis dedans et qui était régulièrement répandu. Alors trouvez le motif et nettoyez.

  2. Connectez-vous ensuite à Google Search Console. Si vous ne l'avez pas déjà fait, ajoutez votre adresse de domaine via "+ Ajouter une propriété". Pour vérifier la propriété de votre site, entrez votre adresse de domaine dans le popup "Prefix". Placez le fichier dans votre domaine. Exécutez le test.

  3. Vous devez maintenant écrire à Google depuis l'intérieur de la console, afin que le personnel de Google vérifie le fichier de vérification sur votre site. Vous recevrez un e-mail de leur part.

  4. Par mesure de précaution supplémentaire, vous pouvez consulter certains sites Web pour savoir si vous êtes sur la liste noire.

  5. Préparez un fichier robot.txt pour toutes les pages indexées mais qui n'existent pas. Cela nettoiera également l'indexation de Google.

Dans mon cas, le site Web et l'indexation ont été nettoyés entre 3 et 4 jours après avoir suivi vigoureusement les procédures. Vous devez contacter Google.

0
Mugé