J'ai commis une erreur avec l'un de mes sites et une foule de données ont été récupérées par Google avant de les récupérer. Je dois régler ce problème assez rapidement en demandant à Google de supprimer la copie en cache des pages, puis de la réinterroger à sa guise. L'URL serait quelque chose comme:
example.com/memberprofile.php?member=XXXXXX
Est-ce que quelqu'un sait si je peux soumettre:
example.com/memberprofile.php?member=<some wildcard character>
en tant que demande unique via les outils pour les webmasters? Si non, quelles sont mes autres alternatives?
Je ne pense pas que vous puissiez supprimer un générique. De plus, une suppression manuelle ne dure que 90 jours. Vous feriez mieux de créer un fichier robots.txt correct et de laisser Google réindexer. Ils devraient laisser tomber vos pages qui ne sont plus censées être explorées, mais je ne sais pas à quelle vitesse cela se produira.
Voir: https://www.google.com/support/webmasters/bin/answer.py?answer=156449&hl=fr
Vous devez également ajouter la balise méta "noindex" à vos pages memberprofile.php.
Voir: https://www.google.com/support/webmasters/bin/answer.py?answer=9371
EDIT: Fait un peu plus de creuser ...
Demander à Google de supprimer uniquement le cache, pas la page entière, de l'index.
Voir: http://www.google.com/support/webmasters/bin/answer.py?answer=164734
Les URL correctes soumises ne mentionnent rien sur les caractères génériques, et la section concernant les "URL multiples" indique de les soumettre séparément. Je ne pense pas que les caractères génériques soient pris en charge, éventuellement par conception.
Voir: http://www.google.com/support/webmasters/bin/answer.py?answer=63758
J'ai lu un article de Google disant que si vous empêchez les robots de lire les pages, Google ne les explore pas, mais ne sait pas non plus qu'ils ne sont plus là. Cela empêche les pages de disparaître de votre rapport Outils pour les webmasters.