Nous essayons actuellement de voir si notre site est indexé avec succès par Google. Notez que nous avons des millions de pages.
Certaines personnes utilisent un truc: google site: command. J'ai toujours supposé que google.com et google.nl seraient les mêmes. Données récupérées par le même GoogleBot. Et que c’était plus une question de latence où google.nl serait plus proche de chez nous que google.com. Mais ce n'est clairement pas le cas, car google.nl et google.com donnent des résultats différents.
http://www.google.nl/search?sourceid=chrome&ie=UTF-8&q=site:Amazon.com renvoie 37.400.000 résultats et http://www.google. com/# sclient = psy & hl = fr & site = & source = hp & q = site: Amazon.com renvoie 487 000 000 résultats
Est-ce que quelqu'un sait comment cela fonctionne?
Une autre question connexe concerne les autres astuces utilisées par les internautes pour savoir si google.com indexe correctement toutes les données.
Il semble que le meilleur moyen consiste à effectuer des analyses dans les journaux Apache à la recherche de GoogleBot.
Google Webmaster Tools est le moyen le plus simple (et le plus fiable) de déterminer la quantité de contenu que vous avez insérée dans l'index de Google.