Supposons que je souhaite récupérer tous les sites Web comportant un lien spécifique. Par exemple, je veux connaître tous les backlinks vers mon blog, sur d'autres sites. Il existe des services qui font cela: http://www.backlinkwatch.com/index.php - se demandait comment ils obtiennent cette fonctionnalité.
L’exploration d’Internet est-elle la seule option ou existe-t-il des tiers moyens de le faire, en utilisant Google.
En fonction de ce que vous souhaitez, vous devrez peut-être explorer Internet au complet. mais il y a un moyen plus facile. Si vous êtes principalement intéressé par les liens sur lesquels vous avez réellement cliqué pour amener les gens vers la page; le stockage des informations sur le référent et le traitement de ces informations en feront beaucoup.
Pour être précis à 100%, oui, il vous faudrait explorer tout le réseau.
Google et Yahoo! avoir cette fonctionnalité dans leurs outils Analytics/Webmaster respectifs, mais ils ne sont même pas complets.
Comment font-ils? Leur activité principale consiste à explorer (presque) tout le réseau.
Cela n'a pas 100% de liens entrants vers votre site, mais cet outil aide beaucoup - http://www.opensiteexplorer.org/
Vous pouvez également trouver ces informations dans Google Analytics page par page.
Même les tiers que vous pourriez utiliser pour faire analyser ces données aussi souvent que possible sur Internet, cela ne peut être évité. Mais oui, vous pouvez utiliser des tiers pour décharger le travail de vos serveurs.
Je suppose que googler pour link:yourblog.com
serait trop facile?
Il est tout à fait possible d'explorer le Net, si c'est ce que vous deviez faire: une ligne T4 saturée prendrait quelques mois pour le faire (vous ne téléchargez que du HTML, pas des images). Mais si une simple recherche suffit, c'est ce que je recommanderais.