Je viens de construire une nouvelle application Web et je cherche des données pour la semer. Quelqu'un connaît-il de bons détaillants de données de semences? Ou suis-je manque quelque chose et il y a un moyen de le faire gratuitement. Je suis tout à fait ouvert au raclage et j'ai construit quelques racleurs que j'ai appréciés.
http://www.yell.com/robots.txt
Beaucoup de sitemaps là-bas :)
Je n'ai pas téléchargé les données et je les ai consultées, mais elles pourraient contenir des informations utilisables.
Si vous êtes aux États-Unis ou au Canada, infoUSA vaut le détour. Un ancien employeur les utilisait pour les mailings. Vous pouvez être très précis quant aux types d’entreprises que vous souhaitez et aux types de données nécessaires, tels que "doit avoir un numéro de téléphone" ou doit être dans l’industrie X "ou" doit être en affaires depuis plus de X ans ", etc.
Puisque vous avez le savoir-faire en matière de grattage, je vous suggérerais de gratter yell.com pour les adresses professionnelles au Royaume-Uni. Peut-être que Yelp ?
Il convient de noter que les internautes n'aiment pas que leurs sites Web soient supprimés. Ils risquent donc de vous bloquer très rapidement et Google se passionne pour le contenu en double (I ne me souviens plus du terme exact) sur différents sites.