web-dev-qa-db-fra.com

Référent de merlot-ops-labeling-devel.corp.google.com

Une entité mystérieuse de Google consulte notre site de temps en temps, curieuse de savoir pourquoi. Nous avons des référents de merlot-ops-labeling-devel.corp.google.com ainsi que 74.125.239.132/url (qui sera 404 sans chaîne de requête). Le 74.125. une partie de l'adresse IP semble être une plage similaire à celle du robot d'exploration de flux de magasinage Google, et le/url semble être le redirecteur qui vous middlemans [brièvement] lorsque vous cliquez sur un titre Google SERP. Cet IP a passé une minute sur le site et a visité 5 pages, mais le domaine corp était 0:00 et le rebond immédiat. En regardant rdns, je ne suis pas sûr que ce soit réellement Google, bien que la gamme whois dise leur:

# Host 74.125.239.132
132.239.125.74.in-addr.arpa domain name pointer nuq05s02-in-f4.1e100.net.

Nous avions mis en place JSON-LD mais cela a pris littéralement 6 mois pour qu'il soit accepté à nouveau (cela s'est passé la semaine dernière… enfin). Je ne sais pas si ces visites ont quelque chose à voir avec QA/C ou quelque chose.

Alors, par curiosité, est-ce que quelqu'un sait ce que serait le projet/l'équipe/l'automatisation "merlot-ops-labelling-devel" ou ce redirecteur exposé IP/application? Peut-être que cela a quelque chose à voir avec cette validation?

1
dhaupin

Toute URL apparaissant sous corp.google.com est une URL interne utilisée par le personnel de Google. Après avoir jeté un coup d'œil à Google Merlot, la seule information que je puisse trouver est qu'il s'agit d'un framework de gestion de projet publié par Google sous la licence GNU GPL v2, bien que cela semble exclure son utilisation pour accéder à des sites Web publics. La seule chose qui pourrait avoir un sens, car il semble y avoir quelques personnes qui ont vu ce nom d'hôte dans les journaux de leur serveur, c'est qu'il est possible qu'en interne, Google ait un projet exécuté sous l'hôte merlot-ops-labelling-devel qui est utilisé pour certaines tâches internes relatives aux sites Web publics, telles que l'audit du site Web, le contrôle de conformité, le contrôle manuel, etc.

Comme il peut être positivement confirmé que le domaine est en fait utilisé et exploité par Google, je suis confiant de dire qu'il n'est pas nécessaire de trop s'en préoccuper et qu'il ne semble pas qu'il s'agisse d'un accès malveillant à la violation sur votre site. En outre, comme l'a mentionné dhaupin dans ses commentaires, ils ne pourraient pas accéder à d'autres informations de votre site que celles auxquelles un membre du public aurait accès sur votre site.

Cela ne devrait pas poser trop de problème. Si vous vous sentez toujours concerné et estimez que cela ne devrait pas se produire, vous pouvez ajouter une règle .htaccess pour empêcher ce site d’accéder à votre site, mais pour le moment, je ne pense pas que cela serait à proprement parler nécessaire.

1
Chris Rutherfurd