Sur une page que je gère, je stocke des informations sur les pages les plus lues et les dernières pages de la base de données.
Comment éviter de prendre en compte les accès des indexeurs de recherche?
Notez que je veux toujours que les pages soient indexées. Cependant, le nombre de pages lues ne doit être mis à jour que pour les lectures humaines et non par des robots. J'ai essayé de filtrer certains agents utilisateurs, mais cette approche ne semble pas être idéale.
Utilisez la langue de votre choix pour détecter l'agent utilisateur. La plupart des robots d'exploration légitimes des moteurs de recherche ont leur propre agent utilisateur pour l'identifier en tant qu'analyseur. Ensuite, vous pouvez simplement ignorer ces agents utilisateurs.