web-dev-qa-db-fra.com

Quel pourcentage de toutes les combinaisons IP + User Agent actives ne sont pas uniques?

Il est assez courant de définir un utilisateur unique par un hachage 1 pour 1 d'IP + User Agent. Mais tous les utilisateurs uniques ne possèdent pas une combinaison IP + Agent utilisateur unique. Ainsi: collisions - événements mal attribués à des utilisateurs qui n’ont pas déclenché ces événements.

Cela est particulièrement problématique lorsque vous essayez de suivre des utilisateurs uniques qui utilisent des machines et des paramètres similaires sous le même toit d'une grande organisation comme une école ou une entreprise.

Ma question est la suivante: quelle est la probabilité de base globale de la simultanéité IP + Agent utilisateur simultanée?

Je suppose que le taux est différent pour différentes heures de la journée et régions. Mais je suis curieux de savoir quelle est la norme.

1
samthebrand

Votre objectif n'est pas clair. Tu ne nous dis pas. Si vous essayez d'identifier des utilisateurs uniques, vous utilisez deux des éléments de données les moins fiables. Oui, les adresses IP sont souvent utilisées, mais conjointement avec d'autres éléments de données. Voici ce qui vous manque.

Les adresses IP sont souvent dynamiques et peuvent changer à chaque session. De plus, les adresses IP peuvent être partagées par de nombreux utilisateurs. Tenez également compte du nombre limité de navigateurs Web et des agents utilisateurs fournis. Il est extrêmement courant que l'adresse IP et l'agent utilisateur entraînent des collisions, comme vous le suggérez. C'est fort probable en fait. Tenez également compte du nombre de fois qu'un agent utilisateur est un faux. Il semble de nos jours que les agents utilisateurs soient plus faux que faux. Utiliser l'agent utilisateur pour un élément de données pivot est une idée horrible en raison de son manque de fiabilité.

Pour certains de mes travaux, j’utilise l’adresse IP et le premier accès à l’époque mais, selon ce que vous essayez de faire, cela risque de ne pas être possible ou pratique. Cela fonctionne bien pour un identifiant d'utilisateur, mais il existe de bien meilleures méthodes. Je n'utilise pas cette méthode pour suivre les utilisateurs en soi.

Si vous écrivez du code, des modules sont disponibles pour créer un identifiant utilisateur unique. Cela peut être votre meilleur pari à nouveau en fonction de ce que vous essayez de faire. Je sais que cette fonctionnalité est disponible dans PHP si c'est votre langue, bien que je ne puisse pas vous dire ce que cela serait car je n'utilise pas PHP. Peut-être que quelqu'un peut commenter.

2
closetnoc