Comme indiqué dans un article de blog récent , nous constatons un écart important entre les "visiteurs" de Google Analytics et les "visiteurs" de Quantcast.
De plus, pour des raisons que nous n’avons jamais comprises, Google Analytics n’obtient que de plus grands nombres que Quantcast. À l'heure actuelle, GA affiche plus de visiteurs (15 millions) sur stackoverflow.com seulement que Quantcast ne le voit sur l'ensemble du réseau (14 millions):
Pourquoi? Je ne sais pas. Google Analytics perd parfois des cookies ou Quantcast manque des visiteurs. Compter est une science inexacte.
Nous pensons que cela est dû au fait que Quantcast utilise un ratio plus conservateur de cookies sur visiteurs . Alors que Google Analytics pourrait considérer chaque cookie comme un "visiteur", Quantcast considérera uniquement chaque cookie 1.24 comme un "visiteur". Cela me semble logique, car les utilisateurs peuvent accéder à nos sites à partir de plusieurs ordinateurs, de plusieurs navigateurs, etc.
J'ai deux questions étroitement liées:
Existe-t-il un ratio standard accepté de cookies sur les visiteurs? C’est évidemment une science inexacte, mais existe-t-il une nouvelle règle empirique?
Existe-t-il un moyen plus précis de compter les visiteurs sur un site Web autrement que par le recours aux cookies de navigateur? Ou est-ce que cela va toujours être un peu comme une estimation du meilleur effort, peu importe comment vous le mesurez?
Quantcast m'a envoyé un mail:
Vous avez indiqué qu'il existait un delta assez important entre vos numéros GA et vos numéros de contrôle de la qualité. Bien que cela ne se produise pas souvent, cela se produit et cela peut se produire pour plusieurs raisons. Par exemple, nous comptabilisons les cookies tiers et les actualisations automatiques, contrairement à GA. Nous demandons également aux éditeurs de placer notre étiquette près du bas de la page pour se conformer aux normes MRC et IAB. Si vos autres balises de mesure sont plus hautes sur la page, elles pourraient se déclencher, contrairement à Quantcast. (Nous sommes le seul service de mesure du trafic agréé par la MRC). De plus, les chiffres ne seront jamais exactement les mêmes pour des raisons de fuseau horaire: nous utilisons une fonction de normalisation et les paramètres généraux sont fixes.
Si vous souhaitez en savoir plus sur la façon dont nous calculons nos chiffres, veuillez consulter: http://www.quantcast.com/how-we-do-it . Nous avons également des livres blancs sur nos données d’audience corrigées en matière de cookies et notre méthodologie.
En parcourant les livres blancs, je constate qu'ils font ce que Jeff suggère: tromper les chiffres "officiels" pour obtenir quelque chose qui, à leur avis, correspond mieux au nombre réel de personnes. Ils ont un Livre blanc sur l'auditoire corrigé par un cookie (lien PDF) , ce qui implique que leur système est assez élaboré, et pas aussi simple que de simplement le diviser par un nombre magique:
Le programme Quantcast Quantified Publisher enregistre plus de 75 milliards d'événements de consommation de médias par mois, générés par plus de 1,4 milliard de cookies (données en date de juin 2008). De plus, beaucoup de nos partenaires Editeur Quantifié partagent avec nous des identifiants anonymes, indépendants des cookies. Notre modèle comprend également plusieurs panneaux qui fournissent des points de référence et d'étalonnage basés sur les personnes, qui ne sont pas supprimés des cookies. Nous triangulons cette masse de données avec différents processus, biais et problèmes de collecte. Nos modèles prennent en compte la fréquence des visites, les périodes, la probabilité d'utilisation de plusieurs ordinateurs et même l'impact de plusieurs personnes utilisant le même ordinateur pour fournir des estimations basées sur les personnes. Notre modèle de traduction de cookies uniques en personnes a été validé à l'aide d'échantillons en attente et d'ensembles de données indépendants. De plus, notre modèle est dynamique et recalibré sur une base continue afin de refléter la nature évolutive des modèles de trafic Internet.
Un autre facteur est en jeu dans le sous-dénombrement Quantcast: ils utilisent des cookies tiers (cookies servis à partir du domaine .quantserve.com
), alors que Google Analytics utilise des cookies propriétaires (stackexchange.com
, etc.).
Cela est très important, car certains navigateurs (notamment Safari, mais plus récemment Firefox et Chrome) désactivent les cookies tiers en tant que paramètre par défaut, tandis que de nombreux autres peuvent choisir individuellement des paramètres de confidentialité interdisant les cookies tiers. Cela signifie qu'il existe un sous-ensemble de la population qui ne sera jamais suivi par les cookies de QuantCast. Cela signifie que Google Analytics renvoie systématiquement un nombre de visiteurs supérieur.
Je dirais qu'il n'y a pas de règle générale. En tant que praticien en analytique, je dirais que la recherche d'un "nombre réel" de visiteurs est sans espoir et qu'elle se concentre plutôt sur les visites elles-mêmes. Par exemple, sur votre compte Google Analytics, je suis au moins 8 visiteurs différents, ayant accédé à StackOverflow depuis Chrome, Safari et Firefox sur mon ordinateur portable professionnel, mon ordinateur portable personnel, mon téléphone et mon iPad. Les services analytiques comptent tous de différentes manières et retournent donc des nombres très différents.
Même avec une mise en œuvre parfaite, Google Analytics affichera presque toujours un nombre de visites inférieur à celui d'un système d'analyse basé sur le journal du serveur, mais affichera un nombre de visites supérieur à celui d'un système basé sur des cookies tiers, tel que Quantcast. L'important n'est pas de regarder les totaux bruts, mais les tendances que chaque méthode montre dans ses points forts. Par conséquent, ne comparez jamais les numéros Quantcast aux numéros Google Analytics; utilisez plutôt les chiffres dans les contextes dans lesquels ils ont été collectés.
Un autre problème peut être que votre implémentation de Google Analytics est incorrecte, car la configurer pour votre type d’installation de domaines et de sous-domaines multiples peut être un cauchemar si elle n’est pas effectuée correctement et de manière rigoureuse, ce qui pourrait conduire à considérer un seul navigateur comme plusieurs visiteurs, gonflant eux-mêmes votre compte. Ce n'est jamais un problème pour Quantcast, car tous les cookies sont définis dans leur domaine tiers.
Le ratio de cookies par visiteurs uniques est généralement compris entre 1,3 et 1,7 pour les sites de plus d'un million de visites.
Même si yc01 a raison de dire que GA utilise des cookies propriétaires par rapport à des cookies tiers, chez RealSelf.com, nous utilisons deux fournisseurs d’analyses propriétaires (GA et Comscore Direct) et GA toujours affiche 30% plus de visiteurs uniques absolus que de visiteurs uniques de Comscore.
Comscore affiche uniquement les visiteurs uniques par pays. Pour comparer GA à Comscore, nous devons calculer le nombre de visiteurs uniques absolus aux États-Unis comme suit:
US Visits/Global Visits * Utilisateurs uniques absolus
(1 150 110/1 650 979) * 1 273 059 = 886 842 utilisateurs uniques basés aux États-Unis
En revanche, Comscore rapporte 680 900 utilisateurs uniques basés aux États-Unis. Donc, GA affiche 30,2% de plus.
Comscore a construit son activité autour de la précision, alors que GA est avant tout un moyen gratuit de suivre et d’optimiser les sites utilisant AdWords et AdSense. Comscore dispose d'un panel de personnes qu'il utilise également pour estimer le trafic et utilise ce panneau pour déterminer un nombre moyen de cookies par personne. Avec plus de personnes utilisant des appareils mobiles (notre utilisation mobile est de 15%), il est logique que les cookies uniques surestiment le nombre de personnes uniques.
Voici une étude récente (4 mai 2011 - hier lorsque j'écris ceci) de MediaMind avec "Multiplicateurs d'inflation de cookie" pour différents marchés:
Leur facteur d'inflation calculé est compris entre 2,2 pour l'Allemagne et 3,0 pour les États-Unis.
Peut-être que votre GA nombre de visiteurs est plus gonflé qu'un site normal en raison de la nature plus technique de son public? Par exemple, les programmeurs, les développeurs Web en particulier, sont plus susceptibles d’utiliser une gamme de navigateurs et d’augmenter le nombre de cookies.
Pour la question 1, je suppose que, comme pour de nombreux indicateurs, il est préférable d’utiliser les données de votre propre site plutôt que de rechercher des normes globales, car les agrégats peuvent être trompeurs. Une façon d'obtenir un cookie avec un nombre réel de visiteurs consiste à compter le nombre de cookies que vous voyez de chaque utilisateur enregistré, puis le nombre obtenu.
Quant au numéro 2, théoriquement, le meilleur moyen de compter les visiteurs réels serait de forcer tout le monde à créer un compte. Comme ce n’est évidemment pas une bonne idée, vous pouvez envisager la normalisation. Par exemple, vous pouvez utiliser la moyenne des cookies pour la métrique utilisateur enregistrée que j'ai suggérée ci-dessus et l'appliquer aux numéros de visiteurs rapportés par GA.