web-dev-qa-db-fra.com

Les données Web de Google Analytics sont très différentes des données de l'API de reporting principale

J'essaie d'extraire exactement les mêmes données que celles que je vois dans mon tableau de bord via l'API de création de rapports de base pour Google Analytics. Cependant, je n'arrive pas à comprendre pourquoi les données peuvent être si différentes, même pour la même période et les mêmes mesures!

Depuis mon interface Web, voici la structure de ma table dans le tableau de bord.

**Display the following columns:**
Dimension: Month of Year
Metric: Pageviews
**Filter this data:**
Only show **Page** containing "/blog/"

Et voici ce que je vois dans mon interface utilisateur Web avant la période du 26/09/2013 au 26/12/2013:

Month of Year   Pageviews   
201312           151,502
201311           136,856    
201310           183,555    
201309            22,689

Dans mon script, j'utilise exactement les mêmes métriques (à l'exception des différences de convention de dénomination entre les métriques Web et API):

dimensions = ga:yearMonth
start-date = 2013-09-26
start-index = 1
metrics = [u'ga:pageviews']
filters = ga:pagepath=@/blog/
end-date = 2013-12-26

Et voici ce que je vois:

Rows:
201312  148626
201311  160769
201310  154770
201309  16099

Signaler Infos:

Contains Sampled Data = False
Kind                  = analytics#gaData
ID                    = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26
Self Link             = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26

Pagination Infos:
Items per page = 1000
Total Results  = 4

Comme nous pouvons le constater, le format des données est correct mais les données qu’il contient sont erronées. Le pire est que la tendance des données est différente.

1
jxn

En fait c'est très bien. Vos chiffres sont assez proches. De mon côté, mes statistiques sur mes systèmes me rapporteraient environ 4 fois plus de résultats que Google Analytics.

Maintenant ... pourquoi cet écart? Il y a beaucoup de facteurs, ce sont ceux que je peux penser à ce stade:

  • Vous avez un cache entre vous et vos clients, Google Analytics comptera chaque hit, mais pas votre système, car il ne sera pas touché.
  • Votre système peut être capable de renvoyer un 304 et de ne pas les compter comme des hits.
  • Votre système compte tous les hits, y compris ceux de tous les spiders (c'est-à-dire googlebot hits). Google Analytics connaît de nombreuses araignées et ne compte pas leurs hits.
  • Votre système compte les accès des pirates informatiques depuis sa mise sur votre serveur, pas celui de Google Analytics car les pirates (spammeurs Web, etc.) n’exécutent pas leur code JavaScript.
  • Goole Analytics ne compte que les occurrences provenant de pages HTML, votre serveur peut stocker d'autres données (fichiers PDF, images, etc.) également comptabilisées.
  • Google Analytics compte également différemment pour les visiteurs qui naviguent sur votre site Web et ceux qui "reviennent", qu’un système de gestion de contenu ne comprend généralement pas de la même manière.
1
Alexis Wilke

J'avais (ce que je pense était) la même question, en comparant les rapports générés par Python et l'outil Web fourni par Google. J'ai trouvé la différence parce que l'outil Web utilise l'échantillonnage:

"Ce rapport est basé sur 96 693 sessions (92,19% des sessions)"

Vous avez un point de données qui est en réalité plus élevé dans l'outil Web, mais ... je ne peux pas l'expliquer :)

1
Ben Griffin