J'essaie d'extraire exactement les mêmes données que celles que je vois dans mon tableau de bord via l'API de création de rapports de base pour Google Analytics. Cependant, je n'arrive pas à comprendre pourquoi les données peuvent être si différentes, même pour la même période et les mêmes mesures!
Depuis mon interface Web, voici la structure de ma table dans le tableau de bord.
**Display the following columns:**
Dimension: Month of Year
Metric: Pageviews
**Filter this data:**
Only show **Page** containing "/blog/"
Et voici ce que je vois dans mon interface utilisateur Web avant la période du 26/09/2013 au 26/12/2013:
Month of Year Pageviews
201312 151,502
201311 136,856
201310 183,555
201309 22,689
Dans mon script, j'utilise exactement les mêmes métriques (à l'exception des différences de convention de dénomination entre les métriques Web et API):
dimensions = ga:yearMonth
start-date = 2013-09-26
start-index = 1
metrics = [u'ga:pageviews']
filters = ga:pagepath=@/blog/
end-date = 2013-12-26
Et voici ce que je vois:
Rows:
201312 148626
201311 160769
201310 154770
201309 16099
Signaler Infos:
Contains Sampled Data = False
Kind = analytics#gaData
ID = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26
Self Link = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26
Pagination Infos:
Items per page = 1000
Total Results = 4
Comme nous pouvons le constater, le format des données est correct mais les données qu’il contient sont erronées. Le pire est que la tendance des données est différente.
En fait c'est très bien. Vos chiffres sont assez proches. De mon côté, mes statistiques sur mes systèmes me rapporteraient environ 4 fois plus de résultats que Google Analytics.
Maintenant ... pourquoi cet écart? Il y a beaucoup de facteurs, ce sont ceux que je peux penser à ce stade:
J'avais (ce que je pense était) la même question, en comparant les rapports générés par Python et l'outil Web fourni par Google. J'ai trouvé la différence parce que l'outil Web utilise l'échantillonnage:
"Ce rapport est basé sur 96 693 sessions (92,19% des sessions)"
Vous avez un point de données qui est en réalité plus élevé dans l'outil Web, mais ... je ne peux pas l'expliquer :)