web-dev-qa-db-fra.com

Calculer la moyenne des rangées dans les pandas

       Y1961      Y1962      Y1963      Y1964      Y1965  Region
0  82.567307  83.104757  83.183700  83.030338  82.831958  US
1   2.699372   2.610110   2.587919   2.696451   2.846247  US
2  14.131355  13.690028  13.599516  13.649176  13.649046  US
3   0.048589   0.046982   0.046583   0.046225   0.051750  US
4   0.553377   0.548123   0.582282   0.577811   0.620999  US

Dans le cadre de données ci-dessus, j'aimerais obtenir une moyenne de chaque ligne. actuellement, je fais ceci:

df.mean(axis=0)

Cependant, cela supprime également la colonne Région. comment puis-je calculer la moyenne et aussi conserver la colonne Région

24
user308827

Vous pouvez spécifier une nouvelle colonne. Vous devez également calculer la moyenne le long des lignes, utilisez donc axis=1.

df['mean'] = df.mean(axis=1)
>>> df
       Y1961      Y1962      Y1963      Y1964      Y1965 Region       mean
0  82.567307  83.104757  83.183700  83.030338  82.831958     US  82.943612
1   2.699372   2.610110   2.587919   2.696451   2.846247     US   2.688020
2  14.131355  13.690028  13.599516  13.649176  13.649046     US  13.743824
3   0.048589   0.046982   0.046583   0.046225   0.051750     US   0.048026
4   0.553377   0.548123   0.582282   0.577811   0.620999     US   0.576518
37
Alexander

Si vous recherchez une colonne moyenne. Essaye ça,

df.drop('Region', axis=1).apply(lambda x: x.mean())

# it drops the Region column
df.drop('Region', axis=1)
0
Rahul