Je ne peux pas obtenir la moyenne ou la moyenne d'une colonne dans les pandas. A avoir un dataframe. Aucune des choses que j'ai essayées ci-dessous ne me donne la moyenne de la colonne weight
>>> allDF
ID birthyear weight
0 619040 1962 0.1231231
1 600161 1963 0.981742
2 25602033 1963 1.3123124
3 624870 1987 0.94212
Les éléments suivants renvoient plusieurs valeurs, pas une:
allDF[['weight']].mean(axis=1)
Ainsi fait ceci:
allDF.groupby('weight').mean()
Si vous voulez seulement la moyenne de la colonne weight
, sélectionnez la colonne (qui est une série) et appelez .mean()
:
In [479]: df
Out[479]:
ID birthyear weight
0 619040 1962 0.123123
1 600161 1963 0.981742
2 25602033 1963 1.312312
3 624870 1987 0.942120
In [480]: df["weight"].mean()
Out[480]: 0.83982437500000007
L'argument Try df.mean(axis=0)
, axis=0
calcule la moyenne en colonnes du cadre de données, de sorte que le résultat est axis=1
correspond à la moyenne en lignes, de sorte que vous obtenez plusieurs valeurs.
Essayez de donner un coup de feu à print (df.describe())
. J'espère qu'il sera très utile d'obtenir une description générale de votre cadre de données.
vous pouvez utiliser
df.describe()
vous obtiendrez des statistiques de base sur le cadre de données et vous obtiendrez une moyenne de colonne spécifique
df["columnname"].mean()
Vous pouvez également accéder à une colonne à l'aide de la notation par points (également appelée accès aux attributs), puis calculer sa moyenne:
df.your_column_name.mean()