Je n'arrive tout simplement pas à comprendre ce que signifie "==" à la deuxième ligne:
- Ce n'est pas un test, il n'y a pas d'énoncé if ...
- Ce n'est pas une déclaration de variable ...
Je n'ai jamais vu ça avant, le truc c'est data.ctage==cat
est une pandas Series et non un test ...
for cat in data["categ"].unique():
subset = data[data.categ == cat] # Création du sous-échantillon
print("-"*20)
print('Catégorie : ' + cat)
print("moyenne:\n",subset['montant'].mean())
print("mediane:\n",subset['montant'].median())
print("mode:\n",subset['montant'].mode())
print("VAR:\n",subset['montant'].var())
print("EC:\n",subset['montant'].std())
plt.figure(figsize=(5,5))
subset["montant"].hist(bins=30) # Crée l'histogramme
plt.show() # Affiche l'histogramme
Ici, vous vérifiez data.categ
avec l'élément itérant, cat
, dans le dictionnaire de data
.
Et s'ils sont égaux, vous continuez la boucle.