pandas reset_index après groupby.value_counts ()

Question

J'essaie de grouper une colonne et de calculer les comptes de valeur sur une autre colonne.

import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) print(dftest)

dftest ressemble

 A Amt 0 1 20 1 1 20 2 1 20 3 1 30 4 1 30 5 1 30 6 1 30 7 1 40 8 1 40 9 2 10 10 2 10 11 2 40 12 2 40 13 2 40

effectuer un regroupement

grouper = dftest.groupby('A') df_grouped = grouper['Amt'].value_counts()

qui donne

 A Amt 1 30 4 20 3 40 2 2 40 3 10 2 Name: Amt, dtype: int64

ce que je veux, c'est garder les deux premières rangées de chaque groupe

De plus, j'étais perplexe face à une erreur lorsque j'ai essayé de reset_index

df_grouped.reset_index()

ce qui donne l'erreur suivante

df_grouped.reset_index () ValueError: impossible d'insérer Amt, existe déjà

jezrael · Accepted Answer

Vous avez besoin du paramètre name dans reset_index , car Series nom est le même que le nom d'un des niveaux de MultiIndex:

df_grouped.reset_index(name='count')

Une autre solution est rename Series nom:

print (df_grouped.rename('count').reset_index()) A Amt count 0 1 30 4 1 1 20 3 2 1 40 2 3 2 40 3 4 2 10 2

Solution plus courante à la place value_counts est un agrégat size :

df_grouped1 = dftest.groupby(['A','Amt']).size().rename('count').reset_index() print (df_grouped1) A Amt count 0 1 20 3 1 1 30 4 2 1 40 2 3 2 10 2 4 2 40 3