web-dev-qa-db-fra.com

Python pandas: Ajouter une colonne à mon dataframe qui compte une variable

J'ai une trame de données 'gt' comme ceci:

org     group
org1      1
org2      1
org3      2
org4      3
org5      3
org6      3

et je voudrais ajouter la colonne 'count' au cadre de données gt au nombre de membres des groupes, les résultats attendus comme ceci:

org     group   count
org1      1       2
org2      1       2
org3      2       1
org4      3       3
org5      3       3
org6      3       3

Je sais comment le faire pour un élément du groupe, mais je ne sais pas comment répéter le comptage pour tous les éléments du groupe, voici le code que j'ai utilisé:

gtcounts = gt.groupby('group').count()

Quelqu'un peut-il aider?

23
UserYmY

Appelez transform cela retournera une série alignée avec le df d'origine:

In [223]:

df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
    org  group  count
0  org1      1      2
1  org2      1      2
2  org3      2      1
3  org4      3      3
4  org5      3      3
5  org6      3      3
39
EdChum