web-dev-qa-db-fra.com

Compter la fréquence des valeurs dans pandas Colonne DataFrame

Je souhaite compter le nombre de fois que chaque valeur apparaît dans Dataframe.

Voici mon cadre de données - df:

    status
1     N
2     N
3     C
4     N
5     S
6     N
7     N
8     S
9     N
10    N
11    N
12    S
13    N
14    C
15    N
16    N
17    N
18    N
19    S
20    N

Je veux un dictionnaire de comptes:

ex. counts = {N: 14, C:2, S:4}

J'ai essayé df['status']['N'] mais il donne keyError et aussi df['status'].value_counts mais sans utilité.

19
Kishan

Vous pouvez utiliser value_counts et to_dict :

print df['status'].value_counts()
N    14
S     4
C     2
Name: status, dtype: int64

counts = df['status'].value_counts().to_dict()
print counts
{'S': 4, 'C': 2, 'N': 14}
51
jezrael

Une alternative à un liner utilisant underdog Counter:

In [3]: from collections import Counter

In [4]: dict(Counter(df.status))
Out[4]: {'C': 2, 'N': 14, 'S': 4}
9
Colonel Beauvel

Vous pouvez essayer de cette façon.

df.stack().value_counts().to_dict()
4
su79eu7k

Pouvez-vous convertir df dans une liste?

Si c'est le cas:

a = ['a', 'a', 'a', 'b', 'b', 'c']
c = dict()
for i in set(a):
    c[i] = a.count(i)

En utilisant une compréhension dictée:

c = {i: a.count(i) for i in set(a)}
1
Chuck Logan Lim

Voir ma réponse dans ce fil pour un Pandas DataFrame,

comptez la fréquence à laquelle une valeur apparaît dans une colonne dataframe

Pour la sortie du dictionnaire, vous pouvez modifier comme suit:

def column_list_dict(x):
    column_list_df = []
    for col_name in x.columns:        
        y = col_name, len(x[col_name].unique())
        column_list_df.append(y)
    return dict(column_list_df)
1
djoguns