Je souhaite compter le nombre de fois que chaque valeur apparaît dans Dataframe.
Voici mon cadre de données - df
:
status
1 N
2 N
3 C
4 N
5 S
6 N
7 N
8 S
9 N
10 N
11 N
12 S
13 N
14 C
15 N
16 N
17 N
18 N
19 S
20 N
Je veux un dictionnaire de comptes:
ex. counts = {N: 14, C:2, S:4}
J'ai essayé df['status']['N']
mais il donne keyError
et aussi df['status'].value_counts
mais sans utilité.
Vous pouvez utiliser value_counts
et to_dict
:
print df['status'].value_counts()
N 14
S 4
C 2
Name: status, dtype: int64
counts = df['status'].value_counts().to_dict()
print counts
{'S': 4, 'C': 2, 'N': 14}
Une alternative à un liner utilisant underdog Counter
:
In [3]: from collections import Counter
In [4]: dict(Counter(df.status))
Out[4]: {'C': 2, 'N': 14, 'S': 4}
Vous pouvez essayer de cette façon.
df.stack().value_counts().to_dict()
Pouvez-vous convertir df
dans une liste?
Si c'est le cas:
a = ['a', 'a', 'a', 'b', 'b', 'c']
c = dict()
for i in set(a):
c[i] = a.count(i)
En utilisant une compréhension dictée:
c = {i: a.count(i) for i in set(a)}
Voir ma réponse dans ce fil pour un Pandas DataFrame,
comptez la fréquence à laquelle une valeur apparaît dans une colonne dataframe
Pour la sortie du dictionnaire, vous pouvez modifier comme suit:
def column_list_dict(x):
column_list_df = []
for col_name in x.columns:
y = col_name, len(x[col_name].unique())
column_list_df.append(y)
return dict(column_list_df)