J'ai une base de données extraite des salaires de Kaggle à San Fransico: https://www.kaggle.com/kaggle/sf-salaries et je souhaite créer un ensemble des valeurs d'une colonne, par exemple ' Statut'.
C’est ce que j’ai essayé mais il apporte une liste de tous les enregistrements au lieu de l’ensemble (sf, c’est comment je nomme le bloc de données).
a=set(sf['Status'])
print a
Selon cette page Web, cela devrait fonctionner. Comment construire un ensemble d'éléments de liste en python?
Si vous devez seulement obtenir une liste de valeurs uniques, vous pouvez simplement utiliser la méthode unique
. Si vous voulez avoir le jeu de Python, faites alors set(some_series)
In [1]: s = pd.Series([1, 2, 3, 1, 1, 4])
In [2]: s.unique()
Out[2]: array([1, 2, 3, 4])
In [3]: set(s)
Out[3]: {1, 2, 3, 4}
Cependant, si vous avez DataFrame, il suffit de sélectionner une série (some_data_frame['<col_name>']
).