web-dev-qa-db-fra.com

Comment sélectionner des lignes avec NaN dans une colonne particulière?

Etant donné cette donnée, comment ne sélectionner que les lignes dont "Col2" est égal à NaN?

In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"])

In [57]: df
Out[57]: 
   0   1   2
0  0   1   2
1  0 NaN   0
2  0   0 NaN
3  0   1   2
4  0   1   2

Le résultat devrait être celui-ci:

Out[57]: 
   0   1   2
1  0 NaN   0
62
Dinosaurius

Essayez ce qui suit:

df[df['Col2'].isnull()]
99
qbzenker

@qbzenker a fourni le méthode la plus idiomatique, IMO

Voici quelques alternatives:

In [28]: df.query('Col2 != Col2') # Using the fact that: np.nan != np.nan
Out[28]:
   Col1  Col2  Col3
1     0   NaN   0.0

In [29]: df[np.isnan(df.Col2)]
Out[29]:
   Col1  Col2  Col3
1     0   NaN   0.0
5
MaxU