Etant donné cette donnée, comment ne sélectionner que les lignes dont "Col2" est égal à NaN
?
In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"])
In [57]: df
Out[57]:
0 1 2
0 0 1 2
1 0 NaN 0
2 0 0 NaN
3 0 1 2
4 0 1 2
Le résultat devrait être celui-ci:
Out[57]:
0 1 2
1 0 NaN 0
Essayez ce qui suit:
df[df['Col2'].isnull()]
@qbzenker a fourni le méthode la plus idiomatique, IMO
Voici quelques alternatives:
In [28]: df.query('Col2 != Col2') # Using the fact that: np.nan != np.nan
Out[28]:
Col1 Col2 Col3
1 0 NaN 0.0
In [29]: df[np.isnan(df.Col2)]
Out[29]:
Col1 Col2 Col3
1 0 NaN 0.0