J'utilise Pandas pour explorer certains jeux de données. J'ai ce dataframe:
Je veux exclure toute ligne ayant une valeur de ville. Alors j'ai essayé:
new_df = all_df[(all_df["City"] == "None") ]
new_df
Mais alors j'ai un dataframe vide:
Cela fonctionne chaque fois que j'utilise une valeur autre que None
. Une idée de comment filtrer ce dataframe?
Pensez à utiliser isnull()
pour localiser les valeurs manquantes.
all_df[all_df['City'].isnull()]
Essayez ceci pour sélectionner uniquement les valeurs None
de la colonne city:
new_df = all_df['City'][all_df['City'] == "None"]
Essayez ceci pour voir toutes les autres colonnes qui ont les mêmes lignes de 'City'==None
new_df = all_df[all_df['City'] == "None"]
print(new_df.head()) # with function head() you can see the first 5 rows
J'espère que "where
" peut faire ce que vous attendez
new_df = new_df.where(new_df["city"], None)
Et il vaut mieux utiliser np.nan
plutôt que None
.
Pour plus de détails pandas.DataFrame.where