J'ai un pandas dataframe "df". Dans ce dataframe, j'ai plusieurs colonnes, l'une desquelles je dois sous-chaîne. Disons que le nom de colonne est "col". Je peux exécuter un "pour "boucle comme ci-dessous et sous-chaîne de la colonne:
for i in range(0,len(df)):
df.iloc[i].col = df.iloc[i].col[:9]
Mais je voulais savoir, s’il existe une option pour laquelle je n’ai pas à utiliser une boucle "pour", et le faire directement en utilisant un attribut. J'ai une énorme quantité de données, et si je le fais, les données prendront un processus très long.
Utilisez str.slice :
df.col = df.col.str.slice(0, 9)
Vous pouvez aussi l'utiliser avec []
, qui tilise une tranche sous l’ea :
df.col = df.col.str[:9]