Comment convertir une colonne de chaînes DataFrame (au format jj/mm/aaaa) en date/heure?
Le moyen le plus simple consiste à utiliser to_datetime
:
_df['col'] = pd.to_datetime(df['col'])
_
Il offre également un argument dayfirst
pour l'époque européenne (mais méfiez-vous ce n'est pas strict ).
Ici c'est en action:
_In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
_
Vous pouvez passer un format :
_In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
_
Si votre colonne de date est une chaîne du format '2017-01-01', vous pouvez utiliser pandas astype pour la convertir en date/heure.
df['date'] = df['date'].astype('datetime64[ns]')
ou utilisez datetime64 [D] si vous voulez une précision de jour et non des nanosecondes
print(type(df_launath['date'].iloc[0]))
les rendements
<class 'pandas._libs.tslib.Timestamp'>
le même que lorsque vous utilisez pandas.to_datetime
Vous pouvez l'essayer avec d'autres formats, puis '% Y-% m-% d' mais au moins, cela fonctionne.
Vous pouvez utiliser les éléments suivants si vous souhaitez spécifier des formats complexes:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
Plus de détails sur format
ici:
Si vous avez un mélange de formats dans votre date, n'oubliez pas de définir infer_datetime_format=True
pour vous simplifier la vie.
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Source: pd.to_datetime
ou si vous souhaitez une approche personnalisée:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)