Puis-je insérer une colonne à un index de colonne spécifique dans les pandas?
import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0
Ceci mettra la colonne n
comme dernière colonne de df
, mais n’est-il pas possible de dire à df
de mettre n
au début?
voir docs: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.insert.html
en utilisant loc = 0 insérera au début
df.insert(loc, column, value)
df = pd.DataFrame({'B': [1, 2, 3], 'C': [4, 5, 6]})
df
Out:
B C
0 1 4
1 2 5
2 3 6
idx = 0
new_col = [7, 8, 9] # can be a list, a Series, an array or a scalar
df.insert(loc=idx, column='A', value=new_col)
df
Out:
A B C
0 7 1 4
1 8 2 5
2 9 3 6
Vous pouvez essayer d'extraire des colonnes sous forme de liste, de manipuler cela à votre guise et de réindexer votre dataframe:
>>> cols = df.columns.tolist()
>>> cols = [cols[-1]]+cols[:-1] # or whatever change you need
>>> df.reindex(columns=cols)
n l v
0 0 a 1
1 0 b 2
2 0 c 1
3 0 d 2
EDIT: cela peut être fait en une seule ligne; Cependant, cela semble un peu moche. Peut-être qu'une proposition plus propre pourrait venir ...
>>> df.reindex(columns=['n']+df.columns[:-1].tolist())
n l v
0 0 a 1
1 0 b 2
2 0 c 1
3 0 d 2