Cela semble assez évident, mais je n'arrive pas à comprendre comment convertir un index de trame de données en colonne?
Par exemple:
df=
gi ptt_loc
0 384444683 593
1 384444684 594
2 384444686 596
À,
df=
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
non plus:
df['index1'] = df.index
ou .reset_index
:
df.reset_index(level=0, inplace=True)
alors, si vous avez un cadre multi-index avec 3 niveaux d’index, comme:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
et que vous voulez convertir les 1er (tick
) et 3ème (obs
) niveaux de l'index en colonnes, vous feriez:
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303
Pour MultiIndex, vous pouvez extraire son sous-index en utilisant
df['si_name'] = R.index.get_level_values('si_name')
où si_name
est le nom du sous-index.
Pour apporter un peu plus de clarté, examinons un DataFrame avec deux niveaux dans son index (un MultiIndex).
index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])
df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))
La méthode reset_index
, appelée avec les paramètres par défaut, convertit tous les niveaux d'index en colonnes et utilise un simple RangeIndex
comme nouvel index.
df.reset_index()
Utilisez le paramètre level
pour contrôler les niveaux d'index convertis en colonnes. Si possible, utilisez le nom de niveau, qui est plus explicite. S'il n'y a pas de noms de niveau, vous pouvez faire référence à chaque niveau par son emplacement entier, qui commence à 0 de l'extérieur. Vous pouvez utiliser ici une valeur scalaire ou une liste de tous les index que vous souhaitez réinitialiser.
df.reset_index(level='State') # same as df.reset_index(level=0)
Dans le cas rare où vous souhaitez conserver l'index et le transformer en colonne, vous pouvez effectuer les opérations suivantes:
# for a single level
df.assign(State=df.index.get_level_values('State'))
# for all levels
df.assign(**df.index.to_frame())
Si vous souhaitez utiliser la méthode reset_index
tout en préservant votre index existant, vous devez utiliser:
df.reset_index().set_index('index', drop=False)
ou pour le changer en place:
df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)
Par exemple:
print(df)
gi ptt_loc
0 384444683 593
4 384444684 594
9 384444686 596
print(df.reset_index())
index gi ptt_loc
0 0 384444683 593
1 4 384444684 594
2 9 384444686 596
print(df.reset_index().set_index('index', drop=False))
index gi ptt_loc
index
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
Et si vous voulez vous débarrasser de l'étiquette d'index, vous pouvez faire:
df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
index gi ptt_loc
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
rename_axis
+ reset_index
Vous pouvez d’abord renommer votre index en une étiquette de votre choix, puis passer à une série:
df = df.rename_axis('index1').reset_index()
print(df)
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
Cela fonctionne aussi pour les __fichiers de données MultiIndex
:
print(df)
# val
# tick tag obs
# 2016-02-26 C 2 0.0139
# 2016-02-27 A 2 0.5577
# 2016-02-28 C 6 0.0303
df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()
print(df)
index1 index2 index3 val
0 2016-02-26 C 2 0.0139
1 2016-02-27 A 2 0.5577
2 2016-02-28 C 6 0.0303
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1
new gi ptt
0 0 232 342
1 1 66 56
2 2 34 662
3 3 43 123