web-dev-qa-db-fra.com

Extraire un élément d'une liste dans une colonne pandas

J'ai un DataFrame qui contient une liste sur chaque colonne comme indiqué dans l'exemple ci-dessous avec seulement deux colonnes.

    Gamma   Beta
0   [1.4652917656926299, 0.9326935235505321, float] [91, 48.611034768515864, int]
1   [2.6008354611105995, 0.7608529935313189, float] [59, 42.38646954167245, int]
2   [2.6386970166722348, 0.9785848171888037, float] [89, 37.9011122659478, int]
3   [3.49336632573625, 1.0411524946972244, float]   [115, 36.211134224288344, int]
4   [2.193991200007534, 0.7955134305428825, float]  [128, 50.03563864975485, int]
5   [3.4574527664490997, 0.9399880977511021, float] [120, 41.841146628802875, int]
6   [3.1190582380554863, 1.0839109431114795, float] [148, 55.990072419824514, int]
7   [2.7757359940789916, 0.8889801332053203, float] [142, 51.08885697101243, int]
8   [3.23820908493237, 1.0587479742892683, float]   [183, 43.831293356668425, int]
9   [2.2509032790941985, 0.8896196407231622, float] [66, 35.9377662201882, int]

Je voudrais extraire pour chaque colonne la première position de la liste sur chaque ligne pour obtenir un DataFrame comme suit.

    Gamma   Beta
0   1.4652917656926299  91
1   2.6008354611105995  59
2   2.6386970166722348  89
...

Jusqu'à présent, ma solution serait comme [row[1][0] for row in df_params.itertuples()], que je pourrais parcourir pour chaque index de colonne de la ligne, puis composer mon nouveau DataFrame.

Une alternative est new_df = df_params['Gamma'].apply(lambda x: x[0]) puis itérer pour parcourir toutes les colonnes.

Ma question est la suivante: existe-t-il un moyen moins lourd d'effectuer cette opération?

8

Vous pouvez utiliser l'accessoire str pour les listes, par exemple:

df_params['Gamma'].str[0]

Cela devrait fonctionner pour toutes les colonnes:

df_params.apply(lambda col: col.str[0])
18
IanS

Les itéruples seraient assez lents. Vous pouvez accélérer cela avec les éléments suivants:

for column_name in df_params.columns:
    df_params[column_name] = [i[0] for i in df_params[column_name]]
3
A.Kot