J'ai le DataFrame suivant:
poste client1 poste2 poste3 1 Apple lait tomate 2 eau orange pomme de terre 3 jus de chips de mangue
que je veux traduire en liste de dictionnaires par ligne
rows = [{'customer': 1, 'item1': 'Apple', 'item2': 'milk', 'item3': 'tomato'},
{'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
{'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]
Comme John Galt le mentionne dans sa réponse , vous devriez probablement plutôt utiliser df.to_dict('records')
. C'est plus rapide que de transposer manuellement.
In [20]: timeit df.T.to_dict().values()
1000 loops, best of 3: 395 µs per loop
In [21]: timeit df.to_dict('records')
10000 loops, best of 3: 53 µs per loop
Utilisez df.T.to_dict().values()
, comme ci-dessous:
In [1]: df
Out[1]:
customer item1 item2 item3
0 1 Apple milk tomato
1 2 water orange potato
2 3 juice mango chips
In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'Apple', 'item2': 'milk', 'item3': 'tomato'},
{'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
{'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]
Use df.to_dict('records')
- donne le résultat sans avoir à transposer en externe.
In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'Apple', 'item2': 'milk', 'item3': 'tomato'},
{'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
{'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]
En tant qu'extension de John Galt's answer -
Pour le DataFrame suivant,
customer item1 item2 item3
0 1 Apple milk tomato
1 2 water orange potato
2 3 juice mango chips
Si vous souhaitez obtenir une liste de dictionnaires comprenant les valeurs d'index, vous pouvez faire quelque chose comme,
df.to_dict('index')
Ce qui produit un dictionnaire de dictionnaires où les clés du dictionnaire parent sont des valeurs d’index. Dans ce cas particulier,
{0: {'customer': 1, 'item1': 'Apple', 'item2': 'milk', 'item3': 'tomato'},
1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}