Je veux créer un dictionnaire à partir des valeurs, je reçois des cellules Excel, mon code est ci-dessous,
wb = xlrd.open_workbook('foo.xls')
sh = wb.sheet_by_index(2)
for i in range(138):
cell_value_class = sh.cell(i,2).value
cell_value_id = sh.cell(i,0).value
et je veux créer un dictionnaire, comme ci-dessous, qui se compose des valeurs provenant des cellules Excel;
{'class1': 1, 'class2': 3, 'class3': 4, 'classN':N}
Une idée sur la façon dont je peux créer ce dictionnaire?
d = {}
wb = xlrd.open_workbook('foo.xls')
sh = wb.sheet_by_index(2)
for i in range(138):
cell_value_class = sh.cell(i,2).value
cell_value_id = sh.cell(i,0).value
d[cell_value_class] = cell_value_id
ou vous pouvez essayer pandas
from pandas import *
xls = ExcelFile('path_to_file.xls')
df = xls.parse(xls.sheet_names[0])
print df.to_dict()
Ce script vous permet de transformer un tableau de données Excel en une liste de dictionnaires:
import xlrd
workbook = xlrd.open_workbook('foo.xls')
workbook = xlrd.open_workbook('foo.xls', on_demand = True)
worksheet = workbook.sheet_by_index(0)
first_row = [] # The row where we stock the name of the column
for col in range(worksheet.ncols):
first_row.append( worksheet.cell_value(0,col) )
# transform the workbook to a list of dictionaries
data =[]
for row in range(1, worksheet.nrows):
Elm = {}
for col in range(worksheet.ncols):
Elm[first_row[col]]=worksheet.cell_value(row,col)
data.append(Elm)
print data
Vous pouvez utiliser Pandas pour ce faire. Importez pandas et lisez l'Excel en tant que pandas dataframe.).
import pandas as pd
file_path = 'path_for_your_input_Excel_sheet'
df = pd.read_Excel(file_path, encoding='utf-16')
Vous pouvez utiliser pandas.DataFrame.to_dict
Pour convertir un pandas dataframe en dictionnaire. Trouvez la documentation pour le même ici
df.to_dict()
Cela vous donnerait un dictionnaire de la feuille Excel que vous lisez.
Exemple générique:
df = pd.DataFrame({'col1': [1, 2],'col2': [0.5, 0.75]},index=['a', 'b'])
>>> df
col1 col2 a 1 0.50 b 2 0.75
>>> df.to_dict()
{'col1': {'a': 1, 'b': 2}, 'col2': {'a': 0.5, 'b': 0.75}}
J'irais pour:
wb = xlrd.open_workbook('foo.xls')
sh = wb.sheet_by_index(2)
lookup = dict(Zip(sh.col_values(2, 0, 138), sh.col_values(0, 0, 138)))
si vous pouvez le convertir en csv, cela est très approprié.
import dataconverters.commas as commas
filename = 'test.csv'
with open(filename) as f:
records, metadata = commas.parse(f)
for row in records:
print 'this is row in dictionary:'+row