web-dev-qa-db-fra.com

lire Excel dans une trame de données python à partir de la ligne 5 et y compris les en-têtes

comment importer des données Excel dans une trame de données en python.

Fondamentalement, le classeur Excel actuel exécute certains vba à l'ouverture qui actualise un tableau croisé dynamique et fait d'autres choses.

Ensuite, je souhaite importer les résultats de l'actualisation du tableau croisé dynamique dans une trame de données en python pour une analyse plus approfondie.

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

L'actualisation et l'ouverture du fichier fonctionnent bien. Mais comment puis-je sélectionner les données de la première feuille de la ligne 5, y compris l'en-tête jusqu'au dernier enregistrement n.

21
IcemanBerlin

Vous pouvez utiliser la méthode ExcelFile de pandas parse pour lire les feuilles Excel, voir io docs :

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows ignorera les 4 premières lignes (c'est-à-dire commence à l'index de ligne 4) et plusieurs autres options .

31
Andy Hayden

La réponse acceptée est ancienne (comme indiqué dans les commentaires de la réponse acceptée). Maintenant, l'option préférée utilise pd.read_Excel ()

10
rrawat