comment importer des données Excel dans une trame de données en python.
Fondamentalement, le classeur Excel actuel exécute certains vba à l'ouverture qui actualise un tableau croisé dynamique et fait d'autres choses.
Ensuite, je souhaite importer les résultats de l'actualisation du tableau croisé dynamique dans une trame de données en python pour une analyse plus approfondie.
import xlrd
wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
#sheetnames
print wb.sheet_names()
#number of sheets
print wb.nsheets
L'actualisation et l'ouverture du fichier fonctionnent bien. Mais comment puis-je sélectionner les données de la première feuille de la ligne 5, y compris l'en-tête jusqu'au dernier enregistrement n.
Vous pouvez utiliser la méthode ExcelFile de pandas parse
pour lire les feuilles Excel, voir io docs :
xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])
skiprows
ignorera les 4 premières lignes (c'est-à-dire commence à l'index de ligne 4) et plusieurs autres options .
La réponse acceptée est ancienne (comme indiqué dans les commentaires de la réponse acceptée). Maintenant, l'option préférée utilise pd.read_Excel ()