Importation de données à partir d'un fichier Excel à l'aide de python vers SQL Server

Question

J'ai trouvé d'autres questions qui ont une erreur similaire à celle que je reçois, mais je n'ai pas été en mesure de résoudre le problème en fonction des réponses. J'essaie d'importer un fichier Excel dans SQL Server à l'aide de python. C'est le code que j'ai écrit:

import pandas as pd import numpy as np import pandas.io.sql import pyodbc import xlrd server = "won't disclose private info" db = 'private info' conn = pyodbc.connect('DRIVER={SQL Server};SERVER=' + Server + ';DATABASE=' + db + ';Trusted_Connection=yes') cursor = conn.cursor() book = xlrd.open_workbook("Daily Flash.xlsx") sheet = book.sheet_by_name("Sheet1") query1 = """CREATE TABLE [LEAF].[MK] ([LEAF][Lease_Number] varchar(255), [LEAF][Start_Date] varchar(255), [LEAF][Report_Status] varchar(255), [LEAF] [Status_Date] varchar(255), [LEAF][Current_Status] varchar(255), [LEAF] [Sales_Rep] varchar(255), [LEAF][Customer_Name] varchar(255),[LEAF] [Total_Finance] varchar(255), [LEAF][Rate_Class] varchar(255) ,[LEAF][Supplier_Name] varchar(255) ,[LEAF] [DecisionStatus] varchar(255))""" query = """INSERT INTO [LEAF].[MK] (Lease_Number, Start_Date, Report_Status, Status_Date, Current_Status, Sales_Rep, Customer_Name,Total_Finance, Rate_Class,Supplier_Name,DecisionStatus) VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)""" for r in range(1, sheet.nrows): Lease_Number = sheet.cell(r,0).value Start_Date = sheet.cell(r,1).value Report_Status = sheet.cell(r,2).value Status_Date = sheet.cell(r,3).value Current_Status= sheet.cell(r,4).value Sales_Rep = sheet.cell(r,5).value Customer_Name = sheet.cell(r,6).value Total_Financed= sheet.cell(r,7).value Rate_Class = sheet.cell(r,8).value Supplier_Name = sheet.cell(r,9).value DecisionStatus= sheet.cell(r,10).value values = (Lease_Number, Start_Date, Report_Status, Status_Date, Current_Status, Sales_Rep, Customer_Name, Total_Financed, Rate_Class, Supplier_Name, DecisionStatus) cursor.execute(query1) cursor.execute(query, values) database.commit() database.close() database.commit()

Le message d'erreur que je reçois est le suivant:

ProgrammingError Traceback (most recent call last) <ipython-input-24-c525ebf0af73> in <module>() 16 17 # Execute sql Query ---> 18 cursor.execute(query, values) 19 20 # Commit the transaction ProgrammingError: ('The SQL contains 0 parameter markers, but 11 parameters were supplied', 'HY000')

Quelqu'un peut-il m'expliquer le problème et comment je peux le résoudre? Je vous remercie!

Mettre à jour:

J'ai eu ce message d'erreur à partir basé sur les commentaires ci-dessous. J'ai également modifié ma requête parce que la table dans laquelle je tente d'insérer des valeurs n'avait pas encore été créée. J'ai donc mis à jour mon code pour tenter de le créer.

Cependant, je reçois maintenant le message d'erreur:

ProgrammingError: ('42000', '[42000] [Microsoft][ODBC SQL Server Driver][SQL Server]The specified schema name "dbo" either does not exist or you do not have permission to use it. (2760) (SQLExecDirectW)')

J'ai essayé de changer cela légèrement en écrivant CREATE [HELLO] [MK] au lieu de simplement CREATE MK, mais cela me dit que MK est déjà dans la base de données ... Quelles étapes dois-je prendre ensuite?

Scratch&#39;N&#39;Purr · Accepted Answer

Sur la base de la conversation que nous avons eue dans notre chat, voici quelques points à retenir:

Après avoir exécuté votre requête CREATE TABLE, assurez-vous de la valider immédiatement avant d'exécuter les requêtes INSERT suivantes.
Utilisez la détection d'erreur pour les cas où la table existe déjà dans la base de données. Vous avez demandé que, si vous vouliez importer plus de données dans la table, le script soit toujours exécuté. La réponse est non, car Python va lancer une exception à cursor.execute(query1).
Si vous souhaitez valider si vos opérations d'insertion ont réussi, vous pouvez effectuer une simple vérification du nombre d'enregistrements.

EDIT Hier, lorsque @mkheifetz a testé mon code, il a détecté un bogue mineur qui rendait la vérification de validation fausse. contre les données actuelles importées, la validation échouerait. Par conséquent, en tant que solution au problème, j'ai modifié le code à nouveau.

Voici comment je modifierais votre code:

import pandas as pd import numpy as np import seaborn as sns import scipy.stats as stats import matplotlib.pyplot as plt import pandas.io.sql import pyodbc import xlrd server = 'XXXXX' db = 'XXXXXdb' # create Connection and Cursor objects conn = pyodbc.connect('DRIVER={SQL Server};SERVER=' + server + ';DATABASE=' + db + ';Trusted_Connection=yes') cursor = conn.cursor() # read data data = pd.read_Excel('Flash Daily Apps through 070918.xls') # rename columns data = data.rename(columns={'Lease Number': 'Lease_Number', 'Start Date': 'Start_Date', 'Report Status': 'Report_Status', 'Status Date': 'Status_Date', 'Current Status': 'Current_Status', 'Sales Rep': 'Sales_Rep', 'Customer Name': 'Customer_Name', 'Total Financed': 'Total_Financed', 'Rate Class': 'Rate_Class', 'Supplier Name': 'Supplier_Name'}) # export data.to_Excel('Daily Flash.xlsx', index=False) # Open the workbook and define the worksheet book = xlrd.open_workbook("Daily Flash.xlsx") sheet = book.sheet_by_name("Sheet1") query1 = """ CREATE TABLE [LEAF].[ZZZ] ( Lease_Number varchar(255), Start_Date varchar(255), Report_Status varchar(255), Status_Date varchar(255), Current_Status varchar(255), Sales_Rep varchar(255), Customer_Name varchar(255), Total_Finance varchar(255), Rate_Class varchar(255), Supplier_Name varchar(255), DecisionStatus varchar(255) )""" query = """ INSERT INTO [LEAF].[ZZZ] ( Lease_Number, Start_Date, Report_Status, Status_Date, Current_Status, Sales_Rep, Customer_Name, Total_Finance, Rate_Class, Supplier_Name, DecisionStatus ) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)""" # execute create table try: cursor.execute(query1) conn.commit() except pyodbc.ProgrammingError: pass # grab existing row count in the database for validation later cursor.execute("SELECT count(*) FROM LEAF.ZZZ") before_import = cursor.fetchone() for r in range(1, sheet.nrows): Lease_Number = sheet.cell(r,0).value Start_Date = sheet.cell(r,1).value Report_Status = sheet.cell(r,2).value Status_Date = sheet.cell(r,3).value Current_Status= sheet.cell(r,4).value Sales_Rep = sheet.cell(r,5).value Customer_Name = sheet.cell(r,6).value Total_Financed= sheet.cell(r,7).value Rate_Class = sheet.cell(r,8).value Supplier_Name = sheet.cell(r,9).value DecisionStatus= sheet.cell(r,10).value # Assign values from each row values = (Lease_Number, Start_Date, Report_Status, Status_Date, Current_Status, Sales_Rep, Customer_Name, Total_Financed, Rate_Class, Supplier_Name, DecisionStatus) # Execute sql Query cursor.execute(query, values) # Commit the transaction conn.commit() # If you want to check if all rows are imported cursor.execute("SELECT count(*) FROM LEAF.ZZZ") result = cursor.fetchone() print((result[0] - before_import[0]) == len(data.index)) # should be True # Close the database connection conn.close()