J'essaie de lire un fichier csv que j'ai stocké localement sur ma machine. (Juste pour la référence supplémentaire ce sont les données titanesques de Kaggle qui sont ici .)
À partir de this question et réponses, j’ai appris que vous pouvez importer des données à l’aide de ce code qui me convient parfaitement.
from google.colab import files
uploaded = files.upload()
Là où je suis perdu, c'est comment le convertir en dataframe à partir d'ici. Le exemple de page de cahier Google répertorié dans la réponse ci-dessus n'en parle pas.
J'essaie de convertir le dictionnaire uploaded
en dataframe à l'aide de la commande from_dict
mais je ne parviens pas à le faire fonctionner. Il y a des discussions sur la conversion de dict en dataframe ici mais les solutions ne me sont pas applicables (je pense).
En résumé, ma question est la suivante:
How do I convert a csv file stored locally on my files to pandas
datframe on google-colaboratory?
Les pandas read_csv
devraient faire l'affaire. Vous voudrez envelopper vos octets téléchargés dans un io.StringIO
puisque read_csv
attend un objet de type fichier.
Voici un exemple complet: https://colab.research.google.com/notebook#fileId=1JmwtF5OmSghC-y3-BkvxLan0zYXqCJJf
L'extrait de clé est:
import pandas as pd
import io
df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8')))
df
étape 1- Montez votre Google Drive sur Collaboratory
from google.colab import drive
drive.mount('/content/gdrive')
Étape 2- Vous verrez maintenant vos fichiers Google Drive dans le volet de gauche (Explorateur de fichiers). Cliquez avec le bouton droit sur le fichier que vous devez importer et sélectionnez Chemin de la copie. Puis importez comme d'habitude dans les pandas, en utilisant ce chemin copié.
import pandas as pd
df=pd.read_csv('gdrive/My Drive/data.csv')
Terminé!
Cela a fonctionné pour moi:
from google.colab import auth
auth.authenticate_user()
from pydrive.drive import GoogleDrive
from pydrive.auth import GoogleAuth
from oauth2client.client import GoogleCredentials
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'})
myfile.GetContentFile('file.csv')
Remplacez !!!YOUR FILE ID!!!
par l'id du fichier dans Google Drive (il s'agit de la longue chaîne alphanumérique qui apparaît lorsque vous cliquez sur "obtenir un lien à partager"). Ensuite, vous pouvez accéder à file.csv avec read_csv des pandas:
import pandas as pd
frm = pd.read_csv('file.csv', header=None)
Colab google: upload de csv depuis votre PC J'ai eu le même problème avec un fichier Excel (* .xlsx), j’ai résolu le problème comme suit et je pense que vous pourriez faire la même chose avec les fichiers csv: __.- Si vous avez un fichier dans votre lecteur PC appelé (fichier.xlsx), alors: 1- Téléchargez-le à partir de votre disque dur en utilisant ce code simple:
from google.colab import files
uploaded = files.upload()
Appuyez sur (Choisir les fichiers) et téléchargez-le sur votre lecteur Google.
2- Puis:
import io
data = io.BytesIO(uploaded['file.XLSX'])
3- Enfin, lisez votre dossier:
import pandas as pd
f = pd.read_Excel(data , sheet_name = '1min', header = 0, skiprows = 2)
#df.sheet_names
df.head()
4- Veuillez modifier les valeurs des paramètres pour lire votre propre fichier. Je pense que cela pourrait être généralisé pour lire d'autres types de fichiers!
Profitez-en!
Vous pouvez également utiliser github pour importer des fichiers également . Vous pouvez prendre cet exemple à titre d'exemple: https://drive.google.com/file/d/1D6ViUx8_ledfBqcxHCrFPcqBvNZitwCs/view?usp=sharing
De plus, Google ne conserve pas le fichier plus longtemps. Vous devrez peut-être exécuter les extraits de github à plusieurs reprises.