Je me demande simplement s'il est possible de charger des fichiers de données locaux (tels que des fichiers .xlsx ou .csv qui se trouvent sur mon lecteur google) dans Colaboratory?
L’exemple de chargement de fichiers locaux me laissait un peu perplexe, car il n’y avait pas de place pour spécifier un chemin de fichier. Tout ce que vous avez à faire est de copier et coller la recette pour le comprendre, mais pour être clair:
from google.colab import files
uploaded = files.upload()
ouvrira une fenêtre de dialogue de téléchargement dans laquelle vous pourrez parcourir et sélectionner vos fichiers locaux à télécharger.
Ensuite
for fn in uploaded.keys():
print('User uploaded file "{name}" with length {length} bytes'.format(
name=fn, length=len(uploaded[fn])))
vous montrera les clés pour accéder à ce que vous venez de télécharger.
Modifiez pour plus de précision: le dictionnaire uploaded
aura les clés des noms de fichiers sélectionnés. Ainsi, si vous sélectionnez par exemple un fichier my_test.txt
, vous pourrez accéder à ce fichier à l'aide de uploaded['my_test.txt']
.
Tout d'abord, l'exécution de cette cellule devrait créer un bouton "Choisir les fichiers" intégré
from google.colab import files
uploaded = files.upload()
Après avoir sélectionné vos fichiers, uploaded
sera un dictionnaire de clés (les noms de fichiers) et de valeurs (les objets de fichiers codés). Pour décoder les fichiers d’une bibliothèque telle que Pandas, essayez
import pandas as pd
import io
df = pd.read_csv(io.StringIO(uploaded['filename.csv'].decode('utf-8')))
Après cela, votre structure de données df
devrait être prête à fonctionner.
En présentant cela comme une alternative pour les personnes qui préfèrent une autre façon de télécharger plus de fichiers, cela vous permet essentiellement de télécharger vos fichiers via Google Drive.
Exécutez le code ci-dessous (trouvé ceci quelque part précédemment mais je ne trouve plus la source - remerciement de celui qui l'a écrit!):
!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse Fuse
from google.colab import auth
auth.authenticate_user()
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}
Cliquez sur le premier lien qui s'affiche pour vous inviter à vous connecter à Google. ensuite, un autre message apparaîtra pour vous demander l'autorisation d'accéder à votre Google Drive.
Ensuite, lancez ceci, ce qui crée un répertoire nommé 'lecteur' et lie votre Google Drive à celui-ci:
!mkdir -p drive
!google-drive-ocamlfuse drive
Si vous faites un !ls
maintenant, il y aura un répertoire drive
et si vous faites un !ls drive
, vous pourrez voir tout le contenu de votre Google Drive.
Ainsi, par exemple, si je sauvegarde mon fichier appelé abc.txt
dans un dossier appelé ColabNotebooks
de Google Drive, je peux désormais y accéder via un chemin drive/ColabNotebooks/abc.txt
.
Oui, tous ces scénarios sont pris en charge.
Pour des recettes permettant d’accéder aux fichiers locaux et aux fichiers Drive, consultez le Exemple d’exemple de bloc-notes .
Pour accéder aux fichiers xls
, vous souhaitez télécharger le fichier sur Google Sheets. Ensuite, vous pouvez utiliser les recettes gspread
dans le même exemple d’exemple de bloc-notes .
Une méthode récemment ajoutée pour télécharger des fichiers locaux consiste à utiliser l'onglet "Fichiers" dans le tiroir de droite.
De là, vous pouvez télécharger un fichier local en utilisant le bouton "Télécharger".
(Vous pouvez également télécharger des fichiers en cliquant dessus avec le bouton droit de la souris dans l’arborescence.)
C'est un processus en 2 étapes.
Étape 1: Commencez par appeler un sélecteur de fichier dans votre cahier colab avec le code suivant.
from google.colab import files
uploaded = files.upload()
cela vous mènera à une fenêtre du navigateur de fichiers
Étape 2: Pour charger le contenu du fichier dans Pandas Dataframe, utilisez le code suivant.
import pandas as pd
import io
df = pd.read_csv(io.StringIO(uploaded['iris.csv'].decode('utf-8')))
print(df)
Dites, vous avez un dossier sur votre lecteur Google nommé Colab
et un fichier csv
est situé à cet endroit . Pour charger ce fichier
import pandas as pd
titanic = pd.read_csv(“drive/Colab/Titanic.csv”)
titanic.head(5)
Avant cela, vous devrez peut-être exécuter la commande suivante:
Exécutez d'abord ces codes pour installer les bibliothèques nécessaires et effectuer les autorisations.
!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse Fuse
from google.colab import auth
auth.authenticate_user()
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}
Lorsque vous exécutez le code ci-dessus, vous devriez voir un résultat comme celui-ci:
Cliquez sur le lien, copiez le code de vérification et collez-le dans la zone de texte.
Après l'achèvement du processus d'autorisation,
montez votre Google Drive:
!mkdir -p drive
!google-drive-ocamlfuse drive
Pour obtenir les données de votre système sur colab, essayez ceci:
from google.colab import files
uploaded = files.upload()
Choisissez le fichier que vous voulez télécharger et appuyez sur Entrée, puis c'est fait. Par exemple, j'ai téléchargé une image et je l'ai affichée à l'aide du code ci-dessous:
import cv2
import numpy as np
from matplotlib import pyplot as plt
img = cv2.imread('image.jpg')
img_cvt = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_cvt)
plt.show()
Vous pouvez utiliser cette URL pour télécharger vos fichiers dans Google Colab:
https://colab.research.google.com/notebooks/io.ipynb#scrollTo=vz-jH8T_Uk2c
allez à Local file system>Downloading files to your local file system
.__, puis exécutez le code. Après cela, le bouton du navigateur apparaîtra pour vous permettre de télécharger vos fichiers depuis votre PC.
Pour charger des fichiers de données locaux dans Colab:
Méthode 1: méthode Google Drive
Monter Google Drive dans Colab
from google.colab import drive
drive.mount('/content/gdrive')
Alors-> path = "/gdrive/My Drive/filename"
Vous pouvez maintenant accéder aux fichiers Google Drive dans Google Colab.
Méthode 2: charge directe
from google.colab import files
def getLocalFiles():
_files = files.upload()
if len(_files) >0:
for k,v in _files.items():
open(k,'wb').write(v)
getLocalFiles()
Méthode 3: Utiliser les fichiers d'importation
from google.colab import files
uploaded = files.upload()