web-dev-qa-db-fra.com

Seaborn load_dataset

J'essaie de faire fonctionner une boîte à moustaches groupée en utilisant Seaborn conformément au exemple

Je peux obtenir l’exemple ci-dessus, mais la ligne:

tips = sns.load_dataset("tips")

n'est pas expliqué du tout. J'ai localisé le fichier tips.csv, mais je n'arrive pas à trouver une documentation adéquate sur ce que fait spécifiquement load_dataset. J'ai essayé de créer mon propre csv et de le charger, mais en vain. J'ai également renommé le fichier de conseils et cela fonctionnait toujours ... 

Ma question est donc:

load_dataset cherche-t-il réellement des fichiers? Puis-je l'utiliser pour mes propres boîtes à moustaches? 

EDIT: J'ai réussi à faire fonctionner mes propres boîtes à moustaches avec ma propre variable DataFrame, mais je me demande toujours si load_dataset est utilisé pour autre chose que de mystérieux exemples de didacticiels.

36
Arsibalt

load_dataset recherche les fichiers csv en ligne sur https://github.com/mwaskom/seaborn-data . Voici la docstring:

Chargez un jeu de données à partir du référentiel en ligne (nécessite Internet).

Paramètres


nom: str Nom du jeu de données (name. Csv on https://github.com/mwaskom/seaborn-data ). Vous pouvez obtenir la liste de jeux de données disponibles utilisant: func: get_dataset_names

kws: dict, optionnel Transmis à pandas.read_csv

Si vous souhaitez modifier cet ensemble de données en ligne ou importer vos propres données, vous devrez probablement utiliser pandas . load_dataset renvoie en fait un objet pandas DataFrame, que vous pouvez confirmer avec type(tips).

Si vous avez déjà créé vos propres données dans un fichier csv appelé, par exemple, tips2.csv, et que vous les avez sauvegardées au même emplacement que votre script, utilisez ceci (après avoir installé des pandas) pour le charger:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')
49
selwyth

Juste pour ajouter à la réponse de «selwyth».

import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)

Une fois que vous avez terminé ces étapes avec succès… .. Maintenant, le traçage fonctionne comme ceci.

Disons que vous voulez tracer un graphique en barres.

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

Cela fonctionne réellement avec chaque complot dans Seaborn.

De plus, nous ne pourrons pas ajouter notre propre jeu de données sur Seaborn Git.

3
Sahil Nagpal

Téléchargez tous les fichiers csv (zippés) à utiliser pour votre exemple à partir de ici .

Extrayez le fichier Zip dans un répertoire local et lancez votre bloc-notes jupyter à partir du même répertoire . Exécutez les commandes suivantes dans le bloc-notes jupyter:

import pandas as pd
tips = pd.read_csv('seaborn-data-master/tips.csv')

vous êtes bon de travailler avec votre exemple maintenant!

0
raahool007