web-dev-qa-db-fra.com

R summary () équivalent en numpy

Y a-t-il un équivalent de la fonction summary() de R dans numpy?

numpy a des fonctions std, mean et average séparément, mais a-t-il une fonction qui résume tout, comme summary le fait dans R?

Si trouvé this question qui se rapporte à pandas et this article avec des équivalents R-to-numpy, mais il n'a pas ce que je recherche.

31
iulian

Non. Vous devrez utiliser pandas.

R est pour le langage des statistiques, donc de nombreuses fonctionnalités de base dont vous avez besoin, comme summary() et lm(), sont chargées lorsque vous le démarrez. Python a de nombreuses utilisations, vous devez donc installer et importer les packages statistiques appropriés. numpy n'est pas un package de statistiques - c'est pour le calcul numérique plus généralement, vous devez donc utilisez des packages comme pandas, scipy et statsmodels pour permettre à Python de faire ce que R peut faire hors de la boîte.

5
Eoin

1. Charger Pandas dans la console et charger le fichier de données csv

import pandas as pd

data = pd.read_csv("data.csv", sep = ",")

2. Examinez les premières lignes de données

data.head() 

3. Calculer des statistiques sommaires

summary = data.describe()

4. Transposer les statistiques pour obtenir un format similaire à la fonction R summary ()

summary = summary.transpose()

5. Visualisez les statistiques récapitulatives dans la console

summary.head()
32
Thomas Hepner