Y a-t-il un équivalent de la fonction summary()
de R
dans numpy
?
numpy
a des fonctions std, mean et average séparément, mais a-t-il une fonction qui résume tout, comme summary
le fait dans R
?
Si trouvé this question qui se rapporte à pandas
et this article avec des équivalents R-to-numpy, mais il n'a pas ce que je recherche.
Non. Vous devrez utiliser pandas
.
R est pour le langage des statistiques, donc de nombreuses fonctionnalités de base dont vous avez besoin, comme summary()
et lm()
, sont chargées lorsque vous le démarrez. Python a de nombreuses utilisations, vous devez donc installer et importer les packages statistiques appropriés. numpy
n'est pas un package de statistiques - c'est pour le calcul numérique plus généralement, vous devez donc utilisez des packages comme pandas
, scipy
et statsmodels
pour permettre à Python de faire ce que R peut faire hors de la boîte.
import pandas as pd
data = pd.read_csv("data.csv", sep = ",")
data.head()
summary = data.describe()
summary = summary.transpose()
summary.head()