web-dev-qa-db-fra.com

Quelles sont les différences entre Pandas et NumPy + SciPy en Python?

Ils semblent tous deux extrêmement similaires et je suis curieux de savoir quel forfait serait le plus bénéfique pour l'analyse des données financières.

184
user1462733

En effet, pandas fournit des outils de manipulation de données de haut niveau construits sur NumPy. NumPy en lui-même est un outil de bas niveau et ressemblera beaucoup à l'utilisation de MATLAB. pandas quant à lui, offre une riche fonctionnalité en séries chronologiques, l'alignement des données, des statistiques adaptées aux NA, des méthodes de groupby, de fusion et de jointure, ainsi que de nombreuses autres commodités. Il est devenu très populaire ces dernières années dans les applications financières. J'aurai un chapitre consacré à l'analyse des données financières en utilisant pandas dans mon prochain livre.

285
Wes McKinney

Numpy est requis par pandas (et par pratiquement tous les outils numériques pour Python). Scipy n'est pas strictement requis pour pandas, mais est répertorié comme une "dépendance facultative". Je ne dirais pas que pandas est une alternative à Numpy et/ou à Scipy. C'est plutôt un outil supplémentaire qui offre un moyen plus simple de travailler avec des données numériques et tabulaires en Python. Vous pouvez utiliser pandas structures de données mais utiliser librement les fonctions Numpy et Scipy pour les manipuler.

55
BrenBarn

Les pandas offrent un excellent moyen de manipuler les tables, car vous pouvez faciliter le binning ( binning un dataframe dans pandas en Python ) et calculer des statistiques. Une autre bonne chose dans pandas est la classe Panel qui permet de joindre des séries de couches avec différentes propriétés et de les combiner à l'aide de la fonction groupby.

3
Iury Sousa