Il semble que pd.rolling_mean
soit obsolète pour ndarrays
,
pd.rolling_mean(x, window=2, center=False)
FutureWarning: pd.rolling_mean est obsolète pour ndarrays et sera supprimé dans une version ultérieure
mais cela semble être le moyen le plus rapide de le faire, selon cette SO réponse .
Existe-t-il maintenant de nouvelles manières de le faire directement avec SciPy ou NumPy aussi rapides que pd.rolling_mean
?
EDIT - Malheureusement, il semble que la nouvelle méthode ne soit pas aussi rapide:
Nouvelle version des pandas:
In [1]: x = np.random.uniform(size=100)
In [2]: %timeit pd.rolling_mean(x, window=2)
1000 loops, best of 3: 240 µs per loop
In [3]: %timeit pd.Series(x).rolling(window=2).mean()
1000 loops, best of 3: 226 µs per loop
In [4]: pd.__version__
Out[4]: '0.18.0'
Ancienne version:
In [1]: x = np.random.uniform(size=100)
In [2]: %timeit pd.rolling_mean(x,window=2)
100000 loops, best of 3: 12.4 µs per loop
In [3]: pd.__version__
Out[3]: u'0.17.1'
Il semble que la nouvelle méthode utilise les méthodes de la classe DataFrame.rolling
(je suppose que vous êtes censé la penser un peu comme un groupby
): http://pandas.pydata.org/pandas-docs/version /0.18.0/whatsnew.html
par exemple.
x.rolling(window=2).mean()
essaye ça
x.rolling(window=2, center=False).mean()
Je suggère scipy.ndimage.filters.uniform_filter1d like dans mon answer à la question liée. C'est aussi beaucoup plus rapide pour les grands tableaux:
import numpy as np
from scipy.ndimage.filters import uniform_filter1d
N = 1000
x = np.random.random(100000)
%timeit pd.rolling_mean(x, window=N)
__main__:257: FutureWarning: pd.rolling_mean is deprecated for ndarrays and will be removed in a future version
The slowest run took 84.55 times longer than the fastest. This could mean that an intermediate result is being cached.
1 loop, best of 3: 7.37 ms per loop
%timeit uniform_filter1d(x, size=N)
10000 loops, best of 3: 190 µs per loop