web-dev-qa-db-fra.com

pandas rééchantillonner la documentation

Je comprends donc parfaitement comment utiliser resample , mais la documentation ne permet pas d'expliquer les options.

Donc, la plupart des options de la fonction resample sont assez simples, à l'exception de ces deux:

  • règle: la chaîne de décalage ou l'objet représentant la conversion cible
  • comment: chaîne de caractères, méthode de sous-échantillonnage ou de rééchantillonnage, valeur par défaut de "moyenne"

Donc, en regardant autant d'exemples que j'ai trouvés en ligne, je peux voir pour règle que vous pouvez faire 'D' pour le jour, 'xMin' pour les minutes, 'xL' pour les millisecondes, mais c'est tout ce que j'ai pu trouver. .

car j'ai vu ce qui suit: 'first', np.max, 'last', 'mean' et 'n1n2n3n4...nx', où nx est la première lettre de chaque index de colonne.

Y a-t-il donc quelque part dans la documentation qui me manque qui affiche toutes les options pour la règle de pandas.resample et comment les entrées? Si oui, où parce que je ne pouvais pas le trouver. Si non, quelles sont toutes les options pour eux?

160
Ryan Saxe
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

Voir le documentation timeseries . Il comprend une liste de décalages (et décalages 'ancrés' ), ainsi qu'une section sur rééchantillonnage .

Notez qu'il n'y a pas de liste de toutes les différentes options how, car il peut s'agir de n'importe quelle fonction de tableau NumPy et toute fonction disponible via groupby dispatching peut être transmise à how de nom.

277
Matti John

Il y a plus que ça, mais vous cherchez probablement cette liste:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

Source: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

65
vonkohorn