web-dev-qa-db-fra.com

Comment ajouter une colonne cumulative à une trame de données R à l'aide de dplyr?

J'ai la même question que cet article , mais je veux utiliser dplyr:

Avec une trame de données R, par exemple:

df <- data.frame(id = rep(1:3, each = 5)
                 , hour = rep(1:5, 3)
                 , value = sample(1:15))

comment ajouter une colonne de somme cumulée qui correspond à l'id?

Sans dplyr la solution acceptée du post précédent est:

df$csum <- ave(df$value, df$id, FUN=cumsum)
38
Racing Tadpole

Comme ça?

df <- data.frame(id = rep(1:3, each = 5),
                 hour = rep(1:5, 3),
                 value = sample(1:15))

mutate(group_by(df,id), cumsum=cumsum(value))

Ou si vous utilisez l'opérateur de tuyauterie de dplyr:

df %>% group_by(id) %>% mutate(cumsum = cumsum(value))

Résultat dans les deux cas:

Source: local data frame [15 x 4]
Groups: id

   id hour value cumsum
1   1    1     4      4
2   1    2    14     18
3   1    3     8     26
4   1    4     2     28
5   1    5     3     31
6   2    1    10     10
7   2    2     7     17
8   2    3     5     22
9   2    4    12     34
10  2    5     9     43
11  3    1     6      6
12  3    2    15     21
13  3    3     1     22
14  3    4    13     35
15  3    5    11     46
65
Stephen Henderson