J'ai la même question que cet article , mais je veux utiliser dplyr
:
Avec une trame de données R, par exemple:
df <- data.frame(id = rep(1:3, each = 5)
, hour = rep(1:5, 3)
, value = sample(1:15))
comment ajouter une colonne de somme cumulée qui correspond à l'id?
Sans dplyr
la solution acceptée du post précédent est:
df$csum <- ave(df$value, df$id, FUN=cumsum)
Comme ça?
df <- data.frame(id = rep(1:3, each = 5),
hour = rep(1:5, 3),
value = sample(1:15))
mutate(group_by(df,id), cumsum=cumsum(value))
Ou si vous utilisez l'opérateur de tuyauterie de dplyr
:
df %>% group_by(id) %>% mutate(cumsum = cumsum(value))
Résultat dans les deux cas:
Source: local data frame [15 x 4]
Groups: id
id hour value cumsum
1 1 1 4 4
2 1 2 14 18
3 1 3 8 26
4 1 4 2 28
5 1 5 3 31
6 2 1 10 10
7 2 2 7 17
8 2 3 5 22
9 2 4 12 34
10 2 5 9 43
11 3 1 6 6
12 3 2 15 21
13 3 3 1 22
14 3 4 13 35
15 3 5 11 46