web-dev-qa-db-fra.com

dplyr: générer un numéro de ligne / position de ligne dans group_by

J'ai un jeu de données et je veux générer la position de la ligne par groupe. Par exemple

library(data.table)

data<-data.table(Position=c(1,2,3,4,5,6,7,8,9,10),
Category=c("M","M","M","M","F","F","F","M","M","F"))

Je regroupe par catégorie et souhaite créer une colonne qui correspond à la position de la ligne par groupe. Quelque chose comme ci-dessous ou avec data.table

dataByGroup %>% group_by(Category) %>% mutate(positionInCategory = 1:nrow(Category))

Vous ne savez pas comment y parvenir?

Sortie désirée:

| Position|Category | positionInCategory|
|--------:|:--------|------------------:|
|        1|M        |                  1|
|        2|M        |                  2|
|        3|M        |                  3|
|        4|M        |                  4|
|        5|F        |                  1|
|        6|F        |                  2|
|        7|F        |                  3|
|        8|M        |                  5|
|        9|M        |                  6|
|       10|F        |                  4|
15
iboboboru

Essayez ce qui suit:

library(data.table)
library(dplyr)

data<-data.table(Position=c(1,2,3,4,5,6,7,8,9,10),
                 Category=c("M","M","M","M","F","F","F","M","M","F"))

cleanData <- data %>%
  group_by(Category) %>%
  mutate(positionInCategory = 1:n())
22
user1357015

Essayer

data[, new := rowid(Category)]
# or, if you're using 1.9.6 or older
data[, new := 1:.N, by=Category]

    Position Category new
 1:        1        M   1
 2:        2        M   2
 3:        3        M   3
 4:        4        M   4
 5:        5        F   1
 6:        6        F   2
 7:        7        F   3
 8:        8        M   5
 9:        9        M   6
10:       10        F   4

Pour utiliser rowid, vous aurez actuellement besoin de la version instable/devel du paquet .

6
Frank