Supposons que j'ai les données suivantes
df = data.frame(name=c("A", "B", "C", "D"), score = c(10, 10, 9, 8))
Je veux ajouter une nouvelle colonne avec le classement. Voilà ce que je fais:
df %>% mutate(ranking = rank(score, ties.method = 'first'))
# name score ranking
# 1 A 10 3
# 2 B 10 4
# 3 C 9 2
# 4 D 8 1
Cependant, mon résultat souhaité est:
# name score ranking
# 1 A 10 1
# 2 B 10 1
# 3 C 9 2
# 4 D 8 3
De toute évidence, rank
ne fait pas ce que je pense. Quelle fonction dois-je utiliser?
On dirait que vous cherchez dense_rank
de "dplyr" - mais appliqué dans un ordre inverse de ce que fait normalement rank
.
Essaye ça:
df %>% mutate(rank = dense_rank(desc(score)))
# name score rank
# 1 A 10 1
# 2 B 10 1
# 3 C 9 2
# 4 D 8 3
Autre solution lorsque vous devez appliquer le classement à toutes les variables (pas seulement une).
df = data.frame(name = c("A","B","C","D"),
score=c(10,10,9,8), score2 = c(5,1,9,2))
select(df, -name) %>% mutate_all(funs(dense_rank(desc(.))))