web-dev-qa-db-fra.com

ggplot remplace le nombre par le pourcentage dans geom_bar

J'ai un dataframe d:

> head(d,20)
   groupchange Symscore3
1            4         1
2            4         2
3            4         1
4            4         2
5            5         0
6            5         0
7            5         0
8            4         0
9            2         2
10           5         0
11           5         0
12           5         1
13           5         0
14           4         1
15           5         1
16           1         0
17           4         0
18           1         1
19           5         0
20           4         0

Que je complote avec:

ggplot(d, aes(groupchange, y=..count../sum(..count..),  fill=Symscore3)) +
  geom_bar(position = "dodge") 

De cette façon, chaque barre représente son pourcentage sur l'ensemble des données.

Au lieu de cela, je voudrais que chaque barre représente un pourcentage relatif; c'est-à-dire la somme de la barre obtenue avec groupchange = k devrait être 1.

16
Donbeo

Récapitulez et transformez d'abord vos données:

library(dplyr)
d2 <- d %>% 
  group_by(groupchange,Symscore3) %>% 
  summarise(count=n()) %>% 
  mutate(perc=count/sum(count))

Ensuite, vous pouvez le tracer:

ggplot(d2, aes(x = factor(groupchange), y = perc*100, fill = factor(Symscore3))) +
  geom_bar(stat="identity", width = 0.7) +
  labs(x = "Groupchange", y = "percent", fill = "Symscore") +
  theme_minimal(base_size = 14)

cela donne:

enter image description here


Vous pouvez également utiliser la fonction percent du package scales:

brks <- c(0, 0.25, 0.5, 0.75, 1)

ggplot(d2, aes(x = factor(groupchange), y = perc, fill = factor(Symscore3))) +
  geom_bar(stat="identity", width = 0.7) +
  scale_y_continuous(breaks = brks, labels = scales::percent(brks)) +
  labs(x = "Groupchange", y = NULL, fill = "Symscore") +
  theme_minimal(base_size = 14)

qui donne:

enter image description here

29
Jaap

Si votre objectif est la visualisation en code minimal, utilisez position = "fill" comme argument dans geom_bar().

Si vous voulez des pourcentages au sein du groupe, la réponse à la réponse dplyr de @ Jaap est la voie à suivre.

Voici un exemple reproductible utilisant l'ensemble de données ci-dessus pour copier/coller:

library(tidyverse)

d <- data_frame(groupchange = c(4,4,4,4,5,5,5,4,2,5,5,5,5,4,5,1,4,1,5,4),
                Symscore3 = c(1,2,1,2,0,0,0,0,2,0,0,1,0,1,1,0,0,1,1,0))

ggplot(d, aes(x = factor(groupchange), fill = factor(Symscore3))) +
  geom_bar(position="fill")

enter image description here

12
Rich Pauloo