J'essaie de créer un histogramme des valeurs de densité et de le superposer à la courbe d'une fonction de densité (et non à l'estimation de la densité).
En utilisant un exemple normal standard simple, voici quelques données:
x <- rnorm(1000)
Je peux faire:
q <- qplot( x, geom="histogram")
q + stat_function( fun = dnorm )
mais cela donne l'échelle de l'histogramme en fréquences et non en densités. avec ..density..
je peux obtenir la bonne échelle sur l'histogramme:
q <- qplot( x,..density.., geom="histogram")
q
Mais maintenant, cela donne une erreur:
q + stat_function( fun = dnorm )
Y a-t-il quelque chose que je ne vois pas?
Une autre question, est-il possible de tracer la courbe d’une fonction, telle que curve()
, mais pas en tant que couche?
Voici!
# create some data to work with
x = rnorm(1000);
# overlay histogram, empirical density and normal density
p0 = qplot(x, geom = 'blank') +
geom_line(aes(y = ..density.., colour = 'Empirical'), stat = 'density') +
stat_function(fun = dnorm, aes(colour = 'Normal')) +
geom_histogram(aes(y = ..density..), alpha = 0.4) +
scale_colour_manual(name = 'Density', values = c('red', 'blue')) +
theme(legend.position = c(0.85, 0.85))
print(p0)
Une alternative plus simple que la réponse de Ramnath, dépassant la moyenne et l'écart type observés et utilisant ggplot
au lieu de qplot
:
df <- data.frame(x = rnorm(1000, 2, 2))
# overlay histogram and normal density
ggplot(df, aes(x)) +
geom_histogram(aes(y = stat(density))) +
stat_function(
fun = dnorm,
args = list(mean = mean(df$x), sd = sd(df$x)),
lwd = 2,
col = 'red'
)
Qu'en est-il d'utiliser geom_density()
à partir de ggplot2
? Ainsi:
df <- data.frame(x = rnorm(1000, 2, 2))
ggplot(df, aes(x)) + geom_histogram(aes(y=..density..)) + geom_density(col = "red")