web-dev-qa-db-fra.com

Tracer la matrice de confusion dans R en utilisant ggplot

J'ai deux matrices de confusion avec des valeurs calculées vraie positive (tp), fausse positive (fp), vraie négative (tn) et fausse négative (fn), correspondant à deux méthodes différentes. Je veux les représenter comme  enter image description here

Je pense que la grille de facettes ou l’habillage de facettes peuvent le faire, mais j’ai du mal à démarrer. Voici les données de deux matrices de confusion correspondant à méthode1 et méthode2.

dframe<-structure(list(label = structure(c(4L, 2L, 1L, 3L, 4L, 2L, 1L, 
3L), .Label = c("fn", "fp", "tn", "tp"), class = "factor"), value = c(9, 
0, 3, 1716, 6, 3, 6, 1713), method = structure(c(1L, 1L, 1L, 
1L, 2L, 2L, 2L, 2L), .Label = c("method1", "method2"), class = "factor")), .Names = c("label", 
"value", "method"), row.names = c(NA, -8L), class = "data.frame")
7
Haroon Rashid

Cela pourrait être un bon début

library(ggplot2)
ggplot(data =  dframe, mapping = aes(x = label, y = method)) +
  geom_tile(aes(fill = value), colour = "white") +
  geom_text(aes(label = sprintf("%1.0f",value)), vjust = 1) +
  scale_fill_gradient(low = "white", high = "steelblue")

Edité

TClass <- factor(c(0, 0, 1, 1))
PClass <- factor(c(0, 1, 0, 1))
Y      <- c(2816, 248, 34, 235)
df <- data.frame(TClass, PClass, Y)

library(ggplot2)
ggplot(data =  df, mapping = aes(x = TClass, y = PClass)) +
  geom_tile(aes(fill = Y), colour = "white") +
  geom_text(aes(label = sprintf("%1.0f", Y)), vjust = 1) +
  scale_fill_gradient(low = "blue", high = "red") +
  theme_bw() + theme(legend.position = "none")

 enter image description here

13
MYaseen208

Une solution légèrement plus modulaire basée sur la réponse de MYaseen208. Pourrait être plus efficace pour les grands ensembles de données/la classification multinomiale:

confusion_matrix <- as.data.frame(table(predicted_class, actual_class))

ggplot(data = confusion_matrix
       mapping = aes(x = predicted_class,
                     y = Var2)) +
  geom_tile(aes(fill = Freq)) +
  geom_text(aes(label = sprintf("%1.0f", Freq)), vjust = 1) +
  scale_fill_gradient(low = "blue",
                      high = "red",
                      trans = "log") # if your results aren't quite as clear as the above example
3
data princess