Désolé, je suis nouveau sur WEKA et j'apprends.
Dans ma sortie de classificateur d'arbre de décision (J48), il y a une matrice de confusion:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
Je le dirais ainsi:
La matrice de confusion est Weka rapportant à quel point ce modèle J48 est bon en termes de ce qu'il obtient bien et ce qu'il se passe mal.
Dans vos données, la variable cible était "fonctionnelle" ou "non fonctionnelle"; le côté droit de la matrice vous indique que la colonne "a" est fonctionnelle et "b" est non fonctionnelle.
Les colonnes vous indiquent comment votre modèle a classé vos échantillons - c'est ce que le modèle a prédit:
Les rangées, en revanche, représentent la réalité:
Connaissant les colonnes et les lignes, vous pouvez creuser dans les détails:
Donc, en haut à gauche et en bas à droite de la matrice, les choses sont correctes pour votre modèle.
En bas à gauche et en haut à droite de la matrice indiquent où votre modèle est confus.
Avez-vous lu la page wikipedia sur les matrices de confusion ? Le texte autour de la matrice est disposé légèrement différemment dans leur exemple (étiquettes de ligne à gauche plutôt qu'à droite), mais vous le lisez tout de même.
La ligne indique la vraie classe, la colonne indique la sortie du classificateur. Chaque entrée donne alors le nombre d'instances de <row>
qui ont été classés comme <column>
. Dans votre exemple, 15 Bs ont été (incorrectement) classés comme As, 150 Bs ont été correctement classés comme Bs, etc.
Par conséquent, toutes les classifications correct sont dans la diagonale en haut à gauche à en bas à droite. Tout ce qui est hors de cette diagonale est une classification incorrecte.
Modifier : La page Wikipedia a depuis inversé les lignes et les colonnes. Ça arrive. Lorsque vous étudiez une matrice de confusion, assurez-vous toujours de vérifier les étiquettes pour voir s'il s'agit de véritables classes en lignes, de classes prédites en colonnes ou inversement.