Voici un graphique de mon application qui est très trompeur:
Les élèves passent un test, puis ils apprennent le matériel, puis ils repassent le test. Nous voulons montrer les améliorations chez les étudiants qui ont des données avant et après le test.
Ce graphique montre les résultats, mais il est très trompeur car dans ce cas, un seul étudiant (sur 27) a réellement passé le post-test, et il a obtenu un 100%. Mais je pense que la plupart des gens qui envisagent cela penseraient que cela signifie que toute la classe a obtenu 100%.
Alors: comment puis-je présenter ces informations, mais aussi en incluant le fait que seulement 17 enfants ont passé le pré-test, et seulement 1 d'entre eux a passé le post-test? Le graphique doit donc montrer trois groupes:
J'ai reçu d'excellentes suggestions de tout le monde ici, mais je voulais publier ma propre réponse à propos de ma version finale parce que je pense qu'elle est sensiblement différente des solutions suggérées:
Il utilise un graphique à barres empilées pour afficher les catégories, et il montre également l'ensemble de la population, il est donc facile de voir la taille relative des catégories, ainsi que la ventilation à chacune des deuxième et troisième phases.
Le problème est que vous devez insérer 3 séries de données dans un seul graphique. Je suggérerais quelque chose dans ce sens:
Vous affichez le nombre de participants sous forme de barres, mais le taux de réussite est le remplissage d'une barre.
Vous pouvez également vérifier ds3.js . Ils ont beaucoup d'idées sur la représentation visuelle de données complexes.
"Nous voulons montrer les améliorations chez les étudiants qui ont des données avant et après le test."
Si tel est le but ultime de ce graphique, pour montrer la différence sur deux tests, alors il est inutile de montrer graphiquement ceux qui n'ont pris qu'une partie du test ou aucun des tests - ceux-ci peuvent être résumés dans un coin/en dehors du tableau avec du texte (c'est-à-dire pas commencé - 17, pas terminé - 12) Et cela à son tour fait moins de choses à tracer, ce qui est bien.
Prenez donc votre 1 point de données complet :-) (ok, ce sera mieux une fois que vous aurez plus de données), puis choisissez comment les afficher. Un moyen est un nuage de points - pré-score sur l'axe y, score post-axe x, dessiner sur une diagonale, n'importe qui à droite de la diagonale fait mieux post-score, n'importe qui à gauche fait pire. Si vous souhaitez afficher la différence dans l'ensemble du groupe, vous revenez à un graphique à barres, une barre affichant la moyenne/s.d. pré-score, l'autre post-score. Bien que lorsque vous êtes sur le point de dessiner seulement quelques points de données, il est temps de penser s'il vaut mieux simplement communiquer le résultat avec un nombre. ("le post est 5 + -2% meilleur que le précédent", etc.)
La meilleure astuce sur la conception de graphiques que je peux fournir est d'avoir un message très simple que vous pouvez voir en regardant la représentation visuelle des données, sinon cela va à l'encontre de l'objectif de clarté dans la communication et devient un exercice de conception visuelle. Avoir trop d'informations signifie souvent que vous devez de toute façon consulter d'autres graphiques, car il est difficile à comprendre ou trompeur de regarder le même graphique.
Pensez également en termes de scénarios les plus courants des données que vous êtes susceptible d'obtenir et des modèles/tendances que vous souhaitez rechercher (ou qui sont importants) lorsque vous concevez le graphique, afin que la conception la plus significative puisse être mise en œuvre . Lorsque vous avez beaucoup d'informations, un compromis est souvent nécessaire pour jongler avec les différents types ou volumes de données. Si ce que vous avez avec la différence entre les personnes qui passent le pré-test/post-test est souvent très similaire, ce n'est pas tellement une préoccupation. Le nombre de personnes qui passent le test est le problème quand il s'agit de moyennes, quel que soit le type de test, c'est donc un problème de quand il est significatif d'afficher des moyennes et comment les comparer.
La meilleure façon de commencer est probablement de créer une vue unique des données, puis de décider quelles combinaisons de données donnent la représentation visuelle la plus perspicace des informations plutôt que comment les combiner toutes pour commencer. Gardez également à l'esprit que vous voudrez peut-être faire d'autres types de comparaisons une fois que vous commencerez à accumuler plus de données au fil du temps, et que vous voudrez peut-être voir les comparaisons historiques et peut-être que le même graphique n'est pas utile pour cela, vous devez donc repenser présentation visuelle cohérente.
Je suis instructeur depuis plus de 18 ans et je fais des résultats de test pré-post depuis plus de 8 ans. Un instructeur est très probablement préoccupé par les améliorations entre le pré-test et le post-test, et toute autre donnée démographique (combien ont pris un ou les deux, etc.) serait d'un intérêt secondaire. Voici un tableau simple que j'utilise lorsque j'explique l'importance aux élèves:
Après y avoir réfléchi pendant environ un an, je me rends compte qu'une simple moyenne ne me fournit pas suffisamment d'informations. Par exemple, je suis intéressé par le nombre d'élèves qui obtiennent un score inférieur à la moyenne, échouent, réussissent à maîtriser, etc. Je voudrais donc un tableau de distribution des notes plus complet.
Vous ne mentionnez pas le format de votre graphique, mais si l'exploration était disponible, la distribution pourrait être affichée en cliquant sur l'une des barres.
Si l'exploration vers le bas n'est pas disponible, les distributions des notes peuvent être affichées sous le graphique que vous affichez en premier ou dans une autre section du rapport.
Le nombre d'élèves qui atteignent un niveau de maîtrise lors du pré-test pourrait également être intéressant.