web-dev-qa-db-fra.com

Les mêmes étiquettes sont requises sur toutes les questions dans une échelle Likert?

Je prépare une enquête UX qui utilisera une échelle de Likert.

Personnellement, je préfère utiliser la même configuration d'étiquettes pour toutes les questions/éléments tels que:

1. Strongly disagree
2. Disagree
3. Neither agree nor disagree
4. Agree
5. Strongly agree

Maintenant, comme c'est un travail collaboratif, certains de mes collègues ont ajouté des questions qui utilisent des étiquettes différentes (pour la fréquence des tâches par exemple) et parfois dans un ordre différent.

Mon instinct est que nous devrions modifier les questions afin que toutes les étiquettes de choix soient exactement les mêmes sur l'ensemble de l'enquête.

Ou je m'en soucie trop?

3
majimekun

Avoir le même ordre importe. Ce devrait être la même échelle et le même ordre tout au long de l'enquête. Sinon, vous ne pouvez pas être sûr que votre utilisateur a compris ce qu'il a répondu.

Je considérerais l'utilisation d'une option de réponse à nombre pair dans une échelle de Likert à 4 points forçant les utilisateurs à prendre une position active sur les questions posées. Avoir une option "ni/ni" quelque part au milieu peut être utilisé comme réponse "pas sûr" ou "sans opinion". Sur l'échelle à 4 points, vous pouvez ajouter l'une de ces options pour clarifier ce que l'utilisateur pense. De cette façon, le résultat de votre enquête sera plus valide.

5 points ou 4 points est votre décision, mais décidez laquelle utiliser.

3
Benny Skogberg

Sur le plan de l'information, l'idéal serait d'avoir une échelle de valeurs bien connectée à la question à laquelle on répond. Par exemple, "À quelle fréquence faites-vous de l'exercice?" avoir "quotidiennement, deux fois par semaine, deux fois par mois, rarement" comme options aurait du sens pour le lecteur. Évitez de réécrire les questions pour utiliser les mêmes options partout.

Pour ce qui est de l'utilisabilité, il est important de maintenir un ordre cohérent des informations. Les utilisateurs s'y habituent rapidement au fur et à mesure qu'ils répondent aux questions. Selon la façon dont les questions sont formulées et la liste des options données, les utilisateurs supposent que la première est toujours "le maximum" (tout à fait d'accord/quotidien/très difficile) et la dernière est toujours "le minimum" (fortement en désaccord/rarement/Très facile) - avant de lire les informations réelles. Cela peut être l'inverse, mais devrait être cohérent dans toutes les questions.

Les gens décident généralement de leur réponse à partir de la question elle-même, avant de lire les options, puis choisissent une réponse dans la liste qui correspond le mieux à celle qu'ils avaient en tête.

2
pushpoth

Non, vous n'êtes pas obligé d'utiliser la même échelle de réponses.

Dans une enquête, vous mesurez différentes variables. Chaque variable est mesurée par un certain nombre de métriques, par ex. tilisabilité peut être mesurée par les métriques apprentissage, facilité d'utilisation et ainsi de suite. Différentes mesures peuvent et auront différentes unités. Ce n'est pas si différent qu'en physique, où le temps est mesuré en secondes et la distance en mètres.

Comme vous travaillez avec des variables autodéclarées, vous disposez d'une certaine latitude pour obtenir des informations sur certaines mesures. Vous pouvez demander "Quelle difficulté avez-vous eu à apprendre à utiliser notre produit" et utiliser une échelle allant de "Beaucoup" à "Aucune", ou vous pouvez dire "Le produit a été difficile à apprendre", et utilisez un échelle allant de "Tout à fait en désaccord" à "Tout à fait d'accord". Tant que vous pouvez rendre les deux échelles équivalentes *, il n'y a pas de différence dans les informations finales. C'est comme choisir entre mesurer la distance en mètres ou en yards, vous obtenez les mêmes informations.

Vous devez mesurer la même métrique de la même manière. Cela signifie que si vous effectuez deux études à un an d'intervalle, la comparabilité des résultats entre les études sera considérablement réduite si vous choisissez une échelle pour la première étude et l'autre pour la deuxième étude. Mais entre les variables, ce problème n'existe pas. Il n'y a pas de comparabilité inhérente entre la fréquence des tâches (qui est mesurée en répétitions par unité de temps) et par ex. la capacité d'apprentissage (qui est mesurée dans une mesure ordinale sans unité), ou même entre différentes métriques mesurées avec une mesure ordinale sans unité. Il n'y a donc rien de mal à mesurer les différentes métriques à différentes échelles, vous ne perdez rien en termes de comparabilité. Du point de vue de l'évaluation, il n'y a aucune raison d'utiliser les mêmes échelles.

Il y a ensuite la question des utilisateurs. Allez-vous les confondre si vous utilisez des échelles différentes? Je ne pense pas que cela se produira. Je ne l'ai pas vu se produire dans mes propres études. Le monde regorge également d'autres exemples. Mon supermarché préféré vend des kiwis à la pièce, des oranges au kilogramme, des œufs au paquet de six pièces et du fromage emballés dans des emballages de taille arbitraire. Aucun des clients ne s'y perd. Nous sommes habitués à utiliser différentes unités pour différentes choses tout le temps. De même pour votre questionnaire - vous mesurez différentes choses, donc les mesurer avec une échelle différente ne déroutera personne.

[*] En ce qui concerne l'équivalence des échelles: les échelles d'accord-en désaccord sont parfois moins expressives que les échelles plus directes. Si vous mesurez l'opinion de l'utilisateur sur le niveau actuel d'un attribut de votre produit, ils sont mauvais. Par exemple, demander "Comment pensez-vous de la longueur de notre newsletter" peut avoir une échelle allant de "trop ​​longue" à "trop ​​courte", ce qui est plus expressif que de dire "Je pense que votre newsletter a juste la bonne longueur" puis avoir une échelle d'accord-pas d'accord.

2
Rumi P.

(Oui, je suis en retard à la foire, mais peut-être que quelqu'un à l'avenir trouvera cela utile)

Si vous utilisez une échelle Likert, retournez les extrémités afin de ne pas obtenir de réponse de fixation.

Mais une meilleure approche consiste à penser en termes de ce que vous essayez de faire plutôt que comment vous allez le faire. N'oubliez pas le dicton Bauhaus: la forme suit la fonction. Une fois que vous maîtrisez le "quoi", le "comment" peut devenir évident.

Les échelles Likert et Osgood ("Sémantique Différentielle") cherchent à exploiter l'évaluation floue. Évaluation non binaire. Et ils présentent tous deux à l'intimé un continuum.

Si vous avez des points clairement contigus sur le continuum, une échelle de Likert fonctionnera. Mais assurez-vous que les points sont en fait contigus et n'ont ni lacunes ni chevauchements. L'exemple d'exercice de Pushpoth est celui où les choix sont pas contigus: que devrait marquer la personne si elle fait de l'exercice de façon irrégulière? Ou trois fois par semaine? Devoir choisir une réponse qui ne reflète pas la réalité est assez frustrant! Et bien sûr, ne fait aucun sens de toutes les conclusions que l'on essaie de tirer des données.

Si vous ne pouvez pas rendre les étapes intermédiaires contiguës, envisagez plutôt une échelle Osgood (SD), où les points intermédiaires ne sont pas étiquetés.

0
MMacD