web-dev-qa-db-fra.com

Tous les tests utilisateurs ne sont-ils pas essentiellement un moyen de déterminer comment les gens pensent que les choses devraient fonctionner?

Lors des tests utilisateurs, les utilisateurs sont souvent confrontés à de graves variations d'un produit et observés pour voir où ils excellaient et où ils avaient des problèmes. Les gens cliquent souvent dans des zones qui ne sont pas destinées à être cliquées, ou peuvent essayer d'atteindre un objectif d'une manière que vous n'aviez pas conçue. Maintenant, mettez-vous à leur place pendant un moment. Lorsque vous cliquez sur quelque chose, pourquoi le faites-vous? Vous le faites parce que soit l'interface a indiqué clairement quoi faire, soit vous comptez simplement sur la façon dont vous pensez que les choses devraient fonctionner.

Une fois les résultats rassemblés et analysés et les conclusions tirées, la recherche est publiée et devient factuelle informations que d'autres, comme nous sur ce site, utilisent pour aider à créer leurs produits et leurs interfaces.

Alors reculons un instant:

Tous les tests utilisateurs ne sont-ils pas essentiellement un moyen de recueillir la façon dont les utilisateurs pensent quelque chose devrait fonctionner et de tirer des conclusions de cette recherche? toutes les décisions qui sont prises pendant le test sont basées sur la façon dont l'utilisateur pense que l'interface fonctionne

Si c'est le cas, alors comment pensent-ils de la meilleure façon de faire quelque chose (comme sur ce site) souvent pris uniquement avec un grain de sel quand ils ne sont pas sauvegardés par les tests/recherches des utilisateurs? Oui, il est très vrai que l'utilisation de la recherche pour étayer votre affirmation renforce votre argument et dit essentiellement "je crois que cela et plus de 100 personnes dans cette étude sont d'accord avec moi". Mais en quoi est-ce différent que plus de 100 personnes soient d'accord avec votre opinion individuelle qui n'est pas soutenue par la recherche?

7
Matt Rockwell

Vous confondez "subjectif" et "peu fiable". Les tests d'utilisabilité visent à obtenir des informations fiables sur les réactions des personnes. Les opinions autodéclarées sont également subjectives et sont des indicateurs beaucoup moins fiables de la façon dont les autres réagiront à l'interface.

Si je teste 100 personnes et que leur opinion subjective est qu'elles détestent une interface, je suis sûr que les 100 prochaines personnes que je testerai vont également la détester. Ce sont des données fiables. Et c'est parce que les tests d'utilisabilité sont structurés pour éliminer une grande partie du manque de fiabilité.

Si je demande à 100 personnes "Détestez-vous cette interface?", Les données seront partout sur la carte:

  • Certaines personnes vont essayer l'interface et répondre au mieux de leurs capacités. Mais ils peuvent penser qu'ils doivent suggérer ou masquer leurs commentaires.
  • Certains voudront me faire plaisir et répondre oui ou non en conséquence.
  • Certains se sentiront comme s'ils ont fait du bon travail (et le disent), lorsque des preuves réelles révéleront qu'ils sont moins productifs, qu'ils ont fait plus d'erreurs ou autrement trouvés l'interface moins qu'idéale.
  • Certains détesteront quelque chose de périphérique à l'interface. (Pensez à toutes les critiques 1 étoile des appareils sur Amazon qui sont vraiment des critiques 1 étoile d'UPS ou de Fedex.)
  • Certains ne l'utiliseront même pas, mais se feront quand même une opinion. Ensuite, ils trouveront rétroactivement des raisons - cela peut leur sembler très réel!
  • Les personnes qui se sentent fortement sont beaucoup plus susceptibles de répondre. La "majorité silencieuse", cependant, constitue la majeure partie de vos utilisateurs.

Franchement, la plupart des gens sont très mauvais pour déclarer eux-mêmes les impressions précises d'une expérience.

Les tests d'utilisabilité préparent les utilisateurs au succès:

  • Nous contrôlons ce qu'ils vivent
  • Nous leur demandons d'expliquer leurs attentes et leurs actions
  • Nous avons la possibilité de les guider sur des chemins spécifiques
  • Nous avons la possibilité de poser des questions de suivi
  • Nous pouvons comparer des parties très spécifiques de l'interface pour comprendre pourquoi un utilisateur a une opinion ou une autre.

En bref: les tests d'utilisabilité sont un processus par lequel les professionnels peuvent atténuer les biais dans l'expérience subjective pour comprendre l'impact d'une conception.

17
Alex Feinman

C'est une question vraiment importante. Toutes les recherches ne sont pas créées également. Honnêtement, certaines études publiées sont fondamentalement idiotes, mais vous devez les évaluer chacune selon ses mérites, c'est pourquoi la section "méthodologie" de tout article scientifique est si importante. Il importe de savoir comment les résultats sont obtenus et analysés et nous ferions tous bien d’être plus constructivement critiques des "études" UX.

De manière générale, cependant, la raison pour laquelle je donne plus de poids aux études (si elles sont bien conçues) que les données autodéclarées ou d'opinion est que les gens mentent. Prenons, par exemple, la question de la quantité d'alcool que quelqu'un boit ou s'il va à l'église. Lorsqu'ils se déclarent eux-mêmes, les répondants boivent toujours moins que les données de consommation ne l'indiquent et vont à l'église plus que les statistiques de fréquentation ne l'indiquent. L'auto-déclaration est beaucoup plus sujette à des biais personnels que le comportement mesuré. Et cette différence est également intéressante, mais si je veux concevoir des produits/interfaces basés sur ce que les gens font et réussissent, plutôt que sur ce qu'ils souhaitent, je prendrai les données de succès mesurées chaque jour.

Pour que les utilisateurs réussissent mieux ou moins bien dans certaines tâches assignées dans les études, même si c'est à cause de leurs préjugés culturels ou éducatifs ou de leur formation est toujours une constatation importante - bien que son application puisse être limitée dans le temps ou à un public spécifique. Pour en revenir à la méthodologie, il importe de savoir qui est dans le groupe d'étude et leur démo et psychographie. La généralisation des résultats est limitée par les caractéristiques des participants. Mais c'est important et pourquoi je concevoirais toujours une interface légèrement différente pour les seniors que pour les étudiants, même pour le même contenu/domaine.

Comme autre exemple, j'ai également effectué des recherches continues sur la satisfaction de la clientèle pour de nombreux sites Web et après une refonte du site, nous avons presque toujours constaté une baisse des niveaux de satisfaction autodéclarés. Donc, en résumé, les utilisateurs de retour pensaient que la refonte était nulle. Cependant, en même temps que ces mêmes données, nous constatons souvent une augmentation de la conversion et/ou une baisse des appels du centre d'appels entrants. Finalement (quelques mois), les niveaux de satisfaction des clients se rétabliraient et dépasseraient leurs niveaux précédents. En bout de ligne? Les utilisateurs ne sont pas de bons concepteurs. Qui se soucie de ce qu'ils pensent ils pensent? Peu importe ce qu'ils font et ce n'est pas toujours la même chose que ce qu'ils disent penser.

3
Kara Heinrichs

Le test utilisateur est la recherche.

Les scénarios de test utilisateur idéaux collecteront des données quantitatives et qualitatives. Pour le quantitatif, vous voudrez généralement tester quelque chose de très spécifique, et généralement par rapport à quelque chose d'autre (a/b). Ces situations produisent un résultat généralement "x% a accompli le test avec l'option a qu'avec l'option b".

La qualité est l'endroit où vous pouvez collecter des idées/suggestions des utilisateurs qui ne sont pas aussi faciles à mesurer en points de données digestes. Il s'agit davantage d'explorer d'autres idées/options.

Maintenant, certaines personnes ne traitent que de la qualité (comme les projections de tests hollywoodiens) et certaines ignorent complètement la recherche qualitative (Steve Jobs), mais la plupart ont tendance à chevaucher la barrière entre les deux autant que possible.

2
DA01

Il existe de nombreuses sortes de tests qui ne sont pas particulièrement subjectifs. Pensez aux études qui définissent

  • Le temps moyen d'achèvement pour deux formulaires, différencié par une seule stratégie d'interface utilisateur
  • La carte thermique moyenne de l'oeil pour une taille d'échantillon statistiquement significative
  • Le taux de réponses "correctes" (sensées) aux formulaires avec des éléments d'interface utilisateur particuliers

Oui, vous mesurez les opinions humaines et les réponses subjectives. Mais on peut collecter des données objectives sur des choses subjectives. Il peut être statistiquement invalide s'il a un échantillon de mauvaise taille, mais ce n'est pas la même chose que quelque chose de "subjectif".

2
Jimmy Breck-McKye

Les tests utilisateurs permettent de détecter les incohérences entre le modèle mental que votre public cible crée sur le système et le modèle du système défini par les concepteurs.

Pour détecter les incohérences, les individus qui représentent le public cible sont évalués et une généralisation est effectuée pour discriminer l'individu des incohérences générales.

Est-ce subjectif?

Le modèle mental que chaque utilisateur crée est influencé par de nombreux éléments différents (conventions, expériences antérieures, culturelles, etc.) qui sont pour la plupart subjectifs. La clé est que notre public cible sera également influencé par ces éléments et aura des problèmes similaires avec le système.

Il existe des exceptions qui ne s'appliquent pas au public cible, mais cela se produit avec tout processus statistique.

Pourquoi ne pas simplement demander l'avis des utilisateurs?

L'incapacité de l'utilisateur à prédire son comportement futur est largement documenté . Ainsi, la stratégie suivie est de détecter les problèmes au lieu de demander des solutions à l'utilisateur.

2
Pau Giner

Répondant simplement à une partie de la question:

Une règle de base en psychologie est "ce que vous voyez - c'est ce que vous pensez vous verrez".

Toute l'expérience du monde est "construite" sur la base de "modèles" existants dans le cerveau.

Le cerveau est assez bon dans ce domaine, mais des choses telles que les illusions visuelles, montrent où le cerveau ne peut pas obtenir un modèle mental pour correspondre aux données entrantes.

La plupart de ce traitement est cependant inconscient. L'utilisateur conscient est donc un peu comme un iceberg: il n'a accès qu'à 1/10ème (ou autre) du traitement qui se passe dans son cerveau. Ils savent donc ce qu'ils voient . Mais ils ne peuvent généralement pas vous dire pourquoi .

1
PhillipW

Oui, mais ce n'est pas tout. Lorsque l'utilisateur agit vers notre interface avec un objectif en tête, il y a deux influences. Leur propre opinion, puis l'interface elle-même. L'interface et l'expérience peuvent influencer leur comportement et même leurs opinions sur la façon dont cela devrait fonctionner.

Ainsi, le test utilisateur recueille les opinions et les perceptions des gens comme une métrique pour influencer et être influencé par une conception UX.

1
jonshariat

Lors de l'interaction entre un utilisateur final et un système (interface Web et mobile, kiosques, etc.), la physiologie et la psychologie de l'utilisateur travaillent main dans la main pour développer un cadre global d'expérience humaine.

  1. Ce qu'un utilisateur fait en ligne, par exemple, données objectives -> données d'action, performances et analyse Web)
  2. Ce qu'un utilisateur ressent et pense, par exemple, données subjectives -> émotions, satisfaction, attentes, engagement et attention)
  3. Données physiologiques: Comment les impulsions physiologiques conduisent la psychologie humaine et le processus comportemental subjectif et objectif global ou les émotions. (Eye-tracking, signaux EEG et NIRS Brain, GSR et capteurs corporels)
  4. Les caractéristiques démographiques des utilisateurs et le contexte d'utilisation fonctionnent comme modérateurs de la relation inférentielle.
0
Dr_Laghari_UX

La différence est le fond de l'opinion. Si vous avez un groupe d'individus affichant chacun leurs opinions individuelles, il n'y a aucun moyen de dire que l'un a plus de valeur qu'un autre. Tout ce que vous pouvez faire, c'est être personnellement d'accord ou en désaccord avec eux.

Cependant, si vous avez une personne déclarant "c'est ce que montre une étude d'utilisabilité avec 100 participants", cela va avoir beaucoup plus de poids. Oui, il ne s'agit encore que d'opinions, mais ces opinions ont été recueillies, analysées et consolidées pour une conclusion formelle.

Pensez-y comme un sondage politique. Vous dites que votre maire local (ou gouverneur, ou toute autre figure élue) fait un travail horrible et devrait être démis de ses fonctions n'est vraiment pas si précieux. Mais un sondage auprès d'un échantillon d'électeurs de taille décente où la majorité dit la même chose définitivement est précieux. Ces opinions en elles-mêmes ne signifient vraiment pas grand-chose, mais dans l'ensemble peuvent fournir un baromètre de la façon dont le fonctionnaire se porte. Les tests d'utilisabilité sont de la même manière.

0
Charles Boyung

Les perceptions et les opinions ne sont pas la même chose. Les perceptions sont notre compréhension du monde basée sur ce que nous avons appris par nos sens. Les opinions sont nos pensées chargées de valeur à propos de quelque chose (par exemple à propos de quelque chose que nous avons perçu). La façon dont quelque chose est perçu par un individu est un fait subjectif ("Je ne vois pas le bouton car il est de la même couleur que l'arrière-plan"). Si les preuves/statistiques s'accumulent et que vous pouvez être sûr que presque tout le monde aura la même perception, alors vous avez un fait normatif (les utilisateurs ne verront pas le bouton). Si le bouton dans notre exemple ne peut vraiment pas être distingué de l'arrière-plan parce qu'il estla même couleur ou en raison des limites de la physiologie humaine, alors nous avons un fait objectif.

Les utilisateurs donneront également leur avis ("Cette interface est géniale, j'aime la façon dont elle me fait chasser les boutons"). Leurs opinions sont importantes de plusieurs façons. Ils diront aux autres ce qu'ils pensent de votre interface, et la perception de votre interface sera influencée par l'opinion donnée.

Les tests d'utilisabilité consistent à recueillir des faits normatifs. Il peut également s'agir de recueillir des faits sur les opinions des gens sur le sujet de l'étude (le logiciel). Les deux peuvent être précieux. Ce sont cependant des choses différentes. Recherche qui prend les opinions des gens (sur le logiciel) et les rapporte comme des faits (sur le logiciel) - par ex. au lieu de dire que "45 utilisateurs sur 47 ont dit que le logiciel était difficile à utiliser", le rapport indique que "45 utilisateurs sur 47 ont eu du mal à utiliser le logiciel" - ce sont de mauvaises recherches. C'est défectueux. Il ne devrait pas passer l'examen par les pairs. Vous ne devez lui donner aucune crédibilité.

Il existe diverses raisons pour lesquelles les faits sur les opinions et les faits sur le comportement et les performances avec le logiciel ne doivent pas être confondus et mal déclarés, mais l'un des plus importants est que ils ne correspondent pas toujours. Les gens peuvent signaler cette interface A est horrible et lente et ils ont fait beaucoup plus d'erreurs qu'ils ne l'ont fait avec l'interface B etc etc où c'est leur opinionmais les preuves montrent qu'en fait ils ont mieux performé et fait moins d'erreurs avec l'interface B. Et l'inverse Cela peut aussi être vrai. Cela ne veut pas dire que les opinions n'ont pas d'importance. Mais les faits sur les opinions et les faits sur le comportement/la performance/etc. ne doivent pas être confondus.

0
Splog