Comment vous assurez-vous d'avoir un échantillon statistiquement représentatif et précis d'utilisateurs d'une population et sur quels critères baseriez-vous cet échantillon?
Je veux m'assurer que les personnes que nous interviewons et observons sont en fait un bon échantillon d'une population d'env. 250k.
Je me demande simplement comment les autres abordent ce problème.
Je ne sais pas si cela s'applique à votre situation, mais il est utile de se rappeler que, d'un point de vue statistique, un échantillon aléatoire (raisonnablement grand) est préférable, même s'il est parfois difficile à obtenir dans la pratique.
En fait, des techniques plus complexes (quotas, cribleurs, etc.) ont été développées pour traiter des problèmes spécifiques (échantillonnage de sous-populations plus petites, biais dans le processus d'échantillonnage qui rendent impossible un échantillon aléatoire réel, etc.) mais si vous avez un liste complète de tous les utilisateurs potentiels à partir desquels vous pouvez choisir des noms au hasard (ce qui signifie également qu'ils doivent être également susceptibles d'accepter de vous parler…) et que votre échantillon est suffisamment grand, vous n'avez pas à vous soucier de la représentativité.
Une façon de le faire est de mettre votre liste dans une table ou une base de données et de la commander ou de donner un numéro à chaque interviewé potentiel (toute commande le fera tant que vous ne la modifiez pas pendant la procédure). Ensuite, allez sur http://www.random.org/integer-sets/ et générez un ensemble avec N (la taille d'échantillon souhaitée) entiers entre 1 et le nombre total dans votre liste. Vous pouvez ensuite utiliser les résultats comme numéro d'identification/position dans la liste pour sélectionner des personnes.
C'est difficile de le faire parfaitement, mais c'est pour cela que les gens utilisent normalement les filtres. Vous établissez les dimensions clés selon lesquelles vos personnages diffèrent, puis construisez des questionnaires de sélection pour voir dans quel groupe un participant potentiel s'intègre, puis acceptez un nombre défini de participants pour chaque personnage/groupe.
Par exemple, supposons que vous ayez deux personnalités: Steve (utilisateur fréquent et professionnel - 70% de votre base d'utilisateurs) et Craig (parfois amateur et rêveur - 30% d'utilisateurs). Les dimensions clés selon lesquelles ils diffèrent sont de savoir s'ils ont utilisé une application de manière professionnelle et à quelle fréquence ils l'ont utilisée.
Vous pouvez construire un filtre:
Utilisez-vous un exemple d'application pour un travail rémunéré?
À quelle fréquence avez-vous utilisé l'exemple d'application au cours de la semaine dernière?
Vous attendez-vous à utiliser un exemple d'application dans la semaine à venir?
Si vous aviez 10 places pour votre recherche, vous prendriez 7 Steves et 3 Craigs en fonction de leurs réponses.