web-dev-qa-db-fra.com

Les balises de folksonomie devraient-elles être régies ou non?

Lorsque nous organisons le contenu, cela peut être fait dans un modèle d'information hiérarchique ou un modèle d'information plat. Le modèle plat est parfois mis en œuvre par l'utilisation de métadonnées sous forme de balises. Les balises mettent des étiquettes sur le contenu, ce qui rend les informations facilement récupérables lorsque l'utilisateur en a besoin. Les balises peuvent être utilisées dans le cadre du filtrage des requêtes de recherche ou des vues fixes d'une source de contenu.

La création de balises peut se faire de différentes manières. Une organisation peut décider d'implémenter des balises de haut en bas, ce qui signifie que les balises n'existent que si le représentant de l'organisation les a créées. Dans ce modèle, les utilisateurs doivent demander la création de balises, s'ils en ont besoin. Le processus est lent et les utilisateurs peuvent avoir oublié où se trouve le contenu lorsque la balise est disponible pour étiqueter le contenu. Ou pire, le contenu peut être stocké localement, ce qui le rend impossible à récupérer pour d'autres utilisateurs.

Pour surmonter ce problème, les organisations peuvent laisser les utilisateurs créer eux-mêmes des balises. Ce processus est appelé une folksonomie et peut être décrit de manière plus formelle comme "un système généré par l'utilisateur pour classer et organiser le contenu en ligne en différentes catégories en utilisant des métadonnées telles que des balises électroniques". Ils ont l'avantage d'être simples et faciles à utiliser et les utilisateurs n'ont pas à demander d'autorisation lors de leur création. Mais cela fait également partie du problème. Les balises sans surveillance peuvent être utilisées de manière involontaire par des fautes d'orthographe, en utilisant la mauvaise balise ou en ne marquant pas du tout. De toute façon, il y a un problème.

Tag Cloud

Image de CLA.ed

Une organisation peut utiliser les deux systèmes en même temps, ayant un champ pour les balises gérées et un deuxième champ pour les balises folksonomy. Lors de la récupération du contenu, l'organisation peut décider des priorités entre ces différents domaines en utilisant plusieurs règles. Mais d'après mon expérience, les utilisateurs trouvent ces différents domaines difficiles à comprendre et, par conséquent, difficiles à utiliser.

Cela conduit à la question si vous utilisez un seul champ de balise où les utilisateurs peuvent ajouter des balises par eux-mêmes, ces balises devraient-elles être régies par un représentant de l'organisation? Tout cela dans le bon but de se débarrasser des erreurs mentionnées précédemment? Il faut du temps pour gouverner les balises de folksonomie, et cela peut être considéré comme un investissement pour rendre la récupération des informations plus précise. Mais vaut-il le coût? Et est-ce des balises de folksonomie si vous les régissez? Est-ce vraiment important, tant que ça marche?

Les balises de folksonomie devraient-elles être régies ou non?

4
Benny Skogberg

C'est un sujet très intéressant. Les opinions des scientifiques de l'information sont mitigées, mais nous obtenons maintenant une meilleure vue avec plus de recherches empiriques effectuées dans ce domaine. En plus de quelques articles sur SIGCHI, j'ai également fait référence à une étude d'Alexis Wichowski et j'en discuterais plus en détail ci-dessous:

Étude empirique sur les balises de gouvernance folklorique

Un article de PJ Morrison en 2007 intitulé " Balisage et recherche: efficacité de recherche des folksonomies sur le Web ", conclut que lorsque les folksonomies sont combinées avec les répertoires avec contrôle vocabulaires , les résultats de précision et de rappel étaient plus élevés que dans les recherches utilisant uniquement les vocabulaires contrôlés. Cela signifie en partie que les balises de folksonomie régies aident à la récupération des informations, mais cela coûtera du temps. Même si cela va à l'encontre de la notion fondamentale d'auto-gouvernance, je pense que cela vaut la peine d'investir du temps jusqu'à ce que nous trouvions de meilleures méthodes (discutées ci-dessous) car c'est la meilleure option que nous avons pour suivre ce se produit avec le non-courant de l'environnement de l'information .

Sur les erreurs dans les balises folksonomy

L'absence de contexte est l'un des problèmes majeurs des balises de folksonomie. Un tag comme "tv" ne récupérera pas les éléments taggés "television". Dans des articles séparés, Noruzi ( Folksonomies: Pourquoi avons-nous besoin d'un vocabulaire contrôlé? ) et Van Damme et al ( FolksOntology: Une approche intégrée pour transformer les folksonomies en ontologies ) ont proposé d'utiliser la folksonomie avec les thésaurus et les ontologies . Personnellement, je pense que cela peut être un bon moyen de réduire les erreurs dans les balises de folksonomie à condition que nous puissions y parvenir avec l'apprentissage automatique dans un futur proche.

Des recherches ont déjà été effectuées pour développer des interfaces de marquage intelligentes. Une de ces technologies a été discutée dans cet article par Jesse Vig de l'Université du Minnesota. Ils ont développé des algorithmes d'apprentissage automatique qui déduisent les propriétés des éléments et des utilisateurs en fonction du contenu fourni par les utilisateurs, y compris les notes, les balises et les avis des utilisateurs.

Aperçu

Avec des quantités colossales d'informations disponibles sur le Web, il vaut la peine de gouverner les balises de folksonomie, car elles offrent un aperçu du comportement des utilisateurs, offrent une alternative à faible coût et engendrent des communautés. Je suis convaincu que nous développerons de meilleures technologies NLP et ML dans un avenir proche afin de pouvoir auto-gouverner les balises de folksonomie.

4
Adit Gupta

Considérez une folksonomie comme une taxonomie informelle (pour un individu, un groupe, une communauté, une organisation, une industrie, etc., une entité), par opposition à une taxonomie régie ou formelle de l'entité. Les folksonomies ont tendance à être construites à partir de contributions ad hoc de termes, pas de choix gouvernés, donc en général, les balises de folksonomie ne seraient pas gouvernées, bien qu'elles pourraient être de plus en plus gouvernées si un contrôle croissant du vocabulaire de l'entité était recherché. Ainsi, la réponse semble être une gamme de gouvernance basée sur la question - "Cela dépend de la façon dont le vocabulaire de l'entité doit être contrôlé."

Les taxonomies non gouvernées et gouvernées peuvent être présentées aux utilisateurs sous forme de listes alphabétiques, de structures de catégorisation (Broader Than/Narrower Than - BT/NT, de structures de réseau (Related To - RT) et de structures de pertinence (par exemple, sortes, nuages).

Les mots et donc les termes d'une taxonomie peuvent être extraits du contenu ou saisis ou importés individuellement.

J'ai vu les types de progression suivants dans la gouvernance des termes: 1. Les utilisateurs saisissent le contenu, et donc les mots, mots-clés, termes, sans contrainte, en tant qu'auteurs de contenu. 2. Les utilisateurs saisissent des mots clés dans une liste alphabétique ouverte et fournissent des définitions de termes et des sources et autorités de définition. 3. Les utilisateurs entrent des termes dans une taxonomie ouverte et non gouvernée, et fournissent des définitions de termes et des sources et autorités de définition. 4. Les utilisateurs ajoutent ou demandent l'ajout (en fonction des autorisations) de termes dans une taxonomie fermée et gouvernée, fournissant des définitions de terme et des sources et autorités de définition. 5. Sur la base des définitions fournies, les taxonomistes migrent les termes des éléments source 1 à 3 vers l'élément de destination 4. 6. Les utilisateurs saisissent ou affinent le vocabulaire du contenu à partir des termes et définitions de la taxonomie régie à partir de l'élément 4.

Les éléments 1 à 6 fournissent une amélioration continue du contenu et une activité d'alignement du vocabulaire.

1
Roy Roebuck