J'implémente un système qui pourrait détecter l'émotion humaine dans le texte. Existe-t-il des ensembles de données annotés manuellement pour l'apprentissage et les tests supervisés?
Voici quelques ensembles de données intéressants: https://dataturks.com/projects/trending
Le domaine de la détection des émotions textuelles est encore très nouveau et la littérature est fragmentée dans de nombreuses revues différentes de différents domaines. C'est vraiment difficile d'avoir un bon aperçu de ce qui existe.
A noter qu'il existe plusieurs théories émotionnelles psychologiques. Il existe donc différentes manières de modéliser/représenter les émotions dans l'informatique. La plupart du temps, "l'émotion" fait référence à des phénomènes tels que la colère, la peur ou la joie. D'autres théories affirment que toutes les émotions peuvent être représentées dans un espace multidimensionnel (il y en a donc un nombre infini).
Voici quelques ensembles de données (accessibles au public) que je connais (mis à jour):
EmoBank. 10k phrases annotées avec les valeurs de Valence, d'excitation et de dominance (divulgation: je suis l'un des auteurs). https://github.com/JULIELab/EmoBank
L'ensemble de données "Emotion Intensity in Tweets" de la tâche partagée WASSA 2017. http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
Les messages Facebook de Valence et d'excitation par Preotiuc-Pietro et autres: http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv
Les données Affect par Cecilia Ovesdotter Alm: http://people.rc.rit.edu/~coagla/affectdata/index.html
L'ensemble de données Emotion in Text par CrowdFlower https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv
ISEAR: http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615
Corpus de test de SemEval 2007 (Tâche sur le texte affectif) http://web.eecs.umich.edu/~mihalcea/downloads.html
Une ré-annotation des données SemEval Stance avec des émotions: http://www.ims.uni-stuttgart.de/data/ssec
Si vous souhaitez approfondir le sujet, voici quelques sondages que je recommande (divulgation: j'ai créé le premier).
Buechel, S., Hahn, U. (2016). Analyse des émotions comme problème de régression - Modèles dimensionnels et leurs implications sur la représentation des émotions et l'évaluation métrique. Dans ECAI 2016.22nd European Conference on Artificial Intelligence (pp. 1114-1122). La Haye, Pays-Bas (disponible: http://ebooks.iospress.nl/volumearticle/44864 ).
Canales, L., Martínez-Barco, P. (s.d.). Détection d'émotion à partir du texte: une enquête. Processing in the 5th Information Systems Research Working Days (JISIC 2014), 37 (disponible: http://www.aclweb.org/anthology/W14-6905 ).