Séminaire


Date : 24 mars 2016 14:00 - Salle :Amphi Garcia

Modèles de clustering temporel pour la fouille d’opinion dans les médias sociaux


Julien VELCIN - Université Lyon 2

Les modèles graphiques probabilistes sont devenus très populaires pour traiter les problèmes de classification automatique. Dans cet exposé, je présenterai les travaux réalisés récemment au laboratoire ERIC pour deux problèmes différents de classification non supervisée capables de traiter de données textuelles situés temporellement. Le premier problème que nous avons attaqué s’inspire de modèles probabilistes de topic modeling pour capturer conjointement l’évolution des thématiques et des opinions exprimées dans un corpus de textes. Les résultats obtenus sur des reviews d’Amazon et des articles de presse montrent que notre modèle capture mieux la dynamique globale des opinions. Pour le deuxième problème, nous adaptons un modèle de mélanges au cas temporel afin de trouver un compromis entre la fidélité du modèle au données présentes et un lissage avec les données de la période précédente. Les premiers résultats ont été obtenus dans le cadre du projet ImagiWeb et permettent de suivre l’image exprimée sur Twitter au sujet d’hommes politiques français.