Entrepôts, Représentation et Ingénierie des Connaissances
Publications du laboratoire

Recherche approfondie

par Année
par Auteur
par Thème
par Type
--------------------
- Utilisation de techniques de modélisation thématiques pour la détection de nouveauté dans des flux de données textuelles hal link

Auteur(s): Christophe C., Velcin J., Boumghar Manel

Conference: Extraction et Gestion des connaissances (EGC2018) (Paris, FR, 2018-01-22)


Ref HAL: hal-01803649_v1
Exporter : BibTex | endNote
Résumé:

Avec l'avènement des réseaux sociaux et la multiplication des messages produits au sujet des entreprises, mieux comprendre les retours clients est devenu un enjeu primordial. Des techniques de classification automatique et de modélisation thématique permettent d'ors déjà d'observer les principales ten-dances observées dans ces données. Il est intéressant, dans une optique d'antici-pation, d'observer les thématiques émergentes et de les identifier avant qu'elles ne prennent de l'ampleur. Afin de résoudre cette problématique, nous avons étu-dié la piste de l'utilisation de modèles LDA pour détecter les documents relatifs à ces thématiques émergentes. Nous avons testé trois systèmes sur plusieurs scé-narios d'arrivées de la nouveauté dans le flux de données. Nous montrons que les modèles thématiques permettent de détecter cette nouveauté mais que cela dépend du scénario envisagé.