Entrepôts, Représentation et Ingénierie des Connaissances
Publications of the ERIC lab

Search

by Year
by Author
by Topic
by Type
--------------------
- Evolution de l'entreposage des données complexes

Author(s): Boussaid O.(Corresp.)

(H.D.R.) , 2006


Abstract:

Les technologies utilisées dans les processus décisionnels, comme les entrepôts de données, l'analyse multidimensionnelle en ligne et la fouille de données (data mining), sont désormais très efficaces pour traiter des données simples numériques ou symboliques ; mais également des données complexes porteuses de nombreuses informations. La combinaison des technologies du data warehousing, du data mining, du XML et celle du web permet de mieux aborder les problèmes d'intégration des données, de modélisation, d'architecture et enfin d'analyse des données complexes. Cependant, la spécificité des données complexes nécessite carrément de nouvelles approches d'entreposage. Le stockage des données dans une base centralisée est une solution onéreuse. La construction des cubes de données à la demande et à la volée permet de rapatrier les données seulement lors de l'analyse. L'intégration des données complexes nécessite un dispositif de médiation basé sur les ontologies pour bénéficier de l'apport sémantique des données complexes. La description de celles-ci dans des documents XML prône pour une solution d'entrepôts XML. Enfin, la proximité naturelle des règles d'association avec l'analyse en ligne incite à coupler les techniques de fouille de données avec l'OLAP pour une analyse en ligne puissante. L'évolution des entrepôts est présentée en trois temps. : - D’abord une évolution des entrepôts classiques vers les entrepôts de données complexes. - La deuxième phase de l’évolution concerne les nouvelles approches pour l'entreposage et la fouille des données complexes. Les entrepôts virtuels, que nous préconisons, font partie de ces nouvelles approches. La description des données complexes à l’aide de document XML incite à une structuration des données sous forme d'entrepôts XML (ou de cubes XML). La nature et la spécificité de ce type de données engendrent également une évolution de l'analyse en ligne en véritable fouille en ligne des données complexes. - Les entrepôts de données actifs représentent le troisième palier d’évolution. Le système décisionnel se composera alors d'une partie statique comportant les données et d'une partie dynamique portant sur les actions d'analyse. Celle-ci donne le caractère actif au système décisionnel, qui en plus des données stockerait désormais des connaissances. Cette perspective permet d'envisager d'utiliser des techniques de fouille de données pour produire automatiquement des connaissances pour renforcer la définition de scénarii d'analyse.