Trainings

– Ecole Nationale Supérieure d’informatique – Département de Post-Graduation – CHOUDER Mohamed Lamine – Incorporation des données non-relationnelles dans les systèmes d’information décisionnels

Etablissement
Ecole Nationale Supérieure d’informatique
Affiliation
Département de Post-Graduation
Auteur
CHOUDER, Mohamed Lamine
Directeur de thèse
CHALAL Rachid (Professeur)
Filière
Informatique
Diplôme
Doctorat LMD
Titre
Incorporation des données non-relationnelles dans les systèmes d’information décisionnels
Mots clés
Base de données non-relationnelle, Découverte de schéma, Traitement analytique en ligne, Conception multidimensionnelle
Résumé
À l’ère du Big Data, une nouvelle génération de bases de données dites non-relationnelles a émergée pour stocker les grandes masses de données générées par les applications modernes. Ces données contiennent des informations précieuses pouvant être profitablement incorporées dans le système d’information décisionnel de l’entreprise. Dans ce système, les données sont représentées dans une forme multidimensionnelle pour permettre leur exploitation moyennant plusieurs outils comme le traitement analytique en ligne. Ce dernier est le paradigme d’interrogation et d’analyse des données multidimensionnelles dont l’objectif est d’offrir une vue synthétique aux décideurs améliorant ainsi la prise de décision. Dans cette thèse, nous étudions l’incorporation des données non-relationnelles dans les systèmes d’information décisionnels. Dans un premier temps, nous avons étudier le problème de découverte de schéma à partir des collections de données stockées dans les bases de données non-relationnelles orientées documents et caractérisées par l’absence de schéma ainsi que la variété dans la structuration des données. Pour ce faire, nous avons proposé une approche de découverte de schéma qui à la fois extrait un schéma et capture la variété de structure au sein d’une même collection. Dans un deuxième temps, nous nous sommes intéressés à l’exploitation analytique des données non-relationnelles. Dans ce contexte, nous avons proposé une approche interactive pour supporter l’analyse multidimensionnelle et le traitement analytique en ligne sur les bases de données non-relationnelles orientées documents. Cette approche commence par l’enrichissement multidimensionnel du schéma obtenu lors de la première approche. Ceci va permettre aux utilisateurs d’exécuter une session analytique en commençant par la formulation de requêtes multidimensionnelles suivi par des opérations de traitement analytique. Notre approche se base sur la fouille des dépendances fonctionnelles à partir des données pour la découverte automatique des hiérarchies multidimensionnelles. Afin d’assurer une meilleure performance, les hiérarchies sont construites de façon incrémentielle à la base de la session courante de l’utilisateur. Nos propositions ont été implémentées dans MongoDB, l’un des plus connus systèmes non-relationnels. Une évaluation expérimentale sur des jeux de données réelles a été menée pour montrer que les performances de notre implémentation sont en adéquation avec les exigences d’une interaction temps réel avec les utilisateurs.
Statut
Vérifié

Leave a Reply

Your email address will not be published. Required fields are marked *