Le modèle DOAN (DOcument ANnotation Model) Modélisation de l'information complexe appliquée à la plateforme Arisem Kaliwatch Server - LINA-DUKE Accéder directement au contenu
Thèse Année : 2005

The DOAN Model (DOcument ANnotation Model) Complex Information Modelling applied to the Arisem Kaliwatch Server platform

Le modèle DOAN (DOcument ANnotation Model) Modélisation de l'information complexe appliquée à la plateforme Arisem Kaliwatch Server

Résumé

This thesis introduces the DOAN model (DOcument ANnotation Model), which aims at answering the modelling needs of the company Arisem. Arisem is a software vendor acting on the knowledge management market. It offers a platform that processes data during the collection, analysis and dissemination steps of the information flow. As it works on heterogeneous data coming from various sources (e.g., internet, intranet, databases), it performs several analyses (e.g., automatic classification, extraction of emergent concepts), in order to provide synthetic information to the user. From this problematic, we have identified three main needs for the model: expressivity, flexibility and performance. Within the context of this thesis, we have developed amodel based on the facet aggregation paradigm. It enables designers to describe complex, heterogeneous and evolving data. Beyond the simple notion of document, it permits the representation of business objects, such as annotations or classification trees. Supplemented by a rich type system and the ability to express constraints between facets, this model enables us to answer the needs of expressiveness and flexibility. On the other hand, we propose an algorithm able to translate DOAN elements into a relational implementation. Once the model is instantiated, update accesses are controlled by using stored procedures in order to ensure data consistency. Read accesses are in return performed directly by using SQL queries. Designers are thus able to use complex queries without sacrificing performance, exploiting database management systems functionalities. This approach scales well and answers the needs of performance.
Nous présentons dans cette thèse le modèle DOAN (DOcument ANnotation Model), destiné à répondre aux besoins de modélisation de la société Arisem. Arisem est éditeur de logiciels dans le domaine de la gestion des connaissances. La plateforme que l'entreprise propose s'inscrit dans le cycle collecte / analyse / diffusion de l'information. À partir de données de nature hétérogène et d'origines diverses (ex. : Internet, intranet, base de données), elle procède à différentes analyses (ex. : classement automatique, extraction de concepts émergents), afin de fournir des informations synthétiques et utiles à l'utilisateur. Partant de cette problématique, nous avons identifié trois besoins principaux pour le modèle : expressivité, flexibilité et performances. Dans le cadre de cette thèse, nous avons développé un modèle basé sur le paradigme d'agrégation de facettes, qui permet aux concepteurs de décrire des données complexes, hétérogènes et évolutives. Au-delà de la simple notion de document, il rend possible la représentation d'objets métiers, comme par exemple des annotations ou des arbres de catégorisation. Complété par un système de types riches et par la capacité d'exprimer des contraintes entre facettes, ce modèle nous permet de répondre aux besoins d'expressivité et de flexibilité. Nous proposons d'autre part un algorithme permettant de traduire les éléments du modèle DOAN en une implémentation relationnelle. Une fois le modèle instancié, les accès en modification sont contrôlés à l'aide de procédures stockées afin de garantir la consistance des données. Les accès en consultations sont en revanche effectués directement à l'aide de requêtes SQL. Les concepteurs peuvent ainsi faire des requêtes à la fois complexes et performantes, tirant parti au maximum des possibilités du système de gestion de bases de données. Cette approche permet une montée en charge importante et répond aux besoins de performances.
Fichier principal
Vignette du fichier
These-Nicolas-Dessaigne-2006-03-08.pdf (1.11 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00465962 , version 1 (22-03-2010)

Identifiants

  • HAL Id : tel-00465962 , version 1

Citer

Nicolas Dessaigne. Le modèle DOAN (DOcument ANnotation Model) Modélisation de l'information complexe appliquée à la plateforme Arisem Kaliwatch Server. Interface homme-machine [cs.HC]. Université de Nantes, 2005. Français. ⟨NNT : ⟩. ⟨tel-00465962⟩
153 Consultations
377 Téléchargements

Partager

Gmail Facebook X LinkedIn More