Transformation de documents structurés, une combinaison des approches explicite et automatique - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 1998

Transformation of Structured Documents, combining the Explicit and the Automatic Approaches

Transformation de documents structurés, une combinaison des approches explicite et automatique

Résumé

The work presented in this thesis deals with the transformation of structured documents. A structured document is a collection of typed elements, organized by a set of logical relations defining a hierarchical structure. These relations are defined by context-free grammars describing classes of documents. The use of structured documents makes it possible to partly automate the document processing. It also helps to improve their portability thanks to a common syntax provided by the SGML and XML standards. Applications using this representation however have limitations due to constraints involved by document structuration. The objective of this work is to compensate these limits with transformation techniques. These techniques aim at modifying the structure of a set of typed elements in order to adapt it to other types or to a new class of documents. This thesis is composed of three parts: 1. A study of document processing applications in which the needs of transform- ation are identified, more particularly in the field of interactive editing. 2. An evaluation of existing techniques and tools resulting in a classificatio- n of approaches: filters, explicit or automatic transformations. Each class is presented through a theoretical study, a tour of available systems and an experiment. 3. A proposal for a transformation method that combines these techniques to take advantage of their strength and fight their weaknesses. This method relies on a transformation algorithm parameterized by explicit pre-couples. This work has led to the development of transformation systems now integrated in the authoring tools of the Opéra project (Thot, Byzance) and the W3C consortium (Amaya).
Les travaux présentés dans cette thèse ont pour thème la transformation des documents structurés. Un document structuré est une collection d'éléments typés organisée par un ensemble de relations logiques définissant une structure hiérarchique. Ces relations sont définies par des grammaires hors-contexte qui décrivent des classes de documents. L'utilisation des documents structurés permet d'automatiser une partie des traitements effectués sur les documents et contribue également à améliorer leur portabilité en proposant une syntaxe commune définie par des normes (SGML, XML). Les applications utilisant cette représentation souffrent néanmoins de limites liées aux contraintes impliquées par la structuration des documents. L'objectif de ce travail est de répondre à ces limites par des techniques de transformation. Ces techniques ont pour but de modifier la structure d'un ensemble d'éléments typés pour le conformer à d'autres types ou à une nouvelle classe de documents. Cette thèse est articulée en trois parties : 1. Une étude des applications de traitement de documents identifiant les besoins de transformation, plus particulièrement dans le domaine de l'édition interactive. 2. Une évaluation des techniques et outils existant conduisant à une classific- ation des approches (filtres, transformation explicite ou automatique). Chaque classe fait l'objet d'une étude théorique, d'une étude des systèmes disponibles et d'une expérimentation. 3. Une proposition de méthode de transformation combinant les différentes techniques pour tirer parti de leurs points forts et répondre aux limitations de chacune. Cette méthode est fondée sur un algorithme de transformation automatique paramétré à l'aide de pré-couples explicites. Ce travail a conduit au développement des systèmes de transformation aujourd'h- ui intégrés dans des logiciels du projet Opéra (Thot, Byzance) et du consortiu- m W3C (Amaya).
Fichier principal
Vignette du fichier
tel-00010471.pdf (552.29 Ko) Télécharger le fichier
Loading...

Dates et versions

tel-00010471 , version 1 (07-10-2005)

Identifiants

  • HAL Id : tel-00010471 , version 1

Citer

Stéphane Bonhomme. Transformation de documents structurés, une combinaison des approches explicite et automatique. Autre [cs.OH]. Université Joseph-Fourier - Grenoble I, 1998. Français. ⟨NNT : ⟩. ⟨tel-00010471⟩
319 Consultations
1134 Téléchargements

Partager

Gmail Facebook X LinkedIn More