Skip to Main content Skip to Navigation
Conference papers

Extraction de concepts guidée par le contexte

Résumé : Les ontologies constituent la brique supportant les échanges et le partage des informations en étendant l'interopérabilité syntaxique du web en une interopérabilité sémantique. Le succès du web sémantique dépend du degré d'automatisation de la construction des ontologies, de leur déploiement et de leur prolifération. Dans cet article, nous présentons une méthode incrémentale d'extraction de concepts ontologiques à partir de documents HTML en vue de construire une ontologie du domaine. Nous exploitons les caractéristiques structurelles des documents HTML afin de localiser et de définir un contexte approprié pour chaque terme en respectant sa position dans le corpus. Notre définition contextuelle permet de sélectionner les co-occurrents sémantiquement proches et de définir une mesure de pondération appropriée pour chaque couple de termes. Afin d'obtenir des classes de termes, nous avons défini les principes algorithmiques d'une méthode de clustering guidée par le contexte. Notre approche se base sur une évaluation interactive et incrémentale de la qualité des clusters par l'utilisateur. Nous avons expérimenté ces principes algorithmiques sur un corpus du domaine portant sur le tourisme. Les premiers résultats obtenus montrent que la prise en compte du contexte des termes améliore considérablement la pertinence des concepts extraits.
Complete list of metadatas

https://hal-supelec.archives-ouvertes.fr/hal-00259870
Contributor : Evelyne Faivre <>
Submitted on : Friday, February 29, 2008 - 3:39:21 PM
Last modification on : Tuesday, June 30, 2020 - 4:04:07 PM

Identifiers

  • HAL Id : hal-00259870, version 1

Collections

Citation

Lobna Karoui, Nacéra Bennacer Seghouani, Marie-Aude Aufaure. Extraction de concepts guidée par le contexte. XIIIème rencontres de la Société Francophone de Classification. (SFC'2006), Sep 2006, Metz, France. pp.119-123. ⟨hal-00259870⟩

Share

Metrics

Record views

212