Découverte des connaissances à partir des pages Web

Lobna Karoui 1 Nacéra Bennacer Seghouani 1 Marie-Aude Aufaure 1 Annie Morin 2
2 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Les ontologies constituent la brique de base du web sémantique et le succès de celui-ci dépend de leur déploiement et de leur prolifération. Dans ce papier, nous proposons une approche permettant d'automatiser le processus de construction d'ontologie à partir de pages Web. Notre approche exploite la structure du document HTML et utilise des méthodes de fouilles de données pour découvrir les concepts, pour les structurer sous forme d'une hiérarchie et pour les enrichir. Notre approche est appliquée au domaine du tourisme et les résultats obtenus sont prometteurs.
Complete list of metadatas

https://hal-supelec.archives-ouvertes.fr/hal-00260283
Contributor : Evelyne Faivre <>
Submitted on : Monday, March 3, 2008 - 4:56:11 PM
Last modification on : Friday, November 16, 2018 - 1:24:10 AM

Identifiers

  • HAL Id : hal-00260283, version 1

Citation

Lobna Karoui, Nacéra Bennacer Seghouani, Marie-Aude Aufaure, Annie Morin. Découverte des connaissances à partir des pages Web. Atelier Fouille de données complexes - conférence Extraction et Gestion des Connaissances (EGC 2005), 2005, Paris, France. pp.37-42. ⟨hal-00260283⟩

Share

Metrics

Record views

372