REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés

Résumé : Les sources de données RDF mises à disposition sur le web sont de plus en plus nombreuses. Cependant, ces sources contiennent relativement peu d’information en comparaison du volume des informations décrites dans le web visible. De nombreux outils ont pour objectif d’annoter sémantiquement les documents mais l’annotation d’instances de propriétés reste une tâche difficile quand leurs structures et leurs vocabulaires sont hétérogènes. Nous proposons une approche appelée REISA qui exploite un ensemble de documents annotés par des instances de concepts pour enrichir des bases de connaissances par des instances de propriétés. L’approche se base sur la proximité structurelle des annotations d’instances de concepts et contrôle la cohérence des faits extraits en se basant sur les axiomes des ontologies, et sur les faits déjà présents dans les bases de connaissances. Les expérimentations menées sur deux ensembles de documents HTML montrent que la précision peut atteindre 76,5%.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2014, 28 (2-3), 〈10.3166/ria.28.297-320〉
Liste complète des métadonnées

https://hal-supelec.archives-ouvertes.fr/hal-01061253
Contributeur : Elodie Dubrac <>
Soumis le : vendredi 5 septembre 2014 - 14:04:38
Dernière modification le : samedi 15 septembre 2018 - 01:03:08

Identifiants

Collections

Citation

Nacéra Bennacer Seghouani, Nathalie Pernelle, Yassine Mrabet. REISA : Enrichissement contrôlé de bases de connaissances à partir de documents annotés. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2014, 28 (2-3), 〈10.3166/ria.28.297-320〉. 〈hal-01061253〉

Partager

Métriques

Consultations de la notice

279