Extraction et chaînage supervisés de connaissances d'un corpus d'entretiens en histoire des sciences - Archive ouverte en Histoire etPhilosophie des Sciences et des Techniques Accéder directement au contenu
Poster De Conférence Année : 2017

Extraction et chaînage supervisés de connaissances d'un corpus d'entretiens en histoire des sciences

Résumé

Les données des sciences de l'homme forment souvent des corpus de textes, qui sont hétérogènes par leurs forme et contenus; spécifiques par leurs terminologie et signification. Ceci rend particulièrement délicate leur exploitation automatique à des fins de gestion de connaissances. À partir d'un corpus d'entretiens en histoire des sciences, nous présentons une méthode supervisée générant un réseau de documents liés par leurs proximités de contenus. Il s'agit d'un graphe multiple flou, basé sur l'extraction de \textit{n-grams} à taille variable. Un prototype en Python permet d'évaluer la méthode. Dans cet article, nous confrontons, de manière interdisciplinaire, le réseau d'informations construit par la méthode numérique à l'analyse qualitative du corpus historique. Nous essayons d'en dégager, d'une part, des améliorations de la méthode, et, d'autre part, des outils heuristiques pour l'historien.
Fichier principal
Vignette du fichier
poster.pdf (2.29 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01449239 , version 1 (30-01-2017)

Identifiants

  • HAL Id : hal-01449239 , version 1

Citer

Benjamin Hervy, Matthieu Quantin, Pierre Teissier. Extraction et chaînage supervisés de connaissances d'un corpus d'entretiens en histoire des sciences. Conférence EGC 2017 - Extraction et Gestion des Connaissances, Jan 2017, Grenoble, France. , 2017. ⟨hal-01449239⟩
457 Consultations
60 Téléchargements

Partager

Gmail Facebook X LinkedIn More