Fouille de données pour associer des noms de sessions aux articles scientifiques - LINA - Equipe Traitement Automatique du Langage Naturel Access content directly
Conference Papers Year : 2014

Fouille de données pour associer des noms de sessions aux articles scientifiques

Solen Quiniou
Peggy Cellier
Thierry Charnois

Abstract

In this paper, we present a proposition based on data mining to tackle the DEFT 2014 challenge. We focus on task 4 which consists of identifying the right conference session for scientific papers. The proposed approach is based on a combination of two data mining techniques. Sequence mining extracts frequent phrases in scientific papers in order to build paper and session descriptions. Then, those descriptions of papers and sessions are used to create a graph which represents shared descriptions. A graph mining technique is applied on the graph in order to extract a collection of homogenous sub-graphs corresponding to sets of papers associated to sessions.
Nous décrivons dans cet article notre participation à l'édition 2014 de DEFT. Nous nous intéressons à la tâche consistant à associer des noms de session aux articles d'une conférence. Pour ce faire, nous proposons une approche originale, symbolique et non supervisée, de découverte de connaissances. L'approche combine des méthodes de fouille de données séquentielles et de fouille de graphes. La fouille de séquences permet d'extraire des motifs fréquents dans le but de construire des descriptions des articles et des sessions. Ces descriptions sont ensuite représentées par un graphe. Une technique de fouille de graphes appliquée sur ce graphe permet d'obtenir des collections de sous-graphes homogènes, correspondant à des collections d'articles et de noms de sessions.
Fichier principal
Vignette du fichier
deft2014_06_lina.pdf (371.08 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-01113464 , version 1 (05-02-2015)

Identifiers

  • HAL Id : hal-01113464 , version 1

Cite

Solen Quiniou, Peggy Cellier, Thierry Charnois. Fouille de données pour associer des noms de sessions aux articles scientifiques. DEFT 2014, Jul 2014, Marseille, France. ⟨hal-01113464⟩
383 View
123 Download

Share

Gmail Facebook X LinkedIn More