Étude Expérimentale d'Extraction d'Information dans des Retranscriptions de Réunions - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen (GREYC) Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Étude Expérimentale d'Extraction d'Information dans des Retranscriptions de Réunions

Résumé

An Experimental Approach For Information Extraction in Multi-Party Dialogue Discourse In this paper, we address the task of information extraction for meeting transcripts. The meeting documents are not usually well-structured and lacks of formatting and punctuation while the information are distributed over multiple sentences. We investigate on the use of numerical statistic or topic modeling methods on a real dataset containing multi-part dialogue texts. We evaluate our experiments with respect to the summaries provided in the dataset.
Nous nous intéressons dans cet article à l'extraction de thèmes à partir de retranscriptions textuelles de réunions. Ce type de corpus est bruité, il manque de formatage, il est peu structuré avec plusieurs locuteurs qui interviennent et l'information y est souvent éparpillée. Nous présentons une étude expérimentale utilisant des méthodes fondées sur la mesure tf-idf et l'extraction de topics sur un corpus réel de référence (le corpus AMI) pour l'étude de réunions. Nous comparons nos résultats avec les résumés fournis par le corpus.
Fichier principal
Vignette du fichier
TALN2018_paper_59.pdf (410.59 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01804162 , version 1 (31-05-2018)

Identifiants

  • HAL Id : hal-01804162 , version 1

Citer

Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. Étude Expérimentale d'Extraction d'Information dans des Retranscriptions de Réunions. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ⟨hal-01804162⟩
260 Consultations
148 Téléchargements

Partager

Gmail Facebook X LinkedIn More