Degré de comparabilité, extraction lexicale bilingue et recherche d'information interlingue - LINA - Equipe Traitement Automatique du Langage Naturel Access content directly
Conference Papers Year : 2011

Degré de comparabilité, extraction lexicale bilingue et recherche d'information interlingue

Abstract

Nous étudions dans cet article le problème de la comparabilité des documents composant un corpus comparable afin d'améliorer la qualité des lexiques bilingues extraits et les performances des systèmes de recherche d'information interlingue. Nous proposons une nouvelle approche qui permet de garantir un certain degré de comparabilité et d'homogénéité du corpus tout en préservant une grande part du vocabulaire du corpus d'origine. Nos expériences montrent que les lexiques bilingues que nous obtenons sont d'une meilleure qualité que ceux obtenus avec les approches précédentes, et qu'ils peuvent être utilisés pour améliorer significativement les systèmes de recherche d'information interlingue.
Fichier principal
Vignette du fichier
Li_taln11_submission_50.pdf (139.18 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-00608471 , version 1 (13-07-2011)

Identifiers

  • HAL Id : hal-00608471 , version 1

Cite

Li Bo, Éric Gaussier, Emmanuel Morin, Amir Hazem. Degré de comparabilité, extraction lexicale bilingue et recherche d'information interlingue. TALN 2011 - Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France. pp.211-222. ⟨hal-00608471⟩
253 View
191 Download

Share

Gmail Facebook X LinkedIn More