Informatisation de dictionnaires langues africaines-français - LINA - Equipe Traitement Automatique du Langage Naturel Access content directly
Conference Papers Year : 2011

Informatisation de dictionnaires langues africaines-français

Abstract

Cet article présente des travaux réalisés dans le cadre du projet DiLAF qui vise à informatiser des dictionnaires langues africaines-français (bambara, haoussa, kanouri, tamajaq, songhai-zarma) afin de pouvoir les diffuser plus largement et étendre leur couverture. Nous présentons une méthodologie de récupération de dictionnaires au format .doc et leur conversion dans un format XML structuré suivant les standards du domaine comme Unicode et Lexical Markup Framework. Cette méthodologie se veut simple et compréhensible par un linguiste sachant manipuler les expressions régulières. Les outils nécessaires sont gratuits, en source ouverte et multi-plate-formes. La méthode décrite est suffisamment générique pour être appliquée sur des dictionnaires d'autres langues, voire toute ressource textuelle.
Fichier principal
Vignette du fichier
LTT2011_Mangeot_v2.pdf (390.5 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-00780181 , version 1 (23-01-2013)

Identifiers

  • HAL Id : hal-00780181 , version 1

Cite

Mathieu Mangeot, Chantal Enguehard. Informatisation de dictionnaires langues africaines-français. journées LTT 2011, Sep 2011, Villetaneuse, France. 11 p. ⟨hal-00780181⟩
197 View
1282 Download

Share

Gmail Facebook X LinkedIn More