Accéder directement au contenu Accéder directement à la navigation
Article dans une revue

Revisiting Multi-Domain Machine Translation

Minh Quang Pham 1, 2 Josep-Maria Crego 2 François Yvon 1
1 TLP - Traitement du Langage Parlé
LISN - Laboratoire Interdisciplinaire des Sciences du Numérique, STL - Sciences et Technologies des Langues
Abstract : When building machine translation systems, one often needs to make the best out of heterogeneous sets of parallel data in training, and to robustly handle inputs from unexpected domains in testing. This multi-domain scenario has attracted a lot of recent work, that fall under the general umbrella of transfer learning. In this study, we revisit multi-domain machine translation, with the aim to formulate the motivations for developing such systems and the associated expectations with respect to performance. Our experiments with a large sample of multi-domain systems show that most of these expectations are hardly met and suggest that further work is needed to better analyze the current behaviour of multi-domain systems and to make them fully hold their promises.
Type de document :
Article dans une revue
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-03159744
Contributeur : Limsi Publications Connectez-vous pour contacter le contributeur
Soumis le : jeudi 4 mars 2021 - 17:02:46
Dernière modification le : lundi 14 juin 2021 - 10:41:11
Archivage à long terme le : : samedi 5 juin 2021 - 19:16:17

Fichier

tacl_a_00351.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

Citation

Minh Quang Pham, Josep-Maria Crego, François Yvon. Revisiting Multi-Domain Machine Translation. Transactions of the Association for Computational Linguistics, The MIT Press, 2021, 9, pp.17-35. ⟨10.1162/tacl_a_00351⟩. ⟨hal-03159744⟩

Partager

Métriques

Consultations de la notice

113

Téléchargements de fichiers

110