Apprentissage non supervisé pour la traduction automatique : application à un couple de langues peu doté

Thi Ngoc Diep, Laurent Besacier, Eric Castelli


Abstract
Cet article présente une méthode non-supervisée pour extraire des paires de phrases parallèles à partir d’un corpus comparable. Un système de traduction automatique est utilisé pour exploiter le corpus comparable et détecter les paires de phrases parallèles. Un processus itératif est exécuté non seulement pour augmenter le nombre de paires de phrases parallèles extraites, mais aussi pour améliorer la qualité globale du système de traduction. Une comparaison avec une méthode semi-supervisée est présentée également. Les expériences montrent que la méthode non-supervisée peut être réellement appliquée dans le cas où on manque de données parallèles. Bien que les expériences préliminaires soient menées sur la traduction français-anglais, cette méthode non-supervisée est également appliquée avec succès à un couple de langues peu doté : vietnamien-français.
Anthology ID:
2010.jeptalnrecital-long.28
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
272–281
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.28
DOI:
Bibkey:
Cite (ACL):
Thi Ngoc Diep, Laurent Besacier, and Eric Castelli. 2010. Apprentissage non supervisé pour la traduction automatique : application à un couple de langues peu doté. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 272–281, Montréal, Canada. ATALA.
Cite (Informal):
Apprentissage non supervisé pour la traduction automatique : application à un couple de langues peu doté (Ngoc Diep et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-long.28.pdf