@inproceedings{tomeh-etal-2011-estimation,
title = "Estimation d`un mod{\`e}le de traduction {\`a} partir d`alignements mot-{\`a}-mot non-d{\'e}terministes (Estimating a translation model from non-deterministic word-to-word alignments)",
author = "Tomeh, Nadi and
Allauzen, Alexandre and
Yvon, Fran{\c{c}}ois",
editor = "Lafourcade, Mathieu and
Prince, Violaine",
booktitle = "Actes de la 18e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2011",
address = "Montpellier, France",
publisher = "ATALA",
url = "https://aclanthology.org/2011.jeptalnrecital-long.37/",
pages = "424--435",
language = "fra",
abstract = "Dans les syst{\`e}mes de traduction statistique {\`a} base de segments, le mod{\`e}le de traduction est estim{\'e} {\`a} partir d`alignements mot-{\`a}-mot gr{\^a}ce {\`a} des heuristiques d`extraction et de valuation. Bien que ces alignements mot-{\`a}-mot soient construits par des mod{\`e}les probabilistes, les processus d`extraction et de valuation utilisent ces mod{\`e}les en faisant l`hypoth{\`e}se que ces alignements sont d{\'e}terministes. Dans cet article, nous proposons de lever cette hypoth{\`e}se en consid{\'e}rant l`ensemble de la matrice d`alignement, d`une paire de phrases, chaque association {\'e}tant valu{\'e}e par sa probabilit{\'e}. En comparaison avec les travaux ant{\'e}rieurs, nous montrons qu`en utilisant un mod{\`e}le exponentiel pour estimer de mani{\`e}re discriminante ces probabilit{\'e}s, il est possible d`obtenir des am{\'e}liorations significatives des performances de traduction. Ces am{\'e}liorations sont mesur{\'e}es {\`a} l`aide de la m{\'e}trique BLEU sur la t{\^a}che de traduction de l`arabe vers l`anglais de l'{\'e}valuation NIST MT`09, en consid{\'e}rant deux types de conditions selon la taille du corpus de donn{\'e}es parall{\`e}les utilis{\'e}es."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="tomeh-etal-2011-estimation">
<titleInfo>
<title>Estimation d‘un modèle de traduction à partir d‘alignements mot-à-mot non-déterministes (Estimating a translation model from non-deterministic word-to-word alignments)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nadi</namePart>
<namePart type="family">Tomeh</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Alexandre</namePart>
<namePart type="family">Allauzen</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Yvon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2011-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Lafourcade</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Violaine</namePart>
<namePart type="family">Prince</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montpellier, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans les systèmes de traduction statistique à base de segments, le modèle de traduction est estimé à partir d‘alignements mot-à-mot grâce à des heuristiques d‘extraction et de valuation. Bien que ces alignements mot-à-mot soient construits par des modèles probabilistes, les processus d‘extraction et de valuation utilisent ces modèles en faisant l‘hypothèse que ces alignements sont déterministes. Dans cet article, nous proposons de lever cette hypothèse en considérant l‘ensemble de la matrice d‘alignement, d‘une paire de phrases, chaque association étant valuée par sa probabilité. En comparaison avec les travaux antérieurs, nous montrons qu‘en utilisant un modèle exponentiel pour estimer de manière discriminante ces probabilités, il est possible d‘obtenir des améliorations significatives des performances de traduction. Ces améliorations sont mesurées à l‘aide de la métrique BLEU sur la tâche de traduction de l‘arabe vers l‘anglais de l’évaluation NIST MT‘09, en considérant deux types de conditions selon la taille du corpus de données parallèles utilisées.</abstract>
<identifier type="citekey">tomeh-etal-2011-estimation</identifier>
<location>
<url>https://aclanthology.org/2011.jeptalnrecital-long.37/</url>
</location>
<part>
<date>2011-06</date>
<extent unit="page">
<start>424</start>
<end>435</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Estimation d‘un modèle de traduction à partir d‘alignements mot-à-mot non-déterministes (Estimating a translation model from non-deterministic word-to-word alignments)
%A Tomeh, Nadi
%A Allauzen, Alexandre
%A Yvon, François
%Y Lafourcade, Mathieu
%Y Prince, Violaine
%S Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2011
%8 June
%I ATALA
%C Montpellier, France
%G fra
%F tomeh-etal-2011-estimation
%X Dans les systèmes de traduction statistique à base de segments, le modèle de traduction est estimé à partir d‘alignements mot-à-mot grâce à des heuristiques d‘extraction et de valuation. Bien que ces alignements mot-à-mot soient construits par des modèles probabilistes, les processus d‘extraction et de valuation utilisent ces modèles en faisant l‘hypothèse que ces alignements sont déterministes. Dans cet article, nous proposons de lever cette hypothèse en considérant l‘ensemble de la matrice d‘alignement, d‘une paire de phrases, chaque association étant valuée par sa probabilité. En comparaison avec les travaux antérieurs, nous montrons qu‘en utilisant un modèle exponentiel pour estimer de manière discriminante ces probabilités, il est possible d‘obtenir des améliorations significatives des performances de traduction. Ces améliorations sont mesurées à l‘aide de la métrique BLEU sur la tâche de traduction de l‘arabe vers l‘anglais de l’évaluation NIST MT‘09, en considérant deux types de conditions selon la taille du corpus de données parallèles utilisées.
%U https://aclanthology.org/2011.jeptalnrecital-long.37/
%P 424-435
Markdown (Informal)
[Estimation d’un modèle de traduction à partir d’alignements mot-à-mot non-déterministes (Estimating a translation model from non-deterministic word-to-word alignments)](https://aclanthology.org/2011.jeptalnrecital-long.37/) (Tomeh et al., JEP/TALN/RECITAL 2011)
ACL