@inproceedings{semmar-fluhr-2007-utilisation,
title = "Utilisation d{'}une approche bas{\'e}e sur la recherche cross-lingue d{'}information pour l{'}alignement de phrases {\`a} partir de textes bilingues Arabe-Fran{\c{c}}ais",
author = "Semmar, Nasredine and
Fluhr, Christian",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2007.jeptalnrecital-long.38",
pages = "385--394",
abstract = "L{'}alignement de phrases {\`a} partir de textes bilingues consiste {\`a} reconna{\^\i}tre les phrases qui sont traductions les unes des autres. Cet article pr{\'e}sente une nouvelle approche pour aligner les phrases d{'}un corpus parall{\`e}le. Cette approche est bas{\'e}e sur la recherche crosslingue d{'}information et consiste {\`a} construire une base de donn{\'e}es des phrases du texte cible et consid{\'e}rer chaque phrase du texte source comme une requ{\^e}te {\`a} cette base. La recherche crosslingue utilise un analyseur linguistique et un moteur de recherche. L{'}analyseur linguistique traite aussi bien les documents {\`a} indexer que les requ{\^e}tes et produit un ensemble de lemmes normalis{\'e}s, un ensemble d{'}entit{\'e}s nomm{\'e}es et un ensemble de mots compos{\'e}s avec leurs {\'e}tiquettes morpho-syntaxiques. Le moteur de recherche construit les fichiers invers{\'e}s des documents en se basant sur leur analyse linguistique et retrouve les documents pertinents {\`a} partir de leur indexes. L{'}aligneur de phrases a {\'e}t{\'e} {\'e}valu{\'e} sur un corpus parall{\`e}le Arabe-Fran{\c{c}}ais et les r{\'e}sultats obtenus montrent que 97{\%} des phrases ont {\'e}t{\'e} correctement align{\'e}es.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="semmar-fluhr-2007-utilisation">
<titleInfo>
<title>Utilisation d’une approche basée sur la recherche cross-lingue d’information pour l’alignement de phrases à partir de textes bilingues Arabe-Français</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nasredine</namePart>
<namePart type="family">Semmar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Christian</namePart>
<namePart type="family">Fluhr</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2007-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nabil</namePart>
<namePart type="family">Hathout</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’alignement de phrases à partir de textes bilingues consiste à reconnaître les phrases qui sont traductions les unes des autres. Cet article présente une nouvelle approche pour aligner les phrases d’un corpus parallèle. Cette approche est basée sur la recherche crosslingue d’information et consiste à construire une base de données des phrases du texte cible et considérer chaque phrase du texte source comme une requête à cette base. La recherche crosslingue utilise un analyseur linguistique et un moteur de recherche. L’analyseur linguistique traite aussi bien les documents à indexer que les requêtes et produit un ensemble de lemmes normalisés, un ensemble d’entités nommées et un ensemble de mots composés avec leurs étiquettes morpho-syntaxiques. Le moteur de recherche construit les fichiers inversés des documents en se basant sur leur analyse linguistique et retrouve les documents pertinents à partir de leur indexes. L’aligneur de phrases a été évalué sur un corpus parallèle Arabe-Français et les résultats obtenus montrent que 97% des phrases ont été correctement alignées.</abstract>
<identifier type="citekey">semmar-fluhr-2007-utilisation</identifier>
<location>
<url>https://aclanthology.org/2007.jeptalnrecital-long.38</url>
</location>
<part>
<date>2007-06</date>
<extent unit="page">
<start>385</start>
<end>394</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Utilisation d’une approche basée sur la recherche cross-lingue d’information pour l’alignement de phrases à partir de textes bilingues Arabe-Français
%A Semmar, Nasredine
%A Fluhr, Christian
%Y Hathout, Nabil
%Y Muller, Philippe
%S Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2007
%8 June
%I ATALA
%C Toulouse, France
%G French
%F semmar-fluhr-2007-utilisation
%X L’alignement de phrases à partir de textes bilingues consiste à reconnaître les phrases qui sont traductions les unes des autres. Cet article présente une nouvelle approche pour aligner les phrases d’un corpus parallèle. Cette approche est basée sur la recherche crosslingue d’information et consiste à construire une base de données des phrases du texte cible et considérer chaque phrase du texte source comme une requête à cette base. La recherche crosslingue utilise un analyseur linguistique et un moteur de recherche. L’analyseur linguistique traite aussi bien les documents à indexer que les requêtes et produit un ensemble de lemmes normalisés, un ensemble d’entités nommées et un ensemble de mots composés avec leurs étiquettes morpho-syntaxiques. Le moteur de recherche construit les fichiers inversés des documents en se basant sur leur analyse linguistique et retrouve les documents pertinents à partir de leur indexes. L’aligneur de phrases a été évalué sur un corpus parallèle Arabe-Français et les résultats obtenus montrent que 97% des phrases ont été correctement alignées.
%U https://aclanthology.org/2007.jeptalnrecital-long.38
%P 385-394
Markdown (Informal)
[Utilisation d’une approche basée sur la recherche cross-lingue d’information pour l’alignement de phrases à partir de textes bilingues Arabe-Français](https://aclanthology.org/2007.jeptalnrecital-long.38) (Semmar & Fluhr, JEP/TALN/RECITAL 2007)
ACL