@inproceedings{brun-etal-2006-exploration,
title = "Exploration et utilisation d`informations distantes dans les mod{\`e}les de langage statistiques",
author = {Brun, Armelle and
Langlois, David and
Sma{\"i}li, Kamel},
editor = "Mertens, Piet and
Fairon, C{\'e}drick and
Dister, Anne and
Watrin, Patrick",
booktitle = "Actes de la 13{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = apr,
year = "2006",
address = "Leuven, Belgique",
publisher = "ATALA",
url = "https://aclanthology.org/2006.jeptalnrecital-poster.6/",
pages = "425--434",
language = "fra",
abstract = "Dans le cadre de la mod{\'e}lisation statistique du langage, nous montrons qu`il est possible d`utiliser un mod{\`e}le n-grammes avec un historique qui n`est pas n{\'e}cessairement celui avec lequel il a {\'e}t{\'e} appris. Par exemple, un adverbe pr{\'e}sent dans l`historique peut ne pas avoir d`importance pour la pr{\'e}diction, et devrait donc {\^e}tre ignor{\'e} en d{\'e}calant l`historique utilis{\'e} pour la pr{\'e}diction. Notre {\'e}tude porte sur les mod{\`e}les n-grammes classiques et les mod{\`e}les n-grammes distants et est appliqu{\'e}e au cas des bigrammes. Nous pr{\'e}sentons quatre cas d`utilisation pour deux mod{\`e}les bigrammes : distants et non distants. Nous montrons que la combinaison lin{\'e}aire d{\'e}pendante de l`historique de ces quatre cas permet d`am{\'e}liorer de 14 {\%} la perplexit{\'e} du mod{\`e}le bigrammes classique. Par ailleurs, nous nous int{\'e}ressons {\`a} quelques cas de combinaison qui permettent de mettre en valeur les historiques pour lesquels les mod{\`e}les que nous proposons sont performants."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="brun-etal-2006-exploration">
<titleInfo>
<title>Exploration et utilisation d‘informations distantes dans les modèles de langage statistiques</title>
</titleInfo>
<name type="personal">
<namePart type="given">Armelle</namePart>
<namePart type="family">Brun</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">David</namePart>
<namePart type="family">Langlois</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Kamel</namePart>
<namePart type="family">Smaïli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2006-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Piet</namePart>
<namePart type="family">Mertens</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Cédrick</namePart>
<namePart type="family">Fairon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Dister</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Patrick</namePart>
<namePart type="family">Watrin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Leuven, Belgique</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans le cadre de la modélisation statistique du langage, nous montrons qu‘il est possible d‘utiliser un modèle n-grammes avec un historique qui n‘est pas nécessairement celui avec lequel il a été appris. Par exemple, un adverbe présent dans l‘historique peut ne pas avoir d‘importance pour la prédiction, et devrait donc être ignoré en décalant l‘historique utilisé pour la prédiction. Notre étude porte sur les modèles n-grammes classiques et les modèles n-grammes distants et est appliquée au cas des bigrammes. Nous présentons quatre cas d‘utilisation pour deux modèles bigrammes : distants et non distants. Nous montrons que la combinaison linéaire dépendante de l‘historique de ces quatre cas permet d‘améliorer de 14 % la perplexité du modèle bigrammes classique. Par ailleurs, nous nous intéressons à quelques cas de combinaison qui permettent de mettre en valeur les historiques pour lesquels les modèles que nous proposons sont performants.</abstract>
<identifier type="citekey">brun-etal-2006-exploration</identifier>
<location>
<url>https://aclanthology.org/2006.jeptalnrecital-poster.6/</url>
</location>
<part>
<date>2006-04</date>
<extent unit="page">
<start>425</start>
<end>434</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Exploration et utilisation d‘informations distantes dans les modèles de langage statistiques
%A Brun, Armelle
%A Langlois, David
%A Smaïli, Kamel
%Y Mertens, Piet
%Y Fairon, Cédrick
%Y Dister, Anne
%Y Watrin, Patrick
%S Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2006
%8 April
%I ATALA
%C Leuven, Belgique
%G fra
%F brun-etal-2006-exploration
%X Dans le cadre de la modélisation statistique du langage, nous montrons qu‘il est possible d‘utiliser un modèle n-grammes avec un historique qui n‘est pas nécessairement celui avec lequel il a été appris. Par exemple, un adverbe présent dans l‘historique peut ne pas avoir d‘importance pour la prédiction, et devrait donc être ignoré en décalant l‘historique utilisé pour la prédiction. Notre étude porte sur les modèles n-grammes classiques et les modèles n-grammes distants et est appliquée au cas des bigrammes. Nous présentons quatre cas d‘utilisation pour deux modèles bigrammes : distants et non distants. Nous montrons que la combinaison linéaire dépendante de l‘historique de ces quatre cas permet d‘améliorer de 14 % la perplexité du modèle bigrammes classique. Par ailleurs, nous nous intéressons à quelques cas de combinaison qui permettent de mettre en valeur les historiques pour lesquels les modèles que nous proposons sont performants.
%U https://aclanthology.org/2006.jeptalnrecital-poster.6/
%P 425-434
Markdown (Informal)
[Exploration et utilisation d’informations distantes dans les modèles de langage statistiques](https://aclanthology.org/2006.jeptalnrecital-poster.6/) (Brun et al., JEP/TALN/RECITAL 2006)
ACL