@inproceedings{huet-etal-2008-un,
title = "Un mod{\`e}le multi-sources pour la segmentation en sujets de journaux radiophoniques",
author = "Huet, St{\'e}phane and
Gravier, Guillaume and
S{\'e}billot, Pascale",
editor = "B{\'e}chet, Fr{\'e}d{\'e}ric and
Bonastre, Jean-Francois",
booktitle = "Actes de la 15{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2008",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2008.jeptalnrecital-long.5/",
pages = "41--50",
language = "fra",
abstract = "Nous pr{\'e}sentons une m{\'e}thode de segmentation de journaux radiophoniques en sujets, bas{\'e}e sur la prise en compte d`indices lexicaux, syntaxiques et acoustiques. Partant d`un mod{\`e}le statistique existant de segmentation th{\'e}matique, exploitant la notion de coh{\'e}sion lexicale, nous {\'e}tendons le formalisme pour y inclure des informations d`ordre syntaxique et acoustique. Les r{\'e}sultats exp{\'e}rimentaux montrent que le seul mod{\`e}le de coh{\'e}sion lexicale ne suffit pas pour le type de documents {\'e}tudi{\'e} en raison de la taille variable des segments et de l`absence d`un lien direct entre segment et th{\`e}me. L`utilisation d`informations syntaxiques et acoustiques permet une am{\'e}lioration substantielle de la segmentation obtenue."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="huet-etal-2008-un">
<titleInfo>
<title>Un modèle multi-sources pour la segmentation en sujets de journaux radiophoniques</title>
</titleInfo>
<name type="personal">
<namePart type="given">Stéphane</namePart>
<namePart type="family">Huet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Guillaume</namePart>
<namePart type="family">Gravier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pascale</namePart>
<namePart type="family">Sébillot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2008-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Béchet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Francois</namePart>
<namePart type="family">Bonastre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons une méthode de segmentation de journaux radiophoniques en sujets, basée sur la prise en compte d‘indices lexicaux, syntaxiques et acoustiques. Partant d‘un modèle statistique existant de segmentation thématique, exploitant la notion de cohésion lexicale, nous étendons le formalisme pour y inclure des informations d‘ordre syntaxique et acoustique. Les résultats expérimentaux montrent que le seul modèle de cohésion lexicale ne suffit pas pour le type de documents étudié en raison de la taille variable des segments et de l‘absence d‘un lien direct entre segment et thème. L‘utilisation d‘informations syntaxiques et acoustiques permet une amélioration substantielle de la segmentation obtenue.</abstract>
<identifier type="citekey">huet-etal-2008-un</identifier>
<location>
<url>https://aclanthology.org/2008.jeptalnrecital-long.5/</url>
</location>
<part>
<date>2008-06</date>
<extent unit="page">
<start>41</start>
<end>50</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Un modèle multi-sources pour la segmentation en sujets de journaux radiophoniques
%A Huet, Stéphane
%A Gravier, Guillaume
%A Sébillot, Pascale
%Y Béchet, Frédéric
%Y Bonastre, Jean-Francois
%S Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2008
%8 June
%I ATALA
%C Avignon, France
%G fra
%F huet-etal-2008-un
%X Nous présentons une méthode de segmentation de journaux radiophoniques en sujets, basée sur la prise en compte d‘indices lexicaux, syntaxiques et acoustiques. Partant d‘un modèle statistique existant de segmentation thématique, exploitant la notion de cohésion lexicale, nous étendons le formalisme pour y inclure des informations d‘ordre syntaxique et acoustique. Les résultats expérimentaux montrent que le seul modèle de cohésion lexicale ne suffit pas pour le type de documents étudié en raison de la taille variable des segments et de l‘absence d‘un lien direct entre segment et thème. L‘utilisation d‘informations syntaxiques et acoustiques permet une amélioration substantielle de la segmentation obtenue.
%U https://aclanthology.org/2008.jeptalnrecital-long.5/
%P 41-50
Markdown (Informal)
[Un modèle multi-sources pour la segmentation en sujets de journaux radiophoniques](https://aclanthology.org/2008.jeptalnrecital-long.5/) (Huet et al., JEP/TALN/RECITAL 2008)
ACL