@inproceedings{studzinski-perotto-etal-2019-une,
title = "Une approche hybride pour la segmentation automatique de documents juridiques (A hybrid approach for automatic text segmentation)",
author = "Studzinski Perotto, Filipo and
Taleb, Fadila and
Trupin, Eric and
Saidali, Youssouf and
Holzem, Maryvonne and
Labiche, Jacques and
Vercouter, Laurent",
editor = "Morin, Emmanuel and
Rosset, Sophie and
Zweigenbaum, Pierre",
booktitle = "Actes de la Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume II : Articles courts",
month = "7",
year = "2019",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2019.jeptalnrecital-court.31/",
pages = "447--456",
language = "fra",
abstract = "Cet article 1 propose une approche hybride pour la segmentation de documents bas{\'e}e sur l`agr{\'e}gation de diff{\'e}rentes solutions. Divers algorithmes de segmentation peuvent {\^e}tre utilis{\'e}s dans le syst{\`e}me, ce qui permet la combinaison de strat{\'e}gies multiples (sp{\'e}cifiques au domaine, supervis{\'e}es et nonsupervis{\'e}es). Un ensemble de documents {\'e}tiquet{\'e}s, segment{\'e}s au pr{\'e}alable et repr{\'e}sentatif du domaine cibl{\'e}, doit {\^e}tre fourni pour {\^e}tre utilis{\'e} comme ensemble d`entra{\^i}nement pour l`apprentissage des m{\'e}thodes supervis{\'e}es, et aussi comme ensemble de test pour l'{\'e}valuation de la performance de chaque m{\'e}thode, ce qui d{\'e}terminera leur poids lors de la phase d`agr{\'e}gation. L`approche propos{\'e}e pr{\'e}sente de bonnes performances dans un sc{\'e}nario exp{\'e}rimental issu d`un corpus extrait du domaine juridique."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="studzinski-perotto-etal-2019-une">
<titleInfo>
<title>Une approche hybride pour la segmentation automatique de documents juridiques (A hybrid approach for automatic text segmentation)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Filipo</namePart>
<namePart type="family">Studzinski Perotto</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Fadila</namePart>
<namePart type="family">Taleb</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eric</namePart>
<namePart type="family">Trupin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Youssouf</namePart>
<namePart type="family">Saidali</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Maryvonne</namePart>
<namePart type="family">Holzem</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jacques</namePart>
<namePart type="family">Labiche</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Laurent</namePart>
<namePart type="family">Vercouter</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2019-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume II : Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Morin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sophie</namePart>
<namePart type="family">Rosset</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pierre</namePart>
<namePart type="family">Zweigenbaum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article 1 propose une approche hybride pour la segmentation de documents basée sur l‘agrégation de différentes solutions. Divers algorithmes de segmentation peuvent être utilisés dans le système, ce qui permet la combinaison de stratégies multiples (spécifiques au domaine, supervisées et nonsupervisées). Un ensemble de documents étiquetés, segmentés au préalable et représentatif du domaine ciblé, doit être fourni pour être utilisé comme ensemble d‘entraînement pour l‘apprentissage des méthodes supervisées, et aussi comme ensemble de test pour l’évaluation de la performance de chaque méthode, ce qui déterminera leur poids lors de la phase d‘agrégation. L‘approche proposée présente de bonnes performances dans un scénario expérimental issu d‘un corpus extrait du domaine juridique.</abstract>
<identifier type="citekey">studzinski-perotto-etal-2019-une</identifier>
<location>
<url>https://aclanthology.org/2019.jeptalnrecital-court.31/</url>
</location>
<part>
<date>2019-7</date>
<extent unit="page">
<start>447</start>
<end>456</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Une approche hybride pour la segmentation automatique de documents juridiques (A hybrid approach for automatic text segmentation)
%A Studzinski Perotto, Filipo
%A Taleb, Fadila
%A Trupin, Eric
%A Saidali, Youssouf
%A Holzem, Maryvonne
%A Labiche, Jacques
%A Vercouter, Laurent
%Y Morin, Emmanuel
%Y Rosset, Sophie
%Y Zweigenbaum, Pierre
%S Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume II : Articles courts
%D 2019
%8 July
%I ATALA
%C Toulouse, France
%G fra
%F studzinski-perotto-etal-2019-une
%X Cet article 1 propose une approche hybride pour la segmentation de documents basée sur l‘agrégation de différentes solutions. Divers algorithmes de segmentation peuvent être utilisés dans le système, ce qui permet la combinaison de stratégies multiples (spécifiques au domaine, supervisées et nonsupervisées). Un ensemble de documents étiquetés, segmentés au préalable et représentatif du domaine ciblé, doit être fourni pour être utilisé comme ensemble d‘entraînement pour l‘apprentissage des méthodes supervisées, et aussi comme ensemble de test pour l’évaluation de la performance de chaque méthode, ce qui déterminera leur poids lors de la phase d‘agrégation. L‘approche proposée présente de bonnes performances dans un scénario expérimental issu d‘un corpus extrait du domaine juridique.
%U https://aclanthology.org/2019.jeptalnrecital-court.31/
%P 447-456
Markdown (Informal)
[Une approche hybride pour la segmentation automatique de documents juridiques (A hybrid approach for automatic text segmentation)](https://aclanthology.org/2019.jeptalnrecital-court.31/) (Studzinski Perotto et al., JEP/TALN/RECITAL 2019)
ACL