@inproceedings{poulard-etal-2009-nouvelles,
title = "Nouvelles consid{\'e}rations pour la d{\'e}tection de r{\'e}utilisation de texte",
author = "Poulard, Fabien and
Afantenos, Stergos and
Hernandez, Nicolas",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles courts",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-court.25/",
pages = "227--236",
language = "fra",
abstract = "Dans cet article nous nous int{\'e}ressons au probl{\`e}me de la d{\'e}tection de r{\'e}utilisation de texte. Plus particuli{\`e}rement, {\'e}tant donn{\'e} un document original et un ensemble de documents candidats {---} th{\'e}matiquement similaires au premier {---} nous cherchons {\`a} classer ceux qui sont d{\'e}riv{\'e}s du document original et ceux qui ne le sont pas. Nous abordons le probl{\`e}me selon deux approches : dans la premi{\`e}re, nous nous int{\'e}ressons aux similarit{\'e}s discursives entre les documents, dans la seconde au recouvrement de n-grams hapax. Nous pr{\'e}sentons le r{\'e}sultat d`exp{\'e}rimentations men{\'e}es sur un corpus de presse francophone construit dans le cadre du projet ANR PIITHIE."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="poulard-etal-2009-nouvelles">
<titleInfo>
<title>Nouvelles considérations pour la détection de réutilisation de texte</title>
</titleInfo>
<name type="personal">
<namePart type="given">Fabien</namePart>
<namePart type="family">Poulard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Stergos</namePart>
<namePart type="family">Afantenos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Hernandez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans cet article nous nous intéressons au problème de la détection de réutilisation de texte. Plus particulièrement, étant donné un document original et un ensemble de documents candidats — thématiquement similaires au premier — nous cherchons à classer ceux qui sont dérivés du document original et ceux qui ne le sont pas. Nous abordons le problème selon deux approches : dans la première, nous nous intéressons aux similarités discursives entre les documents, dans la seconde au recouvrement de n-grams hapax. Nous présentons le résultat d‘expérimentations menées sur un corpus de presse francophone construit dans le cadre du projet ANR PIITHIE.</abstract>
<identifier type="citekey">poulard-etal-2009-nouvelles</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-court.25/</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>227</start>
<end>236</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Nouvelles considérations pour la détection de réutilisation de texte
%A Poulard, Fabien
%A Afantenos, Stergos
%A Hernandez, Nicolas
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G fra
%F poulard-etal-2009-nouvelles
%X Dans cet article nous nous intéressons au problème de la détection de réutilisation de texte. Plus particulièrement, étant donné un document original et un ensemble de documents candidats — thématiquement similaires au premier — nous cherchons à classer ceux qui sont dérivés du document original et ceux qui ne le sont pas. Nous abordons le problème selon deux approches : dans la première, nous nous intéressons aux similarités discursives entre les documents, dans la seconde au recouvrement de n-grams hapax. Nous présentons le résultat d‘expérimentations menées sur un corpus de presse francophone construit dans le cadre du projet ANR PIITHIE.
%U https://aclanthology.org/2009.jeptalnrecital-court.25/
%P 227-236
Markdown (Informal)
[Nouvelles considérations pour la détection de réutilisation de texte](https://aclanthology.org/2009.jeptalnrecital-court.25/) (Poulard et al., JEP/TALN/RECITAL 2009)
ACL