@inproceedings{amalvy-etal-2022-remplacement,
title = "Remplacement de mentions pour l`adaptation d`un corpus de reconnaissance d`entit{\'e}s nomm{\'e}es {\`a} un domaine cible (Mention replacement for adapting a named entity recognition dataset to a target domain)",
author = "Amalvy, Arthur and
Labatut, Vincent and
Dufour, Richard",
editor = "Est{\`e}ve, Yannick and
Jim{\'e}nez, Tania and
Parcollet, Titouan and
Zanon Boito, Marcely",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2022.jeptalnrecital-taln.19/",
pages = "198--205",
language = "fra",
abstract = "La reconnaissance d`entit{\'e}s nomm{\'e}es est une t{\^a}che de traitement automatique du langage naturel bien {\'e}tudi{\'e}e et utile dans de nombreuses applications. Derni{\`e}rement, les mod{\`e}les neuronaux permettent de la r{\'e}soudre avec de tr{\`e}s bonnes performances. Cependant, les jeux de donn{\'e}es permettant l`entra{\^i}nement et l'{\'e}valuation de ces mod{\`e}les se concentrent sur un nombre restreint de domaines et types de documents (articles journalistiques, internet). Or, les performances d`un mod{\`e}le entra{\^i}n{\'e} sur un domaine cibl{\'e} sont en g{\'e}n{\'e}ral moindres dans un autre : ceux moins couverts sont donc p{\'e}nalis{\'e}s. Pour tenter de rem{\'e}dier {\`a} ce probl{\`e}me, cet article propose d`utiliser une technique d`augmentation de donn{\'e}es permettant d`adapter un corpus annot{\'e} en entit{\'e}s nomm{\'e}es d`un domaine source {\`a} un domaine cible o{\`u} les types de noms rencontr{\'e}s peuvent {\^e}tre diff{\'e}rents. Nous l`appliquons dans le cadre de la litt{\'e}rature de fantasy, o{\`u} nous montrons qu`elle peut apporter des gains de performance."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="amalvy-etal-2022-remplacement">
<titleInfo>
<title>Remplacement de mentions pour l‘adaptation d‘un corpus de reconnaissance d‘entités nommées à un domaine cible (Mention replacement for adapting a named entity recognition dataset to a target domain)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Arthur</namePart>
<namePart type="family">Amalvy</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Labatut</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2022-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Estève</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Tania</namePart>
<namePart type="family">Jiménez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Titouan</namePart>
<namePart type="family">Parcollet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marcely</namePart>
<namePart type="family">Zanon Boito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La reconnaissance d‘entités nommées est une tâche de traitement automatique du langage naturel bien étudiée et utile dans de nombreuses applications. Dernièrement, les modèles neuronaux permettent de la résoudre avec de très bonnes performances. Cependant, les jeux de données permettant l‘entraînement et l’évaluation de ces modèles se concentrent sur un nombre restreint de domaines et types de documents (articles journalistiques, internet). Or, les performances d‘un modèle entraîné sur un domaine ciblé sont en général moindres dans un autre : ceux moins couverts sont donc pénalisés. Pour tenter de remédier à ce problème, cet article propose d‘utiliser une technique d‘augmentation de données permettant d‘adapter un corpus annoté en entités nommées d‘un domaine source à un domaine cible où les types de noms rencontrés peuvent être différents. Nous l‘appliquons dans le cadre de la littérature de fantasy, où nous montrons qu‘elle peut apporter des gains de performance.</abstract>
<identifier type="citekey">amalvy-etal-2022-remplacement</identifier>
<location>
<url>https://aclanthology.org/2022.jeptalnrecital-taln.19/</url>
</location>
<part>
<date>2022-6</date>
<extent unit="page">
<start>198</start>
<end>205</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Remplacement de mentions pour l‘adaptation d‘un corpus de reconnaissance d‘entités nommées à un domaine cible (Mention replacement for adapting a named entity recognition dataset to a target domain)
%A Amalvy, Arthur
%A Labatut, Vincent
%A Dufour, Richard
%Y Estève, Yannick
%Y Jiménez, Tania
%Y Parcollet, Titouan
%Y Zanon Boito, Marcely
%S Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2022
%8 June
%I ATALA
%C Avignon, France
%G fra
%F amalvy-etal-2022-remplacement
%X La reconnaissance d‘entités nommées est une tâche de traitement automatique du langage naturel bien étudiée et utile dans de nombreuses applications. Dernièrement, les modèles neuronaux permettent de la résoudre avec de très bonnes performances. Cependant, les jeux de données permettant l‘entraînement et l’évaluation de ces modèles se concentrent sur un nombre restreint de domaines et types de documents (articles journalistiques, internet). Or, les performances d‘un modèle entraîné sur un domaine ciblé sont en général moindres dans un autre : ceux moins couverts sont donc pénalisés. Pour tenter de remédier à ce problème, cet article propose d‘utiliser une technique d‘augmentation de données permettant d‘adapter un corpus annoté en entités nommées d‘un domaine source à un domaine cible où les types de noms rencontrés peuvent être différents. Nous l‘appliquons dans le cadre de la littérature de fantasy, où nous montrons qu‘elle peut apporter des gains de performance.
%U https://aclanthology.org/2022.jeptalnrecital-taln.19/
%P 198-205
Markdown (Informal)
[Remplacement de mentions pour l’adaptation d’un corpus de reconnaissance d’entités nommées à un domaine cible (Mention replacement for adapting a named entity recognition dataset to a target domain)](https://aclanthology.org/2022.jeptalnrecital-taln.19/) (Amalvy et al., JEP/TALN/RECITAL 2022)
ACL