@inproceedings{verdy-etal-2023-dwie,
title = "{DWIE}-{FR} : Un nouveau jeu de donn{\'e}es en fran{\c{c}}ais annot{\'e} en entit{\'e}s nomm{\'e}es",
author = "Verdy, Sylvain and
Prieur, Maxime and
Gadek, Guillaume and
Lopez, C{\'e}dric",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : travaux de recherche originaux -- articles courts",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-short.7",
pages = "63--72",
abstract = "Ces derni{\`e}res ann{\'e}es, les contributions majeures qui ont eu lieu en apprentissage automatique supervis{\'e} ont mis en evidence la n{\'e}cessit{\'e} de disposer de grands jeux de donn{\'e}es annot{\'e}s de haute qualit{\'e}. Les recherches men{\'e}es sur la t{\^a}che de reconnaissance d{'}entit{\'e}s nomm{\'e}es dans des textes en fran{\c{c}}ais font face {\`a} l{'}absence de jeux de donn{\'e}es annot{\'e}s {``}{\`a} grande {\'e}chelle{''} et avec de nombreuses classes d{'}entit{\'e}s hi{\'e}rarchis{\'e}es. Dans cet article, nous proposons une approche pour obtenir un tel jeu de donn{\'e}es qui s{'}appuie sur des {\'e}tapes de traduction puis d{'}annotation des donn{\'e}es textuelles en anglais vers une langue cible (ici au fran{\c{c}}ais). Nous {\'e}valuons la qualit{\'e} de l{'}approche propos{\'e}e et mesurons les performances de quelques mod{\`e}les d{'}apprentissage automatique sur ces donn{\'e}es.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="verdy-etal-2023-dwie">
<titleInfo>
<title>DWIE-FR : Un nouveau jeu de données en français annoté en entités nommées</title>
</titleInfo>
<name type="personal">
<namePart type="given">Sylvain</namePart>
<namePart type="family">Verdy</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Maxime</namePart>
<namePart type="family">Prieur</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Guillaume</namePart>
<namePart type="family">Gadek</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Cédric</namePart>
<namePart type="family">Lopez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : travaux de recherche originaux – articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Vilnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Ces dernières années, les contributions majeures qui ont eu lieu en apprentissage automatique supervisé ont mis en evidence la nécessité de disposer de grands jeux de données annotés de haute qualité. Les recherches menées sur la tâche de reconnaissance d’entités nommées dans des textes en français font face à l’absence de jeux de données annotés “à grande échelle” et avec de nombreuses classes d’entités hiérarchisées. Dans cet article, nous proposons une approche pour obtenir un tel jeu de données qui s’appuie sur des étapes de traduction puis d’annotation des données textuelles en anglais vers une langue cible (ici au français). Nous évaluons la qualité de l’approche proposée et mesurons les performances de quelques modèles d’apprentissage automatique sur ces données.</abstract>
<identifier type="citekey">verdy-etal-2023-dwie</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-short.7</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>63</start>
<end>72</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T DWIE-FR : Un nouveau jeu de données en français annoté en entités nommées
%A Verdy, Sylvain
%A Prieur, Maxime
%A Gadek, Guillaume
%A Lopez, Cédric
%Y Servan, Christophe
%Y Vilnat, Anne
%S Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : travaux de recherche originaux – articles courts
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F verdy-etal-2023-dwie
%X Ces dernières années, les contributions majeures qui ont eu lieu en apprentissage automatique supervisé ont mis en evidence la nécessité de disposer de grands jeux de données annotés de haute qualité. Les recherches menées sur la tâche de reconnaissance d’entités nommées dans des textes en français font face à l’absence de jeux de données annotés “à grande échelle” et avec de nombreuses classes d’entités hiérarchisées. Dans cet article, nous proposons une approche pour obtenir un tel jeu de données qui s’appuie sur des étapes de traduction puis d’annotation des données textuelles en anglais vers une langue cible (ici au français). Nous évaluons la qualité de l’approche proposée et mesurons les performances de quelques modèles d’apprentissage automatique sur ces données.
%U https://aclanthology.org/2023.jeptalnrecital-short.7
%P 63-72
Markdown (Informal)
[DWIE-FR : Un nouveau jeu de données en français annoté en entités nommées](https://aclanthology.org/2023.jeptalnrecital-short.7) (Verdy et al., JEP/TALN/RECITAL 2023)
ACL