@inproceedings{naguib-etal-2023-strategies,
title = "Strat{\'e}gies d{'}apprentissage actif pour la reconnaissance d{'}entit{\'e}s nomm{\'e}es en fran{\c{c}}ais",
author = "Naguib, Marco and
N{\'e}v{\'e}ol, Aur{\'e}lie and
Tannier, Xavier",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-long.18",
pages = "232--247",
abstract = "L{'}annotation manuelle de corpus est un processus co{\^u}teux et lent, notamment pour la t{\^a}che de re-connaissance d{'}entit{\'e}s nomm{\'e}es. L{'}apprentissage actif vise {\`a} rendre ce processus plus efficace, ens{\'e}lectionnant les portions les plus pertinentes {\`a} annoter. Certaines strat{\'e}gies visent {\`a} s{\'e}lectionner lesportions les plus repr{\'e}sentatives du corpus, d{'}autres, les plus informatives au mod{\`e}le de langage.Malgr{\'e} un int{\'e}r{\^e}t grandissant pour l{'}apprentissage actif, rares sont les {\'e}tudes qui comparent cesdiff{\'e}rentes strat{\'e}gies dans un contexte de reconnaissance d{'}entit{\'e}s nomm{\'e}es m{\'e}dicales. Nous pro-posons une comparaison de ces strat{\'e}gies en fonction des performances de chacune sur 3 corpus dedocuments cliniques en langue fran{\c{c}}aise : MERLOT, QuaeroFrenchMed et E3C. Nous comparonsles strat{\'e}gies de s{\'e}lection mais aussi les diff{\'e}rentes fa{\c{c}}ons de les {\'e}valuer. Enfin, nous identifions lesstrat{\'e}gies qui semblent les plus efficaces et mesurons l{'}am{\'e}lioration qu{'}elles pr{\'e}sentent, {\`a} diff{\'e}rentesphases de l{'}apprentissage.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="naguib-etal-2023-strategies">
<titleInfo>
<title>Stratégies d’apprentissage actif pour la reconnaissance d’entités nommées en français</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marco</namePart>
<namePart type="family">Naguib</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Aurélie</namePart>
<namePart type="family">Névéol</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Xavier</namePart>
<namePart type="family">Tannier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux – articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Vilnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’annotation manuelle de corpus est un processus coûteux et lent, notamment pour la tâche de re-connaissance d’entités nommées. L’apprentissage actif vise à rendre ce processus plus efficace, ensélectionnant les portions les plus pertinentes à annoter. Certaines stratégies visent à sélectionner lesportions les plus représentatives du corpus, d’autres, les plus informatives au modèle de langage.Malgré un intérêt grandissant pour l’apprentissage actif, rares sont les études qui comparent cesdifférentes stratégies dans un contexte de reconnaissance d’entités nommées médicales. Nous pro-posons une comparaison de ces stratégies en fonction des performances de chacune sur 3 corpus dedocuments cliniques en langue française : MERLOT, QuaeroFrenchMed et E3C. Nous comparonsles stratégies de sélection mais aussi les différentes façons de les évaluer. Enfin, nous identifions lesstratégies qui semblent les plus efficaces et mesurons l’amélioration qu’elles présentent, à différentesphases de l’apprentissage.</abstract>
<identifier type="citekey">naguib-etal-2023-strategies</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-long.18</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>232</start>
<end>247</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Stratégies d’apprentissage actif pour la reconnaissance d’entités nommées en français
%A Naguib, Marco
%A Névéol, Aurélie
%A Tannier, Xavier
%Y Servan, Christophe
%Y Vilnat, Anne
%S Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux – articles longs
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F naguib-etal-2023-strategies
%X L’annotation manuelle de corpus est un processus coûteux et lent, notamment pour la tâche de re-connaissance d’entités nommées. L’apprentissage actif vise à rendre ce processus plus efficace, ensélectionnant les portions les plus pertinentes à annoter. Certaines stratégies visent à sélectionner lesportions les plus représentatives du corpus, d’autres, les plus informatives au modèle de langage.Malgré un intérêt grandissant pour l’apprentissage actif, rares sont les études qui comparent cesdifférentes stratégies dans un contexte de reconnaissance d’entités nommées médicales. Nous pro-posons une comparaison de ces stratégies en fonction des performances de chacune sur 3 corpus dedocuments cliniques en langue française : MERLOT, QuaeroFrenchMed et E3C. Nous comparonsles stratégies de sélection mais aussi les différentes façons de les évaluer. Enfin, nous identifions lesstratégies qui semblent les plus efficaces et mesurons l’amélioration qu’elles présentent, à différentesphases de l’apprentissage.
%U https://aclanthology.org/2023.jeptalnrecital-long.18
%P 232-247
Markdown (Informal)
[Stratégies d’apprentissage actif pour la reconnaissance d’entités nommées en français](https://aclanthology.org/2023.jeptalnrecital-long.18) (Naguib et al., JEP/TALN/RECITAL 2023)
ACL