@inproceedings{arens-etal-2024-reequilibrer,
title = "R{\'e}{\'e}quilibrer la distribution des labels tout en {\'e}liminant le temps d`attente inh{\'e}rent dans l`apprentissage actif multi-label appliqu{\'e} aux transformers",
author = "Arens, Maxime and
G Moreno, Jose and
Boughanem, Mohand and
Callebert, Lucile",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d`articles publi{\`e}s",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-trad.10/",
pages = "16--17",
language = "fra",
abstract = "L`annotation des donn{\'e}es est cruciale pour l`apprentissage automatique, notamment dans les domaines techniques, o{\`u} la qualit{\'e} et la quantit{\'e} des donn{\'e}es annot{\'e}es affectent significativement l`efficacit{\'e} des mod{\`e}les entra{\^i}n{\'e}s. L`utilisation de personnel humain est co{\^u}teuse, surtout lors de l`annotation pour la classification multi-label, les instances pouvant {\^e}tre associ{\'e}es {\`a} plusieurs labels.L`apprentissage actif (AA) vise {\`a} r{\'e}duire les co{\^u}ts d`annotation en s{\'e}lectionnant intelligemment des instances pour l`annotation, plut{\^o}t que de les annoter de mani{\`e}re al{\'e}atoire. L`attention r{\'e}cente port{\'e}e aux transformers a mis en lumi{\`e}re le potentiel de l`AA dans ce contexte.Cependant, dans des environnements pratiques, la mise en {\oe}uvre de l`AA rencontre des d{\'e}fis pratiques. Notamment, le temps entre les cycles d`AA n`est pas mis {\`a} contribution par les annotateurs. Pour r{\'e}soudre ce probl{\`e}me, nous examinons des m{\'e}thodes alternatives de s{\'e}lection d`instances, visant {\`a} maximiser l`efficacit{\'e} de l`annotation en s`int{\'e}grant au processus de l`AA. Nous commen{\c{c}}ons par {\'e}valuer deux m{\'e}thodes existantes, en utilisant respectivement un {\'e}chantillonnage al{\'e}atoire et des informations de cycle d`AA p{\'e}rim{\'e}es. Ensuite, nous proposons notre m{\'e}thode novatrice bas{\'e}e sur l`annotation des instances pour r{\'e}{\'e}quilibrer la distribution des labels. Notre approche att{\'e}nue les biais, am{\'e}liore les performances du mod{\`e}le (jusqu'{\`a} une am{\'e}lioration de 23 sur le score F1), r{\'e}duit les disparit{\'e}s d{\'e}pendantes de la strat{\'e}gie (diminution d`environ 50 sur l'{\'e}cart type) et diminue le d{\'e}s{\'e}quilibre des libell{\'e}s (diminution de 30 sur le ratio moyen de d{\'e}s{\'e}quilibre)."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="arens-etal-2024-reequilibrer">
<titleInfo>
<title>Rééquilibrer la distribution des labels tout en éliminant le temps d‘attente inhérent dans l‘apprentissage actif multi-label appliqué aux transformers</title>
</titleInfo>
<name type="personal">
<namePart type="given">Maxime</namePart>
<namePart type="family">Arens</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mohand</namePart>
<namePart type="family">Boughanem</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lucile</namePart>
<namePart type="family">Callebert</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d‘articles publiès</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L‘annotation des données est cruciale pour l‘apprentissage automatique, notamment dans les domaines techniques, où la qualité et la quantité des données annotées affectent significativement l‘efficacité des modèles entraînés. L‘utilisation de personnel humain est coûteuse, surtout lors de l‘annotation pour la classification multi-label, les instances pouvant être associées à plusieurs labels.L‘apprentissage actif (AA) vise à réduire les coûts d‘annotation en sélectionnant intelligemment des instances pour l‘annotation, plutôt que de les annoter de manière aléatoire. L‘attention récente portée aux transformers a mis en lumière le potentiel de l‘AA dans ce contexte.Cependant, dans des environnements pratiques, la mise en øeuvre de l‘AA rencontre des défis pratiques. Notamment, le temps entre les cycles d‘AA n‘est pas mis à contribution par les annotateurs. Pour résoudre ce problème, nous examinons des méthodes alternatives de sélection d‘instances, visant à maximiser l‘efficacité de l‘annotation en s‘intégrant au processus de l‘AA. Nous commençons par évaluer deux méthodes existantes, en utilisant respectivement un échantillonnage aléatoire et des informations de cycle d‘AA périmées. Ensuite, nous proposons notre méthode novatrice basée sur l‘annotation des instances pour rééquilibrer la distribution des labels. Notre approche atténue les biais, améliore les performances du modèle (jusqu’à une amélioration de 23 sur le score F1), réduit les disparités dépendantes de la stratégie (diminution d‘environ 50 sur l’écart type) et diminue le déséquilibre des libellés (diminution de 30 sur le ratio moyen de déséquilibre).</abstract>
<identifier type="citekey">arens-etal-2024-reequilibrer</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-trad.10/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>16</start>
<end>17</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Rééquilibrer la distribution des labels tout en éliminant le temps d‘attente inhérent dans l‘apprentissage actif multi-label appliqué aux transformers
%A Arens, Maxime
%A G Moreno, Jose
%A Boughanem, Mohand
%A Callebert, Lucile
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d‘articles publiès
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F arens-etal-2024-reequilibrer
%X L‘annotation des données est cruciale pour l‘apprentissage automatique, notamment dans les domaines techniques, où la qualité et la quantité des données annotées affectent significativement l‘efficacité des modèles entraînés. L‘utilisation de personnel humain est coûteuse, surtout lors de l‘annotation pour la classification multi-label, les instances pouvant être associées à plusieurs labels.L‘apprentissage actif (AA) vise à réduire les coûts d‘annotation en sélectionnant intelligemment des instances pour l‘annotation, plutôt que de les annoter de manière aléatoire. L‘attention récente portée aux transformers a mis en lumière le potentiel de l‘AA dans ce contexte.Cependant, dans des environnements pratiques, la mise en øeuvre de l‘AA rencontre des défis pratiques. Notamment, le temps entre les cycles d‘AA n‘est pas mis à contribution par les annotateurs. Pour résoudre ce problème, nous examinons des méthodes alternatives de sélection d‘instances, visant à maximiser l‘efficacité de l‘annotation en s‘intégrant au processus de l‘AA. Nous commençons par évaluer deux méthodes existantes, en utilisant respectivement un échantillonnage aléatoire et des informations de cycle d‘AA périmées. Ensuite, nous proposons notre méthode novatrice basée sur l‘annotation des instances pour rééquilibrer la distribution des labels. Notre approche atténue les biais, améliore les performances du modèle (jusqu’à une amélioration de 23 sur le score F1), réduit les disparités dépendantes de la stratégie (diminution d‘environ 50 sur l’écart type) et diminue le déséquilibre des libellés (diminution de 30 sur le ratio moyen de déséquilibre).
%U https://aclanthology.org/2024.jeptalnrecital-trad.10/
%P 16-17
Markdown (Informal)
[Rééquilibrer la distribution des labels tout en éliminant le temps d’attente inhérent dans l’apprentissage actif multi-label appliqué aux transformers](https://aclanthology.org/2024.jeptalnrecital-trad.10/) (Arens et al., JEP/TALN/RECITAL 2024)
ACL