@inproceedings{labrak-etal-2023-morfitt,
title = "{MORFITT} : Un corpus multi-labels d{'}articles scientifiques fran{\c{c}}ais dans le domaine biom{\'e}dical",
author = "Labrak, Yanis and
Rouvier, Mickael and
Dufour, Richard",
editor = {Boudin, Florian and
Daille, B{\'e}atrice and
Dufour, Richard and
El, Oumaima and
Houbre, Ma{\"e}l and
Jourdan, L{\'e}ane and
Kooli, Nihel},
booktitle = "Actes de CORIA-TALN 2023. Actes de l'atelier ``Analyse et Recherche de Textes Scientifiques'' (ARTS)@TALN 2023",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-arts.11",
pages = "66--70",
abstract = "Cet article pr{\'e}sente MORFITT, le premier corpus multi-labels en fran{\c{c}}ais annot{\'e} en sp{\'e}cialit{\'e}s dans le domaine m{\'e}dical. MORFITT est compos{\'e} de 3 624 r{\'e}sum{\'e}s d{'}articles scientifiques issus de PubMed, annot{\'e}s en 12 sp{\'e}cialit{\'e}s pour un total de 5 116 annotations. Nous d{\'e}taillons le corpus, les exp{\'e}rimentations et les r{\'e}sultats pr{\'e}liminaires obtenus {\`a} l{'}aide d{'}un classifieur fond{\'e} sur le mod{\`e}le de langage pr{\'e}-entra{\^\i}n{\'e} CamemBERT. Ces r{\'e}sultats pr{\'e}liminaires d{\'e}montrent la difficult{\'e} de la t{\^a}che, avec un F-score moyen pond{\'e}r{\'e} de 61,78{\%}.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="labrak-etal-2023-morfitt">
<titleInfo>
<title>MORFITT : Un corpus multi-labels d’articles scientifiques français dans le domaine biomédical</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yanis</namePart>
<namePart type="family">Labrak</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mickael</namePart>
<namePart type="family">Rouvier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de l’atelier “Analyse et Recherche de Textes Scientifiques” (ARTS)@TALN 2023</title>
</titleInfo>
<name type="personal">
<namePart type="given">Florian</namePart>
<namePart type="family">Boudin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Béatrice</namePart>
<namePart type="family">Daille</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Oumaima</namePart>
<namePart type="family">El</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Maël</namePart>
<namePart type="family">Houbre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Léane</namePart>
<namePart type="family">Jourdan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihel</namePart>
<namePart type="family">Kooli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente MORFITT, le premier corpus multi-labels en français annoté en spécialités dans le domaine médical. MORFITT est composé de 3 624 résumés d’articles scientifiques issus de PubMed, annotés en 12 spécialités pour un total de 5 116 annotations. Nous détaillons le corpus, les expérimentations et les résultats préliminaires obtenus à l’aide d’un classifieur fondé sur le modèle de langage pré-entraîné CamemBERT. Ces résultats préliminaires démontrent la difficulté de la tâche, avec un F-score moyen pondéré de 61,78%.</abstract>
<identifier type="citekey">labrak-etal-2023-morfitt</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-arts.11</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>66</start>
<end>70</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T MORFITT : Un corpus multi-labels d’articles scientifiques français dans le domaine biomédical
%A Labrak, Yanis
%A Rouvier, Mickael
%A Dufour, Richard
%Y Boudin, Florian
%Y Daille, Béatrice
%Y Dufour, Richard
%Y El, Oumaima
%Y Houbre, Maël
%Y Jourdan, Léane
%Y Kooli, Nihel
%S Actes de CORIA-TALN 2023. Actes de l’atelier “Analyse et Recherche de Textes Scientifiques” (ARTS)@TALN 2023
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F labrak-etal-2023-morfitt
%X Cet article présente MORFITT, le premier corpus multi-labels en français annoté en spécialités dans le domaine médical. MORFITT est composé de 3 624 résumés d’articles scientifiques issus de PubMed, annotés en 12 spécialités pour un total de 5 116 annotations. Nous détaillons le corpus, les expérimentations et les résultats préliminaires obtenus à l’aide d’un classifieur fondé sur le modèle de langage pré-entraîné CamemBERT. Ces résultats préliminaires démontrent la difficulté de la tâche, avec un F-score moyen pondéré de 61,78%.
%U https://aclanthology.org/2023.jeptalnrecital-arts.11
%P 66-70
Markdown (Informal)
[MORFITT : Un corpus multi-labels d’articles scientifiques français dans le domaine biomédical](https://aclanthology.org/2023.jeptalnrecital-arts.11) (Labrak et al., JEP/TALN/RECITAL 2023)
ACL