@inproceedings{hiebel-etal-2022-clister,
title = "{CLISTER} : Un corpus pour la similarit{\'e} s{\'e}mantique textuelle dans des cas cliniques en fran{\c{c}}ais ({CLISTER} : A Corpus for Semantic Textual Similarity in {F}rench Clinical Narratives)",
author = {Hiebel, Nicolas and
Fort, Kar{\"e}n and
N{\'e}v{\'e}ol, Aur{\'e}lie and
Ferret, Olivier},
editor = "Est{\`e}ve, Yannick and
Jim{\'e}nez, Tania and
Parcollet, Titouan and
Zanon Boito, Marcely",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2022.jeptalnrecital-taln.28/",
pages = "287--296",
language = "fra",
abstract = "Le TAL repose sur la disponibilit{\'e} de corpus annot{\'e}s pour l`entra{\^i}nement et l'{\'e}valuation de mod{\`e}les. Il existe tr{\`e}s peu de ressources pour la similarit{\'e} s{\'e}mantique dans le domaine clinique en fran{\c{c}}ais. Dans cette {\'e}tude, nous proposons une d{\'e}finition de la similarit{\'e} guid{\'e}e par l`analyse clinique et l`appliquons au d{\'e}veloppement d`un nouveau corpus partag{\'e} de 1 000 paires de phrases annot{\'e}es manuellement en scores de similarit{\'e}. Nous {\'e}valuons ensuite le corpus par des exp{\'e}riences de mesure automatique de similarit{\'e}. Nous montrons ainsi qu`un mod{\`e}le de plongements de phrases peut capturer la similarit{\'e} avec des performances {\`a} l'{\'e}tat de l`art sur le corpus DEFT STS (Spearman=0,8343). Nous montrons {\'e}galement que le contenu du corpus CLISTER est compl{\'e}mentaire de celui de DEFT STS."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="hiebel-etal-2022-clister">
<titleInfo>
<title>CLISTER : Un corpus pour la similarité sémantique textuelle dans des cas cliniques en français (CLISTER : A Corpus for Semantic Textual Similarity in French Clinical Narratives)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Hiebel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karën</namePart>
<namePart type="family">Fort</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Aurélie</namePart>
<namePart type="family">Névéol</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Olivier</namePart>
<namePart type="family">Ferret</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2022-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Estève</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Tania</namePart>
<namePart type="family">Jiménez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Titouan</namePart>
<namePart type="family">Parcollet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marcely</namePart>
<namePart type="family">Zanon Boito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Le TAL repose sur la disponibilité de corpus annotés pour l‘entraînement et l’évaluation de modèles. Il existe très peu de ressources pour la similarité sémantique dans le domaine clinique en français. Dans cette étude, nous proposons une définition de la similarité guidée par l‘analyse clinique et l‘appliquons au développement d‘un nouveau corpus partagé de 1 000 paires de phrases annotées manuellement en scores de similarité. Nous évaluons ensuite le corpus par des expériences de mesure automatique de similarité. Nous montrons ainsi qu‘un modèle de plongements de phrases peut capturer la similarité avec des performances à l’état de l‘art sur le corpus DEFT STS (Spearman=0,8343). Nous montrons également que le contenu du corpus CLISTER est complémentaire de celui de DEFT STS.</abstract>
<identifier type="citekey">hiebel-etal-2022-clister</identifier>
<location>
<url>https://aclanthology.org/2022.jeptalnrecital-taln.28/</url>
</location>
<part>
<date>2022-6</date>
<extent unit="page">
<start>287</start>
<end>296</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T CLISTER : Un corpus pour la similarité sémantique textuelle dans des cas cliniques en français (CLISTER : A Corpus for Semantic Textual Similarity in French Clinical Narratives)
%A Hiebel, Nicolas
%A Fort, Karën
%A Névéol, Aurélie
%A Ferret, Olivier
%Y Estève, Yannick
%Y Jiménez, Tania
%Y Parcollet, Titouan
%Y Zanon Boito, Marcely
%S Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2022
%8 June
%I ATALA
%C Avignon, France
%G fra
%F hiebel-etal-2022-clister
%X Le TAL repose sur la disponibilité de corpus annotés pour l‘entraînement et l’évaluation de modèles. Il existe très peu de ressources pour la similarité sémantique dans le domaine clinique en français. Dans cette étude, nous proposons une définition de la similarité guidée par l‘analyse clinique et l‘appliquons au développement d‘un nouveau corpus partagé de 1 000 paires de phrases annotées manuellement en scores de similarité. Nous évaluons ensuite le corpus par des expériences de mesure automatique de similarité. Nous montrons ainsi qu‘un modèle de plongements de phrases peut capturer la similarité avec des performances à l’état de l‘art sur le corpus DEFT STS (Spearman=0,8343). Nous montrons également que le contenu du corpus CLISTER est complémentaire de celui de DEFT STS.
%U https://aclanthology.org/2022.jeptalnrecital-taln.28/
%P 287-296
Markdown (Informal)
[CLISTER : Un corpus pour la similarité sémantique textuelle dans des cas cliniques en français (CLISTER : A Corpus for Semantic Textual Similarity in French Clinical Narratives)](https://aclanthology.org/2022.jeptalnrecital-taln.28/) (Hiebel et al., JEP/TALN/RECITAL 2022)
ACL