@inproceedings{decker-amblard-2024-construction,
title = "Construction d`une mesure de similarit{\'e} th{\'e}matique non supervis{\'e}e pour les conversations",
author = "Decker, Amandine and
Amblard, Maxime",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-taln.25/",
pages = "362--375",
language = "fra",
abstract = "La structure th{\'e}matique d`une conversation repr{\'e}sente la mani{\`e}re dont l`interaction est organis{\'e}e {\`a} un niveau plus global que le strict encha{\^i}nement des interventions. Elle permet de comprendre comment la coh{\'e}rence est maintenue sur le temps de l'{\'e}change. La cr{\'e}ation d`une mesure de similarit{\'e} th{\'e}matique qui donne un score de similarit{\'e} {\`a} deux {\'e}nonc{\'e}s du point de vue th{\'e}matique pourrait nous permettre de produire et d`analyser ces structures. Nous entra{\^i}nons une mesure non supervis{\'e}e, bas{\'e}e sur le mod{\`e}le BERT avec pr{\'e}diction de la phrase suivante, sur des conversations Reddit. La structure de Reddit nous fournit diff{\'e}rents niveaux de proximit{\'e} de coh{\'e}rence entre des paires de messages, ce qui nous permet d`entra{\^i}ner notre mod{\`e}le avec une fonction de perte bas{\'e}e sur des comparaisons plut{\^o}t que sur des valeurs num{\'e}riques attendues a priori. Cette mesure nous permet de trouver des ensembles d`interventions localement coh{\'e}rents dans nos conversations Reddit, mais aussi de mesurer la variabilit{\'e} en termes de th{\`e}me tout au long d`une conversation."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="decker-amblard-2024-construction">
<titleInfo>
<title>Construction d‘une mesure de similarité thématique non supervisée pour les conversations</title>
</titleInfo>
<name type="personal">
<namePart type="given">Amandine</namePart>
<namePart type="family">Decker</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Maxime</namePart>
<namePart type="family">Amblard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La structure thématique d‘une conversation représente la manière dont l‘interaction est organisée à un niveau plus global que le strict enchaînement des interventions. Elle permet de comprendre comment la cohérence est maintenue sur le temps de l’échange. La création d‘une mesure de similarité thématique qui donne un score de similarité à deux énoncés du point de vue thématique pourrait nous permettre de produire et d‘analyser ces structures. Nous entraînons une mesure non supervisée, basée sur le modèle BERT avec prédiction de la phrase suivante, sur des conversations Reddit. La structure de Reddit nous fournit différents niveaux de proximité de cohérence entre des paires de messages, ce qui nous permet d‘entraîner notre modèle avec une fonction de perte basée sur des comparaisons plutôt que sur des valeurs numériques attendues a priori. Cette mesure nous permet de trouver des ensembles d‘interventions localement cohérents dans nos conversations Reddit, mais aussi de mesurer la variabilité en termes de thème tout au long d‘une conversation.</abstract>
<identifier type="citekey">decker-amblard-2024-construction</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-taln.25/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>362</start>
<end>375</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Construction d‘une mesure de similarité thématique non supervisée pour les conversations
%A Decker, Amandine
%A Amblard, Maxime
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F decker-amblard-2024-construction
%X La structure thématique d‘une conversation représente la manière dont l‘interaction est organisée à un niveau plus global que le strict enchaînement des interventions. Elle permet de comprendre comment la cohérence est maintenue sur le temps de l’échange. La création d‘une mesure de similarité thématique qui donne un score de similarité à deux énoncés du point de vue thématique pourrait nous permettre de produire et d‘analyser ces structures. Nous entraînons une mesure non supervisée, basée sur le modèle BERT avec prédiction de la phrase suivante, sur des conversations Reddit. La structure de Reddit nous fournit différents niveaux de proximité de cohérence entre des paires de messages, ce qui nous permet d‘entraîner notre modèle avec une fonction de perte basée sur des comparaisons plutôt que sur des valeurs numériques attendues a priori. Cette mesure nous permet de trouver des ensembles d‘interventions localement cohérents dans nos conversations Reddit, mais aussi de mesurer la variabilité en termes de thème tout au long d‘une conversation.
%U https://aclanthology.org/2024.jeptalnrecital-taln.25/
%P 362-375
Markdown (Informal)
[Construction d’une mesure de similarité thématique non supervisée pour les conversations](https://aclanthology.org/2024.jeptalnrecital-taln.25/) (Decker & Amblard, JEP/TALN/RECITAL 2024)
ACL