@inproceedings{abel-etal-2024-synthese,
title = "Synth{\`e}se de gestes communicatifs via {STARGATE}",
author = "Abel, Louis and
Colotte, Vincent and
Ouni, Slim",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes des 35{\`e}mes Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-jep.19/",
pages = "181--190",
language = "fra",
abstract = "La synth{\`e}se de gestes li{\'e} {\`a} la parole est un domaine de recherche en pleine expansion. Cependant, les nouveaux syst{\`e}mes utilisent souvent des architectures complexes, les rendant souvent inadapt{\'e}s {\`a} leur utilisation dans des agents conversationnels incarn{\'e}s ou dans d`autres domaines de recherche comme la linguistique, o{\`u} le lien entre la parole et les gestes est difficile {\`a} {\'e}tudier manuellement. Cet article pr{\'e}sente STARGATE, une nouvelle architecture tirant parti de l`autor{\'e}gression pour fournir des capacit{\'e}s en temps r{\'e}el, mais aussi des convolutions de graphe coupl{\'e}es {\`a} l`attention pour incorporer des connaissances structurelles explicites et permettre une forte compr{\'e}hension spatiale et temporelle du geste. Nous avons d{\'e}montr{\'e} que notre mod{\`e}le est capable de g{\'e}n{\'e}rer des gestes convaincants en surpassant l'{\'e}tat de l`art dans une {\'e}tude quantitative, tout en obtenant des scores l{\'e}g{\`e}rement meilleurs en termes de coh{\'e}rence et de cr{\'e}dibilit{\'e} des gestes g{\'e}n{\'e}r{\'e}s li{\'e}s {\`a} la parole sur une {\'e}tude perceptive."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="abel-etal-2024-synthese">
<titleInfo>
<title>Synthèse de gestes communicatifs via STARGATE</title>
</titleInfo>
<name type="personal">
<namePart type="given">Louis</namePart>
<namePart type="family">Abel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Colotte</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Slim</namePart>
<namePart type="family">Ouni</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 35èmes Journées d’Études sur la Parole</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La synthèse de gestes lié à la parole est un domaine de recherche en pleine expansion. Cependant, les nouveaux systèmes utilisent souvent des architectures complexes, les rendant souvent inadaptés à leur utilisation dans des agents conversationnels incarnés ou dans d‘autres domaines de recherche comme la linguistique, où le lien entre la parole et les gestes est difficile à étudier manuellement. Cet article présente STARGATE, une nouvelle architecture tirant parti de l‘autorégression pour fournir des capacités en temps réel, mais aussi des convolutions de graphe couplées à l‘attention pour incorporer des connaissances structurelles explicites et permettre une forte compréhension spatiale et temporelle du geste. Nous avons démontré que notre modèle est capable de générer des gestes convaincants en surpassant l’état de l‘art dans une étude quantitative, tout en obtenant des scores légèrement meilleurs en termes de cohérence et de crédibilité des gestes générés liés à la parole sur une étude perceptive.</abstract>
<identifier type="citekey">abel-etal-2024-synthese</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-jep.19/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>181</start>
<end>190</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Synthèse de gestes communicatifs via STARGATE
%A Abel, Louis
%A Colotte, Vincent
%A Ouni, Slim
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes des 35èmes Journées d’Études sur la Parole
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F abel-etal-2024-synthese
%X La synthèse de gestes lié à la parole est un domaine de recherche en pleine expansion. Cependant, les nouveaux systèmes utilisent souvent des architectures complexes, les rendant souvent inadaptés à leur utilisation dans des agents conversationnels incarnés ou dans d‘autres domaines de recherche comme la linguistique, où le lien entre la parole et les gestes est difficile à étudier manuellement. Cet article présente STARGATE, une nouvelle architecture tirant parti de l‘autorégression pour fournir des capacités en temps réel, mais aussi des convolutions de graphe couplées à l‘attention pour incorporer des connaissances structurelles explicites et permettre une forte compréhension spatiale et temporelle du geste. Nous avons démontré que notre modèle est capable de générer des gestes convaincants en surpassant l’état de l‘art dans une étude quantitative, tout en obtenant des scores légèrement meilleurs en termes de cohérence et de crédibilité des gestes générés liés à la parole sur une étude perceptive.
%U https://aclanthology.org/2024.jeptalnrecital-jep.19/
%P 181-190
Markdown (Informal)
[Synthèse de gestes communicatifs via STARGATE](https://aclanthology.org/2024.jeptalnrecital-jep.19/) (Abel et al., JEP/TALN/RECITAL 2024)
ACL