@inproceedings{sun-etal-2024-creation,
title = "Cr{\'e}ation d`un corpus parall{\`e}le de styles de parole en mandarin via l`auto-transcription et l`alignement forc{\'e}",
author = "Sun, Jingyi and
Wu, Yaru and
Audibert, Nicolas and
Adda-Decker, Martine",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes des 35{\`e}mes Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-jep.30/",
pages = "291--300",
language = "fra",
abstract = "La technologie ASR excelle dans la transcription pr{\'e}cise des discours lus pr{\'e}par{\'e}s, mais elle rencontre encore des d{\'e}fis lorsqu`il s`agit de conversations spontan{\'e}es. Cela est en partie d{\^u} au fait que ces derni{\`e}res rel{\`e}vent d`un registre de langage informel, avec disfluences et r{\'e}ductions de parole. Afin de mieux comprendre les diff{\'e}rences de production en fonction des styles de parole, nous pr{\'e}sentons la cr{\'e}ation d`un corpus de parole conversationnelle, dont des extraits sont ensuite lus par leurs auteurs. Le corpus comprend 36 heures de parole en chinois mandarin avec leur transcription, r{\'e}parties entre conversations spontan{\'e}es et lecture. Nous avons utilis{\'e} WHISPER pour la transcription automatique de la parole et le Montreal Forced Aligner pour l`alignement forc{\'e}, r{\'e}sultant dans un corpus de parole transcrit avec annotations multi-niveaux incluant phon{\`e}mes, caract{\`e}res/syllabes et mots. De telles productions de parole parall{\`e}les (en modes spontan{\'e} et lu) seront particuli{\`e}rement int{\'e}ressantes pour l'{\'e}tude des r{\'e}ductions temporelles."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="sun-etal-2024-creation">
<titleInfo>
<title>Création d‘un corpus parallèle de styles de parole en mandarin via l‘auto-transcription et l‘alignement forcé</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jingyi</namePart>
<namePart type="family">Sun</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Yaru</namePart>
<namePart type="family">Wu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Audibert</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Martine</namePart>
<namePart type="family">Adda-Decker</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 35èmes Journées d’Études sur la Parole</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La technologie ASR excelle dans la transcription précise des discours lus préparés, mais elle rencontre encore des défis lorsqu‘il s‘agit de conversations spontanées. Cela est en partie dû au fait que ces dernières relèvent d‘un registre de langage informel, avec disfluences et réductions de parole. Afin de mieux comprendre les différences de production en fonction des styles de parole, nous présentons la création d‘un corpus de parole conversationnelle, dont des extraits sont ensuite lus par leurs auteurs. Le corpus comprend 36 heures de parole en chinois mandarin avec leur transcription, réparties entre conversations spontanées et lecture. Nous avons utilisé WHISPER pour la transcription automatique de la parole et le Montreal Forced Aligner pour l‘alignement forcé, résultant dans un corpus de parole transcrit avec annotations multi-niveaux incluant phonèmes, caractères/syllabes et mots. De telles productions de parole parallèles (en modes spontané et lu) seront particulièrement intéressantes pour l’étude des réductions temporelles.</abstract>
<identifier type="citekey">sun-etal-2024-creation</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-jep.30/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>291</start>
<end>300</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Création d‘un corpus parallèle de styles de parole en mandarin via l‘auto-transcription et l‘alignement forcé
%A Sun, Jingyi
%A Wu, Yaru
%A Audibert, Nicolas
%A Adda-Decker, Martine
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes des 35èmes Journées d’Études sur la Parole
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F sun-etal-2024-creation
%X La technologie ASR excelle dans la transcription précise des discours lus préparés, mais elle rencontre encore des défis lorsqu‘il s‘agit de conversations spontanées. Cela est en partie dû au fait que ces dernières relèvent d‘un registre de langage informel, avec disfluences et réductions de parole. Afin de mieux comprendre les différences de production en fonction des styles de parole, nous présentons la création d‘un corpus de parole conversationnelle, dont des extraits sont ensuite lus par leurs auteurs. Le corpus comprend 36 heures de parole en chinois mandarin avec leur transcription, réparties entre conversations spontanées et lecture. Nous avons utilisé WHISPER pour la transcription automatique de la parole et le Montreal Forced Aligner pour l‘alignement forcé, résultant dans un corpus de parole transcrit avec annotations multi-niveaux incluant phonèmes, caractères/syllabes et mots. De telles productions de parole parallèles (en modes spontané et lu) seront particulièrement intéressantes pour l’étude des réductions temporelles.
%U https://aclanthology.org/2024.jeptalnrecital-jep.30/
%P 291-300
Markdown (Informal)
[Création d’un corpus parallèle de styles de parole en mandarin via l’auto-transcription et l’alignement forcé](https://aclanthology.org/2024.jeptalnrecital-jep.30/) (Sun et al., JEP/TALN/RECITAL 2024)
ACL