@inproceedings{pellegrini-etal-2016-reseau,
title = "R{\'e}seau de neurones convolutif pour l'{\'e}valuation automatique de la prononciation ({CNN}-based automatic pronunciation assessment of {J}apanese speakers learning {F}rench )",
author = "Pellegrini, Thomas and
Fontan, Lionel and
Sahraoui, Halima",
editor = "Danlos, Laurence and
Hamon, Thierry",
booktitle = "Actes de la conf{\'e}rence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP",
month = "7",
year = "2016",
address = "Paris, France",
publisher = "AFCP - ATALA",
url = "https://aclanthology.org/2016.jeptalnrecital-jep.70/",
pages = "624--632",
language = "fra",
abstract = "Dans cet article, nous comparons deux approches d'{\'e}valuation automatique de la prononciation de locuteurs japonophones apprenant le fran{\c{c}}ais. La premi{\`e}re, l`algorithme standard appel{\'e} Goodness Of Pronunciation (GOP), compare les vraisemblances obtenues lors d`un alignement forc{\'e} et lors d`une reconnaissance de phones sans contrainte. La deuxi{\`e}me, n{\'e}cessitant {\'e}galement un alignement pr{\'e}alable, fait appel {\`a} un r{\'e}seau de neurones convolutif (CNN) comme classifieur binaire, avec comme entr{\'e}e des trames de coefficients spectraux. Les deux approches sont {\'e}valu{\'e}es sur deux phon{\`e}mes cibles /R/ et /v/ du fran{\c{c}}ais, particuli{\`e}rement difficiles {\`a} prononcer pour des Japonophones. Les param{\`e}tres du GOP (seuils) et du CNN sont estim{\'e}s sur un corpus de parole lue par des locuteurs natifs du fran{\c{c}}ais, dans lequel des erreurs de prononciation artificielles sont introduites. Un gain de performance relatif de 13,4{\%} a {\'e}t{\'e} obtenu avec le CNN, avec une pr{\'e}cision globale de 72,6{\%}, sur un corpus d'{\'e}valuation enregistr{\'e} par 23 locuteurs japonophones."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="pellegrini-etal-2016-reseau">
<titleInfo>
<title>Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Thomas</namePart>
<namePart type="family">Pellegrini</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lionel</namePart>
<namePart type="family">Fontan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Halima</namePart>
<namePart type="family">Sahraoui</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2016-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP</title>
</titleInfo>
<name type="personal">
<namePart type="given">Laurence</namePart>
<namePart type="family">Danlos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>AFCP - ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans cet article, nous comparons deux approches d’évaluation automatique de la prononciation de locuteurs japonophones apprenant le français. La première, l‘algorithme standard appelé Goodness Of Pronunciation (GOP), compare les vraisemblances obtenues lors d‘un alignement forcé et lors d‘une reconnaissance de phones sans contrainte. La deuxième, nécessitant également un alignement préalable, fait appel à un réseau de neurones convolutif (CNN) comme classifieur binaire, avec comme entrée des trames de coefficients spectraux. Les deux approches sont évaluées sur deux phonèmes cibles /R/ et /v/ du français, particulièrement difficiles à prononcer pour des Japonophones. Les paramètres du GOP (seuils) et du CNN sont estimés sur un corpus de parole lue par des locuteurs natifs du français, dans lequel des erreurs de prononciation artificielles sont introduites. Un gain de performance relatif de 13,4% a été obtenu avec le CNN, avec une précision globale de 72,6%, sur un corpus d’évaluation enregistré par 23 locuteurs japonophones.</abstract>
<identifier type="citekey">pellegrini-etal-2016-reseau</identifier>
<location>
<url>https://aclanthology.org/2016.jeptalnrecital-jep.70/</url>
</location>
<part>
<date>2016-7</date>
<extent unit="page">
<start>624</start>
<end>632</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French )
%A Pellegrini, Thomas
%A Fontan, Lionel
%A Sahraoui, Halima
%Y Danlos, Laurence
%Y Hamon, Thierry
%S Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP
%D 2016
%8 July
%I AFCP - ATALA
%C Paris, France
%G fra
%F pellegrini-etal-2016-reseau
%X Dans cet article, nous comparons deux approches d’évaluation automatique de la prononciation de locuteurs japonophones apprenant le français. La première, l‘algorithme standard appelé Goodness Of Pronunciation (GOP), compare les vraisemblances obtenues lors d‘un alignement forcé et lors d‘une reconnaissance de phones sans contrainte. La deuxième, nécessitant également un alignement préalable, fait appel à un réseau de neurones convolutif (CNN) comme classifieur binaire, avec comme entrée des trames de coefficients spectraux. Les deux approches sont évaluées sur deux phonèmes cibles /R/ et /v/ du français, particulièrement difficiles à prononcer pour des Japonophones. Les paramètres du GOP (seuils) et du CNN sont estimés sur un corpus de parole lue par des locuteurs natifs du français, dans lequel des erreurs de prononciation artificielles sont introduites. Un gain de performance relatif de 13,4% a été obtenu avec le CNN, avec une précision globale de 72,6%, sur un corpus d’évaluation enregistré par 23 locuteurs japonophones.
%U https://aclanthology.org/2016.jeptalnrecital-jep.70/
%P 624-632
Markdown (Informal)
[Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French )](https://aclanthology.org/2016.jeptalnrecital-jep.70/) (Pellegrini et al., JEP/TALN/RECITAL 2016)
ACL