@inproceedings{bouaziz-etal-2016-un-sous,
title = "Un Sous-espace Th{\'e}matique Latent pour la Compr{\'e}hension du Langage Parl{\'e} (A Latent Topic-based Subspace for Spoken Language Understanding)",
author = "Bouaziz, Mohamed and
Morchid, Mohamed and
Bousquet, Pierre-Michel and
Dufour, Richard and
Janod, Killian and
Kheder, Waad Ben and
Linar{\`e}s, Georges",
editor = "Danlos, Laurence and
Hamon, Thierry",
booktitle = "Actes de la conf{\'e}rence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP",
month = "7",
year = "2016",
address = "Paris, France",
publisher = "AFCP - ATALA",
url = "https://aclanthology.org/2016.jeptalnrecital-jep.73",
pages = "651--659",
abstract = "Les applications de compr{\'e}hension du langage parl{\'e} sont moins performantes si les documents transcrits automatiquement contiennent un taux d{'}erreur-mot {\'e}lev{\'e}. Des solutions r{\'e}centes proposent de projeter ces transcriptions dans un espace de th{\`e}mes, comme par exemple l{'}allocation latente de Dirichlet (LDA), la LDA supervis{\'e}e ainsi que le mod{\`e}le author-topic (AT). Une repr{\'e}sentation compacte originale, appel{\'e}e c-vector, a {\'e}t{\'e} r{\'e}cemment introduite afin de surmonter la difficult{\'e} li{\'e}e au choix de la taille de ces espaces th{\'e}matiques. Cette repr{\'e}sentation am{\'e}liore la robustesse aux erreurs de transcription, en compactant les diff{\'e}rentes repr{\'e}sentations LDA d{'}un document parl{\'e} dans un espace r{\'e}duit. Le d{\'e}faut majeur de cette m{\'e}thode est le nombre {\'e}lev{\'e} de sous-t{\^a}ches n{\'e}cessaires {\`a} la construction de l{'}espace c-vector. Cet article propose de corriger ce d{\'e}faut en utilisant un cadre original fond{\'e} sur un espace de caract{\'e}ristiques robustes de faible dimension provenant d{'}un ensemble de mod{\`e}les AT consid{\'e}rant {\`a} la fois le contenu du dialogue parl{\'e} (les mots) et la classe du document. Les exp{\'e}rimentations, conduites sur le corpus DECODA, montrent que la repr{\'e}sentation propos{\'e}e permet un gain de plus de 2.5 points en termes de conversations correctement classifi{\'e}es.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bouaziz-etal-2016-un-sous">
<titleInfo>
<title>Un Sous-espace Thématique Latent pour la Compréhension du Langage Parlé (A Latent Topic-based Subspace for Spoken Language Understanding)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mohamed</namePart>
<namePart type="family">Bouaziz</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mohamed</namePart>
<namePart type="family">Morchid</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pierre-Michel</namePart>
<namePart type="family">Bousquet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Killian</namePart>
<namePart type="family">Janod</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Waad</namePart>
<namePart type="given">Ben</namePart>
<namePart type="family">Kheder</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Georges</namePart>
<namePart type="family">Linarès</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2016-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP</title>
</titleInfo>
<name type="personal">
<namePart type="given">Laurence</namePart>
<namePart type="family">Danlos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>AFCP - ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les applications de compréhension du langage parlé sont moins performantes si les documents transcrits automatiquement contiennent un taux d’erreur-mot élevé. Des solutions récentes proposent de projeter ces transcriptions dans un espace de thèmes, comme par exemple l’allocation latente de Dirichlet (LDA), la LDA supervisée ainsi que le modèle author-topic (AT). Une représentation compacte originale, appelée c-vector, a été récemment introduite afin de surmonter la difficulté liée au choix de la taille de ces espaces thématiques. Cette représentation améliore la robustesse aux erreurs de transcription, en compactant les différentes représentations LDA d’un document parlé dans un espace réduit. Le défaut majeur de cette méthode est le nombre élevé de sous-tâches nécessaires à la construction de l’espace c-vector. Cet article propose de corriger ce défaut en utilisant un cadre original fondé sur un espace de caractéristiques robustes de faible dimension provenant d’un ensemble de modèles AT considérant à la fois le contenu du dialogue parlé (les mots) et la classe du document. Les expérimentations, conduites sur le corpus DECODA, montrent que la représentation proposée permet un gain de plus de 2.5 points en termes de conversations correctement classifiées.</abstract>
<identifier type="citekey">bouaziz-etal-2016-un-sous</identifier>
<location>
<url>https://aclanthology.org/2016.jeptalnrecital-jep.73</url>
</location>
<part>
<date>2016-7</date>
<extent unit="page">
<start>651</start>
<end>659</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Un Sous-espace Thématique Latent pour la Compréhension du Langage Parlé (A Latent Topic-based Subspace for Spoken Language Understanding)
%A Bouaziz, Mohamed
%A Morchid, Mohamed
%A Bousquet, Pierre-Michel
%A Dufour, Richard
%A Janod, Killian
%A Kheder, Waad Ben
%A Linarès, Georges
%Y Danlos, Laurence
%Y Hamon, Thierry
%S Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP
%D 2016
%8 July
%I AFCP - ATALA
%C Paris, France
%G French
%F bouaziz-etal-2016-un-sous
%X Les applications de compréhension du langage parlé sont moins performantes si les documents transcrits automatiquement contiennent un taux d’erreur-mot élevé. Des solutions récentes proposent de projeter ces transcriptions dans un espace de thèmes, comme par exemple l’allocation latente de Dirichlet (LDA), la LDA supervisée ainsi que le modèle author-topic (AT). Une représentation compacte originale, appelée c-vector, a été récemment introduite afin de surmonter la difficulté liée au choix de la taille de ces espaces thématiques. Cette représentation améliore la robustesse aux erreurs de transcription, en compactant les différentes représentations LDA d’un document parlé dans un espace réduit. Le défaut majeur de cette méthode est le nombre élevé de sous-tâches nécessaires à la construction de l’espace c-vector. Cet article propose de corriger ce défaut en utilisant un cadre original fondé sur un espace de caractéristiques robustes de faible dimension provenant d’un ensemble de modèles AT considérant à la fois le contenu du dialogue parlé (les mots) et la classe du document. Les expérimentations, conduites sur le corpus DECODA, montrent que la représentation proposée permet un gain de plus de 2.5 points en termes de conversations correctement classifiées.
%U https://aclanthology.org/2016.jeptalnrecital-jep.73
%P 651-659
Markdown (Informal)
[Un Sous-espace Thématique Latent pour la Compréhension du Langage Parlé (A Latent Topic-based Subspace for Spoken Language Understanding)](https://aclanthology.org/2016.jeptalnrecital-jep.73) (Bouaziz et al., JEP/TALN/RECITAL 2016)
ACL