@inproceedings{janod-etal-2016-auto,
title = "Auto-encodeurs pour la compr{\'e}hension de documents parl{\'e}s (Auto-encoders for Spoken Document Understanding)",
author = "Janod, Killian and
Morchid, Mohamed and
Dufour, Richard and
Linar{\`e}s, Georges and
De Mori, Renato",
editor = "Danlos, Laurence and
Hamon, Thierry",
booktitle = "Actes de la conf{\'e}rence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP",
month = "7",
year = "2016",
address = "Paris, France",
publisher = "AFCP - ATALA",
url = "https://aclanthology.org/2016.jeptalnrecital-jep.9",
pages = "73--81",
abstract = "Les repr{\'e}sentations de documents au moyen d{'}approches {\`a} base de r{\'e}seaux de neurones ont montr{\'e} des am{\'e}liorations significatives dans de nombreuses t{\^a}ches du traitement du langage naturel. Dans le cadre d{'}applications r{\'e}elles, o{\`u} des conditions d{'}enregistrement difficiles peuvent {\^e}tre rencontr{\'e}es, la transcription automatique de documents parl{\'e}s peut g{\'e}n{\'e}rer un nombre de mots mal transcrits important. Cet article propose une repr{\'e}sentation des documents parl{\'e}s tr{\`e}s bruit{\'e}s utilisant des caract{\'e}ristiques apprises par un auto-encodeur profond supervis{\'e}. La m{\'e}thode propos{\'e}e s{'}appuie {\`a} la fois sur les documents bruit{\'e}s et leur {\'e}quivalent propre annot{\'e} manuellement pour estimer une repr{\'e}sentation plus robuste des documents bruit{\'e}s. Cette repr{\'e}sentation est {\'e}valu{\'e}e sur le corpus DECODA sur une t{\^a}che de classification th{\'e}matique de conversations t{\'e}l{\'e}phoniques atteignant une pr{\'e}cision de 83{\%} avec un gain d{'}environ 6{\%}.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="janod-etal-2016-auto">
<titleInfo>
<title>Auto-encodeurs pour la compréhension de documents parlés (Auto-encoders for Spoken Document Understanding)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Killian</namePart>
<namePart type="family">Janod</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mohamed</namePart>
<namePart type="family">Morchid</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Georges</namePart>
<namePart type="family">Linarès</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Renato</namePart>
<namePart type="family">De Mori</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2016-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP</title>
</titleInfo>
<name type="personal">
<namePart type="given">Laurence</namePart>
<namePart type="family">Danlos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>AFCP - ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les représentations de documents au moyen d’approches à base de réseaux de neurones ont montré des améliorations significatives dans de nombreuses tâches du traitement du langage naturel. Dans le cadre d’applications réelles, où des conditions d’enregistrement difficiles peuvent être rencontrées, la transcription automatique de documents parlés peut générer un nombre de mots mal transcrits important. Cet article propose une représentation des documents parlés très bruités utilisant des caractéristiques apprises par un auto-encodeur profond supervisé. La méthode proposée s’appuie à la fois sur les documents bruités et leur équivalent propre annoté manuellement pour estimer une représentation plus robuste des documents bruités. Cette représentation est évaluée sur le corpus DECODA sur une tâche de classification thématique de conversations téléphoniques atteignant une précision de 83% avec un gain d’environ 6%.</abstract>
<identifier type="citekey">janod-etal-2016-auto</identifier>
<location>
<url>https://aclanthology.org/2016.jeptalnrecital-jep.9</url>
</location>
<part>
<date>2016-7</date>
<extent unit="page">
<start>73</start>
<end>81</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Auto-encodeurs pour la compréhension de documents parlés (Auto-encoders for Spoken Document Understanding)
%A Janod, Killian
%A Morchid, Mohamed
%A Dufour, Richard
%A Linarès, Georges
%A De Mori, Renato
%Y Danlos, Laurence
%Y Hamon, Thierry
%S Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP
%D 2016
%8 July
%I AFCP - ATALA
%C Paris, France
%G French
%F janod-etal-2016-auto
%X Les représentations de documents au moyen d’approches à base de réseaux de neurones ont montré des améliorations significatives dans de nombreuses tâches du traitement du langage naturel. Dans le cadre d’applications réelles, où des conditions d’enregistrement difficiles peuvent être rencontrées, la transcription automatique de documents parlés peut générer un nombre de mots mal transcrits important. Cet article propose une représentation des documents parlés très bruités utilisant des caractéristiques apprises par un auto-encodeur profond supervisé. La méthode proposée s’appuie à la fois sur les documents bruités et leur équivalent propre annoté manuellement pour estimer une représentation plus robuste des documents bruités. Cette représentation est évaluée sur le corpus DECODA sur une tâche de classification thématique de conversations téléphoniques atteignant une précision de 83% avec un gain d’environ 6%.
%U https://aclanthology.org/2016.jeptalnrecital-jep.9
%P 73-81
Markdown (Informal)
[Auto-encodeurs pour la compréhension de documents parlés (Auto-encoders for Spoken Document Understanding)](https://aclanthology.org/2016.jeptalnrecital-jep.9) (Janod et al., JEP/TALN/RECITAL 2016)
ACL