@inproceedings{tian-etal-2017-detection,
title = "D{\'e}tection des mots non-standards dans les tweets avec des r{\'e}seaux de neurones (Detecting non-standard words in tweets with neural networks)",
author = "Tian, Tian and
Tellier, Isabelle and
Dinarelli, Marco and
Cardoso, Pedro",
editor = "Eshkol-Taravella, Iris and
Antoine, Jean-Yves",
booktitle = "Actes des 24{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts",
month = "6",
year = "2017",
address = "Orl{\'e}ans, France",
publisher = "ATALA",
url = "https://aclanthology.org/2017.jeptalnrecital-court.22/",
pages = "174--182",
language = "fra",
abstract = "Dans cet article, nous proposons un mod{\`e}le pour d{\'e}tecter dans les textes g{\'e}n{\'e}r{\'e}s par des utilisateurs (en particulier les tweets), les mots non-standards {\`a} corriger. Nous utilisons pour cela des r{\'e}seaux de neurones convolutifs au niveau des caract{\`e}res, associ{\'e}s {\`a} des {\textquotedblleft}plongements{\textquotedblright} (embeddings) des mots pr{\'e}sents dans le contexte du mot courant. Nous avons utilis{\'e} pour l'{\'e}valuation trois corpus de r{\'e}f{\'e}rence. Nous avons test{\'e} diff{\'e}rents mod{\`e}les qui varient suivant leurs plongements pr{\'e}-entrain{\'e}s, leurs configurations et leurs optimisations. Nous avons finalement obtenu une F1-mesure de 0.972 en validation crois{\'e}e pour la classe des mots non-standards. Cette d{\'e}tection des mots {\`a} corriger est l'{\'e}tape pr{\'e}liminaire pour la normalisation des textes non standards comme les tweets."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="tian-etal-2017-detection">
<titleInfo>
<title>Détection des mots non-standards dans les tweets avec des réseaux de neurones (Detecting non-standard words in tweets with neural networks)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Tian</namePart>
<namePart type="family">Tian</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Isabelle</namePart>
<namePart type="family">Tellier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marco</namePart>
<namePart type="family">Dinarelli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pedro</namePart>
<namePart type="family">Cardoso</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2017-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Iris</namePart>
<namePart type="family">Eshkol-Taravella</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Yves</namePart>
<namePart type="family">Antoine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Orléans, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans cet article, nous proposons un modèle pour détecter dans les textes générés par des utilisateurs (en particulier les tweets), les mots non-standards à corriger. Nous utilisons pour cela des réseaux de neurones convolutifs au niveau des caractères, associés à des “plongements” (embeddings) des mots présents dans le contexte du mot courant. Nous avons utilisé pour l’évaluation trois corpus de référence. Nous avons testé différents modèles qui varient suivant leurs plongements pré-entrainés, leurs configurations et leurs optimisations. Nous avons finalement obtenu une F1-mesure de 0.972 en validation croisée pour la classe des mots non-standards. Cette détection des mots à corriger est l’étape préliminaire pour la normalisation des textes non standards comme les tweets.</abstract>
<identifier type="citekey">tian-etal-2017-detection</identifier>
<location>
<url>https://aclanthology.org/2017.jeptalnrecital-court.22/</url>
</location>
<part>
<date>2017-6</date>
<extent unit="page">
<start>174</start>
<end>182</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Détection des mots non-standards dans les tweets avec des réseaux de neurones (Detecting non-standard words in tweets with neural networks)
%A Tian, Tian
%A Tellier, Isabelle
%A Dinarelli, Marco
%A Cardoso, Pedro
%Y Eshkol-Taravella, Iris
%Y Antoine, Jean-Yves
%S Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
%D 2017
%8 June
%I ATALA
%C Orléans, France
%G fra
%F tian-etal-2017-detection
%X Dans cet article, nous proposons un modèle pour détecter dans les textes générés par des utilisateurs (en particulier les tweets), les mots non-standards à corriger. Nous utilisons pour cela des réseaux de neurones convolutifs au niveau des caractères, associés à des “plongements” (embeddings) des mots présents dans le contexte du mot courant. Nous avons utilisé pour l’évaluation trois corpus de référence. Nous avons testé différents modèles qui varient suivant leurs plongements pré-entrainés, leurs configurations et leurs optimisations. Nous avons finalement obtenu une F1-mesure de 0.972 en validation croisée pour la classe des mots non-standards. Cette détection des mots à corriger est l’étape préliminaire pour la normalisation des textes non standards comme les tweets.
%U https://aclanthology.org/2017.jeptalnrecital-court.22/
%P 174-182
Markdown (Informal)
[Détection des mots non-standards dans les tweets avec des réseaux de neurones (Detecting non-standard words in tweets with neural networks)](https://aclanthology.org/2017.jeptalnrecital-court.22/) (Tian et al., JEP/TALN/RECITAL 2017)
ACL