@inproceedings{zampieri-etal-2022-identification,
title = "Identification des Expressions Polylexicales dans les Tweets (Identification of Multiword Expressions in Tweets)",
author = "Zampieri, Nicolas and
Ramisch, Carlos and
Illina, Irina and
Fohr, Dominique",
editor = "Est{\`e}ve, Yannick and
Jim{\'e}nez, Tania and
Parcollet, Titouan and
Zanon Boito, Marcely",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2022.jeptalnrecital-taln.36",
pages = "365--373",
abstract = "L{'}identification des expressions polylexicales (EP) dans les tweets est une t{\^a}che difficile en raison de la nature linguistique complexe des EP combin{\'e}e {\`a} l{'}utilisation d{'}un langage non standard. Dans cet article, nous pr{\'e}sentons cette t{\^a}che d{'}identification sur des donn{\'e}es anglaises de Twitter. Nous comparons les performances de deux syst{\`e}mes : un utilisant un dictionnaire et un autre des r{\'e}seaux de neurones. Nous {\'e}valuons exp{\'e}rimentalement sept configurations d{'}un syst{\`e}me {\'e}tat de l{'}art fond{\'e} sur des r{\'e}seaux neuronaux r{\'e}currents utilisant des embeddings contextuels g{\'e}n{\'e}r{\'e}s par BERT. Le syst{\`e}me fond{\'e} sur les r{\'e}seaux neuronaux surpasse l{'}approche dictionnaire, collect{\'e} automatiquement {\`a} partir des EP dans des corpus, gr{\^a}ce {\`a} son pouvoir de g{\'e}n{\'e}ralisation sup{\'e}rieur.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="zampieri-etal-2022-identification">
<titleInfo>
<title>Identification des Expressions Polylexicales dans les Tweets (Identification of Multiword Expressions in Tweets)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Zampieri</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Carlos</namePart>
<namePart type="family">Ramisch</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Irina</namePart>
<namePart type="family">Illina</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Dominique</namePart>
<namePart type="family">Fohr</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2022-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Estève</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Tania</namePart>
<namePart type="family">Jiménez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Titouan</namePart>
<namePart type="family">Parcollet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marcely</namePart>
<namePart type="family">Zanon Boito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’identification des expressions polylexicales (EP) dans les tweets est une tâche difficile en raison de la nature linguistique complexe des EP combinée à l’utilisation d’un langage non standard. Dans cet article, nous présentons cette tâche d’identification sur des données anglaises de Twitter. Nous comparons les performances de deux systèmes : un utilisant un dictionnaire et un autre des réseaux de neurones. Nous évaluons expérimentalement sept configurations d’un système état de l’art fondé sur des réseaux neuronaux récurrents utilisant des embeddings contextuels générés par BERT. Le système fondé sur les réseaux neuronaux surpasse l’approche dictionnaire, collecté automatiquement à partir des EP dans des corpus, grâce à son pouvoir de généralisation supérieur.</abstract>
<identifier type="citekey">zampieri-etal-2022-identification</identifier>
<location>
<url>https://aclanthology.org/2022.jeptalnrecital-taln.36</url>
</location>
<part>
<date>2022-6</date>
<extent unit="page">
<start>365</start>
<end>373</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Identification des Expressions Polylexicales dans les Tweets (Identification of Multiword Expressions in Tweets)
%A Zampieri, Nicolas
%A Ramisch, Carlos
%A Illina, Irina
%A Fohr, Dominique
%Y Estève, Yannick
%Y Jiménez, Tania
%Y Parcollet, Titouan
%Y Zanon Boito, Marcely
%S Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2022
%8 June
%I ATALA
%C Avignon, France
%G French
%F zampieri-etal-2022-identification
%X L’identification des expressions polylexicales (EP) dans les tweets est une tâche difficile en raison de la nature linguistique complexe des EP combinée à l’utilisation d’un langage non standard. Dans cet article, nous présentons cette tâche d’identification sur des données anglaises de Twitter. Nous comparons les performances de deux systèmes : un utilisant un dictionnaire et un autre des réseaux de neurones. Nous évaluons expérimentalement sept configurations d’un système état de l’art fondé sur des réseaux neuronaux récurrents utilisant des embeddings contextuels générés par BERT. Le système fondé sur les réseaux neuronaux surpasse l’approche dictionnaire, collecté automatiquement à partir des EP dans des corpus, grâce à son pouvoir de généralisation supérieur.
%U https://aclanthology.org/2022.jeptalnrecital-taln.36
%P 365-373
Markdown (Informal)
[Identification des Expressions Polylexicales dans les Tweets (Identification of Multiword Expressions in Tweets)](https://aclanthology.org/2022.jeptalnrecital-taln.36) (Zampieri et al., JEP/TALN/RECITAL 2022)
ACL