@inproceedings{ferret-2015-declasser,
title = "D{\'e}classer les voisins non s{\'e}mantiques pour am{\'e}liorer les th{\'e}saurus distributionnels",
author = "Ferret, Olivier",
editor = "Lecarpentier, Jean-Marc and
Lucas, Nadine",
booktitle = "Actes de la 22e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2015",
address = "Caen, France",
publisher = "ATALA",
url = "https://aclanthology.org/2015.jeptalnrecital-long.13/",
pages = "146--157",
abstract = {La plupart des m{\'e}thodes d`am{\'e}lioration des th{\'e}saurus distributionnels se focalisent sur les moyens {--} repr{\'e}sentations ou mesures de similarit{\'e} {--} de mieux d{\'e}tecter la similarit{\'e} s{\'e}mantique entre les mots. Dans cet article, nous proposons un point de vue inverse : nous cherchons {\`a} d{\'e}tecter les voisins s{\'e}mantiques associ{\'e}s {\`a} une entr{\'e}e les moins susceptibles d'{\^e}tre li{\'e}s s{\'e}mantiquement {\`a} elle et nous utilisons cette information pour r{\'e}ordonner ces voisins. Pour d{\'e}tecter les faux voisins s{\'e}mantiques d`une entr{\'e}e, nous adoptons une approche s`inspirant de la d{\'e}sambigu{\"i}sation s{\'e}mantique en construisant un classifieur permettant de diff{\'e}rencier en contexte cette entr{\'e}e des autres mots. Ce classifieur est ensuite appliqu{\'e} {\`a} un {\'e}chantillon des occurrences des voisins de l`entr{\'e}e pour rep{\'e}rer ceux les plus {\'e}loign{\'e}s de l`entr{\'e}e. Nous {\'e}valuons cette m{\'e}thode pour des th{\'e}saurus construits {\`a} partir de cooccurrents syntaxiques et nous montrons l`int{\'e}r{\^e}t de la combiner avec les m{\'e}thodes d{\'e}crites dans (Ferret, 2013b) selon une strat{\'e}gie de type vote.}
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="ferret-2015-declasser">
<titleInfo>
<title>Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels</title>
</titleInfo>
<name type="personal">
<namePart type="given">Olivier</namePart>
<namePart type="family">Ferret</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2015-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Marc</namePart>
<namePart type="family">Lecarpentier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nadine</namePart>
<namePart type="family">Lucas</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Caen, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La plupart des méthodes d‘amélioration des thésaurus distributionnels se focalisent sur les moyens – représentations ou mesures de similarité – de mieux détecter la similarité sémantique entre les mots. Dans cet article, nous proposons un point de vue inverse : nous cherchons à détecter les voisins sémantiques associés à une entrée les moins susceptibles d’être liés sémantiquement à elle et nous utilisons cette information pour réordonner ces voisins. Pour détecter les faux voisins sémantiques d‘une entrée, nous adoptons une approche s‘inspirant de la désambiguïsation sémantique en construisant un classifieur permettant de différencier en contexte cette entrée des autres mots. Ce classifieur est ensuite appliqué à un échantillon des occurrences des voisins de l‘entrée pour repérer ceux les plus éloignés de l‘entrée. Nous évaluons cette méthode pour des thésaurus construits à partir de cooccurrents syntaxiques et nous montrons l‘intérêt de la combiner avec les méthodes décrites dans (Ferret, 2013b) selon une stratégie de type vote.</abstract>
<identifier type="citekey">ferret-2015-declasser</identifier>
<location>
<url>https://aclanthology.org/2015.jeptalnrecital-long.13/</url>
</location>
<part>
<date>2015-06</date>
<extent unit="page">
<start>146</start>
<end>157</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels
%A Ferret, Olivier
%Y Lecarpentier, Jean-Marc
%Y Lucas, Nadine
%S Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2015
%8 June
%I ATALA
%C Caen, France
%F ferret-2015-declasser
%X La plupart des méthodes d‘amélioration des thésaurus distributionnels se focalisent sur les moyens – représentations ou mesures de similarité – de mieux détecter la similarité sémantique entre les mots. Dans cet article, nous proposons un point de vue inverse : nous cherchons à détecter les voisins sémantiques associés à une entrée les moins susceptibles d’être liés sémantiquement à elle et nous utilisons cette information pour réordonner ces voisins. Pour détecter les faux voisins sémantiques d‘une entrée, nous adoptons une approche s‘inspirant de la désambiguïsation sémantique en construisant un classifieur permettant de différencier en contexte cette entrée des autres mots. Ce classifieur est ensuite appliqué à un échantillon des occurrences des voisins de l‘entrée pour repérer ceux les plus éloignés de l‘entrée. Nous évaluons cette méthode pour des thésaurus construits à partir de cooccurrents syntaxiques et nous montrons l‘intérêt de la combiner avec les méthodes décrites dans (Ferret, 2013b) selon une stratégie de type vote.
%U https://aclanthology.org/2015.jeptalnrecital-long.13/
%P 146-157
Markdown (Informal)
[Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels](https://aclanthology.org/2015.jeptalnrecital-long.13/) (Ferret, JEP/TALN/RECITAL 2015)
ACL