@inproceedings{bourgeade-etal-2021-plongements,
title = "Plongements Interpr{\'e}tables pour la D{\'e}tection de Biais Cach{\'e}s (Interpretable Embeddings for Hidden Biases Detection)",
author = "Bourgeade, Tom and
Muller, Philippe and
Van de Cruys, Tim",
editor = "Denis, Pascal and
Grabar, Natalia and
Fraisse, Amel and
Cardon, R{\'e}mi and
Jacquemin, Bernard and
Kergosien, Eric and
Balvet, Antonio",
booktitle = "Actes de la 28e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2021",
address = "Lille, France",
publisher = "ATALA",
url = "https://aclanthology.org/2021.jeptalnrecital-taln.6/",
pages = "64--80",
language = "fra",
abstract = "De nombreuses t{\^a}ches s{\'e}mantiques en TAL font usage de donn{\'e}es collect{\'e}es de mani{\`e}re semiautomatique, ce qui est souvent source d`artefacts ind{\'e}sirables qui peuvent affecter n{\'e}gativement les mod{\`e}les entra{\^i}n{\'e}s sur celles-ci. Avec l'{\'e}volution plus r{\'e}cente vers des mod{\`e}les {\`a} usage g{\'e}n{\'e}rique pr{\'e}-entra{\^i}n{\'e}s plus complexes, et moins interpr{\'e}tables, ces biais peuvent conduire {\`a} l`int{\'e}gration de corr{\'e}lations ind{\'e}sirables dans des applications utilisateurs. R{\'e}cemment, quelques m{\'e}thodes ont {\'e}t{\'e} propos{\'e}es pour entra{\^i}ner des plongements de mots avec une meilleure interpr{\'e}tabilit{\'e}. Nous proposons une m{\'e}thode simple qui exploite ces repr{\'e}sentations pour d{\'e}tecter de mani{\`e}re pr{\'e}ventive des corr{\'e}lations lexicales faciles {\`a} apprendre, dans divers jeux de donn{\'e}es. Nous {\'e}valuons {\`a} cette fin quelques mod{\`e}les de plongements interpr{\'e}tables populaires pour l`anglais, en utilisant {\`a} la fois une {\'e}valuation intrins{\`e}que, et un ensemble de t{\^a}ches s{\'e}mantiques en aval, et nous utilisons la qualit{\'e} interpr{\'e}table des plongements afin de diagnostiquer des biais potentiels dans les jeux de donn{\'e}es associ{\'e}s."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bourgeade-etal-2021-plongements">
<titleInfo>
<title>Plongements Interprétables pour la Détection de Biais Cachés (Interpretable Embeddings for Hidden Biases Detection)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Tom</namePart>
<namePart type="family">Bourgeade</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Tim</namePart>
<namePart type="family">Van de Cruys</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2021-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pascal</namePart>
<namePart type="family">Denis</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Natalia</namePart>
<namePart type="family">Grabar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Amel</namePart>
<namePart type="family">Fraisse</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Rémi</namePart>
<namePart type="family">Cardon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Bernard</namePart>
<namePart type="family">Jacquemin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eric</namePart>
<namePart type="family">Kergosien</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Antonio</namePart>
<namePart type="family">Balvet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Lille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>De nombreuses tâches sémantiques en TAL font usage de données collectées de manière semiautomatique, ce qui est souvent source d‘artefacts indésirables qui peuvent affecter négativement les modèles entraînés sur celles-ci. Avec l’évolution plus récente vers des modèles à usage générique pré-entraînés plus complexes, et moins interprétables, ces biais peuvent conduire à l‘intégration de corrélations indésirables dans des applications utilisateurs. Récemment, quelques méthodes ont été proposées pour entraîner des plongements de mots avec une meilleure interprétabilité. Nous proposons une méthode simple qui exploite ces représentations pour détecter de manière préventive des corrélations lexicales faciles à apprendre, dans divers jeux de données. Nous évaluons à cette fin quelques modèles de plongements interprétables populaires pour l‘anglais, en utilisant à la fois une évaluation intrinsèque, et un ensemble de tâches sémantiques en aval, et nous utilisons la qualité interprétable des plongements afin de diagnostiquer des biais potentiels dans les jeux de données associés.</abstract>
<identifier type="citekey">bourgeade-etal-2021-plongements</identifier>
<location>
<url>https://aclanthology.org/2021.jeptalnrecital-taln.6/</url>
</location>
<part>
<date>2021-6</date>
<extent unit="page">
<start>64</start>
<end>80</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Plongements Interprétables pour la Détection de Biais Cachés (Interpretable Embeddings for Hidden Biases Detection)
%A Bourgeade, Tom
%A Muller, Philippe
%A Van de Cruys, Tim
%Y Denis, Pascal
%Y Grabar, Natalia
%Y Fraisse, Amel
%Y Cardon, Rémi
%Y Jacquemin, Bernard
%Y Kergosien, Eric
%Y Balvet, Antonio
%S Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2021
%8 June
%I ATALA
%C Lille, France
%G fra
%F bourgeade-etal-2021-plongements
%X De nombreuses tâches sémantiques en TAL font usage de données collectées de manière semiautomatique, ce qui est souvent source d‘artefacts indésirables qui peuvent affecter négativement les modèles entraînés sur celles-ci. Avec l’évolution plus récente vers des modèles à usage générique pré-entraînés plus complexes, et moins interprétables, ces biais peuvent conduire à l‘intégration de corrélations indésirables dans des applications utilisateurs. Récemment, quelques méthodes ont été proposées pour entraîner des plongements de mots avec une meilleure interprétabilité. Nous proposons une méthode simple qui exploite ces représentations pour détecter de manière préventive des corrélations lexicales faciles à apprendre, dans divers jeux de données. Nous évaluons à cette fin quelques modèles de plongements interprétables populaires pour l‘anglais, en utilisant à la fois une évaluation intrinsèque, et un ensemble de tâches sémantiques en aval, et nous utilisons la qualité interprétable des plongements afin de diagnostiquer des biais potentiels dans les jeux de données associés.
%U https://aclanthology.org/2021.jeptalnrecital-taln.6/
%P 64-80
Markdown (Informal)
[Plongements Interprétables pour la Détection de Biais Cachés (Interpretable Embeddings for Hidden Biases Detection)](https://aclanthology.org/2021.jeptalnrecital-taln.6/) (Bourgeade et al., JEP/TALN/RECITAL 2021)
ACL