@inproceedings{neveol-etal-2022-french-crows,
title = "{F}rench {C}row{S}-Pairs: Extension {\`a} une langue autre que l`anglais d`un corpus de mesure des biais soci{\'e}taux dans les mod{\`e}les de langue masqu{\'e}s ({F}rench {C}row{S}-Pairs : Extending a challenge dataset for measuring social bias in masked language models to a language other than {E}nglish)",
author = {N{\'e}v{\'e}ol, Aur{\'e}lie and
Dupont, Yoann and
Bezan{\c{c}}on, Julien and
Fort, Kar{\"e}n},
editor = "Est{\`e}ve, Yannick and
Jim{\'e}nez, Tania and
Parcollet, Titouan and
Zanon Boito, Marcely",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2022.jeptalnrecital-taln.35/",
pages = "355--364",
language = "fra",
abstract = "Afin de permettre l'{\'e}tude des biais en traitement automatique de la langue au del{\`a} de l`anglais am{\'e}ricain, nous enrichissons le corpus am{\'e}ricain CrowS-pairs de 1 677 paires de phrases en fran{\c{c}}ais repr{\'e}sentant des st{\'e}r{\'e}otypes portant sur dix cat{\'e}gories telles que le genre. 1 467 paires de phrases sont traduites {\`a} partir de CrowS-pairs et 210 sont nouvellement recueillies puis traduites en anglais. Selon le principe des paires minimales, les phrases du corpus contrastent un {\'e}nonc{\'e} st{\'e}r{\'e}otyp{\'e} concernant un groupe d{\'e}favoris{\'e} et son {\'e}quivalent pour un groupe favoris{\'e}. Nous montrons que quatre mod{\`e}les de langue favorisent les {\'e}nonc{\'e}s qui expriment des st{\'e}r{\'e}otypes dans la plupart des cat{\'e}gories. Nous d{\'e}crivons le processus de traduction et formulons des recommandations pour {\'e}tendre le corpus {\`a} d`autres langues. Attention : Cet article contient des {\'e}nonc{\'e}s de st{\'e}r{\'e}otypes qui peuvent {\^e}tre choquants."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="neveol-etal-2022-french-crows">
<titleInfo>
<title>French CrowS-Pairs: Extension à une langue autre que l‘anglais d‘un corpus de mesure des biais sociétaux dans les modèles de langue masqués (French CrowS-Pairs : Extending a challenge dataset for measuring social bias in masked language models to a language other than English)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Aurélie</namePart>
<namePart type="family">Névéol</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Yoann</namePart>
<namePart type="family">Dupont</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Bezançon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karën</namePart>
<namePart type="family">Fort</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2022-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Estève</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Tania</namePart>
<namePart type="family">Jiménez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Titouan</namePart>
<namePart type="family">Parcollet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marcely</namePart>
<namePart type="family">Zanon Boito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Afin de permettre l’étude des biais en traitement automatique de la langue au delà de l‘anglais américain, nous enrichissons le corpus américain CrowS-pairs de 1 677 paires de phrases en français représentant des stéréotypes portant sur dix catégories telles que le genre. 1 467 paires de phrases sont traduites à partir de CrowS-pairs et 210 sont nouvellement recueillies puis traduites en anglais. Selon le principe des paires minimales, les phrases du corpus contrastent un énoncé stéréotypé concernant un groupe défavorisé et son équivalent pour un groupe favorisé. Nous montrons que quatre modèles de langue favorisent les énoncés qui expriment des stéréotypes dans la plupart des catégories. Nous décrivons le processus de traduction et formulons des recommandations pour étendre le corpus à d‘autres langues. Attention : Cet article contient des énoncés de stéréotypes qui peuvent être choquants.</abstract>
<identifier type="citekey">neveol-etal-2022-french-crows</identifier>
<location>
<url>https://aclanthology.org/2022.jeptalnrecital-taln.35/</url>
</location>
<part>
<date>2022-6</date>
<extent unit="page">
<start>355</start>
<end>364</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T French CrowS-Pairs: Extension à une langue autre que l‘anglais d‘un corpus de mesure des biais sociétaux dans les modèles de langue masqués (French CrowS-Pairs : Extending a challenge dataset for measuring social bias in masked language models to a language other than English)
%A Névéol, Aurélie
%A Dupont, Yoann
%A Bezançon, Julien
%A Fort, Karën
%Y Estève, Yannick
%Y Jiménez, Tania
%Y Parcollet, Titouan
%Y Zanon Boito, Marcely
%S Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2022
%8 June
%I ATALA
%C Avignon, France
%G fra
%F neveol-etal-2022-french-crows
%X Afin de permettre l’étude des biais en traitement automatique de la langue au delà de l‘anglais américain, nous enrichissons le corpus américain CrowS-pairs de 1 677 paires de phrases en français représentant des stéréotypes portant sur dix catégories telles que le genre. 1 467 paires de phrases sont traduites à partir de CrowS-pairs et 210 sont nouvellement recueillies puis traduites en anglais. Selon le principe des paires minimales, les phrases du corpus contrastent un énoncé stéréotypé concernant un groupe défavorisé et son équivalent pour un groupe favorisé. Nous montrons que quatre modèles de langue favorisent les énoncés qui expriment des stéréotypes dans la plupart des catégories. Nous décrivons le processus de traduction et formulons des recommandations pour étendre le corpus à d‘autres langues. Attention : Cet article contient des énoncés de stéréotypes qui peuvent être choquants.
%U https://aclanthology.org/2022.jeptalnrecital-taln.35/
%P 355-364
Markdown (Informal)
[French CrowS-Pairs: Extension à une langue autre que l’anglais d’un corpus de mesure des biais sociétaux dans les modèles de langue masqués (French CrowS-Pairs : Extending a challenge dataset for measuring social bias in masked language models to a language other than English)](https://aclanthology.org/2022.jeptalnrecital-taln.35/) (Névéol et al., JEP/TALN/RECITAL 2022)
ACL