@inproceedings{ducel-etal-2024-evaluation,
title = "{\'E}valuation automatique des biais de genre dans des mod{\`e}les de langue auto-r{\'e}gressifs",
author = {Ducel, Fanny and
N{\'e}v{\'e}ol, Aur{\'e}lie and
Fort, Kar{\"e}n},
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-taln.5/",
pages = "64--84",
language = "fra",
abstract = "Nous proposons un outil pour mesurer automatiquement les biais de genre dans des textes g{\'e}n{\'e}r{\'e}s par des grands mod{\`e}les de langue dans des langues flexionnelles. Nous {\'e}valuons sept mod{\`e}les {\`a} l`aide de 52 000 textes en fran{\c{c}}ais et 2 500 textes en italien, pour la r{\'e}daction de lettres de motivation. Notre outil s`appuie sur la d{\'e}tection de marqueurs morpho-syntaxiques de genre pour mettre au jour des biais. Ainsi, les mod{\`e}les favorisent largement la g{\'e}n{\'e}ration de masculin : le genre masculin est deux fois plus pr{\'e}sent que le f{\'e}minin en fran{\c{c}}ais, et huit fois plus en italien. Les mod{\`e}les {\'e}tudi{\'e}s exacerbent {\'e}galement des st{\'e}r{\'e}otypes attest{\'e}s en sociologie en associant les professions st{\'e}r{\'e}otypiquement f{\'e}minines aux textes au f{\'e}minin, et les professions st{\'e}r{\'e}otypiquement masculines aux textes au masculin."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="ducel-etal-2024-evaluation">
<titleInfo>
<title>Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Fanny</namePart>
<namePart type="family">Ducel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Aurélie</namePart>
<namePart type="family">Névéol</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karën</namePart>
<namePart type="family">Fort</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous proposons un outil pour mesurer automatiquement les biais de genre dans des textes générés par des grands modèles de langue dans des langues flexionnelles. Nous évaluons sept modèles à l‘aide de 52 000 textes en français et 2 500 textes en italien, pour la rédaction de lettres de motivation. Notre outil s‘appuie sur la détection de marqueurs morpho-syntaxiques de genre pour mettre au jour des biais. Ainsi, les modèles favorisent largement la génération de masculin : le genre masculin est deux fois plus présent que le féminin en français, et huit fois plus en italien. Les modèles étudiés exacerbent également des stéréotypes attestés en sociologie en associant les professions stéréotypiquement féminines aux textes au féminin, et les professions stéréotypiquement masculines aux textes au masculin.</abstract>
<identifier type="citekey">ducel-etal-2024-evaluation</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-taln.5/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>64</start>
<end>84</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs
%A Ducel, Fanny
%A Névéol, Aurélie
%A Fort, Karën
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F ducel-etal-2024-evaluation
%X Nous proposons un outil pour mesurer automatiquement les biais de genre dans des textes générés par des grands modèles de langue dans des langues flexionnelles. Nous évaluons sept modèles à l‘aide de 52 000 textes en français et 2 500 textes en italien, pour la rédaction de lettres de motivation. Notre outil s‘appuie sur la détection de marqueurs morpho-syntaxiques de genre pour mettre au jour des biais. Ainsi, les modèles favorisent largement la génération de masculin : le genre masculin est deux fois plus présent que le féminin en français, et huit fois plus en italien. Les modèles étudiés exacerbent également des stéréotypes attestés en sociologie en associant les professions stéréotypiquement féminines aux textes au féminin, et les professions stéréotypiquement masculines aux textes au masculin.
%U https://aclanthology.org/2024.jeptalnrecital-taln.5/
%P 64-84
Markdown (Informal)
[Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs](https://aclanthology.org/2024.jeptalnrecital-taln.5/) (Ducel et al., JEP/TALN/RECITAL 2024)
ACL