@inproceedings{guembour-etal-2024-caracterisation,
title = "Caract{\'e}risation de la ville du futur dans un corpus de science-fiction",
author = "Guembour, Sami and
Dong, Chuanming and
Domingu{\`e}s, Catherine",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d`articles publi{\`e}s",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-trad.2/",
pages = "2--3",
language = "fra",
abstract = "Ce r{\'e}sum{\'e} pr{\'e}sente le travail de recherche d{\'e}taill{\'e} dans l`article (Guembour et al., 2023). Ce travail s`int{\`e}gre au projet PARoles de VIlleS (PARVIS, https://parvis.hypotheses.org/) ; il se concentre sur la caract{\'e}risation de la ville du futur dans un corpus de romans de science-fiction et de fictions climatiques constitu{\'e} par l'{\'e}quipe PARVIS, en utilisant des techniques de traitement automatique des langues. L`objectif est d`analyser les images de la ville du futur {\`a} travers les {\'e}l{\'e}ments qu`elle contient(lieux, objets urbains, etc.) et les fonctions qui leur sont associ{\'e}es. Cependant, tous les romans du corpus ne parlent pas de la ville, d`o{\`u} la n{\'e}cessit{\'e} d`identifier ceux dans lesquels elle constitue le cadre dans lequel s`int{\`e}grent l`action et les personnages. Pour cela, une ressource terminologique (Topalov et al., 2010) permettant d`identifier les {\'e}l{\'e}ments sp{\'e}cifiques de la ville a {\'e}t{\'e} utilis{\'e}e. Elle regroupe 533 mots, en majorit{\'e} des noms, d{\'e}sign{\'e}s par la forme OOC (abr{\'e}viation de {\textquotedblright}Object Of the City{\textquotedblright} pour {\textquotedblright}Objets de la ville{\textquotedblright}). Un algorithme de clustering fond{\'e} sur les fr{\'e}quences des OOC dans les romans est utilis{\'e} pour identifier ceux de la ville, et ainsi construire un nouveau corpus qui est sp{\'e}cifique {\`a} la ville. Les OOC ayant permis de construire ce nouveau corpus n`ont pas tous les m{\^e}mes fr{\'e}quences et donc pas le m{\^e}me poids dans la description de la ville du futur. Un algorithme de co-clustering a {\'e}t{\'e} appliqu{\'e} sur les fr{\'e}quences des OOC dans le nouveau corpus afin d`identifier ceux ayant un poids important dans la description de la ville ; ces derniers sont appel{\'e}s OOC discriminants. Un parseur de d{\'e}pendance syntaxique est ensuite mis en oeuvre sur les phrases du nouveau corpus afin d`extraire les fonctions (verbes) associ{\'e}es aux OOC discriminants. Des algorithmes de clustering (et des techniques de r{\'e}duction de dimension pour la visualisation des r{\'e}sultats) sont ensuite utilis{\'e}s de mani{\`e}re it{\'e}rative sur les cinq fonctions les plus fr{\'e}quentes de chaque OOC discriminant pour regrouper ces OOC afin d`identifier d'{\'e}ventuelles fonctions nouvelles ou anciennes associ{\'e}es {\`a} des OOC (anciens ou nouveaux objets de la ville). Les r{\'e}sultats montrent que la ville du futur (dans le corpus PARVIS), comme celle d`aujourd`hui, vise {\`a} r{\'e}pondre principalement {\`a} deux probl{\'e}matiques principales : la circulation et l`habitation."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="guembour-etal-2024-caracterisation">
<titleInfo>
<title>Caractérisation de la ville du futur dans un corpus de science-fiction</title>
</titleInfo>
<name type="personal">
<namePart type="given">Sami</namePart>
<namePart type="family">Guembour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Chuanming</namePart>
<namePart type="family">Dong</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Catherine</namePart>
<namePart type="family">Dominguès</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d‘articles publiès</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Ce résumé présente le travail de recherche détaillé dans l‘article (Guembour et al., 2023). Ce travail s‘intègre au projet PARoles de VIlleS (PARVIS, https://parvis.hypotheses.org/) ; il se concentre sur la caractérisation de la ville du futur dans un corpus de romans de science-fiction et de fictions climatiques constitué par l’équipe PARVIS, en utilisant des techniques de traitement automatique des langues. L‘objectif est d‘analyser les images de la ville du futur à travers les éléments qu‘elle contient(lieux, objets urbains, etc.) et les fonctions qui leur sont associées. Cependant, tous les romans du corpus ne parlent pas de la ville, d‘où la nécessité d‘identifier ceux dans lesquels elle constitue le cadre dans lequel s‘intègrent l‘action et les personnages. Pour cela, une ressource terminologique (Topalov et al., 2010) permettant d‘identifier les éléments spécifiques de la ville a été utilisée. Elle regroupe 533 mots, en majorité des noms, désignés par la forme OOC (abréviation de ”Object Of the City” pour ”Objets de la ville”). Un algorithme de clustering fondé sur les fréquences des OOC dans les romans est utilisé pour identifier ceux de la ville, et ainsi construire un nouveau corpus qui est spécifique à la ville. Les OOC ayant permis de construire ce nouveau corpus n‘ont pas tous les mêmes fréquences et donc pas le même poids dans la description de la ville du futur. Un algorithme de co-clustering a été appliqué sur les fréquences des OOC dans le nouveau corpus afin d‘identifier ceux ayant un poids important dans la description de la ville ; ces derniers sont appelés OOC discriminants. Un parseur de dépendance syntaxique est ensuite mis en oeuvre sur les phrases du nouveau corpus afin d‘extraire les fonctions (verbes) associées aux OOC discriminants. Des algorithmes de clustering (et des techniques de réduction de dimension pour la visualisation des résultats) sont ensuite utilisés de manière itérative sur les cinq fonctions les plus fréquentes de chaque OOC discriminant pour regrouper ces OOC afin d‘identifier d’éventuelles fonctions nouvelles ou anciennes associées à des OOC (anciens ou nouveaux objets de la ville). Les résultats montrent que la ville du futur (dans le corpus PARVIS), comme celle d‘aujourd‘hui, vise à répondre principalement à deux problématiques principales : la circulation et l‘habitation.</abstract>
<identifier type="citekey">guembour-etal-2024-caracterisation</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-trad.2/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>2</start>
<end>3</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Caractérisation de la ville du futur dans un corpus de science-fiction
%A Guembour, Sami
%A Dong, Chuanming
%A Dominguès, Catherine
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d‘articles publiès
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F guembour-etal-2024-caracterisation
%X Ce résumé présente le travail de recherche détaillé dans l‘article (Guembour et al., 2023). Ce travail s‘intègre au projet PARoles de VIlleS (PARVIS, https://parvis.hypotheses.org/) ; il se concentre sur la caractérisation de la ville du futur dans un corpus de romans de science-fiction et de fictions climatiques constitué par l’équipe PARVIS, en utilisant des techniques de traitement automatique des langues. L‘objectif est d‘analyser les images de la ville du futur à travers les éléments qu‘elle contient(lieux, objets urbains, etc.) et les fonctions qui leur sont associées. Cependant, tous les romans du corpus ne parlent pas de la ville, d‘où la nécessité d‘identifier ceux dans lesquels elle constitue le cadre dans lequel s‘intègrent l‘action et les personnages. Pour cela, une ressource terminologique (Topalov et al., 2010) permettant d‘identifier les éléments spécifiques de la ville a été utilisée. Elle regroupe 533 mots, en majorité des noms, désignés par la forme OOC (abréviation de ”Object Of the City” pour ”Objets de la ville”). Un algorithme de clustering fondé sur les fréquences des OOC dans les romans est utilisé pour identifier ceux de la ville, et ainsi construire un nouveau corpus qui est spécifique à la ville. Les OOC ayant permis de construire ce nouveau corpus n‘ont pas tous les mêmes fréquences et donc pas le même poids dans la description de la ville du futur. Un algorithme de co-clustering a été appliqué sur les fréquences des OOC dans le nouveau corpus afin d‘identifier ceux ayant un poids important dans la description de la ville ; ces derniers sont appelés OOC discriminants. Un parseur de dépendance syntaxique est ensuite mis en oeuvre sur les phrases du nouveau corpus afin d‘extraire les fonctions (verbes) associées aux OOC discriminants. Des algorithmes de clustering (et des techniques de réduction de dimension pour la visualisation des résultats) sont ensuite utilisés de manière itérative sur les cinq fonctions les plus fréquentes de chaque OOC discriminant pour regrouper ces OOC afin d‘identifier d’éventuelles fonctions nouvelles ou anciennes associées à des OOC (anciens ou nouveaux objets de la ville). Les résultats montrent que la ville du futur (dans le corpus PARVIS), comme celle d‘aujourd‘hui, vise à répondre principalement à deux problématiques principales : la circulation et l‘habitation.
%U https://aclanthology.org/2024.jeptalnrecital-trad.2/
%P 2-3
Markdown (Informal)
[Caractérisation de la ville du futur dans un corpus de science-fiction](https://aclanthology.org/2024.jeptalnrecital-trad.2/) (Guembour et al., JEP/TALN/RECITAL 2024)
ACL