@inproceedings{guembour-etal-2024-caracterisation,
title = "Caract{\'e}risation de la ville du futur dans un corpus de science-fiction",
author = "Guembour, Sami and
Dong, Chuanming and
Domingu{\`e}s, Catherine",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d`articles publi{\`e}s",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://preview.aclanthology.org/Add-Cong-Liu-Florida-Atlantic-University-author-id/2024.jeptalnrecital-trad.2/",
pages = "2--3",
language = "fra",
abstract = "Ce r{\'e}sum{\'e} pr{\'e}sente le travail de recherche d{\'e}taill{\'e} dans l`article (Guembour et al., 2023). Ce travail s`int{\`e}gre au projet PARoles de VIlleS (PARVIS, https://parvis.hypotheses.org/) ; il se concentre sur la caract{\'e}risation de la ville du futur dans un corpus de romans de science-fiction et de fictions climatiques constitu{\'e} par l'{\'e}quipe PARVIS, en utilisant des techniques de traitement automatique des langues. L`objectif est d`analyser les images de la ville du futur {\`a} travers les {\'e}l{\'e}ments qu`elle contient(lieux, objets urbains, etc.) et les fonctions qui leur sont associ{\'e}es. Cependant, tous les romans du corpus ne parlent pas de la ville, d`o{\`u} la n{\'e}cessit{\'e} d`identifier ceux dans lesquels elle constitue le cadre dans lequel s`int{\`e}grent l`action et les personnages. Pour cela, une ressource terminologique (Topalov et al., 2010) permettant d`identifier les {\'e}l{\'e}ments sp{\'e}cifiques de la ville a {\'e}t{\'e} utilis{\'e}e. Elle regroupe 533 mots, en majorit{\'e} des noms, d{\'e}sign{\'e}s par la forme OOC (abr{\'e}viation de {\textquotedblright}Object Of the City{\textquotedblright} pour {\textquotedblright}Objets de la ville{\textquotedblright}). Un algorithme de clustering fond{\'e} sur les fr{\'e}quences des OOC dans les romans est utilis{\'e} pour identifier ceux de la ville, et ainsi construire un nouveau corpus qui est sp{\'e}cifique {\`a} la ville. Les OOC ayant permis de construire ce nouveau corpus n`ont pas tous les m{\^e}mes fr{\'e}quences et donc pas le m{\^e}me poids dans la description de la ville du futur. Un algorithme de co-clustering a {\'e}t{\'e} appliqu{\'e} sur les fr{\'e}quences des OOC dans le nouveau corpus afin d`identifier ceux ayant un poids important dans la description de la ville ; ces derniers sont appel{\'e}s OOC discriminants. Un parseur de d{\'e}pendance syntaxique est ensuite mis en oeuvre sur les phrases du nouveau corpus afin d`extraire les fonctions (verbes) associ{\'e}es aux OOC discriminants. Des algorithmes de clustering (et des techniques de r{\'e}duction de dimension pour la visualisation des r{\'e}sultats) sont ensuite utilis{\'e}s de mani{\`e}re it{\'e}rative sur les cinq fonctions les plus fr{\'e}quentes de chaque OOC discriminant pour regrouper ces OOC afin d`identifier d'{\'e}ventuelles fonctions nouvelles ou anciennes associ{\'e}es {\`a} des OOC (anciens ou nouveaux objets de la ville). Les r{\'e}sultats montrent que la ville du futur (dans le corpus PARVIS), comme celle d`aujourd`hui, vise {\`a} r{\'e}pondre principalement {\`a} deux probl{\'e}matiques principales : la circulation et l`habitation."
}
Markdown (Informal)
[Caractérisation de la ville du futur dans un corpus de science-fiction](https://preview.aclanthology.org/Add-Cong-Liu-Florida-Atlantic-University-author-id/2024.jeptalnrecital-trad.2/) (Guembour et al., JEP/TALN/RECITAL 2024)
ACL