@inproceedings{bachey-etal-2025-etude,
title = "{\'E}tude critique du corpus {CNN}/{D}aily{M}ail pour le r{\'e}sum{\'e} automatique",
author = "Bachey, Fanny and
Rodrigues, Christophe and
Bossard, Aur{\'e}lien",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-taln.21/",
pages = "348--359",
language = "fra",
abstract = "De nombreux mod{\`e}les de g{\'e}n{\'e}ration et d'{\'e}valuation sont entra{\^i}n{\'e}s sur des corpus sans qu{'}il ait {\'e}t{\'e} d{\'e}montr{\'e} qu{'}ils {\'e}taient appropri{\'e}s pour cette t{\^a}che. C{'}est pourquoi nous proposons l'{\'e}tude critique des donn{\'e}es de l{'}un des corpus les plus utilis{\'e}s dans le domaine du r{\'e}sum{\'e} automatique : CNN/DailyMail. Nous montrons, par une analyse th{\'e}orique, puis en comparant les r{\'e}sum{\'e}s de r{\'e}f{\'e}rence du corpus et {\`a} des r{\'e}sum{\'e}s {\'e}crits par des humains, que les r{\'e}sum{\'e}s de r{\'e}f{\'e}rence de CNN/DailyMail ne correspondent pas {\`a} ce que doit {\^e}tre un r{\'e}sum{\'e}, et que le corpus n{'}est donc pas adapt{\'e} {\`a} la t{\^a}che de r{\'e}sum{\'e} automatique."
}
Markdown (Informal)
[Étude critique du corpus CNN/DailyMail pour le résumé automatique](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-taln.21/) (Bachey et al., JEP/TALN/RECITAL 2025)
ACL