Une approche de résumé automatique basée sur les collocations (A Collocation-Driven Approach to Text Summarization)

Violeta Seretan


Abstract
Dans cet article, nous décrivons une nouvelle approche pour la création de résumés extractifs – tâche qui consiste à créer automatiquement un résumé pour un document en sélectionnant un sous-ensemble de ses phrases – qui exploite des informations collocationnelles spécifiques à un domaine, acquises préalablement à partir d’un corpus de développement. Un extracteur de collocations fondé sur l’analyse syntaxique est utilisé afin d’inférer un modèle de contenu qui est ensuite appliqué au document à résumer. Cette approche a été utilisée pour la création des versions simples pour les articles de Wikipedia en anglais, dans le cadre d’un projet visant la création automatique d’articles simplifiées, similaires aux articles recensées dans Simple English Wikipedia. Une évaluation du système développé reste encore à faire. Toutefois, les résultats préalables obtenus pour les articles sur des villes montrent le potentiel de cette approche guidée par collocations pour la sélection des phrases pertinentes.
Anthology ID:
2011.jeptalnrecital-court.2
Volume:
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2011
Address:
Montpellier, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
7–12
Language:
French
URL:
https://aclanthology.org/2011.jeptalnrecital-court.2
DOI:
Bibkey:
Cite (ACL):
Violeta Seretan. 2011. Une approche de résumé automatique basée sur les collocations (A Collocation-Driven Approach to Text Summarization). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 7–12, Montpellier, France. ATALA.
Cite (Informal):
Une approche de résumé automatique basée sur les collocations (A Collocation-Driven Approach to Text Summarization) (Seretan, JEP/TALN/RECITAL 2011)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2011.jeptalnrecital-court.2.pdf