Approche de construction automatique de titres courts par des méthodes de Fouille du Web (An automatic short title construction approach by web mining methods)

Cédric Lopez, Mathieu Roche


Abstract
Le titrage automatique de documents textuels est une tâche essentielle pour plusieurs applications (titrage de mails, génération automatique de sommaires, synthèse de documents, etc.). Cette étude présente une méthode de construction de titres courts appliquée à un corpus d’articles journalistiques via des méthodes de Fouille du Web. Il s’agit d’une première étape cruciale dans le but de proposer une méthode de construction de titres plus complexes. Dans cet article, nous présentons une méthode proposant des titres tenant compte de leur cohérence par rapport au texte, par rapport au Web, ainsi que de leur contexte dynamique. L’évaluation de notre approche indique que nos titres construits automatiquement sont informatifs et/ou accrocheurs.
Anthology ID:
2011.jeptalnrecital-long.3
Volume:
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2011
Address:
Montpellier, France
Editors:
Mathieu Lafourcade, Violaine Prince
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
25–36
Language:
French
URL:
https://aclanthology.org/2011.jeptalnrecital-long.3
DOI:
Bibkey:
Cite (ACL):
Cédric Lopez and Mathieu Roche. 2011. Approche de construction automatique de titres courts par des méthodes de Fouille du Web (An automatic short title construction approach by web mining methods). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 25–36, Montpellier, France. ATALA.
Cite (Informal):
Approche de construction automatique de titres courts par des méthodes de Fouille du Web (An automatic short title construction approach by web mining methods) (Lopez & Roche, JEP/TALN/RECITAL 2011)
Copy Citation:
PDF:
https://preview.aclanthology.org/nschneid-patch-4/2011.jeptalnrecital-long.3.pdf