Abstract
Le titrage automatique de documents textuels est une tâche essentielle pour plusieurs applications (titrage de mails, génération automatique de sommaires, synthèse de documents, etc.). Cette étude présente une méthode de construction de titres courts appliquée à un corpus d’articles journalistiques via des méthodes de Fouille du Web. Il s’agit d’une première étape cruciale dans le but de proposer une méthode de construction de titres plus complexes. Dans cet article, nous présentons une méthode proposant des titres tenant compte de leur cohérence par rapport au texte, par rapport au Web, ainsi que de leur contexte dynamique. L’évaluation de notre approche indique que nos titres construits automatiquement sont informatifs et/ou accrocheurs.- Anthology ID:
- 2011.jeptalnrecital-long.3
- Volume:
- Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- June
- Year:
- 2011
- Address:
- Montpellier, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 25–36
- Language:
- French
- URL:
- https://aclanthology.org/2011.jeptalnrecital-long.3
- DOI:
- Cite (ACL):
- Cédric Lopez and Mathieu Roche. 2011. Approche de construction automatique de titres courts par des méthodes de Fouille du Web (An automatic short title construction approach by web mining methods). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 25–36, Montpellier, France. ATALA.
- Cite (Informal):
- Approche de construction automatique de titres courts par des méthodes de Fouille du Web (An automatic short title construction approach by web mining methods) (Lopez & Roche, JEP/TALN/RECITAL 2011)
- PDF:
- https://preview.aclanthology.org/ingestion-script-update/2011.jeptalnrecital-long.3.pdf