Utilisation d’indices temporels pour la segmentation événementielle de textes

Ludovic Jean-Louis, Romaric Besançon, Olivier Ferret


Abstract
Dans le domaine de l’Extraction d’Information, une place importante est faite à l’extraction d’événements dans des dépêches d’actualité, particulièrement justifiée dans le contexte d’applications de veille. Or il est fréquent qu’une dépêche d’actualité évoque plusieurs événements de même nature pour les comparer. Nous proposons dans cet article d’étudier des méthodes pour segmenter les textes en séparant les événements, dans le but de faciliter le rattachement des informations pertinentes à l’événement principal. L’idée est d’utiliser des modèles d’apprentissage statistique exploitant les marqueurs temporels présents dans les textes pour faire cette segmentation. Nous présentons plus précisément deux modèles (HMM et CRF) entraînés pour cette tâche et, en faisant une évaluation de ces modèles sur un corpus de dépêches traitant d’événements sismiques, nous montrons que les méthodes proposées permettent d’obtenir des résultats au moins aussi bons que ceux d’une approche ad hoc, avec une approche beaucoup plus générique.
Anthology ID:
2010.jeptalnrecital-long.24
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
231–240
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.24
DOI:
Bibkey:
Cite (ACL):
Ludovic Jean-Louis, Romaric Besançon, and Olivier Ferret. 2010. Utilisation d’indices temporels pour la segmentation événementielle de textes. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 231–240, Montréal, Canada. ATALA.
Cite (Informal):
Utilisation d’indices temporels pour la segmentation événementielle de textes (Jean-Louis et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://preview.aclanthology.org/nschneid-patch-5/2010.jeptalnrecital-long.24.pdf