Intérêt des modèles de caractères pour la détection d’événements (The interest of character-level models for event detection)

Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau


Abstract
Cet article aborde la tâche de détection d’événements, visant à identifier et catégoriser les mentions d’événements dans les textes. Une des difficultés de cette tâche est le problème des mentions d’événements correspondant à des mots mal orthographiés, très spécifiques ou hors vocabulaire. Pour analyser l’impact de leur prise en compte par le biais de modèles de caractères, nous proposons d’intégrer des plongements de caractères, qui peuvent capturer des informations morphologiques et de forme sur les mots, à un modèle convolutif pour la détection d’événements. Plus précisément, nous évaluons deux stratégies pour réaliser une telle intégration et montrons qu’une approche de fusion tardive surpasse à la fois une approche de fusion précoce et des modèles intégrant des informations sur les caractères ou les sous-mots tels que ELMo ou BERT.
Anthology ID:
2021.jeptalnrecital-taln.17
Volume:
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
Month:
6
Year:
2021
Address:
Lille, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
179–188
Language:
French
URL:
https://aclanthology.org/2021.jeptalnrecital-taln.17
DOI:
Bibkey:
Cite (ACL):
Emanuela Boros, Romaric Besançon, Olivier Ferret, and Brigitte Grau. 2021. Intérêt des modèles de caractères pour la détection d’événements (The interest of character-level models for event detection). In Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, pages 179–188, Lille, France. ATALA.
Cite (Informal):
Intérêt des modèles de caractères pour la détection d’événements (The interest of character-level models for event detection) (Boros et al., JEP/TALN/RECITAL 2021)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2021.jeptalnrecital-taln.17.pdf