Abstract
Cet article vise la description et le repérage automatique des segments d’obsolescence dans les documents de type encyclopédique. Nous supposons que des indices sémantiques et discursifs peuvent permettre le repérage de tels segments. Pour ce faire, nous travaillons sur un corpus annoté manuellement par des experts sur lequel nous projetons des indices repérés automatiquement. Les techniques statistiques de base ne permettent pas d’expliquer ce phénomène complexe. Nous proposons l’utilisation de techniques de fouille de données pour le caractériser et nous évaluons le pouvoir prédictif de nos indices. Nous montrons, à l’aide de techniques de classification supervisée et de calcul de l’aire sous la courbe ROC, que nos hypothèses sont pertinentes.- Anthology ID:
- 2009.jeptalnrecital-long.19
- Volume:
- Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- June
- Year:
- 2009
- Address:
- Senlis, France
- Editors:
- Adeline Nazarenko, Thierry Poibeau
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 181–190
- Language:
- French
- URL:
- https://aclanthology.org/2009.jeptalnrecital-long.19
- DOI:
- Cite (ACL):
- Marion Laignelet and François Rioult. 2009. Repérer automatiquement les segments obsolescents à l’aide d’indices sémantiques et discursifs. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 181–190, Senlis, France. ATALA.
- Cite (Informal):
- Repérer automatiquement les segments obsolescents à l’aide d’indices sémantiques et discursifs (Laignelet & Rioult, JEP/TALN/RECITAL 2009)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2009.jeptalnrecital-long.19.pdf