François Rioult
2010
Repérer automatiquement les segments obsolescents à l’aide d’indices sémantiques et discursifs [Automatic Tracking of Obsolescent Segments with Linguistic Cues]
Marion Laignelet
|
François Rioult
Traitement Automatique des Langues, Volume 51, Numéro 1 : Varia [Varia]
2009
Repérer automatiquement les segments obsolescents à l’aide d’indices sémantiques et discursifs
Marion Laignelet
|
François Rioult
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Cet article vise la description et le repérage automatique des segments d’obsolescence dans les documents de type encyclopédique. Nous supposons que des indices sémantiques et discursifs peuvent permettre le repérage de tels segments. Pour ce faire, nous travaillons sur un corpus annoté manuellement par des experts sur lequel nous projetons des indices repérés automatiquement. Les techniques statistiques de base ne permettent pas d’expliquer ce phénomène complexe. Nous proposons l’utilisation de techniques de fouille de données pour le caractériser et nous évaluons le pouvoir prédictif de nos indices. Nous montrons, à l’aide de techniques de classification supervisée et de calcul de l’aire sous la courbe ROC, que nos hypothèses sont pertinentes.
Search