Marion Laignelet

2018

pdf bib
A Real-life, French-accented Corpus of Air Traffic Control Communications
Estelle Delpech | Marion Laignelet | Christophe Pimm | Céline Raynal | Michal Trzos | Alexandre Arnold | Dominique Pronto
Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)

2011

pdf bib abs
Enrichir la notion de patron par la prise en compte de la structure textuelle - Application à la construction d’ontologie (Enriching the notion of pattern by taking into account the textual structure - Application to ontology construction)
Marion Laignelet | Mouna Kamel | Nathalie Aussenac-Gilles
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts

La projection de patrons lexico-syntaxiques sur corpus est une des manières privilégiées pour identifier des relations sémantiques précises entre éléments lexicaux. Dans cet article, nous proposons d’étendre la notion de patron en prenant en compte la sémantique que véhiculent les éléments de structure d’un document (définitions, titres, énumérations) dans l’identification de relations. Nous avons testé cette hypothèse dans le cadre de la construction d’ontologies à partir de textes fortement structurés du domaine de la cartographie.

2009

pdf bib abs
Repérer automatiquement les segments obsolescents à l’aide d’indices sémantiques et discursifs
Marion Laignelet | François Rioult
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs

Cet article vise la description et le repérage automatique des segments d’obsolescence dans les documents de type encyclopédique. Nous supposons que des indices sémantiques et discursifs peuvent permettre le repérage de tels segments. Pour ce faire, nous travaillons sur un corpus annoté manuellement par des experts sur lequel nous projetons des indices repérés automatiquement. Les techniques statistiques de base ne permettent pas d’expliquer ce phénomène complexe. Nous proposons l’utilisation de techniques de fouille de données pour le caractériser et nous évaluons le pouvoir prédictif de nos indices. Nous montrons, à l’aide de techniques de classification supervisée et de calcul de l’aire sous la courbe ROC, que nos hypothèses sont pertinentes.

2007

pdf bib abs
La segmentation thématique TextTiling comme indice pour le repérage de segments d’information évolutive dans un corpus de textes encyclopédiques
Marion Laignelet | Christophe Pimm
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters)

Nous faisons l’hypothèse que les bornes délimitées par la méthode statistique TextTiling peuvent servir d’indices qui, cumulées à des indices de nature linguistique, permettront de repérer automatiquement des segments d’informations évolutives. Ce travail est développé dans le cadre d’un projet industriel plus général dont le but est le repérage automatique de zones textuelles contenant de l’information potentiellement évolutive.

2006

pdf bib abs
Repérage de segments d’information évolutive dans des documents de type encyclopédique
Marion Laignelet
Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues

Dans cet article, nous cherchons à caractériser linguistiquement des segments textuels définis pragmatiquement, relativement à des besoins de réédition de documents et au sein desquels l’information est susceptible d’évoluer dans le temps. Sur la base d’un corpus de textes encyclopédiques en français, nous analysons la distribution de marqueurs textuels et discursifs et leur pertinence en nous focalisant principalement sur un traitement sémantique particulier de la temporalité.

Co-authors