2006
pdf
abs
V1Ω a=able ou Normaliser des lexiques syntaxiques est délectable
Susanne Salmon-Alt
Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Partant des lexiques TAL syntaxiques existants, cet article propose une représentation lexicale unifiée et normalisée, préalable et nécessaire à toute exploitation des lexiques syntaxiques hors de leur propre contexte de conception. Ce travail s’inscrit dans un cadre de modélisation privilégié − le Lexical Markup Framework − qui a été conçu dès le départ comme un modèle lexicographique intégrant les différents niveaux de description. Ce modèle permet d’articuler des descriptions extensionnelles et intensionnelles et fait référence à un jeu de descripteurs normalisés, garantissant la rigueur de la description des faits linguistiques et assurant, à terme, la compatibilité avec des formats de données utilisés pour l’annotation de corpus.
pdf
abs
Automatic extraction of subcategorization frames for French
Paula Chesley
|
Susanne Salmon-Alt
Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC’06)
This paper describes the automatic extraction of French subcategorization frames from corpora. The subcategorization frames have been acquired via VISL, a dependency-based parser (Bick 2003), whose verb lexicon is currently incomplete with respect to subcategorization frames. Therefore, we have implemented binomial hypothesis testing as a post-parsing filtering step. On a test set of 104 frequent verbs we achieve lower bounds on type precision at 86.8% and on token recall at 54.3%. These results show that, contra (Korhonen et al. 2000), binomial hypothesis testing can be robust for determining subcategorization frames given corpus data. Additionally, we estimate that our extracted subcategorization frames account for 85.4% of all frames in French corpora. We conclude that using a language resource, such as the VISL parser, with a currently unevaluated (and potentially high) error rate can yield robust results in conjunction with probabilistic filtering of the resource output.
2004
pdf
abs
La FREEBANK : vers une base libre de corpus annotés
Susanne Salmon-Alt
|
Eckhard Bick
|
Laurent Romary
|
Jean-Marie Pierrel
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Les corpus français librement accessibles annotés à d’autres niveaux linguistiques que morpho-syntaxique sont insuffisants à la fois quantitativement et qualitativement. Partant de ce constat, la FREEBANK – construite sur la base d’outils d’analyse automatique dont la sortie est révisée manuellement – se veut une base de corpus du français annotés à plusieurs niveaux (structurel, morphologique, syntaxique, coréférentiel) et à différents degrés de finesse linguistique qui soit libre d’accès, codée selon des schémas normalisés, intégrant des ressources existantes et ouverte à l’enrichissement progressif.
pdf
abs
Résolution automatique d’anaphores infidèles en français : Quelles ressources pour quels apports ?
Susanne Salmon-Alt
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
La performance d’une résolution automatique d’anaphores infidèles pour le français pourrait atteindre une F-mesure de 30%. Ce résultat repose toutefois sur une ressource équivalente à un bon dictionnaire de la langue française, une analyse syntaxique de qualité satisfaisante et un traitement performant des entités nommées. En l’absence de telles ressources, les meilleurs résultats plafonnent autour d’une F-mesure de 15%.
pdf
Standards going concrete : from LMF to Morphalou
Laurent Romary
|
Susanne Salmon-Alt
|
Gil Francopoulo
Proceedings of the Workshop on Enhancing and Using Electronic Dictionaries
pdf
Towards a Reference Annotation Framework
Susanne Salmon-Alt
|
Laurent Romary
Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC’04)
pdf
Online Evaluation of Coreference Resolution
Andrei Popescu-Belis
|
Loïs Rigouste
|
Susanne Salmon-Alt
|
Laurent Romary
Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC’04)
2003
pdf
bib
From Concrete to Virtual Annotation Mark-up Language: The Case of COMMOn-REFs
Renata Vieira
|
Caroline Gasperin
|
Rodrigo Goulart
|
Susanne Salmon-Alt
Proceedings of the ACL 2003 Workshop on Linguistic Annotation: Getting the Model Right
2002
pdf
Nominal Expressions in Multilingual Corpora: Definites and Demonstratives
Susanne Salmon-Alt
|
Renata Vieira
Proceedings of the Third International Conference on Language Resources and Evaluation (LREC’02)