2021
pdf
The Menzerath-Altmann law in syntactic structure revisited
Ján Mačutek
|
Radek Čech
|
Marine Courtin
Proceedings of the Second Workshop on Quantitative Syntax (Quasy, SyntaxFest 2021)
pdf
bib
abs
Extraction de fragments syntaxiques en français à partir d’une mesure d’autonomie basée sur l’entropie (Mining French syntactic fragments using an entropy-based autonomy measure)
Marine Courtin
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 : 23e REncontres jeunes Chercheurs en Informatique pour le TAL (RECITAL)
Dans cet article nous nous intéressons à la prédiction du caractère syntaxique ou non d’une séquence de tokens dans des corpus du français. En particulier, nous comparons une méthode d’extraction de fragments syntaxiques identifiés au moyen d’une mesure d’autonomie basée sur l’entropie à une méthode de référence qui extrait des fragments aléatoires. Les résultats semblent indiquer que les fragments ainsi extraits sont bien plus souvent des unités syntaxiques que les fragments aléatoires. Une telle méthode pourrait être utilisée dans des travaux ultérieurs afin de proposer une induction non-supervisée de structures de dépendances syntaxiques.
2020
pdf
abs
When Collaborative Treebank Curation Meets Graph Grammars
Gaël Guibon
|
Marine Courtin
|
Kim Gerdes
|
Bruno Guillaume
Proceedings of the Twelfth Language Resources and Evaluation Conference
In this paper we present Arborator-Grew, a collaborative annotation tool for treebank development. Arborator-Grew combines the features of two preexisting tools: Arborator and Grew. Arborator is a widely used collaborative graphical online dependency treebank annotation tool. Grew is a tool for graph querying and rewriting specialized in structures needed in NLP, i.e. syntactic and semantic dependency trees and graphs. Grew also has an online version, Grew-match, where all Universal Dependencies treebanks in their classical, deep and surface-syntactic flavors can be queried. Arborator-Grew is a complete redevelopment and modernization of Arborator, replacing its own internal database storage by a new Grew API, which adds a powerful query tool to Arborator’s existing treebank creation and correction features. This includes complex access control for parallel expert and crowd-sourced annotation, tree comparison visualization, and various exercise modes for teaching and training of annotators. Arborator-Grew opens up new paths of collectively creating, updating, maintaining, and curating syntactic treebanks and semantic graph banks.
2019
pdf
A Surface-Syntactic UD Treebank for Naija
Bernard Caron
|
Marine Courtin
|
Kim Gerdes
|
Sylvain Kahane
Proceedings of the 18th International Workshop on Treebanks and Linguistic Theories (TLT, SyntaxFest 2019)
pdf
What can we learn from natural and artificial dependency trees
Marine Courtin
|
Chunxiao Yan
Proceedings of the First Workshop on Quantitative Syntax (Quasy, SyntaxFest 2019)
2017
pdf
Multi-word annotation in syntactic treebanks - Propositions for Universal Dependencies
Sylvain Kahane
|
Marine Courtin
|
Kim Gerdes
Proceedings of the 16th International Workshop on Treebanks and Linguistic Theories