Jean-Philippe Prost


2022

pdf
Integrating a Phrase Structure Corpus Grammar and a Lexical-Semantic Network: the HOLINET Knowledge Graph
Jean-Philippe Prost
Proceedings of the Thirteenth Language Resources and Evaluation Conference

In this paper we address the question of how to integrate grammar and lexical-semantic knowledge within a single and homogeneous knowledge graph. We introduce a graph modelling of grammar knowledge which enables its merging with a lexical-semantic network. Such an integrated representation is expected, for instance, to provide new material for language-related graph embeddings in order to model interactions between Syntax and Semantics. Our base model relies on a phrase structure grammar. The phrase structure is accounted for by both a Proof-Theoretical representation, through a Context-Free Grammar, and a Model-Theoretical one, through a constraint-based grammar. The constraint types colour the grammar layer with syntactic relationships such as Immediate Dominance, Linear Precedence, and more. We detail a creation process which infers the grammar layer from a corpus annotated in constituency and integrates it with a lexical-semantic network through a shared POS tagset. We implement the process, and experiment with the French Treebank and the JeuxDeMots lexical-semantic network. The outcome is the HOLINET knowledge graph.

2016

pdf
Compilation de grammaire de propriétés pour l’analyse syntaxique par optimisation de contraintes (Compilation of a Property Grammar for Syntactic Parsing through Constraint Optimisation)
Jean-Philippe Prost | Rémi Coletta | Christophe Lecoutre
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)

Cet article présente un processus de compilation d’une grammaire de propriétés en une contrainte en extension. Le processus s’insère dans le cadre d’un analyseur syntaxique robuste par résolution d’un problème d’optimisation de contraintes. La grammaire compilée est une énumération de tous les constituants immédiats uniques de l’espace de recherche. L’intérêt de ce travail encore préliminaire tient principalement dans l’exploration d’une modélisation computationnelle de la langue à base de Syntaxe par Modèles (MTS, Model-Theoretic Syntax), qui intègre la représentation indifférenciée des énoncés canoniques et non-canoniques. L’objectif plus particulier du travail présenté ici est d’explorer la possibilité de construire l’ensemble des structures candidat-modèles à partir de l’ensemble des structures syntagmatiques observées sur corpus. Cet article discute notamment le potentiel en matière d’intégration de prédictions probabilistes dans un raisonnement exact pour contribuer à la discrimination entre analyses grammaticales et agrammaticales.

2014

pdf
Exact Grammaticality of Likely Parse Tree (Jugement exact de grammaticalité d’arbre syntaxique probable) [in French]
Jean-Philippe Prost
Proceedings of TALN 2014 (Volume 1: Long Papers)

2009

pdf
Grammar Error Detection with Best Approximated Parse
Jean-Philippe Prost
Proceedings of the 11th International Conference on Parsing Technologies (IWPT’09)

pdf
Analyse relâchée à base de contraintes
Jean-Philippe Prost
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts

La question de la grammaticalité, et celle duale de l’agrammaticalité, sont des sujets délicats à aborder, dès lors que l’on souhaite intégrer différents degrés, tant de grammaticalité que d’agrammaticalité. En termes d’analyse automatique, les problèmes posés sont de l’ordre de la représentation des connaissances, du traitement, et bien évidement de l’évaluation. Dans cet article, nous nous concentrons sur l’aspect traitement, et nous nous penchons sur la question de l’analyse d’énoncés agrammaticaux. Nous explorons la possibilité de fournir une analyse la plus complète possible pour un énoncé agrammatical, sans l’apport d’information complémentaire telle que par le biais de mal-règles ou autre grammaire d’erreurs. Nous proposons une solution algorithmique qui permet l’analyse automatique d’un énoncé agrammatical, sur la seule base d’une grammaire modèle-théorique de bonne formation. Cet analyseur est prouvé générer une solution optimale, selon un critère numérique maximisé.

2006

pdf bib
Proceedings of the Third Workshop on Constraints and Language Processing
Philippe Blache | Henning Christiansen | Veronica Dahl | Jean-Philippe Prost
Proceedings of the Third Workshop on Constraints and Language Processing

pdf
Numbat: Abolishing Privileges when Licensing New Constituents in Constraint-Oriented Parsing
Jean-Philippe Prost
Proceedings of the Third Workshop on Constraints and Language Processing