Une application de la grammaire structurelle: L’analyseur syntaxique du français SYGFRAN (An application of structural grammar: the SYGFRAN syntactic analyser)
Jacques Chauché
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations
La démonstration présentée produit une analyse syntaxique du français. Elle est écrite en SYGMART, fournie avec les actes, exécutable à l’adresse : http ://www.lirmm.fr/ chauche/ExempleAnl.html et téléchargeable à l’adresse : http ://www.sygtext.fr.
Building a Bilingual Representation of the Roget Thesaurus for French to English Machine Translation
Violaine Prince
Jacques Chauché
Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08)
This paper describes a solution to lexical transfer as a trade-off between a dictionary and an ontology. It shows its association to a translation tool based on morpho-syntactical parsing of the source language. It is based on the English Roget Thesaurus and its equivalent, the French Larousse Thesaurus, in a computational framework. Both thesaurii are transformed into vector spaces, and all monolingual entries are represented as vectors, with 1,000 components for English and 873 for French. The indexing concepts of the respective thesaurii are the generation families of the vector spaces. A bilingual data structure transforms French entries into vectors in the English space, by using their equivalencies representations. Word sense disambiguation consists in choosing the appropriate vector among these bilingual vectors, by computing the contextualized vector of a given word in its source sentence, wading it in the English vector space, and computing the closest distance to the different entries in the bilingual data structure beginning with the same source string (i.e. French word). The process has been experimented on a 20,000 words extract of a French novel, Le Petit Prince, and lexical transfer results were found quite encouraging with a recall of 71% and a precision of 86%.
Classification automatique de textes à partir de leur analyse syntaxico-sémantique
Jacques Chauché
Violaine Prince
Simon Jaillet
Maguelonne Teisseire
Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
L’hypothèse soutenue dans cet article est que l’analyse de contenu, quand elle est réalisée par un analyseur syntaxique robuste avec calcul sémantique dans un modèle adéquat, est un outil de classification tout aussi performant que les méthodes statistiques. Pour étudier les possibilités de cette hypothèse en matière de classification, à l’aide de l’analyseur du Français, SYGMART, nous avons réalisé un projet en grandeur réelle avec une société qui propose des sélections d’articles en revue de presse. Cet article présente non seulement les résultats de cette étude (sur 4843 articles finalement sélectionnés), mais aussi cherche à montrer que l’analyse de contenu automatisée, quand elle est possible, est un moyen fiable de produire une catégorisation issue du sens (quand il est calculable), et pas simplement créée à partir d’une reconnaissance de “similarités”de surface.
Deduction Automatique Et Systemes Transformationnels
J. Chauche
Coling 1986 Volume 1: The 11th International Conference on Computational Linguistics
Un Outil Multidimensionnel de l’Analyse du Discours
J. Chauché
10th International Conference on Computational Linguistics and 22nd Annual Meeting of the Association for Computational Linguistics
The ATEF and CETA Systems
J. Chauche
American Journal of Computational Linguistics (July 1975)