Typologie automatique des langues à partir de treebanks

Philippe Blache, Grégroie de Montcheuil, Stéphane Rauzy


Abstract
La typologie des langues repose sur l’étude de la réalisation de propriétés ou phénomènes linguistiques dans plusieurs langues ou familles de langues. Nous abordons dans cet article la question de la typologie syntaxique et proposons une méthode permettant d’extraire automatiquement ces propriétés à partir de treebanks, puis de les analyser en vue de dresser une telle typologie. Nous décrivons cette méthode ainsi que les outils développés pour la mettre en œuvre. Celle-ci a été appliquée à l’analyse de 10 langues décrites dans le Universal Dependencies Treebank. Nous validons ces résultats en montrant comment une technique de classification permet, sur la base des informations extraites, de reconstituer des familles de langues.
Anthology ID:
2015.jeptalnrecital-long.20
Volume:
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2015
Address:
Caen, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
232–243
Language:
URL:
https://aclanthology.org/2015.jeptalnrecital-long.20
DOI:
Bibkey:
Cite (ACL):
Philippe Blache, Grégroie de Montcheuil, and Stéphane Rauzy. 2015. Typologie automatique des langues à partir de treebanks. In Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 232–243, Caen, France. ATALA.
Cite (Informal):
Typologie automatique des langues à partir de treebanks (Blache et al., JEP/TALN/RECITAL 2015)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2015.jeptalnrecital-long.20.pdf