Identification de cognats à partir de corpus parallèles français-roumain (Identification of cognates from French-Romanian parallel corpora)

Mirabela Navlea, Amalia Todiraşcu


Abstract
Cet article présente une méthode hybride d’identification de cognats français - roumain. Cette méthode exploite des corpus parallèles alignés au niveau propositionnel, lemmatisés et étiquetés (avec des propriétés morphosyntaxiques). Notre méthode combine des techniques statistiques et des informations linguistiques pour améliorer les résultats obtenus. Nous évaluons le module d’identification de cognats et nous faisons une comparaison avec des méthodes statistiques pures, afin d’étudier l’impact des informations linguistiques utilisées sur la qualité des résultats obtenus. Nous montrons que l’utilisation des informations linguistiques augmente significativement la performance de la méthode.
Anthology ID:
2011.jeptalnrecital-court.14
Volume:
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2011
Address:
Montpellier, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
79–84
Language:
French
URL:
https://aclanthology.org/2011.jeptalnrecital-court.14
DOI:
Bibkey:
Cite (ACL):
Mirabela Navlea and Amalia Todiraşcu. 2011. Identification de cognats à partir de corpus parallèles français-roumain (Identification of cognates from French-Romanian parallel corpora). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 79–84, Montpellier, France. ATALA.
Cite (Informal):
Identification de cognats à partir de corpus parallèles français-roumain (Identification of cognates from French-Romanian parallel corpora) (Navlea & Todiraşcu, JEP/TALN/RECITAL 2011)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2011.jeptalnrecital-court.14.pdf