@inproceedings{miletic-2023-outiller,
title = "Outiller l`occitan : nouvelles ressources et lemmatisation",
author = "Mileti{\'c}, Aleksandra",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jeptalnrecital-long.17/",
pages = "217--231",
language = "fra",
abstract = "Ce travail pr{\'e}sente des contributions r{\'e}centes {\`a} l`effort de doter l`occitan de ressources et outils pour le TAL. Plusieurs ressources existantes ont {\'e}t{\'e} modifi{\'e}es ou adapt{\'e}es, notamment un tok{\'e}niseur {\`a} base de r{\`e}gles, un lexique morphosyntaxique et un corpus arbor{\'e}. Ces ressources ont {\'e}t{\'e} utilis{\'e}es pour entra{\^i}ner et {\'e}valuer des mod{\`e}les neuronaux pour la lemmatisation. Dans le cadre de ces exp{\'e}riences, un nouveau corpus plus large (2 millions de tokens) provenant du Wikip{\'e}dia a {\'e}t{\'e} annot{\'e} en parties du discours, lemmatis{\'e} et diffus{\'e}."
}
Markdown (Informal)
[Outiller l’occitan : nouvelles ressources et lemmatisation](https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jeptalnrecital-long.17/) (Miletić, JEP/TALN/RECITAL 2023)
ACL
- Aleksandra Miletić. 2023. Outiller l’occitan : nouvelles ressources et lemmatisation. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs, pages 217–231, Paris, France. ATALA.