@inproceedings{labrak-etal-2023-morfitt,
title = "{MORFITT} : Un corpus multi-labels d{'}articles scientifiques fran{\c{c}}ais dans le domaine biom{\'e}dical",
author = "Labrak, Yanis and
Rouvier, Mickael and
Dufour, Richard",
editor = {Boudin, Florian and
Daille, B{\'e}atrice and
Dufour, Richard and
El, Oumaima and
Houbre, Ma{\"e}l and
Jourdan, L{\'e}ane and
Kooli, Nihel},
booktitle = "Actes de CORIA-TALN 2023. Actes de l'atelier ``Analyse et Recherche de Textes Scientifiques'' (ARTS)@TALN 2023",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-arts.11/",
pages = "66--70",
language = "fra",
abstract = "Cet article pr{\'e}sente MORFITT, le premier corpus multi-labels en fran{\c{c}}ais annot{\'e} en sp{\'e}cialit{\'e}s dans le domaine m{\'e}dical. MORFITT est compos{\'e} de 3 624 r{\'e}sum{\'e}s d{'}articles scientifiques issus de PubMed, annot{\'e}s en 12 sp{\'e}cialit{\'e}s pour un total de 5 116 annotations. Nous d{\'e}taillons le corpus, les exp{\'e}rimentations et les r{\'e}sultats pr{\'e}liminaires obtenus {\`a} l{'}aide d{'}un classifieur fond{\'e} sur le mod{\`e}le de langage pr{\'e}-entra{\^i}n{\'e} CamemBERT. Ces r{\'e}sultats pr{\'e}liminaires d{\'e}montrent la difficult{\'e} de la t{\^a}che, avec un F-score moyen pond{\'e}r{\'e} de 61,78{\%}."
}
Markdown (Informal)
[MORFITT : Un corpus multi-labels d’articles scientifiques français dans le domaine biomédical](https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-arts.11/) (Labrak et al., JEP/TALN/RECITAL 2023)
ACL