@inproceedings{hiebel-etal-2022-clister,
title = "{CLISTER} : Un corpus pour la similarit{\'e} s{\'e}mantique textuelle dans des cas cliniques en fran{\c{c}}ais ({CLISTER} : A Corpus for Semantic Textual Similarity in {F}rench Clinical Narratives)",
author = {Hiebel, Nicolas and
Fort, Kar{\"e}n and
N{\'e}v{\'e}ol, Aur{\'e}lie and
Ferret, Olivier},
editor = "Est{\`e}ve, Yannick and
Jim{\'e}nez, Tania and
Parcollet, Titouan and
Zanon Boito, Marcely",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2022.jeptalnrecital-taln.28/",
pages = "287--296",
language = "fra",
abstract = "Le TAL repose sur la disponibilit{\'e} de corpus annot{\'e}s pour l`entra{\^i}nement et l'{\'e}valuation de mod{\`e}les. Il existe tr{\`e}s peu de ressources pour la similarit{\'e} s{\'e}mantique dans le domaine clinique en fran{\c{c}}ais. Dans cette {\'e}tude, nous proposons une d{\'e}finition de la similarit{\'e} guid{\'e}e par l`analyse clinique et l`appliquons au d{\'e}veloppement d`un nouveau corpus partag{\'e} de 1 000 paires de phrases annot{\'e}es manuellement en scores de similarit{\'e}. Nous {\'e}valuons ensuite le corpus par des exp{\'e}riences de mesure automatique de similarit{\'e}. Nous montrons ainsi qu`un mod{\`e}le de plongements de phrases peut capturer la similarit{\'e} avec des performances {\`a} l'{\'e}tat de l`art sur le corpus DEFT STS (Spearman=0,8343). Nous montrons {\'e}galement que le contenu du corpus CLISTER est compl{\'e}mentaire de celui de DEFT STS."
}
Markdown (Informal)
[CLISTER : Un corpus pour la similarité sémantique textuelle dans des cas cliniques en français (CLISTER : A Corpus for Semantic Textual Similarity in French Clinical Narratives)](https://preview.aclanthology.org/jlcl-multiple-ingestion/2022.jeptalnrecital-taln.28/) (Hiebel et al., JEP/TALN/RECITAL 2022)
ACL