@inproceedings{alkan-etal-2023-etude,
title = "{\'E}tude de m{\'e}thodes d{'}augmentation de donn{\'e}es pour la reconnaissance d{'}entit{\'e}s nomm{\'e}es en astrophysique",
author = "Alkan, Atilla Kaan and
Grouin, Cyril and
Zweigenbaum, Pierre",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-long.1",
pages = "1--13",
abstract = "Dans cet article nous {\'e}tudions l{'}int{\'e}r{\^e}t de l{'}augmentation de donn{\'e}es pour le rep{\'e}rage d{'}entit{\'e}s nomm{\'e}es en domaine de sp{\'e}cialit{\'e} : l{'}astrophysique. Pour cela, nous comparons trois m{\'e}thodes d{'}augmentation en utilisant deux r{\'e}cents corpus annot{\'e}s du domaine : DEAL et TDAC, tous deux en anglais. Nous avons g{\'e}n{\'e}r{\'e}s les donn{\'e}es artificielles en utilisant des m{\'e}thodes {\`a} base de r{\`e}gles et {\`a} base de mod{\`e}les de langue. Les donn{\'e}es ont ensuite {\'e}t{\'e} ajout{\'e}es de mani{\`e}re it{\'e}rative pour affiner un syst{\`e}me de d{\'e}tection d{'}entit{\'e}s. Les r{\'e}sultats permettent de constater un effet de seuil : ajouter des donn{\'e}es artificielles au-del{\`a} d{'}une certaine quantit{\'e} ne pr{\'e}sente plus d{'}int{\'e}r{\^e}t et peut d{\'e}grader la F-mesure. Sur les deux corpus, le seuil varie selon la m{\'e}thode employ{\'e}e, et en fonction du mod{\`e}le de langue utilis{\'e}. Cette {\'e}tude met {\'e}galement en {\'e}vidence que l{'}augmentation de donn{\'e}es est plus efficace sur de petits corpus, ce qui est coh{\'e}rent avec d{'}autres {\'e}tudes ant{\'e}rieures. En effet, nos exp{\'e}riences montrent qu{'}il est possible d{'}am{\'e}liorer de 1 point la F-mesure sur le corpus DEAL, et jusqu{'}{\`a} 2 points sur le corpus TDAC.",
language = "French",
}
Markdown (Informal)
[Étude de méthodes d’augmentation de données pour la reconnaissance d’entités nommées en astrophysique](https://aclanthology.org/2023.jeptalnrecital-long.1) (Alkan et al., JEP/TALN/RECITAL 2023)
ACL