@inproceedings{alkan-etal-2023-etude,
title = "{\'E}tude de m{\'e}thodes d`augmentation de donn{\'e}es pour la reconnaissance d`entit{\'e}s nomm{\'e}es en astrophysique",
author = "Alkan, Atilla Kaan and
Grouin, Cyril and
Zweigenbaum, Pierre",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/icon-24-ingestion/2023.jeptalnrecital-long.1/",
pages = "1--13",
language = "fra",
abstract = "Dans cet article nous {\'e}tudions l`int{\'e}r{\^e}t de l`augmentation de donn{\'e}es pour le rep{\'e}rage d`entit{\'e}s nomm{\'e}es en domaine de sp{\'e}cialit{\'e} : l`astrophysique. Pour cela, nous comparons trois m{\'e}thodes d`augmentation en utilisant deux r{\'e}cents corpus annot{\'e}s du domaine : DEAL et TDAC, tous deux en anglais. Nous avons g{\'e}n{\'e}r{\'e}s les donn{\'e}es artificielles en utilisant des m{\'e}thodes {\`a} base de r{\`e}gles et {\`a} base de mod{\`e}les de langue. Les donn{\'e}es ont ensuite {\'e}t{\'e} ajout{\'e}es de mani{\`e}re it{\'e}rative pour affiner un syst{\`e}me de d{\'e}tection d`entit{\'e}s. Les r{\'e}sultats permettent de constater un effet de seuil : ajouter des donn{\'e}es artificielles au-del{\`a} d`une certaine quantit{\'e} ne pr{\'e}sente plus d`int{\'e}r{\^e}t et peut d{\'e}grader la F-mesure. Sur les deux corpus, le seuil varie selon la m{\'e}thode employ{\'e}e, et en fonction du mod{\`e}le de langue utilis{\'e}. Cette {\'e}tude met {\'e}galement en {\'e}vidence que l`augmentation de donn{\'e}es est plus efficace sur de petits corpus, ce qui est coh{\'e}rent avec d`autres {\'e}tudes ant{\'e}rieures. En effet, nos exp{\'e}riences montrent qu`il est possible d`am{\'e}liorer de 1 point la F-mesure sur le corpus DEAL, et jusqu'{\`a} 2 points sur le corpus TDAC."
}
Markdown (Informal)
[Étude de méthodes d’augmentation de données pour la reconnaissance d’entités nommées en astrophysique](https://preview.aclanthology.org/icon-24-ingestion/2023.jeptalnrecital-long.1/) (Alkan et al., JEP/TALN/RECITAL 2023)
ACL