@inproceedings{boulanger-etal-2023-tri,
title = "Tri-apprentissage g{\'e}n{\'e}ratif : g{\'e}n{\'e}ration de donn{\'e}es pour de la reconnaissance d`entit{\'e}es nomm{\'e}es semi-supervis{\'e}",
author = "Boulanger, Hugo and
Lavergne, Thomas and
Rosset, Sophie",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jeptalnrecital-long.6/",
pages = "68--79",
language = "fra",
abstract = "Le d{\'e}veloppement de solutions de traitement automatique de la langue pour de nouvelles t{\^a}ches n{\'e}cessite des donn{\'e}es, dont l`obtention est co{\^u}teuses. L`acc{\`e}s aux donn{\'e}es peut {\^e}tre limit{\'e} en raison de la nature sensible des donn{\'e}es. La plupart des travaux r{\'e}cents ont exploit{\'e} de grands mod{\`e}les pr{\'e}-entra{\^i}n{\'e}s pour initialiser des versions sp{\'e}cialis{\'e}es de ceux-ci. La sp{\'e}cialisation d`un tel mod{\`e}le n{\'e}cessite toujours une quantit{\'e} {\'e}lev{\'e}e de donn{\'e}es {\'e}tiquet{\'e}es sp{\'e}cifiques {\`a} la t{\^a}che cible. Nous utilisons l`apprentissage semi-supervis{\'e} pour entra{\^i}ner des mod{\`e}les dans un contexte o{\`u} le nombre d`exemples {\'e}tiquet{\'e}s est limit{\'e} et le nombre de donn{\'e}es non {\'e}tiquet{\'e}es est nul. Nous {\'e}tudions plusieurs m{\'e}thodes pour g{\'e}n{\'e}rer le corpus non {\'e}tiquet{\'e} n{\'e}cessaire {\`a} l`utilisation de l`apprentissage semi-supervis{\'e}. Nous introduisons les m{\'e}thodes de g{\'e}n{\'e}ration entre les {\'e}pisodes d`entra{\^i}nement et utilisons les mod{\`e}les entra{\^i}n{\'e}s pour filtrer les exemples g{\'e}n{\'e}r{\'e}s. Nous testons cette g{\'e}n{\'e}ration avec le tri-apprentissage et l`auto-apprentissage sur des corpus Anglais et Fran{\c{c}}ais."
}
Markdown (Informal)
[Tri-apprentissage génératif : génération de données pour de la reconnaissance d’entitées nommées semi-supervisé](https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jeptalnrecital-long.6/) (Boulanger et al., JEP/TALN/RECITAL 2023)
ACL