@inproceedings{de-salabert-barreaux-2020-vers,
title = "Vers un corpus optimal pour la fouille de textes : strat{\'e}gie de constitution de corpus sp{\'e}cialis{\'e}s {\`a} partir d'{ISTEX} (Towards an optimal corpus for text mining: specialized corpus building strategy from {ISTEX})",
author = "de Salabert, Camille and
Barreaux, Sabine",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 4 : D{\'e}monstrations et r{\'e}sum{\'e}s d'articles internationaux",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-demos.18/",
pages = "66--69",
language = "fra",
abstract = "Pr{\'e}alable indispensable {\`a} de nombreuses activit{\'e}s de TAL et de fouille de textes, l'{\'e}laboration d{'}un corpus peut n{\'e}cessiter plusieurs phases de traitement pour am{\'e}liorer sa qualit{\'e} et ainsi obtenir les meilleurs r{\'e}sultats d{'}analyse automatique. Les post-traitements appliqu{\'e}s {\`a} un tel corpus, notamment pour garantir la pertinence de son contenu et l{'}homog{\'e}n{\'e}it{\'e} de son format, pourront s{'}av{\'e}rer d{'}autant plus co{\^u}teux et fastidieux que la construction du corpus de travail aura {\'e}t{\'e} impr{\'e}cise. Cette d{\'e}monstration se proposera de tirer parti de la plateforme ISTEX et de ses services associ{\'e}s pour constituer, au travers d{'}un cycle it{\'e}ratif, un corpus homog{\`e}ne de publications scientifiquement pertinentes pour une utilisation simplifi{\'e}e par des outils de fouille."
}
Markdown (Informal)
[Vers un corpus optimal pour la fouille de textes : stratégie de constitution de corpus spécialisés à partir d’ISTEX (Towards an optimal corpus for text mining: specialized corpus building strategy from ISTEX)](https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-demos.18/) (de Salabert & Barreaux, JEP/TALN/RECITAL 2020)
ACL