@inproceedings{de-salabert-barreaux-2020-vers,
title = "Vers un corpus optimal pour la fouille de textes : strat{\'e}gie de constitution de corpus sp{\'e}cialis{\'e}s {\`a} partir d{'}{ISTEX} (Towards an optimal corpus for text mining: specialized corpus building strategy from {ISTEX})",
author = "de Salabert, Camille and
Barreaux, Sabine",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 4 : D{\'e}monstrations et r{\'e}sum{\'e}s d'articles internationaux",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://aclanthology.org/2020.jeptalnrecital-demos.18",
pages = "66--69",
abstract = "Pr{\'e}alable indispensable {\`a} de nombreuses activit{\'e}s de TAL et de fouille de textes, l{'}{\'e}laboration d{'}un corpus peut n{\'e}cessiter plusieurs phases de traitement pour am{\'e}liorer sa qualit{\'e} et ainsi obtenir les meilleurs r{\'e}sultats d{'}analyse automatique. Les post-traitements appliqu{\'e}s {\`a} un tel corpus, notamment pour garantir la pertinence de son contenu et l{'}homog{\'e}n{\'e}it{\'e} de son format, pourront s{'}av{\'e}rer d{'}autant plus co{\^u}teux et fastidieux que la construction du corpus de travail aura {\'e}t{\'e} impr{\'e}cise. Cette d{\'e}monstration se proposera de tirer parti de la plateforme ISTEX et de ses services associ{\'e}s pour constituer, au travers d{'}un cycle it{\'e}ratif, un corpus homog{\`e}ne de publications scientifiquement pertinentes pour une utilisation simplifi{\'e}e par des outils de fouille.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="de-salabert-barreaux-2020-vers">
<titleInfo>
<title>Vers un corpus optimal pour la fouille de textes : stratégie de constitution de corpus spécialisés à partir d’ISTEX (Towards an optimal corpus for text mining: specialized corpus building strategy from ISTEX)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Camille</namePart>
<namePart type="family">de Salabert</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sabine</namePart>
<namePart type="family">Barreaux</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2020-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 4 : Démonstrations et résumés d’articles internationaux</title>
</titleInfo>
<originInfo>
<publisher>ATALA et AFCP</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Préalable indispensable à de nombreuses activités de TAL et de fouille de textes, l’élaboration d’un corpus peut nécessiter plusieurs phases de traitement pour améliorer sa qualité et ainsi obtenir les meilleurs résultats d’analyse automatique. Les post-traitements appliqués à un tel corpus, notamment pour garantir la pertinence de son contenu et l’homogénéité de son format, pourront s’avérer d’autant plus coûteux et fastidieux que la construction du corpus de travail aura été imprécise. Cette démonstration se proposera de tirer parti de la plateforme ISTEX et de ses services associés pour constituer, au travers d’un cycle itératif, un corpus homogène de publications scientifiquement pertinentes pour une utilisation simplifiée par des outils de fouille.</abstract>
<identifier type="citekey">de-salabert-barreaux-2020-vers</identifier>
<location>
<url>https://aclanthology.org/2020.jeptalnrecital-demos.18</url>
</location>
<part>
<date>2020-6</date>
<extent unit="page">
<start>66</start>
<end>69</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Vers un corpus optimal pour la fouille de textes : stratégie de constitution de corpus spécialisés à partir d’ISTEX (Towards an optimal corpus for text mining: specialized corpus building strategy from ISTEX)
%A de Salabert, Camille
%A Barreaux, Sabine
%S Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 4 : Démonstrations et résumés d’articles internationaux
%D 2020
%8 June
%I ATALA et AFCP
%C Nancy, France
%G French
%F de-salabert-barreaux-2020-vers
%X Préalable indispensable à de nombreuses activités de TAL et de fouille de textes, l’élaboration d’un corpus peut nécessiter plusieurs phases de traitement pour améliorer sa qualité et ainsi obtenir les meilleurs résultats d’analyse automatique. Les post-traitements appliqués à un tel corpus, notamment pour garantir la pertinence de son contenu et l’homogénéité de son format, pourront s’avérer d’autant plus coûteux et fastidieux que la construction du corpus de travail aura été imprécise. Cette démonstration se proposera de tirer parti de la plateforme ISTEX et de ses services associés pour constituer, au travers d’un cycle itératif, un corpus homogène de publications scientifiquement pertinentes pour une utilisation simplifiée par des outils de fouille.
%U https://aclanthology.org/2020.jeptalnrecital-demos.18
%P 66-69
Markdown (Informal)
[Vers un corpus optimal pour la fouille de textes : stratégie de constitution de corpus spécialisés à partir d’ISTEX (Towards an optimal corpus for text mining: specialized corpus building strategy from ISTEX)](https://aclanthology.org/2020.jeptalnrecital-demos.18) (de Salabert & Barreaux, JEP/TALN/RECITAL 2020)
ACL