@inproceedings{goeuriot-etal-2007-caracterisation,
title = "Caract{\'e}risation des discours scientifiques et vulgaris{\'e}s en fran{\c{c}}ais, japonais et russe",
author = "Goeuriot, Lorraine and
Grabar, Natalia and
Daille, B{\'e}atrice",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2007.jeptalnrecital-poster.9/",
pages = "93--102",
language = "fra",
abstract = "L{'}objectif principal de notre travail consiste {\`a} {\'e}tudier la notion de comparabilit{\'e} des corpus, et nous abordons cette question dans un contexte monolingue en cherchant {\`a} distinguer les documents scientifiques et vulgaris{\'e}s. Nous travaillons s{\'e}par{\'e}ment sur des corpus compos{\'e}s de documents du domaine m{\'e}dical dans trois langues {\`a} forte distance linguistique (le fran{\c{c}}ais, le japonais et le russe). Dans notre approche, les documents sont caract{\'e}ris{\'e}s dans chaque langue selon leur th{\'e}matique et une typologie discursive qui se situe {\`a} trois niveaux de l{'}analyse des documents : structurel, modal et lexical. Le typage des documents est impl{\'e}ment{\'e} avec deux algorithmes d{'}apprentissage (SVMlight et C4.5). L'{\'e}valuation des r{\'e}sultats montre que la typologie discursive propos{\'e}e est portable d{'}une langue {\`a} l{'}autre car elle permet en effet de distinguer les deux discours. Nous constatons n{\'e}anmoins des performances tr{\`e}s vari{\'e}es selon les langues, les algorithmes et les types de caract{\'e}ristiques discursives."
}
Markdown (Informal)
[Caractérisation des discours scientifiques et vulgarisés en français, japonais et russe](https://preview.aclanthology.org/fix-sig-urls/2007.jeptalnrecital-poster.9/) (Goeuriot et al., JEP/TALN/RECITAL 2007)
ACL