@inproceedings{hamon-etal-2007-ogmios,
title = "{OGMIOS} : une plate-forme d`annotation linguistique de collection de documents issus du Web",
author = "Hamon, Thierry and
Derivi{\`e}re, Julien and
Nazarenko, Adeline",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2007.jeptalnrecital-poster.10/",
pages = "103--112",
language = "fra",
abstract = "L`un des objectifs du projet ALVIS est d`int{\'e}grer des informations linguistiques dans des moteurs de recherche sp{\'e}cialis{\'e}s. Dans ce contexte, nous avons con{\c{c}}u une plate-forme d`enrichissement linguistique de documents issus du Web, OGMIOS, exploitant des outils de TAL existants. Les documents peuvent {\^e}tre en fran{\c{c}}ais ou en anglais. Cette architecture est distribu{\'e}e, afin de r{\'e}pondre aux contraintes li{\'e}es aux traitements de gros volumes de textes, et adaptable, pour permettre l`analyse de sous-langages. La plate-forme est d{\'e}velopp{\'e}e en Perl et disponible sous forme de modules CPAN. C`est une structure modulaire dans lequel il est possible d`int{\'e}grer de nouvelles ressources ou de nouveaux outils de TAL. On peut ainsi d{\'e}finir des configuration diff{\'e}rentes pour diff{\'e}rents domaines et types de collections. Cette plateforme robuste permet d`analyser en masse des donn{\'e}es issus du web qui sont par essence tr{\`e}s h{\'e}t{\'e}rog{\`e}nes. Nous avons {\'e}valu{\'e} les performances de la plateforme sur plusieurs collections de documents. En distribuant les traitements sur vingt machines, une collection de 55 329 documents du domaine de la biologie (106 millions de mots) a {\'e}t{\'e} annot{\'e}e en 35 heures tandis qu`une collection de 48 422 d{\'e}p{\^e}ches relatives aux moteurs de recherche (14 millions de mots) a {\'e}t{\'e} annot{\'e}e en 3 heures et 15 minutes."
}
Markdown (Informal)
[OGMIOS : une plate-forme d’annotation linguistique de collection de documents issus du Web](https://preview.aclanthology.org/jlcl-multiple-ingestion/2007.jeptalnrecital-poster.10/) (Hamon et al., JEP/TALN/RECITAL 2007)
ACL