@inproceedings{millour-etal-2017-vers,
title = "Vers une solution l{\'e}g{\`e}re de production de donn{\'e}es pour le {TAL} : cr{\'e}ation d`un tagger de l`alsacien par crowdsourcing b{\'e}n{\'e}vole (Toward a lightweight solution to the language resources bottleneck issue: creating a {POS} tagger for {A}lsatian using voluntary crowdsourcing)",
author = {Millour, Alice and
Fort, Kar{\"e}n and
Bernhard, Delphine and
Steibl{\'e}, Lucie},
editor = "Eshkol-Taravella, Iris and
Antoine, Jean-Yves",
booktitle = "Actes des 24{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs",
month = "6",
year = "2017",
address = "Orl{\'e}ans, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2017.jeptalnrecital-long.10/",
pages = "139--154",
language = "fra",
abstract = "Nous pr{\'e}sentons ici les r{\'e}sultats d`une exp{\'e}rience men{\'e}e sur l`annotation en parties du discours d`un corpus d`une langue r{\'e}gionale encore peu dot{\'e}e, l`alsacien, via une plateforme de myriadisation (crowdsourcing) b{\'e}n{\'e}vole d{\'e}velopp{\'e}e sp{\'e}cifiquement {\`a} cette fin : Bisame1 . La plateforme, mise en ligne en mai 2016, nous a permis de recueillir 15 846 annotations gr{\^a}ce {\`a} 42 participants. L'{\'e}valuation des annotations, r{\'e}alis{\'e}e sur un corpus de r{\'e}f{\'e}rence, montre que la F-mesure des annotations volontaires est de 0, 93. Le tagger entra{\^i}n{\'e} sur le corpus annot{\'e} atteint lui 82 {\%} d`exactitude. Il s`agit du premier tagger sp{\'e}cifique {\`a} l`alsacien. Cette m{\'e}thode de d{\'e}veloppement de ressources langagi{\`e}res est donc efficace et prometteuse pour certaines langues peu dot{\'e}es, dont un nombre suffisant de locuteurs est connect{\'e} et actif sur le Web. Le code de la plateforme, le corpus annot{\'e} et le tagger sont librement disponibles."
}
Markdown (Informal)
[Vers une solution légère de production de données pour le TAL : création d’un tagger de l’alsacien par crowdsourcing bénévole (Toward a lightweight solution to the language resources bottleneck issue: creating a POS tagger for Alsatian using voluntary crowdsourcing)](https://preview.aclanthology.org/jlcl-multiple-ingestion/2017.jeptalnrecital-long.10/) (Millour et al., JEP/TALN/RECITAL 2017)
ACL