@inproceedings{lejeune-barbaresi-2020-bien,
title = "Bien choisir son outil d{'}extraction de contenu {\`a} partir du Web (Choosing the appropriate tool for Web Content Extraction )",
author = {Lejeune, Ga{\"e}l and
Barbaresi, Adrien},
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 4 : D{\'e}monstrations et r{\'e}sum{\'e}s d'articles internationaux",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-demos.12/",
pages = "46--49",
language = "fra",
abstract = "Nous proposons une d{\'e}monstration sur l{'}extraction de contenu textuel dans des pages web ainsi que son {\'e}valuation. Nous nous concentrons sur les pages web contenant du texte (articles de presse, magazines en ligne et blogs) et montrons que les textes peuvent varier grandement selon diff{\'e}rentes dimensions : diachronique, g{\'e}ographique et typologique. D{\`e}s lors, les outils et mesures d'{\'e}valuation correspondantes sont sujettes {\`a} caution : les indicateurs commun{\'e}ment utilis{\'e}s et cens{\'e}s pr{\'e}sider au choix de l{'}outil appropri{\'e} par les utilisateurs finaux sont {\`a} la fois impr{\'e}cis et difficiles {\`a} interpr{\'e}ter."
}
Markdown (Informal)
[Bien choisir son outil d’extraction de contenu à partir du Web (Choosing the appropriate tool for Web Content Extraction )](https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-demos.12/) (Lejeune & Barbaresi, JEP/TALN/RECITAL 2020)
ACL