Abstract
Dans cet article, nous présentons FreDist, un logiciel libre pour la construction automatique de thésaurus distributionnels à partir de corpus de texte, ainsi qu’une évaluation des différents ressources ainsi produites. Suivant les travaux de (Lin, 1998) et (Curran, 2004), nous utilisons un corpus journalistique de grande taille et implémentons différentes options pour : le type de relation contexte lexical, la fonction de poids, et la fonction de mesure de similarité. Prenant l’EuroWordNet français et le WOLF comme références, notre évaluation révèle, de manière originale, que c’est l’approche qui combine contextes linéaires (ici, de type bigrammes) et contextes syntaxiques qui semble fournir le meilleur thésaurus. Enfin, nous espérons que notre logiciel, distribué avec nos meilleurs thésaurus pour le français, seront utiles à la communauté TAL.- Anthology ID:
- 2011.jeptalnrecital-court.20
- Volume:
- Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
- Month:
- June
- Year:
- 2011
- Address:
- Montpellier, France
- Editors:
- Mathieu Lafourcade, Violaine Prince
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 116–121
- Language:
- French
- URL:
- https://aclanthology.org/2011.jeptalnrecital-court.20
- DOI:
- Cite (ACL):
- Enrique Henestroza Anguiano and Pascal Denis. 2011. FreDist : Construction automatique d’un thésaurus distributionnel pour le Français (FreDist : Automatic construction of distributional thesauri for French). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 116–121, Montpellier, France. ATALA.
- Cite (Informal):
- FreDist : Construction automatique d’un thésaurus distributionnel pour le Français (FreDist : Automatic construction of distributional thesauri for French) (Henestroza Anguiano & Denis, JEP/TALN/RECITAL 2011)
- PDF:
- https://preview.aclanthology.org/ingest-acl-2023-videos/2011.jeptalnrecital-court.20.pdf