Abstract
De nombreuses méthodes automatiques de classification de textes selon les sentiments qui y sont exprimés s’appuient sur un lexique dans lequel à chaque entrée est associée une valence. Le plus souvent, ce lexique est construit à partir d’un petit nombre de mots, choisis arbitrairement, qui servent de germes pour déterminer automatiquement la valence d’autres mots. La question de l’optimalité de ces mots germes a bien peu retenu l’attention. Sur la base de la comparaison de cinq méthodes automatiques de construction de lexiques de valence, dont une qui, à notre connaissance, n’a jamais été adaptée au français et une autre développée spécifiquement pour la présente étude, nous montrons l’importance du choix de ces mots germes et l’intérêt de les identifier au moyen d’une procédure d’apprentissage supervisée.- Anthology ID:
- 2011.jeptalnrecital-long.14
- Volume:
- Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- June
- Year:
- 2011
- Address:
- Montpellier, France
- Editors:
- Mathieu Lafourcade, Violaine Prince
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 153–164
- Language:
- French
- URL:
- https://aclanthology.org/2011.jeptalnrecital-long.14
- DOI:
- Cite (ACL):
- Nadja Vincze and Yves Bestgen. 2011. Identification de mots germes pour la construction d’un lexique de valence au moyen d’une procédure supervisée (Identification of seed words for building a valence lexicon using a supervised procedure). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 153–164, Montpellier, France. ATALA.
- Cite (Informal):
- Identification de mots germes pour la construction d’un lexique de valence au moyen d’une procédure supervisée (Identification of seed words for building a valence lexicon using a supervised procedure) (Vincze & Bestgen, JEP/TALN/RECITAL 2011)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2011.jeptalnrecital-long.14.pdf