Abstract
Le projet décrit vise à soutenir les efforts de constitution de ressources lexicales utiles à l’indexation automatique. Un type de vocabulaire utile à l’indexation est défini, le vocabulaire savant de base, qui peut s’articuler avec le vocabulaire spécialisé pour constituer des entrées d’index structurées. On présente les résultats d’ une expérimentation d’ extraction (semi-)automatique des mots du vocabulaire savant de base à partir d’un corpus ciblé, constitué de résumés d’articles scientifiques en français et en anglais. La tâche d’extraction a réussi à doubler une liste originale constituée manuellement pour le français. La comparaison est établie avec une expérimentation similaire effectuée pour l’anglais sur un corpus plus grand et contenant des résumés d’articles non seulement en sciences pures mais aussi en sciences humaines et sociales.- Anthology ID:
- 2010.jeptalnrecital-long.37
- Volume:
- Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- July
- Year:
- 2010
- Address:
- Montréal, Canada
- Editors:
- Philippe Langlais, Michel Gagnon
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 363–372
- Language:
- French
- URL:
- https://aclanthology.org/2010.jeptalnrecital-long.37
- DOI:
- Cite (ACL):
- Lyne Da Sylva. 2010. Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 363–372, Montréal, Canada. ATALA.
- Cite (Informal):
- Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique (Da Sylva, JEP/TALN/RECITAL 2010)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2010.jeptalnrecital-long.37.pdf