Abstract
Dans cet article, nous nous intéressons à l’indexation de documents de domaines de spécialité par l’intermédiaire de leurs termes-clés. Plus particulièrement, nous nous intéressons à l’indexation telle qu’elle est réalisée par les documentalistes de bibliothèques numériques. Après analyse de la méthodologie de ces indexeurs professionnels, nous proposons une méthode à base de graphe combinant les informations présentes dans le document et la connaissance du domaine pour réaliser une indexation (hybride) libre et contrôlée. Notre méthode permet de proposer des termes-clés ne se trouvant pas nécessairement dans le document. Nos expériences montrent aussi que notre méthode surpasse significativement l’approche à base de graphe état de l’art.- Anthology ID:
- 2016.jeptalnrecital-long.18
- Volume:
- Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Articles longs)
- Month:
- 7
- Year:
- 2016
- Address:
- Paris, France
- Editors:
- Laurence Danlos, Thierry Hamon
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- AFCP - ATALA
- Note:
- Pages:
- 235–247
- Language:
- French
- URL:
- https://aclanthology.org/2016.jeptalnrecital-long.18
- DOI:
- Cite (ACL):
- Adrien Bougouin, Florian Boudin, and Beatrice Daille. 2016. Modélisation unifiée du document et de son domaine pour une indexation par termes-clés libre et contrôlée (Unified document and domain-specific model for keyphrase extraction and assignment ). In Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Articles longs), pages 235–247, Paris, France. AFCP - ATALA.
- Cite (Informal):
- Modélisation unifiée du document et de son domaine pour une indexation par termes-clés libre et contrôlée (Unified document and domain-specific model for keyphrase extraction and assignment ) (Bougouin et al., JEP/TALN/RECITAL 2016)
- PDF:
- https://preview.aclanthology.org/gem-23-ingestion/2016.jeptalnrecital-long.18.pdf