Abstract
L’extraction et la valorisation de données biographiques contenues dans les dépêches de presse est un processus complexe. Pour l’appréhender correctement, une définition complète, précise et fonctionnelle de cette information est nécessaire. Or, la difficulté que l’on rencontre lors de l’analyse préalable de la tâche d’extraction réside dans l’absence d’une telle définition. Nous proposons ici des conventions dans le but d’en développer une. Le principal concept utilisé pour son expression est la structuration de l’information sous forme de triplets sujet, relation, objet. Le début de définition ainsi construit est exploité lors de l’étape d’extraction d’informations par transducteurs à états finis. Il permet également de suggérer une solution d’implémentation pour l’organisation des données extraites en base de connaissances.- Anthology ID:
- 2006.jeptalnrecital-recital.4
- Volume:
- Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
- Month:
- April
- Year:
- 2006
- Address:
- Leuven, Belgique
- Editors:
- Piet Mertens, Cédrick Fairon, Anne Dister, Patrick Watrin
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 680–689
- Language:
- French
- URL:
- https://aclanthology.org/2006.jeptalnrecital-recital.4
- DOI:
- Cite (ACL):
- Laurent Kevers. 2006. L’information biographique : modélisation, extraction et organisation en base de connaissances. In Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 680–689, Leuven, Belgique. ATALA.
- Cite (Informal):
- L’information biographique : modélisation, extraction et organisation en base de connaissances (Kevers, JEP/TALN/RECITAL 2006)
- PDF:
- https://preview.aclanthology.org/ingest-bitext-workshop/2006.jeptalnrecital-recital.4.pdf