Abstract
Nous présentons les résultats de l’approche statistique que nous avons développée pour le repérage de mots informatifs à partir de textes oraux. Ce travail fait partie d’un projet lancé par le département de la défense canadienne pour le développement d’un système d’extraction d’information dans le domaine de la Recherche et Sauvetage maritime (SAR). Il s’agit de trouver et annoter les mots pertinents avec des étiquettes sémantiques qui sont les concepts d’une ontologie du domaine (SAR). Notre méthode combine deux types d’information : les vecteurs de similarité générés grâce à l’ontologie du domaine et le dictionnaire-thésaurus Wordsmyth ; le contexte d’énonciation représenté par le thème. L’évaluation est effectuée en comparant la sortie du système avec les réponses de formulaires d’extraction d’information prédéfinis. Les résultats obtenus sur les textes oraux sont comparables à ceux obtenus dans le cadre de MUC7 pour des textes écrits.- Anthology ID:
- 2004.jeptalnrecital-long.26
- Volume:
- Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- April
- Year:
- 2004
- Address:
- Fès, Maroc
- Editors:
- Philippe Blache, Noël Nguyen, Nouredine Chenfour, Abdenbi Rajouani
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 249–258
- Language:
- French
- URL:
- https://aclanthology.org/2004.jeptalnrecital-long.26
- DOI:
- Cite (ACL):
- Narjès Boufaden, Yoshua Bengio, and Guy Lapalme. 2004. Approche statistique pour le repérage de mots informatifs dans les textes oraux. In Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 249–258, Fès, Maroc. ATALA.
- Cite (Informal):
- Approche statistique pour le repérage de mots informatifs dans les textes oraux (Boufaden et al., JEP/TALN/RECITAL 2004)
- PDF:
- https://preview.aclanthology.org/ingest-bitext-workshop/2004.jeptalnrecital-long.26.pdf