Abstract
Le projet PASTEL étudie l’acceptabilité et l’utilisabilité des transcriptions automatiques dans le cadre d’enseignements magistraux. Il s’agit d’outiller les apprenants pour enrichir de manière synchrone et automatique les informations auxquelles ils peuvent avoir accès durant la séance. Cet enrichissement s’appuie sur des traitements automatiques du langage naturel effectués sur les transcriptions automatiques. Nous présentons dans cet article un travail portant sur l’annotation d’enregistrements de cours magistraux enregistrés dans le cadre du projet CominOpenCourseware. Ces annotations visent à effectuer des expériences de transcription automatique, segmentation thématique, appariement automatique en temps réel avec des ressources externes... Ce corpus comprend plus de neuf heures de parole annotées. Nous présentons également des expériences préliminaires réalisées pour évaluer l’adaptation automatique de notre système de reconnaissance de la parole.- Anthology ID:
- 2018.jeptalnrecital-court.25
- Volume:
- Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN
- Month:
- 5
- Year:
- 2018
- Address:
- Rennes, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 419–426
- Language:
- French
- URL:
- https://aclanthology.org/2018.jeptalnrecital-court.25
- DOI:
- Cite (ACL):
- Salima Mdhaffar, Antoine Laurent, and Yannick Estève. 2018. Le corpus PASTEL pour le traitement automatique de cours magistraux (PASTEL corpus for automatic processing of lectures). In Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN, pages 419–426, Rennes, France. ATALA.
- Cite (Informal):
- Le corpus PASTEL pour le traitement automatique de cours magistraux (PASTEL corpus for automatic processing of lectures) (Mdhaffar et al., JEP/TALN/RECITAL 2018)
- PDF:
- https://preview.aclanthology.org/ingestion-script-update/2018.jeptalnrecital-court.25.pdf