Abstract
Cet article présente l’utilisation de la plate-forme CasSys pour la segmentation de la parole conversationnelle (chunking) à l’aide de cascades de transducteurs Unitex. Le système que nous présentons est utilisé dans le cadre du projet ANR EPAC. Ce projet a pour objectif l’indexation et l’annotation automatique de grands flux de parole issus d’émissions télévisées ou radiophoniques. Cet article présente tout d’abord l’adaptation à ce type de données d’un système antérieur de chunking (Romus) qui avait été développé pour le dialogue oral homme-machine. Il décrit ensuite les principaux problèmes qui se posent à l’analyse : traitement des disfluences de l’oral spontané, mais également gestion des erreurs dues aux étapes antérieures de reconnaissance de la parole et d’étiquetage morphosyntaxique.- Anthology ID:
- 2008.jeptalnrecital-court.12
- Volume:
- Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
- Month:
- June
- Year:
- 2008
- Address:
- Avignon, France
- Editors:
- Frédéric Béchet, Jean-Francois Bonastre
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 111–120
- Language:
- French
- URL:
- https://aclanthology.org/2008.jeptalnrecital-court.12
- DOI:
- Cite (ACL):
- Abdenour Mokrane, Nathalie Friburger, and Jean-Yves Antoine. 2008. Cascades de transducteurs pour le chunking de la parole conversationnelle : l’utilisation de la plateforme CasSys dans le projet EPAC. In Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 111–120, Avignon, France. ATALA.
- Cite (Informal):
- Cascades de transducteurs pour le chunking de la parole conversationnelle : l’utilisation de la plateforme CasSys dans le projet EPAC (Mokrane et al., JEP/TALN/RECITAL 2008)
- PDF:
- https://preview.aclanthology.org/corrections-2024-05/2008.jeptalnrecital-court.12.pdf