Classification du genre vidéo reposant sur des transcriptions automatiques

Stanislas Oger, Mickael Rouvier, Georges Linarès


Abstract
Dans cet article nous proposons une nouvelle méthode pour l’identification du genre vidéo qui repose sur une analyse de leur contenu linguistique. Cette approche consiste en l’analyse des mots apparaissant dans les transcriptions des pistes audio des vidéos, obtenues à l’aide d’un système de reconnaissance automatique de la parole. Les expériences sont réalisées sur un corpus composé de dessins animés, de films, de journaux télévisés, de publicités, de documentaires, d’émissions de sport et de clips de musique. L’approche proposée permet d’obtenir un taux de bonne classification de 74% sur cette tâche. En combinant cette approche avec des méthodes reposant sur des paramètres acoustiques bas-niveau, nous obtenons un taux de bonne classification de 95%.
Anthology ID:
2010.jeptalnrecital-long.19
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
181–190
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.19
DOI:
Bibkey:
Cite (ACL):
Stanislas Oger, Mickael Rouvier, and Georges Linarès. 2010. Classification du genre vidéo reposant sur des transcriptions automatiques. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 181–190, Montréal, Canada. ATALA.
Cite (Informal):
Classification du genre vidéo reposant sur des transcriptions automatiques (Oger et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://preview.aclanthology.org/nschneid-patch-4/2010.jeptalnrecital-long.19.pdf