Pierre Alain
2005
Evaluation des Modèles de Langage n-gram et n/m-multigram
Pierre Alain
|
Olivier Boeffard
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Cet article présente une évaluation de modèles statistiques du langage menée sur la langue Française. Nous avons cherché à comparer la performance de modèles de langage exotiques par rapport aux modèles plus classiques de n-gramme à horizon fixe. Les expériences réalisées montrent que des modèles de n-gramme à horizon variable peuvent faire baisser de plus de 10% en moyenne la perplexité d’un modèle de n-gramme à horizon fixe. Les modèles de n/m-multigramme demandent une adaptation pour pouvoir être concurrentiels.
Search