Vanessa Andréani


2009

La normalisation intervient dans de nombreux champs du traitement de l’information. Elle permet d’optimiser les performances des applications, telles que la recherche ou l’extraction d’information, et de rendre plus fiable la constitution de ressources langagières. La normalisation consiste à ramener toutes les variantes d’un même terme ou d’une entité nommée à une forme standard, et permet de limiter l’impact de la variation linguistique. Notre travail porte sur la normalisation des entités nommées, pour laquelle nous avons mis en place un système complexe mêlant plusieurs approches. Nous en présentons ici une des composantes : une méthode endogène de délimitation et de validation de l’entité nommée normée, adaptée à des données multilingues. De plus, nous plaçons l’utilisateur au centre du processus de normalisation, dans l’objectif d’obtenir des données parfaitement fiables et adaptées à ses besoins.