Attribution d’auteur au moyen de modèles de langue et de modèles stylométriques

Audrey Laroche


Abstract
Dans une tâche consistant à trouver l’auteur (parmi 53) de chacun de 114 textes, nous analysons la performance de modèles de langue et de modèles stylométriques sous les angles du rappel et du nombre de paramètres. Le modèle de mots bigramme à lissage de Kneser-Ney modifié interpolé est le plus performant (75 % de bonnes réponses au premier rang). Parmi les modèles stylométriques, une combinaison de 7 paramètres liés aux parties du discours produit les meilleurs résultats (rappel de 25 % au premier rang). Dans les deux catégories de modèles, le rappel maximal n’est pas atteint lorsque le nombre de paramètres est le plus élevé.
Anthology ID:
2010.jeptalnrecital-recital.1
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
1–10
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-recital.1
DOI:
Bibkey:
Cite (ACL):
Audrey Laroche. 2010. Attribution d’auteur au moyen de modèles de langue et de modèles stylométriques. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 1–10, Montréal, Canada. ATALA.
Cite (Informal):
Attribution d’auteur au moyen de modèles de langue et de modèles stylométriques (Laroche, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2010.jeptalnrecital-recital.1.pdf