Tassadit Amghar
2026
Progress Ratio Embeddings: An Impatience Signal for Robust Length Control in Neural Text Generation
Ivanhoé Botcazou | Tassadit Amghar | Sylvain Lamprier | Frédéric Saubion
Findings of the Association for Computational Linguistics: ACL 2026
Ivanhoé Botcazou | Tassadit Amghar | Sylvain Lamprier | Frédéric Saubion
Findings of the Association for Computational Linguistics: ACL 2026
Modern neural language models achieve high accuracy in text generation, yet precise control over generation length remains underdeveloped. In this paper, we first investigate a recent length control method based on Reverse Positional Embeddings (RPE) and show its limits when control is requested beyond the training distribution. In particular, using a discrete countdown signal tied to the absolute remaining token count leads to instability. To provide robust length control, we introduce Progress Ratio Embeddings (PRE), as continuous embeddings tied to a trigonometric impatience signal. PRE integrates seamlessly into standard Transformer architectures, providing stable length fidelity without degrading text accuracy under standard evaluation metrics. We further show that PRE generalizes well to unseen target lengths. Experiments on two widely used news-summarization benchmarks and a popular question generation dataset validate these findings.
2001
Représenter le temps en langue dans le formalisme des graphes conceptuels une approche basée sur les schèmes sémantico-cognitifs
Tassadit Amghar | Delphine Battistelli | Thierry Charnois
Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Tassadit Amghar | Delphine Battistelli | Thierry Charnois
Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
L’objectif de notre travail est de construire une représentation sémantique d’un corpus de textes français au sein des graphes conceptuels simples. Notre conceptualisation est fondée sur les Schèmes Sémantico-Cognitifs et la théorie aspecto-temporelle introduits par J. P. Desclés. Un texte est représenté par deux structures. La première modélise la représention semanticocognitive des propositions du texte, et la seconde le diagramme temporel exprimant les contraintes temporelles entre les différentes situations décrites dans le texte. La prise en compte de ces deux structures et des liens qu’elles entretiennent nous a amenés à modifier le modèle des graphes conceptuels simples et à envisager les modes d’interaction entre temps, aspect (grammatical) et significations des lexèmes verbaux.