Lispector: Fine-tuning de Modelos de Linguagem para Revisão Gramatical e Ortográfica em Português Brasileiro
Andresa Medeiros, Felipe Iszlaji, Claudia Sarmiento-Moreno, Camila Muniz, Larissa Ponciano, Larissa Dejigov, Ronald Monteiro, Pedro Kretikouski, Guilherme Chaves
Abstract
Este trabalho apresenta o Lispector, uma família de modelos de linguagem especializados para revisão gramatical e ortográfica em português brasileiro. Comparamos duas estratégias de inferência para a tarefa de correção gramatical de texto com grandes modelos de linguagem (LLMs): (1) fine-tuning supervisionado e (2) prompting few-shot em modelos de maior escala. Utilizando um conjunto de dados de 4.500 pares de textos reais de usuários (2.500 registros para treino, 1.000 para avaliação e 1.000 para teste), com referências corrigidas por linguistas, analisamos duas variantes do Lispector baseadas em diferentes tamanhos de parâmetros. A avaliação empregou as métricas BLEU, GLEU, METEOR e ROUGE. Os resultados demonstram que modelos menores submetidos a fine-tuning supervisionado superam consistentemente em todas as métricas modelos maiores que operam apenas com prompting, com o Lispector small alcançando ganhos expressivos em métricas de similaridade textual como GLEU (+12%) e BLEU (+13%). Assim, além do aumento de desempenho, os modelos fine-tuned apresentam comportamento mais previsível e conservador, características desejáveis em aplicações industriais de escrita assistida. No quesito latência, o Lispector small obteve a menor mediana de tempo de resposta entre todos os modelos e o menor P95 entre os fine-tuned; o Lispector large também se mostrou competitivo. Esses achados indicam que, para tarefas específicas de revisão textual em português brasileiro, o fine-tuning pode oferecer vantagens significativas em desempenho e eficiência computacional.- Anthology ID:
- 2026.propor-2.8
- Volume:
- Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
- Month:
- April
- Year:
- 2026
- Address:
- Salvador, Brazil
- Editors:
- Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
- Venue:
- PROPOR
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 25–29
- Language:
- URL:
- https://preview.aclanthology.org/ingest-dnd/2026.propor-2.8/
- DOI:
- Cite (ACL):
- Andresa Medeiros, Felipe Iszlaji, Claudia Sarmiento-Moreno, Camila Muniz, Larissa Ponciano, Larissa Dejigov, Ronald Monteiro, Pedro Kretikouski, and Guilherme Chaves. 2026. Lispector: Fine-tuning de Modelos de Linguagem para Revisão Gramatical e Ortográfica em Português Brasileiro. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2, pages 25–29, Salvador, Brazil. Association for Computational Linguistics.
- Cite (Informal):
- Lispector: Fine-tuning de Modelos de Linguagem para Revisão Gramatical e Ortográfica em Português Brasileiro (Medeiros et al., PROPOR 2026)
- PDF:
- https://preview.aclanthology.org/ingest-dnd/2026.propor-2.8.pdf