Avaliação Automática de Redações do Enem: Uma Análise Comparativa entre Engenharia de Características e Transformers

Pâmela Camilo Chalegre, Vitor da Rocha Machado, Valéria Delisandra Feltrim


Abstract
A Avaliação Automática de Redações (AES) é um desafio central em avaliações educacionais de larga escala, como o Exame Nacional do Ensino Médio (Enem), no qual redações são avaliadas em múltiplas competências. Este trabalho apresenta uma análise comparativa de representações textuais para a AES em nível de competência no português brasileiro. Foram avaliados modelos baseados em características utilizando TF-IDF, métricas linguísticas extraídas com o NILC-Metrix e uma combinação híbrida de ambos, além de modelos baseados em transformers. Os experimentos foram conduzidos sobre o corpus Enem-AES, considerando formulações de classificação e de regressão. Os resultados indicam que formulações de regressão são, em geral, mais adequadas do que as de classificação multiclasse, pois acomodam melhor a estrutura ordinal das notas. Modelos baseados em transformers alcançaram uma concordância maior em competências relacionadas ao uso da linguagem e à coesão textual, enquanto representações baseadas em características demonstraram um desempenho comparável em competências associadas à pertinência temática. Apesar de alcançarem alta acurácia sob o critério de tolerância do Enem, todas as abordagens demonstraram dificuldade em prever notas extremas, principalmente devido ao desbalanceamento do corpus. Dessa forma, conclui-se que as metodologias são complementares e que sistemas híbridos são promissores para a AES.
Anthology ID:
2026.propor-1.73
Volume:
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Month:
April
Year:
2026
Address:
Salvador, Brazil
Editors:
Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
Venue:
PROPOR
SIG:
Publisher:
Association for Computational Linguistics
Note:
Pages:
738–748
Language:
URL:
https://preview.aclanthology.org/ingest-dnd/2026.propor-1.73/
DOI:
Bibkey:
Cite (ACL):
Pâmela Camilo Chalegre, Vitor da Rocha Machado, and Valéria Delisandra Feltrim. 2026. Avaliação Automática de Redações do Enem: Uma Análise Comparativa entre Engenharia de Características e Transformers. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1, pages 738–748, Salvador, Brazil. Association for Computational Linguistics.
Cite (Informal):
Avaliação Automática de Redações do Enem: Uma Análise Comparativa entre Engenharia de Características e Transformers (Chalegre et al., PROPOR 2026)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingest-dnd/2026.propor-1.73.pdf