Caracterização lexical e sintática de notícias falsas em português produzidas por humanos e por máquinas
Pedro Lucas Castro de Andrade, Renato Silva, Thiago Alexandre Salgueiro Pardo
Abstract
Notícias falsas são um grande problema para a sociedade. Com a Inteligência Artificial generativa, notícias falsas produzidas pela máquina têm se proliferado, tornando o cenário mais desafiador. Apesar da relevância desse problema, em línguas sub-representadas como o Português, as pesquisas que buscam diferenciar notícias falsas de humanos e de máquinas são incipientes. Buscando preencher essa lacuna, este artigo explora os corpora Fake.br e FakeTrueBR expandidos com notícias falsas geradas automaticamente, caracterizando lexical e sintaticamente as notícias falsas produzidas por humanos e por máquina. Os resultados mostram que textos gerados por máquina apresentam palavras significativamente mais longas, maior uso de modificadores adjetivais e menor diversidade sintática, apesar de utilizarem mais regras sintáticas por sentença. Em contrapartida, textos humanos exibem maior variabilidade estilística em todas as dimensões analisadas.- Anthology ID:
- 2026.propor-2.22
- Volume:
- Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
- Month:
- April
- Year:
- 2026
- Address:
- Salvador, Brazil
- Editors:
- Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
- Venue:
- PROPOR
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 148–158
- Language:
- URL:
- https://preview.aclanthology.org/ingest-dnd/2026.propor-2.22/
- DOI:
- Cite (ACL):
- Pedro Lucas Castro de Andrade, Renato Silva, and Thiago Alexandre Salgueiro Pardo. 2026. Caracterização lexical e sintática de notícias falsas em português produzidas por humanos e por máquinas. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2, pages 148–158, Salvador, Brazil. Association for Computational Linguistics.
- Cite (Informal):
- Caracterização lexical e sintática de notícias falsas em português produzidas por humanos e por máquinas (Andrade et al., PROPOR 2026)
- PDF:
- https://preview.aclanthology.org/ingest-dnd/2026.propor-2.22.pdf