Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology
Daniela Barreiro Claro, Adriana Pagano (Editors)
- Anthology ID:
- 2024.stil-1
- Month:
- Year:
- 2024
- Address:
- Belém do Pará, Brazil
- Venues:
- STIL | WS
- SIG:
- Publisher:
- Association for Computational Linguistics
- URL:
- https://preview.aclanthology.org/bootstrap-5/2024.stil-1/
- DOI:
- PDF:
- https://preview.aclanthology.org/bootstrap-5/2024.stil-1.pdf
Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology
Daniela Barreiro Claro | Adriana Pagano
Daniela Barreiro Claro | Adriana Pagano
A Linguagem em Foco: Anotação de Sinalizadores Discursivos em Textos Jornalísticos
Paula Figueira Cardoso | Jackson Wilke da Cruz Souza | Roana Rodrigues | Ewerson Dantas | Gabriel Sizinio Bomfim Cruz | Larissa Bárbara | Naira Gama
Paula Figueira Cardoso | Jackson Wilke da Cruz Souza | Roana Rodrigues | Ewerson Dantas | Gabriel Sizinio Bomfim Cruz | Larissa Bárbara | Naira Gama
Synthetic AI Data Pipeline for Domain-Specific Speech-to-Text Solutions
Caminha Caminha | Yvens Rebouças Serpa | Leonardo Pires | Guilherme Fernandes | Anderson Karl
Caminha Caminha | Yvens Rebouças Serpa | Leonardo Pires | Guilherme Fernandes | Anderson Karl
Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese
Elvis Souza | Magali Duran | Maria das Graças Volpe Nunes | Gustavo Sampaio | Giovanna Belasco | Thiago Pardo
Elvis Souza | Magali Duran | Maria das Graças Volpe Nunes | Gustavo Sampaio | Giovanna Belasco | Thiago Pardo
Biases in GPT-3.5 Turbo model: a case study regarding gender and language
Fernanda Malheiros Assi | Helena Caseli
Fernanda Malheiros Assi | Helena Caseli
Modestos e Sustentáveis: O Ajuste Eficiente Beneficia Modelos de Língua de Menor Escala em Português?
Gabriel Assis | Arthur Vasconcelos | Lívia Silva | Mariza Ferro | Aline Paes
Gabriel Assis | Arthur Vasconcelos | Lívia Silva | Mariza Ferro | Aline Paes
TableRAG: A Novel Approach for Augmenting LLMs with Information from Retrieved Tables
Elvis Souza | Patricia Ferreira da Silva | Diogo Gomes | Vitor Batista | Evelyn Batista | Marco Pacheco
Elvis Souza | Patricia Ferreira da Silva | Diogo Gomes | Vitor Batista | Evelyn Batista | Marco Pacheco
PropBank e anotacão de papéis semânticos para a língua portuguesa: O que há de novo?
Cláudia Freitas | Thiago Pardo
Cláudia Freitas | Thiago Pardo
LLMs as Tools for Evaluating Textual Coherence: A Comparative Analysis
Bryan Khelven Barbosa | Claudio Campelo
Bryan Khelven Barbosa | Claudio Campelo
Evaluating Federated Learning with Homomorphic Encryption for Medical Named Entity Recognition Using Compact BERT Models
Marcos Felipe Rezende | Rodrigo Silva | Eduardo Luz | Pedro Silva
Marcos Felipe Rezende | Rodrigo Silva | Eduardo Luz | Pedro Silva
A Dependency Treebank of Tweets in Brazilian Portuguese: Syntactic Annotation Issues and Approach
Ariani Di Felippo | Maria das Graças Volpe Nunes | Bryan Khelven Barbosa
Ariani Di Felippo | Maria das Graças Volpe Nunes | Bryan Khelven Barbosa
Geração Automática de Perguntas em Português do Brasil Usando os Modelos PTT5 e FLAN-T5
Tiago Braga | Hilário Tomaz de Oliveira | Bruno Coutinho
Tiago Braga | Hilário Tomaz de Oliveira | Bruno Coutinho
Sumarização Automática de Artigos de Notícias em Português: Da Extração à Abstração com Abordagens Clássicas e Modelos de Neurais
Marcio Alves Sarmento | Hilário Tomaz de Oliveira
Marcio Alves Sarmento | Hilário Tomaz de Oliveira
Boosting not so Large Language Models by using Knowledge Graphs and Reinforcement Learning
William Beckhauser | Renato Fileto
William Beckhauser | Renato Fileto
Genipapo - a Multigenre Dependency Parsing for Brazilian Portuguese
Ariani Felippo | Bryan Khelven Barbosa | Norton Trevisan Roman | Thiago Pardo
Ariani Felippo | Bryan Khelven Barbosa | Norton Trevisan Roman | Thiago Pardo
Toxic Text Classification in Portuguese: Is LLaMA 3.1 8B All You Need?
Amanda Oliveira | Pedro Silva | Vander Freitas | Valéria Santos | Gladston Moreira | Eduardo Luz
Amanda Oliveira | Pedro Silva | Vander Freitas | Valéria Santos | Gladston Moreira | Eduardo Luz
Disfluency Detection and Removal in Speech Transcriptions via Large Language Models
Pedro Siqueira de Lima | Claudio Campelo
Pedro Siqueira de Lima | Claudio Campelo
Detection and Censorship of Offensive Language in Extended Texts in Portuguese
Lucas Lenoch de Souza | Franciele Beal | Andre Ortoncelli | Marlon Marcon
Lucas Lenoch de Souza | Franciele Beal | Andre Ortoncelli | Marlon Marcon
EyetrackingMOS: Proposta de um método rápido e barato para avaliar modelos de sintese de fala
Gustavo Araújo | Julio Cesar Galdino | Rodrigo Lima | Sandra Aluísio | Arnaldo Candido Jr. | Miguel Oliveira Jr. | Moacir Ponti
Gustavo Araújo | Julio Cesar Galdino | Rodrigo Lima | Sandra Aluísio | Arnaldo Candido Jr. | Miguel Oliveira Jr. | Moacir Ponti
Quati: A Brazilian Portuguese Information Retrieval Dataset from Native Speakers
Eduardo de Oliveira | Mirelle Bueno | Rodrigo Nogueira | Roberto Lotufo | Jayr Pereira
Eduardo de Oliveira | Mirelle Bueno | Rodrigo Nogueira | Roberto Lotufo | Jayr Pereira
Mineração de Argumentos em Textos de Redes Sociais no Idioma Português
Vitor Santos | Livia Alabarse dos Santos | Renata Araujo | Ivan Carlos Alcântara de Oliveira | Orlando Coelho
Vitor Santos | Livia Alabarse dos Santos | Renata Araujo | Ivan Carlos Alcântara de Oliveira | Orlando Coelho
Adapting LLMs to New Domains: A Comparative Study of Fine-Tuning and RAG strategies for Portuguese QA Tasks
Leandro Costa | João Baptista de Oliveira e Souza-Filho
Leandro Costa | João Baptista de Oliveira e Souza-Filho
A Change in Perspective: The Trade-Off Between Perspective API and Custom Models in Classifying Hate Speech in Portuguese
Arthur Buzelin | Pedro Torres Bento | Samira Araújo Malaquias Souza | Yan Amorim | Wagner Meira Jr. | Gisele Pappa
Arthur Buzelin | Pedro Torres Bento | Samira Araújo Malaquias Souza | Yan Amorim | Wagner Meira Jr. | Gisele Pappa
No Argument Left Behind: Overlapping Chunks for Faster Processing of Arbitrarily Long Legal Texts
Israel Fama | Bárbara Bueno | Alexandre Alcoforado | Thomas Palmeira Ferraz | Arnold Moya | Anna Helena Reali Costa
Israel Fama | Bárbara Bueno | Alexandre Alcoforado | Thomas Palmeira Ferraz | Arnold Moya | Anna Helena Reali Costa
Syntactic parsing: where are we going?
Lucelene Lopes | Thiago Alexandre Salgueiro Pardo | Magali Duran
Lucelene Lopes | Thiago Alexandre Salgueiro Pardo | Magali Duran
Segmentação Textual Baseada em Tópicos em Português Utilizando BERTimbau
Luciano A. C. da Silva | Maiara S. F. Rodrigues | Adriana P. Archanjo | Luis Pessoa | Thiago F. de Miguel L. Silva, Almeida | Leonardo Silveira
Luciano A. C. da Silva | Maiara S. F. Rodrigues | Adriana P. Archanjo | Luis Pessoa | Thiago F. de Miguel L. Silva, Almeida | Leonardo Silveira
Avaliação de modelos para detecção de ataques de replay usando diferentes bases de dados
Giovana Y. Nakashima | Higor D. C. Santos | Jone W. M. Soares | Mário Uliani Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima
Giovana Y. Nakashima | Higor D. C. Santos | Jone W. M. Soares | Mário Uliani Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima
Avaliação de arquiteturas de síntese de fala generativa com abordagens de espectrograma e fim-a-fim em cenários low-resource para clonagem de voz
Bruno C. dos S. Ribeiro | Gustavo H. dos S. Figueiredo | Leonardo H. da S. Correia | Mário Uliani-Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima
Bruno C. dos S. Ribeiro | Gustavo H. dos S. Figueiredo | Leonardo H. da S. Correia | Mário Uliani-Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima
Leveraging Structured Data Input for Effective Chatbot Integration in Enterprises
Caio Siqueira | Orlando Guilarte | Giuliano Ferreira | Omar Leiva
Caio Siqueira | Orlando Guilarte | Giuliano Ferreira | Omar Leiva
Anomaly Detection in Text Data: A Semi-Supervised Approach Applied to the Portuguese Domain
Fabio Masaracchia Maia | Anna Helena Reali Costa
Fabio Masaracchia Maia | Anna Helena Reali Costa
Identificação de aspectos explícitos e implícitos em críticas gastronômicas em português: avaliando o potencial dos LLMs
Luiz H. N. Silva | Eloize R. M. Seno | Rozane R. Rebechi | Helena M. Caseli | Fabiano M. Rocha-Jr. | Guilherme A. Faller
Luiz H. N. Silva | Eloize R. M. Seno | Rozane R. Rebechi | Helena M. Caseli | Fabiano M. Rocha-Jr. | Guilherme A. Faller
Avaliação de Algoritmos de Clusterização para Agrupamento de Descrições de Produtos em Notas Fiscais Eletrônicas
Jonas Gabriel L. de Araújo | Thaís G. do Rêgo | Yuri de A. M. Barbosa
Jonas Gabriel L. de Araújo | Thaís G. do Rêgo | Yuri de A. M. Barbosa
Unified Knowledge-Graph for Brazilian Indigenous Languages: An Educational Applications Perspective
Gustavo Polleti | Fabio Cozman | Fabricio Gerardi
Gustavo Polleti | Fabio Cozman | Fabricio Gerardi
A Robustness Analysis of Automated Essay Scoring Methods
Rafael T. Anchiêta | Rogério F. de Sousa | Raimundo S. Moura
Rafael T. Anchiêta | Rogério F. de Sousa | Raimundo S. Moura
Classificação de Notícias em Português Utilizando Modelos Baseados em Transferência de Aprendizagem e Transformers
Wagner Narde | João Mendanha | Henrique Barbosa | Frederico Coelho | Bruno Santos | Luiz Torres
Wagner Narde | João Mendanha | Henrique Barbosa | Frederico Coelho | Bruno Santos | Luiz Torres
Beyond Single Models: Leveraging LLM Ensembles for Human Value Detection in Text
Diego Dimer Rodrigues | Mariana Recamonde-Mendoza | Viviane P. Moreira
Diego Dimer Rodrigues | Mariana Recamonde-Mendoza | Viviane P. Moreira
Performance in a dialectal profiling task of LLMs for varieties of Brazilian Portuguese
Raquel M. Ko Freitag | Túlio Sousa de Gois
Raquel M. Ko Freitag | Túlio Sousa de Gois
Mini-glossário do Tucumã do Pará no Município de Acará: olhares, significados e cultura da Amazônia
Eliene da S. Alves | Brayna C. dos S. Cardoso
Eliene da S. Alves | Brayna C. dos S. Cardoso
Desambiguação de lema e atributos morfológicos na anotação do córpus Porttinari-base
Lucelene Lopes | Magali S. Duran | Thiago Alexandre Salgueiro Pardo
Lucelene Lopes | Magali S. Duran | Thiago Alexandre Salgueiro Pardo
An NLP approach to impersonal –se in Brazilian Portuguese
Elvis A. de Souza | Magali S. Duran | Adriana S. Pagano
Elvis A. de Souza | Magali S. Duran | Adriana S. Pagano
Inferências baseadas em sintaxe: a anotação de sujeitos implícitos
Magali Sanches Duran | Maria das Graças Volpe Nunes | Thiago Alexandre Salgueiro Pardo
Magali Sanches Duran | Maria das Graças Volpe Nunes | Thiago Alexandre Salgueiro Pardo
Notes on variation and lexical diachrony in the Parish Memories-Alentejo collection (1758)
Helena Freire Cameron | Fernanda Olival | Renata Vieira
Helena Freire Cameron | Fernanda Olival | Renata Vieira
A sílaba e a composicionalidade em emakhuwa (P31): análise de empréstimos do português
Francelino Wilson | Vasco Magona | Felermino Ali
Francelino Wilson | Vasco Magona | Felermino Ali
Linguistic and emotional dynamics in satirical vs. real news: a psycholinguistic analysis
Gabriela Wick-Pedro | Roney Lira de Sales Santos | Oto Araújo Vale
Gabriela Wick-Pedro | Roney Lira de Sales Santos | Oto Araújo Vale
Complementos de eco de adjetivos com completiva-sujeito em português do Brasil
Ryan Saldanha Martinez | Jorge Baptista | Oto Araújo Vale
Ryan Saldanha Martinez | Jorge Baptista | Oto Araújo Vale
Modelagem baseada em frames para identificação do léxico da Violência de Gênero
Lorena Tasca Larré | Tiago Timponi Torrent
Lorena Tasca Larré | Tiago Timponi Torrent
Relações Retóricas de List e Sequence em textos jornalísticos
Tobias J. A. Almeida | Patrícia V. Almeida | Paula C.F. Cardoso
Tobias J. A. Almeida | Patrícia V. Almeida | Paula C.F. Cardoso
Estudo preliminar sobre sinalizadores discursivos para Conteúdo Gerado por Usuários
Naira Silva Gama | Jackson Wilke da Cruz Souza
Naira Silva Gama | Jackson Wilke da Cruz Souza
Relações de coerência do português brasileiro: um estudo bibliográfico-documental da RST e seus sinalizadores discursivos
Larissa Jesus Santa Bárbara | Roana Rodrigues | Jackson Wilke da Cruz Souza
Larissa Jesus Santa Bárbara | Roana Rodrigues | Jackson Wilke da Cruz Souza
Subsídios Linguísticos para classificação automática de textos de User-Generated Content
Mateus Araújo Pereira | Jackson Wilke da Cruz Souza
Mateus Araújo Pereira | Jackson Wilke da Cruz Souza
Relações de coerência do espanhol peninsular: Um estudo bibliográfico-documental da Rhetorical Structure Theory
Ewerson Dantas | Roana Rodrigues | Jackson Wilke da Cruz Souza
Ewerson Dantas | Roana Rodrigues | Jackson Wilke da Cruz Souza
Estratégias automáticas para análise da concordância da anotação de Sinalizadores Discursivos
Gabriel Sizinio Bomfim Cruz | Jackson Wilke da Cruz Souza | Paula C. F. Cardoso
Gabriel Sizinio Bomfim Cruz | Jackson Wilke da Cruz Souza | Paula C. F. Cardoso
Mineração de Emoções Multirrótulo Em Textos Curtos
Ramon N. Mendes | Syanne. K. M. Tavares | Luiz Nicollas M. Campos | Fabíola P. O. Araújo
Ramon N. Mendes | Syanne. K. M. Tavares | Luiz Nicollas M. Campos | Fabíola P. O. Araújo
Classificação automática de textos de User-Generated Content utilizando Aprendizagem de Máquina Supervisionado
Iolanda Victoria Morais Ramos | Jackson Wilke da Cruz Souza
Iolanda Victoria Morais Ramos | Jackson Wilke da Cruz Souza
PLN e Segurança Jurídica Identificação de divergências jurisprudenciais com Processamento de Linguagem Natural
Marcella Queiroz de Castro | Ana Régia Mendonça
Marcella Queiroz de Castro | Ana Régia Mendonça
Um Pipeline de Pré-Processamento de Dados Textuais em Português para Análise de Redes Sociais
Livia A. dos Santos | Orlando B. Coelho | Ivan Carlos A. Oliveira Renata Araujo
Livia A. dos Santos | Orlando B. Coelho | Ivan Carlos A. Oliveira Renata Araujo
Especulação Mística. Uma abordagem de Clusterização e Busca Semântica na aproximação de preço em cartas de Magic: The Gathering
Rodrigo Marques Duarte | André de Lima Salgado | Paula Figueira Cardoso
Rodrigo Marques Duarte | André de Lima Salgado | Paula Figueira Cardoso
Comparação de Ferramentas para Análise de Sentimentos Aplicada no Contexto Educacional
Benjamin G. Moreira | Luiz C. Camargo | Ricardo J. Pfitscher | Tatiana R. Garcia
Benjamin G. Moreira | Luiz C. Camargo | Ricardo J. Pfitscher | Tatiana R. Garcia
Modelo de Linguagem Quantizados na Área da Saúde: Um Enfoque em Perguntas e Respostas com Base na Técnica DPO
Mário Pinto Freitas Filho | João Dallyson Almeida | Sousa De | Anselmo C. Paiva
Mário Pinto Freitas Filho | João Dallyson Almeida | Sousa De | Anselmo C. Paiva
Automated Topic Annotation in Brazilian Product Reviews: A Case Study of Adversarial Examples with Sabia-3
Lucas Nildaimon dos Santos Silva | Livy Real
Lucas Nildaimon dos Santos Silva | Livy Real
Text extraction from Knowledge Graphs in the Oil and Gas Industry
Laura P. Navarro | Elvis A. de Souza | Marco A. C. Pacheco
Laura P. Navarro | Elvis A. de Souza | Marco A. C. Pacheco
Getting Logic From LLMs Annotating Natural Language Inference with Sabiá
Fabiana Avais | Marcos Carreira | Livy Real
Fabiana Avais | Marcos Carreira | Livy Real