Banca de DEFESA: ARLINDO MENEZES DA COSTA NETO

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: ARLINDO MENEZES DA COSTA NETO
DATA : 26/11/2025
HORA: 16:00
LOCAL: online
TÍTULO:

MACHINE LEARNING AND READABILITY IN
ACCOUNTING: AN ENSEMBLE LEARNING APPROACH

 


PALAVRAS-CHAVES:

     Informatividade. Aprendizado de Máquinas. Informação contábil. LLM.


PÁGINAS: 80
RESUMO:

Este estudo emprega o FinBERT-PT-BR, um modelo de linguagem baseado em trans-
formadores treinado em textos financeiros em português do Brasil, para desenvolver um

Índice de Informatividade, concebido para quantificar o valor informacional das divulgações
financeiras. O conjunto de dados é composto por 26.804 notas explicativas anuais de 1.152
companhias abertas brasileiras, abrangendo um período de 12 anos (2011–2023). Além o
índice, são calculadas as medidas tradicionais de legibilidade, Flesch-Kincaid Reading Ease,
Índice de Fog, Índice SMOG e Índice de Loughran-McDonald, para cada nota. Em seguida,
aplicam-se modelos de aprendizado de máquina (Random Forest e Gradient Boosting) para
avaliar qual dessas métricas de legibilidade melhor representa o índice de informatividade
derivado das três dimensões fundamentais: Padronização (Boilerplateness), Completude
e Densidade. As análises de importância das variáveis nos diferentes modelos indicam
que o Índice de Loughran-McDonald é o que mais se aproxima da variação do índice de
informatividade, sugerindo que ele é a proxy mais eficaz para mensurar a legibilidade dos
textos financeiros em português. Esse resultado com base em evidência empírica implica
mudanças sobre a relação teórica entre complexidade textual e ofuscação informacional sob
a ótica da teoria da agência. A pesquisa contribui para a literatura ao integrar modelos de
linguagem e técnicas de aprendizado de máquina ao estudo da qualidade das divulgações
financeiras em português, um contexto linguístico e regulatório ainda pouco explorado,
utilizando um banco de dados extenso. Pesquisas futuras podem ampliar essa abordagem
ao incorporar modelos multilíngues, avaliações humanas ou embeddings híbridos, de modo
a aprimorar e validar o conceito de informatividade.

 


MEMBROS DA BANCA:
Externo à Instituição - CASSIO DA NOBREGA BESARRIA - UFPB
Interno - 1473349 - DANIEL JOSE CARDOSO DA SILVA
Presidente - 1666902 - LUIZ CARLOS MARQUES DOS ANJOS
Externo ao Programa - 1890208 - PAULO SALGADO GOMES DE MATTOS NETO - nullInterno - 2623846 - WILTON BERNARDINO DA SILVA
Notícia cadastrada em: 05/11/2025 13:42
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2025 - UFRN - sigaa09.ufpe.br.sigaa09