An Experimental Study on the Impact of Design Choices in Deep
Learning Frameworks for Alzheimer’s Disease Diagnosis
Diagnóstico da doença de Alzheimer. Aprendizado profundo.
Transparência de modelos. Rejeição baseada em incerteza. Mecanismos de
atenção. Pré-processamento de neuroimagens.
A doença de Alzheimer (DA) é uma condição neurodegenerativa progressiva e a
principal causa de demência no mundo, representando desafios clínicos e
sociais significativos. Nos últimos anos, modelos de aprendizado profundo
(AP) têm mostrado resultados promissores para o diagnóstico de DA com base
em dados de neuroimagem. No entanto, a implementação desses sistemas na
prática clínica ainda é limitada devido a desafios relacionados à
transparência dos modelos, interpretabilidade, comunicação de incertezas e
sensibilidade a escolhas de projeto, como mecanismos de atenção e
sequências de pré-processamento. Esta Dissertação investiga como modelos
baseados em AP para diagnóstico de DA podem ser aprimorados por meio de
abordagens orientadas à transparência e decisões de design informadas,
relacionadas a configurações de atenção, estratégias de pré-processamento e
seleção de modalidades de imagem. Utilizando dados de RM estrutural e
FDG-PET, experimentos controlados foram conduzidos com base na arquitetura
LA-GMF. Essas investigações incluíram a reprodução parcial de resultados
previamente reportados, a avaliação de variações na configuração de cabeças
de atenção, a integração de mecanismos de rejeição baseados em incerteza e
a avaliação de múltiplos pipelines de pré-processamento aplicados
separadamente a cada modalidade. Os experimentos de reprodução apresentaram
boa concordância com o trabalho original, com uma diferença de acurácia de
apenas 2,13 pontos percentuais e uma pequena diferença de
interpretabilidade de 0,057 na precisão média. As variações nas
configurações de atenção demonstraram uma interação não linear entre
desempenho e interpretabilidade ao aumentar o número de cabeças de atenção.
A introdução de rejeição baseada em incerteza melhorou substancialmente a
confiabilidade do diagnóstico, alcançando 99,38% de acurácia e 98,97% de
recall para a classe DA, enquanto manteve 75,7% das amostras. Além disso,
as escolhas do pré-processamento tiveram um impacto pronunciado no
desempenho do modelo, com diferenças de acurácia de até 10,28pp para
configurações apenas com RM e até 11,5pp para pipelines apenas com FDG-PET.
Sob condições ótimas, o FDG-PET superou a RM em 9,13pp em acurácia, de
acordo com a literatura que indica resultados superiores quando essa
modalidade é utilizada. Em geral, os resultados fornecem evidências
quantitativas de que estratégias para aprimorar a transparência, o design
de mecanismos de atenção e as escolhas de pré-processamento desempenham um
papel crucial no desenvolvimento de sistemas de AP confiáveis e
interpretáveis para diagnóstico da doença de Alzheimer, contribuindo para o
avanço da inteligência artificial em aplicações clínicas.