Interfaces musicais humano-máquina para reconhecimento de emoções em sinais eletroencefalográficos
Reconhecimento de emoções; EEG; ASTERI; Interfaces cérebro-máquina; Musicoterapia; Demência; Aprendizado de máquina; PSO; Random Forest.
O envelhecimento populacional acelerado no Brasil e no mundo tem intensificado a prevalência de doenças neurodegenerativas, especialmente as demências, como a Doença de Alzheimer. Nesse contexto, terapias não farmacológicas, como a musicoterapia, têm ganhado destaque por sua eficácia na melhora da qualidade de vida, comunicação e bem-estar emocional de pacientes com demência. Contudo, a personalização dos estímulos musicais — essencial para a eficácia da intervenção — enfrenta um desafio crítico: a avaliação subjetiva das respostas emocionais torna-se inviável em indivíduos com comprometimento cognitivo avançado, já que métodos tradicionais (como autorrelato, expressão facial ou análise vocal) perdem confiabilidade. Diante disso, este trabalho propõe o desenvolvimento de uma interface musical cérebro-máquina capaz de reconhecer estados emocionais de forma objetiva e não invasiva, utilizando sinais eletroencefalográficos (EEG) coletados durante atividades autobiográficas com estímulos musicais personalizados. A base de dados utilizada foi coletada por Santana (2023) e inclui 39 participantes — 21 controles cognitivamente saudáveis e 18 com diagnóstico de demência leve a moderada —, totalizando 39 registros de EEG rotulados conforme a valência emocional autoavaliada após o relato autobiográfico RAB2. Para viabilizar a aplicação de técnicas de aprendizado profundo, os sinais de EEG foram convertidos em imagens bidimensionais por meio do método ASTERI (Gomes, 2023), que emprega uma analogia com a tomografia computadorizada para gerar representações espaciais dos sinais multicanal. A partir dessas imagens, foram extraídas características implícitas utilizando uma rede neural convolucional pré-treinada (LeNet, originalmente treinada na base MNIST), resultando em um vetor de 500 atributos por amostra. Foram conduzidos três experimentos metodológicos: a) Experimento A: avaliação comparativa de múltiplos classificadores (Naive Bayes, BayesNet, J48, Random Forest e SVM) sobre a base completa de atributos; b) Experimento B: aplicação da Otimização por Enxame de Partículas (PSO) para seleção de atributos, reduzindo em 81% a dimensionalidade (de 500 para 95 atributos), seguida de nova classificação; c) Experimento C: análise da influência do número de iterações do PSO (20, 50, 100, 150 e 200) na estabilidade do desempenho classificatório. Os resultados demonstraram que o Random Forest com 100 árvores obteve desempenho superior em todos os cenários, com acurácia média de 98,84% ± 0,15 no Experimento A e 98,61% ± 0,56 no Experimento B, mantendo índice Kappa acima de 0,98, sensibilidade e especificidade próximas a 0,98–0,99 e AUC-ROC igual a 1,00. Notavelmente, mesmo após a redução de 80% dos atributos, o desempenho permaneceu estável, evidenciando a robustez da combinação ASTERI + PSO + Random Forest. Além disso, o Experimento C revelou que o número de iterações do PSO não impactou significativamente o desempenho final, com acurácias consistentemente acima de 97% para todos os valores testados, indicando que configurações mais leves (ex.: I = 20) já são suficientes para alcançar resultados ótimos. Este trabalho contribui para a Computação Biomédica ao demonstrar a viabilidade de uma abordagem integrada — baseada em representação imagética de EEG, extração profunda de características e seleção evolucionária de atributos — para o reconhecimento automático de emoções em populações clínicas vulneráveis, com potencial aplicação direta no apoio à personalização de intervenções musicoterapêuticas para idosos com demência.