DiagNose.AI: A Novel Explainable Artificial Intelligence Framework
for the Identification of Candida spp. from Volatile Organic Compounds
using Electronic Noses
Análise de Séries Temporais, Biomarcadores, Compostos Orgânicos Voláteis, E-noses, Infecções por Candida spp., Inteligência Artificial Explicável, Narizes Eletrônicos.
As infecções fúngicas, especialmente as causadas por Candida spp., representam um desafio crítico em unidades de terapia intensiva, estando associadas a elevadas taxas de mortalidade (40–60%). Esse cenário é agravado pela lentidão e pela baixa sensibilidade (∼50%) do atual padrão-ouro de diagnóstico, a hemocultura. Com o objetivo de superar essas limitações, esta tese propõe, desenvolve e valida um novo Framework para a identificação de microrganismos a partir da análise de Compostos Orgânicos Voláteis (VOCs). Essa abordagem estabelece um fluxo de trabalho sistemático que contempla: (i) o desenvolvimento de um protocolo para experimentação e aquisição de dados com Narizes Eletrônicos (E-nose); (ii) a construção e preparação de bases de dados de VOCs de Candida, tanto com isolados de cultura quanto em caldo de sangue; (iii) a aplicação e avaliação de modelos de classificação tradicionais e de séries temporais; e (iv) a concepção de uma arquitetura pioneira de explicabilidade (XAI) baseada em um ensemble de técnicas, voltada a assegurar a transparência das predições. A eficácia do Framework foi validada na diferenciação de espécies de Candida em diferentes contextos, incluindo cultura e caldo de sangue. Os resultados atestam a robustez da abordagem, com os modelos de classificação alcançando acurácias de 97,46% na abordagem com cultura e 98,18% no contexto com caldo de sangue. Nesse sentido, a principal contribuição desta tese é a criação de um framework computacional que integra uma arquitetura inédita de Ensemble de explicabilidade, baseada na combinação de múltiplos métodos, a fim de fornecer interpretações consistentes e multifacetadas das decisões do modelo. A validação dessa abordagem, por meio de estudos de ablação e sensibilidade, confirma seu potencial para aumentar a confiança nos resultados e favorecer a adoção clínica da solução. Assim, o Framework consolida-se como uma contribuição metodológica significativa para a ciência da computação, com impacto direto e relevante na saúde.