PREDIÇÃO MULTIMODAL DO SUBTIPO MOLECULAR DO ADENOCARCINOMA GÁSTRICO: INTEGRANDO VISÃO COMPUTACIONAL HISTOPATOLÓGICA E ALTERAÇÕES GENÔMICAS NA PRÁTICA MÉDICA
adenocarcinoma gástrico; classificação molecular; Redes neurais convolucionais; ensemble multimodal; Variantes somáticas.
O adenocarcinoma gástrico é uma neoplasia altamente heterogênea, classificada em subtipos moleculares pelo The Cancer Genome Atlas (TCGA): instabilidade cromossômica (CIN), instabilidade de microssatélites (MSI), genômica estável (GS) e associado ao vírus Epstein-Barr (EBV). Esses subtipos influenciam prognóstico e terapia, mas métodos diagnósticos convencionais são onerosos e limitados por erros de amostragem. Esta tese investiga a predição desses subtipos por meio de inteligência artificial, integrando visão computacional em imagens histopatológicas (H&E) e dados genômicos, com o objetivo de desenvolver modelos escaláveis para medicina de precisão. Organizada em quatro artigos, a tese utiliza dados do TCGA-STAD para treinamento e validação. No primeiro artigo, ensembles de redes neurais convolucionais (CNNs: MobileNetV2, ShuffleNet e GoogLeNet) foram treinados em tiles de imagens H&E, alcançando precisão macro de 0,79-0,81 e precisão perfeita (1,00) para EBV e MSI, superando abordagens anteriores em classes minoritárias. O segundo artigo testa se CNNs capturam padrões histopatológicos novos para CIN em dataset controlado por morfologia (apenas adenocarcinomas tubulares, OMS-2019), com NASNet-Mobile obtendo AUC-ROC médio >0,70, confirmando predição independente de tipologias conhecidas. O terceiro artigo identifica paineis genéticos com Florestas Aleatórias (Random Forest) e avaliação de influência cooperativa dos genes para predição. Identifica dois paineis com respectivamente 18 e 9 genes. O quarto artigo propõe um modelo denominado G.SUBTGENOVISION com base em ensemble multimodal combinando CNNs (MobileNetV2) com Random Forest em painel de 9 genes mutações somáticas (SNVs); o modelo obteve média macro AUC de 0.94, obtendo AUC-ROC CIN (0.90), EBV (0.96), GS (0.90), MSI (0.98) superior à literatura. Os resultados demonstram que modelos de aprendizado profundo revelam padrões histológicos subjacentes correlacionados a genótipos, melhorando robustez em subtipos e reduzindo barreiras diagnósticas, com potencial para integração em fluxos clínicos, contribuindo para bioinformática oncológica e redução de mortalidade por CG. Palavras-chave: Adenocarcinoma gástrico; Subtipos moleculares TCGA; Redes neurais convolucionais; Ensemble multimodal; Mutações somáticas.