Fenótipos Profundos: Desenvolvimento de modelos multimodais preditivos para
instabilidade cromossômica no adenocarcinoma gástrico com redes neurais convolucionais em imagens histopatológicas e Random Forest em mutações somáticas
adenocarcinoma gástrico; inteligência artificial na saúde; patologia digital;
classificação molecular; random forest em mutações somáticas.
O câncer gástrico (CG) é um grave problema de saúde pública. Esforços científicos foram
realizados para subclassificar os tipos histopatológicos com base na biologia molecular.
Uma classificação molecular foi proposta pelo TCGA (The Cancer Genome Atlas), utilizando
dados multiômicos, mas a disponibilidade rotineira dessas tecnologias é limitada. É essencial
compreender os padrões moleculares subjacentes para caracterizar com mais precisão o CG e,
assim, avançar em direção a tratamentos personalizados. Paralelamente, foram feitos esforços
para desenvolver modelos de redes neurais convolucionais capazes de reconhecer imagens
histopatológicas de câncer gástrico, tornando amplamente acessíveis modelos preditivos que
direcionem e reduzam os custos dos testes moleculares. A presente tese desenvolve e avalia
modelos preditivos com base na biologia molecular, aprendizado de máquina em dados clínicos
e patológicos, e redes neurais em imagens histopatológicas e dados transcriptômicos, buscando
concatenar essas redes em modelos multimodais. Foram construídos dois datasets de imagens
histopatoógicas rotuladas para a presença ou ausência de instabilidade cromossômica: dataset
geral e dataset controlado para o tipo histopatológico. Isso foi feito para investigar se a extração
de features pelas arquiteturas das redes neurais convolucionais identificaram fenótipos
profundos associados à instabilidade cromossômica. ou apenas classificam por associação indireta
com o tipo histopatológico. Encontrou-se resultados semelhantes entre o treinamento de
diversas arquiteturas com o dataset geral e com o dataset controlado, reforçando a hipótese de
que há fenótipo profundo sendo identificado. Paralelamente a presente investiga a associação
entre mutações somáticas e a presença de instabilidade cromossômica a partir do treinamento
com aprendizado de máquina (Randon Forest) foi identificado que a mutação somática em um
conjunto de genes está associado em maior poder de predição que painel imunoistoquímicos
propostos na literatura. Para a defesa da presente, a concatenação multimodal entre os modelos
de CNN e Random Forest será treinada no dataset geral de imagens histopatológicas e
nas mutações somáticas para apresentar resultados que potencializem ambas as abordagens.