Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
Docking molecular. Interações proteína-proteína. Redes de pseudo-convolução. Random Forests. Descoberta de medicamentos. Afinidade de ligação.
Docking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. O docking molecular é fundamental para a descoberta de novos medicamentos, pois ajuda a identificar possíveis candidatos a fármacos e a compreender os mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de IA e aprendizado de máquina têm melhorado a precisão e eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Foi desenvolvida uma abordagem para a estimativa do encaixe molecular entre proteínas, utilizando uma combinação de redes de pseudo-convolução e Random Forests. Esta abordagem visou melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia inteligente. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas-alvo, fragmentando-as em segmentos menores e capturando informações estruturais cruciais. Subsequentemente, os Random Forests foram utilizados para classificar os vetores resultantes das pseudo-convoluções. A metodologia foi avaliada rigorosamente por meio de experimentos que compararam seus resultados com abordagens tradicionais de encaixe molecular, explorando também as capacidades de generalização e adaptação a diferentes tipos de proteínas e cenários de interações moleculares. Os resultados mostraram que a metodologia apresentou avanços significativos. A redução de 8113 para 11 atributos aumentou a eficiência sem sacrificar a precisão. O modelo Random Forest com 200 árvores destacou-se com acurácia de 99.8%, índice Kappa de 0.997, sensibilidade de 0.997, especificidade de 1.000 e AUC de 1.000. Esses resultados indicam alta eficiência e contribuições significativas para a descoberta de novos medicamentos.