Espaços de representações hiperbólicos para mergulhos de proteínas
Representation Learning; Geometria Hiperbólica; Redes Neurais; Proteínas.
Aplicamos um método estabelecido de representation learning hiperbólico ao domínio da estrutura de proteínas. Reutilizamos uma técnica proeminente de outra equipe de pesquisa introduzida em (Nickel, Kiela, 2018), a qual trata de usar redes neurais para gerar representações de elementos a partir das similaridades entre eles em espaços hiperbólicos, onde essas representações são ditas embed-dings. Através de nossa adaptação dessa técnica para utilizar dissimilaridades, tratamos de analisar conjuntos de proteínas do Protein Data Bank (PDB) com base em suas distâncias, dadas pela Root Mean Square Deviation (RMSD) entre os pares. Esse processo funciona como um método de redução de dimensionalidade que visa preservar a noção das dissimilaridades estruturais entre as proteínas no espaço de representação, de dimensão muito menor. Demonstramos que essas embbeddings hiperbólicas são mais eficazes para essa tarefa do que os espaços euclidianos tradicionalmente usados. Nossos resultados, quantificados por um score de função de stress mais baixo, mostram que essa abordagem pode reduzir significativamente a distorção representacional inerente aos espaços euclidianos. Isso sugere que a geometria hiperbólica é um espaço ambiente mais natural e preciso para representar estruturas de proteínas.