Banca de DEFESA: KARL VANDESMAN DE MATOS SOUSA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : KARL VANDESMAN DE MATOS SOUSA
DATA : 02/06/2022
HORA: 10:00
LOCAL: Virtual
TÍTULO:

Desenvolvimento de base de dados e algoritmo de classificação 
antecipada de exames RT-qPCR para COVID-19


PALAVRAS-CHAVES:

Aprendizagem de Máquina; Classificação Antecipada de Séries 
Temporais; Otimização de Hiperparâmetros; RT-qPCR; COVID-19.


PÁGINAS: 78
RESUMO:

A doença denominada COVID-19, causada pelo vírus SARS-CoV-2, foi a 
responsável por gerar uma pandemia, preocupando diversos órgãos e 
instituições ao redor do mundo de forma a combatê-la e reduzir o seu 
impacto. Um dos fatores importantes para esse combate, é o diagnóstico da 
doença, que deve considerar a assertividade e o tempo levado para sua 
conclu- são. Este trabalho atuou nos dados quantitativos gerados pelo exame 
RT-qPCR, obtidos pela disponibilização feita pelo Núcleo de Pesquisa em 
Inovação Terapêutica (NUPIT) da Universidade Federal de Pernambuco. Os 
arquivos de saída do exame foram filtrados e ajustados de forma a se ter 
uma base de dados disponível para treinamento de algoritmos de aprendizagem 
supervisionada, totalizando 75.716 linhas com 45 características temporais 
(ciclos de máquina) e um alvo a ser classificado como positivo ou negativo. 
Esses dados formam uma série temporal, sendo cada característica um valor 
de fluorescência do processo da reação química do RT-qPCR, de forma a 
detectar genes do SARS-CoV-2. Foram elencados diferentes algoritmos da 
literatura, desde mais genéricos para classificação, a outros mais 
complexos, utilizando comitês, e considerando a ordenação temporal das 
características do problema. Primeiramente, esses algoritmos foram 
treinados com a totalidade dos ciclos, para se ter uma referência do 
desempenho que poderia ser obtido. Posteriormente, foram realizados 
treinamentos com uma redução desse número de ciclos, com o intuito de 
antecipar o exame e consequentemente diminuir o tempo necessário para sua 
conclusão. Para comparar os desempenhos, foram analisadas as métricas AUROC 
(do inglês, Area Under the Receiver Operating Characteristic), acurácia, 
especificidade e sensibilidade, com média e desvio padrão calculadas em 
cima de cem reamostragens da base de dados. Para o cenário de redução de 30 
ciclos, foi realizada a otimização de hiperparâmetros dos três algoritmos 
que se destacaram na etapa anterior: um baseado em redes neurais, MLP 
(Multilayer Perceptron) e dois comitês de classificadores, o XGBoost e o 
Time Series Forest (TSF), sendo que este último considera a relação 
temporal das características. Testes estatísticos realizados indicaram um 
maior desempenho do TSF (AUROC 98,98 ± 0, 07%) e do MLP (98,94 ± 0, 19%) 
para 30 ciclos, uma melhoria de desempenho graças à otimização, mas ainda 
com desempenho inferior ao algoritmo treinado com 35 ciclos com valores 
padrões de hiperparâmetros. Com isso, este trabalho fornece respaldo para a 
redução do tempo do RT-qPCR aplicado para COVID-19, por meio de algoritmos 
de aprendizagem de máquina.


MEMBROS DA BANCA:
Presidente - 1866615 - ADENILTON JOSÉ DA SILVA
Externo à Instituição - ANDRÉ CÂMARA ALVES DO NASCIMENTO - UFRPE
Externo à Instituição - GEORGE GOMES CABRAL - UFRPE
Notícia cadastrada em: 18/05/2022 09:21
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2022 - UFRN - sigaa02.ufpe.br.sigaa02