PPGEST PROGRAMA DE PÓS-GRADUAÇÃO EM ESTATÍSTICA - CCEN DEPARTAMENTO DE ESTATISTICA - CCEN Telefone/Ramal: Não informado

Banca de DEFESA: DIEGO DA SILVA SANTOS

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : DIEGO DA SILVA SANTOS
DATA : 22/02/2022
HORA: 14:00
LOCAL: videoconferência
TÍTULO:

MODELOS DE REGULARIZAÇÃO COM IMPUTAÇÃO E CURVAS DE DECISÃO APLICADOS A DADOS DE MEDICINA


PALAVRAS-CHAVES:

 Imputação múltipla, Regressão regularizada, Validação cruzada aninhada, Curvas de decisão


PÁGINAS: 73
RESUMO:

Na análise estatística é comum a presença de dados faltantes em muitas aplicações e estudos em inúmeras áreas com especial ênfase a área da saúde. Estudos foram sendo desenvolvidos ao longo da segunda metade do século XX para contornar o problema de dados faltantes dos quais destacam-se os trabalhos de Rubin (1988) e Schafer (1997) em imputação de dados. Além do tratamento do banco de dados e preenchimento dos dados para utilização das técnicas estatísticas de modelagem que em sua grande maioria são restritas a dados completos, outra questão que se levanta após o tratamento dos dados é a técnica estatística mais adequada a ser utilizada para o determinado objetivo inferencial. Na área de análise de regressão os modelos com regularização vem sendo cada vez mais utilizados em problemas de alta dimensão onde tem-se muitas covariáveis a serem estimadas ou problemas de multicolinearidade. Esta dissertação aborda o problema da modelagem de regressão regularizada aplicada aos dados imputados, em especial ao modelo de regressão LASSO para dados multi-imputados conhecida como MI-LASSO (Chen e Wang, 2013), também utiliza-se a técnica de validação cruzada aninhada (Bates, Hastie e Tibshirani, 2021) para obtenção da variância empírica de validação cruzada e intervalos de confiança mais largos para o erro de validação dentro da amostra envolvidos nos modelos de regularização. Desta forma, é proposta uma abordagem utilizando a imputação múltipla através do Bootstrap Bayesiano atrelado ao modelo LASSO com validação cruzada aninhada para correção da estimativa de variância da validação cruzada usual, e busca-se o modelo com melhor poder de predição (ou classificação para problemas envolvendo modelo logístico com variável resposta de interesse dicotômica). Por fim, utiliza-se da metodologia de curvas de decisão proposta por Vickers e Elkin (2006) para a aplicação em dados de Covid-19 com o intuito de propor uma abordagem correta na tomada de decisões de profissionais da saúde em problemas de diagnóstico clínico na presença de dados faltantes.


MEMBROS DA BANCA:
Presidente - 3100567 - PABLO MARTIN RODRIGUEZ
Externa à Instituição - FLORENCIA GRACIELA LEONARDI - USP
Externa à Instituição - TATIANA ANDREA BENAGLIA CARVALHO - UNICAMP
Notícia cadastrada em: 24/01/2022 10:04
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2024 - UFRN - sigaa04.ufpe.br.sigaa04