Portal de Programas de Pós-Graduação (UFPE)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPGCC PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS DA COMPUTAÇÃO - CIN CENTRO DE INFORMÁTICA - CIN Telefone/Ramal: Não informado E-mail: Não informado

Banca de DEFESA: JESSICA TAIS DE SOUZA REINALDO

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : JESSICA TAIS DE SOUZA REINALDO
DATA : 29/03/2022
HORA: 09:00
LOCAL: Virtual
TÍTULO:

Using Item Response Theory to evaluate feature relevance in missing

PALAVRAS-CHAVES:

item response theory, model evaluation, missing data,
feature gathering, feature importance

PÁGINAS: 100
RESUMO:

A Teoria de Resposta ao Item (em inglês, Item Response Theory - IRT) tem
sido historicamente usada para avaliar as habilidades latentes de
respondentes humanos a um conjunto de itens.
Recentemente, esforços têm sido feitos para propor soluções que utilizem a
TRI para resolver problemas de classificação, onde os respondentes são
classificadores e os itens são as instâncias de um conjunto de dados.
O β^3-IRT oferece uma ferramenta poderosa para analisar conjuntos de dados
e classificadores, pois formula o problema de TRI com duas variáveis
latentes (2-PL), onde as instâncias são descritas em termos de dificuldade
e discriminação, e os classificadores têm um habilidade associada. A
formulação do β^3-IRT permite utilizar a predição da probabilidade de cada
classificador para cada instância, o que é uma abordagem muito mais rica em
informação do que modelos anteriores que propunham utilizar simplesmente
uma resposta dicotômica, isto é, apenas mapeando erros e acertos de cada
classificador na predição de cada instância.
Uma aplicação possível de TRI em problemas de classificação é utiliza-la
para resolver problemas em que faltam dados no momento do teste.
A falta de dados é um problema desafiador na classificação, principalmente
quando ocorre no momento de teste, ou seja, quando um classificador que já
foi treinado com os dados completos precisa ser usado para fornecer uma
previsão para uma nova instância, para a qual está faltando o valor de
alguma variável. Nesses casos, antes de aplicar o classificador, deve-se
decidir se vale a pena adquirindo o valor real do recurso ou apenas
imputando o valor ausente. A imputação pode
ser uma alternativa melhor, por exemplo, se a coleta de recursos for muito
cara e/ou não se espera que o recurso seja realmente relevante para
melhorar a qualidade do classificador
predição.
Neste trabalho, propomos um workflow onde esses dados faltantes em tempo de
teste são preenchidos com valores imputados com diferentes técnicas de
imputação, baseado nos dados de treinamento disponíveis, a fim de avaliar o
quanto esses dados faltantes podem afetar a habilidade dos classificadores
e a dificuldade e discriminação das instâncias em um conjunto de dados.
Essa abordagem representa uma alternativa às técnicas de seleção de
atributos que é capaz de fornecer uma visão geral da relevância dos
recursos tanto em nível global quanto individualmente para cada instância.
A análise do desempenho de classificadores e como a falta de dados impacta
os modelos e as instâncias do ponto de vista da TRI ainda não foi
investigada na literatura.

MEMBROS DA BANCA:
Externo à Instituição - RAFAEL GOMES MANTOVANI - UTFPR
Presidente - 1512321 - GEORGE DARMITON DA CUNHA CAVALCANTI
Interno - 1463105 - RICARDO BASTOS CAVALCANTE PRUDENCIO

Notícia cadastrada em: 18/03/2022 08:51