Regressão linear robusta auto-organizada aplicada a dados
intervalares
Análise Simbólica de Dados; Dados de intervalares;
Outliers; Regressão robusta.
Dados simbólicos são tipos de dados complexos e podem ser representados de
diferentes
maneiras, cada uma com suas peculiaridades e aplicações. Dados do tipo
intervalo, por sua
vez, podem ser usados para representar informações imprecisas, como
medições, informações sensíveis, como geolocalização, ou até mesmo como uma
forma de reduzir o tamanho do problema. No contexto da regressão linear de
dados intervalares, podemos ter dois problemas: sensibilidade a dados
discrepantes (outliers) e escolha adequada para a representação dos
intervalos. Para superar essas dificuldades, este artigo propõe um modelo
de regressão robusta para dados intervalares no qual a melhor representação
para os dados intervalares é obtida automaticamente, otimizando um critério
baseado na equação paramétrica da reta e no método dos mínimos quadrados
reponderados. Conjuntos de dados sintéticos e reais são considerados para
validar o desempenho do modelo proposto. Conceitos de outliers de limite
inferior e superior também foram introduzidos, além da métrica MMRE:L para
limites inferiores e MMRE:U para limites superiores.