Associação não linear entre variáveis e presença de concurvidade em modelos de regressão semiparamétricos
Correlação. GAMLSS. Multicolinearidade. Simulação Monte Carlo. Teste de permutação.
Este trabalho tem como propósito o estudo e desenvolvimento de medidas para analisar a associação não linear entre variáveis, buscando determinar métodos adequados para medir essas relações, contribuindo tanto para a análise exploratória dos dados quanto para o diagnóstico do modelo de regressão. Neste sentido, algumas medidas de associação entre variáveis contínuas foram consideradas e suas propriedades foram estudadas. Para avaliar a performance das medidas, foi utilizado o teste de permutação, bem como estudos de simulação e análise de dados. Duas das medidas estudadas se destacaram das demais, apresentando ótimo desempenho, embora uma delas tenha um maior custo computacional. Espera-se ainda neste trabalho identificar medidas adequadas para o estudo de associação entre variáveis discretas e qualitativas, estudar e entender quais eventuais problemas essas
relações podem trazer para o ajuste de um modelo de regressão semiparamétrico. Esta ideia pode ser estendida para o contexto dos modelos aditivos generalizados de locação, escala e forma (GAMLSS), nos quais todos os parâmetros podem ser modelados como funções das variáveis explicativas, sendo elas do tipo quantitativas ou qualitativas. Ainda, o trabalho propõe avaliar o impacto causado pela presença de outliers nos métodos de avaliação dessas relações.