Associação não-linear entre variáveis e presença de concurvidade em modelos de regressão semi-paramétricos
Correlação. GAMLSS. Multicolinearidade. Simulação Monte Carlo. Teste de permutação.
Neste trabalho, é proposto o uso de algumas medidas para análise de associação não-linear entre observações de variáveis, contribuindo tanto para a análise exploratória, quanto para o diagnóstico do modelo de regressão. Esta ideia pode ser estendida para o contexto dos modelos aditivos generalizados de locação, escala e forma (GAMLSS). Foi conduzida uma análise comparativa do desempenho das medidas em diferentes cenários por meio de estudos de simulação e análises de dados reais. E ainda, foi avaliado a robustez dessas medidas mediante a presença de observações atípicas. Finalmente, foi avaliado o impacto causado pela presença de concurvidade nas estimativas dos parâmetros de modelos da classe GAMLSS via simulação Monte Carlo. As medidas de associação não-linear com melhor desempenho foram utilizadas para a análise exploratória do conjunto de variáveis explicativas dos modelos, apontando para os possíveis problemas causados às estimativas a medida que as relações entre as variáveis torna-se mais significativa. A metodologia apresentada neste trabalho contribui para uma análise mais elaborada do conjunto de variáveis explicativas em modelos semi-paramétricos e não-paramétricos, evitando problemas como concurividade pela inclusão de variáveis altamente associadas.