Um sistema híbrido baseado em combinação de preditores para
previsão de vários passos à frente de séries temporais de taxas de
mortalidade
Sistemas híbridos. Redes neurais artificiais. Aprendizado
profundo. Previsão de múltiplos passos à frente. Previsão de mortalidade.
Prever taxas de mortalidade para múltiplos passos à frente é essencial em
áreas como demografia, seguros e políticas públicas. Os trabalhos de
previsão de taxas de mortalidade com múltiplos passos à frente supõem que
seus resíduos, obtidos pela diferença entre a série temporal e suas
previsões, refletem erros aleatórios e linearmente descorrelacionados no
tempo. No entanto, problemas como má-especificação (i.e., sobreajustes e
subajustes) ou o comportamento dinâmico do fenômeno temporal conduzem a
modelos viesados ou imprecisos, deixando padrões nos resíduos ainda não
modelados. Adicionalmente, prever múltiplos passos à frente em séries
temporais curtas intensifica o desafio. Levando em conta essa problemática,
esta tese propõe um novo sistema híbrido para a previsão de taxas de
mortalidade em vários passos à frente. O sistema proposto é composto de
três etapas: (i) um modelo estatístico linear é usado para prever séries
temporais de taxas de mortalidade; (ii) um modelo de Aprendizado de Máquina
(AM) é empregado para prever os padrões não-lineares dos resíduos de (i); e
(iii) as estimativas da série e dos resíduos são combinadas por uma soma
simples. Para cada conjunto de dados, o sistema seleciona em um pool de
modelos de AM o mais promissor para prever os resíduos. O desempenho de
previsão do sistema proposto foi avaliado por meio de uma análise
experimental, a qual considerou quinze conjuntos de dados disponíveis na
Human Mortality Database (HMD). Esses conjuntos de dados englobaram as
taxas de mortalidade da população total, masculina e feminina de cinco
países: Austrália, Estados Unidos, França, Japão e Portugal, considerando
cento e uma faixas etárias, desde o nascimento até os 100 anos de idade. A
proposta utilizou o modelo Autorregressivo Integrado de Médias Móveis para
prever as séries das taxas de mortalidade e empregou um pool dos modelos
Perceptron de Multicamadas (MLP), Long Short-Term Memory (LSTM) e Neural
basis expansion analysis for interpretable time series (N-BEATS) para
prever os resíduos do preditor linear. O sistema proposto foi comparado com
alternativas da literatura, entre técnicas estatísticas tradicionais,
modelos de AM e sistemas híbridos, utilizando Mean Absolute Percentage
Error (MAPE) e Mean Absolute Scaled Error (MASE) como métricas de
desempenho preditivo. Diante disso, o sistema proposto alcançou uma média
menor que 1,875% e 1,516 para o MAPE e MASE, respectivamente considerando
todos os conjuntos de dados para dez horizontes de previsão. Ainda, os
resultados sugerem que a proposta é promissora, alcançando a melhor
acurácia de previsão dentre todas as alternativas consideradas,
especificamente para o teste Nemenyi Multiple comparisons with the best
(MCB), onde o sistema proposto apresentou o melhor desempenho dentre as
alternativas.