TACKLING VIRTUAL AND REAL CONCEPT DRIFTS VIA ADAPTIVE GAUSSIAN MIXTURE MODEL APPROACHES
Modelo de Mistura Gaussiana, Fluxos de Dados, Mudança de
Conceito Virtual, Mudança de Conceito Real, Entendimento da Mudança.
As aplicações do mundo real têm lidado com uma grande quantidade de
informações, que chegam de forma contínua e sequencialmente ao longo do
tempo, caracterizadas como fluxos de dados. Esse tipo de dado desafia os
algoritmos de aprendizado de máquina devido à mudança de conceito. A
mudança de conceito é uma mudança na distribuição de probabilidade conjunta
do problema e tem duas variações: a mudança virtual que afeta a
distribuição de probabilidade incondicional p(x); e a mudança real que
afeta a distribuição de probabilidade condicional p(y|x). Essas mudanças
podem ocorrer separadamente e simultaneamente e ter impactos diferentes no
desempenho do classificador. Os trabalhos da literatura geralmente não
compreendem bem esses aspectos. Devido a isso, se concentram apenas nas
mudanças reais, por que elas causam degradação direta no desempenho do
classificador. No entanto, desvios virtuais também podem causar essa
degradação de forma indireta. Novas observações podem chegar em uma região
não treinada pelo classificador, forçando-o a confundir sua verdadeira
classe, assim cometendo erros de classificação. O ideal seria ter
classificadores que entendam que tipo de mudança ocorre em determinado
momento para ativar estratégias apropriadas para lidar com este desafio.
Este processo é chamado de entendimento da mudança. Como as abordagens da
literatura não compreendem bem os diferentes impactos causados pelas
mudanças virtuais e reais, o seu desempenho fica limitado. Motivados por
isso, propomos três abordagens para entender o tipo da mudança e usar a
estratégia correta para se adaptar, sendo elas: (i) (GMM-VRD) Gaussian
Mixture Model For Dealing With Virtual and Real Concept Drifts; (ii)
(OGMMF-VRD) On-line Gaussian Mixture Model With Noise Filter For Handling
Virtual And Real Concept Drifts ; e (iii) (GLDD-DU) Gaussian Local Drift
Detector for Drift Understanding. Essas abordagens atualizam e criam
Gaussians on-line para lidar com mudanças virtuais, usam detectores de
mudança para reinicializar o conhecimento do sistema para lidar com
mudanças reais e recuperam modelos do pool para acelerar a adaptação a um
novo conceito. Os principais resultados mostraram que todas as abordagens
apresentam desempenho competitivo, mas o OGMMF-VRD foi mais consistente ao
longo dos conjuntos de dados, apresentando melhor desempenho.