Otimização de Aspectos do Aprendizado para Lidar com Fluxo de Dados
Aprendizado adaptativo. Fluxo de Dados. Aprendizado Online.
Detecção de Mudança de Conceito. Sinais de Detecção Warning
Muitos desafios de aplicações comerciais envolvem mineração de dados
aplicado a classificação em fluxo de dados. Onde os classificadores são
métodos incrementais de instâncias que aprendem com cada exemplo conforme
chegam e são capazes de lidar com um fluxo teoricamente infinito de
instâncias, suscetível a mudança de conceito, com severas restrições de
tempo de processamento e quantidade de memória, além disso, também precisam
ser capazes de predizer um padrão a qualquer momento. Assim sendo,
diferentes modelos de classificação foram adaptados para manipular fluxos
de dados nessas condições, destacando-se para este trabalho a estratégia de
aprendizado adaptativo aplicado a classificação com detecção, na qual a
adaptação do modelo de aprendizado leva em consideração sinais de detecção
do método de detecção de mudança de conceito. Normalmente, os trabalhos da
literatura de detecção de mudança de conceito escolhem essa estratégia.
Entretanto, é comum nas avaliações de desempenho entre métodos detectores
não fazer distinção entre métodos que consideram dos que não consideram,
sinais de detecção Warning. Neste trabalho, foram analisados os impactos do
sinal de detecção Warning na acurácia de modelos e para isso são fornecidas
evidências empíricas, referências e justificativas para descrever os
efeitos do Warning na acurácia. Deste modo, sendo possível concluir que os
sinais de detecção Warning na maioria das situações analisadas, quando são
omitidos degradam da acurácia Prequential, resultando em diferenças
estatísticas. Baseando-se nesses resultados, foram desenvolvidas duas
estratégias para melhor lidar com os efeitos do sinal de detecção Warning.
Elas possuem mecanismos capazes de garantir que novos modelos sejam
treinados antes de serem testados sem depender dos sinais de detecção
Warning do método de detecção de mudança de conceito. Assim sendo, foi
possível fornecer uma análise aprofundada comparando os impactos dos sinais
de detecção Warning na acurácia Prequential, incluindo um estudo empírico
para comparar várias versões diferentes de métodos de detecção de mudança
de conceito em cada estratégia. Por fim, os experimentos empíricos, tanto
com bases artificiais como reais e os novos algoritmos foram implementados
no framework Massive Online Analysis (MOA) e executados na ferramenta
MOAManager, alcançando resultados promissores nos novos algoritmos.