Clustering-based Dynamic Ensemble Selection for One-Class
Decomposition
Decomposição de uma classe. Sistemas de Múltiplos Classificadores. Seleção Dinâmica de Ensemble.
Uma solução natural para lidar com problemas multiclasse é empregar classificadores multiclasse. No entanto, em situações específicas, como dados desbalanceados ou grande número de classes, é mais eficaz decompor o problema multiclasse em vários problemas mais fáceis de resolver. A decomposição em uma classe é uma alternativa, onde classificadores de uma classe (OCCs) são treinados para cada classe separadamente. No entanto, ajustar os dados de forma otimizada é um desafio para OCCs, principalmente quando os dados apresentam uma distribuição intraclasse complexa. A literatura mostra que sistemas de múltiplos classificadores são inerentemente robustos em tais casos. Assim, a adoção de múltiplos OCCs para cada classe pode levar a uma melhoria na decomposição de uma classe. Com isso em mente, neste trabalho apresentamos dois métodos para classificação de problemas multiclasse através ensembles de OCCs. One-class Classifier Dynamic Ensemble Selection for Multi-class problems (MODES, para abreviar) e Density-Based Dynamic Ensemble Selection (DBDES) fornecem classificadores competentes para cada região do espaço de características, decompondo o problema multiclasse original em vários problemas de uma classe. Assim, cada classe é segmentada e um OCC é treinado para cada cluster. MODES utiliza o algoritmo K-means e um conjunto de índices de validação de cluster enquanto DBDES utiliza o algoritmo OPTICS para a segmentação dos dados. A lógica é reduzir a complexidade da tarefa de classificação definindo uma região do espaço de características onde o classificador deve ser um especialista. A classificação de um exemplo de teste é realizada selecionando dinamicamente um conjunto de OCCs competentes e a decisão final é dada pela reconstrução do problema multiclasse original. Experimentos realizados com 25 bancos de dados, 4 modelos OCC e 3 métodos de agregação mostraram que as técnicas propostas superam a literatura. Quando comparado com o estado da arte, MODES e DBDES obtiveram melhores resultados, principalmente para bancos de dados com regiões de decisão complexas.