Modelos de Agrupamento Difuso com Restrições Pareadas para Dados
Relacionais Multivisão
Dados multivisão. Agrupamento difuso. Dados relacionais.
Restrições pareadas. Semi-supervisão.
Apesar da abundante quantidade de trabalhos nos tópicos de agrupamento
semi-supervisionado, multivisão e dados relacionais, separadamente, há
poucos trabalhos feitos considerando todos esses tópicos ao mesmo tempo, ou
seja, métodos de agrupamento semi-supervisionado multivisão para dados
relacionais; apesar de apresentarem resultados promissores que oferecem
vantagens substanciais em relação à abordagens de visão única e multivisão
não supervisionadas.
Nesse contexto, este trabalho propõe diversas famílias de algoritmos de
agrupamento difuso semi-supervisionado multivisão para dados relacionais,
capaz de inferir pesos de relevância para cada visão além de representantes
para cada grupo.
Cada família possui diversas variantes que diferem através do método de
definição do peso das visões e nas restrições impostas nesses pesos;
semi-supervisão se dá através do uso de restrições pareadas must-link e
cannot-link.
Vários experimentos com dados reais foram realizados e mostram que essas
famílias podem oferecer mais robustez do que outros algoritmos da mesma
categoria ao lidar com restrições pareadas, além de prover maior
interpretabilidade dos resultados.
Esses experimentos também revelam que algumas famílias de algoritmos podem
ter uma performance melhor do que outras para um determinado conjunto de
dados; isso também é observado para variantes em uma determinada família.