Agrupamento difuso c-means com kernel gaussiano, kernelização
da métrica, cálculo e regularização automática dos parâmetros de largura
agrupamento particional; grupos difusos; kernelização da
métrica de distância; kernel gaussiano; parâmetros de largura;
regularização da entropia
Os algoritmos convencionais de agrupamento difuso c-means baseados no
Kernel gaussiano requerem a seleção de hiperparâmetros de largura, que são
dependentes dos dados e fixos durante a execução completa. Não apenas isso,
mas esses parâmetros são os mesmos para cada variável da base de dados. Ou
seja, as variáveis possuem a mesma importância para o algoritmo de
agrupamento, independente da sua relevância para uma melhor separação. Esta
tese propõe um algoritmo de agrupamento difuso c-means baseados no Kernel
gaussiano com kernelização da métrica de distância e computação automática
dos parâmetros de largura. Esses parâmetros de largura são modificados a
cada iteração do algoritmo e são diferentes para cada variável e grupo.
Dessa forma, esse algoritmo pode re-escalar as variáveis independentemente,
destacando aquelas que são mais relevantes para a atividade de agrupamento.
Algoritmos de agrupamento difuso com regularização se tornaram populares
graças a sua alta performance em dados de agrupamento de larga-escala,
robustez para inicialização, e baixa complexidade computacional. Já que os
parâmetros de largura das variáveis também podem ser controlados pela
entropia, então esta tese também propõe algoritmos de agrupamento difuso
c-means baseados no Kernel gaussiano com kernelização da métrica de
distância e computação automática dos parâmetros de largura a partir da
regularização da entropia.
Para demonstrar a sua utilidade, os algoritmos propostos foram comparados
com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de
Monte Carlo em 7 base sintéticas, utilizando métricas para as partições
exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que
os métodos propostos se comportam de forma competitiva em relação aos
modelos de referência.