An Experimental Analysis of TCP Congestion Control Algorithms
Within Virtualized Environments
agrupamento particional; grupos difusos; kernelização da
métrica de distância; kernel gaussiano; parâmetros de largura;
regularização da entropia
Os algoritmos convencionais de agrupamento difuso c-means baseados no
Kernel gaussiano requerem a seleção de hiperparâmetros de largura, que são
dependentes dos dados e fixos durante a execução completa. Não apenas isso,
mas esses parâmetros são os mesmos para cada variável da base de dados. Ou
seja, as variáveis possuem a mesma importância para o algoritmo de
agrupamento, independente da sua relevância para uma melhor separação.
Esta tese propõe um algoritmo de agrupamento difuso c-means baseados no
Kernel gaussiano com kernelização da métrica de distância e computação
automática dos parâmetros de largura. Esses parâmetros de largura são
modificados a cada iteração do algoritmo e são diferentes para cada
variável e grupo. Dessa forma, esse algoritmo pode re-escalar as variáveis
independentemente, destacando aquelas que são mais relevantes para a
atividade de agrupamento.
Algoritmos de agrupamento difuso com regularização se tornaram populares
graças a sua alta performance em dados de agrupamento de larga-escala,
robustez para inicialização, e baixa complexidade computacional. Já que os
parâmetros de largura das variáveis também podem ser controlados pela
entropia, então esta tese também propõe algoritmos de agrupamento difuso
c-means baseados no Kernel gaussiano com kernelização da métrica de
distância e computação automática dos parâmetros de largura a partir da
regularização da entropia.
Para demonstrar a sua utilidade, os algoritmos propostos foram comparados
com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de
Monte Carlo em 7 base sintéticas, utilizando métricas para as partições
exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que
os métodos propostos se comportam de forma competitiva em relação aos
modelos de referência.