Métodos Gerais de Controle Paramétrico Eficiente eAuto-Adaptativo para Algoritmos Evolucionários e Baseadosem Enxames
controle paramétrico, inteligência de enxames, computação evolucionária,aprendizagem por reforço, sistemas multi-agente
|
Algoritmos evolucionários e baseados em enxames são métodos de otimização aproximada com inspirações em teorias sobre a evolução das espécies e no comportamento de coletivos animais, respectivamente. Cada algoritmo destas famílias possui um conjunto de parâmetros que ditam o seu comportamento durante o processo de otimização. Uma das maiores dificuldades na utilização destes algoritmos por não-especialistas encontra-se na definição dos valores ótimos destes parâmetros para cada problema, pois é sabido não existir um único conjunto de valores que provoque o melhor comportamento possível do algoritmo em todos os problemas existentes. Os métodos de ajuste paramétrico para algoritmos evolucionários e baseados em enxames podem ser divididos em dois grupos: métodos de tuning, onde os valores dos parâmetros são definidos previamente e permanecem constantes até o fim da execução do algoritmo, normalmente definidos a partir de diversas execuções prévias do algoritmo no problema em mãos (i.e. métodos offline); métodos de controle, onde os valores são variados durante a execução do algoritmo (i.e. métodos online). Ambos os grupos possuem técnicas que removem ou reduzem a necessidade de interferência do usuário na configuração de tais parâmetros. Porém, os algoritmos de controle apresentam a vantagem de poderem definir valores ótimos para cada momento do processo de otimização, o que é sabido ser potencialmente mais eficaz do que definir um valor inicial que permanece constante até o final de sua execução. Apesar dos algoritmos de tuning apresentarem resultados bastante sólidos, o problema de controle paramétrico ainda está longe de ser satisfatoriamente resolvido. Na literatura, costuma-se encontrar muitos métodos que fazem controle de parâmetros específicos para algoritmos específicos. Pouquíssimos são os trabalhos que apresentam métodos gerais, i.e. aplicáveis a qualquer parâmetro ou algoritmo, e ainda assim estes são desenvolvidos através de metodologias que permitem questionar a generalidade da proposta. Um ponto em comum entre estes métodos é a necessidade de um mecanismo robusto para se adaptar a qualquer cenário, demanda normalmente suprida por algoritmos de aprendizagem de máquina. Entre estas abordagens, os resultados mais promissores foram obtidos a partir de algoritmos de aprendizagem por reforço. Porém, a depender do algoritmo utilizado, a adição desta camada de controle pode elevar dramaticamente o custo computacional do sistema como um todo. Portanto, esta pesquisa busca explorar métodos gerais de controle paramétrico eficiente e auto-adaptativo para algoritmos evolucionários e baseados em enxames, através de aprendizagem por reforço com múltiplos agentes. Os múltiplos agentes devem explorar em paralelo o espaço de parâmetros do algoritmo de otimização, abrindo mão ou solicitando recursos computacionais quando necessário. Portanto, o sistema de controle deve ser capaz de escalar automaticamente, de maneira a usar eficientemente os recursos computacionais disponíveis em cada momento do processo de otimização. Além da evidente vantagem da exploração paralela do espaço de busca paramétrico, a troca de informações entre agentes deve permitir que o sistema aprenda melhor e mais rapidamente a controlar de maneira ótima os parâmetros do algoritmo em mãos, aumentando ainda mais o seu poder de otimização.