Portal de Programas de Pós-Graduação (UFPE)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPGCC PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS DA COMPUTAÇÃO - CIN CENTRO DE INFORMÁTICA - CIN Teléfono/Ramal: No informado E-mail: No informado

Banca de DEFESA: FELIPE BEZERRA MARTINS

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: FELIPE BEZERRA MARTINS
DATA : 27/09/2023
HORA: 08:00
LOCAL: Virtual
TÍTULO: Exploring Multi-Agent Deep Reinforcement Learning In IEEE Very
Small Size Soccer

PALAVRAS-CHAVES:

Aprendizado por Reforço. Robótica. Sistemas Multiagentes

PÁGINAS: 86
RESUMO:

O futebol de robôs é considerado um excelente exemplo de ambiente
multiagente dinâmico e cooperativo, pois pode demonstrar uma variedade de
complexidades. A aprendizagem por reforço é uma técnica promissora para
otimizar a tomada de decisões nestes sistemas complexos, pois obteve
recentemente grande sucesso devido aos avanços nas redes neurais profundas,
como mostrado em problemas como direção autônoma, jogos e robótica; em
sistemas multiagentes, a pesquisa de aprendizagem por reforço está
enfrentando desafios como cooperação, observabilidade parcial, execução
descentralizada, comunicação e dinâmicas complexas. Em tarefas difíceis,
modelar o problema completo no ambiente de aprendizagem pode ser muito
desafiador para os algoritmos resolverem; podemos simplificar o ambiente
para permitir a aprendizagem, contudo, as políticas aprendidas em ambientes
simplificados geralmente não são ideais no ambiente completo. Este estudo
explora se a aprendizagem profunda por reforço multiagente supera as
contrapartes de agente único em um ambiente de futebol de robôs da
categoria IEEE Very Small Size Soccer, uma tarefa que apresenta um problema
desafiador de cooperação e competição com duas equipes frente a frente,
cada uma com três robôs; Investigamos a eficácia de diversos paradigmas de
aprendizagem em alcançar o objetivo central de realizar gols, avaliando a
cooperação, comparando os resultados de paradigmas multiagentes e de agente
único. Os resultados indicam que as simplificações introduzidas no ambiente
de aprendizagem para facilitar a aprendizagem podem diminuir a importância
da cooperação e introduzir vieses, conduzindo o processo de aprendizagem
para políticas conflitantes e desalinhadas com o desafio original.

MEMBROS DA BANCA:
Externo à Instituição - MARCOS RICARDO OMENA DE ALBUQUERQUE MAXIMO - ITA
Interno - 1710187 - HANSENCLEVER DE FRANCA BASSANI
Presidente - 1511095 - TSANG ING REN

Notícia cadastrada em: 13/09/2023 09:12