Banca de DEFESA: CYNTHIA MOREIRA MAIA

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: CYNTHIA MOREIRA MAIA
DATA : 15/10/2025
HORA: 09:00
LOCAL: Auditorio do CIn - Bloco B (Hibrida)
TÍTULO:

On Multi-Label Meta-Learning for Automated Pipeline Recommendation


PALAVRAS-CHAVES:

Fluxos. Meta-Aprendizagem. Multirrótulo. Aprendizado de Máquina Automatizado.


PÁGINAS: 161
RESUMO:

O Aprendizado de Máquina Automatizado (Automated Machine Learning - AutoML) visa automatizar etapas do processo de aprendizado de máquina, como seleção de algoritmos, pré-processamento e ajuste de hiperparâmetros. Um de seus principais desafios é projetar um espaço de busca que atenda a diferentes problemas, garantindo a melhor relação entre desempenho e custo computacional. As abordagens tradicionais de AutoML exploram principalmente o espaço de busca em tempo de execução (online), aplicando estratégias de otimização como a Otimização Bayesiana para encontrar a melhor configuração dentro de um prazo determinado. Embora eficazes, tais estratégias frequentemente resultam em altos custos computacionais. Em contraste, nossa proposta busca evitar estratégias de busca online empregando meta-aprendizado para abordar tais desafios. Essa abordagem utiliza as meta-características dos problemas para recomendar soluções apropriadas à sua natureza, eliminando assim a necessidade de busca exaustiva em tempo de execução. Dessa forma, propomos o MetaML, primeiro estudo desta tese, uma abordagem de meta-aprendizado baseada em algoritmos multirrótulos para recomendação de pipelines em AutoML. Para tanto, apresentamos um projeto de espaço de busca com curadoria que reduz automaticamente o número de pipelines candidatos, com base em dados históricos de repositórios online, incluindo apenas os pipelines mais utilizados e com melhor desempenho em um número significativo de conjuntos de dados. Além disso, propomos recomendações encadeadas usando algoritmos multirrótulos que consideram as interdependências entre as etapas do pipeline. Experimentos em diferentes conjuntos

de dados demonstram a eficácia da abordagem, com o MetaML alcançando resultados satisfatórios e, em alguns casos, resultados superiores a um custo computacional menor do que os métodos AutoML atuais. No entanto, os pipelines derivados dos experimentos do repositório online apresentaram pouca representatividade em relação ao uso de técnicas de pré-processamento. Como alternativa, propomos o meta-dataset PIPES, o segundo estudo da tese, que consiste em uma coleção de experimentos envolvendo múltiplos pipelines, projetados para representar todas as combinações selecionadas de técnicas incluindo diferentes blocos de pré-processamento e um bloco de classificação. Após a construção do PIPES, utilizamos este meta-dataset no terceiro estudo da tese, o MetaML 2.0, para verificar se é possível obter resultados ainda melhores com uma representatividade mais ampla dos pipelines. Os experimentos demonstraram que, de fato, a abordagem proporcionou desempenhos melhores em determinados conjuntos de dados.


MEMBROS DA BANCA:
Externo à Instituição - SYLVIO BARBON JUNIOR - OUTRA
Externo à Instituição - ALCEU DE SOUZA BRITTO JÚNIOR - PUCPR
Externo à Instituição - RAFAEL GOMES MANTOVANI - UTFPR
Interno - 1463105 - RICARDO BASTOS CAVALCANTE PRUDENCIO
Presidente - 1511095 - TSANG ING REN
Notícia cadastrada em: 17/09/2025 08:53
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2025 - UFRN - sigaa03.ufpe.br.sigaa03