Banca de DEFESA: JOHNY MOREIRA DA SILVA

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: JOHNY MOREIRA DA SILVA
DATA : 02/03/2023
HORA: 14:00
LOCAL: Virtual
TÍTULO:

Augmenting Product Knowledge Graphs with Subjective Information


PALAVRAS-CHAVES:

Grafos de Produto. Dados Subjetivos. Mineração de Opinião. 
Modelos de Linguagem. Aprendizagem Zero-shot. Supervisão Distante.


PÁGINAS: 110
RESUMO:

Grafos de Produto, do inglês Product Graphs (PGs), são grafos de 
conhecimento com dados sobre produtos de consumo. Atualmente, essas 
estruturas têm se tornado populares devido ao potencial de facilitar 
tarefas de Inteligência Artificial no comércio eletrônico. Os Grafos de 
Produto armazenam dados factuais sobre produtos (ex: smartphones)  e suas 
características (ex: marca, dimensões, e processador) coletados de diversas 
fontes. O enriquecimento dessas estruturas com informações dinâmicas e 
subjetivas, como opiniões de usuários, é essencial para a melhoria das 
tarefas de recomendação, busca, comparação e precificação. No entanto, esta 
é uma nova tarefa e os trabalhos existentes são baseados em abordagens 
supervisionadas. Neste trabalho de tese nós abordamos essa tarefa por meio 
de duas etapas complementares: (1) Nós desenvolvemos uma abordagem 
semi-supervisionada chamada Product Graph enriched with Opinions (PGOpi) 
para enriquecimento de Grafos de Produto com opiniões extraídas de 
avaliações de clientes. Para isso, exploramos um método tradicional de 
mineração de opinião, uma técnica de Supervisão Distante baseada em 
representação de palavras com o objetivo de mitigar a dependência na 
rotulagem manual de dados de treino, e utilizamos Aprendizagem Profunda 
para mapear as opiniões extraídas até os nós do Grafo de Produto; (2) Nós 
construímos um gerador de triplas opinativas chamado SYNthetiC OPinionAted 
TriplEs (SYNCOPATE). Esse gerador pode substituir métodos tradicionais para 
extração pareada de aspectos e opiniões em avaliações de produtos. Para a 
construção do mesmo foi realizado In-Context Learning em um Modelo de 
Linguagem pré-treinado e adaptado. Por último, foi feito o 
pós-processamento do texto gerado, para limpeza e rotulagem automática das 
triplas opinativas. Nós efetuamos a avaliação experimental das duas etapas. 
O PGOpi foi avaliado em cinco categorias de produtos de dois conjuntos de 
dados obtidos de plataformas de comércio eletrônico. O PGOpi alcançou 
valores de micro F1-score superiores a modelos semi-supervisionados mais 
complexos, e também apresentou performance comparável a um modelo de 
estado-da-arte totalmente supervisionado. O SYNCOPATE foi avaliado 
aumentando bases de treino de benchmarking com as triplas opinativas 
geradas sinteticamente. Variações dessas bases de dados rotuladas 
manualmente, geradas sinteticamente e aumentadas foram utilizadas para 
treino de quatro modelos de estado-da-arte de extração pareada de aspectos 
e opiniões. Os resultados obtidos dessa experimentação mostraram que os 
modelos treinados com dados sintéticos apresentaram performance superior 
àqueles treinados em uma pequena porcentagem de dados rotulados e curados 
por humanos. Além disso, três avaliadores humanos realizaram uma inspeção 
manual que atestou a qualidade das triplas geradas sinteticamente.


MEMBROS DA BANCA:
Externo à Instituição - ALTIGRAN SOARES DA SILVA - UFAM
Externo à Instituição - JOSÉ MARIA DA SILVA MONTEIRO FILHO - UFC
Externo à Instituição - LEANDRO BALBY MARINHO - UFCG
Presidente - 1675582 - CLEBER ZANCHETTIN
Interno - 1412012 - FERNANDO MACIANO DE PAULA NETO
Notícia cadastrada em: 15/02/2023 08:21
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2024 - UFRN - sigaa09.ufpe.br.sigaa09