Banca de DEFESA: EVERALDO COSTA SILVA NETO

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: EVERALDO COSTA SILVA NETO
DATA : 13/06/2023
HORA: 09:00
LOCAL: Virtual
TÍTULO:

Discovering a Domain-Specific Schema from General-Purpose Knowledge Base


PALAVRAS-CHAVES:

Descoberta de Esquema; Descoberta do Domínio; Representação 
de Entidade; Identificação de Classe; Mineração de Esquema.


PÁGINAS: 108
RESUMO:

Bases de conhecimento de propósito geral, e.g., DBpedia, YAGO e Wikidata, 
armazenam dados factuais sobre um conjunto de entidades. Elas são 
construídas para armazenar conhecimento de múltiplos domínios, e.g., saúde, 
entretenimento, indústria, esportes e artes. A maioria das aplicações que 
utilizam dados de bases de conhecimento de própósito geral são específica 
para um domínio. Alguns tarefas, tais como formulação de consulta e 
extração da informação, requerem um esquema de dados para explorar o 
conteúdo de uma base de conhecimento. Entretanto, declarações específicas 
de esquema não são mandatórias e, algumas vezes, não são fornecidas. 
Portanto, aplicações específicas para um domínio enfrentam dois problemas: 
(1) elas requerem apenas um subconjunto de dados de interesse ao domínio da 
aplicação, mas as bases de conhecimento de propósito geral possuem um 
grande volume de dados factuais em diferentes domínios; e (2) a falta de 
informações relacionadas ao esquema. Nesta tese, endereçamos o problema da 
descoberta de esquema para um domínio específico a partir de bases de 
conhecimento de propósito geral. Especificamente, desenvolvemos ANCHOR, um 
pipeline ponta-a-ponta que tem como objetivo identificar, de maneira 
automática, um conjunto de dados para um domínio específico bem como a sua 
descrição de esquema. ANCHOR é dividido em três etapas: descoberta de 
domínio, identificação de classe e mineração de esquema. Inicialmente, 
ANCHOR extrai um domínio específico explorando os mapeamentos 
categoria-categoria fornecidos pela base de conhecimento. Em seguida, a 
etapa de identificação de classe descobre classes implícitas no conjunto de 
dados. Nesta direção, ANCHOR aprende uma representação para cada entidade 
do conjunto de dados utilizando os mapeamentos entidade-categoria. Essa 
representação é usada para agrupar entidades similares com o objetivo de 
identificar classes de entidades implícitas no conjunto de dados. Por fim, 
a etapa de mineração de esquema constrói o esquema da classe, i.e., 
identifica um conjunto de atributos relavantes que melhor descreve as 
entidades de uma mesma classe. Para isso, ANCHOR executa CoFFee, uma 
abordagem baseada na coocorrência e frequência dos atributos para 
identificar um conjunto de atributos centrais para cada classe descoberta 
na etapa anterior. Realizamos uma extensiva avaliação experimental em 
quatro domínios da DBpedia. Na tarefa de identificação de classe, 
comparamos ANCHOR com baselines tradicionais e baseados em embeedings. Os 
resultados mostraram que, utilizando os algoritmos de agrupamento 
clássicos, a representação de entidade proposta nesta tese superou os 
baselines, mostrando ser eficiente para a tarefa de identificação de 
classe. Na tarefa de mineração de esquema, comparamos CoFFee com duas 
abordagens do estado da arte. Os resultados indicam que CoFFee é eficaz 
para filtrar atributos menos relavantes. Ele seleciona um conjunto de 
atributos centrais mantendo a taxa de recuperação alta e produzindo um 
esquema de alta qualidade para as classes identificadas.


MEMBROS DA BANCA:
Externo à Instituição - ALTIGRAN SOARES DA SILVA - UFAM
Externo à Instituição - ANDRÉ CÂMARA ALVES DO NASCIMENTO - UFRPE
Externo à Instituição - CARLOS EDUARDO SANTOS PIRES - UFCG
Externa à Instituição - DAMIRES YLUSKA DE SOUZA FERNANDES - IFPB
Presidente - 1130534 - FERNANDO DA FONSECA DE SOUZA
Notícia cadastrada em: 25/05/2023 11:04
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2024 - UFRN - sigaa01.ufpe.br.sigaa01