Um Método para Desambiguação Lexical de Sentidos no Idioma
Português Brasileiro para Tarefas de Processamento de Linguagem Natural
Processamento de Linguagem Natural, Inteligência
Artificial, Desambiguação Lexical de Sentido, Modelos de Linguagens
O Processamento de Linguagem Natural (PLN) e a Inteligência Artificial (IA)
têm avançado significativamente nos últimos anos, possibilitando o
desenvolvimento de diversas tarefas, como tradução automática, sumarização
de textos, análise de sentimentos e análise de discurso. No entanto, ainda
existem desafios a serem superados, como a ambiguidade da linguagem
natural. Um dos problemas causados pela ambiguidade é a dificuldade de
determinar o sentido adequado de uma palavra em um contexto específico. Por
exemplo, a palavra "mouse" pode significar um periférico de computador ou
um animal, dependendo do contexto. Essa limitação pode levar a uma
interpretação semântica incorreta da sentença processada. Nos últimos anos,
os modelos de linguagem (LMs) têm fornecido um novo impulso ao PLN e à IA,
inclusive na tarefa de desambiguação lexical de sentido (DLS). Os LMs são
capazes de aprender e gerar textos, pois são treinados em grandes
quantidades de dados. No entanto, no idioma português, ainda existem poucos
trabalhos sobre DLS usando LMs. Diante deste cenário, este trabalho tem o
objetivo de desenvolver um método para DLS para o idioma português. Para
isso, utiliza o modelo de linguagem BERTimbau, que é específico para o
português. Os resultados serão avaliados utilizando as métricas
estabelecidas na literatura, e também comparados com os trabalhos
relacionados.