Portal de Programas de Pós-Graduação (UFPE)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPGCC PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS DA COMPUTAÇÃO - CIN CENTRO DE INFORMÁTICA - CIN Teléfono/Ramal: No informado E-mail: No informado

Banca de DEFESA: BEATRIZ BEZERRA DE SOUZA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: BEATRIZ BEZERRA DE SOUZA
DATA : 15/02/2023
HORA: 16:00
LOCAL: Virtual
TÍTULO: Learning to Detect Text-Code Inconsistencies with Weak and Manual
Supervision

PALAVRAS-CHAVES:

detecção de inconsistência; pré-treinamento; afinamento.

PÁGINAS: 42
RESUMO:

O código-fonte geralmente está associado a um resumo em linguagem natural, permitindo
que os desenvolvedores entendam o comportamento e a intenção do código. Por exemplo, comentários em nível de método resumem o comportamento de um método e descrições de teste resumem a intenção de um caso de teste. Infelizmente, o texto e seu código correspondente às vezes são inconsistentes, o que pode atrapalhar a compreensão do código, a reutilização do código e a manutenção do código. Propomos TCID, uma abordagem para Detecção de Inconsistência de Código e Texto, que treina um modelo neural para distinguir pares de texto-código consistentes de inconsistentes. Nossa principal contribuição é combinar duas formas de treinar tal modelo. Primeiro, o TCID executa pré-treinamento fracamente supervisionado com base em grandes quantidades de exemplos consistentes extraídos do código como está e exemplos inconsistentes criados pela recombinação aleatória de pares texto-código. Em seguida, o TCID faz o ajuste fino no modelo baseado em um conjunto pequeno e curado de exemplos rotulados manualmente. Esta combinação é motivada pela observação de que a supervisão fraca por si só leva a modelos que generalizam mal a inconsistências do mundo real. Nossa avaliação
aplica o procedimento de treinamento em duas etapas a quatro modelos de última geração e avalia-os em dois problemas de texto versus código: 40.7K comentários em nível de método verificados em relação ao corpo do método Java correspondente e—como um problema não considerado em trabalhos anteriores—338.8K as descrições dos casos de teste são verificadas em relação às implementações JavaScript correspondentes. Nossos resultados mostram que uma pequena quantidade de rotulagem manual permite que a eficácia da abordagem melhore significativamente, superando o estado da arte atual e melhorando a pontuação de F1 em 5% em Java e em 17% em JavaScript. Validamos a utilidade das previsões do TCID por envio de pull requests, dos quais 10 foram aceitos até o momento.

MEMBROS DA BANCA:
Externo à Instituição - MICHAEL PRADEL
Presidente - 1114746 - LEOPOLDO MOTTA TEIXEIRA
Interno - 1670589 - MARCELO BEZERRA D AMORIM

Notícia cadastrada em: 24/01/2023 10:26