Banca de DEFESA: FRANCIMARIA RAYANNE DOS SANTOS NASCIMENTO

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: FRANCIMARIA RAYANNE DOS SANTOS NASCIMENTO
DATA : 12/03/2024
HORA: 10:00
LOCAL: Virtual
TÍTULO:

Hate Speech Detection and Gender Bias Mitigation on Online Social Media


PALAVRAS-CHAVES:

Detecção de discurso de ódio. Ensemble learning. Viés de gênero.
Multi-view. Redes sociais.


PÁGINAS: 128
RESUMO:

A popularização das redes sociais online permitiu a rápida proliferação de conteúdos gerados pelos usuários. A grande quantidade de conteúdo gerado a cada segundo nas plataformas de redes sociais torna a moderação adequada do seu conteúdo árdua e demorada, resultando numa fácil disseminação do discurso de ódio. Embora tenham sido feitos avanços significativosna detecção automática de discurso de ódio, preocupações têm surgido a cerca da robustez demodelos de aprendizagem de máquina e o seu impacto devido aos seus comportamentos potencialmente tendenciosos, levando a tendências questionáveis baseadas em termos de identidade (por exemplo, mulheres, negros ou gay). Nesta tese, abordamos o viés nãointencional, especificamente o viés de gênero não intencional (unintended gender bias), na
tarefa de detecção de discurso de ódio.
No Capítulo 2, é realizado um estudo abrangente do discurso de ódio, incluindo uma análise
crítica das definições do termo discurso de ódio propostas em múltiplas plataformas e na
comunidade científica. Além disso, é apresentada uma visão geral das principais abordagens
geralmente utilizadas na detecção automática de discurso de ódio. Os resultados apresentam
uma análise crítica dos recursos teóricos e práticos, discutindo oportunidades nesta área e
diversos desafios, incluindo questões como o viés (bias).
No Capítulo 3, é proposta uma nova metodologia que utiliza um multi-view ensemble para a
deteção automática de discurso de ódio e a mitigação do viés não intencional de gênero. A
metodologia proposta consiste em dois módulos: (1) um módulo de mitigação do viés de
gênero baseado na detecção e substituição de palavras sensíveis ao viés e (2) um módulo de
detecção de discurso de ódio usando um classificador multi-view stacked. O classificador
multi-view stacked combina classificadores básicos treinados com representações de features
distintas. Resultados experimentais em quatro conjuntos de dados de benchmark demonstram
a eficácia da abordagem proposta em comparação com soluções de última geração, reduzindo
o viés não intencional sem comprometer o desempenho do modelo.
Finalmente, no Capítulo 4, é proposta uma estrutura para ajudar a analisar o comportamento
tendencioso das técnicas de extração de características. Além disso, foi projetado um novo
conjunto de dados abrangente para ajudar na avaliação do viés de gênero não intencional,
denominado Unbiased dataset. Conduzimos um estudo experimental sobre vários métodos de
extração de recursos de última geração, com foco em seu potencial viés em relação aos termos
de identidade. Nossas descobertas indicam que a técnica de extração de características pode
influenciar o viés encontrado no modelo final, e sua eficácia pode depender do conjunto de
dados analisado.


MEMBROS DA BANCA:
Externa à Instituição - CAROLINA SCARTON - OUTRA
Externa à Instituição - LILIAN BERTON - UNIFESP
Externa à Instituição - MIRELLA MOURA MORO - UFMG
Externo à Instituição - RAFAEL MENELAU OLIVEIRA E CRUZ - OUTRA
Presidente - 1511095 - TSANG ING REN
Notícia cadastrada em: 21/02/2024 09:31
SIGAA | Superintendência de Tecnologia da Informação (STI-UFPE) - (81) 2126-7777 | Copyright © 2006-2024 - UFRN - sigaa11.ufpe.br.sigaa11