Deteccao de Fake News utilizando multi-view autoencoders
Detecção de Fake News, Processamento de Linguagem Natural,
Multi-view Learning, Multi-view autoencoder, Sistema de Múltiplos
Classificadores (Multiple Classifier System), Ensemble
Dado o volume e a velocidade com que as fake news se propagam nas redes
sociais, a detecção automática de fake news tornou-se uma tarefa de extrema
importância. No entanto, essa tarefa apresenta diversos desafios, incluindo
a extração de características textuais que contenham informações relevantes
sobre fake news. Pesquisas sobre detecção de fake news mostram que nenhuma
técnica de extração de características supera consistentemente as outras em
todos os cenários. No entanto, diferentes técnicas de extração de
características podem fornecer informações complementares sobre os dados
textuais e possibilitar uma representação mais abrangente do conteúdo.
Este trabalho propõe o uso de multi-view autoencoders para gerar uma
representação conjunta de características para a detecção de fake news,
integrando diversas técnicas de extração de características comumente
utilizadas na literatura. Experimentos em bancos de dados de fake news
mostram uma melhoria significativa no desempenho da classificação em
comparação com representações de características (views) individuais.
Também observamos que selecionar um subconjunto das views, em vez de compor
um espaço latente com todas as views, pode ser vantajoso em termos de
precisão e esforço computacional. Este trabalho também propõe um modelo de
multi-view autoencoder supervisionado, que incorpora os rótulos das
amostras para otimizar seu desempenho. Por meio de análises comparativas,
demonstra-se que a inclusão dos rótulos enriquece o vetor latente gerado
pelo modelo, o que, como consequência, aprimora a detecção de fake news.