Utilizando modelos de Machine Learning para classificar Fake News
de COVID-19
Machine Learning, Grid Search, Análise de Tópicos, Vetorização e
Técnicas de pré processamento
Com a chegada da pandemia de COVID-19 a internet se tornou um meio de co-
municação muito utilizado para divulgação e consumo de informações sobre o que estava
acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece
que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam
com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas
Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser
uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de
Inteligências Artificiais que consigam classifica-las de maneira automática. Para esse fim,
modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de
dados de texto em português do Brasil, foi necessária a criação de um dataset colhendo
textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases
identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com dife-
rentes modelos de Machine Learning comparando diferentes combinações de Features foi
identificado um desempenho superior quando utilizado como modelo o Random Forest