Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/7774
Tipo: Trabalho de Conclusão de Curso
Título: Análise de Desempenho de Modelos de Embeddings Multilínguas na Classificação de Notícias Falsas
Autor(es): ALISON IURI OGHINO DE MOURA
Primeiro orientador: BRUNO MAGALHAES NOGUEIRA
Resumo: A classificação de notícias falsas introduzem alguns desafios para o Processamento de Linguagem Natural (PLN). Outras representações não-textuais, como text embedding podem influenciar o desempenho das classificações. O objetivo deste trabalho é avaliar esses desempenhos em duas bases de dados textuais, no contexto de classificação de notícias falsas, onde foram aplicados cinco algoritmos de word embedding diferentes e posteriormente classificados por quatro algoritmos de classificação. Nosso trabalho apresenta um desempenho satisfatório para as representações, com destaque do algoritmo Multilingual-E5-large com performance superior aos demais modelos testados. Este trabalho pode contribuir para o entendimento da influência dos algoritmos de word embedding multilíngue no desempenho dos algoritmos de classificação de textos. Os resultados experimentais podem servir como uma referência de desempenho para guiar a utilização desses modelos para classificação de textos em trabalhos similares.
Abstract: The fake news classification introduces some challenges for Natural Language Processing (NLP). Other non-textual representations, such as text embedding, can influence the performance of those classifications. The goal of this work is to evaluate these performances on two corpus databases in the context of fake news classification. Five different word embedding algorithms were applied, and subsequently, the data were classified by four classification algorithms. Our study demonstrates satisfactory performance for the representations, with the Multilingual-E5-large algorithm standing out with superior performance compared to the other tested models. This work may contribute to understanding the influence of multilingual word embedding algorithms on the performance of text classification algorithms. The experimental results can serve as a performance reference to guide the use of these models for text classification in similar studies.
Palavras-chave: word embedding
multilingual word embbeding
análise de desempenho de word embeddings
word embeddings para classificação de fake news brasileiras
word embeddings para classificação de notícias falsas brasileiras
fake news classification
classificação de notícias falsas
País: 
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/7774
Data do documento: 2023
Aparece nas coleções:Sistemas de Informação - Bacharelado (FACOM)

Arquivos associados a este item:
Arquivo TamanhoFormato 
5603.pdf410,14 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.