Use este identificador para citar ou linkar para este item:
https://repositorio.ufms.br/handle/123456789/7774
Tipo: | Trabalho de Conclusão de Curso |
Título: | Análise de Desempenho de Modelos de Embeddings Multilínguas na Classificação de Notícias Falsas |
Autor(es): | ALISON IURI OGHINO DE MOURA |
Primeiro orientador: | BRUNO MAGALHAES NOGUEIRA |
Resumo: | A classificação de notícias falsas introduzem alguns desafios para o Processamento de Linguagem Natural (PLN). Outras representações não-textuais, como text embedding podem influenciar o desempenho das classificações. O objetivo deste trabalho é avaliar esses desempenhos em duas bases de dados textuais, no contexto de classificação de notícias falsas, onde foram aplicados cinco algoritmos de word embedding diferentes e posteriormente classificados por quatro algoritmos de classificação. Nosso trabalho apresenta um desempenho satisfatório para as representações, com destaque do algoritmo Multilingual-E5-large com performance superior aos demais modelos testados. Este trabalho pode contribuir para o entendimento da influência dos algoritmos de word embedding multilíngue no desempenho dos algoritmos de classificação de textos. Os resultados experimentais podem servir como uma referência de desempenho para guiar a utilização desses modelos para classificação de textos em trabalhos similares. |
Abstract: | The fake news classification introduces some challenges for Natural Language Processing (NLP). Other non-textual representations, such as text embedding, can influence the performance of those classifications. The goal of this work is to evaluate these performances on two corpus databases in the context of fake news classification. Five different word embedding algorithms were applied, and subsequently, the data were classified by four classification algorithms. Our study demonstrates satisfactory performance for the representations, with the Multilingual-E5-large algorithm standing out with superior performance compared to the other tested models. This work may contribute to understanding the influence of multilingual word embedding algorithms on the performance of text classification algorithms. The experimental results can serve as a performance reference to guide the use of these models for text classification in similar studies. |
Palavras-chave: | word embedding multilingual word embbeding análise de desempenho de word embeddings word embeddings para classificação de fake news brasileiras word embeddings para classificação de notícias falsas brasileiras fake news classification classificação de notícias falsas |
País: | |
Editor: | Fundação Universidade Federal de Mato Grosso do Sul |
Sigla da Instituição: | UFMS |
Tipo de acesso: | Acesso Aberto |
URI: | https://repositorio.ufms.br/handle/123456789/7774 |
Data do documento: | 2023 |
Aparece nas coleções: | Sistemas de Informação - Bacharelado (FACOM) |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
5603.pdf | 410,14 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.