Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/13053
Tipo: Trabalho de Conclusão de Curso
Título: Análise de Títulos e Conteúdos Políticos em Portais de Notícias Online
Autor(es): MAURÍCIO JORNADA BASTOS
Primeiro orientador: VALERIA QUADROS DOS REIS
Resumo: Este trabalho investiga as características textuais de títulos de notícias de quatro grandes portais brasileiros — Folha de São Paulo, G1, Jovem Pan e CNN Brasil — durante o período eleitoral de 2022. O objetivo é identificar se existem "assinaturas" editoriais e temáticas que permitam diferenciar as fontes de notícia. Por meio de análises descritivas, como a frequência de termos e a métrica TF-IDF, foram revelados padrões distintos no vocabulário e no estilo de cada portal. Subsequentemente, um experimento de classificação de texto foi conduzido, utilizando modelos de linguagem baseados na arquitetura Transformer. O modelo neuralmind/bert-base-portuguese-cased, pré-treinado para o português do Brasil, demonstrou ser capaz de prever o portal de origem de uma notícia com um F1-Score médio de 82,5%, validando a hipótese de que os portais possuem características textuais distinguíveis. Os resultados indicam que, apesar de uma cobertura temática comum centrada nas eleições, nuances no foco editorial e no estilo linguístico são suficientes para uma diferenciação automática, contribuindo para o campo do Processamento de Linguagem Natural aplicado à análise de mídia.
Abstract: This study investigates the textual characteristics of news headlines from four major Brazilian news portals—Folha de São Paulo, G1, Jovem Pan, and CNN Brasil—during the 2022 election period. The objective is to identify whether editorial and thematic 'signatures' exist that allow these news sources to be differentiated. Through descriptive analysis, such as term frequency and TF-IDF metrics, distinct patterns in the vocabulary and style of each portal were revealed. Subsequently, a text classification experiment was conducted using language models based on the Transformer architecture. The neuralmind/bert-base-portuguese-cased model, pre-trained for Brazilian Portuguese, proved capable of predicting a news item's source portal with a mean F1-Score of 82.5%, thereby validating the hypothesis that these portals possess distinguishable textual characteristics. The results indicate that, despite common thematic coverage centered on the elections, nuances in editorial focus and linguistic style are sufficient for automatic differentiation, contributing to the field of Natural Language Processing (NLP) applied to media analysis.
Palavras-chave: pln
IA
ciência de dados
classificação
análise
sentimento
País: 
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/13053
Data do documento: 2025
Aparece nas coleções:Engenharia de Computação - Bacharelado (FACOM)

Arquivos associados a este item:
Arquivo TamanhoFormato 
8203.pdf1 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.