Análise de Títulos e Conteúdos Políticos em Portais de Notícias Online

MAURÍCIO JORNADA BASTOS

Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/13053

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	MAURÍCIO JORNADA BASTOS	-
dc.date.accessioned	2025-11-12T22:23:32Z	-
dc.date.available	2025-11-12T22:23:32Z	-
dc.date.issued	2025	pt_BR
dc.identifier.uri	https://repositorio.ufms.br/handle/123456789/13053	-
dc.description.abstract	This study investigates the textual characteristics of news headlines from four major Brazilian news portals—Folha de São Paulo, G1, Jovem Pan, and CNN Brasil—during the 2022 election period. The objective is to identify whether editorial and thematic 'signatures' exist that allow these news sources to be differentiated. Through descriptive analysis, such as term frequency and TF-IDF metrics, distinct patterns in the vocabulary and style of each portal were revealed. Subsequently, a text classification experiment was conducted using language models based on the Transformer architecture. The neuralmind/bert-base-portuguese-cased model, pre-trained for Brazilian Portuguese, proved capable of predicting a news item's source portal with a mean F1-Score of 82.5%, thereby validating the hypothesis that these portals possess distinguishable textual characteristics. The results indicate that, despite common thematic coverage centered on the elections, nuances in editorial focus and linguistic style are sufficient for automatic differentiation, contributing to the field of Natural Language Processing (NLP) applied to media analysis.	-
dc.language.iso	pt_BR	pt_BR
dc.publisher	Fundação Universidade Federal de Mato Grosso do Sul	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	pln	-
dc.subject	IA	-
dc.subject	ciência de dados	-
dc.subject	classificação	-
dc.subject	análise	-
dc.subject	sentimento	-
dc.subject.classification	Engenharia / Tecnologia	pt_BR
dc.title	Análise de Títulos e Conteúdos Políticos em Portais de Notícias Online	pt_BR
dc.type	Trabalho de Conclusão de Curso	pt_BR
dc.contributor.advisor1	VALERIA QUADROS DOS REIS	-
dc.description.resumo	Este trabalho investiga as características textuais de títulos de notícias de quatro grandes portais brasileiros — Folha de São Paulo, G1, Jovem Pan e CNN Brasil — durante o período eleitoral de 2022. O objetivo é identificar se existem "assinaturas" editoriais e temáticas que permitam diferenciar as fontes de notícia. Por meio de análises descritivas, como a frequência de termos e a métrica TF-IDF, foram revelados padrões distintos no vocabulário e no estilo de cada portal. Subsequentemente, um experimento de classificação de texto foi conduzido, utilizando modelos de linguagem baseados na arquitetura Transformer. O modelo neuralmind/bert-base-portuguese-cased, pré-treinado para o português do Brasil, demonstrou ser capaz de prever o portal de origem de uma notícia com um F1-Score médio de 82,5%, validando a hipótese de que os portais possuem características textuais distinguíveis. Os resultados indicam que, apesar de uma cobertura temática comum centrada nas eleições, nuances no foco editorial e no estilo linguístico são suficientes para uma diferenciação automática, contribuindo para o campo do Processamento de Linguagem Natural aplicado à análise de mídia.	pt_BR
dc.publisher.country	null	pt_BR
dc.publisher.initials	UFMS	pt_BR
Aparece nas coleções:	Engenharia de Computação - Bacharelado (FACOM)

Arquivos associados a este item:

Arquivo	Tamanho	Formato
8203.pdf	1 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas