Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/13053
Registro completo de metadados
Campo DCValorIdioma
dc.creatorMAURÍCIO JORNADA BASTOS-
dc.date.accessioned2025-11-12T22:23:32Z-
dc.date.available2025-11-12T22:23:32Z-
dc.date.issued2025pt_BR
dc.identifier.urihttps://repositorio.ufms.br/handle/123456789/13053-
dc.description.abstractThis study investigates the textual characteristics of news headlines from four major Brazilian news portals—Folha de São Paulo, G1, Jovem Pan, and CNN Brasil—during the 2022 election period. The objective is to identify whether editorial and thematic 'signatures' exist that allow these news sources to be differentiated. Through descriptive analysis, such as term frequency and TF-IDF metrics, distinct patterns in the vocabulary and style of each portal were revealed. Subsequently, a text classification experiment was conducted using language models based on the Transformer architecture. The neuralmind/bert-base-portuguese-cased model, pre-trained for Brazilian Portuguese, proved capable of predicting a news item's source portal with a mean F1-Score of 82.5%, thereby validating the hypothesis that these portals possess distinguishable textual characteristics. The results indicate that, despite common thematic coverage centered on the elections, nuances in editorial focus and linguistic style are sufficient for automatic differentiation, contributing to the field of Natural Language Processing (NLP) applied to media analysis.-
dc.language.isopt_BRpt_BR
dc.publisherFundação Universidade Federal de Mato Grosso do Sulpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectpln-
dc.subjectIA-
dc.subjectciência de dados-
dc.subjectclassificação-
dc.subjectanálise-
dc.subjectsentimento-
dc.subject.classificationEngenharia / Tecnologiapt_BR
dc.titleAnálise de Títulos e Conteúdos Políticos em Portais de Notícias Onlinept_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1VALERIA QUADROS DOS REIS-
dc.description.resumoEste trabalho investiga as características textuais de títulos de notícias de quatro grandes portais brasileiros — Folha de São Paulo, G1, Jovem Pan e CNN Brasil — durante o período eleitoral de 2022. O objetivo é identificar se existem "assinaturas" editoriais e temáticas que permitam diferenciar as fontes de notícia. Por meio de análises descritivas, como a frequência de termos e a métrica TF-IDF, foram revelados padrões distintos no vocabulário e no estilo de cada portal. Subsequentemente, um experimento de classificação de texto foi conduzido, utilizando modelos de linguagem baseados na arquitetura Transformer. O modelo neuralmind/bert-base-portuguese-cased, pré-treinado para o português do Brasil, demonstrou ser capaz de prever o portal de origem de uma notícia com um F1-Score médio de 82,5%, validando a hipótese de que os portais possuem características textuais distinguíveis. Os resultados indicam que, apesar de uma cobertura temática comum centrada nas eleições, nuances no foco editorial e no estilo linguístico são suficientes para uma diferenciação automática, contribuindo para o campo do Processamento de Linguagem Natural aplicado à análise de mídia.pt_BR
dc.publisher.countrynullpt_BR
dc.publisher.initialsUFMSpt_BR
Aparece nas coleções:Engenharia de Computação - Bacharelado (FACOM)

Arquivos associados a este item:
Arquivo TamanhoFormato 
8203.pdf1 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.