Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/4513
Tipo: Dissertação
Título: FRASEOLOGIA E INFORMÁTICA: CONSTITUIÇÃO DE CORPUS DE COMENTÁRIOS DO TWITTER PARA O ESTUDO DE EXPRESSÕES IDIOMÁTICAS
Autor(es): MARINA LUZ
Primeiro orientador: Elizabete Aparecida Marques
Resumo: Desde as primeiras investigações, os estudos do léxico voltaram-se para as necessidades comunicativas do homem. Considerando, portanto, que os contextos e propósitos comunicativos interferem na seleção léxica dos indivíduos, reitera-se a relação indissociável e contínua entre língua, sociedade e cultura (BARBOSA, 1987, p. 158), na qual, a primeira desenha-se como um fenômeno social de “natureza dinâmica” (BIDERMAN, 1992, p.32) capaz de perpetuar as heranças culturais de um povo. Esse processo de comunicação é cotidianamente potencializado diante das interações propostas pelas redes sociais, ambientes virtuais de confraternização que permitem uma manifestação espontânea e despojada da linguagem, especificidades essas que compartilham o caráter de coloquialidade das unidades fraseológicas da língua, sobretudo as Expressões Idiomáticas (EI). Objeto de estudo deste trabalho, as EI definem-se como estruturas léxicas complexas, plurilexicais, indecomponíveis, de sentido figurado e cristalizadas pela tradição cultural (XATARA, 1998; 2013). Nesse cenário, desenha-se esta pesquisa que, em uma perspectiva geral, objetiva a elaboração de um corpus linguístico de expressões idiomáticas, por meio de um banco de dados de comentários coletados da rede social Twitter. Aliado a esse propósito, de forma específica, realiza-se a elaboração de códigos computacionais que auxiliem as ferramentas para a coleta dos textos que compõe a base de dados, do mesmo modo que, promove-se uma discussão acerca da produtividade de EI, considerando a hipótese de que os usuários que utilizam o Twitter empregam o uso de uma linguagem mais coloquial. A investigação pauta-se nas bases teóricas da Lexicologia, da Fraseologia, da Linguística Computacional e da Linguística de Corpus. A metodologia utilizada nesta pesquisa tem caráter descritivo e quantitativo. Os resultados alcançados montam uma base de dados de coletas diárias de tweets, no período de 6 meses, dezembro de 2020 à maio de 2021, da mesma forma que uma amostra contendo 232 EI, sendo 50% de caráter somático. Além disso, mostraram-se mais produtivas as hashtags “#” com temática relacionada à reality shows e política.
Abstract: Desde las primeras investigaciones, los estudios del léxico se han vuelto hacia las necesidades comunicativas del hombre. Teniendo en cuenta que los contextos y propósitos de comunicación interfieren en la selección léxica de los individuos, se reitera la relación inseparable y continua entre lengua, sociedad y cultura (BARBOSA, 1987, p. 158), en el que primero está diseñado como un fenómeno social de “naturaleza dinámica” (BIDERMAN, 1992, p.32) capaz de perpetuar la herencia cultural de un pueblo. Ese proceso comunicativo se ve potenciado día a día por las interacciones que proponen las redes sociales, entornos virtuales de socialización que permiten una expresión espontánea y despejada del lenguaje, especialmente las locuciones. Objeto de estudio de este trabajo, las locuciones se definen como estructuras léxicas complejas, plurilexicales, indecomponibles, con sentido figurativo y cristalizadas por la tradición cultural (XATARA, 1998). En este escenario, se diseña esta investigación que, en una perspectiva general tiene como objetivo la elaboración de un corpus lingüístico de locuciones, a través de una base de datos de comentarios recolectados de la red social Twitter. Aliado a este propósito, en específico, se lleva a cabo la elaboración de códigos de computacionales para ayudar a las herramientas de software que recolectan los textos de la base de datos, así como una discusión considerando la hipótesis de que los usuarios de Twitter empleen el uso de un lenguaje más coloquial. La investigación se sustenta en las bases teóricas de la Lexicología, Fraseología, Lingüística Computacional y Lingüística de Corpus. La metodología utilizada en esta investigación es descriptiva y cuantitativa. Los resultados obtenidos ensamblan una base de datos de recopilaciones diarias de tweets, durante un período de 6 meses, de diciembre de 2020 a mayo de 2021, así como una muestra que contiene 232 locuciones, las cuáles, el 50% son somáticas. Además, los hashtags “#” con temas relacionados con reality shows y política fueron más productivos.
Palavras-chave: Expressões idiomática
Fraseologia
Linguística Computacional, Informática e Linguística de Corpus
País: Brasil
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/4513
Data do documento: 2022
Aparece nas coleções:Programa de Pós-graduação em Estudos de Linguagens

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Marina Luz - Dissertação de mestrado..pdf3,41 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.