Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/5061
Tipo: Dissertação
Título: Uma Abordagem Baseado em Ranking para a Predição de Evasão Escolar: Um Estudo de Caso na Universidade Federal de Mato Grosso do Sul
Autor(es): Gregorio Takashi Higashikawa
Primeiro orientador: Rafael Geraldeli Rossi
Resumo: A evasão acadêmica é um problema discutido em várias instituições de ensino, pois acarreta um dispêndio para a instituição e um grande prejuízo educacional para o aluno. Além disso, causas definidas por meio de percepções humanas podem estar incorretas e consequentemente levar à ações preventivas incorretas. Por outro lado, observa-se o emprego com sucesso de técnicas de mineração de dados em diversas instituições de ensino no Brasil e no mundo para a extração automática de hipóteses, e a geração de modelos para classificar se um aluno tem propensão para evadir ou não. O uso da classificação neste cenário pode gerar resultados não satisfatórios, principalmente quando a confiança de classificação entre as classes evasão e não evasão são próximas. Outro ponto a considerar é quando existe um desbalanceamento entre as classes, conhecido por gerar modelos de classificação inacurado na classe minoritária. Ademais, as causas de evasão podem variar de acordo com a localidade e curso. Como alternativa, classificar instâncias de testes baseada em sua propensão à pertencer à uma determinada classe significativa e ranqueando-as, direcionaria esforço de forma mais precisa aos alunos com maior chance de evasão. Dado isso, este trabalho apresenta um método para detecção de evasão baseado em ranking e tem como conjunto de treinamento os dados dos históricos escolares dos alunos. É então avaliado se a evasão ocorre nos top alunos ranqueados com potencial de evasão. Ademais, o método foi empregado em diferentes cursos e diferentes áreas do conhecimento da Universidade Federal de Mato Grosso do Sul (UFMS) para avaliar o seu comportamento em diferentes cenários. Os resultados mostram uma precisão de 0, 97, 0, 99 e 0, 98 para os 50 primeiros alunos ranqueados das áreas de ciências Exatas, Biológicas e Humanas. E para os 10 primeiros a precisão foi de 0, 99 à 1, 0. Por outro lado, com o uso de modelos de classificação, os resultados obtidos foram de 0,72, 0,79, 0,78 na acurácia e 0,68, 0,65, 0,64 para a precisão. Vale ressaltar que apesar da avaliação do ranking englobar apenas os top-k alunos da classe de evasão, a assertividade na classificação faz com que os esforços sejam mais bem direcionados e esperançosamente mais efetivos. Com isso, dada a previsão assertiva do método proposto para os alunos com maior potencial de evasão, os interessados poderão aplicar estratégias mais eficientes no contensão à evasão.
Abstract: Academic dropout is a problem discussed in several educational institutions, as it entails an expense for the institution and a significant educational loss for the student. In addition, causes defined by human perceptions can be incorrect and consequently lead to wrong preventive actions. On the other hand, the successful use of data mining techniques is observed in several educational institutions in Brazil and in the world for the automatic extraction of hypotheses and the generation of models to classify whether a student has a propensity to drop out or not. The use of classification in this scenario can generate unsatisfactory results, especially when the classification confidence between the evasion and non-evasion classes are close. Another point to consider is when there is an imbalance between classes, known to generate inaccurate classification models in the minority class. In addition, the causes of dropout may vary by location and course. Alternatively, ranking test instances based on their propensity to belong to a certain meaningful class and ranking them would more precisely direct effort to students most likely to drop out. Given that, this work presents a method for detecting dropout based on ranking and having as a training set the data from students’ school records. It is then evaluated whether dropout occurs in the top ranked students with dropout potential. Furthermore, the method was used in different courses and different areas of knowledge at the Federal University of Mato Grosso do Sul (UFMS) to evaluate its behavior in different scenarios. The results show an accuracy of 0.94, 0.98 and 0.96 for the first 50 ranked students in the exact, biological and humanities areas. And for the first 10 the precision was from 0.99 to 1.0. On the other hand, with the use of classification models, the results obtained were 0.72, 0.79, 0.78 for accuracy and 0.68, 0.65, 0.64 for precision. It is worth mentioning that despite the ranking evaluation only encompassing the top-k students in the dropout class, the assertiveness in the classification makes the efforts better targeted and hopefully more effective. Therefore, given the assertive prediction of the proposed method for students with greater dropout potential, those interested will be able to apply more efficient strategies to combat dropout.
Palavras-chave: Mineração de dados, ranking, evasão, universidade pública
País: Brasil
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Restrito
URI: https://repositorio.ufms.br/handle/123456789/5061
Data do documento: 2022
Aparece nas coleções:Programa de Pós-graduação em Computação Aplicada

Arquivos associados a este item:
Não existem arquivos associados a este item.


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.