Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/3000
Tipo: Dissertação
Título: Seleção de instâncias baseado em aprendizado de métricas para K Vizinhos Mais Próximos
Autor(es): Max, Eduardo Zárate Guerreiro
Abstract: A seleção de instâncias, em apredizado de máquina, procura identificar instâncias relevantes e remover as instâncias que são redundantes ou prejudiciais do conjunto original. Classificadores baseados em instâncias, como o K Vizinhos Mais Próximos (k-NN), são fortemente beneficiados com esta seleção, podendo prover uma classificação mais rápida, uma diminuição nos requisitos de armazenamento e uma diminuição na sensibilidade ao ruído. Um fundamento essencial a esses algoritmos são as métricas de distância entre os exemplos. Nesse trabalho de mestrado, é proposto um algoritmo de seleção de instâncias com aprendizado de métricas denominado Seleção de Instância sobre Aprendizado de Métrica (Instance Selection on Metric Learning, ISML) para o Classificador K Vizinhos Mais Próximos. O método de aprendizado de métricas, chamado de k-Neighborhood Components Analysis (kNCA), é aplicado ao conjunto de dados para melhorar a seleção e reduzir a relação de compromisso (trade-off ) entre número de instâncias de treino e acurácia. Foram realizados experimentos para comparar métodos tradicionais da literatura de seleção de instâncias. Os resultados são promissores principalmente em cenários de redução extrema de exemplos, redução maior que 50% dos dados originais, onde a proposta ISML obtém melhor ROC AUC em 11 dos 12 conjunto de dados quando comparado com outros três métodos de seleção de instância.
Palavras-chave: Computação
Computer science
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/3000
Data do documento: 2016
Aparece nas coleções:Programa de Pós-graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Eduardo Zárate Guerreiro Max.pdf2,5 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.