Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/10004
Tipo: Trabalho de Conclusão de Curso
Título: RANDOM FOREST PARA A CLASSIFICAÇÃO DE ESPECTROS LIBS: TÉCNICAS DE NORMALIZAÇÃO E SELEÇÃO DE VARIÁVEIS
Autor(es): ALAN GABRIEL VARELA TARGINO
Primeiro orientador: BRUNO SPOLON MARANGONI
Resumo: Pesquisas recentes evidenciam o uso da técnica LIBS (laser-induced breakdown spectroscopy) para a classificação de materiais nas mais diversas áreas. Na maioria dos casos, essa classificação é realizada por meio de algoritmos de aprendizado de máquina. Nesse sentido, outros trabalhos mostram a eficiência na associação de métodos de normalização, seleção e redução de variáveis com os classificadores que utilizam aprendizado de máquina, dentre eles o Random Forest. O presente trabalho apresenta um protocolo que utiliza técnicas de normalização, seleção e redução de variáveis em associação com o Random Forest na classificação de resíduos de armas de fogo provenientes de munições não tóxicas. Os espectros foram normalizados utilizando Standard Normal Variate, posteriormente foram aplicados a Análise das Componentes Principais e a técnica Boruta, de forma permutada, para reduzir e selecionar variáveis com a finalidade de reduzir a dimensionalidade dos dados e treinar o modelo de classificação Random Forest. Enquanto treinados, os dados foram testados utilizando a validação interna, por meio do método leave-one-out cross-validation e os hiperparâmetros do Random Forest foram otimizados por meio do uso do Grid Search de modo a fornecer a melhor acurácia possível para o modelo. Esse melhor resultado demonstrou uma acurácia de 100% para ambas as formas de validação (interna e externa), evidenciando a eficiência do protocolo desenvolvido.
Abstract: Recent research highlights the use of the LIBS (Laser-Induced Breakdown Spectroscopy) technique for material classification across various fields. In most cases, this classification is carried out using machine learning algorithms. In this regard, other studies show the effectiveness of combining normalization, feature selection, and dimensionality reduction methods with machine learning classifiers, including Random Forest. This study presents a protocol that employs normalization, feature selection, and dimensionality reduction techniques in conjunction with Random Forest for classifying firearm residue from non-toxic ammunition. The spectra were normalized using Standard Normal Variate (SNV), and then Principal Component Analysis (PCA) and the Boruta technique were applied in a permuted fashion to reduce and select features, aiming to reduce data dimensionality and train the Random Forest classification model. While training, the data were tested using internal validation through leave-one-out cross-validation, and the Random Forest hyperparameters were optimized using Grid Search to achieve the best possible accuracy for the model. This optimal result demonstrated 100% accuracy for both internal and external validation, highlighting the effectiveness of the developed protocol.
Palavras-chave: Random Forest
Boruta
Espectroscopia LIBS
Classificação
País: 
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/10004
Data do documento: 2024
Aparece nas coleções:Física - Bacharelado (INFI)

Arquivos associados a este item:
Arquivo TamanhoFormato 
5773.pdf2,64 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.