Use este identificador para citar ou linkar para este item:
https://repositorio.ufms.br/handle/123456789/7429
Tipo: | Trabalho de Conclusão de Curso |
Título: | Melhoria dos Processos de Classificação Espectral: Um Estudo sobre Redes Neurais, Técnicas de Normalização e Seleção de Variáveis |
Autor(es): | MURILO NECO SARAIVA |
Primeiro orientador: | BRUNO SPOLON MARANGONI |
Resumo: | Nos últimos anos, diversos estudos utilizando a espectroscopia FTIR e a análise multivariada foram realizados. Seus resultados mostram a eficiência, viabilidade, precisão e potencial do método em identificar padrões complexos, classificar e discriminar amostras e automatizar processos. O presente trabalho apresenta uma metodologia que envolve o uso de técnicas de normalização, seleção de variáveis e redes neurais para a identificação de polimorfismos de nucleotídeo único no DNA de bovinos (homozigoto ou heterozigoto). Os dados espectrais foram pré-processados utilizando Variável Normal Padrão e derivadas de primeira e segunda ordem. Análise de Componentes Principais e Boruta foram aplicadas como técnicas de redução de dimensionalidade e seleção de variáveis para alimentar a rede neural. Técnicas de validação interna utilizando validação cruzada leave-one-out foram utilizadas. Otimização dos hiperparâmetros do classificador com base na melhora da acurácia e validação externa foi aplicada para averiguar a robustez do modelo. O melhor resultado obtido demonstrou uma acurácia de validação interna de 95,33% e validação externa de 98%, que é melhor do que a acurácia interna de 90% obtida pela metodologia de RIOS et. al para as mesmas classes. Isso corrobora para o uso do método para a melhoria de processos de classificação. |
Abstract: | In recent years, several studies using FTIR spectroscopy and multivariate analysis have been carried out. Their results show the efficiency, feasibility, accuracy, and potential of the method in identifying complex patterns, classifying and discriminating samples, and automating processes. This paper presents a methodology that involves the use of normalization techniques, variable selection, and neural networks for the identification of single nucleotide polymorphisms in bovine DNA (homozygous or heterozygous). The spectral data were pre-processed using the Standard Normal Variate and first and second order derivatives. Principal Component Analysis (PCA) and Boruta were applied as dimensionality reduction techniques and variable selection to feed the neural network. Internal validation techniques using leave-one-out cross validation were used. Optimization of the classifier’s hyperparameters based on improving accuracy and external validation was applied to verify the robustness of the model. The best result demonstrated an internal validation accuracy of 95.33% and external validation of 98%, which is better than the 90% accuracy obtained by the RIOS et. al. methodology for the same classes. This corroborates the use of the method for improving classification processes. |
Palavras-chave: | Espectroscopia FTIR Análise Multivariada Aprendizado de Máquina Classificação |
País: | |
Editor: | Fundação Universidade Federal de Mato Grosso do Sul |
Sigla da Instituição: | UFMS |
Tipo de acesso: | Acesso Aberto |
URI: | https://repositorio.ufms.br/handle/123456789/7429 |
Data do documento: | 2023 |
Aparece nas coleções: | Física - Bacharelado (INFI) |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
5772.pdf | 1,3 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.