Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/11947
Tipo: Tese
Título: MODELOS DE APRENDIZADO DE MÁQUINA PARA PREDIÇÃO DA PROTEÍNA BRUTA DE PASTOS DE CAPIM-TAMANI: DESENVOLVIMENTO, AVALIAÇÃO E INTERPRETABILIDADE COM A TÉCNICA SHAP
Autor(es): GABRIELA OLIVEIRA DE AQUINO MONTEIRO
Primeiro orientador: Gelson dos Santos Difante
Resumo: RESUMO MONTEIRO, G.O.A. Modelos de aprendizado de máquina para predição da proteína bruta de pastos de capim-tamani: desenvolvimento, avaliação e interpretabilidade com Shap. 2025. Tese (Doutorado) - Faculdade de Medicina Veterinária e Zootecnia, Universidade Federal de Mato Grosso do Sul, Campo Grande, MS, 2025. Conhecer a qualidade da forragem é essencial para atender às exigências dos animais e otimizar a produção. Os métodos tradicionais para aferir o valor nutritivo do pasto são destrutivos, onerosos e demorados. Modelos de aprendizado de máquina (AM) tem sido utilizado em tarefas de predição na agropecuária. No entanto, compreender como o modelo faz uma predição é tão importante quanto predizer. O estudo teve como objetivos: i) testar a aplicabilidade de modelos de aprendizado de máquina com dados tabulares como variáveis climáticas, interceptação de luz (IL), doses de nitrogênio (N), intervalos entre pastejo (IEP) e alturas de pré (ALTpre) e pós-pastejo (ALTpos) para predição do teor de proteína bruta das folhas (PB) de pastos de capim-tamani; ii) utilizar a técnica SHAP para interpretar como essas variáveis atuam no modelo XGBoost. Foi utilizado um banco de dados robusto coletado de área de pastagem formada com capim-tamani manejado intensivamente no bioma Cerrado brasileiro de outubro de 2020 a abril de 2022. O conjunto de dados foi composto por 90 instâncias com 80% para treino e validação e 20% para teste com validação cruzada com 5 folds e 100 iterações. Os hiperparâmetros foram ajustados com grid-search no conjunto de treino. Foram testados Regressão Linear (RL), Multilayer Perceptron (MLP), Decision Trees (DT), Random Forest (RF) e XGBoost. A técnica Shapley Additive Explanations (SHAP) foi utilizada para entender a força e direção de cada variável na predição do modelo. As métricas de desempenho obtidas foram coeficiente de correlação de Pearson (r), coeficiente de determinação (R2) e o erro absoluto médio (MAE). Os modelos MLP (r=0.75, R2=43.94%, MAE=1.56), RF (r=0.78, R2=49.23%, MAE=1.60) e XGBoost (r=0.78, R2=56.90% MAE=1.45) apresentaram os melhores resultados de predição (p
Abstract: ABSTRACT MONTEIRO, G.O.A. Machine learning models for predicting crude protein in Tamani grass pastures: development, evaluation, and interpretability with SHAP. 2025. Thesis (Ph.D.) – Faculty of Veterinary Medicine and Animal Science, Federal University of Mato Grosso do Sul, Campo Grande, MS, 2025. Knowing forage quality is essential to meet animal nutritional requirements and optimize production. Traditional methods for assessing pasture nutritive value are destructive, costly, and time-consuming. Machine learning (ML) models have been increasingly applied to predictive tasks in agriculture. However, understanding how a model makes its predictions is just as important as the prediction itself. This study aimed to: (i) evaluate the applicability of machine learning models using tabular data, including climatic variables, light interception (LI), nitrogen (N) rates, grazing intervals (GI), and pre- (PREheight) and post-grazing (POSTheight) pasture heights to predict crude protein (CP) content in Tamani grass leaves; and (ii) use the SHAP technique to interpret how these variables influence the XGBoost model. A robust dataset was used, collected from an intensively managed Tamani grass pasture in the Brazilian Cerrado biome from October 2020 to April 2022. The dataset consisted of 90 instances, with 80% used for training and validation, and 20% for testing, applying 5-fold cross-validation with 100 iterations. Hyperparameters were tuned using grid search on the training set. The tested models included Linear Regression (LR), Multilayer Perceptron (MLP), Decision Trees (DT), Random Forest (RF), and XGBoost. The Shapley Additive Explanations (SHAP) technique was employed to understand the strength and direction of each variable’s contribution to the model's prediction. Performance metrics included Pearson correlation coefficient (r), coefficient of determination (R²), and mean absolute error (MAE). The MLP (r = 0.75, R² = 43.94%, MAE = 1.56), RF (r = 0.78, R² = 49.23%, MAE = 1.60), and XGBoost (r = 0.78, R² = 56.90%, MAE = 1.45) models showed the best prediction results (p < 0.001). The most important predictors of CP content were GI, followed by N rates, PREheight, and POSTheight. XGBoost outperformed the other models tested (p < 0.001). The impact of GI depended on interactions with other variables. Higher N rates had a positive effect on CP content in Tamani grass leaves. Rainfall between 100 and 180 mm positively influenced CP levels, while values outside this range had a negative impact. The application of 240 kg/ha/year of N reduced the influence of environmental conditions on CP content. In contrast, at 80 kg/ha/year of N, CP content was more strongly influenced by rainfall. The use of tabular data—such as N rates, GI, PREheight, POSTheight, LI, and climatic variables—proved to be a viable alternative for predicting CP using ML. The results underscore the importance of integrated management strategies, including pasture height targets, grazing management, nitrogen fertilization, and grazing intervals, as key tools for increasing crude protein in Tamani grass leaves. Keywords: algorithms, machine learning, pasture management, Panicum maximum, precision livestock farming, Shapley Additive Explanations.
Palavras-chave: .
País: Brasil
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/11947
Data do documento: 2025
Aparece nas coleções:Programa de Pós-graduação em Ciência Animal

Arquivos associados a este item:
Arquivo TamanhoFormato 
Tese_Gabriela Oliveira de Aquino Monteiro 2025.pdf1,92 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.