Técnicas de aprendizado de máquina aplicadas na predição da produtividade de soja no estado do Tocantins

dc.contributor.advisor1Matta, David Henriques da
dc.contributor.referee1Matta, David Henriques da
dc.contributor.referee1Vargas Junior, Valdivino
dc.contributor.referee1Feliciano, Joelmir Divino Carlos
dc.contributor.referee1Campos, Leonardo José Motta
dc.creatorViotto, Gabriel Senosien
dc.date.accessioned2026-01-28T11:59:41Z
dc.date.available2026-01-28T11:59:41Z
dc.date.issued2025-11-26
dc.description.abstractThis study applies and compares machine learning techniques for predicting soybean yield in the state of Tocantins, using categorized variables via k-means derived from climate data from the NASA POWER platform and soybean yield data obtained from experiments conducted in several municipalities of Tocantins from 2013 to 2023. Five algorithms were implemented: Random Forest, Decision Tree, XGBoost, Support Vector Machine, and Bagging. The models were trained using yield data from municipalities and evaluated through cross-validation using the metrics RMSE, MAE, and R2. The results demonstrated the superiority of ensemble methods, with Bagging showing the best performance (RMSE = 498.64 kg/ha, MAE = 380.07 kg/ha, R2 = 0.724). XGBoost and Random Forest also achieved very similar results. The variable importance analysis revealed that climatic factors—especially precipitation during the reproductive period and solar radiation during the vegetative period—are crucial determinants of productivity. The study concludes that machine learning techniques, particularly ensemble methods, are promising tools for predicting soybean yield and can support agricultural planning and decision-making in the sector, contributing to reducing the high inherent risk of this activity.
dc.description.resumoEste estudo aplica e compara técnicas de aprendizado de máquina na predição da produtividade de soja no estado do Tocantins, utilizando variáveis categorizadas via k-means oriundas de dados climáticos da plataforma NASA POWER e dados de produtividade de soja, obtidos em experimentos realizados em diversos municípios do Tocantins, de 2013 à 2023. Foram implementados cinco algoritmos: Random Forest, Árvore de Decisão, XGBoost, Support Vector Machine e Bagging. Os modelos foram treinados com dados de municípios de produtividade de Soja e avaliados mediante validação cruzada utilizando as métricas RMSE, MAE e R2. Os resultados demonstraram a superioridade dos métodos de ensemble, com o Bagging apresentando o melhor desempenho (RMSE = 498,64 kg/ha, MAE = 380,07 kg/ha, R2 = 0,724). O XGBoost e Random Forest também obtiveram resultados muito próximos. A análise de importância de variáveis revelou que fatores climáticos, especialmente precipitação no período reprodutivo e radiação solar no período vegetativo, são determinantes cruciais para a produtividade. O estudo conclui que as técnicas de aprendizado de máquina, particularmente os métodos de ensemble, são ferramentas promissoras para a predição de produtividade da soja, podendo auxiliar no planejamento agrícola e na tomada de decisão no setor, para a redução do alto risco inerente a esta atividade.
dc.identifier.citationVIOTTO, Gabriel Senosien. Técnicas de aprendizado de máquina aplicadas na predição da produtividade de soja no estado do Tocantins. 2025. 35 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) – Instituto de Matemática e Estatística, Universidade Federal de Goiás, Goiânia, 2025.
dc.identifier.urihttps://repositorio.bc.ufg.br//handle/ri/29521
dc.language.isopor
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.courseEstatística (RMG)
dc.publisher.departmentInstituto de Matemática e Estatística - IME (RMG)
dc.publisher.initialsUFG
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectEstatísticas
dc.subjectRedução de risco
dc.subjectMatopiba
dc.subjectDados climáticos
dc.subjectStatistics
dc.subjectRisk reduction
dc.subjectMatopiba
dc.subjectClimate data
dc.titleTécnicas de aprendizado de máquina aplicadas na predição da produtividade de soja no estado do Tocantins
dc.typeTrabalho de conclusão de curso de graduação (TCCG)

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCCG - Estatística - Gabriel Senosien Viotto - 2025.pdf
Tamanho:
362.49 KB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: