Técnicas de aprendizado de máquina aplicadas na predição da produtividade de soja no estado do Tocantins
| dc.contributor.advisor1 | Matta, David Henriques da | |
| dc.contributor.referee1 | Matta, David Henriques da | |
| dc.contributor.referee1 | Vargas Junior, Valdivino | |
| dc.contributor.referee1 | Feliciano, Joelmir Divino Carlos | |
| dc.contributor.referee1 | Campos, Leonardo José Motta | |
| dc.creator | Viotto, Gabriel Senosien | |
| dc.date.accessioned | 2026-01-28T11:59:41Z | |
| dc.date.available | 2026-01-28T11:59:41Z | |
| dc.date.issued | 2025-11-26 | |
| dc.description.abstract | This study applies and compares machine learning techniques for predicting soybean yield in the state of Tocantins, using categorized variables via k-means derived from climate data from the NASA POWER platform and soybean yield data obtained from experiments conducted in several municipalities of Tocantins from 2013 to 2023. Five algorithms were implemented: Random Forest, Decision Tree, XGBoost, Support Vector Machine, and Bagging. The models were trained using yield data from municipalities and evaluated through cross-validation using the metrics RMSE, MAE, and R2. The results demonstrated the superiority of ensemble methods, with Bagging showing the best performance (RMSE = 498.64 kg/ha, MAE = 380.07 kg/ha, R2 = 0.724). XGBoost and Random Forest also achieved very similar results. The variable importance analysis revealed that climatic factors—especially precipitation during the reproductive period and solar radiation during the vegetative period—are crucial determinants of productivity. The study concludes that machine learning techniques, particularly ensemble methods, are promising tools for predicting soybean yield and can support agricultural planning and decision-making in the sector, contributing to reducing the high inherent risk of this activity. | |
| dc.description.resumo | Este estudo aplica e compara técnicas de aprendizado de máquina na predição da produtividade de soja no estado do Tocantins, utilizando variáveis categorizadas via k-means oriundas de dados climáticos da plataforma NASA POWER e dados de produtividade de soja, obtidos em experimentos realizados em diversos municípios do Tocantins, de 2013 à 2023. Foram implementados cinco algoritmos: Random Forest, Árvore de Decisão, XGBoost, Support Vector Machine e Bagging. Os modelos foram treinados com dados de municípios de produtividade de Soja e avaliados mediante validação cruzada utilizando as métricas RMSE, MAE e R2. Os resultados demonstraram a superioridade dos métodos de ensemble, com o Bagging apresentando o melhor desempenho (RMSE = 498,64 kg/ha, MAE = 380,07 kg/ha, R2 = 0,724). O XGBoost e Random Forest também obtiveram resultados muito próximos. A análise de importância de variáveis revelou que fatores climáticos, especialmente precipitação no período reprodutivo e radiação solar no período vegetativo, são determinantes cruciais para a produtividade. O estudo conclui que as técnicas de aprendizado de máquina, particularmente os métodos de ensemble, são ferramentas promissoras para a predição de produtividade da soja, podendo auxiliar no planejamento agrícola e na tomada de decisão no setor, para a redução do alto risco inerente a esta atividade. | |
| dc.identifier.citation | VIOTTO, Gabriel Senosien. Técnicas de aprendizado de máquina aplicadas na predição da produtividade de soja no estado do Tocantins. 2025. 35 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) – Instituto de Matemática e Estatística, Universidade Federal de Goiás, Goiânia, 2025. | |
| dc.identifier.uri | https://repositorio.bc.ufg.br//handle/ri/29521 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de Goiás | |
| dc.publisher.country | Brasil | |
| dc.publisher.course | Estatística (RMG) | |
| dc.publisher.department | Instituto de Matemática e Estatística - IME (RMG) | |
| dc.publisher.initials | UFG | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Estatísticas | |
| dc.subject | Redução de risco | |
| dc.subject | Matopiba | |
| dc.subject | Dados climáticos | |
| dc.subject | Statistics | |
| dc.subject | Risk reduction | |
| dc.subject | Matopiba | |
| dc.subject | Climate data | |
| dc.title | Técnicas de aprendizado de máquina aplicadas na predição da produtividade de soja no estado do Tocantins | |
| dc.type | Trabalho de conclusão de curso de graduação (TCCG) |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCCG - Estatística - Gabriel Senosien Viotto - 2025.pdf
- Tamanho:
- 362.49 KB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: