Proposta de arquitetura de AutoML para aprendizado de múltiplos estimadores de séries temporais
| dc.contributor.advisor1 | Soares, Anderson da Silva | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1096941114079527 | |
| dc.contributor.referee1 | Soares, Anderson da Silva | |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/1096941114079527 | |
| dc.contributor.referee2 | Galvão Filho, Arlindo Rodrigues | |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/7744765287200890 | |
| dc.contributor.referee3 | Sousa, Rafael Teixeira | |
| dc.contributor.referee3Lattes | http://lattes.cnpq.br/3819400092348829 | |
| dc.contributor.referee4 | Fanucchi, Rodrigo Zempulski | |
| dc.contributor.referee4Lattes | http://lattes.cnpq.br/0937371415675134 | |
| dc.contributor.referee5 | Patto, Vinicius Sebba | |
| dc.contributor.referee5Lattes | http://lattes.cnpq.br/3585475958654532 | |
| dc.creator | Santos, Danilo Turkievicz dos | |
| dc.creator.Lattes | http://lattes.cnpq.br/0266521949808051 | |
| dc.date.accessioned | 2025-12-15T17:47:37Z | |
| dc.date.available | 2025-12-15T17:47:37Z | |
| dc.date.issued | 2025-10-20 | |
| dc.description.abstract | Demand forecasting in the retail sector is a highly complex task, characterized by the vast heterogeneity of patterns across thousands of time series. Traditional approaches, such as custom single models, are costly and poorly scalable, while global foundational models still face challenges in practical applicability. In this context, this thesis proposes and develops an AutoML methodology that enhances the robustness and computational efficiency of predictions, based on the cluster-then-forecast strategy. The cornerstone of this methodology is a novel clustering approach that employs SOM using the LikelihoodDistance metric to identify series with similar underlying generative processes. The architecture was validated in a real-world and challenging scenario, using sales data from the pharmaceutical retail sector. The results demonstrated that the sampling-based approach, derived from the clustering, was particularly effective, successfully identifying the best-performing models from small samples of series. The central finding of the research is that the proposed architecture not only proved to be competitive across all stores and evaluated metrics but also exhibited remarkable consistency and reliability. Furthermore, the success of the clustering provides strong evidence that the similarity between the series' generative models is a determining factor in selecting the most accurate forecasting technique. This work thus contributes an AutoML framework that mitigates the model selection problem in heterogeneous environments, offering a more stable, scalable, and computationally viable forecasting solution for the retail sector. | eng |
| dc.description.resumo | A previsão de demanda no setor varejista é uma tarefa de alta complexidade, caracterizada pela vasta heterogeneidade de padrões em milhares de séries temporais. Abordagens tradicionais, como modelos únicos customizados, são custosas e pouco escaláveis, enquanto modelos fundacionais globais ainda apresentam desafios de aplicabilidade prática. Diante desse cenário, esta tese propõe e desenvolve uma metodologia de AutoML que eleva a robustez e a eficiência computacional das predições, fundamentada na estratégia de agrupar para depois prever (cluster-then-forecast). O pilar desta metodologia é uma abordagem de clusterização inédita, que emprega SOM utilizando a métrica LikelihoodDistance para identificar séries com processos geradores subjacentes similares. A arquitetura foi validada em um cenário real e desafiador, com dados de vendas do varejo farmacêutico. Os resultados demonstraram que a abordagem por amostragem, derivada da clusterização, foi particularmente eficaz, conseguindo identificar os modelos de melhor desempenho a partir de pequenas amostras de séries. O resultado central da pesquisa é que a arquitetura proposta se mostrou competitiva nas lojas e métricas avaliadas, exibindo consistência. Adicionalmente, o sucesso da clusterização fornece indicativos de que a similaridade entre os modelos geradores das séries é um fator relevante para a seleção de uma técnica de previsão adequada. O trabalho contribui, assim, com um framework de AutoML que mitiga o problema da seleção de modelos em ambientes heterogêneos, oferecendo uma solução de previsão mais estável, escalável e computacionalmente viável para o setor varejista. | |
| dc.identifier.citation | Santos, D. T. Proposta de arquitetura de AutoML para aprendizado de múltiplos estimadores de séries temporais. 2025. 120 f. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025. | |
| dc.identifier.uri | https://repositorio.bc.ufg.br/tede/handle/tede/14965 | |
| dc.language | Português | por |
| dc.publisher | Universidade Federal de Goiás | por |
| dc.publisher.country | Brasil | por |
| dc.publisher.department | Instituto de Informática - INF (RMG) | |
| dc.publisher.initials | UFG | por |
| dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Previsão de séries temporais | por |
| dc.subject | Clusterização | por |
| dc.subject | AutoML | por |
| dc.subject | Time series | eng |
| dc.subject | Clustering | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.title | Proposta de arquitetura de AutoML para aprendizado de múltiplos estimadores de séries temporais | |
| dc.title.alternative | AutoML architecture proposal for learning multiple time series estimators | eng |
| dc.type | Tese |