Proposta de arquitetura de AutoML para aprendizado de múltiplos estimadores de séries temporais

dc.contributor.advisor1Soares, Anderson da Silva
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1096941114079527
dc.contributor.referee1Soares, Anderson da Silva
dc.contributor.referee1Latteshttp://lattes.cnpq.br/1096941114079527
dc.contributor.referee2Galvão Filho, Arlindo Rodrigues
dc.contributor.referee2Latteshttp://lattes.cnpq.br/7744765287200890
dc.contributor.referee3Sousa, Rafael Teixeira
dc.contributor.referee3Latteshttp://lattes.cnpq.br/3819400092348829
dc.contributor.referee4Fanucchi, Rodrigo Zempulski
dc.contributor.referee4Latteshttp://lattes.cnpq.br/0937371415675134
dc.contributor.referee5Patto, Vinicius Sebba
dc.contributor.referee5Latteshttp://lattes.cnpq.br/3585475958654532
dc.creatorSantos, Danilo Turkievicz dos
dc.creator.Latteshttp://lattes.cnpq.br/0266521949808051
dc.date.accessioned2025-12-15T17:47:37Z
dc.date.available2025-12-15T17:47:37Z
dc.date.issued2025-10-20
dc.description.abstractDemand forecasting in the retail sector is a highly complex task, characterized by the vast heterogeneity of patterns across thousands of time series. Traditional approaches, such as custom single models, are costly and poorly scalable, while global foundational models still face challenges in practical applicability. In this context, this thesis proposes and develops an AutoML methodology that enhances the robustness and computational efficiency of predictions, based on the cluster-then-forecast strategy. The cornerstone of this methodology is a novel clustering approach that employs SOM using the LikelihoodDistance metric to identify series with similar underlying generative processes. The architecture was validated in a real-world and challenging scenario, using sales data from the pharmaceutical retail sector. The results demonstrated that the sampling-based approach, derived from the clustering, was particularly effective, successfully identifying the best-performing models from small samples of series. The central finding of the research is that the proposed architecture not only proved to be competitive across all stores and evaluated metrics but also exhibited remarkable consistency and reliability. Furthermore, the success of the clustering provides strong evidence that the similarity between the series' generative models is a determining factor in selecting the most accurate forecasting technique. This work thus contributes an AutoML framework that mitigates the model selection problem in heterogeneous environments, offering a more stable, scalable, and computationally viable forecasting solution for the retail sector.eng
dc.description.resumoA previsão de demanda no setor varejista é uma tarefa de alta complexidade, caracterizada pela vasta heterogeneidade de padrões em milhares de séries temporais. Abordagens tradicionais, como modelos únicos customizados, são custosas e pouco escaláveis, enquanto modelos fundacionais globais ainda apresentam desafios de aplicabilidade prática. Diante desse cenário, esta tese propõe e desenvolve uma metodologia de AutoML que eleva a robustez e a eficiência computacional das predições, fundamentada na estratégia de agrupar para depois prever (cluster-then-forecast). O pilar desta metodologia é uma abordagem de clusterização inédita, que emprega SOM utilizando a métrica LikelihoodDistance para identificar séries com processos geradores subjacentes similares. A arquitetura foi validada em um cenário real e desafiador, com dados de vendas do varejo farmacêutico. Os resultados demonstraram que a abordagem por amostragem, derivada da clusterização, foi particularmente eficaz, conseguindo identificar os modelos de melhor desempenho a partir de pequenas amostras de séries. O resultado central da pesquisa é que a arquitetura proposta se mostrou competitiva nas lojas e métricas avaliadas, exibindo consistência. Adicionalmente, o sucesso da clusterização fornece indicativos de que a similaridade entre os modelos geradores das séries é um fator relevante para a seleção de uma técnica de previsão adequada. O trabalho contribui, assim, com um framework de AutoML que mitiga o problema da seleção de modelos em ambientes heterogêneos, oferecendo uma solução de previsão mais estável, escalável e computacionalmente viável para o setor varejista.
dc.identifier.citationSantos, D. T. Proposta de arquitetura de AutoML para aprendizado de múltiplos estimadores de séries temporais. 2025. 120 f. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.
dc.identifier.urihttps://repositorio.bc.ufg.br/tede/handle/tede/14965
dc.languagePortuguêspor
dc.publisherUniversidade Federal de Goiáspor
dc.publisher.countryBrasilpor
dc.publisher.departmentInstituto de Informática - INF (RMG)
dc.publisher.initialsUFGpor
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectPrevisão de séries temporaispor
dc.subjectClusterizaçãopor
dc.subjectAutoMLpor
dc.subjectTime serieseng
dc.subjectClusteringeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleProposta de arquitetura de AutoML para aprendizado de múltiplos estimadores de séries temporais
dc.title.alternativeAutoML architecture proposal for learning multiple time series estimatorseng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese - Danilo Turkievicz dos Santos - 2025.pdf
Tamanho:
3.82 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: