Comparação de modelos preditivos para campeonatos de futebol: uma análise de seis ligas mundiais (2003-2023)

dc.contributor.advisor1Vargas Junior, Valdivino
dc.contributor.referee1Vargas Junior, Valdivino
dc.contributor.referee1Matta, David Henriques da
dc.contributor.referee1Piscoya Diaz, Mario Ernesto
dc.creatorOliveira, Danilo Silva Carvalho de
dc.date.accessioned2026-01-28T10:56:21Z
dc.date.available2026-01-28T10:56:21Z
dc.date.issued2025-11-25
dc.description.abstractThis study systematically compares three predictive modeling approaches for football championships: (i) a purely quantitative model based on Poisson distribution, (ii) a purely categorical model based on performance profiles, and (iii) a hybrid model combining both approaches. The analysis was applied to six major world leagues (Brazil, England, Spain, Italy, Germany, and France) over 21 seasons (2003 to 2023), totaling 126 season-championships and 46,503 matches. Using temporal cross-validation with 5 folds, the memory parameter $h$ was optimized independently for each model, league, and season. The results revealed better performance of the Pure Poisson model for the analyzed dataset, which presented the best metrics across all six leagues (global MAE: 3.37 versus 3.43 for categorical models) and higher categorical accuracy (82.5% champion prediction versus 79.4%), empirically validating the adequacy of the Poisson distribution for modeling goals in football within the scope of this research. All combinations showed high performance inertia (h > 0.75), indicating that accumulated history is more informative than recent form. Systematic differences between leagues were identified: Germany more predictable (MAE = 2.96), England less predictable (MAE = 3.71). Hierarchical clustering analysis identified three distinct groups of leagues with similar dynamics, demonstrating that inertia and predictability are partially independent dimensions. As a practical application, although the Pure Poisson model presented superior metrics, the Hybrid model was used to generate predictions for the 2025 Brazilian Championships Series A and B due to its methodological completeness in generating realistic scores while capturing match outcome dynamics (W/D/L). The application indicated a balanced title dispute in Series A between Flamengo (46%) and Palmeiras (43%) and Coritiba's favoritism in Series B (72% title probability), in addition to detailing the 35 possible promotion combinations in the latter.
dc.description.resumoEste trabalho compara sistematicamente três abordagens de modelagem preditiva para campeonatos de futebol: (i) modelo puramente quantitativo baseado em Poisson, (ii) modelo puramente categórico baseado em perfis de desempenho, e (iii) modelo híbrido que combina ambas as abordagens. A análise foi aplicada a seis das principais ligas mundiais (Brasil, Inglaterra, Espanha, Itália, Alemanha e França) ao longo de 21 temporadas (2003 a 2023), totalizando 126 temporadas-campeonato e 46.503 partidas. Utilizando validação cruzada temporal com 5 folds, o parâmetro de memória h foi otimizado independentemente para cada modelo, liga e temporada. Os resultados revelaram melhor desempenho do modelo de Poisson Puro para o conjunto de dados analisado, que apresentou as melhores métricas em todas as seis ligas (MAE global: 3,37 versus 3,43 dos modelos categóricos) e maior acurácia categórica (82,5% de acerto de campeões versus 79,4%), validando empiricamente a adequação da distribuição de Poisson para modelar gols no futebol dentro do escopo desta pesquisa. Todas as combinações apresentaram alta inércia de desempenho (h > 0,75), indicando que o histórico acumulado é mais informativo que a forma recente. Identificaram-se diferenças sistemáticas entre ligas: Alemanha mais previsível (MAE = 2,96), Inglaterra menos previsível (MAE = 3,71). A análise de agrupamento hierárquico identificou três grupos distintos de ligas com dinâmicas similares, demonstrando que inércia e previsibilidade são dimensões parcialmente independentes. Como aplicação prática, embora o modelo de Poisson Puro tenha apresentado métricas superiores, o modelo Híbrido foi utilizado para gerar previsões dos Campeonatos Brasileiros Série A e B de 2025 por sua completude metodológica em gerar placares realistas enquanto captura as dinâmicas de resultado (V/E/D). A aplicação indicou uma disputa equilibrada pelo título da Série A entre Flamengo (46%) e Palmeiras (43%) e o favoritismo do Coritiba na Série B (72% de título), além de detalhar as 35 combinações de acesso possíveis nesta última.
dc.identifier.citationOLIVEIRA, Danilo Silva Carvalho de. Comparação de modelos preditivos para campeonatos de futebol: Uma análise de seis ligas mundiais (2003-2023). 2025. 55 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Instituto de Matemática e Estatística, Universidade Federal de Goiás, Goiânia, 2025.
dc.identifier.urihttps://repositorio.bc.ufg.br//handle/ri/29516
dc.language.isopor
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.courseEstatística (RMG)
dc.publisher.departmentInstituto de Matemática e Estatística - IME (RMG)
dc.publisher.initialsUFG
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectDistribuição de Poisson
dc.subjectSimulação de Monte Carlo
dc.subjectSuavização exponencial
dc.subjectValidação cruzada temporal
dc.subjectSports analytics
dc.subjectAnálise estatística esportiva
dc.subjectMonte Carlo simulation
dc.subjectExponential smoothing
dc.subjectTemporal cross-validation
dc.titleComparação de modelos preditivos para campeonatos de futebol: uma análise de seis ligas mundiais (2003-2023)
dc.typeTrabalho de conclusão de curso de graduação (TCCG)

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCCG - Estatística - Danilo Silva Carvalho de Oliveira - 2025.pdf
Tamanho:
1.38 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: