Comparação de modelos preditivos para campeonatos de futebol: uma análise de seis ligas mundiais (2003-2023)
| dc.contributor.advisor1 | Vargas Junior, Valdivino | |
| dc.contributor.referee1 | Vargas Junior, Valdivino | |
| dc.contributor.referee1 | Matta, David Henriques da | |
| dc.contributor.referee1 | Piscoya Diaz, Mario Ernesto | |
| dc.creator | Oliveira, Danilo Silva Carvalho de | |
| dc.date.accessioned | 2026-01-28T10:56:21Z | |
| dc.date.available | 2026-01-28T10:56:21Z | |
| dc.date.issued | 2025-11-25 | |
| dc.description.abstract | This study systematically compares three predictive modeling approaches for football championships: (i) a purely quantitative model based on Poisson distribution, (ii) a purely categorical model based on performance profiles, and (iii) a hybrid model combining both approaches. The analysis was applied to six major world leagues (Brazil, England, Spain, Italy, Germany, and France) over 21 seasons (2003 to 2023), totaling 126 season-championships and 46,503 matches. Using temporal cross-validation with 5 folds, the memory parameter $h$ was optimized independently for each model, league, and season. The results revealed better performance of the Pure Poisson model for the analyzed dataset, which presented the best metrics across all six leagues (global MAE: 3.37 versus 3.43 for categorical models) and higher categorical accuracy (82.5% champion prediction versus 79.4%), empirically validating the adequacy of the Poisson distribution for modeling goals in football within the scope of this research. All combinations showed high performance inertia (h > 0.75), indicating that accumulated history is more informative than recent form. Systematic differences between leagues were identified: Germany more predictable (MAE = 2.96), England less predictable (MAE = 3.71). Hierarchical clustering analysis identified three distinct groups of leagues with similar dynamics, demonstrating that inertia and predictability are partially independent dimensions. As a practical application, although the Pure Poisson model presented superior metrics, the Hybrid model was used to generate predictions for the 2025 Brazilian Championships Series A and B due to its methodological completeness in generating realistic scores while capturing match outcome dynamics (W/D/L). The application indicated a balanced title dispute in Series A between Flamengo (46%) and Palmeiras (43%) and Coritiba's favoritism in Series B (72% title probability), in addition to detailing the 35 possible promotion combinations in the latter. | |
| dc.description.resumo | Este trabalho compara sistematicamente três abordagens de modelagem preditiva para campeonatos de futebol: (i) modelo puramente quantitativo baseado em Poisson, (ii) modelo puramente categórico baseado em perfis de desempenho, e (iii) modelo híbrido que combina ambas as abordagens. A análise foi aplicada a seis das principais ligas mundiais (Brasil, Inglaterra, Espanha, Itália, Alemanha e França) ao longo de 21 temporadas (2003 a 2023), totalizando 126 temporadas-campeonato e 46.503 partidas. Utilizando validação cruzada temporal com 5 folds, o parâmetro de memória h foi otimizado independentemente para cada modelo, liga e temporada. Os resultados revelaram melhor desempenho do modelo de Poisson Puro para o conjunto de dados analisado, que apresentou as melhores métricas em todas as seis ligas (MAE global: 3,37 versus 3,43 dos modelos categóricos) e maior acurácia categórica (82,5% de acerto de campeões versus 79,4%), validando empiricamente a adequação da distribuição de Poisson para modelar gols no futebol dentro do escopo desta pesquisa. Todas as combinações apresentaram alta inércia de desempenho (h > 0,75), indicando que o histórico acumulado é mais informativo que a forma recente. Identificaram-se diferenças sistemáticas entre ligas: Alemanha mais previsível (MAE = 2,96), Inglaterra menos previsível (MAE = 3,71). A análise de agrupamento hierárquico identificou três grupos distintos de ligas com dinâmicas similares, demonstrando que inércia e previsibilidade são dimensões parcialmente independentes. Como aplicação prática, embora o modelo de Poisson Puro tenha apresentado métricas superiores, o modelo Híbrido foi utilizado para gerar previsões dos Campeonatos Brasileiros Série A e B de 2025 por sua completude metodológica em gerar placares realistas enquanto captura as dinâmicas de resultado (V/E/D). A aplicação indicou uma disputa equilibrada pelo título da Série A entre Flamengo (46%) e Palmeiras (43%) e o favoritismo do Coritiba na Série B (72% de título), além de detalhar as 35 combinações de acesso possíveis nesta última. | |
| dc.identifier.citation | OLIVEIRA, Danilo Silva Carvalho de. Comparação de modelos preditivos para campeonatos de futebol: Uma análise de seis ligas mundiais (2003-2023). 2025. 55 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Instituto de Matemática e Estatística, Universidade Federal de Goiás, Goiânia, 2025. | |
| dc.identifier.uri | https://repositorio.bc.ufg.br//handle/ri/29516 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de Goiás | |
| dc.publisher.country | Brasil | |
| dc.publisher.course | Estatística (RMG) | |
| dc.publisher.department | Instituto de Matemática e Estatística - IME (RMG) | |
| dc.publisher.initials | UFG | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Distribuição de Poisson | |
| dc.subject | Simulação de Monte Carlo | |
| dc.subject | Suavização exponencial | |
| dc.subject | Validação cruzada temporal | |
| dc.subject | Sports analytics | |
| dc.subject | Análise estatística esportiva | |
| dc.subject | Monte Carlo simulation | |
| dc.subject | Exponential smoothing | |
| dc.subject | Temporal cross-validation | |
| dc.title | Comparação de modelos preditivos para campeonatos de futebol: uma análise de seis ligas mundiais (2003-2023) | |
| dc.type | Trabalho de conclusão de curso de graduação (TCCG) |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCCG - Estatística - Danilo Silva Carvalho de Oliveira - 2025.pdf
- Tamanho:
- 1.38 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: