Dixon-Coles model je najcitovanejší akademický rámec pre predpoveď futbalových zápasov. Publikovaný v 1997, rieši špecifickú chybu štandardnej Poissonovej regresie a zostáva referenčným bodom pre novšie modely.
Problém so základným Poissonom
Štandardná Poissonova regresia modeluje góly každého tímu nezávisle. Funguje to celkovo dobre, ale systematicky podceňuje pravdepodobnosť nízko-skórovacích výsledkov — najmä 0:0, 1:0, 0:1 a 1:1.
Dixon-Coles korekcia
Dixon a Coles zaviedli parameter závislosti rho, ktorý upravuje spoločnú pravdepodobnosť nízko-skórovacích výsledkov. Parameter rho je typicky malé záporné číslo (okolo -0,13 až -0,08), ktoré zvyšuje pravdepodobnosť 0:0 a 1:1.
Kroky implementácie
1. Pripravte dáta
Načítajte historické výsledky: dátum, domáci tím, hostia, domáce góly, hosťovacie góly.
2. Definujte parametre modelu
Každý tím má útočný a obranný parameter. Plus domáca výhoda a rho. Pre 12-tímovú ligu: 25 parametrov.
3. Aplikujte časovú úpadkovú váhu
Váha = exp(-xi x t), kde t je počet dní od zápasu. Xi 0,005 znamená, že 6 mesiacov starý zápas má približne 40% váhy včerajšieho.
4. Optimalizujte maximálnou vierohodnosťou
SciPy minimize alebo R optim nájdu parametre maximalizujúce vierohodnosť.
5. Generujte predpovede
Príklad: Slovan (útok 1,30, obrana 0,85) vs Žilina (útok 0,95, obrana 1,10). Domáce xG = 1,95. xG hostí = 0,81. Po korekcii: Domáca výhra 60,1%, Remíza 21,2%, Výhra hostí 18,7%.
Stávka 30 € na remízu pri kurze 3,50 vráti 105 €. Ak model dáva 21,2% a implikovaná pravdepodobnosť je 28,6% (1/3,50), bookmaker preceňuje remízu — nie je tam hodnota.
Za hranice Dixon-Coles
Model sa dá rozšíriť o: xG dáta, tímovo-špecifické domáce výhody alebo bivariátne Poissonove rozdelenia. Každé rozšírenie pridáva komplexnosť, ale potenciálne zlepšuje presnosť.