R je jazyk voľby pre štatistikov a jeho silné stránky sa priamo premietajú do modelovania športového stávkovania. Kde Python vyniká v dátovom inžinierstve, R robí štatistickú analýzu natívnou.
Krok 1: Nastavte R prostredie
Nainštalujte R a RStudio, načítajte základné balíčky: tidyverse, rvest, jsonlite.
Krok 2: Pripravte dáta o zápasoch
Načítajte historické výsledky a preformátujte pre modelovanie. Každý riadok reprezentuje jeden tím v jednom zápase: názov tímu, súper, góly, indikátor domáci/hostia, sezóna a dátum.
Krok 3: Napasujte Poissonov regresný model
Model odhaduje útočnú a obrannú silu každého tímu súčasne. Domáca výhoda sa objaví prirodzene ako koeficient.
Príklad: Model predpovedá Slovan Bratislava doma vs Žilina s xG Slovana 1,85 a xG Žiliny 0,80. Poissonovo rozdelenie dáva: Domáca výhra 58%, Remíza 22%, Výhra hostí 20%.
Ak bookmaker ponúka Slovan pri kurze 1,65 (implikovaných 60,6%), model nevidí hodnotu. Pri kurze 1,80 (implikovaných 55,6%) sa ukazuje 2,4% výhoda. Stávka 30 € vráti 54 €.
Krok 4: Backtestujte model
Rozdeľte dáta: trénujte na 75% sezóny, predpovedajte zvyšných 25%, porovnajte s výsledkami a vypočítajte simulované výnosy.
Krok 5: Vizualizujte výsledky
ggplot2 vytvára prehľadné vizualizácie: kalibračné grafy, yield krivky a heatmapy tímovej sily.