Štatistiky a analytika

Regresia k priemeru

Štatistický jav, pri ktorom sa extrémne výsledky po čase vracajú smerom k priemerným hodnotám, čo je kľúčový koncept pri hodnotení formy tímov a stávkovaní.

Betmana.sk je affiliate partner stávkovej spoločnosti. Kliknutím na banner opustíte náš web a budete presmerovaní na stránku partnera. 18+. Hrajte zodpovedne (hramzodpovedne.sk)

Čo je regresia k priemeru?

Regresia k priemeru je štatistický princíp, ktorý hovorí, že extrémne výsledky — či už výnimočne dobré alebo výnimočne zlé — sa po dostatočnom počte pokusov vrátia bližšie k dlhodobému priemeru. V stávkovaní ide o jeden z najdôležitejších konceptov, ktorý pomáha pochopiť, prečo sa formy tímov menia a ako identifikovať skutočné príležitosti na trhoch.

Pojem zaviedol britský vedec Francis Galton v roku 1886, keď študoval závislosť medzi výškou otcov a ich synov. Zistil, že velmi vysokí otcovia mali síce synov vyšších ako priemer, ale nie až tak vysokých ako sami. Synovia sa „vrátili" smerom k priemeru populácie. Tento jav sa ukázal byť univerzálnym zákonom štatistiky — nie je špecifický len pre genetiku, ale platí všade tam, kde hrá úlohu náhoda.

Základná definícia

Regresia k priemeru sa dá vysvetliť jednoduchou rovnicou: Výsledok = Schopnosť + Šťastie. Ak tím dosahuje extrémne výsledky, je to zvyčajne kombinácia jeho skutočnej kvality a mimoriadneho šťastia (alebo smoly). Keď sa šťastie vyrovná — a vyrovná sa vždy — výsledky sa priblížia k tomu, čo by mal tím dosahovať na základe svojej skutočnej úrovne.

Prakticky to znamená:

  • Tím s sériu výhier prekonávajúci svoju očakávanú výkonnosť pravdepodobne zažíva priaznivé okolnosti, ktoré nie sú udržateľné.
  • Tím v kríze s výsledkami horšími, ako by naznačovala jeho štatistika, má potenciál na zlepšenie.
  • Čím dlhšia je vzorka výsledkov, tým presnejšie odráža skutočnú kvalitu.
Scenár Výsledky Očakávaný xG Analýza
Tím A — 10 víťazstiev 18 gólov 12,5 xG Overperformance o +5,5 gólov — pravdepodobná regresia
Tím B — 5 porážok 8 gólov 15,2 xG Underperformance o -7,2 gólov — potenciál na zlepšenie
Tím C — stabilný 14 gólov 13,8 xG Blízko očakávaní — stabilná forma

Historický pôvod — Francis Galton a jeho objav

Pojem „regresia" má zaujímavú históriu. Francis Galton, britský matematik a štatistik, nemal na mysli návrat k primitívnemu stavu. Slovo „regress" jednoducho znamená „ísť späť" alebo „vrátiť sa". Keď Galton pozoroval, že synovia vysokých otcov boli síce vysokí, ale nie až tak vysokí ako ich otcovia, nazval tento jav „regressia k mediocrity" — návratom k priemernosti.

Galton skúmal 928 párov otcov a synov a zistil jasný vzor. Rozdiel medzi vysokým otcom a priemerom populácie sa u syna zmenšil. Ak bol otec o 10 cm vyšší ako priemer, syn bol zvyčajne len o 6-7 cm vyšší. Toto nebolo genetické zlyhanie — bolo to čisté štatistické pravidlo.

Tento objav mal obrovský vplyv na teóriu štatistiky a neskôr sa aplikoval na všetky oblasti, od medicíny cez financie až po šport.

Ako funguje regresia k priemeru v športe?

Regresia v futbale — prípad xG a formy tímu

V modernom futbale je regresia k priemeru viditeľná všade tam, kde porovnávame skutočné góly s očakávanými gólmi (xG). Expected Goals je štatistika, ktorá meria kvalitu striel — nie počet strelených gólov, ale aké pravdepodobné bolo, že dané strely skončia gólom.

Predstavte si dva tímy na konci jesene futbalovej sezóny:

Prípad 1: Overperformance (Prekonávajúci tím)

  • Tím dostal 12 víťazstiev a je na prvom mieste
  • Strelil 24 gólov
  • Ale jeho xG je len 16,5
  • Analýza: Tím prekonáva svoje očakávanie o 7,5 gólov. Je to výnimočná efektivita alebo šťastie? Keď sa pozrieme na jednotlivé zápasy, vidíme, že veľa gólov padlo z nepravdepodobných pozícií. Brankár súpera mal zlé chvíle. Strihanie v posledných minútach. Toto je kombinovanie šťastia a zručnosti, ale šťastie nie je udržateľné.

Prípad 2: Underperformance (Nedosahujúci tím)

  • Tím dostal len 4 víťazstva a je na 15. mieste
  • Strelil 8 gólov
  • Ale jeho xG je 14,2
  • Analýza: Tím nedosahuje svoje očakávanie o 6,2 gólov. To znamená, že brankár tímu robí výnimočné zákroky, alebo šťastie hrá proti tímu. Keď sa štatistika vyrovná, tím by mal začať vyhrávať viac zápasov, aj keby sa nič iné nezmenilo.

Regresia k priemeru v futbale obvykle trvá 10–30 zápasov, v závislosti od toho, ako veľké je odchýlenie. Malé odchýlky sa vyrovnávajú rýchlejšie, veľké odchýlky trvajú dlhšie.

Tím Góly xG Rozdiel Očakávaný vývoj
Chelsea 22 18,5 +3,5 Regresia — menej gólov v ďalších 15 zápasoch
Man City 19 21,2 -2,2 Regresia — viac gólov v ďalších 15 zápasoch
Liverpool 20 19,8 +0,2 Stabilný výkon — bez zmeny
Arsenal 17 17,1 -0,1 Stabilný výkon — bez zmeny

Regresia v iných športoch

Regresia k priemeru nie je špecifická len pre futbal. Vidíme ju všade:

Baseball — Sophomore slump V americkej Major League Baseball je slávny „sophomore slump" — jav, keď mladý hráč v druhej sezóne dosahuje podstatne horšie výsledky ako v prvej. Nie je to preto, že by sa hráč zhoršil. Je to preto, že jeho prvá sezóna bola pravdepodobne lepšia, ako by bola jeho dlhodobá priemer. Súpeři sa naučili, ako ho hrať, a šťastie sa vyrovnalo.

Basketbal — NBA tímové výkonnosti Tímy, ktoré vyhrali nezvyčajne veľa zápasov v jednej sezóne (napr. kvôli zraneniam súperov alebo nezvyčajným výkonom), zvyčajne regredujú v ďalšej sezóne. Výskumy ukazujú, že korelácia medzi víťazstvami z jednej sezóny na druhú je iba 0,54 — čo znamená, že polovica variácie je vysvetlená šťasťou.

Hokej — Goaltender performance Brankári s nezvyčajne vysokou save percentage (% zákrytov) v jednej sezóne zvyčajne poklesajú v ďalšej. Nie je to vždy zlyhanie — je to regresia k ich dlhodobému priemeru.

Prečo sa extrémne výsledky vrátia k priemeru?

Úloha šťastia vs. zručnosti

Kľúčom k pochopeniu regresie je rozumieť spektru medzi šťasťou a zručnosťou. Niektoré výsledky sú čisté šťastie (ako padnutie kocky), iné sú čistá zručnosť (ako hra v šachu). Futbal je niekde uprostred.

V každom futbalovom zápase je niekoľko faktorov:

  • Zručnosť tímu — taktika, fyzická príprava, technické zručnosti hráčov
  • Náhoda — odsúdenie rozhodcu, zranenia počas zápasu, odraz lopty, šťastie pri zakončení

Keď tím dosahuje extrémne výsledky, je to zvyčajne kombinácia oboch. Ale šťastie sa vyrovnáva — nie je možné, aby bol tím neustále šťastný alebo neustále smolný.

Výskumy v oblasti behavioral economics (napríklad práce Michaela Mauboussina) ukazujú, že v krátkodobom horizonte (5–10 zápasov) dominuje šťastie. V dlhodobom horizonte (30+ zápasov) dominuje zručnosť. Preto je analýza xG a iných štatistík také dôležitá — dávajú nám lepší obraz o skutočnej úrovni tímu, ktorý nie je skreslen šťasťou.

Veľkosť vzorky a štatistická stabilita

Počet pozorovaní (v tomto prípade zápasov) je kritický. Malá vzorka je extrémne citlivá na šťastie. Veľká vzorka sa stabilizuje okolo skutočnej úrovne.

Príklad:

  • Tím, ktorý vyhral 4 z 5 zápasov (80% win rate), by sa mohol pochváliť výnimočnou formou.
  • Ale je to iba 5 zápasov. Štatisticky je to takmer bez významu.
  • Keď tím hrá 30 zápasov a vyhral 24 (80% win rate), je to podstatne viac signifikantné.
  • Pri 100 zápasoch s 80% win rate by to bol absolútny fenomén — alebo by to znamenalo, že tím je naozaj tak dobrý.

Preto analytici vždy hovoria: „Počkajte si na väčšiu vzorku." Minimálne 10–15 zápasov je potrebných na to, aby ste mohli začať dôverovať trendu.

Ako sa regresia k priemeru vzťahuje na stávkovanie?

Identifikácia hodnotovej stávky cez regresia

Pre stávkujúcich je regresia k priemeru zlatá baňa. Ak dokážete identifikovať, že kurzy bookmakerov odrážajú nedávne výsledky (ktoré sú skreslené šťasťou) namiesto skutočnej úrovne tímu, nájdete hodnotu.

Scenár:

  • Tím vyhral 5 zápasov za sebou s nízkou xG — je overperformer
  • Bookmakeri videli tieto 5 výhier a zvýšili kurz na výhru tohto tímu
  • Ale štatistika naznačuje, že tím nie je až tak dobrý
  • Stávka na súpera má hodnotu — je to „fade" (stávka proti) na overperformujúci tím

Opačne:

  • Tím prehral 4 zápasy za sebou, ale xG naznačuje, že mal byť v ňom podstatne lepší
  • Bookmakeri znížili kurz na výhru tohto tímu (zvýšili kurz na stratu)
  • Stávka na tento tím má hodnotu — je to „back" (stávka za) na underperformujúci tím

Praktické príklady — čítanie kurzov

Príklad 1: Overperformujúci favorit

  • Arsenal vyhral 7 z posledných 8 zápasov
  • Kurz na výhru: 1,80
  • Ale analýza xG: Arsenal prekonáva svoju xG o +4,5 gólov
  • Štatistika naznačuje, že Arsenal by mal vyhrať len cca 60% svojich zápasov, nie 87,5%
  • Rozhodnutie: Stávka na súpera (alebo draw) má lepšiu hodnotu

Príklad 2: Underperformujúci underdog

  • Tottenham prehral 3 z posledných 4 zápasov
  • Kurz na výhru: 3,50
  • Ale analýza xG: Tottenham nedosahuje svoju xG o -3,2 gólov
  • Štatistika naznačuje, že Tottenham by mal vyhrať viac ako 28,6% svojich zápasov
  • Rozhodnutie: Stávka na Tottenham má potenciálnu hodnotu

Closing Line Value a dlhodobý úspech

Zlatý štandard na meranie stávkovej zručnosti je Closing Line Value (CLV). Ide o rozdiel medzi kurzom, na ktorý ste stavili, a kurzom, na ktorý sa zápas uzavrel.

Ak stavíte na výber s kurzom 2,50 a kurz sa uzavrie na 2,30, zachytili ste value — bez ohľadu na to, či daná stávka vyhrala. Pri stovkách stávok je konzistentne pozitívny CLV najsilnejším indikátorom skutočnej zručnosti.

Regresia k priemeru vám pomáha dosiahnuť pozitívny CLV, pretože:

  1. Identifikujete, keď sú kurzy skreslené (vďaka nedávnym výsledkom)
  2. Stavíte proti trendu, keď má regresia vysokú pravdepodobnosť
  3. Dlhodobo profitujete, pretože regresia sa vždy stane

Čo NIE je regresia k priemeru? Časte omyly

Regresia vs. kauzalita — Sports Illustrated curse

Jeden z najslávnejších príkladov nesprávneho pochopenia regresie je Sports Illustrated curse. Viac ako 30 rokov sa hovorilo, že tímy alebo hráči, ktorí boli na obálke Sports Illustrated, rýchlo podľahli a začali podávať horšie výkony.

Ľudia si mysleli: „Musí to byť kliatka! Obálka Sports Illustrated tímu prináša smolu!"

Ale pravda je jednoduchšia. Tímy boli vybrané na obálku práve preto, že dosahovali výnimočné výsledky. A keďže boli výnimočné, boli to pravdepodobne anomálie poháňané šťasťou. Po publikácii sa šťastie vyrovnalo a tímy regredovali k priemeru. Nie obálka spôsobila pokles — regresie k priemeru spôsobila pokles.

To je príklad kauzálnej chyby — pripisovanie príčiny javom, keď je to vlastne len štatistická náhoda.

Ďalší slávny príklad z psychológie je Dunningov-Krugerov efekt. Ľudia, ktorí dosahli extrémne zlé výsledky v teste, si mysleli, že sú lepší, ako v skutočnosti sú. Ale keď sa test zopakoval, výsledky sa zlepšili — nie preto, že by sa ľudia stali lepšími, ale preto, že sa ich prvý výsledok vrátil k priemeru.

Kedy regresia NEneplatí — zmeny štruktúry

Je dôležité pochopiť, že regresia k priemeru predpokladá, že sa nič zásadné nezmenilo. Ak sa zmení:

  • Tréner — nový tréner môže permanentne zlepšiť tím
  • Kľúčový hráč — príchod alebo odchod hviezdy zmení realitu
  • Taktika — zmena herného systému môže permanentne zmeniť výkon
  • Zranenie — zranenie kľúčového hráča nie je regresia, je to zmena okolností

V týchto prípadoch tím nemôže regredovať k „starej" priemeru, pretože sa zmenila základná realita.

Príklad: Manchestru United sa v januári podarilo získať hviezdu v prestupe. Tím začína vyhrávať viac zápasov. To nie je regresia — to je permanentná zmena úrovne.

Ako dlho trvá regresia k priemeru?

Časový horizont

Regresia k priemeru nie je okamžitá. Trvá čas. Ale ako dlho presne?

Výskumy v športe ukazujú, že:

  • Malé odchýlky (±2 góly) sa zvyčajne vyrovnajú v priebehu 10–15 zápasov
  • Stredné odchýlky (±4 góly) trvajú 15–25 zápasov
  • Veľké odchýlky (±6+ gólov) môžu trvať 25–40 zápasov

Ale to nie sú presné čísla — sú to priemery. V niektorých prípadoch sa regresia stane rýchlejšie, v iných pomalšie.

Premenné, ktoré ovplyvňujú rýchlosť regresie

Volatilita výsledkov: Športy s vyššou volatilitou (ako futbal s malým počtom gólov) regredujú pomalšie. Basketbal s vysokým skóre regreduje rýchlejšie, pretože je viac „dátových bodov" na zápas.

Kvalita súperov: Ak tím hrá v ďalších zápasoch proti silnejším súperom, regresia sa môže urýchliť. Ak hrá proti slabším, môže sa spomaliť.

Zmeny v tíme: Ak sa zranení hráči vrátia alebo naopak, časový horizont sa zmení.

Regresia k priemeru v praxi — Ako ju používať

Krok 1: Zbierajte dáta

Aby ste mohli identifikovať regresia k priemeru, potrebujete dáta. Najlepšie zdroje sú:

  • Understat — detailná xG analýza
  • FBref — rozsiahle futbalové štatistiky
  • Infogol — xG a iné pokročilé metriky

Zbierajte minimálne 10–15 posledných zápasov pre každý tím.

Krok 2: Porovnajte výkon s očakávaním

Vypočítajte rozdiel medzi skutočnými gólmi a xG:

  • Tím A: 18 gólov, 13,2 xG = +4,8 (overperformance)
  • Tím B: 10 gólov, 14,5 xG = -4,5 (underperformance)

Čím väčší rozdiel, tým väčšia pravdepodobnosť regresie.

Krok 3: Nájdite hodnotu v kurzoch

Ak kurzy odrážajú nedávne výsledky namiesto xG výkonu, máte príležitosť. Stávka na underperformujúci tím alebo proti overperformujúcemu tímu má zvyčajne lepšiu hodnotu.

Krok 4: Monitorujte regresia

Sledujte, ako sa regresia vyvíja. Ak ste správne identifikovali underperformujúci tím, mali by ste vidieť zlepšenie výsledkov v nasledujúcich 15–30 zápasoch.

Čo hovoria výskumy o regresii k priemeru?

Behaviorálna ekonómia a psychológia

Regresia k priemeru nie je len štatistika — je to aj psychologický jav. Ľudia majú tendenciu pripisovať extrémne výsledky osobným schopnostiam, keď je to vlastne šťastie.

Výskumníci v oblasti behavioral economics (vrátane Daniela Kahnemana a Amosa Tverskya) ukázali, že ľudia sú zlí v pochopení regresie. Keď vidíme výnimočný výkon, myslíme si, že osoba alebo tím je výnimočný — nie že zažívajú šťastie.

To je kľúčový dôvod, prečo sú stávkujúci v nevýhode. Bookmakeri sú si uvedomení regresie a prispôsobujú kurzy. Ale ľudia staviacich sa často nechajú oklamať nedávnymi výsledkami.

Príklady z výskumov

Výskum v baseballe (Lahman database): Analýza MLB tímov z rokov 2015–2016 ukázala, že korelácia medzi víťazstvami z jednej sezóny na druhú je iba 0,54. To znamená, že polovica variácie je vysvetlená šťasťou, nie schopnosťou. Tímy, ktoré vyhrali veľa zápasov v roku 2015, zvyčajne vyhrali menej v roku 2016.

Výskum v zdravotníctve: Jedným z prvých aplikácií regresie k priemeru bolo zdravotníctvo. Pacienti, ktorí boli prijatí do nemocnice s extrémne vysokým krvným tlakom, zvyčajne mali nižší tlak pri ďalšej kontrole — nie preto, že by liečba fungovala, ale preto, že sa ich vysoký tlak vrátil k priemeru. To je dôvod, prečo lekári čakajú na viacero meraní pred diagnózou.

Časté otázky o regresii k priemeru

Čo presne meria xG a ako súvisí s regresou k priemeru?

xG (Expected Goals) priradí každej strele pravdepodobnosť na základe historických dát o podobných strelách. Penalta má xG okolo 0,76 (76% sa premení). Strela z 30 metrov môže mať xG 0,03. Súčet všetkých striel v zápase dáva celkový xG tímu.

xG súvisí s regresou k priemeru, pretože odráža očakávaný výkon — nie skutočný. Ak tím strelil 20 gólov, ale jeho xG je len 14, prekonáva očakávanie. Regresia k priemeru hovorí, že v budúcnosti by mal strelať bližšie k 14 gólom na zápas (alebo menej), nie 20.

Je regresia k priemeru šťastie alebo štatistika?

Oboje. Regresia k priemeru je štatistický jav, ktorý sa vyskytuje, pretože šťastie (a smola) sa vyrovnáva. V krátkodobom horizonte dominuje šťastie. V dlhodobom horizonte dominuje štatistika. Regresia je bod, kde sa obe stretávajú.

Ako dlho by som mal počkať, kým sa regresia prejaví?

Minimálne 10–15 zápasov. Ale to je len začiatok. Ak je odchýlka veľká (±6+ gólov), regresia môže trvať 25–40 zápasov. Čím väčšia odchýlka, tým dlhšie trvá regresie.

Môže regresia k priemeru predpovedať výsledky zápasov?

Čiastočne. Regresia k priemeru vám hovorí, že extrémne výsledky sa vrátia k priemeru — ale ako sa vrátia, je ťažko predpovedať. Tím s overperformance môže:

  • Stratiť všetky ďalšie zápasy (rýchla regresia)
  • Postupne stratí zápasy (pomalá regresia)
  • Vyhrať jeden zápas, potom stratiť dva (nepravidelná regresia)

Regresia vám dáva smer — ale nie presný časový plán.

Ako sa regresia k priemeru vzťahuje na Closing Line Value?

Closing Line Value (CLV) je rozdiel medzi kurzom, na ktorý ste stavili, a kurzom, na ktorý sa zápas uzavrel. Regresia k priemeru vám pomáha dosiahnuť pozitívny CLV, pretože:

  1. Identifikujete, keď sú kurzy skreslené vďaka nedávnym výsledkom
  2. Stavíte proti trendu, keď má regresia vysokú pravdepodobnosť
  3. Dlhodobo profitujete, pretože regresia sa vždy stane

Ak stavíte na underperformujúci tím s kurzom 3,50 a kurz sa uzavrie na 3,00 (pretože tím začína vyhrávať viac zápasov), máte pozitívny CLV — bez ohľadu na to, či daná stávka vyhrala.

Záver

Regresia k priemeru je jedným z najpotentnejších konceptov v športe a stávkovaní. Pochopenie, že extrémne výsledky sú zvyčajne kombináciou schopnosti a šťastia — a že šťastie sa vždy vyrovná — vám dáva výhodu.

Pre stávkujúcich je to znamená:

  • Nepodľahnite hype okolo overperformujúcich tímov
  • Hľadajte hodnotu u underperformujúcich tímov
  • Staňte sa na xG, nie na nedávne výsledky
  • Čakajte na dostatočne veľkú vzorku (10–15 zápasov) pred rozhodnutím

Pre analytikov to znamená:

  • Rozlišujte medzi šťasťou a zručnosťou
  • Používajte pokročilé metriky (xG, xGA) na presnejšiu analýzu
  • Nepripisujte kauzalitu javom, ktoré sú len štatistické

Regresia k priemeru nie je kliatka — je to zákon štatistiky. A keď ho chápete a používate správne, môže vám priniesť skutočnú výhodu.

Súvisiace pojmy

Betmana.sk je affiliate partner stávkovej spoločnosti. Kliknutím na banner opustíte náš web a budete presmerovaní na stránku partnera. 18+. Hrajte zodpovedne (hramzodpovedne.sk)