Szczęście, pech, statystyki
W poprzednich tekstach wprowadziliśmy do analizy naszej ligi wskaźniki TSR i PDO. Okazało się, że obecnie mają one umiarkowaną powtarzalność i niezbyt wysoką korelację ze zdobyczą punktową. A co, jeśli je połączyć? Czy można za ich pomocą wyliczyć, ile szczęścia lub pecha ma dana drużyna? Wyniki są obiecujące.
Łącząc TSR z PDO i budując z nich prosty model regresji liniowej w relacji do zdobytych punktów, otrzymujemy bardzo wysoki współczynnik R-kwadrat. Innymi słowy, TSR wraz z PDO w dużym stopniu wyjaśniają zdobycz punktową. W pierwszym tekście mowa była o PDO jako wskaźniku szczęścia bądź pecha, ale teraz można zaproponować coś innego: otóż odchylenie w górę lub w dół od oczekiwań wynikających z modelu byłoby interpretowane jako nadmiar szczęścia lub jego deficyt.
Cofnijmy się do końca poprzedniego sezonu. Model TSR+PDO „wyjaśnia” w 84 proc. zdobycz punktową (R-kwadrat 0,84). Trzeba zaznaczyć, że to, co tu opisano, to nie jest model w sensie jakiejś ustalonej formuły, do której podstawiamy zmienne i wychodzi nam wynik. To raczej obraz ligi na daną chwilę. Jeśli ktoś siedzi głębiej w statystyce, to mogą go rozboleć zęby od uproszczeń, ale trzeba pamiętać, ze jest to tylko zabawa liczbami, w żaden sposób nie pretendująca do powagi naukowej.
Przyjmując, że TSR to miara przewagi drużyny i organizacji gry, a PDO to jakość gry pod obiema bramkami, pozostaje nam 16 proc. do wyjaśnienia innymi czynnikami – szczęściem, decyzjami sędziowskimi, ręką trenera, itp. Załóżmy, że to szczęście – kto zatem miał w ubiegłym sezonie farta, a kto pecha?
W tabeli przedstawiono realną zdobycz punktową tak, jakby nie było dzielenia punktów, a także liczbę punktów wynikającą z „modelu”, a także różnicę. Dodatnia różnica oznacza szczęście, a ujemna pecha.
Rzuca się w oczy „fart” Legii. Ale nawet bez niego byłaby najlepsza, choć z mniejszą przewagą nad Lechem, który z kolei miał lekkiego pecha. Szczęście mocno też sprzyjało Ruchowi i Koronie, a na brak szczęścia narzekać mogli w Białymstoku, Wrocławiu i Gdańsku, a także Łodzi – choć nie uratowałoby to Widzewa przed spadkiem.
Gdyby przyjąć, że suma szczęścia się wyrówna, a w drużynach nie zajdą istotne zmiany, to można było się spodziewać, że w obecnym sezonie Ruch i Korona będą się spisywać słabiej, Legia będzie prowadzić, ale z mniejszą przewagą, zaś Jagiellonia, Śląsk i Lechia się poprawią. Patrząc na aktualną tabelę mamy pięć trafień na sześć. Można się rozochocić wynikami „modelu”.
DRUŻYNA | PUNKTY | MODEL | RÓŻNICA |
---|---|---|---|
Legia Warszawa | 81 | 71.5 | 9.5 |
Lech Poznań | 66 | 69.3 | -3.3 |
Ruch Chorzów | 59 | 49.9 | 9.1 |
Wisła Kraków | 53 | 54.4 | -1.4 |
Lechia Gdańsk | 52 | 56.7 | -4.7 |
Górnik Zabrze | 52 | 49.9 | 2.1 |
Śląsk Wrocław | 51 | 56.4 | -5.4 |
Pogoń Szczecin | 50 | 51.7 | -1.7 |
Jagiellonia Białystok | 48 | 55.7 | -7.7 |
Zawisza Bydgoszcz | 46 | 46.9 | -0.9 |
Podbeskidzie | 45 | 45.2 | -0.2 |
Piast Gliwice | 45 | 42.4 | 2.6 |
Korona Kielce | 44 | 40 | 4 |
Cracovia | 44 | 42.2 | 1.8 |
Widzew Łódź | 33 | 36.8 | -3.8 |
Zagłębie Lubin | 30 | 30 | 0 |
„Model” nie bierze pod uwagę beniaminków. Gdyby założyć stałą formę drużyn i zastosować modelową średnią punktową z poprzedniego sezonu w obecnym sezonie, to tabela po 19. kolejce 2014/15 prezentowałaby się tak:
DRUŻYNA | PUNKTY realnie | MODEL 2013/14 | RÓŻNICA |
---|---|---|---|
Legia Warszawa | 38 | 36.7 | 1.3 |
Lech Poznań | 32 | 35.6 | -3.6 |
Lechia Gdańsk | 21 | 29.1 | -8.1 |
Śląsk Wrocław | 35 | 29 | 6 |
Jagiellonia Białystok | 32 | 28.6 | 3.4 |
Wisła Kraków | 32 | 27.9 | 4.1 |
Pogoń Szczecin | 27 | 26.5 | 0.5 |
Górnik Zabrze | 28 | 25.6 | 2.4 |
Ruch Chorzów | 17 | 25.6 | -8.6 |
Zawisza Bydgoszcz | 9 | 24.1 | -15.1 |
Podbeskidzie Bielsko-Biała | 27 | 23.2 | 3.8 |
Piast Gliwice | 26 | 21.8 | 4.2 |
Cracovia | 22 | 21.7 | 0.3 |
Korona Kielce | 21 | 20.5 | 0.5 |
Zdecydowanie rozczarowuje Zawisza, Ruch i Lechia, in plus zaskakuje Śląsk, Piast i Wisła. R-kwadrat dla „prognozy” na obecnym etapie to 0,38.
Jak to wygląda obecnie? Po 19 kolejkach R-kwadrat modelu to imponujące 0,9. Czyli w 90 proc. „wyjaśnia” on zdobycz punktową.
DRUŻYNA | PUNKTY | MODEL | RÓŻNICA |
---|---|---|---|
Legia Warszawa | 38 | 38 | 0 |
Śląsk Wrocław | 35 | 34.5 | 0.5 |
Lech Poznań | 32 | 34 | -2 |
Wisła Kraków | 32 | 32 | 0 |
Jagiellonia Białystok | 32 | 30.1 | 1.9 |
Podbeskidzie Bielsko-Biała | 27 | 28.9 | -1.9 |
Piast Gliwice | 26 | 28.3 | -2.3 |
Górnik Zabrze | 28 | 25.5 | 2.5 |
Pogoń Szczecin | 27 | 26 | 1 |
GKS Bełchatów | 27 | 25.1 | 1.9 |
Górnik Łęczna | 24 | 22.7 | 1.3 |
Lechia Gdańsk | 21 | 23.9 | -2.9 |
Cracovia | 22 | 18.5 | 3.5 |
Korona Kielce | 21 | 18.5 | 2.5 |
Ruch Chorzów | 17 | 19.8 | -2.8 |
Zawisza Bydgoszcz | 9 | 12.2 | -3.2 |
~ fid