Ekstraklasa w Monte Carlo

Ekstraklasa w Monte Carlo

Każdy mecz rozgrywany jest tylko raz. O jego wyniku może przesądzić jedno zdarzenie, pech lub szczęście, przypadek albo rzadko popełniany błąd. A jeśli każdy mecz rozegrany byłby 10000 razy? Sprawdziliśmy to. Wyniki mogą się nie spodobać w Gdańsku i Gliwicach.

Półmetek sezonu zasadniczego to dobry moment na podsumowania. W tym tekście przyjrzymy się Ekstraklasie w kilku ujęciach, łącznie z tzw. symulacją Monte Carlo, w której każdy mecz zostanie rozegrany 10 000 razy, by zobaczyć, jak mógł ten sezon wyglądać przy mniejszej roli przypadku.

Punktem wyjścia są omawiane już wcześniej gole oczekiwane. W skrócie: każdemu oddanemu strzałowi przypisane jest prawdopodobieństwo, że padnie po nim gol. Pod uwagę brana jest strefa, z której pada strzał, oraz to, czy jest to strzał nogą czy głową. Nie jest to metoda doskonała (a, jak zobaczymy poniżej, „wyjaśnia” wyniki w mniejszym stopniu niż np. „zwykłe” celne strzały), jednak urealnia statystyki i może dać lepsze pojęcie o faktycznej jakości gry danego zespołu.

Gole oczekiwane mają swoje słabe strony. Nie uwzględniają tego, ilu zawodników rywala jest między strzelającym a bramką, ile strzelający ma czasu i miejsca, czy uderza z „trudnej” czy „łatwej” piłki. Nie bierze pod uwagę dobrych sytuacji, które nie kończą się strzałem. Ponadto, premiuje zespoły, które dobijają własne strzały. Jeśli drużyna A zdobędzie gola po pierwszym strzale, będzie miała mniej oczekiwanych goli niż drużyna B, która z analogicznej pozycji gola nie strzeli, za to będzie strzał dobijać. Słabości goli oczekiwanych można pewnie mnożyć, ale na razie nie mamy lepszego wskaźnika. Zobaczmy więc, co on nam mówi o Ekstraklasie.

Poniższa tabela zestawia zdobycz punktową (pkt), różnicę bramek (GD), oczekiwaną różnicę bramek (xGD), różnicę strzałów (SD) i strzałów celnych (SoTD).

Lp.klubpktGDxGDSDSoTD
1.Jagiellonia Białystok30178,839439
2.Legia Warszawa2256,325836
3.Lech Poznań2246,058627
4.Pogoń Szczecin2155,623722
5.Cracovia1743,347827
6.Wisła Płock16-30,05-7-13
7.Górnik Łęczna14-4-0,3928-5
8.Arka Gdynia201-0,462-6
9.Bruk-Bet24-4-1,28-44-17
10.Wisła Kraków18-7-1,6225-8
11.Lechia Gdańsk305-1,84-19-4
12.Zagłębie Lubin248-1,84-47-4
13.Śląsk Wrocław213-3,04-84-4
14.Korona Kielce17-15-3,53-27-27
15.Ruch Chorzów14-11-3,78-67-32
16.Piast Gliwice17-8-12,43-113-31

Zdobycz punktową w największym stopniu „wyjaśnia” różnica bramek (R-kwadrat 0,55), potem różnica strzałów celnych (0,22), goli oczekiwanych (0,15) i różnica strzałów ogółem (0,05).

Z różnicy goli oczekiwanych wynika, że rezultat powyżej oczekiwań ma Bruk-Bet, Zagłębie, Śląsk i Lechia. Trzeba jednak pamiętać, że zawodnicy najwyższej klasy z reguły mają wyniki lepsze niż gole oczekiwane, gdyż model nie wychwytuje tego, że w tych samych strefach tworzą sobie lepsze okazje niż przeciętni ligowcy i skuteczniej wykańczają sytuacje. To mogłoby tłumaczyć wynik Lechii. Tyle, że wicelider ma również ujemny bilans strzałów i strzałów celnych. A to już powinno dać do myślenia. Można co prawda zwrócić uwagę, że Lechia bardzo długimi okresami jest na prowadzeniu (drugi wynik po Jagiellonii), a drużyna goniąca wynik z reguły oddaje więcej strzałów (temat omówiony w „Przewodniku Kibica” – edycja wiosna 2015/16). Podobne zjawisko występuje w przypadku Zagłębia. Z drugiej jednak strony, przykład drużyny z Białegostoku wskazuje, że nie musi to być wytłumaczeniem.  A skoro już jesteśmy przy liderze – każdą miarą jest to prowadzenie zasłużone. W świetnych wynikach drużyny Probierza nie ma przypadku.

Natomiast możliwe, że o przypadku można mówić, gdy patrzy się na niskie miejsca w tabeli Cracovii, a także Wisły Płock i Górnika Łęczna. Wedle miar innych niż punkty, te zespoły powinny być wyżej w tabeli. Zaś na jej dnie powinien znajdować się Piast, druga drużyna poprzedniego sezonu.

Przechodząc do symulacji sezonu, każdy mecz, a dokładniej każdy strzał w meczu został „rozegrany” 10 000 razy, co pozwoliło na oszacowanie prawdopodobieństw, jakimi wynikami „powinny” się zakończyć te mecze. Na przykład, w przypadku meczu Ruch – Lech (0:5), w 85,9% przypadków wygrywają goście, w 11% symulacji pada remis, a gospodarze wygrali tylko 3,1% wirtualnych spotkań. Te prawdopodobieństwa zostają przeliczone na punkty, wedle wzoru „prawdopodobieństwo wygranej x 3 + prawdopodobieństwo remisu x 1”. Takie podejście spłaszczy tabelę, bo w rzeczywistości drużyny dostają 3, 1 lub 0 pkt., a w przypadku omawianego meczu Ruch dostaje 0,2 pkt., a Lech 2,7 pkt. (a jest to przypadek dość ekstremalny, większość meczów jest bardziej wyrównana).

Lp.klubpktx pktSzansa
1.Arka Gdynia20209,20%
2.Bruk-Bet24205,60%
3.Cracovia17234,20%
4.Górnik Łęczna14204,00%
5.Jagiellonia Białystok30287,80%
6.Korona Kielce17189,00%
7.Lech Poznań22257,80%
8.Lechia Gdańsk30200,60%
9.Legia Warszawa22248,40%
10.Piast Gliwice17123,70%
11.Pogoń Szczecin21256,40%
12.Ruch Chorzów14186,80%
13.Śląsk Wrocław21187,40%
14.Wisła Kraków18209,00%
15.Wisła Płock16215,50%
16.Zagłębie Lubin24205,30%

Wnioski? Przede wszystkim taki, że po wszystkich symulacjach liczba oczekiwanych punktów (x pkt) niemal idealnie odwzorowuje oczekiwaną różnicę bramek (R-kwadrat 0,99). Dlatego na przyszłość można się ograniczyć tylko do oczekiwanej różnicy bramek. Natomiast rozgrywanie sezonu tysiące razy przyda się przy ocenie, jak prawdopodobne są wyniki poszczególnych zespołów, co pokazuje kolumna „szansa”. Widać, jak mało prawdopodobny jest scenariusz, w którym Lechia ma 30 pkt. Natomiast wyniki w granicach 8-9% to są okolice najbardziej prawdopodobnych zdobyczy punktowych.

Na koniec  trzy wykresy, sporządzone w programie gretl. Pierwszy zestawia wybrane kluby, które mają taką samą zdobycz punktową (Jagiellonia i Lechia, oraz Cracovia, Korona i Piast) z wynikającym z symulacji rozkładem zdobyczy punktowej, gdyby sezon rozegrać 10 000 razy. Czerwone linie to faktyczna zdobycz punktowa (30 pkt. na górze i 17 na dole), zaś najbardziej prawdopodobne scenariusze to „pudełka”.

montecarlo_1

Dwa kolejne zaś pokazują, jak prawdopodobne są osiągnięte wyniki punktowe Lechii i Arki.

montecarlo_2
montecarlo_3

Tematyka oczekiwanych punktów i przewidywania wyników na pewno wróci na nasze łamy, już niebawem.

~fid

Udostępnij innym ten wpis:

Komentarze: