GROMAN, M. Sabermetrics - statistická analýza výkonů baseballových hráčů [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2017.

Posudky

Posudek vedoucího

Bednář, Josef

Práce se zabývá statistickou analýzou baseballových hráčů (Sabermetrics). Z matematických nástrojů jsou požity Markovovy řetězce, indexová analýza a lineární regrese. Téma si zvolil student sám a musím říct, že mé počáteční obavy z obtížnosti tématu brzy vyvrátil. Je vidět, že baseball i matematické modely jsou jeho vášní. Většina použitého matematického aparátu nebyla vůbec v bakalářském studiu probírána a student si ho musel nastudovat a zdařile implementovat. Zdařilé je i srovnání teoretických výsledků s realitou. Pracovní morálka studenta byla na výborné úrovni, pracoval samostatně a přicházel s vlastními postupy. Během konzultací projevoval velice solidní znalosti a výborný přehled ve studovaném oboru.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosažené vysledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A
Navrhovaná známka
A

Posudek oponenta

Hrabec, Pavel

Předložená bakalářská práce má 42 stran a je vhodně rozdělena do 4 hlavních kapitol. V první kapitole jsou zavedeny baseballové charakteristiky Sabermetrics. Ve druhé kapitole je popsán dále použitý matematický aparát Markovových řetězců. Ve třetí kapitole jsou vytvořeny lineární regresní modely vybraných charakteristik. Hlavní částí práce ja pak kapitola čtvrtá, ve které autor popisuje svůj model počtu doběhů a povolených doběhů týmů MLB ve druhé polovině sezony 2015. Pomocí těchto modelů se snaží odhadnout počet výher jednotlivých týmů. Svůj odhad poté porovnává s predikcí "běžného fanouška" i skutečnými výsledky. V textu se nachází pouze zanedbatelné množství překlepů, které ale nijak nebrání v jeho čitelnosti a pochopení. Největším nedostatkem tohoto typu je použití množiny stavů T^C, která v textu není definována. V práci mi trošku chybí data, která autor použil, nebo alespoň nějaký způsob jak se k nim dostat. Tento fakt je obzvláště nepříjemný u modelu ERA vícenásobnou lineární regresí, kde autor, narozdíl od ostatních modelů v textu, nezmínil omezení pro jednotlivé vstupní proměnné a tento model udává záporné ERA v počátku, což nedává smysl. Lehkou výtku lze uvést i k poslednímu odstavci závěru, který považuji za zbytečně pesimistický. Práci hodnotím jako výbornou a doporučuji ji k obhajobě.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosaž. vysledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Navrhovaná známka
A

Otázky

eVSKP id 101238