Posilované učení pro hraní robotického fotbalu
Reinforcement Learning for RoboCup
Abstract
Tato práce se zabývá tvorbou umělé inteligence schopné ovládat robotického hráče fotbalu simulovaného v prostředí SimSpark. Vytvořená umělá inteligence rozšiřuje již hotového agenta, který poskytuje implementaci základních dovedností jako je orientace na hřišti, pohyb v osmi směrech a nebo driblování s balonem. Umělá inteligence se stará o výběr nejvhodnější akce v závislosti na situaci na hřišti. Pro její implementaci byla použita metoda posilovaného učení - Q-learning. Pro výběr nejlepší akce je situace na hřišti převedena do formy 2D obrazu s několika rovinami. Tento obraz je následně analyzován hlubokou konvoluční neuronovou sítí implementované pomocí C++ knihovny DeepCL. Goal of this thesis is creation of artificial intelligence capable of controlling robotic soccer player simulated in SimSpark environment. Agent created is expanding capabilities of existing third party agent which provides set of basic skills such as localization on the field, dribbling with the ball and omnidirectional walk. Responsibility of the created agent is to pick the best action based current state of the game. This decision making was implemented using reinforcement learning and its method Q-learning. State of the game is transformed into 2D picture with several planes. This picture is then analyzed using deep convolution neural network implemented using C++ and DeepCL library.
Keywords
Strojové učení, posilované učení, hluboké neuronové sítě, konvoluční neuronové sítě, Q-learning, robotický fotbal, RoboCup, Machine learning, reinforcement learning, deep neural networks, convolution neural networks, Q-learning, robotic soccer, RoboCupLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen) Ing. Marcela Zachariášová, Ph.D. (člen)Date of defence
2017-06-14Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " D ". Otázky u obhajoby: Rozeberte a dejte do kontextu problematiku předávání informací o směru robota a cíli pohybu robota pomocí obrázku (grafické vrstvy). Zaměřte se na možnosti předávání podobných informací do neuronové sítě efektivnějším způsobem. Diskutujte náročnost učení jednotlivých činností s ohledem na použitelnost řešení. Kde je hranice, kdy už je učení příliš náročné (časově či výpočetně)? Z jakého důvodu nebyly implementovány akce pro práci s míčem?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/69787Source
BOČÁN, H. Posilované učení pro hraní robotického fotbalu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017.Collections
- 2017 [328]