Hluboké neuronové sítě pro posilované učení
Deep Neural Networks for Reinforcement Learning

Author
Advisor
Hradiš, MichalReferee
Bambušek, DanielGrade
CAltmetrics
Metadata
Show full item recordAbstract
Cílem této práce je použití hlubokých neuronových sítí na problém v posilovaném učení. Používám moji úpravu 2D hry Tuxánci jako testovací prostředí. Jedná se o úpravu, která zajišťuje možnosti využití hry jako prostředí pro strojového učení. Následně řeším problémy s naučením agenta pomocí posilovaného učení algoritmem Double DQN. Pomocí experimentů si prokazuji správné nastavení funkce odměn. The aim of this thesis is to use deep neural networks for task in reinforcement learning. I use my modification of 2D game Tuxánci for the purposes of the test environment. This modification provides the possibility of using the game as an environment for machine learning. Subsequently, Iam solving the task of learning the agent by using reinforcement learning with the Double DQN algorithm.
Keywords
Posilované učení, DQN, Tuxánci, Tensorflow, strojové učení, testovací prostředí, reinforcement learning, DQN, Tuxánci, Tensorflow, machine learning, testing enviromentLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Radek Burget, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen)Date of defence
2022-06-14Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Je používáno perfektní nebo limitované pozorování? Jakým způsobem se agent učí?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/207374Source
LUDVÍK, T. Hluboké neuronové sítě pro posilované učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.Collections
- 2022 [309]