Hluboké posilovaná učení a řešení pohybu robotu typu had
Deep reinforcement learning and snake-like robot locomotion design
Author
Advisor
Matoušek, RadomilReferee
Dobrovský, LadislavGrade
AAltmetrics
Metadata
Show full item recordAbstract
Tato diplomová práce se zabývá použitím posilovaného učení pro úkoly hlubokého učení. V teoretické části je rozebrán potřebný základ k neuronovým sítím a posilovanému učení. Práce popisuje teoretický model posilovaného učení - Markovovské procesy, na konvenčních algoritmech ukazuje některé zajímavé techniky a v rešeršní části ukazuje některé z používaných algoritmů hlubokého posilovaného učení. Praktická část práce se skládá z vlastního modelu robotu a prostředí a z vlastního systému posilovaného učení. This master thesis is discussing application of reinforcement learning in deep learning tasks. In theoretical part, basics about artificial neural networks and reinforcement learning. The thesis describes theoretical model of reinforcement learning process - Markov processes. Some interesting techniques are shown on conventional reinforcement learning algorithms. Some of widely used deep reinforcement learning algorithms are described here as well. Practical part consist of implementing model of robot and it's environment and of the deep reinforcement learning system itself.
Keywords
Posilované učení, hluboké posilované učení, hluboké učení, neuronové sítě, robot typu had, Python, CoppeliaSim, BlueZero, Reinforcement learning, deep reinforcement learning, reinforcement learning, neural networks, snake-like robot, Python, CoppeliaSim, BlueZeroLanguage
čeština (Czech)Study brunch
Aplikovaná informatika a řízeníComposition of Committee
doc. Ing. Radomil Matoušek, Ph.D. (předseda) doc. Ing. Zuzana Komínková Oplatková, Ph.D. (místopředseda) prof. RNDr. Ing. Jiří Šťastný, CSc. (člen) RNDr. Martin Kuba, Ph.D. (člen) prof. Ing. Miluše Vítečková, CSc. (člen) doc. Ing. Ivan Švarc, CSc. (člen)Date of defence
2020-07-14Process of defence
Student seznámil komisi s obsahem své DP a reagoval na dotazy oponenta DP. Ze strany komise byly pozitivní připomínky.Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/191860Source
KOČÍ, J. Hluboké posilovaná učení a řešení pohybu robotu typu had [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2020.Collections
- 2020 [581]