Hluboké neuronové sítě pro posilované učení

Loading...
Thumbnail Image
Date
ORCID
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práce popisuje trénovací prostředí pro trénování postavičky chodící po dvou končetinách. Prostředí je implementováno v AI Gym pomocí fyzikálního modelu PyBullet. Úlohy z prostředí jsou řešené pomocí posilovaného učení algoritmem ActorCritic. Každá z úloh je zaměřená na základní pohyby postavičky. Práce ukazuje, pomocí jakých funkcí odměn je algoritmus schopen dospět k řešení úloh.
The paper describes a training environment for training a character how to walk. The environment is implemented in Al Gym by using the PyBullet physical model. Tasks from the environment are solved by using reinforcement learning by the ActorCritic algorithm. Each of the tasks is focused on the fundamental movements of the character. The paper show, which reward functions are used by the algorithm to solve given tasks.
Description
Citation
KOŠÁK, V. Hluboké neuronové sítě pro posilované učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) doc. Ing. Radek Burget, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen)
Date of acceptance
2021-06-14
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Které části vytvořeného prostředí a algoritmu by bylo nutné upravit, pokud bychom chtěli experimentovat s postavičkou se čtyřmi nohami?  
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO