• čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • English 
    • čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2022
  • View Item
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2022
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Hluboké neuronové sítě pro posilované učení

Deep Neural Networks for Reinforcement Learning

Thumbnail
View/Open
review_145248.html (1.448Kb)
final-thesis.pdf (15.59Mb)
Posudek-Vedouci prace-24975_v.pdf (85.86Kb)
Posudek-Oponent prace-24975_o.pdf (87.47Kb)
Author
Ludvík, Tomáš
Advisor
Hradiš, Michal
Referee
Bambušek, Daniel
Grade
C
Altmetrics
Metadata
Show full item record
Abstract
Cílem této práce je použití hlubokých neuronových sítí na problém v posilovaném učení. Používám moji úpravu 2D hry Tuxánci jako testovací prostředí. Jedná se o úpravu, která zajišťuje možnosti využití hry jako prostředí pro strojového učení. Následně řeším problémy s naučením agenta pomocí posilovaného učení algoritmem Double DQN. Pomocí experimentů si prokazuji správné nastavení funkce odměn. 
 
The aim of this thesis is to use deep neural networks for task in reinforcement learning. I use my modification of 2D game Tuxánci for the purposes of the test environment. This modification provides the possibility of using the game as an environment for machine learning. Subsequently, Iam solving the task of learning the agent by using reinforcement learning with the Double DQN algorithm.
 
Keywords
Posilované učení, DQN, Tuxánci, Tensorflow, strojové učení, testovací prostředí, reinforcement learning, DQN, Tuxánci, Tensorflow, machine learning, testing enviroment
Language
čeština (Czech)
Study brunch
Informační technologie
Composition of Committee
doc. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Radek Burget, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen)
Date of defence
2022-06-14
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Je používáno perfektní nebo limitované pozorování? Jakým způsobem se agent učí?
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/207374
Source
LUDVÍK, T. Hluboké neuronové sítě pro posilované učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.
Collections
  • 2022 [309]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV