• čeština
    • English
  • English 
    • čeština
    • English
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta elektrotechniky a komunikačních technologií
  • 2018
  • View Item
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta elektrotechniky a komunikačních technologií
  • 2018
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Zpětnovazební učení pro řešení herních algoritmů

Reinforcement learning for solving game algorithms

Thumbnail
View/Open
appendix-1.zip (2.683Mb)
final-thesis.pdf (8.159Mb)
review_110275.html (3.668Kb)
Author
Daňhelová, Jana
Advisor
Kolařík, Martin
Referee
Uher, Václav
Grade
A
Alternative metrics PlumX
http://hdl.handle.net/11012/82371
Altmetrics
http://hdl.handle.net/11012/82371
http://hdl.handle.net/11012/82371
Metadata
Show full item record
Abstract
Bakalářská práce Zpětnovazební učení pro řešení herních algoritmů je rozdělena do dvou částí. V teoretické části jsou popsány a srovnávány základní metody zpětnovazebního učení, přičemž zvláštní pozornost je věnována metodám aktivního učení – Q-učení a hlubokému učení. Praktická část je zaměřena na aplikaci metody deep learning na hru Had. Výsledky jsou prezentovány ve formě programu napsaného v programovacím jazyku Python, který se skládá z herního prostředí vytvořeného v PyGame, modelu konvoluční neuronové sítě zkonstruovaného v knihovně Keras a herního agenta. Výstupem programu je několik typů datasetů ve formátu csv. Získaná data, obsahující hodnoty jednotlivých parametrů jako počet epoch, přesnost, ztráta nebo výše odměny, mohou být následně použita jako podklady pro další zpracování.
 
The bachelor thesis Reinforcement learning for solving game algorithms is divided into two distinct parts. The theoretical part describes and compares the fundamental methods of reinforcement learning with special attention to the methods of active learning – Q-learning and deep learning. In the practical part the deep q-learning technique is chosen for testing and applied to the case of the Snake game. The results are presented in the form of program written in Python programming language, which consists of the game environment created in PyGame, the model of convolutional neural network designed in Keras and agent playing the game. As an output of the program there are several types of datasets in CSV format. The gained data containing the values of parameters like number of epochs, accuracy, loss or the amount of the reward can later be used for further processing.
 
Keywords
zpětnovazební učení, Had, hluboké učení, konvoluční neuronová síť, herní algoritmus, PyGame, Keras, Python 3.5, reinforcement learning, Snake, deep learning, convolutional neural network, game algorithm, PyGame, Keras, Python 3.5
Language
čeština (Czech)
Study brunch
Teleinformatika
Composition of Committee
prof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. Radim Burget, Ph.D. (místopředseda) Ing. David Kubánek, Ph.D. (člen) Ing. Pavel Mašek, Ph.D. (člen) Ing. Tomáš Gerlich (člen) Ing. Ivan Míča, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen)
Date of defence
2018-06-14
Process of defence
Jak se liší konvoluční síť od běžné neuronové sítě? Popište strukturu vámi vytvořené sítě. Vysvětlete zpětné šíření chyby. Vysvětlete pojem drop-out. Vysvětlete, proč jste zvolila rozměr pracovního prostoru 70x70 pixelů?
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/82371
Source
DAŇHELOVÁ, J. Zpětnovazební učení pro řešení herních algoritmů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Collections
  • 2018 [418]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV