Využití opakovaně posilovaného učení pro řízení čtyřnohého robotu

but.committeecs
but.defenceTéma DP a použité metody řešení náleží mezi zcela soudobou problematiku teorie řízení inteligentních robotů. Navržená možnost řízení využitím posilovaného učení byla optimalizována na chůzi čtyřnohého robotu a ověřena na modelu 3 režimů chůze na základě vypracování SW zabezpečení dynamických simulací kráčení pro různé způsoby chůze.cs
but.jazykčeština (Czech)
but.programAplikované vědy v inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBřezina, Tomášcs
dc.contributor.authorOndroušek, Vítcs
dc.contributor.refereeMaga,, Dušancs
dc.contributor.refereeMaňas, Pavelcs
dc.contributor.refereeSingule, Vladislavcs
dc.date.accessioned2014-12-10T01:11:12Z
dc.date.available2014-12-10T01:11:12Z
dc.date.created2011cs
dc.description.abstractDisertační práce je zaměřena na využití opakovaně posilovaného učení pro řízení chůze čtyřnohého robotu. Hlavním cílem je předložení adaptivního řídicího systému kráčivého robotu, který budem schopen plánovat jeho chůzi pomocí algoritmu Q-učení. Tohoto cíle je dosaženo komplexním návrhem třívrstvé architektury založené na paradigmatu DEDS. Předkládané řešení je vystavěno na návrhu množiny elementárních reaktivních chování. Prostřednictvím simultáních aktivací těchto elementů je vyvozena množina kompozitních řídicích členů. Obě množiny zákonů řízení jsou schopny operovat nejen na rovinném, ale i v členitém terénu. Díky vhodné diskretizaci spojitého stavového prostoru je sestaven model všechn možných chování robotu pod vlivem aktivací uvedených základních i složených řídicích členů. Tento model chování je využit pro nalezení optimálních strategií řízení robotu prostřednictvím schématu Q-učení. Schopnost řídicí jednotky je ukázána na řešení tří komplexních úloh: rotace robotu, chůze robotu v přímém směru a chůze po nakloněné rovině. Tyto úlohy jsou řešeny prostřednictvím prostorových dynamických simulací čtyřnohého kráčivého robotu se třemi stupni volnosti na každou z noh. Výsledné styly chůze jsou vyhodnoceny pomocí kvantitativních standardizovaných ukazatelů. Součástí práce jsou videozáznamy verifikačních experimentů ukazující činnost elementárních a kompozitních řídicích členů a výsledné naučené styly chůze robotu.cs
dc.description.abstractThe Ph.D. thesis is focused on using the reinforcement learning for four legged robot control. The main aim is to create an adaptive control system of the walking robot, which will be able to plan the walking gait through Q-learning algorithm. This aim is achieved using the design of the complex three layered architecture, which is based on the DEDS paradigm. The small set of elementary reactive behaviors forms the basis of proposed solution. The set of composite control laws is designed using simultaneous activations of these behaviors. Both types of controllers are able to operate on the plain terrain as well as on the rugged one. The model of all possible behaviors, that can be achieved using activations of mentioned controllers, is designed using an appropriate discretization of the continuous state space. This model is used by the Q-learning algorithm for finding the optimal strategies of robot control. The capabilities of the control unit are shown on solving three complex tasks: rotation of the robot, walking of the robot in the straight line and the walking on the inclined plane. These tasks are solved using the spatial dynamic simulations of the four legged robot with three degrees of freedom on each leg. Resulting walking gaits are evaluated using the quantitative standardized indicators. The video files, which show acting of elementary and composite controllers as well as the resulting walking gaits of the robot, are integral part of this thesis.en
dc.description.markPcs
dc.identifier.citationONDROUŠEK, V. Využití opakovaně posilovaného učení pro řízení čtyřnohého robotu [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2011.cs
dc.identifier.other47201cs
dc.identifier.urihttp://hdl.handle.net/11012/4459
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta strojního inženýrstvícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectkráčivý robotcs
dc.subjectkráčivá chůzecs
dc.subjectQ-učenícs
dc.subjectposilované učenícs
dc.subjectwalking roboten
dc.subjectwalking gaiten
dc.subjectQ-learningen
dc.subjectreinforcement learningen
dc.titleVyužití opakovaně posilovaného učení pro řízení čtyřnohého robotucs
dc.title.alternativeUsing of Reinforcement Learning for Four Legged Robot Controlen
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.dateAccepted2011-09-26cs
dcterms.extent7.26 MBcs
dcterms.mediumapplication/pdfen
dcterms.modified2011-09-27-14:38:25cs
eprints.affiliatedInstitution.facultyFakulta strojního inženýrstvícs
sync.item.dbid47201en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 22:44:43en
sync.item.modts2021.11.22 21:29:12en
thesis.disciplineInženýrská mechanikacs
thesis.grantorVysoké učení technické v Brně. Fakulta strojního inženýrství. Ústav automatizace a informatikycs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
7.26 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.avi
Size:
25.85 MB
Format:
Unknown data format
Description:
appendix-1.avi
Loading...
Thumbnail Image
Name:
thesis-1.pdf
Size:
2.02 MB
Format:
Adobe Portable Document Format
Description:
thesis-1.pdf
Loading...
Thumbnail Image
Name:
review_47201.html
Size:
1.9 KB
Format:
Hypertext Markup Language
Description:
review_47201.html
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections