• čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • polski 
    • čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • Zaloguj
Zobacz pozycję 
  •   Strona główna DSpace
  • Závěrečné práce
  • dizertační práce
  • Fakulta strojního inženýrství
  • 2011
  • Zobacz pozycję
  •   Strona główna DSpace
  • Závěrečné práce
  • dizertační práce
  • Fakulta strojního inženýrství
  • 2011
  • Zobacz pozycję
JavaScript is disabled for your browser. Some features of this site may not work without it.

Využití opakovaně posilovaného učení pro řízení čtyřnohého robotu

Using of Reinforcement Learning for Four Legged Robot Control

Thumbnail
Oglądaj/Otwórz
appendix-1.avi (25.85MB)
final-thesis.pdf (7.262MB)
thesis-1.pdf (2.021MB)
review_47201.html (1.895KB)
Autor
Ondroušek, Vít
Advisor
Březina, Tomáš
Referee
Maga,, Dušan
Maňas, Pavel
Singule, Vladislav
Grade
P
Altmetrics
Metadata
Pokaż pełny rekord
Streszczenie
Disertační práce je zaměřena na využití opakovaně posilovaného učení pro řízení chůze čtyřnohého robotu. Hlavním cílem je předložení adaptivního řídicího systému kráčivého robotu, který budem schopen plánovat jeho chůzi pomocí algoritmu Q-učení. Tohoto cíle je dosaženo komplexním návrhem třívrstvé architektury založené na paradigmatu DEDS. Předkládané řešení je vystavěno na návrhu množiny elementárních reaktivních chování. Prostřednictvím simultáních aktivací těchto elementů je vyvozena množina kompozitních řídicích členů. Obě množiny zákonů řízení jsou schopny operovat nejen na rovinném, ale i v členitém terénu. Díky vhodné diskretizaci spojitého stavového prostoru je sestaven model všechn možných chování robotu pod vlivem aktivací uvedených základních i složených řídicích členů. Tento model chování je využit pro nalezení optimálních strategií řízení robotu prostřednictvím schématu Q-učení. Schopnost řídicí jednotky je ukázána na řešení tří komplexních úloh: rotace robotu, chůze robotu v přímém směru a chůze po nakloněné rovině. Tyto úlohy jsou řešeny prostřednictvím prostorových dynamických simulací čtyřnohého kráčivého robotu se třemi stupni volnosti na každou z noh. Výsledné styly chůze jsou vyhodnoceny pomocí kvantitativních standardizovaných ukazatelů. Součástí práce jsou videozáznamy verifikačních experimentů ukazující činnost elementárních a kompozitních řídicích členů a výsledné naučené styly chůze robotu.
 
The Ph.D. thesis is focused on using the reinforcement learning for four legged robot control. The main aim is to create an adaptive control system of the walking robot, which will be able to plan the walking gait through Q-learning algorithm. This aim is achieved using the design of the complex three layered architecture, which is based on the DEDS paradigm. The small set of elementary reactive behaviors forms the basis of proposed solution. The set of composite control laws is designed using simultaneous activations of these behaviors. Both types of controllers are able to operate on the plain terrain as well as on the rugged one. The model of all possible behaviors, that can be achieved using activations of mentioned controllers, is designed using an appropriate discretization of the continuous state space. This model is used by the Q-learning algorithm for finding the optimal strategies of robot control. The capabilities of the control unit are shown on solving three complex tasks: rotation of the robot, walking of the robot in the straight line and the walking on the inclined plane. These tasks are solved using the spatial dynamic simulations of the four legged robot with three degrees of freedom on each leg. Resulting walking gaits are evaluated using the quantitative standardized indicators. The video files, which show acting of elementary and composite controllers as well as the resulting walking gaits of the robot, are integral part of this thesis.
 
Keywords
kráčivý robot, kráčivá chůze, Q-učení, posilované učení, walking robot, walking gait, Q-learning, reinforcement learning
Language
čeština (Czech)
Study brunch
Inženýrská mechanika
Composition of Committee
Date of defence
2011-09-26
Process of defence
Téma DP a použité metody řešení náleží mezi zcela soudobou problematiku teorie řízení inteligentních robotů. Navržená možnost řízení využitím posilovaného učení byla optimalizována na chůzi čtyřnohého robotu a ověřena na modelu 3 režimů chůze na základě vypracování SW zabezpečení dynamických simulací kráčení pro různé způsoby chůze.
Result of the defence
práce byla úspěšně obhájena
URI
http://hdl.handle.net/11012/4459
Source
ONDROUŠEK, V. Využití opakovaně posilovaného učení pro řízení čtyřnohého robotu [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2011.
Collections
  • 2011 [40]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Kontakt z nami | Wyślij uwagi | Theme by @mire NV
 

 

Przeglądaj

Całe DSpaceZbiory i kolekcje Daty wydaniaAutorzyTytułyTematyTa kolekcjaDaty wydaniaAutorzyTytułyTematy

Moje konto

ZalogujZarejestruj

Statystyki

Przejrzyj statystyki użycia

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Kontakt z nami | Wyślij uwagi | Theme by @mire NV