Detekce jógových pozic v obraze

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Motivací pro tuto práci je koncept mobilní aplikace detekující jógové pozice a zobrazující výsledky uživateli. Cílem této práce je ověření hypotézy, že i jednoduchý model konvoluční neuronové sítě dokáže rozpoznávat a klasifikovat snímky z nahraných jógových sekvencí. Napsal jsem aplikaci, v níž se pořízená videa ručně oanotují. Výsledná data, sestávající ze snímků extrahovaných ze 162 jógových videí na základě jednotlivých anotací, jsou pak použita k trénování modelu sítě. Vytvořený Dataset obsahuje 22 000 obrázků reprezentující 22 různých jógových pozic. Snímky jsou z videí extrahovány pomocí knihovny OpenCV, trénování modelu je plně v režii platformy TensorFlow a API Keras, a výsledky jsou vizualizovány pomocí nástroje TensorBoard. Přesnost modelu detekovat jógové pozice dosahuje 91% při použití aktivační funkce sigmoid a  binary cross-entropy loss function. I přes slibně vypadající dosažené výsledky jsou hlavním přínosem této práce nástroje pro tvorbu datasetu a vytvořený Dataset samotný. Díky nim byla navrhovaná hypotéza úspěšně ověřena.
The motivation for this thesis is the concept of a smartphone app detecting Yoga poses and displaying Yoga frames to a user. The goal of this project is proving that even a simple Convolutional Neural Network (CNN) model can be trained to recognize and classify video frames from a Yoga session. I created an application in which the videos are manually annotated. The data, consisting of frames captured from 162 collected videos based on the annotations, is then passed to train a CNN model. The Dataset consists of 22 000 images of 22 different Yoga poses. The frames are captured using the OpenCV library, the training process is handled by the TensorFlow platform and the Keras API, and the results are visualized in the TensorBoard toolkit. The Model's multi-class classification accuracy reaches 91% when the binary cross-entropy loss function and the sigmoid activation function are used. Despite the promising experimental results, the main contributions are the dataset forming tools and the Dataset itself, which both helped to confirm the proof-of-concept.
Description
Citation
KUTÁLEK, J. Detekce jógových pozic v obraze [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Dr. Ing. Pavel Zemčík (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen)
Date of acceptance
2021-06-14
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Kde jste prováděl trénování navržených sítí? Bylo vyzkoušeno velké množství variant a na vlastní PC by to patrně trvalo neúměrně dlouho. V práci tahle skutečnost nebyla zmíněna. Uvažoval jste nad využitím detekce kostry člověka, jak bylo navrženo v zadání práce?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO