Sémantická segmentace obrazu pomocí konvolučních neuronových sítí

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta strojního inženýrství
Abstract
Tato práce se zabývá rešerší a implementací vybraných architektur konvolučních neuronových sítí pro segmentaci obrazu. V první části jsou shrnuty základní pojmy z teorie neuronových sítí. Tato část také představuje silné stránky konvolučních sítí v oblasti rozpoznávání obrazových dat. Teoretická část je uzavřena rešerší zaměřenou na konkrétní architekturu používanou na segmentaci scén. Implementace této architektury a jejích variant v Caffe je převzata a upravena pro konkrétní použití v praktické části práce. Nedílnou součástí tohoto procesu jsou kroky potřebné ke správnému nastavení softwarového a hardwarového prostředí. Příslušná kapitola proto poskytuje přesný návod, který ocení zejména noví uživatelé Linuxu. Pro trénování všech variant vybrané sítě je vytvořen vlastní dataset obsahující 2600 obrázků. Je také provedeno několik nastavení původní implementace, zvláště pro účely použití předtrénovaných parametrů. Trénování zahrnuje výběr hyperparametrů, jakými jsou například typ optimalizačního algoritmu a rychlost učení. Na závěr je provedeno vyhodnocení výkonu a výpočtové náročnosti všech natrénovaných sítí na testovacím datasetu.
This thesis deals with the research and implementation of selected architectures of Convolutional Neural Networks (CNNs) for image segmentation. The fundamental terms from the theory of neural networks are summarized in the first part. It also presents the power of CNNs in the field of image data classification. The theoretical part concludes with the research focused on the particular network architecture and its variants used for scene segmentation. In the practical part, the Caffe implementation of the network is taken from its authors and tailored to the specific needs of this study. The steps required to properly set up the software and hardware environments are an essential part of the process. Therefore, the corresponding chapter gives a step-by-step guide that is especially helpful to new Linux users. A custom dataset containing 2600 segmented images is created and used for training all variants of the selected network. Several adjustments of the original implementation are performed, especially for applying the method of using pre-trained parameters of the networks. The training phase includes a selection of hyperparameters, such as the type of optimization algorithm. Finally, the performance and computational cost of the variants of the trained network are evaluated on a testing dataset.
Description
Citation
ŠPILA, F. Sémantická segmentace obrazu pomocí konvolučních neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2020.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Mechatronika
Comittee
RNDr. Vladimír Opluštil (předseda) doc. Ing. Robert Grepl, Ph.D. (místopředseda) prof. RNDr. Ing. Tomáš Březina, CSc. (člen) Ing. Dalibor Červinka, Ph.D. (člen) doc. Ing. Jiří Krejsa, Ph.D. (člen) doc. Ing. Peter Kriššák, Ph.D. (člen) doc. Ing. Radoslav Cipín, Ph.D. (člen) Ing. Josef Ferda (člen) mjr. Ing. Václav Křivánek, Ph.D. (člen)
Date of acceptance
2020-07-21
Defence
Student v prezentaci představil svou práci. Po přečtení posudku vedoucího práce a posudku oponenta práce student odpověděl na otázku položenou oponentem. Tuto otázku zodpověděl bez zaváhání. Dále odpovídal na otázky položené jednotlivými členy komise, směřující např. na původ použitých obrazových dat a možnost využití daného přístupu pro navigaci mobilního robota. Celé vystoupení včetně odpovědí na položené otázky hodnotila komise jako výborné.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO