Popis fotografií pomocí rekurentních neuronových sítí

but.committeedoc. Dr. Ing. Jan Černocký (předseda) prof. Dr. Ing. Pavel Zemčík (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) doc. Ing. Vladimír Drábek, CSc. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) prof. RNDr. Josef Šlapal, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: V citovaných článcích [54, 57] autoři používají RNN pro predikci slov a nikoliv znaků. Na základě čeho jste usoudil, že predikce na úrovni znaků může fungovat? Nesouvisí i vznik nesmyslných slov s predikcí popisků na úrovni znaků? Výstup CNN je také typicky vstupem RNN části, co Vás vedlo k rozhodnutí výstup CNN přivést jako vnitřní stav? Vysvětlete, jak v případě BoW experimentu inicializujete LSTM, které jsou určeny pro predikci na úrovni znaků?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalen
dc.contributor.authorKvita, Jakuben
dc.contributor.refereeŠpaněl, Michalen
dc.date.accessioned2018-10-21T17:07:28Z
dc.date.available2018-10-21T17:07:28Z
dc.date.created2016cs
dc.description.abstractTato práce se zabývá automatickým generovaním popisů obrázků s využitím několika druhů neuronových sítí. Práce je založena na článcích z MS COCO Captioning Challenge 2015 a znakových jazykových modelech, popularizovaných A. Karpathym. Navržený model je kombinací konvoluční a rekurentní neuronové sítě s architekturou kodér--dekodér. Vektor reprezentující zakódovaný obrázek je předáván jazykovému modelu jako hodnoty paměti LSTM vrstev v síti. Práce zkoumá, na jaké úrovni je model s takto jednoduchou architekturou schopen popisovat obrázky a jak si stojí v porovnání s ostatními současnými modely. Jedním ze závěrů práce je, že navržená architektura není dostatečná pro jakýkoli popis obrázků.en
dc.description.abstractIn this work I deal with automatic generation of image captions by using multiple types of neural networks. Thesis is based on the papers from MS COCO Captioning Challenge 2015 and character language models, popularized by A. Karpathy. Proposed model is combination of convolutional and recurrent neural network with encoder--decoder architecture. Vector representing encoded image is passed to language model as memory values of LSTM layers in the network. This work investigate, whether model with such simple architecture is able to generate captions and how good it is in comparison to other contemporary solutions. One of the results is that the proposed architecture is not sufficient for any image captioning task.cs
dc.description.markBcs
dc.identifier.citationKVITA, J. Popis fotografií pomocí rekurentních neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96505cs
dc.identifier.urihttp://hdl.handle.net/11012/61816
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrekurentní neuronové sítěen
dc.subjectRNNen
dc.subjectkonvoluční neuronové sítěen
dc.subjectCNNen
dc.subjectpopisování obrázkůen
dc.subjectLSTMen
dc.subjectGRUen
dc.subjectMS COCOen
dc.subjectTorchen
dc.subjecthluboké učeníen
dc.subjectrecurrent neural networkscs
dc.subjectRNNcs
dc.subjectconvolutional neural networkscs
dc.subjectCNNcs
dc.subjectimage captioningcs
dc.subjectLSTMcs
dc.subjectGRUcs
dc.subjectMS COCOcs
dc.subjectTorchcs
dc.subjectdeep learningcs
dc.titlePopis fotografií pomocí rekurentních neuronových sítíen
dc.title.alternativeImage Captioning with Recurrent Neural Networkscs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2016-06-21cs
dcterms.modified2020-05-10-16:12:38cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid96505en
sync.item.dbtypeZPen
sync.item.insts2021.11.23 00:10:06en
sync.item.modts2021.11.22 23:04:07en
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.15 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18734_v.pdf
Size:
85.95 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18734_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18734_o.pdf
Size:
93.17 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18734_o.pdf
Loading...
Thumbnail Image
Name:
review_96505.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_96505.html
Collections