Automatické rozpoznání akordů pomocí hlubokých neuronových sítí

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato práce se zabývá automatickým rozpoznáváním akordů pomocí neuronových sítí. Tento problém byl rozdělen na dva podproblémy, první podproblém se zaměřuje na experimentální nalezení nejvhodnějšího akustického modelu a druhý na experimentální nalezení nejvhodnějšího jazykového modelu. K celkovému problému se přistupovalo iterativně, kdy nejdříve bylo nalezeno suboptimální řešení prvního podproblému a následně druhého. V práci bylo vytvořeno celkem 19 akustických a 12 jazykových architektur. Pro akustické modely bylo vytvořeno 10 trénovacích datasetů a pro jazykové 3. Celkem bylo natrénováno přes 200 modelů. Nejlepších výsledků bylo dosaženo na akustických modelech reprezentovaných konvolučními sítěmi spolu s jazykovými modely reprezentovanými rekurentními sítěmi s LSTM moduly.
This work deals with automatic chord recognition using neural networks. The problem was separated into two subproblems. The first subproblem aims to experimental finding of most suitable solution for a acoustic model and the second one aims to experimental finding of most suitable solution for a language model. The problem was solved by iterative method. First a suboptimal solution of the first subproblem was found and then the second one. A total of 19 acoustic and 12 language models were made. Ten training datasets was created for acoustic models and three for language models. In total, over 200 models were trained. The best results were achieved on acoustic models represented by convolutional networks together with language models represented by recurent networks with LSTM modules.
Description
Citation
NODŽÁK, P. Automatické rozpoznání akordů pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen)
Date of acceptance
2020-08-26
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných, např. ohledně vyhodnocování modifikací akordů a dosažené přesnosti, účinnosti vyhodnocování při natrénovaním na skladně jiného žánru než později analyzované či možností detekce falešně zahraných tónů. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A - výborně . Otázky u obhajoby: Objasněte pojem "jazykový model" a jeho potřebu pro řešení - proč je třeba predikovat akordy, když ty tvoří samotnou skladbu a jejich rozpoznávání provádí neuronová síť (podobně jako navíc predikci v jazykovém modelu)? Jaký závěr dokážete vyvodit z naměřených dat týkajících se výpočetní náročnosti?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO