Detekce Akustické Prostředí z Řeči
Acoustic Scene Classification from Speech

Автор
Advisor
Matějka, PavelReferee
Beneš, KarelGrade
AAltmetrics
Metadata
Показати повний опис матеріалуКороткий опис(реферат)
Tato práce se zabývá vytvořením systému, jehož úkolem je z audio signálu rozpoznat, na jakém místě byla vstupní nahrávka pořízena. Klasifikátor je založen na vícevrstvé hustě propojené neuronové síti. Topologie neuronové sítě vychází ze základního systému, poskytovaného k soutěži DCASE. Pro její trénování a evaluaci je využita datová sada rovněž z této soutěže. Experimenty jsou prováděny zejména s reprezentací vlastností jednotlivých audio nahrávek a formátem vstupních dat. Za tímto účelem jsou využity Mel-filter bank, blok Mel-filter bank a MFCC příznaky. Experimenty, provedené v této práci, přinesly oproti základnímu systému soutěže DCASE vyšší přesnost klasifikace o 6.5 %. Celková úspěšnost systému tak dosáhla hodnoty 67.5 %. This thesis deals with creating a system whose task is to recognize what type of location the recording was created at by analyzing the audio signal. The classifier is based on a multi-layer, fully connected neural network. The topology of the neural network is based on the baseline system provided for the DCASE competition. A dataset from this competition is also used for training and evaluating the neural network. The experiments are performed in particular with the representation of the properties of the audio records and with the format of the input data of the neural network. For this purpose, Mel-filter bank, block Mel-filter bank and MFCC flags are used. The experiments performed in this thesis brought a classification accuracy increased by 6.5 % compared to the baseline system of DCASE. Overall system success rate reached 67.5 %.
Keywords
vícevrstvá hustě propojená neuronová síť, akustická klasifikace scény, Mel-filter bank, Mel-frequency cepstral coefficients, delta koeficienty, soutěž DCASE, Voting, multilayer fully connected neural network, acoustic scene classification, Mel-filter bank, Mel-frequency cepstral coefficients, delta coefficients, competition DCASE, VotingLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Michal Novák, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)Date of defence
2018-06-12Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A".Result of the defence
práce byla úspěšně obhájenaSource
GREPL, F. Detekce Akustické Prostředí z Řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.Collections
- 2018 [278]