Detekce Akustické Prostředí z Řeči
Acoustic Scene Classification from Speech

Autor
Vedoucí práce
Matějka, PavelOponent
Beneš, KarelKlasifikace
AAltmetrics
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá vytvořením systému, jehož úkolem je z audio signálu rozpoznat, na jakém místě byla vstupní nahrávka pořízena. Klasifikátor je založen na vícevrstvé hustě propojené neuronové síti. Topologie neuronové sítě vychází ze základního systému, poskytovaného k soutěži DCASE. Pro její trénování a evaluaci je využita datová sada rovněž z této soutěže. Experimenty jsou prováděny zejména s reprezentací vlastností jednotlivých audio nahrávek a formátem vstupních dat. Za tímto účelem jsou využity Mel-filter bank, blok Mel-filter bank a MFCC příznaky. Experimenty, provedené v této práci, přinesly oproti základnímu systému soutěže DCASE vyšší přesnost klasifikace o 6.5 %. Celková úspěšnost systému tak dosáhla hodnoty 67.5 %. This thesis deals with creating a system whose task is to recognize what type of location the recording was created at by analyzing the audio signal. The classifier is based on a multi-layer, fully connected neural network. The topology of the neural network is based on the baseline system provided for the DCASE competition. A dataset from this competition is also used for training and evaluating the neural network. The experiments are performed in particular with the representation of the properties of the audio records and with the format of the input data of the neural network. For this purpose, Mel-filter bank, block Mel-filter bank and MFCC flags are used. The experiments performed in this thesis brought a classification accuracy increased by 6.5 % compared to the baseline system of DCASE. Overall system success rate reached 67.5 %.
Klíčová slova
vícevrstvá hustě propojená neuronová síť, akustická klasifikace scény, Mel-filter bank, Mel-frequency cepstral coefficients, delta koeficienty, soutěž DCASE, Voting, multilayer fully connected neural network, acoustic scene classification, Mel-filter bank, Mel-frequency cepstral coefficients, delta coefficients, competition DCASE, VotingJazyk
čeština (Czech)Studijní obor
Informační technologieSložení komise
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Michal Novák, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)Termín obhajoby
2018-06-12Průběh obhajoby
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A".Výsledek obhajoby
práce byla úspěšně obhájenaTrvalý odkaz
http://hdl.handle.net/11012/85179Zdrojový dokument
GREPL, F. Detekce Akustické Prostředí z Řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.Kolekce
- 2018 [278]