Systém pro rozpoznání hlasových povelů v reálném čase
Real-time voice command recognition system
Author
Advisor
Přinosil, JiříReferee
Kiac, MartinGrade
AAltmetrics
Metadata
Show full item recordAbstract
Bakalářská práce se zabývá tvorbou systému pro rozpoznání hlasových povelů. Klasifikátor tohoto systému byl vytvořený pomocí neuronové sítě. V práci se obeznámíte s historií a problematiku rozpoznání řeči. Byl vytvořený systém, který detekuje v nahrávce úsek obsahující řečový signál, který následně pomocí klasifikátoru rozhodne o jaké slovo z tabulky slov se jedná. Byly vytvořeny 3 modely se stejnou architekturou avšak s různými trénovacími daty. Tyto modely byly následně porovnány mezi sebou. Pro výsledný systém bylo vytvořené jednoduché uživatelské rozhraní. The bachelor thesis deals with the development of a system for voice command recognition. The classifier of this system was created using a neural network. In this thesis you will learn about the history and problems of speech recognition. A system has been created that detects a section in a recording containing a speech signal, which then uses the classifier to decide what word from the word table it is. Three models with the same architecture but with different training data were created. These models were then compared with each other. A simple user interface was created for the resulting system.
Keywords
neuronové sítě, rozpoznání řeči, mfcc, dataset, VAD, Keras API, neural networks, speech recognition, mfcc, dataset, VAD, Keras APILanguage
čeština (Czech)Study brunch
Zvuková produkce a nahráváníComposition of Committee
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Jiří Přinosil, Ph.D. (místopředseda) Ing. Jaromír Mačák, Ph.D. (člen) prof. Ing. Jana Tučková, CSc., CSc. (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen)Date of defence
2022-06-16Process of defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Otázky: 1) V sekcii 1.3.2 ste uviedli obrázok 1.9, ktorý by mal znázorňovať rozdiel medzi koreláciou a konvolúciou. Prosím o stručné vysvetlenie rozdielu medzi týmito matematickými operáciami v súvislosti s uvedeným obrázkom. 2) V praktickej časti práce uvádzate, že ste naučili 3 modely neuronovej siete, každý model na inom datasete, respektíve dataset obsahujúci čisté pôvodné nahrávky, dataset obsahujúci nahrávky s pridanými ruchmi a dataset obsahujúci nahrávky s odstránenými ruchmi pomocou externej funkcie. Všetky 3 naučené modely dosiahli veľmi pekné výsledky. Nikde ale neuvádzate, aký ste zvolili pomer medzi trénovacou, validačnou a testovacou množinou z uvedených datasetov v priebehu procesu učenia. Aký postup ste zvolili na testovanie presnosti naučených modelov?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/206244Source
ŠÍBL, E. Systém pro rozpoznání hlasových povelů v reálném čase [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.Collections
- 2022 [397]