Online detekce jednoduchých příkazů v audiosignálu
Online detection of simple voice commands in audiosignal
Автор
Advisor
Krejsa, JiříReferee
Březina, LukášGrade
AAltmetrics
Metadata
Показати повний опис матеріалуКороткий опис(реферат)
Tato práce popisuje vývoj hlasového modulu, který je schopen rozpoznávat jednoduché řečové povely na základě porovnání zvukového vstupu s uloženými vzory. První část práce obsahuje popis použitého algoritmu a ověření jeho funkčnosti. Algoritmus je založen na Mel-frekvenčních cepstrálních koeficientech a dynamickém borcení času. Dále je navržen hardware hlasového modulu, obsahující signálový kontrolér 56F805 firmy Freescale. Signál z mikrofonu je upraven operačními zesilovači a digitálním filtrem. Třetí část se zabývá vývojem software pro kontrolér a popisuje implementaci algoritmu v pevné řádové čárce s ohledem na omezené možnosti kontroléru. Závěrečná zkouška prokazuje použitelnost modulu v prostředí s nízkým obsahem šumu. This thesis describes the development of voice module, that can recognize simple speech commands by comparation of input sound with recorded templates. The first part of thesis contains a description of used algorithm and a verification of its functionality. The algorithm is based on Mel-frequency cepstral coefficients and dynamic time warping. Thereafter the hardware of voice module is designed, containing signal controller 56F805 from Freescale. The signal from microphone is conditioned by operational amplifiers and digital filter. The third part deals with the development of software for the controller and describes the fixed point implementation of the algorithm, respecting limited capabilities of the controller. Final test proves the usability of voice module in low-noise environment.
Keywords
aliasing, dynamické borcení času, Mel-frekvenční cepstrální koeficienty, rozpoznávání řeči, signálový kontrolér 56F805, výpočty v pevné řádové čárce, aliasing, dynamic time warping, fixed point arithmetics, Mel-frequency cepstral coefficients, signal controller 56F805, speech recognitionLanguage
čeština (Czech)Study brunch
MechatronikaComposition of Committee
prof. Ing. Jiří Skalický, CSc. (předseda) prof. Ing. Ctirad Kratochvíl, DrSc. (místopředseda) doc. Ing. Čestmír Ondrůšek, CSc. (člen) prof. RNDr. Ing. Tomáš Březina, CSc. (člen) Ing. Bohumil Král, CSc. (člen) RNDr. Vladimír Opluštil (člen) doc. Ing. Peter Kriššák, Ph.D. (člen)Date of defence
2011-06-15Process of defence
Student v prezentaci představil diplomovou práci. Po přečtení posudků vedoucího diplomové práce a oponenta diplomové práce odpověděl na tři dotazy oponenta. Tyto odpovědi komise hodnotila jako zodpovězené. Dále student odpovídal na otázky týkající se jeho diplomové práce položené jednotlivými členy komise. Komise hodnotila jeho presentaci jako excelentní a vysoce hodnotila jak praktickou realizaci práce, tak i jeho práce v oblasti teorie rozpoznávání řeči. Celé vystoupení hodnotila komise jako výborné.Result of the defence
práce byla úspěšně obhájenaSource
ZEZULA, M. Online detekce jednoduchých příkazů v audiosignálu [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2011.Collections
- 2011 [512]