Hlasové ovládání
Voice Control

View/ Open
Author
Advisor
Černocký, JanReferee
Szőke, IgorGrade
DAltmetrics
Metadata
Show full item recordAbstract
V této bakalářské práci jsou studovány techniky pro rozpoznávání řeči a detekci klíčových slov s pomocí skrytých Markovových modelů. V první části jsou popsány techniky parametrizace signálu, trénování modelů a algoritmy pro rozpoznávání řeči. V druhé části je provedena detekce klíčových slov s několika modely natrénovanými z řečových signálů zachycených v různých vzdálenostech a výsledky těchto testů jsou následně vyhodnoceny. This Bachelor's Thesis deals with the techniques of the speech recognition and key words spotting using hidden Markov models. The first part of my thesis contains a description of the techniques of parameterization of the signals, models training and algorithms of speech recognition. In the second part, the detection of key words with several models trained on speech signals recorded in different distances is investigated and the results of the tests are evaluated.
Keywords
skryté Markovovy modely, rozpoznávání řeči, detekce klíčových slov, The Hidden Markov Model Toolkit (HTK), trénování skrytých Markovových modelů, Hidden Markov Model (HMM), speech recognition, Keyword spotting (KWS), The Hidden Markov Model Toolkit (HTK), HMM trainingLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
prof. Ing. Jan M. Honzík, CSc. (předseda) doc. Dr. Ing. Petr Hanáček (místopředseda) doc. Ing. Vladimír Drábek, CSc. (člen) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Michal Španěl, Ph.D. (člen)Date of defence
2010-08-23Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " D ". Otázky u obhajoby: Můžete názorně demonstrovat, co se děje při aplikaci okénkové funkce (pravoúhlé a Hammingově) a jaký to má dopad na signál (str. 6)? Vysvětlete rovnice 8 a 9 a popište, co znamenají jednotlivé členy. V síti pro detekci klíčových slov (obr. 9) máte nastaven parametr l=-20. Výsvětlete, co znamená, a jak jste dospěl právě k této hodnotě.Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/56167Source
SÁDECKÝ, P. Hlasové ovládání [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.Collections
- 2010 [347]