Rozpoznávání řeči pro vybrané jazyky
Speech Recognition For Selected Languages
Author
Advisor
Janda, MilošReferee
Karafiát, MartinGrade
DAltmetrics
Metadata
Show full item recordAbstract
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů. This bachelor's thesis deals with recognition of continues speech for three languages - Bulgarian, Croatian and Swedish. There are described basics of speech processing and recognition methods like acoustic modeling using hidden Markov models and gaussian mixture models. Another aim of this work is preparing data for those languages from GlobalPhone database, so they may be used with speech recognition toolkits Kaldi and HTK. With data prepared there are several models trained and tested using Kaldi toolkit.
Keywords
Rozpoznávání řeči, bulharština, chorvatština, švédština, Kaldi, GlobalPhone, HMM, GMM, MFCC, Speech recognition, Bulgarian, Croatian, Swedish, Kaldi, GlobalPhone, HMM, GMM, MFCCLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D. (člen) Dr. Ing. Petr Peringer (člen)Date of defence
2013-06-10Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Na konci popisu token passing algoritmu máte menší nepřesnost, můžete ji najít a vysvětlit. Pro urychlení dekodování se používají různé optimalizace, v této práci zmiňujete užití jazykového modelu pro zmenšení dekodovacího grafu. Ktere další optimalizace založené na akustice znáte?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/52866Source
SCHMITT, J. Rozpoznávání řeči pro vybrané jazyky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.Collections
- 2013 [354]