Rozpoznávání řeči s pomocí nástroje Sphinx-4
Speech recognition using Sphinx-4
Autor
Vedoucí práce
Burget, RadimOponent
Uher, VáclavKlasifikace
AAltmetrics
Metadata
Zobrazit celý záznamAbstrakt
Tato diplomová práce se zabývá hledáním efektivní techniky pro strojové rozpoznávání řeči, konkrétně pak strojovým přepisem mluvené řeči do textu a následným hledáním klíčových slov. Toto řešení lze následně použit pro analýzy telefonních hovorů nebo jiné podobné aplikace. Celá diplomová práce se věnuje nástroji Sphinx-4 pro strojové rozpoznávání řeči, který využívá k popisu akustických modelů skrytých Markovových modelů (HMM – Hidden Markov Model). Práce detailně vysvětluje, jak takové modely připravit pro nový jazyk nebo dialekt jazyka a jak tyto modely softwarově implementovat v jazyce Java. This diploma thesis is aimed to find an effective method for continuous speech recognition. To be more accurate, it uses speech-to-text recognition for a keyword spotting discipline. This solution is able to be applicable for phone calls analysis or for a similar application. Most of the diploma thesis describes and implements speech recognition framework Sphinx-4 which uses Hidden Markov models (HMM) to define a language acoustic models. It is explained how these models can be trained for a new language or for a new language dialect. Finally there is in detail described how to implement the keyword spotting in the Java language.
Klíčová slova
rozpoznávání řeči, Sphinx-4, HMM, MFCC, Java, jazykový model, akustický model, Speech Recognition, Sphinx-4, HMM, MFCC, Java, Language Model, Acoustic ModelJazyk
čeština (Czech)Studijní obor
Telekomunikační a informační technikaSložení komise
prof. Ing. Kamil Vrba, CSc. (předseda) doc. Ing. Anna Přibilová, Ph.D. (místopředseda) doc. Ing. Radim Burget, Ph.D. (člen) Ing. Radomír Svoboda, Ph.D. (člen) doc. Ing. Jan Hajný, Ph.D. (člen) Ing. Pavel Hanák, Ph.D. (člen)Termín obhajoby
2014-06-12Průběh obhajoby
Výsledek obhajoby
práce byla úspěšně obhájenaTrvalý odkaz
http://hdl.handle.net/11012/32954Zdrojový dokument
KRYŠKE, L. Rozpoznávání řeči s pomocí nástroje Sphinx-4 [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.Kolekce
- 2014 [438]