Adaptace rozpoznávače řeči na datech bez přepisu

Loading...
Thumbnail Image
Date
ORCID
Mark
E
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem práce je vytvořit a otestovat techniky pro adaptaci rozpoznávače řeči na audionahrávkach bez slovního přepisu. Nejprve připravíme data pro trenovaní rozpoznavače řeči a natrénujeme počáteční systém. Tímto rozpoznavačem přepišeme neznáma data a zaměříme se na experimentování s výběrem kvalitních adaptačních dat na základě míry kvality přepisu. Systém na nově vytvořené sadě přetrénujeme a vyhodnotíme úspešnost. Dále experimentujeme s množstvím adaptačních dat.
The goal of this thesis is to design and test techniques for unsupervised adaptation of speech recognizers on some audio data without any textual transcripts. A training set is prepared at first, and a baseline speech recognition system is trained. This sistem is used to transcribe some unseen data. We will experiment with an adaptation data selection process based on some speech transcript quality measurement. The system is re-trained on this new set than, and the accuracy is evaluated. Then we experiment with the amount of adaptation data.
Description
Citation
ŠVEC, J. Adaptace rozpoznávače řeči na datech bez přepisu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Počítačová grafika a multimédia
Comittee
doc. RNDr. Pavel Smrž, Ph.D. (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Petr Sedlák, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen)
Date of acceptance
2015-06-25
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: V textu se zmiňujete velké množství externích zdrojů (titulky, web...) pro tvorbu jazykového modelu. Byly tyto data přidány k původním přepisům se stejnou váhou, nebo byla tvorba jazykového modelu optimalizována? Jak se změní úspěšnost pokud zadaptujete již adaptovaný systém.  Myslíte že způsob jakým je měřena věrohodnost ("confidence") je plně dostačující nebo by šel nadále vylepšit.Pokud ano, jaký způsob by jste navrhoval.     
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO