Synchronizace textu a audia
Text to Audio Alignment
Abstract
Tato bakalářská práce se zabývá výzkumem nástroje pro synchronizaci textu a audia na úrovni jednotlivých grafémů a fonémů. V práci jsou také diskutovány možné přístupy k synchronizaci a případná omezení a problémy, kterým je třeba čelit. Zkoumaný nástroj využívá přístup vycházející z grapheme-to-phoneme konverze s použitím joint-sequence modelů. Pro experimenty jsou použity data z televizního vysílání, která byla převzata z Multi-Genre Broadcast Challenge 2015. This bachelor thesis studies a tool for automatic text to audio alignment at the level of single phonemes and graphemes. It also discusses possible techniques used in alignment and possible limitations and difficulties that need to be taken into account. Studied tool uses approach based on grapheme-to-phoneme conversion using joint-sequence models. Data used in experiments are TV broadcast recordings from Multi-Genre Broadcast Challenge 2015.
Keywords
synchronizace textu a audia, zarovnání, fonémový rozpoznávač, grapheme-to-phoneme konverze, g2p, MGB Challenge, synchronization of text and audio, alignment, phoneme recognition, grapheme-to-phoneme conversion, g2p, MGB ChallengeLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Michal Novák, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)Date of defence
2018-06-12Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A". Otázky u obhajoby: Jak moc se jazykový model adaptuje? Není možné míru této adaptace řídit? Proč je adaptace náročná na paměť? Není možné paměťovou náročnost jednoduše snížit? Nejsou některé rozdíly, které v práci popisujete spíše dílem náhody? Například rozdíly úspěšnosti na špatně zarovnaných nahrávkách?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/85080Source
ŠUBA, A. Synchronizace textu a audia [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.Collections
- 2018 [278]