Konverze hlasu

Loading...
Thumbnail Image
Date
ORCID
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práce je věnována tvorbě systému pro konverzi hlasu. Metodám, jež hlas jednoho člověka upraví tak, aby ho bylo možné zaměnit za hlas člověka jiného. V první části je popsán harmonický a šumový model (HNM), který se stará o analýzu a syntézu signálů. Druhá část se zabývá metodami konverze. Nejprve jsou uvedeny prozodické změny a následně i možnosti modifikace spektrální obálky, zejména použití konverzních matic. Stručně je zde vysvětlena metoda dynamického borcení času (DTW) a metoda kódování pomocí lineární predikce (LPC). V poslední části je uveden způsob implementace, popsán průběh testování a jsou diskutovány dosažené výsledky. V závěru jsou nastíněny možnosti dalšího vývoje.
Thesis is dedicated to the making of a system for voice conversion. To methods, which alter voice of one person in a way, that it could be possible for listener to mislead it for someone elses voice. In the first part, Harmonic plus Noise Model (HNM) is described. Signal analysis and synthesis are its main purposes. Methods of voice conversion are considered in the second part. Prosodic modifications are introduced at first and then modification of a spectral envelope is discussed (Especially aplication of conversion matrices). Dynamic Time Warping (DTW) and Linear Prediction Coding (LPC) methods are explained briefly. In last section, implementation process is described and achived results are discussed. Ways of further development are suggested in summary.
Description
Citation
SCHWARZ, I. Konverze hlasu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. RNDr. Jitka Kreslíková, CSc. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)
Date of acceptance
2010-06-17
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Můžete zdůvodnit nutnost použití Moore-Penrose pseudoinverze v sekci 3.2.4? Můžete ujasnit, zda-li pro změnu rytmu a hlasitosti byla brána v úvahu i dynamika (pomocí fonémů), a Váš systém by byl schopen se vypořádat například s přemapováním ostravského přízvuku na pražský? Můžete ujasnit, zda-li je Váš systém schopen vytvořit nahrávku řečníka, kterou nikdy neřekl? (Tedy splnění bodu 5 zadání.) Pokud je bod 5 splněn, proč to oponentovi nebylo jasné? Kolik prvků má Kepstrum?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO