Evaluace a optimalizace výpočetní náročnosti v systémech pro rozpoznání řečníka

but.committeedoc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: You propose a Modified DCF metric and Time Constrained Protocol. Do you think they are interchangeable or there are tasks when one should be preferred over the other? If yes, give an example. In your work, you present two approaches to truncate the input utterances to reduce the processing time (A and B as referenced in the text). How do you think, what are the reasons for the approach B (limiting the number of speech frames for x-vector extraction) to outperform A (simply truncating the audio)?  Have you considered other strategies to reduce the processing time except for those two described in the thesis? If yes, what were they and what advantages and disadvantages they have compared to those that you've used? Kolik metod na rozpoznávání řeči jste použila? Dávaly by vámi použité metriky smysl i pro jinou metodu rozpoznávání řeči?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorRohdin, Johan Andréasen
dc.contributor.authorGregušová, Sabínaen
dc.contributor.refereeSilnova, Annaen
dc.date.accessioned2020-07-14T07:59:21Z
dc.date.available2020-07-14T07:59:21Z
dc.date.created2020cs
dc.description.abstractCieľom tejto práce je navrhnúť hodnotiacu metriku, ktorá zahŕňa výpočetné náklady. Všeobecne výpočetné náklady nepredstavujú vo výskume problém, ale môžu byť problematické v komerčnom produkčnom systéme, kedy je rýchlosť dôležitá. Navrhnuté metriky rozširujú existujúci rámec pre hodnotenie od NIST a pridávajú k nim parametre pre časovú jednotku a náklady pre časovú jednotku. Tieto metriky sú aplikované na skutočný ASV a experimenty ukazujú potenciál pre hlbší výskum a možné použitie. Vrámci experimentov bola limitovaná maximálna dĺžka nahrávok, ale aj maximálne dĺžka rámcov pre spracovanie pri extrakcii x-vektorov. Obe optimalizácie znížili celkové výpočetné náklady a dosiahli priaznivé výsledky pre nové metriky. Na záver sú výsledky z experimentov porovnané a jednotlivé modifikácie ohodnotené a zoradené podľa nových metrík.en
dc.description.abstractThe goal of this thesis is to propose an evaluation metric that includes computational costs. Computational costs generally do not pose a problem in research, but it can become problematic in a commercial production system, where speed is essential. The proposed metric extends existing evaluation framework from NIST and adds parameter for time unit and time unit cost. These metrics are applied on real ASV and experiments show the potential for further research and possible use. The experiments focus on reducing the computational cost by posing a limit on maximum length of the utterance, but also limiting number of frames for x-vector extraction. Both optimizations reduced the computational costs and reached favorable results for the new metrics. Finally, experiments' results are compared and each system modification is ranked according to the new metrics.cs
dc.description.markCcs
dc.identifier.citationGREGUŠOVÁ, S. Evaluace a optimalizace výpočetní náročnosti v systémech pro rozpoznání řečníka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129157cs
dc.identifier.urihttp://hdl.handle.net/11012/191517
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávanie rečníkaen
dc.subjectevaluácia systémov na rospoznávanie rečníkaen
dc.subjectoptimalizácia systémov na rozpoznanie rečníkaen
dc.subjectvýpočetné nákladyen
dc.subjectevaluačné metrikyen
dc.subjectspeaker recognition systemscs
dc.subjectspeaker recognition evaluationcs
dc.subjectspeaker recognition optimizationcs
dc.subjectcomputational costscs
dc.subjectevaluation metricscs
dc.titleEvaluace a optimalizace výpočetní náročnosti v systémech pro rozpoznání řečníkaen
dc.title.alternativeEvaluation and Optimization of Computational Costs in Speaker Recognition Systemscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2020-07-10cs
dcterms.modified2020-07-13-23:41:08cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid129157en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 21:00:50en
sync.item.modts2021.11.12 20:12:12en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.26 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23008_o.pdf
Size:
91.25 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23008_o.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23008_v.pdf
Size:
85.7 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23008_v.pdf
Loading...
Thumbnail Image
Name:
review_129157.html
Size:
1.49 KB
Format:
Hypertext Markup Language
Description:
review_129157.html
Collections