Učení separace řečníků pomocí prostorové informace

but.committeedoc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Odůvodněte, proč byly nejhorší výsledky dosaženy pro přístup využívající neuronové sítě trénované s využitím správných masek a nelepší výsledky pro přístup trénování bez učitele, který byl dále použit pro odhad masek (pro následné trénování nerunové sítě). Porovnejte vstupy neuronové sítě při trénování se správnými a odhadovanými maskami. Zdůvodněte rozdíly. Používal jste binární nebo pravděpodobnostní masky? Musí být masky exkluzivní?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorŽmolíková, Kateřinaen
dc.contributor.authorPavlus, Jánen
dc.contributor.refereeMošner, Ladislaven
dc.date.accessioned2020-07-14T09:01:45Z
dc.date.available2020-07-14T09:01:45Z
dc.date.created2020cs
dc.description.abstractTahle práce pojednává o~možnosti použití prostorových informací pro odhadnutí masek pro cíle, které je uvedeno v~článku \textit{Bootstrapping single-channel source separation via unsupervised spatial clustering on stereo mixtures}. Tahle myšlenka umožňuje použití neumělých náhrávek směsice signálů pro trénování systémů separace řečníků, které používají neuronové sítě. V~práci jsou zmíněny dvě trénovací metotody a to permutačně invariantní trénování a dále pak metoda deep clustering. Tyto metody jsou použity pro experimenty s~trénováním neuronových sítí s~použítím masek cílů, které jsou odhadnuty pomocí prostorové informace. Výsledkem práce je porovnání výsledků těchto experimentů s~výsledky výše zmíněného článku. Tohle porovnání ukázalo, že použití odhadnutých masek za pomoci prostorových informací, může vést ke kvalitnímu natrénování systému separace řečníků.en
dc.description.abstractThis thesis discusses the idea of using spatial cues in speech separation for estimating target masks, that is stated in article \textit{Bootstrapping single-channel source separation via unsupervised spatial clustering on stereo mixtures}. This idea may make it possible to use real-world mixtures for the training of speech separation systems, which use neural networks. In the thesis two training methods, permutation invariant training and deep clustering method are mentioned and used for experiments with training neural networks using target masks estimated by spatial cues. The result of the work is a comparison of the results of these experiments with the results of the above-mentioned article. This comparison showed that the use of estimated masks with the help of spatial information can lead to a quality training of the speaker separation system.cs
dc.description.markCcs
dc.identifier.citationPAVLUS, J. Učení separace řečníků pomocí prostorové informace [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129171cs
dc.identifier.urihttp://hdl.handle.net/11012/191702
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectSeparace řečníkůen
dc.subjectdeep clusteringen
dc.subjectprostorová informaceen
dc.subjectstrojové učeníen
dc.subjectneuronové sítěen
dc.subjectlong-short term memoryen
dc.subjectSpeech separationcs
dc.subjectdeep clusteringcs
dc.subjectspatial cuescs
dc.subjectmachine learningcs
dc.subjectneural networkscs
dc.subjectlong-short term memorycs
dc.titleUčení separace řečníků pomocí prostorové informaceen
dc.title.alternativeLearning Speech Separation Using Spatial Cuescs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2020-07-10cs
dcterms.modified2020-07-13-23:41:08cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid129171en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 18:59:48en
sync.item.modts2021.11.12 17:50:31en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.8 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23153_o.pdf
Size:
91.43 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23153_o.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23153_v.pdf
Size:
85.72 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23153_v.pdf
Loading...
Thumbnail Image
Name:
review_129171.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
review_129171.html
Collections