• čeština
    • English
    • русский
  • English 
    • čeština
    • English
    • русский
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2020
  • View Item
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2020
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Učení separace řečníků pomocí prostorové informace

Learning Speech Separation Using Spatial Cues

Thumbnail
View/Open
Posudek-Oponent prace-23153_o.pdf (91.43Kb)
Posudek-Vedouci prace-23153_v.pdf (85.72Kb)
final-thesis.pdf (2.801Mb)
review_129171.html (1.462Kb)
Author
Pavlus, Ján
Advisor
Žmolíková, Kateřina
Referee
Mošner, Ladislav
Grade
C
Altmetrics
Metadata
Show full item record
Abstract
Tahle práce pojednává o~možnosti použití prostorových informací pro odhadnutí masek pro cíle, které je uvedeno v~článku \textit{Bootstrapping single-channel source separation via unsupervised spatial clustering on stereo mixtures}. Tahle myšlenka umožňuje použití neumělých náhrávek směsice signálů pro trénování systémů separace řečníků, které používají neuronové sítě. V~práci jsou zmíněny dvě trénovací metotody a to permutačně invariantní trénování a dále pak metoda deep clustering. Tyto metody jsou použity pro experimenty s~trénováním neuronových sítí s~použítím masek cílů, které jsou odhadnuty pomocí prostorové informace. Výsledkem práce je porovnání výsledků těchto experimentů s~výsledky výše zmíněného článku. Tohle porovnání ukázalo, že použití odhadnutých masek za pomoci prostorových informací, může vést ke kvalitnímu natrénování systému separace řečníků.
 
This thesis discusses the idea of using spatial cues in speech separation for estimating target masks, that is stated in article \textit{Bootstrapping single-channel source separation via unsupervised spatial clustering on stereo mixtures}. This idea may make it possible to use real-world mixtures for the training of speech separation systems, which use neural networks. In the thesis two training methods, permutation invariant training and deep clustering method are mentioned and used for experiments with training neural networks using target masks estimated by spatial cues. The result of the work is a comparison of the results of these experiments with the results of the above-mentioned article. This comparison showed that the use of estimated masks with the help of spatial information can lead to a quality training of the speaker separation system.
 
Keywords
Separace řečníků, deep clustering, prostorová informace, strojové učení, neuronové sítě, long-short term memory, Speech separation, deep clustering, spatial cues, machine learning, neural networks, long-short term memory
Language
angličtina (English)
Study brunch
Informační technologie
Composition of Committee
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)
Date of defence
2020-07-10
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Odůvodněte, proč byly nejhorší výsledky dosaženy pro přístup využívající neuronové sítě trénované s využitím správných masek a nelepší výsledky pro přístup trénování bez učitele, který byl dále použit pro odhad masek (pro následné trénování nerunové sítě). Porovnejte vstupy neuronové sítě při trénování se správnými a odhadovanými maskami. Zdůvodněte rozdíly. Používal jste binární nebo pravděpodobnostní masky? Musí být masky exkluzivní?
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/191702
Source
PAVLUS, J. Učení separace řečníků pomocí prostorové informace [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Collections
  • 2020 [298]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV