Bezeztrátové kódování signálů z mikrofonního pole

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
Lossless audio coding is increasingly important for properly archiving and preserving audio in its original form. To achieve a good compression ratio, lossless encoding techniques such as linear prediction and Rice coding are often applied to the original audio in order to minimize its entropy and preserve the original signal bit-precisely with a reduced size. This thesis explores the possibilities of efficiently encoding multi-channel audio in a way that exploits the similarity between multiple channels in order to achieve better compression ratios. This thesis also explores the techniques employed by FLAC in more depth while also providing solutions to a few problems that FLAC fails to address.
Description
Citation
KÁLAZI, A. Bezeztrátové kódování signálů z mikrofonního pole [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)
Date of acceptance
2022-06-15
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: What happens to the passive down-mix (d_MID in eq. 4.9) if the two input channels, s_L and s_R, have opposite phase, i.e. effectively cancelling each other? How do you deal with this problem in your codec? In Fig. 4.14 the "m" parameter seems toggling. Would smoothing or interpolation help? On page 23 you state that the entropy rises when the input signals are re-scaled to the same energy level. Can you explain how is it possible? I'd expect the exact opposite, i.e. lower energy of the residual signal and, consequently, also lower entropy.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO