Rozpoznání typu přenosového kanálu z řečového signálu

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Práce se zabývá rozpoznáním pěti odlišných řečových přenosových kanálů. Použité kanály jsou: GSM, dva PSTN a dva VoIP kanály. Pro účely testování a trénování je vytvořena pro přenosové kanály řečová databáze SPLAB_TranCh. Řečové nahrávky z tohoto korpusu pochází z databáze TIMIT a každá promluva prošla každým přenosovým kanálem. Hlavním cílem práce je nalezení optimálních příznaků a klasifikátorů, které poskytují nejvyšší úspěšnost klasifikace. Je vyzkoušeno několik typů příznaků, včetně MFCC, LPCC a spektrálních charakteristik. Nejlepší suprasegmentální příznaky byly určeny algoritmem mRMR. Také bylo otestováno několik klasifikátorů. Výsledky ukazují, že rozpoznání přenosových kanálů může být realizováno s vysokou úspěšností (okolo 90 %). Práce také zkoumá vliv zkreslení, které může nastat během přenosu, na úspěšnost klasifikace. Jsou uvažovány následující typy zkreslení: saturace, prahování, ozvěna, praskání a vliv filtrů a různých barev šumů.
This work deals with the classification of five different transmission channels by speech signal processing. The channels considered are: GSM, two PSTN channels and two VoIP channels. For the training and testing purposes, a speech database for the transmission channels called SPLAB_TranCh was constructed. The speech signals of this corpus originally come from well-known TIMIT database, where each utterance passed through each mentioned transmission channel. The main objective of this work is to find optimal features and classification accuracy that yield best classification accuracy. Several types of features, including MFCC, LPCC and spectral characteristics were put under examination. The best suprasegmental features were identified by using mRMR algorithm. Several classifiers were tested as well. The results suggested that the classification of transmission channel can be performed with high accuracy (around 90 %). Influence of adverse effects, which can occur during transmission, is also examined. Considered types of distortions are: saturation, thresholding, echo, crackling noises and different colors of noises and filters.
Description
Citation
KOPŘIVA, T. Rozpoznání typu přenosového kanálu z řečového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2013.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Teleinformatika
Comittee
prof. Ing. Eva Gescheidtová, CSc. (předseda) prof. Ing. Zdeněk Smékal, CSc. (místopředseda) Ing. Michal Kohoutek, Ph.D. (člen) doc. Ing. Petr Číka, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Jiří Balej, Ph.D. (člen)
Date of acceptance
2013-06-20
Defence
Práce neobsahuje podrobnosti ohledně parametrů SVM algoritmu. Popište tyto parametry, jejich význam, hodnoty a typ použitého jádra. Jaké další metody výběru příznaků znáte?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO