Využití knihovny ALIZE pro identifikaci mluvčích

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
V posledních letech, kdy dochází k výraznému nárůstu výkonu počítačů, se na popředí dostaly mimo jiné i systémy pro rozeznávání mluvčího. Vznikla řada knihoven, ať již open--source či proprietárních, které se této problematice věnují. Jednou z takových knihoven je například ALIZE, která byla vyvinuta na univerzitě v Avignonu. Tato knihovna nabízí obecný koncept práce s biometrickými údaji, statistickými výpočty a kompletní framework pro zamýšlenou aplikaci. Úkolem této práce je tuto knihovnu vyzkoušet, a to postavením praktické aplikace pro rozeznávání mluvčího. Tato práce popisuje úspěšné sestavení této aplikace. Aplikace je platformně nezávislá a je také vyzkoušená na všech třech základních platformách. Ty jsou přílohou práce jako soubory do virtuálního stroje VirtualBox. Práce si všímá praktických zkušeností s knihovnou ALIZE, popisuje její strukturu a architekturu. Pro testování je použito celkem 50 vzorků od 9ti mluvčích, v délkách okolo 20ti sekund. Pro tyto délky funguje rozeznávání naprosto spolehlivě s dodanými vzorky. Proto je na závěr v tezi uskutečněn test skutečné délky potřebné k rozeznání mluvčího.
Recently computing power has been significantly increasing and speaker identification systems have been drawing to the foreground among others. Many libraries have been developed, no matter if open--source or proprietary. One of them is for example ALIZE that was developed at Avignon university. This library offers general concept for staff with biometric values, statistic computations and complex framework for intended application. The goal of this thesis is to test this library, namely by constructing a practical application for speaker identification. This thesis describes successful assembly of that application. Application is platform independent and it is also tested on three basic platforms. These platforms are attached as files into VirtualBox virtual machine. This thesis takes notice of practical experiences with ALIZE library and also describes it's structure and architecture. There are 50 patterns of 9 speakers used for testing in average length 20 seconds. Application recognizes speakers very reliable in these given patterns. Therefore real neccesary length test for speaker recognition was accomplished at the end of this thesis.
Description
Citation
SKULÍNEK, Z. Využití knihovny ALIZE pro identifikaci mluvčích [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Teleinformatika
Comittee
prof. Ing. Karel Bartušek, DrSc. (předseda) prof. Ing. Dan Komosný, Ph.D. (místopředseda) Ing. Jaroslav Vrána, Ph.D. (člen) Ing. Radim Číž, Ph.D. (člen) Ing. Jiří Přinosil, Ph.D. (člen)
Date of acceptance
2015-06-18
Defence
Uveďte jaké příznaky byly extrahovány z textu a které mají největší vliv na přesnost detekce mluvčího.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO