Klasifikace malých nekódujících RNA

Loading...
Thumbnail Image
Date
ORCID
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato diplomová práce opisuje návrh a implementaci nástroje pro klasifikaci rostlinných microRNA bez genomu. Použity jsou vlastnosti mature a star sekvencí v microRNA duplexech. Implementována metoda je založena na shlukování RNA sekvencí (nástrojem CD-HIT), hlavne pro redukci jejich počtu. Vybraní reprezentanti z jednotlivých shluků jsou klasifikováni použitím support vector machine. Výkonnost klasifikace je víc než 96% (na základě metody cross-validation, využitím trénovacích dat).
This masters's thesis contains description of designed and implemented tool for classification of plant microRNA without genome. Properties of mature and star sequences in microRNA duplexes are used. Implemented method is based on clustering of RNA sequences (with CD-HIT) to mainly reduce their count. Selected representants from each clusters are classified using support vector machine. Performance of classification is more than 96% (based on cross-validation method using the training data).
Description
Citation
ŽIGÁRDI, T. Klasifikace malých nekódujících RNA [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) doc. RNDr. Petr Šaloun, Ph.D. (člen)
Date of acceptance
2015-06-24
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " D ". Otázky u obhajoby: V rámci hledání vhodných parametrů procesu shlukování přidáváte k referenční sadě sekvencí i neklasifikovaná vstupní data. Dokázal by jste vysvětlit, v čem je tento postup výhodnější oproti použití samotné referenční sady? V rámci metodiky vytvoření negativní datové sady pro SVM klasifikátor používáte neklasifikovaná vstupní data, což snižuje její věrohodnost. Napadá vás způsob, jak negativní datovou sadu vytvořit pouze s využitím referenčních sekvencí miRNA?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO