Klasifikace bakterií pomocí markerových genů

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem této práce je návrh a implementace nové metody klasifikace bakterií podle sekvencí několika markerových genů. Pro řešení tohoto problému bylo zvoleno 10 markerových genů. Výsledný MultiGene klasifikátor dělí trénovací sadu do několika skupin a pro každou je vybrán gen dosahující nejlepších výsledků v jejím rozpoznání. V práci je popsána implementace MultiGene klasifikátoru a jeho otestování v porovnání s ostatními klasifikátory bakterií a s klasifikací čistě podle genu 16S rRNA.
The aim of this work is proposal of new method for bacteria classification based on sequences of marker genes. For this purpose was chosen 10 marker genes. Resulting MultiGene classifier processes data set by dividing it in several groups and choosing gene for each group which can distinguish this group with best results. This work describes implementation of MultiGene classifier and its results in comparison with other bacteria classifiers and with classification based entirely on gene 16S rRNA.
Description
Citation
PELANTOVÁ, L. Klasifikace bakterií pomocí markerových genů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen)
Date of acceptance
2020-08-26
Defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných, např. ohledně genové kompozice klasifikovaných bakterií, způsobu vyhodnocení kvality datové sady včetně použitých metrik a přístupu k trénování klasifikátoru. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře . Otázky u obhajoby: Ve fázi trénování zjišťujete, s jakou přesností který gen rozlišuje danou taxonomickou skupinu. Při predikci tuto znalost ale využíváte jen nepřímo, tj. zařadíte nejlepší gen do množiny genů. Dal by se váš algoritmus upravit tak, aby zohlednil i přesnost jednotlivých genů? Např. použitím vhodného váhování sekvenční identity k různým genům? Velikost vaší datové sady (631 organismů) je omezena nutností znát sekvence všech osmi markerových genů. Jak velkou datovou sadu byste mohla získat, pokud byste pro predikci potřebovala pouze gen 16S rRNA?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO