Bioinformatický nástroj pro klasifikaci bakterií do taxonomických kategorií na základě sekvence genu 16S rRNA

but.committeedoc. Ing. František Zbořil, Ph.D. (předseda) doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. Lukáš Burget, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Prof. RNDr. Mária Lucká, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Proč je nástroj TOP přesnější než váš model? Mohlo by to souviset se ztrátou informace při použití k-merového spektra? U algoritmu NMDK vybíráte N prvků k-merového spektra s největšími rozdíly. Co kdyby se použili všechny prvky k-merového spektra, které by měly rozdíl větší než pevně stanovený práh? Mohlo by to vést ke zlepšení klasifikace? Existuje publikace s algoritmem ITS a zkoušela jste se sním srovnat? Jaká je výpočetní náročnost Vašeho algoritmu? Data sety jste si tvořila sama, nebo jste použila existující?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmatana, Stanislaven
dc.contributor.authorValešová, Nikolaen
dc.contributor.refereeHon, Jiříen
dc.date.accessioned2019-07-08T15:56:55Z
dc.date.available2019-07-08T15:56:55Z
dc.date.created2019cs
dc.description.abstractTato práce se zabývá problematikou automatizované klasifikace a rozpoznávání bakterií po získání jejich DNA procesem sekvenování. V rámci této práce je navržena a popsána nová metoda klasifikace založená na základě segmentu 16S rRNA. Představený princip je vytvořen podle stromové struktury taxonomických kategorií a používá známé algoritmy strojového učení pro klasifikaci bakterií do jedné ze tříd na nižší taxonomické úrovni. Součástí práce je dále implementace popsaného algoritmu a vyhodnocení jeho přesnosti predikce. Přesnost klasifikace různých typů klasifikátorů a jejich nastavení je prozkoumána a je určeno nastavení, které dosahuje nejlepších výsledků. Přesnost implementovaného algoritmu je také porovnána s několika existujícími metodami. Během validace dosáhla implementovaná aplikace KTC více než 45% přesnosti při predikci rodu na datových sadách BLAST 16S i BLAST V4. Na závěr je zmíněno i několik možností vylepšení a rozšíření stávající implementace algoritmu.en
dc.description.abstractThis thesis deals with the problem of automated classification and recognition of bacteria after obtaining their DNA by the sequencing process. In the scope of this work, a new classification method based on the 16S rRNA gene segment is designed and described. The presented principle is constructed according to the tree structure of taxonomic categories and uses well-known machine learning algorithms to classify bacteria into one of the classes at the lower taxonomic level. A part of this thesis is also dedicated to the implementation of the described algorithm and evaluation of its prediction accuracy. The performance of various classifier types and their settings is examined and the setting with the best accuracy is determined. The accuracy of the implemented algorithm is also compared to several existing methods. During validation, the implemented KTC application reached more than 45 % accuracy on genus prediction on both BLAST 16S and BLAST V4 datasets. At the end of the thesis, there are mentioned several possibilities to improve and extend the current implementation of the algorithm.cs
dc.description.markAcs
dc.identifier.citationVALEŠOVÁ, N. Bioinformatický nástroj pro klasifikaci bakterií do taxonomických kategorií na základě sekvence genu 16S rRNA [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other121940cs
dc.identifier.urihttp://hdl.handle.net/11012/180353
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectStrojové učeníen
dc.subjectmetagenomikaen
dc.subjectklasifikace bateriíen
dc.subjectfylogenetický stromen
dc.subjecttaxonomieen
dc.subject16S rRNAen
dc.subjectsekvenování DNAen
dc.subjectscikit-learnen
dc.subjectMachine learningcs
dc.subjectmetagenomicscs
dc.subjectbacteria classificationcs
dc.subjectphylogenetic treecs
dc.subjecttaxonomycs
dc.subject16S rRNAcs
dc.subjectDNA sequencingcs
dc.subjectscikit-learncs
dc.titleBioinformatický nástroj pro klasifikaci bakterií do taxonomických kategorií na základě sekvence genu 16S rRNAen
dc.title.alternativeBioinformatic Tool for Classification of Bacteria into Taxonomic Categories Based on the Sequence of 16S rRNA Genecs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-17cs
dcterms.modified2019-07-08-13:31:19cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid121940en
sync.item.dbtypeZPen
sync.item.insts2021.11.08 13:09:03en
sync.item.modts2021.11.08 12:40:43en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.96 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21517_v.pdf
Size:
86.45 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21517_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21517_o.pdf
Size:
90.19 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21517_o.pdf
Loading...
Thumbnail Image
Name:
review_121940.html
Size:
1.53 KB
Format:
Hypertext Markup Language
Description:
review_121940.html
Collections