Statistické vyhodnocení fylogeneze biologických sekvencí

Loading...
Thumbnail Image
Date
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tématem této diplomové práce je statistické vyhodnocení fylogeneze biologických sekvencí pomocí fylogenetických stromů. V teoretické části vypracujeme literární rešerši metodologie odhadu průběhu fylogeneze na základě podobnosti biologických sekvencí (DNA a bílkovin), kde se zaměříme na nepřesnosti v odhadu, čím jsou způsobeny a na možnosti jejich odstranění. Poté srovnáme metody pro statistické vyhodnocení správnosti průběhu fylogeneze. V praktické části navrhneme algoritmy, které budou sloužit pro testování věrohodnosti konstrukce fylogenetických stromů na základě bootstrappingu, jackknifingu, OTU jackknifingu a PTP testu, které budou schopny z biologických sekvencí ve FASTA kódu vykreslit fylogenetický strom metodou neighbor joining a lze také měnit distanční model a substituční matici. Abychom mohli tyto algoritmy použít pro statistickou podporu fylogenetických stromů, musíme ověřit jejich správnou funkci. Toto ověření vyhodnotíme na teoretických sekvencích aminokyselin. Po ověření správné funkce algoritmů, si demonstrujeme jednotlivé statistické testy na reálných 10 sekvencích ubikvitinu savců. Tyto výsledky analyzujeme a vhodně okomentujeme.
The topic of my diploma thesis is the statistical evaluation of biological sequences with the help of phylogenic trees. In the theoretical part we will create a literary recherche of estimation methodology concerning the course of phylogeny on the basis of the similarity of biological sequences (DNA and proteins) and we will focus on the inaccuracies of the estimation, their causes and the possibilities of their elimination. Afterwards, we will compare the methods for the statistical evaluation of the correctness of the course of phylogeny. In the practical part of the thesis we will suggest algorithms that will be used for testing the correctness of the phylogenic trees on the basis of bootstrapping, jackknifing, OTU jackknifing and PTP test which are able to the capture phylogenic tree with the method neighbor joining from the biological sequences in FASTA code. It is also possible to change the distance model and the substitution matrix. To be able to use these algorithms for the statistical support of phylogenic trees we have to verify their right function. This verification will be evaluated on the theoretical sequences of the amino acids. For the verification of the correct function of the algorithms, we will carry out single statistical tests on real 10 sequences of mammalian ubiquitin. These results will be analysed and appropriately discussed.
Description
Citation
ZEMBOL, F. Statistické vyhodnocení fylogeneze biologických sekvencí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2013.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Biomedicínské inženýrství a bioinformatika
Comittee
prof. Ing. Ivo Provazník, Ph.D. (předseda) doc. Ing. Jiří Rozman, CSc. (místopředseda) Ing. Martin Vítek, Ph.D. (člen) RNDr. Petr Fuchs, Ph.D. (člen) prof. Pharm.Dr. Petr Babula, Ph.D. (člen)
Date of acceptance
2013-06-12
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. RNDr. Peter Fuchs, Ph.D. položil otázku: Jaký jste používal program na vytvoření obrázků v práci? Jaký je literární pramen vzorců na str. 50? Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO