Porovnání eukaryotních genomů

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Hlavním motivem pro vznik této diplomové práce byla potřeba kvalitních bioinformatických nástrojů, které slouží na porovnávání genomů a vylepšení jednoho z existujících nástrojů - RepeatExplorer. Práce přináší přehled transposibilních elementů v DNA, existujících nástrojů určených pro identifikaci a analýzu repetic v nasekvenovaných genomech. V práci jsou popsány nedostatky nástroje RepeatExplorer se zaměřením na komparativní analýzu genomů. Byly navrženy a implementovány dvě řešení k odstranění těchto nedostatků. První řešení je určeno na porovnávání dvojic genomů. Princip tohoto řešení je založen na porovnávání podobnosti rozložení pokrytí contigů prostřednictvím Kolmogorov-Smirnova testu, díky čemu víme určiť rozdílné místa v genomech. Druhé řešení, které slouží k porovnávání více genomů, je založeno na metodě mapování readů porovnávaných genomů na contigy referenčního genomu a poskytuje grafy s pokrytím contigů, pomocí kterých víme určit variabilitu repetic. Funkčnost byla ověřena na reálných NGS datech organizmu Silene latifolia.
Main motive of this master thesis was the need of good bioinformatics tools for genome comparison and improvement of one of the existing tools - RepeatExplorer. This work offers an overview of transposable elements in DNA, existing tools for identification and analysis of repetitions in sequenced genomes, summary of currently used genome sequencing methods. This work describes shortcomings of RepeatExplorer tool with focus on comparative analysis of genomes. Two solutions to remove these problems were designed and implemented. The first solution is designed for comparing pairs of genomes. The principle of this solution is based on comparison of similarity of distribution of contigs coverages using Kolmogorov-Smirnov test, thanks to which we are able to determine different parts in the genomes.The second solution, which is used to compare multiple genomes, is based on the method of mapping reads from compared genomes to the reference genome contigs and provides contigs coverage graphs, by which we are able to determine the variability of the repeats.Their functionality was verified on real NGS data of organism Silene latifolia.
Description
Citation
PUTEROVÁ, J. Porovnání eukaryotních genomů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) doc. RNDr. Petr Šaloun, Ph.D. (člen)
Date of acceptance
2015-06-24
Defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: V sekcii 3.4 popisujete nástroj RepeatExplorer a jednotlivé kroky analýzy. Z časti o identifikácii proteínových domén vyplýva, že nástroj funguje len na LTR retroelementy. Je možné ho použiť aj na iné typy repetitívnych sekvencií? Na odhad zastúpenia jednotlivých transpozónových rodín navrhujete dve sumarizačné metriky (vzťahy 6.2 a 6.3). Zhodnoťte, ako veľmi sa ich výsledky líšia na reálnych dátach.
Result of defence
práce byla úspěšně obhájena
Document licence
Přístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 1 roku/let
DOI
Collections
Citace PRO