Rekonstrukce opakujících se segmentů DNA

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Hlavní motivací diplomové práce bylo najít vhodný algoritmus, který by vytvořil grafovou reprezentaci NGS sekvenačních dat v lineárním čase. Zvolenou metodou pro reprezentaci je de Bruijnův graf. V další části práce byl navrhnut nástroj, který je schopen transformovat graf do přijatelné podoby pro vykreslování, a dále je schopen odstraňovat chyby, které vznikají při konstrukci grafu. Cílem práce je vytvořit nástroj, který rekonstruuje repetitivní segmenty v DNA. Implementovaný nástroj byl otestován a je schopen identifikovat opakující se segmenty, určit jejich typy, vizualizovat je a sestavit jejich sekvenci na jednodušších genomech s velkou přesnotí. Při použití složitějších genomů, nástroj nalezne pouze fragmenty repetitivních segmentů.
The main motivation for master's thesis is to find suitable algorithm that creates a graph representation of NGS sequencing data in linear time. De Bruijn graph was chosen as a method for research. Next, the tool was designed to be able to transform the graph and correct errors created during construction of the graph. The main aim of the thesis is to implement a tool that reconstructs repetitive segments in DNA. Implemented tool was tested and is able to  identify repetitive segments, specify types, visualize them properly and is also able to assemble their sequence with fine accuracy on simpler genomes. When using complex genomes, tool is able to reconstruct only fragments of repetitive segments.
Description
Citation
BIKÁR, R. Rekonstrukce opakujících se segmentů DNA [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. Jan Platoš, Ph.D. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)
Date of acceptance
2016-06-20
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: 1) Pokud uznáte za vhodné, reagujte prosím na bod 5. 2) V práci je použita osvědčená a v tomto případě snad jediná možná metoda ověření spolehlivosti algoritmu, resp. jeho implementace, a sice analýza umělých dat, se známým počtem repetic ve formátu co nejpodobnějším reálným datům. Z přečteného mám dojem, že tyto syntetické data neobsahovali repetice v přirozeném spektru jejich variability, ale počítali jenom s omezeným počtem repetic a variabilitou způsobenou chybami v sekvenaci. To může vést k nadhodnocení kvality výpočtu oproti tomu, co by se dělo v datech s reálnými repeticemi, které se často liší od sebe v desítkách procent nukleotidů, i když patří do stejné rodiny, či jiné evolučně příbuzné skupiny. Reagujte prosím potvrzením nebo vyvrácením této zkutečnosti, zkušenostmi s programem v tomto směru nebo návrhy pro nápravu.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO