Komprese DNA sekvencí

Loading...
Thumbnail Image
Date
ORCID
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Vzrůstající objem biologických dat vyžaduje hledání nových způsobů uložení těchto dat v genetických bankách. Cílem této práce je navržení a implementace nového algoritmu pro kompresi DNA sekvencí, který je založen na porovnání DNA sekvencí s referenčním modelem a následném uložení rozdílů oproti danému referenčnímu modelu. Práce obsahuje základní znalosti z molekulární biologie potřebné k pochopení principu algoritmu. Dále vysvětluje problematiku zarovnávání a uvádí některé kompresní algoritmy vhodné pro uložení rozdílů oproti referenčnímu modelu. Práce pokračuje popisem implementace algoritmu, která je následována odvozením časové složitosti a porovnáním s již existujícími přístupy. Na závěr je diskutována možnost dalšího pokračování projektu.
The increasing volume of biological data requires finding new ways to save these data in genetic banks. The target of this work is design and implementation of a novel algorithm for compression of DNA sequences. The algorithm is based on aligning DNA sequences agains a reference sequence and storing only diferencies between sequence and reference model. The work contains basic prerequisities from molecular biology which are needed for understanding of algorithm details. Next aligment algorithms and common compress schemes suitable for storing of diferencies agains reference sequence are described. The work continues with a description of implementation, which is follewed by derivation of time and space complexity and comparison with common compression algorithms. Further continuation of this thesis is discussed in conclusion.
Description
Citation
FRIEDRICH, T. Komprese DNA sekvencí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační systémy
Comittee
doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Miroslav Švéda, CSc. (místopředseda) Ing. Šárka Květoňová, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) prof. Ing. Lukáš Sekanina, Ph.D. (člen)
Date of acceptance
2010-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Jaký je primární účel algoritmu BLAST? Jaké algoritmy se používají pro zarovnání více sekvencí? Jaká je časová složitost algoritmů Gen Compress nebo BioCompress2? Provedl jste implementaci uvedených algoritmů, či jste využil nějakou stávající implementaci? Který z Vámi uvedených algoritmů jste skutečně navrhnul a implementoval?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO