Metody pro komparativní analýzu metagenomických dat

Abstract
Moderní výzkum v environmentální mikrobiologii využívá k popisu mikrobiálních komunit genomická data, především sekvenaci DNA. Oblast, která zkoumá veškerý genetický materiál přítomný v environmentálním vzorku, se nazývá metagenomika. Tato doktorská práce se zabývá metagenomikou z pohledu bioinformatiky, která je nenahraditelná při výpočetním zpracování dat. V teoretické části práce jsou popsány dva základní přístupy metagenomiky, včetně jejich základních principů a slabin. První přístup, založený na cíleném sekvenování, je dobře rozpracovanou oblastí s velkou řadou bioinformatických technik. Přesto mohou být metody pro porovnávání vzorků z několika prostředí podstatně vylepšeny. Přístup představený v této práci používá unikátní transformaci dat do podoby bipartitního grafu, kde je jedna partita tvořena taxony a druhá vzorky, případně různými prostředími. Takový graf plně reflektuje kvalitativní i kvantitativní složení analyzované mikrobiální sítě. Umožňuje masivní redukci dat pro jednoduché vizualizace bez negativních vlivů na automatickou detekci komunit, která dokáže odhalit shluky podobných vzorků a jejich typických mikrobů. Druhý přístup využívá sekvenace celého metagenomu. Tato strategie je novější a příslušející bioinformatické nástroje jsou méně propracované. Hlavní výzvou přitom zůstává rychlá klasifikace sekvencí, v metagenomice označovaná jako „binning“. Metoda představená v této práci využívá přístupu zpracování genomických signálů. Tato unikátní metodologie byla navržena na základě podrobné analýzy redundance genetické informace uložené v genomických signálech. Využívá transformace znakových sekvencí do několika variant fázových signálů. Navíc umožňuje přímé zpracování dat ze sekvenace nanopórem v podobě nativních proudových signálů.
Modern research in environmental microbiology utilizes genomic data, especially sequencing of DNA, to describe microbial communities. The field studying all genetic material present in an environmental sample is referred to as metagenomics. This doctoral thesis deals with metagenomics from the perspective of bioinformatics that is unreplaceable during the data processing. In the theoretical part of this thesis, two different approaches of metagenomics are described including their main principles and weaknesses. The first approach, based on targeted sequencing, is a well-established field with a wide range of bioinformatics techniques. Yet, methods for comparison of samples from several environments can be highly improved. The approach introduced in this thesis uses unique transformation of data into a bipartite graph, where one partition is formed by taxa, while the other by samples or environments. Such a graph fully reflects qualitative as well as quantitative aspect of analyzed microbial networks. It allows a massive data reduction to provide human comprehensible visualization without affecting the automatic community detection that can found clusters of similar samples and their typical microbes. The second approach utilizes whole metagenome shotgun sequencing. This strategy is newer and the corresponding bioinformatics techniques are less developed. The main challenge lies in fast clustering of sequences, in metagenomics referred to as binning. The method introduced in this thesis utilizes a genomic signal processing approach. By thorough analysis of redundancy of genetic information stored in genomic signals, a unique technique was proposed. The technique utilizes transformation of character sequences into several variants of phase signals. Moreover, it is able to directly process nanopore sequencing data in the form of a native current signal.
Description
Citation
SEDLÁŘ, K. Metody pro komparativní analýzu metagenomických dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Biomedicínské technologie a bioinformatika
Comittee
prof. Ewaryst Tkacz, Ph.D.,D.Sc. (předseda) doc. Ing. Jaroslav Zendulka, CSc. (člen) Ing. Matej Lexa, Ph.D. - oponent (člen) doc. Mgr. Tomáš Vinař, PhD. - oponent (člen) prof. RNDr. Šárka Pospíšilová , Ph.D. (člen) RNDr. Petr Baldrian, Ph.D. (člen)
Date of acceptance
2018-12-07
Defence
Provedena vědecká diskuze jak s oponenty, tak s ostatními členy komise a výsledkem je hlasování.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO