Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Proteinové inženýrství je interdisciplinární vědní obor zabývající se návrhem vylepšených proteinů. Úspěšnou metodou využívanou pro návrh stabilnějších a aktivnějších proteinů je ancestrální rekonstrukce sekvencí. Tato metoda zkoumá evoluční vztahy mezi existujícími proteiny a za pomoci fylogenetických stromů vytváří jejich evoluční předchůdce, které kýžené vylepšené vlastnosti často vykazují. Proto nové a robustnější metody využívající matematické modely společně s obrovským množstvím sekvenčních dat by se mohly stát mocným nástrojem proteinového inženýrství. Tato diplomové práce se zabývá použitím variačních autoenkodérů jako alternativního přístupu k návrhu ancestrálních sekvencí oproti konvenčním metodám využívajícím fylogenetické stromy. V práci byly provedeny experimenty pro optimalizaci architektury a navrženy statistické metody pro evaluaci kvality modelů a generovaných sekvencí. Současně byly provedeny zkoušky robustnosti celé metody a navrhnuty a implementovány strategie pro generaci sekvence předků.
Protein engineering is an interdisciplinary science concerned with the design of improved proteins. A successful method used to design more stable and active proteins is ancestral sequence reconstruction. This method explores the evolutionary relationships between existing proteins and uses phylogenetic trees to generate their evolutionary ancestors, which often exhibit the desired improved properties. Therefore, new and more robust methods using mathematical models together with huge amounts of sequence data could become a powerful tool for protein engineering. This thesis explores the use of variational autoencoders as an alternative approach to ancestral sequence design compared to conventional methods using phylogenetic trees. Experiments were performed to optimize the architecture and statistical methods were proposed to evaluate the quality of the models and the sequences generated. At the same time, robustness tests of the whole method were performed and strategies for ancestral sequence generation were proposed and implemented.
Description
Citation
KOHOUT, P. Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen) doc. Ing. Radomil Matoušek, Ph.D. (člen)
Date of acceptance
2022-06-21
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Z textu mi nebylo zřejmé, zda mapování ASR sekvencí do latentního prostoru dopadlo dobře či nikoliv. Z obrázku 8.4 spíše plyne, že evoluční vztahy se v latentním prostoru nedaří vždy zachytit v dostatečné míře. Jak to tedy je? Jak úspěšná byla rekonstrukce trénovacích sekvencí z latentního prostoru zpět do sekvenčního? Do jaké míry může tato rekonstrukce ovlivnit kvalitu generovaných ASR sekvencí? Kolik trénovacích vzorků a jaké parametry enkodéru jsou obvyklé v úspěšných aplikacích této metody (např. v oblasti zpracování videa, zvuku)? Odpovídá to parametrům úloh v oblasti proteinového inženýrství?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO