Automatizovaný návrh stabilních proteinů

Loading...
Thumbnail Image
Date
ORCID
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Stabilní proteiny nacházejí široké uplatnění v řadě medicínských a biotechnologických aplikacích. Přírodní proteiny se vyvinuly tak, aby fungovaly převážně v mírných podmínkách uvnitř buněk. V důsledku toho vzniká zájem o stabilizaci proteinů za účelem jejich širšího uplatnění také v průmyslovém prostředí. Obor proteinového inženýrství se v posledních letech rozvinul do úrovně umožňující modifikovat proteiny pro různá využití, ačkoliv identifikace stabilních mutací je stále zatížená drahou a časově náročnou experimentální prací. Výpočetní metody se proto uplatňují jako atraktivní alternativa, která dovoluje prioritizovat potenciálně stabilizující mutace pro laboratorní práci. Během posledních let bylo vyvinuto velké množství výpočetních strategií: i) výpočty energie pomocí silových polí, ii) evoluční metody, iii) strojové učení a iv) kombinace více přístupů. Spolehlivost a využití nástrojů jsou často limitovány predikcí pouze jednobodových mutací, které mají malý dopad na stabilitu proteinů, zatímco sofistikovanější metody pro predikci multibodových mutací vyžadují větší množství práce na straně uživatele. Hlavním záměrem této práce je poskytnout uživatelům plně automatizované metody, umožňující návrh vysoce stabilních vícebodových mutantů bez potřeby pokročilých znalostí bioinformatických nástrojů a zkoumaného proteinu. V této práci jsou prezentovány následující nástroje a databáze:  FireProt je plně automatizovaná metoda pro návrh stabilních vícebodových mutantů z kategorie tzv. hybridních přístupů. Ve svém výpočetním jádře spojuje jak energetické tak i evoluční metody, přičemž evoluční informace jsou užívány především jako filtry pro časově náročné výpočty energií. Kromě detekce potenciálně stabilizujících mutací se FireProt rovněž snaží spojit tyto mutace do jednoho vícebodového mutanta s minimalizací rizika vzniku antagonistických efektů. FireProt-ASR je plně automatizovaná platforma pro rekonstrukci ancestrálních sekvencí, která dovoluje uživatelům využít tuto strategii bez nutnosti velkého objemu manuální práce a hluboké znalosti zkoumaného proteinu. FireProt-ASR řeší všechny kroky ancestrální rekonstrukce, včetně sběru biologicky relevantních sekvencí, konstrukce zakořeněného fylogenetického stromu a rekonstrukce ancestrálních sekvencí.HotSpotWizard je nástroj pro návrh mutací a mutačních knihoven za účelem zlepšení stability a aktivity zkoumaných proteinů. Nástroj dovoluje provést i širší analýzu za využití čtyř různých strategií běžně používaných v oboru proteinového inženýrství: i) identifikace evolučně variabilních pozic v blízkosti katalytických kapes a tunelů, ii) identifikace pohyblivých regionů, iii) výpočet sekvenčního konsensu a iv) identifikace korelovaných pozic.FireProt-DB je databáze dostupných experimentálních dat popisujících stabilitu proteinů. Hlavním účelem této databáze je standardizovat data v oblasti proteinové stability, poskytnout uživatelům platformu k jejich snadnému ukládání a umožnit intuitivní vyhledávání, které by mohly být využité k trénování nových nástrojů s využitím technik strojového učení.
Stable proteins are utilized in a vast number of medical and biotechnological applications. However, the native proteins have mostly evolved to function under mild conditions inside the living cells. As a result, there is a great interest in increasing protein stability to enhance their utility in the harsh industrial conditions. In recent years, the field of protein engineering has matured to the point that enables tailoring of native proteins for specific practical applications. However, the identification of stable mutations is still burdened by costly and laborious experimental work. Computational methods offer attractive alternatives that allow a rapid search of the pool of potentially stabilizing mutations to prioritize them for further experimental validation. A plethora of the computational strategies was developed: i) force-field-based energy calculations, ii) evolution-based techniques, iii) machine learning, or iv) the combination of several approaches. Those strategies are usually limited in their predictions to less impactful single-point mutations, while some more sophisticated methods for prediction of multiple-point mutations require more complex inputs from the side of the user. The main aim of this Thesis is to provide users with a fully automated workflow that would allow for the prediction of the highly stable multiple-point mutants without the requirement of the extensive knowledge of the bioinformatics tools and the protein of interest. FireProt is a fully automated workflow for the design of the highly stable multiple-point mutants. It is a hybrid method that combines both energy- and evolution-based approaches in its calculation core, utilizing sequence information as a filter for robust force-field calculations. FireProt workflow not only detects a pool of potentially stabilizing mutations but also tries to combine them together while reducing the risk of antagonistic effects. FireProt-ASR is a fully automated workflow for ancestral sequence reconstruction, allowing users to utilize this protein engineering strategy without the need for the laborious manual work and the knowledge of the system of interest. It resolves all the steps required during the process of ancestral sequence reconstruction, including the collection of the biologically relevant homologs, construction of the rooted tree, and the reconstruction of the ancestral sequences and ancestral gaps.HotSpotWizard is a workflow for the automated design of mutations and smart libraries for the engineering of protein function and stability. It allows for a wider analysis of the protein of interest by utilizing four different protein engineering strategies: i) identification of the highly mutable residues located in the catalytic pockets and tunnels, ii) identification of the flexible regions, iii) calculation of the sequence consensus, and iv) identification of the correlated residues.FireProt-DB is a database of the known experimental data quantifying a protein stability. The main aim of this database is to standardize protein stability data, provide users with well-manageable storage, and allow them to construct protein stability datasets to use them as training sets for various machine learning applications.
Description
Citation
MUSIL, M. Automatizovaný návrh stabilních proteinů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Výpočetní technika a informatika
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Ing. Jan Holub, Ph.D. (člen) doc. Ing. Jiří Kléma, Ph.D. (člen) Ing. Matej Lexa, Ph.D. (člen) doc. Mgr. Tomáš Vinař, Ph.D. (člen)
Date of acceptance
2021-12-15
Defence
Student přednesl cíle a výsledky, kterých v rámci řešení disertační práce dosáhl. V rozpravě student odpověděl na otázky komise a oponentů. Diskuze je zaznamenána na diskuzních lístcích, které jsou přílohou protokolu. Počet diskuzních lístků: 1 Komise se v závěru jednomyslně usnesla, že student splnil podmínky pro udělení akademického titulu doktor. Komise doporučuje, aby studentovi byla udělena cena za výjimečně kvalitní disertační práci.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO