Bioinformatický nástroj pro predikci rozpustnosti proteinů

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Táto diplomová práca sa zaoberá rozpustnosťou rekombinantných proteínov a hlavne jej predikciou. Približuje čitateľovi problematiku vzniku proteínov, ako aj proces tvorby rekombinantných proteínov. Syntetická výroba rekombinantných proteínov je významným prínosom napríklad pre farmakologický priemysel. Ide však o náročný proces, ktorý navyše nemusí priniesť použiteľné proteíny. Podstatným ukazateľom použiteľnosti výsledných proteínov je práve ich rozpustnosť. Pre spoločnosti, zaoberajúce sa výrobou rekombinantných proteínov, je samozrejme výhodné sústrediť svoje úsilie a prostriedky na výrobu tých proteínov, ktoré budú v praxi použiteľné. V tomto ohľade podáva pomocnú ruku bioinformatika, ktorá je pomocou techník strojového učenia schopná predikovať rozpustnosť proteínov, napríklad na základe ich sekvencie. Táto práca zoznamuje čiteteľa so základnými princípmi strojového učenia a predstavuje niektoré metódy strojového učenia, používané okrem iného aj na predikciu rozpustnosti proteínov. Práca ďalej opisuje vytvorenú dátovú sadu, ktorá je neskôr použitá na testovanie vybraných prediktorov a pre trénovanie konsenzuálneho prediktoru, ktorý je cieľom práce. Ďalej sa práca zameriava na konkrétne existujúce prediktory rozpustnosti proteínov a prezentuje základné princípy ich funkčnosti, ako aj výsledky ich testovania. V závere prezentuje konsenzuálny metaprediktor rozpustnosti proteínov.
This master's thesis addresses the solubility of recombinant proteins and its prediction. It describes the subject of protein synthesis, as well as the process of recombinant protein creation. Recombinant protein synthesis is of great importance for example to pharmacologic industry. This synthesis is not a simple task and it does not always produce viable proteins. Protein solubility is an important factor, determining the viability of the resulting proteins. It is of course favourable for companies, that take part in recombinant protein synthesis, to focus their effort and their resources on proteins, that will be viable in the end. In this regard, bioinformatics is of great help, as it is capable, with the help of machine learning, of predicting the solubility of proteins, for example based on their sequences. This thesis introduces the reader to the basic principles of machine learning and presents several machine learning methods, used in the field of protein solubility prediction. It deals with the definition of a dataset, which is later used to test selected predictors, as well as to train the ensemble predictor, which is the main focus of this thesis. It also focuses on several specific protein solubility predictors and explains the basic principles upon which they are built, as well as the results of their testing. In the end, it presents the ensemble predictor of protein solubility.
Description
Citation
HRONSKÝ, P. Bioinformatický nástroj pro predikci rozpustnosti proteinů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. František Zbořil, Ph.D. (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. Jan Platoš, Ph.D. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)
Date of acceptance
2016-06-20
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Obsahovala datová sada, která byla použita pro testování prediktorů nějaká data, která byla součástí trénovací sady některého z použitých prediktorů? Čím si vysvětlujete to, že prediktor pred_weka predikuje pro většinu proteinů hodnotu nerozpustné?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO