Predikce rozpustnosti proteinů

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Proteínová rozpustnosť je úzko spojená s použiteľnosťou proteínov pre účely priemyselného využitia a vo výskume. Predikcia rozpustnosti by preto viedla k značnému ušetreniu finančných prostriedkov. V tejto práci je prezentovaný nový prediktor rozpustnosti Solpex založený na strojovom učení, ktorý na nezávislej testovacej sade dosiahol vyššiu presnosť ako porovnateľné existujúce prediktory. Realizácii prediktoru predchádzalo oboznámenie s biologickou podstatou rozpustnosti, preskúmanie existujúcich prístupov k predikcii, tvorba dátových sád, uskutočnenie experimentov a výber vlastností pre prediktor. Najpodstatnejšou z týchto častí je pravdepodobne tvorba dátových sád, ktoré sú kľúčové pre vytvorenie kvalitného prediktoru. V súvislosti s dátovými sadami je v tejto práci podrobne popísané spracovanie hlavného zdroja ich dát - databázy TargetTrack.
Protein solubility is closely related to the usability of proteins in industrial use and research. The successful prediction of solubility would therefore lead to a significant saving of financial resources. This work presents new solubility predictor Solpex based on machine learning that achieved better performance on independent test set than any comparable solubility prediction tool. The predictor implementation was preceded by a study of the biological nature of solubility, evaluation of existing solubility prediction approaches, datasets building, many experiments with novel features and selection of the best features for the predictor. As the most important step in machine learning is the datasets building, this work mainly benefits from own rigorous processing of the main source of solubility data - the TargetTrack database.
Description
Citation
MARUŠIAK, M. Predikce rozpustnosti proteinů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Ing. Jan M. Honzík, CSc. (místopředseda) Ing. Radek Kočí, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen)
Date of acceptance
2018-06-12
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Které z vybraných vlastností měly nejvyšší vliv na přesnost predikce? Myslíte si, že by mělo význam využít pro prediktor rozpustnosti hlubokých neuronových sítí, podobně jako to bylo u nástroje DeepSol?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO