Aplikace metody učení bez učitele na hledání podobných grafů

but.committeeprof. Dr. Ing. Pavel Zemčík (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) Ing. Libor Polčák, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: V technické zprávě uvádíte, že dostupná data byla rozdělena na trénovací, testovací a validační datovou sadu. Jak přesně byly využity jednotlivé datové sady při tvorbě samoučících systémů?cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKřivka, Zbyněkcs
dc.contributor.authorSabo, Jozefcs
dc.contributor.refereeBurgetová, Ivanacs
dc.date.accessioned2021-06-25T07:55:35Z
dc.date.available2021-06-25T07:55:35Z
dc.date.created2021cs
dc.description.abstractCieľom tejto diplomovej práce bolo v spolupráci s firmou Avast navrhnúť systém, ktorý dokáže dolovať znalosti z databázy grafov pomocou metód učenia bez učiteľa. Grafy, určené pre dolovanie, popisujú chovanie počítačových systémov a do databázy prichádzajú anonymne od používateľov softvérových produktov firmy. Grafom v databáze je možné priradiť jednu z dvoch tried: čistý graf alebo malware (škodlivý) graf. Úlohou navrhnutého samoučiacieho systému je nad grafovou databázou nájsť zhluky grafov, v ktorých sa triedy grafov nemiešajú. Zhluky grafov, v ktorých sa nachádza iba jedna trieda grafov, sa dajú interpretovať ako rôzne typy čistých alebo malware grafov a sú užitočným zdrojom ďalších analýz nad grafmi. Pre ohodnotenie kvality zhlukov bola navrhnutá vlastná metrika pomenovaná ako jednofarebnosť. Metrika hodnotí kvalitu zhlukov na základe toho ako veľmi sa v zhlukoch miešajú čisté a malware grafy. Najlepšie výsledky metrika dosiahla, keď boli vektorové reprezentácie grafov vytvorené modelom hlbokého učenia (variačným grafovým autoenkodérom s dvomi relačnými grafovými konvolučnými operátormi)  a pre zhlukovanie nad vektormi bola použitá bezparametrická metóda MeanShift.cs
dc.description.abstractGoal of this master's thesis was in cooperation with the company Avast to design a system, which can extract knowledge from a database of graphs. Graphs, used for data mining, describe behaviour of computer systems and they are anonymously inserted into the company's database from systems of the company's products users. Each graph in the database can be assigned with one of two labels: clean or malware (malicious) graph. The task of the proposed self-learning system is to find clusters of graphs in the graph database, in which the classes of graphs do not mix. Graph clusters with only one class of graphs can be interpreted as different types of clean or malware graphs and they are a useful source of further analysis on the graphs. To evaluate the quality of the clusters, a custom metric, named as monochromaticity, was designed. The metric evaluates the quality of the clusters based on how much clean and malware graphs are mixed in the clusters. The best results of the metric were obtained when vector representations of graphs were created by a deep learning model (variational  graph autoencoder with two relation graph convolution operators) and the parameterless method MeanShift was used for clustering over vectors.en
dc.description.markCcs
dc.identifier.citationSABO, J. Aplikace metody učení bez učitele na hledání podobných grafů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136765cs
dc.identifier.urihttp://hdl.handle.net/11012/200141
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectgrafcs
dc.subjectAvastcs
dc.subjectučenie bez učiteľacs
dc.subjectzhlukovaniecs
dc.subjectdetekcia komunítcs
dc.subjectvektorové reprezentácie uzlovcs
dc.subjectvektorové reprezentácie grafovcs
dc.subjectgrafové neurónové sietecs
dc.subjectgraphen
dc.subjectAvasten
dc.subjectunsupervised learningen
dc.subjectclusteringen
dc.subjectcommunities detectionen
dc.subjectnode embeddingsen
dc.subjectgraph embeddingsen
dc.subjectgraph neural networksen
dc.titleAplikace metody učení bez učitele na hledání podobných grafůcs
dc.title.alternativeApplication of Unsupervised Learning Methods in Graph Similarity Searchen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2021-06-23cs
dcterms.modified2021-06-24-11:35:09cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136765en
sync.item.dbtypeZPen
sync.item.insts2021.11.23 00:10:59en
sync.item.modts2021.11.22 23:24:21en
thesis.disciplineVývoj aplikacícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.12 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23791_v.pdf
Size:
86.07 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23791_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23791_o.pdf
Size:
89.52 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23791_o.pdf
Loading...
Thumbnail Image
Name:
review_136765.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
review_136765.html
Collections