Generátor síťového provozu pro testování klasifikačních algoritmů

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Pokrok při zdokonalování klasifikačních algoritmů je zpomalován nedostatkem dat potřebných pro testování. Reálná data je obtížné získat z důvodu bezpečnosti a ochrany citlivých informací. Existují však generátory syntetických sad pravidel, jako například ClassBench-ng. K vyhodnocení správného fungování, propustnosti, spotřeby energie a dalších vlastností klasifikačních algoritmů je zapotřebí také vhodný síťový provoz. Tématem této práce je tvorba takového generátoru síťového provozu, který by umožnil testování těchto vlastností v kombinaci s IPv4, IPv6 a OpenFlow1.0 pravidly vygenerovanými ClassBench-ng. Práce se zabývá různými způsoby, jak toho dosáhnout, které vedly k vytvoření několika verzí generátoru. Vlastnosti jednotlivých verzí byly zkoumány řadou experimentů. Implementace byla provedena pomocí jazyku Python. Nejvýznamnějším výsledkem je generátor, který využívá principů několika zkoumaných přístupů k dosažení co nejlepších vlastností. Dalším přínosem je nástroj, který bylo nutné vytvořit pro analýzu užitých sad klasifikačních pravidel a vyhodnocení vlastností vygenerovaného síťového provozu.
Efforts to improve classification algorithms are being slowed down by lack of data required for testing. For confidentiality and security reasons it is difficult to obtain real data. Good rule set generation tools, such as ClassBench-ng, exist. However, in order to evaluate proper functioning, throughput, power consumption, and other properties of packet classification algorithms, it is necessary to also use network traffic. Subject of this thesis is creating a network traffic generator that would allow for testing of such properties using IPv4, IPv6, and OpenFlow1.0 rules created by ClassBench-ng. The work explores different ways to achieve this, which resulted in several versions of the generator. Those were experimented with and evaluated. Implementation was done using Python. The primary result is a generator combining multiple approaches to achieve the best properties of created header traces. Another contribution of this thesis is a tool that was necessary to create for analyzing rule sets and evaluating generated header traces.
Description
Citation
JANEČEK, D. Generátor síťového provozu pro testování klasifikačních algoritmů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Počítačové sítě a komunikace
Comittee
doc. Ing. Ondřej Ryšavý, Ph.D. (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (místopředseda) Ing. Matěj Grégr, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Lukáš Kekely, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen)
Date of acceptance
2020-07-17
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně. Otázky u obhajoby: Jakým způsobem je zaručeno, že výsledný algoritmus kombinovaného generátoru hlaviček bude produkovat správné správné pokrytí? Je možné iterováním zjistit jaké hodnoty parametrů vašeho algoritmu (overlap_focus, search_limit, num_headers) jsou pro danou sadu pravidel nejvhodnější?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO