LÍZAL, R. Detekce plagiátů textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Posudky

Posudek vedoucího

Smital, Lukáš

Předložená diplomová práce se zabývá problematikou automatického rozpoznání plagiátů textových dokumentů. V práci student navrhl a realizoval algoritmus, který vyhodnocuje podobnost dvou dokumentů na základě více jednodušších příznaků, jejichž výsledky váhuje a sčítá. K samotnému řešení mám následující připomínky. Algoritmus nelze použít na libovolnou databázi, jelikož si neporadí se strukturou adresářů ani s libovolným formátem dokumentů. Před detekcí je nutné data převést na formát TXT a uložit do jednoho adresáře, na což také autor v práci upozorňuje. Další slabinou je lineární nastavování vah jednotlivých příznaků, které například nezohledňuje, že jeden z příznaků může vypovídat o plagiátu mnohem více než ostatní nebo naopak, že dva příznaky mohou mít shodnou vypovídající schopnost. V této oblasti by bylo možné vymyslet různá sofistikovanější rozhodovací kritéria. Závěrečné statistické zhodnocení detektoru je také spíše stručné. V práci oceňuji zařazení kapitoly „Křížové porovnání dokumentů“ kde byla dokázána schopnost algoritmu upozornit na plagiáty mezi neznámými dokumenty. Nutno podotknout, že zadání diplomové práce bylo splněno v celém rozsahu. Formálně bych práci vytkl především její kratší rozsah, kde je celá praktická část obsažena na šestnácti stranách. Další závažnější formální prohřešky v práci nenacházím. Aktivita studenta při řešení diplomové práce byla přiměřená a student řádně využíval konzultačních hodin. Celkově práci považuji za průměrnou a hodnotím stupněm C.

Navrhovaná známka
C
Body
75

Posudek oponenta

Vítek, Martin

Student nastudoval a popsal problematiku detekce plagiátů textových dokumentů. Nalezl celkem sedm příznaků vhodných k detekci textových plagiátů a otestoval je na reálných datech. Následně realizoval algoritmus pro detekci plagiátů založený na kombinování těchto příznaků a otestoval jej na reálných datech. Dosažené výsledky vyhodnotil. Zadání diplomové práce považuji za splněné v plném rozsahu. Po formální stránce musím vytknout zejména značně podprůměrný rozsah práce, která má od úvodu po závěr pouhých 34 stran. Rozšířit by zasloužila jak teoretická, tak praktická část práce. Po odborné stránce vytýkám absenci jakýchkoliv ukázek v kapitole 6, která popisuje testované příznaky pro detekci plagiátů. Kombinování příznaků je založeno na lineárně přidělených vahách, což nepovažuji za příliš vhodné a navíc jsou váhy v tabulce 7.1 vypočteny špatně. Práce obsahuje jedinou ukázku detekce plagiátu v tabulce 8.2, což nepovažuji za dostatečné. Přestože je program jako celek funkční, umožňuje porovnávat vždy jen jednu ručně vybranou dvojici dokumentů, což značně snižuje možnosti jeho praktického využití. Vzhledem k uvedeným výhradám práci hodnotím stupněm uspokojivě / D.

Navrhovaná známka
D
Body
65

eVSKP id 84472