JELEČEK, J. Automatické zjišťování významu textu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.

Posudky

Posudek vedoucího

Povoda, Lukáš

Študent vo svojej práci vytvoril databázu textov v 3 rôznych jazykoch pre trénovanie klasifikátora pre rozlišovanie pozitívneho a negatívneho textu. Texty boli automaticky stiahnuté pomocou navrhnutého skriptu z rôznych webov s hodnotením produktov a automaticky zaradené do jednej z tried. Na časti stiahnutej databázy si študent vyskúšal trénovanie klasifikátor a porovnanie rôznych metód umelej inteligencie. Študent sa pravidelne (až na pár výnimiek) účastnil konzultácií a riadil sa pokynmi vedúceho. Vďaka svedomitému prístupu v tejto práci vznikli obrovské databázy, ktoré budú použité v ďalšom výskume. Po formálnej stránke je práca celkovo na dobrej úrovni, po obsahovej stránke je nutné vytknúť stručnosť niektorých zásadných kapitol.

Navrhovaná známka
A
Body
90

Posudek oponenta

Dvořák, Pavel

Student se v práci věnuje klasifikaci textu do dvou tříd dle náboje textu. Pro tento účel byla vytvořena databáze ve třech různých jazycích a otestovány čtyři klasifikátory a tři různé jazyky. Z tohoto pohledu je možné konstatovat, že zadání bylo zcela splněno. V teoretické části chybí popis jednoho z nich, konkrétně FLM. Student by měl hned na začátku praktické části zmínit vše o vytvořené databázi. V práci byly zkoumány dvě různě velké databáze, ovšem každá z nich je popsána na jiném místě. U algoritmu FLM je poté čtenář zmaten přítomností dvou databází, kde druhá z nich je popsána až později. Dále student píše, že ve větší databázi je přítomno 5000 trénovacích a 2500 testovacích vzorků. Ve výsledcích pro různé jazyky je ovšem v tabulkách 5000 vzorků pro každou skupinu. Čísla odkazů na jednotlivé tabulky v textu jsou posunuta. Text občas působí kostrbatě, např. chybějící přísudky ve větách apod. V obrázku znázorňujícím úspěšnost pro různé by měla být lépe využita plocha grafu. V práci je také poměrně málo zdrojové literatury. Dále mi zde chybí popis použitých příznaků pro klasifikaci textu.

Navrhovaná známka
B
Body
83

Otázky

eVSKP id 85242