TROJÁK, D. Extrakce textových dat z internetových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.

Posudky

Posudek vedoucího

Červenec, Radek

Student zadání splnil. Výsledkem je funkční aplikace pro extrakci obsahu z Internetových stránek a automatickou tvorbu databáze ve formátu XML. Velmi kladně hodnotím studentovu snahu získávat textový obsah z různých zdrojů. V tomto případě se jedná o sociální síť, zpravodajské servery nebo RSS kanály. Pokus o další rozšíření aplikace a integraci s prostředím RapidMiner se bohužel nezdařil, nicméně nebyl hlavním cílem této práce. Po formální a grafické stránce je práce na dobré úrovni. Student prokázal v průběhu roku schopnost samostatně pracovat a snažil se podněty vedoucího vždy do své práce začlenit.

Navrhovaná známka
A
Body
90

Posudek oponenta

Morský, Ondřej

Teoretická část práce je logicky strukturována od základních informací až po technologie použité v praktické části. Obsahuje několik pravopisných chyb a velmi řídké odkazování na literaturu. Některé zkratky (např. RSS) jsou vysvětleny až po několikátém použití. Program nefungoval příliš dobře. Po spuštění je možné stáhnout RSS feedy, ale nikde se mi nepodařilo nalézt soubor s uloženými daty. Stejně tak vyhledávání nikdy nenašlo žádný výsledek. Věřím však, že je to pouze drobná chyba způsobená jinou konfigurací počítače. Zdrojový kód je poměrně přehledný. Drobná nevýhoda je vložení seznamu RSS adres přímo do kódu.

Navrhovaná známka
A
Body
90

Otázky

eVSKP id 56788