Předzpracování a transformace textových kolekcí dat
Preprocessing and Transformation of Text Data Collections
Author
Advisor
Bartík, VladimírReferee
Burget, RadekGrade
DAltmetrics
Metadata
Show full item recordAbstract
Tato bakalářská práce se zabývá problematikou získávání znalostí z textů, především se zaměřením na předzpracování a transformaci. V teoretické části práce jsou obsaženy informace o vývoji a metodach procesů získávání znalostí z textů, textových kolekcí dat a využití v praxi. Další část této práce detailně popisuje jednotlivé kroky procesu předzpracování a transformace textových kolekcí dat. V závěrečných částech je přehled o vývoji aplikace, testování a osobní zhodnocení práce. This bachelor thesis deals with the issue of text-mining, mostly focused on preprocessing and transformation. In theoretical part there are contained information about development and principles of text-mining processes, text data collections and use in practice. The next part of this thesis describes in detail single steps of preprocessing and transformation of text data collections. In the final parts there are reviews of application development, testing and personal view on this thesis.
Keywords
získávání znalostí z textů, textové kolekce dat, předzpracování, tokenizace, označování slovních druhů, izolace kořene slova, stop-slova, text-mining, text data collections, preprocessing, tokenization, Part-Of-Speech tagging, stemming, stop-wordsLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Ing. Jiří Kunovský, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Bidlo, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen)Date of defence
2013-06-13Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Jaké existující kolekce textových dat jste prostudoval a co o nich můžete říct? Můžete nějakým způsobem shrnout výsledky Vašich experimentů a čím jsou zajímavéResult of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/54819Source
MARUNA, V. Předzpracování a transformace textových kolekcí dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.Collections
- 2013 [354]