Extrakce informací z Wikipedie
Information Extraction from Wikipedia
Author
Advisor
Smrž, PavelReferee
Otrusina, LubomírGrade
DAltmetrics
Metadata
Show full item recordAbstract
Tato bakalářská práce se zabývá problematikou extrakce informací z nestrukturovaného textu. V první části jsou čtenáři přiblíženy jednotlivé metody, které se v informačních tech- nologiích používají k extrakci informací. Následně je popsán návrh a realizace systému, který získává požadovaná data ze zadaných článků internetového serveru Wikipedie. V po- slední části práce je provedena analýza dosažených výsledků. This bachelor's thesis describes the issue of information extraction from unstructured text. The first part contains summary of basic techniques used for information extracting. Thereafter, concept and realization of the system for information extraction from Wikipedia is described. In the last part of thesis, results, coming from experiments, are analysed.
Keywords
Extrakce informací, pravidlový systém, Wikipedie, Python, Information extraction, rule-based system, Wikipedia, PythonLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen)Date of defence
2013-06-12Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Podle čeho jste v kapitole 3.2.5 vycházel při vytváření sady pravidel pro odhadování nevyjádřeného podmětu? Co máte na mysli pod pojmy "Neprodukovaných odpovědí" a "Neúplně vyhodnocených relací" uvedených v tabulkách v kapitole 4. Pojmy nejsou nikde vysvětleny.Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/54818Source
KRIŠTOF, T. Extrakce informací z Wikipedie [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.Collections
- 2013 [354]