Určování typů a atributů entit napříč jazyky

but.committeedoc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: Na straně 14 píšete: "Na české Wikipedii program dosahuje úspěšnosti 98 %, na slovenské verzi 96 %." Můžete komisi vysvětlit, jak jste k těmto číslům dospěl? V práci to není dostatečně vysvětleno. Na straně 29 píšete: "Systém převádí wikitext na prostý text s vysokou úspěšností." Čím můžete toto tvrzení podložit? V práci to není uvedeno. Existují nějaké další systémy a porovnal jste je se svým? Obsahuje práce porovnání s dalšími systémy?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorŠvub, Danielcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.accessioned2019-07-08T15:56:21Z
dc.date.available2019-07-08T15:56:21Z
dc.date.created2019cs
dc.description.abstractCílem této práce je analýza článků na internetové encyklopedii Wikipedii a převod jejich textu psaného v přirozeném jazyce na strukturovanou databázi osob, míst a dalších entit. Podstatou implementovaného programu je určení typu entity na základě typických znaků, které ji charakterizují, a extrakce nejdůležitějších atributů této entity v českém a slovenském jazyce. Výsledkem práce je báze znalostí umožňující snadné vyhledávání a třídění informací. Díky snadné rozšiřitelnosti je možné do programu přidat identifikaci dalších typů entit a dalších vlastností, případně i podporu jiných jazyků.cs
dc.description.abstractThe target of this thesis is to analyze articles on the Wikipedia internet encyclopedia and to convert their text written in natural language into a structured database of persons, places and other entities. The essence of the implemented program is the determination of the type of entity based on its typical characteristics, and the extraction of the most important attributes of this entity in the Czech and Slovak languages. The result of this task is a knowledge base allowing simple searching and sorting of information. Thanks to its easy extensibility, it is possible to add identification of other types of entities and other features to the program, as well as a support of other languages.en
dc.description.markEcs
dc.identifier.citationŠVUB, D. Určování typů a atributů entit napříč jazyky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122119cs
dc.identifier.urihttp://hdl.handle.net/11012/180235
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectWikipediecs
dc.subjectextrakce informacícs
dc.subjectanalýza textucs
dc.subjectatributy entitcs
dc.subjectWikipediaen
dc.subjectinformation extractionen
dc.subjecttext miningen
dc.subjectentity atributesen
dc.titleUrčování typů a atributů entit napříč jazykycs
dc.title.alternativeIdentifying Entity Types and Attributes Across Languagesen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-10cs
dcterms.modified2019-07-08-13:31:29cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122119en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 10:00:26en
sync.item.modts2021.11.12 09:18:31en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.09 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21926_v.pdf
Size:
85.72 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21926_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21926_o.pdf
Size:
90.56 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21926_o.pdf
Loading...
Thumbnail Image
Name:
review_122119.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_122119.html
Collections