Show simple item record

Machine-Learning Methods in Natural Language Processing

dc.contributor.advisorOtrusina, Lubomírcs
dc.contributor.authorVantuch, Marekcs
dc.date.accessioned2020-06-23T08:01:59Z
dc.date.available2020-06-23T08:01:59Z
dc.date.created2011cs
dc.identifier.citationVANTUCH, M. Metody strojového učení ve zpracování přirozeného jazyka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.cs
dc.identifier.other42751cs
dc.identifier.urihttp://hdl.handle.net/11012/55836
dc.description.abstractPráce se zabývá automatickým značkováním českého jazyka za pomocí existujících implementací, využívajících model Conditional Random Fields a algoritmy L-BFGS a SDG. Jsou popsány základní pravidla značkování a problémy, se kterými se tento obor potýká v případě zpracování českého jazyka. Čtenáři jsou vysvětleny principy použitých algoritmů a modelů, které jsou implementovány v programech CRF++ a CRFSuite. Práce se poté zaměřuje na vlastní testování úspěšnosti na českém korpusu a snaží se nalézt nejvhodnější hodnoty parametrů při využití všech rysů. Při nalezení rozumného kompromisu mezi časem a přesností se poté snaží tuto hodnotu ještě zpřesnit za pomoci analýzy přínosu jednotlivých rysů a možností jejich vynechání.cs
dc.description.abstractFirstly, basic rules of tagging of the Czech language are described as well as problems connected to this field. Thereafter the focus of the thesis is put on the success rate of testing on the Czech corpus and at the same time trying to find the most suitable parameter values for using the features. After reaching a reasonable compromise between duration and accuracy, the value is then attempted to be improved using analysis of separate features and their eventual omission.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectstrojové učenícs
dc.subjectznačkování textucs
dc.subjectConditional Random Fieldscs
dc.subjectL-BFGScs
dc.subjectMachine Learningen
dc.subjectPOS taggingen
dc.subjectConditional Random Fieldsen
dc.subjectL-BFGSen
dc.titleMetody strojového učení ve zpracování přirozeného jazykacs
dc.title.alternativeMachine-Learning Methods in Natural Language Processingen
dc.typeTextcs
dcterms.dateAccepted2011-06-16cs
dcterms.modified2020-05-09-23:42:52cs
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
sync.item.dbid42751en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 17:02:05en
sync.item.modts2021.11.12 16:47:52en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeMrnuštík, Michalcs
dc.description.markCcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
but.committeeprof. Ing. Jan M. Honzík, CSc. (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (místopředseda) Ing. Jaroslav Ráb (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Jaká je baseline pro experimenty (úspěšnost taggeru, který přiřadí každému slovu jeho nejčastější značku), při použití stejných pozic značky jako v experimentech? Je dosažená úspěšnost uváděna pro evaluční sadu určenou v PDT, nebo byla evaluační data vybrána jinak?cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record