Automatická tvorba slovníků z překladových textů
Automatic Creation of Dictionaries from Translations
Abstract
Cílem této bakalářské práce bylo vytvořit systém pro automatickou tvorbu slovníků z překladových testů. Je popsána implementace systému, který generuje česko-anglický slovník ze zarovnaného paralelního korpusu a shrnut výsledek práce. Dále je analyzován paralelní korpus CzEng, který byl použit jako zdroj dat pro slovníky a vysvětleny teoretické pojmy související s touto problematikou. The aim of this bachelor thesis was to make a system for automatic creation of dictionaries from translations. It describes the implementation of a system that generates Czech-English dictionary from the aligned parallel corpus and summarizes the results. It also analyzed CzEng parallel corpus, which was used as the data source for dictionaries and explainS the theoretical concepts related to this topic.
Keywords
slovník, korpus, zarovnání, strojový překlad, lemmatizace, dictionary, corpus, alignment, machine translation, lemmatizationLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen)Date of defence
2013-06-12Process of defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Jaké jsou možnosti ohodnocení jazykových modelů? Hodila by se například metrika "perplexity" pro váš projekt?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/54948Source
SUMBALOVÁ, L. Automatická tvorba slovníků z překladových textů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.Collections
- 2013 [354]