Show simple item record

Reordering Text Fragments Using a Language Model

dc.contributor.advisorBeneš, Karelcs
dc.contributor.authorHolubec, Michaelcs
dc.date.accessioned2022-06-24T06:55:14Z
dc.date.available2022-06-24T06:55:14Z
dc.date.created2022cs
dc.identifier.citationHOLUBEC, M. Uspořádání fragmentů textu s pomocí jazykového modelu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other145399cs
dc.identifier.urihttp://hdl.handle.net/11012/207803
dc.description.abstractCílem této práce je sestrojit a experimentálně ověřit účinnost jazykového modelu při identifikaci posloupnosti čtení (Reading Order). K tomuto účelu byl sestrojen jazykový model využívající rekurentní neuronovou síť LSTM. Práce dále navrhuje a implementuje celkem tři metody, jazykovou analýzu, prostorovou analýzu a kombinovanou analýzu, pomocí kterých je posloupnost čtení identifikována. Jazyková a kombinovaná analýza ke své činnosti přímo používají vytvořený jazykový model. Úspěšnost identifikace posloupnosti prostřednictvím všech tří metod byla změřena na třech datasetech obsahující novinové články s různým rozložením. Jazyková analýza dosahuje úspěšnosti 57,6 %, prostorová analýza dosahuje 91,6 %. Nejlepších výsledků dosahuje kombinovaná analýza, která vykazuje úspěšnost 92,9 %. Práce ukazuje, že jazykový model lze pro identifikaci posloupnosti čtení použít, avšak výsledky experimentů naznačují, že je vhodné zpracování odhadu posloupnosti doplnit o další informace, jako je to například v kombinované analýze, která pracuje jak s jazykovým modelem, tak s prostorovými informacemi.cs
dc.description.abstractThe aim of this work is to construct and experimentally verify the effectiveness of the language model in identifying the reading order. For this purpose language model with LSTM architecture was constructed. This work designs and implements three methods which are used to identify reading order. These methods are Language analysis, Spatial analysis and Combined analysis. Language analysis and combined analysis used constructed language model. The success of the language model, and all three methods, was measured on three datasets containing newspaper articles. Language analysis reaches 57,6 % and spatial analysis reaches 91,6 %. Combined analysis achieved the best results 92,9 %. The work shows that the language model can be used to identify reading order but use of additional data (e.g. spatial dataen
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectPosloupnost čtenícs
dc.subjectJazykový modelcs
dc.subjectJazyková analýzacs
dc.subjectProstorová analýzacs
dc.subjectReading orderen
dc.subjectLanguage modelen
dc.subjectLanguage analysisen
dc.subjectSpatial analysisen
dc.titleUspořádání fragmentů textu s pomocí jazykového modelucs
dc.title.alternativeReordering Text Fragments Using a Language Modelen
dc.typeTextcs
dcterms.dateAccepted2022-06-21cs
dcterms.modified2022-06-23-09:13:51cs
thesis.disciplineInformační systémy a databázecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid145399en
sync.item.dbtypeZPen
sync.item.insts2022.06.24 08:55:14en
sync.item.modts2022.06.24 08:12:45en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeKocour, Martincs
dc.description.markAcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
but.committeedoc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Jiří Hynek, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) prof. Ing. Tomáš Vojnar, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: V technickej správe spomínate jazykový model založený na LSTM neurónovej sieti, experimentovali ste aj s inými typmi jazykových modelov? Jak jste získal dataset Europeana Newspapers Project? Proč jste tento dataset zvolil, a jak jste data očistil?cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologie a umělá inteligencecs
but.jazykčeština (Czech)


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record