Zjednoznačňování pojmenovaných entit ve slovenštině

but.committeedoc. Ing. František Zbořil, Ph.D. (předseda) doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) Ing. Jiří Hynek, Ph.D. (člen) Ing. Lukáš Kekely, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Na straně 20 píšete, že při tvorbě znalostní báze dochází k přetěžování API Wikipedie. Proč tedy používáte API a nezískáváte potřebné informace z offline souborů, které by pro Vaše potřeby měly být dostupné? Na straně 25 uvádíte, že při aktualizaci znalostní báze přidáváte unikátní entity ze staré verze Wikipedie do nové verze. Nemůže mít jejich odstranění racionální důvod (např. porušení pravidel Wikipedie)? Můžete porotě ukázat několik příkladů odstranění entit z Wikipedie a uvést pravděpodobné důvody, proč k tomu došlo? Jaký je vztah mezi češtinou a slovenštinou z hlediska morfologie?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorKrižan, Samuelcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.accessioned2022-06-21T07:56:09Z
dc.date.available2022-06-21T07:56:09Z
dc.date.created2022cs
dc.description.abstractPráca sa zaoberá rozpoznávaním a zjednoznačňovaním pomenovaných entít. V rámci práce bol vytvorený základný systém obsahujúci všetky prerekvizity potrebné pre zjednoznačňovanie pomenovaných entít v slovenčine. Súčasťou systému je vytvorenie znalostnej bázy z exportu slovenskej Wikipédie. Tá bola následne porovnávaná so znalostnou bázou z Wikidát, čím sa zistilo, že hlavným prínosom použitia znalostnej bázy z Wikipédie pre slovenčinu je väčšie pokrytie entitami s odkazom na slovenskú Wikipédiu a lepšie určovanie tried entít. Okrem toho bola vykonaná aj aktualizácia morfologického slovníka výskumnej skupiny KNOT@FIT, ktorá priniesla zlepšenie v rozsahu 33-39 %. Práca predpokladá možné využitie v spojitosti s rozšírením systému o zjednoznačňovací modul a zlepšením pokrytia alternatívnych pomenovaní.cs
dc.description.abstractThesis deals with the topic of named entity recognition and disambiguation. A basic system was created which includes all prequisitions necessary for named entity disambiguation in Slovak language. Part of the system is building of a knowledge base out of an export from Slovak Wikipedia. This was subsequently compared to knowledge base obtained from Wikidata, which revealed that the main contribution of Wikipedia knowledge base for Slovak language is greater coverage of entities with link to Slovak Wikipedia and better determination of entity classes. Apart from that, morfological dictionary of KNOT@FIT research group was updated, which yielded an improvement by 33-39 %. This work presumes possible utilization in relation to system extention by a disambiguation modul and enhancement of alternative names coverage.en
dc.description.markDcs
dc.identifier.citationKRIŽAN, S. Zjednoznačňování pojmenovaných entit ve slovenštině [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other145146cs
dc.identifier.urihttp://hdl.handle.net/11012/207283
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectpomenovaná entitacs
dc.subjectrozpoznávanie pomenovaných entítcs
dc.subjectzjednoznačňovanie pomenovaných entítcs
dc.subjectznalostná bázacs
dc.subjectWikipédiacs
dc.subjectextrakcia informáciícs
dc.subjectnamed entityen
dc.subjectnamed entity recognitionen
dc.subjectnamed entity disambiguationen
dc.subjectknowledge baseen
dc.subjectWikipediaen
dc.subjectinformation extractionen
dc.titleZjednoznačňování pojmenovaných entit ve slovenštiněcs
dc.title.alternativeNamed Entity Disambiguation in Slovaken
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2022-06-15cs
dcterms.modified2022-06-20-10:23:08cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid145146en
sync.item.dbtypeZPen
sync.item.insts2022.06.21 09:56:09en
sync.item.modts2022.06.21 08:19:47en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.75 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-24563_v.pdf
Size:
86.34 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-24563_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-24563_o.pdf
Size:
90.43 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-24563_o.pdf
Loading...
Thumbnail Image
Name:
review_145146.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_145146.html
Collections