Lze to říci jinak aneb automatické hledání parafrází
Automatic Identification of Paraphrases
Abstract
Automatické získávání parafrází je důležitou úlohou v oblasti zpracování přirozeného jazyka. Uplatnění nalezne v systémech provádějících odpovídání na otázky, získávání informací nebo shrnutí dokumentů. Tato práce má za úkol seznámit čtenáře s problematikou získávání parafrází a následně vytvořit systém, který z volného textu parafráze získává. Práce nejprve vysvětlí hlavní pojmy v této oblasti, jako jsou parafráze nebo parafrázové vzory. Dále shrne přístupy k získávání parafrází z různých zdrojů. V další části je popsán návrh systému, který je zaměřen na získávání parafrází mezi dvěma pojmenovanými entitami. Na závěr jsou popsány metody vyhodnocování těchto systémů a je provedeno vyhodnocení našeho systému a jeho srovnání s podobnými systémy. Automatic paraphrase discovery is an important task in natural language processing. Many systems use paraphrases for improve performance e.g. systems for question answering, information retrieval or document summarization. In this thesis, we explain basic concepts e.g. paraphrase or paraphrase pattern. Next we propose some methods for paraphrase discovery from various resources. Subsequently we propose an unsupervised method for discovering paraphrase from large plain text based on context and keywords between NE pairs. In the end we explain evaluation metods in paraphrase discovery area and then we evaluate our system and compare it with similar systems.
Keywords
parafráze, získávání parafrází, parafrázové vzory, pojmenované entity, paraphrase, paraphrase aquisition, paraphrase pattern, named entitiesLanguage
čeština (Czech)Study brunch
Inteligentní systémyComposition of Committee
Date of defence
2009-06-22Process of defence
Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/53812Source
OTRUSINA, L. Lze to říci jinak aneb automatické hledání parafrází [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2009.Collections
- 2009 [159]