Název:
Lze to říci jinak aneb automatické hledání parafrází
Překlad názvu:
Automatic Identification of Paraphrases
Autoři:
Otrusina, Lubomír ; Schwarz, Petr (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Automatické získávání parafrází je důležitou úlohou v oblasti zpracování přirozeného jazyka. Uplatnění nalezne v systémech provádějících odpovídání na otázky, získávání informací nebo shrnutí dokumentů. Tato práce má za úkol seznámit čtenáře s problematikou získávání parafrází a následně vytvořit systém, který z volného textu parafráze získává. Práce nejprve vysvětlí hlavní pojmy v této oblasti, jako jsou parafráze nebo parafrázové vzory. Dále shrne přístupy k získávání parafrází z různých zdrojů. V další části je popsán návrh systému, který je zaměřen na získávání parafrází mezi dvěma pojmenovanými entitami. Na závěr jsou popsány metody vyhodnocování těchto systémů a je provedeno vyhodnocení našeho systému a jeho srovnání s podobnými systémy.
Automatic paraphrase discovery is an important task in natural language processing. Many systems use paraphrases for improve performance e.g. systems for question answering, information retrieval or document summarization. In this thesis, we explain basic concepts e.g. paraphrase or paraphrase pattern. Next we propose some methods for paraphrase discovery from various resources. Subsequently we propose an unsupervised method for discovering paraphrase from large plain text based on context and keywords between NE pairs. In the end we explain evaluation metods in paraphrase discovery area and then we evaluate our system and compare it with similar systems.
Klíčová slova:
parafráze; parafrázové vzory; pojmenované entity; získávání parafrází; named entities; paraphrase; paraphrase aquisition; paraphrase pattern
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53812