Národní úložiště šedé literatury Nalezeno 9 záznamů.  Hledání trvalo 0.01 vteřin. 
Vyhledávání v semanticky obohacených textech
Dostál, Jiří ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá dotazováním nad rozsáhlými textovými daty, obohacenými o sémantické informace, zejména o vyznačení pojmenovaných entit zmíněných v textu. Text nejprve rozebírá způsoby indexace částečně stukturovaných textových dat a přístupy k jejich dotazování. Jádrem práce je potom návrh a implementace dotazovacího systému, který analyzuje dotazy uživatele a požadavky na rozsah a strukturu vracených informací, převádí je do formátu vyhledávacího systému MG4J, na výsledku aplikuje zadaná omezení a formátuje jej do požadovaného tvaru. Výsledky práce jsou zhodnoceny na základě statistik časových odezev sady dotazů nad indexem anglické Wikipedie, které jsou také porovnány s údaji získanými pomocí dosavadního systému dotazování.
Aplikace pro sumarizaci textu
Mička, Jakub ; Zendulka, Jaroslav (oponent) ; Bartík, Vladimír (vedoucí práce)
V této práci jsem se zaměřil na implementaci webové aplikace, která slouží jako prostředek pro automatickou tvorbu souhrnů v anglickém jazyce. Automatická tvorba souhrnů je v řešení prováděna pomocí metody TextRank a Latentní sémantické analýzy. Obě tyto metody jsou vylepšeny o rozpoznávání pojmenovaných entit. Přínosem této práce je zjištění, že využití rozpoznávání pojmenovaných entit u Latentní sémantické analýzy a především u metody TextRank, vede k vytváření kvalitnějších souhrnů. Tato kvalita souhrnů byla ověřena pomocí metrik ROUGE.
Lze to říci jinak aneb automatické hledání parafrází
Otrusina, Lubomír ; Schwarz, Petr (oponent) ; Smrž, Pavel (vedoucí práce)
Automatické získávání parafrází je důležitou úlohou v oblasti zpracování přirozeného jazyka. Uplatnění nalezne v systémech provádějících odpovídání na otázky, získávání informací nebo shrnutí dokumentů. Tato práce má za úkol seznámit čtenáře s problematikou získávání parafrází a následně vytvořit systém, který z volného textu parafráze získává. Práce nejprve vysvětlí hlavní pojmy v této oblasti, jako jsou parafráze nebo parafrázové vzory. Dále shrne přístupy k získávání parafrází z různých zdrojů. V další části je popsán návrh systému, který je zaměřen na získávání parafrází mezi dvěma pojmenovanými entitami. Na závěr jsou popsány metody vyhodnocování těchto systémů a je provedeno vyhodnocení našeho systému a jeho srovnání s podobnými systémy.
Entity Relationship Extraction
Šimečková, Zuzana ; Straka, Milan (vedoucí práce) ; Straňák, Pavel (oponent)
Úkol hledání sémantických vztahů mezi entitami na základě předloženého textu oz- načujeme jako extrakci vztahů (relationship extraction). Metodou distant supervision, která spočívá ve spojení báze znalostí (Wikidata) a korpusu (české Wikipedie), jsme vytvořili Český dataset pro extrakci vztahů (CERED). Použitou metodiku a problémy, na které jsme narazili, důkladně rozebíráme. CERED využíváme při tréninku neuronové sítě pro extrakci vztahů. Základem této sítě je BERT - lingvistický model předtrénovaný na velkém množství prostého textu. Navržený model vyhodnocujeme na anglických dat- ech (Semeval 2010 Task 8, TACRED) a porovnáváme jeho kvalitu s ostatními výsledky v oblasti extrakce vztahů. Přikládáme i výsledky naměřené na CEREDu. 1
Aplikace pro sumarizaci textu
Mička, Jakub ; Zendulka, Jaroslav (oponent) ; Bartík, Vladimír (vedoucí práce)
V této práci jsem se zaměřil na implementaci webové aplikace, která slouží jako prostředek pro automatickou tvorbu souhrnů v anglickém jazyce. Automatická tvorba souhrnů je v řešení prováděna pomocí metody TextRank a Latentní sémantické analýzy. Obě tyto metody jsou vylepšeny o rozpoznávání pojmenovaných entit. Přínosem této práce je zjištění, že využití rozpoznávání pojmenovaných entit u Latentní sémantické analýzy a především u metody TextRank, vede k vytváření kvalitnějších souhrnů. Tato kvalita souhrnů byla ověřena pomocí metrik ROUGE.
Named Entity Recognition and Linking
Taufer, Pavel ; Straka, Milan (vedoucí práce) ; Kliegr, Tomáš (oponent)
Cílem této diplomové práce je navrhnout a naimplementovat algoritmus pro rozpoznávání a propojování pojmenovaných entit. Součástí tohoto cíle je také navrhnutí a vytvoření báze znalostí, která je v algoritmu použita. Vzhledem k omezenému množství dat pro jiné jazyky než pro angličtinu chceme, aby naši metodu bylo možné natrénovat na jednom jazyku a naučené parametry přenést na jiné jazyky (ve kterých není tolik trénovacích dat). Práce se skládá z popisu dostupných bází znalostí, existujicích metod, navrhnutí a implementace vlastní báze znalostí a metody pro propojování pojmenovaných entit. Na několika variantách tradičního datasetu AIDA CoNLL-YAGO dosahuje implementovaný algoritmus nejlepších známých výsledků. Na vzorku českých anotovaných dat z datasetu PDT dosahuje algoritmus pomocí parametrů natrénovaných na anglickém CoNLL datasetu srovnatelných výsledků. Powered by TCPDF (www.tcpdf.org)
Normalizace pojmenovaných entit v českých textech
Kubát, Petr ; Vidová Hladká, Barbora (vedoucí práce) ; Popel, Martin (oponent)
Pojmenované entity jsou slovní spojení, která v textu označují objekty reálného světa. Normalizací entit nazveme jejich převod do základního tvaru. Práce se zabývá vytvořením pravidlové procedury určené k normalizaci pojmenovaných entit v českých textech. Proces návrhu jednotlivých pravidel této procedury je důkladně zmapován. Důraz je kladen na to, aby každé pravidlo bylo motivováno příklady reálných entit. Za účelem dosažení co největší úspěšnosti jsou také analyzovány některé aspekty syntaxe českého jazyka. Na základě teoretického popisu procedury je dále implementován normalizační program a jeho úspěšnost je vyhodnocena srovnáním s ručně normalizovanými entitami. Ve spojení s již existujícími nástroji pro automatické rozpoznávání pojmenovaných entit v textu je možné tento normalizátor využít v jiných procesech strojového zpracování textu, například překladu do jiného jazyka, vyhledávání a kategorizaci apod. Powered by TCPDF (www.tcpdf.org)
Vyhledávání v semanticky obohacených textech
Dostál, Jiří ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá dotazováním nad rozsáhlými textovými daty, obohacenými o sémantické informace, zejména o vyznačení pojmenovaných entit zmíněných v textu. Text nejprve rozebírá způsoby indexace částečně stukturovaných textových dat a přístupy k jejich dotazování. Jádrem práce je potom návrh a implementace dotazovacího systému, který analyzuje dotazy uživatele a požadavky na rozsah a strukturu vracených informací, převádí je do formátu vyhledávacího systému MG4J, na výsledku aplikuje zadaná omezení a formátuje jej do požadovaného tvaru. Výsledky práce jsou zhodnoceny na základě statistik časových odezev sady dotazů nad indexem anglické Wikipedie, které jsou také porovnány s údaji získanými pomocí dosavadního systému dotazování.
Lze to říci jinak aneb automatické hledání parafrází
Otrusina, Lubomír ; Schwarz, Petr (oponent) ; Smrž, Pavel (vedoucí práce)
Automatické získávání parafrází je důležitou úlohou v oblasti zpracování přirozeného jazyka. Uplatnění nalezne v systémech provádějících odpovídání na otázky, získávání informací nebo shrnutí dokumentů. Tato práce má za úkol seznámit čtenáře s problematikou získávání parafrází a následně vytvořit systém, který z volného textu parafráze získává. Práce nejprve vysvětlí hlavní pojmy v této oblasti, jako jsou parafráze nebo parafrázové vzory. Dále shrne přístupy k získávání parafrází z různých zdrojů. V další části je popsán návrh systému, který je zaměřen na získávání parafrází mezi dvěma pojmenovanými entitami. Na závěr jsou popsány metody vyhodnocování těchto systémů a je provedeno vyhodnocení našeho systému a jeho srovnání s podobnými systémy.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.