Národní úložiště šedé literatury Nalezeno 60 záznamů.  začátekpředchozí29 - 38dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rozpoznání pojmenovaných entit v textu
Süss, Martin
Tato práce se zabývá rozpoznáváním pojmenovaných entit v textu, které je realizované technikami strojového učení. V nedávné době byly představeny techniky vytváření modelů vektorových reprezentací slov, které dokáží do vektorů zakódovat mnoho užitečných vztahů mezi slovy v textových datech, jako např. jejich syntaktickou či sémantickou podobnost. Moderní systémy pro rozpoznávání pojmenovaných entit tyto vlastnosti vektorů využívají, čímž výrazněji zlepšují svoji kvalitu. Málo z nich však detailněji zkoumá, jak velký vliv tyto vektory na rozpoznávání mají a jestli je lze optimalizovat pro ještě větší nárůst kvality rozpoznávání. Tato práce zkoumá různé faktory, které mohou ovlivnit kvalitu modelů vektorových reprezentací slov, a tím i výslednou kvalitu rozpoznávání pojmenovaných entit. V práci je vykonána série experimentů, které tyto faktory, jako je kvalita a velikost korpusu, počet dimenzí vektorů, techniky předzpracování textu či různé algoritmy (Word2Vec, GloVe a FastText) a specifické nastavení jejich parametrů, zkoumají. Jejich výsledky přinášejí řadu poznatků, které lze využít při vytváření vektorových reprezentací slov, a tím i nepřímo navýšit výslednou kvalitu rozpoznávání pojmenovaných entit.
Systém pro integraci webových datových zdrojů
Kolečkář, David ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Cílem této diplomové práce je navrhnout a implementovat webovou aplikaci, která bude sloužit pro integraci webových datových zdrojů. K řešení integrace dat byla použita metoda, která využívá doménový model cílového informačního systému. Práce popisuje jednotlivé metody používané na extrakci informací z webových stránek. V textu práce je popsán proces návrhu architektury systému včetně popisu zvolených technologií a nástrojů. Hlavní částí práce je implementace a testování výsledné webové aplikace, která je napsána v jazyce Java a frameworku Angular. Výsledkem této práce je webová aplikace, která uživatelům umožní definici webových datových zdrojů a ukládání dat do cílové databáze.
Extrakce sémantických vztahů z textu
Pospíšil, Milan ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
Dnes existuje spousta polostrukturovaných dokumentů, které by bylo vhodné převést do strukturované podoby. Cílem práce je navrhnout systém, který umožňí tuto práci co nejvíce zautomatizovat. To může být obtížný problém, protože většina těchto dokumentů není generovaná automaticky počítačem a systém proto musí tolerovat nepřesnosti. Protože je třeba i určité sémantické pochopení problému, bude systém testován na doméně sady dokumentů zápisů ze schůzek.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce) ; Harašta, Jakub (oponent) ; Pecina, Pavel (oponent)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Určování typů a atributů entit napříč jazyky
Švub, Daniel ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je analýza článků na internetové encyklopedii Wikipedii a převod jejich textu psaného v přirozeném jazyce na strukturovanou databázi osob, míst a dalších entit. Podstatou implementovaného programu je určení typu entity na základě typických znaků, které ji charakterizují, a extrakce nejdůležitějších atributů této entity v českém a slovenském jazyce. Výsledkem práce je báze znalostí umožňující snadné vyhledávání a třídění informací. Díky snadné rozšiřitelnosti je možné do programu přidat identifikaci dalších typů entit a dalších vlastností, případně i podporu jiných jazyků.
Extrakce informací z lékařských textů
Zvára, Karel ; Svátek, Vojtěch (vedoucí práce) ; Veselý, Arnošt (oponent) ; Skalská, Hana (oponent)
Cílem mé práce bylo zjistit specifické vlastnosti českých lékařských zpráv z hlediska možnosti extrahovat z nich konkrétní informace. Pro svoji práci jsem měl k dispozici celkem 268 anonymizovaných narativních lékařských zpráv ze dvou ambulantních pracovišť. Studoval jsem standardy pro uchování elektronické zdravotnické dokumentace i pro přenos klinických informací mezi informačními systémy ve zdravotnictví. Věnoval jsem se také implementování elektronického zdravotního záznamu v zubním lékařství. Nejprve jsem se narativní lékařské zprávy snažil zpracovat pomocí nástrojů pro zpracování přirozeného jazyka (Natural Language Processing, NLP). Dospěl jsem k závěru, že narativní lékařské zprávy v českém jazyce jsou typickému českému textu velmi vzdálené zejména pro svoji heslovitost a absenci české větné stavby. Obsahují také velké množství překlepů, zkratek a zkrácených slov. Vzhledem k nedostupnosti hlavních mezinárodních klasifikačních systémů v českém jazyce jsem se rozhodl pokračovat ve výzkumu vývojem metody pro přípravu vstupního textu pro překlad a jeho sémantickou anotaci. Hlavním cílem této části výzkumu bylo navrhnout metodu a podpůrný software pro interaktivní korekci a sémantickou anotaci narativních lékařských zpráv, které by umožnily jejich snadnější použití, s menším množstvím chyb i...
Webové uživatelské rozhraní nástroje pro extrakci informací
Pokorný, Jan ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
V této práci se můžete dočíst o návrhu a implementaci JavaScriptové aplikace, která slouží jako uživatelské rozhraní pro nástroj k extrakci dat. Aplikace nabízí prostředí, ve kterém si uživatel spravuje extrakční úlohy. Úlohy jsou vytvářeny pomocí interaktivních grafů. Této funkcionality je docíleno pomocí současných moderních trendů z oblasti JavaScriptových aplikací, které jsou v práci popsány. Zejména se jedná o knihovnu React a správce stavu Redux.
Segmentace webových stránek s využitím shlukování
Lengál, Tomáš ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Tato zpráva se zabývá segmentací webových stránek, jež je důležitou součástí oboru extrakce informací. V první části popisujeme několik obecných způsobů jak se dá implementovat. Následně je pak představena metoda Box Clustering Segmentation, ktrerá přichází s mírně odlišným přístupem k segmentaci. V druhé polovině práce je pak popsána implementace této metody v rámci nástroje FITLayout a závěrečné testování.
Automatické zpracování českých soudních rozhodnutí
Maslowski, Bohdan ; Vidová Hladká, Barbora (vedoucí práce) ; Nečaský, Martin (oponent)
Název práce: Automatické zpracování českých soudních rozhodnutí Autor: Bohdan Maslowski Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí diplomové práce: Mgr. Barbora Vidová Hladká, Ph.D. Abstrakt: Cílem této práce je porovnání různých metod zpracování textů rozhodnutí českých soudů. Konkrétně byly řešeny úlohy extrakce informací o účastnících soudních řízení (jmen, procesních rolí, adres, apod.) a klasifikace soudních rozhodnutí podle dvou kritérií, právní kategorie a výsledku řízení. Jsou vyhodnoceny a porovnány metody založené na strojovém učení s metodami využívajícími pravidla. Pro účely trénování a vyhodnocení klasifikátorů byl připraven anotovaný korpus soudních rozhodnutí v rozsahu 400 dokumentů. Součástí práce je webová aplikace demonstrující výsledky různých přístupů a nástroj na spouštění vyhodnocení testovacích scénářů. Klíčová slova: počítačové zpracování přirozeného jazyka, extrakce informací, legislativní doména, strojové učení, pravidlové systémy

Národní úložiště šedé literatury : Nalezeno 60 záznamů.   začátekpředchozí29 - 38dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.