Národní úložiště šedé literatury Nalezeno 9 záznamů.  Hledání trvalo 0.00 vteřin. 
Určování syntaktické smysluplnosti českých vět
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce) ; Mírovský, Jiří (oponent)
Určovanie syntaktickej zmysluplnosti viet je zaujímavou a užitočnou úlohou v aplikáciách počítačového spracovania prirodzeného jazyka, napríklad v strojovom preklade, vyhľadávacích strojoch a v systémoch zodpovedania otázok. Teoretická lingvistika skúma prirodzený jazyk ako systém rovín. V našom projekte tento pohľad rešpektujeme a berieme do úvahy pri definovaní zmysluplnosti. Zmysluplnosť skúmame na základe morfologickej a syntaktickej roviny. V práci implementujeme znalostnú (pravidlovú) procedúru, ktorá o reťazci českých slov rozhodne, či je zmysluplný, alebo nie. Pred spustením procedúry bude reťazec slov analyzovaný externými modulmi, ktoré dodajú morfologické a syntaktické informácie o reťazci. Cieľovým jazykom je čeština.
Classifier for semantic patterns of English verbs
Kríž, Vincent ; Holub, Martin (vedoucí práce) ; Bojar, Ondřej (oponent)
Cieľom tejto diplomovej práce je navrhnúť, implementovať a empiricky evaluovať klasifikátory pre rozpoznávanie sémantických patternov anglických slovies. Ako trénovacie a testovacie údaje používame konkordancie z pilotnej kolekcie 30 anglických slovies, ktorá bola spracovaná metódou Corpus Pattern Analysis. Modely klasifikátorov tvoríme pomocou algoritmov strojového učenia s učiteľom. Experimentujeme s rozhodovacími stromami, algoritmom k najbližších susedov (kNN), podpornými vektormi (SVM) a Adaboostom. V práci sa, okrem iného, zameriavame na návrh vhodnej množiny rysov pre strojové učenie (feature selection). Experimentujeme s množinami morfo-syntaktických i sémantických rysov. Naše výsledky ukazujú, že morfo-syntaktické rysy sú najdôležitejšie pre sémantickú desambiguáciu, hoci pre niektoré slovesá hrajú sémantické rysy dôležitú úlohu.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce) ; Harašta, Jakub (oponent) ; Pecina, Pavel (oponent)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Automatická extrakce konkordancí z Internetu
Macháček, Dominik ; Kríž, Vincent (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Konkordance jsou věty, které obsahují zadané cílové slovo. Jsou důležitými předměty zkoumání ve všech oblastech lingvistiky. Velký počet konkordancí má také využití při řešení problému lexikální desambiguace. Jazykové korpusy ale neposkytují dostatečný počet konkordancí například některých anglických sloves. V této práci se zabýváme návrhem a implementací konzolové aplikace pro automatickou extrakci zadaného počtu anglických konkordancí. Aplikace bere na vstupu cílové slovo, slovní druh a počet vět, a následně na Internetu vyhledá a extrahuje zadaný počet anglických vět obsahujících cílové slovo jako zadaný slovní druh. Vytvořili jsme také knihovnu v Pythonu, s jejíž pomocí se dá aplikace modifikovat pro libovolný jiný jazyk, a zveřejnili jsme ji na serveru PyPI. Součástí práce je také webová stránka umožnující vyzkoušet si aplikaci přes webové rozhraní. 1
Framework pro extrakci informací z velkého množství jazykových dat
Kuboň, David ; Križ, Vincent (vedoucí práce) ; Bednárek, David (oponent)
Tato práce popisuje program FAFEFI sloužící k extrakci n-gramů a skip-gramů z velkého množství jazykových dat. Řeší možnosti předání vstupních dat programu, návrh datových struktur pro reprezentaci n-gramů a skip-gramů v paměti, algoritmus jejich extrakce, paměťově úsporné varianty uložení extrahovaných dat a jejich finální zpracování do výstupních vektorů příznaků. Představuje i řadu rozšiřujících funkcí programu, jako jsou například řádkový filtr vstupních dat a modifikátor obsahu řádků, a široké spektrum konfigurovatelných parametrů - oddělovači v souborech počínaje a názvy výstupních souborů konče. Mimoto poskytuje variabilitu prováděných činností v podobě meziukládání trénovací sady dat a prezentuje nástroje pro paralelizaci výpočtu na clusteru. Powered by TCPDF (www.tcpdf.org)
Classifier for semantic patterns of English verbs
Kríž, Vincent ; Holub, Martin (vedoucí práce) ; Bojar, Ondřej (oponent)
Cieľom tejto diplomovej práce je navrhnúť, implementovať a empiricky evaluovať klasifikátory pre rozpoznávanie sémantických patternov anglických slovies. Ako trénovacie a testovacie údaje používame konkordancie z pilotnej kolekcie 30 anglických slovies, ktorá bola spracovaná metódou Corpus Pattern Analysis. Modely klasifikátorov tvoríme pomocou algoritmov strojového učenia s učiteľom. Experimentujeme s rozhodovacími stromami, algoritmom k najbližších susedov (kNN), podpornými vektormi (SVM) a Adaboostom. V práci sa, okrem iného, zameriavame na návrh vhodnej množiny rysov pre strojové učenie (feature selection). Experimentujeme s množinami morfo-syntaktických i sémantických rysov. Naše výsledky ukazujú, že morfo-syntaktické rysy sú najdôležitejšie pre sémantickú desambiguáciu, hoci pre niektoré slovesá hrajú sémantické rysy dôležitú úlohu.
Určování syntaktické smysluplnosti českých vět
Kríž, Vincent ; Mírovský, Jiří (oponent) ; Vidová Hladká, Barbora (vedoucí práce)
Určovanie syntaktickej zmysluplnosti viet je zaujímavou a užitočnou úlohou v aplikáciách počítačového spracovania prirodzeného jazyka, napríklad v strojovom preklade, vyhľadávacích strojoch a v systémoch zodpovedania otázok. Teoretická lingvistika skúma prirodzený jazyk ako systém rovín. V našom projekte tento pohľad rešpektujeme a berieme do úvahy pri definovaní zmysluplnosti. Zmysluplnosť skúmame na základe morfologickej a syntaktickej roviny. V práci implementujeme znalostnú (pravidlovú) procedúru, ktorá o reťazci českých slov rozhodne, či je zmysluplný, alebo nie. Pred spustením procedúry bude reťazec slov analyzovaný externými modulmi, ktoré dodajú morfologické a syntaktické informácie o reťazci. Cieľovým jazykom je čeština.

Viz též: podobná jména autorů
1 KŘÍŽ, Vladimír
1 KŘÍŽ, Vojtěch
10 KŘÍŽ, Václav
14 Kříž, Vlastimil
10 Kříž, Václav
3 Kříž, Vítězslav
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.