Národní úložiště šedé literatury Nalezeno 60 záznamů.  začátekpředchozí27 - 36dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Content classification in legal documents
Bečvarová, Lucia ; Žabokrtský, Zdeněk (vedoucí práce) ; Holub, Martin (oponent)
Tato práce představuje aplikovaný výzkum pro potřeby firmy Datlowe, s.r.o. zaměřený na automatické zpracování právních dokumentů. Cílem práce je navrhnout, implementovat a vyhodnotit klasifikační modul, který je schopen přiřadit kategorie odstavcům dokumentů. Použitých bylo několik klasifikačních algoritmů, které byly vyhodnoceny a srovnány mezi sebou a následně kombinované dohromady s cílem vytvořit lepší modely. Výsledkem je predikční modul, který byl úspěšně integrován do celého systému zpracování dokumentů. Vedle predikčního modulu jsou dalšími přínosy práce měření mezianotátorské shody a návrh nové sady příznaků využitelných pro klasifikaci.
SVM classifiers and heuristics for feature selection
Krupka, Tomáš ; Holub, Martin (vedoucí práce) ; Kopa, Miloš (oponent)
V aplikacích strojového učení s velkým množstvím počítačem vytvářených příznaků je často zapotřebí užít pouze jejich malou podmnožinu. Algoritmus "Recursive Feature Elimination" (SVM-RFE) publikovaný v práci Guyon et al. (2002), který vybírá příznaky na základě jejich váhy v SVM modelu, prokázal na úloze výběru genů pro klasifikaci leukemie do té doby nepřekonanou výkonnost (Tan et al. (2010)). Tato práce rozvíjí tuto metodu a předkládá novou modifikaci algoritmu SVM-RFE nazvanou Evaluation-Based RFE (EB-RFE). Ve srovnání s původním algoritmem SVM-RFE tato heuristika významně zvedá výkonnost výsledného SVM klasifikátoru na studované úloze strojového učení. Experimenty navíc ukazují, že tato nová heuristika má další dvě žádoucí vlastnosti. Za prvé, EB-RFE generuje výrazně menší podmnožíny příznaků, čímž umožňuje trénovat kompaktnější modely. Za druhé, heuristika EB-RFE je narozdíl od originálního algoritmu SVM-RFE jednoduše škálovatelná v závislosti na výpočetním čase, a to výrazně nad možnosti současných nejvýkonnějších běžných počítačů. Powered by TCPDF (www.tcpdf.org)
Semantic information from FrameNet and the possibility of its transfer to Czech data
Limburská, Adéla ; Lopatková, Markéta (vedoucí práce) ; Holub, Martin (oponent)
Tématem práce je převod anotace z databáze FrameNet do češtiny a možnost využití takto vzniklých dat pro automatické předpovídání rámců. První část tohoto úkolu, převod anotace z angličtiny do češtiny, byla provedena dvěma způ- soby. Nejprve byl k tomuto účelu použit paralelní korpus anglických vět a jejich českých překladů (PCEDT), následně byl podobný, ale mnohonásobně větší ko- rpus vytvořen strojovým překladem příkladových vět z databáze FrameNet do češtiny. Výsledná data byla částečně ručně evaluována a došlo rovněž k automat- ickému vyřazení snadno rozpoznatelných chyb. Získaná data byla poté použita v experimentech zaměřených na automatické přiřazování rámců pomocí metod strojového učení (rozhodovacích stromů a support vector machines). Vzhledem k tomu, že obě metody dosáhly v předpovídání rámců poměrně nízké úspěšnosti, byla provedena další ruční korekce vstupních dat, čímž se podařilo kvalitu přiřa- zování rámců zvýšit. Srovnání s podobnými experimenty popsanými v odborné literatuře však ukázalo, že výsledky automatického předpovídání významů mohou dosahovat ještě vyšší úspěšnosti. Práce se proto zmiňuje také o odlišných přís- tupech k výběru rysů a možnostech dalšího zlepšování výsledků automatického přiřazování rámců za použití strojového učení. 1
Internet a mezinárodní právo soukromé
Holub, Martin ; Pauknerová, Monika (vedoucí práce) ; Pfeiffer, Magdalena (oponent)
Předmětem diplomové práce je problematika stanovování příslušnosti soudů v mimosmluvních závazcích vznikajících v prostředí internetu. Autor konstatuje, že i na právní vztahy vznikající na internetuje vhodné používatobecné normymezinárodníhoprávasoukromého.Mechanickáaplikace stávajících pravidel by však vedla k nežádoucím důsledkům. Z tohoto důvodu je nutné stávající pravidla vykládat způsobem, který přihlíží k jedinečným vlastnostem internetu. Vzhledem ke skutečnosti, že obecná pravidla jsou vykládána především soudy, značný prostor je věnován detailnímu rozboru judikatury evropských a amerických soudů týkající se určování zvláštní příslušnosti vmimosmluvníchvztazích.Závěrypráce všakovlivněnytaké poznatkyodborné literatury a doporučeními odborných skupin zabývajících se mezinárodním právem soukromým. V první a druhé kapitole jsou popsány specifické vlastnosti internetu, jakož i obecná právní úprava určování příslušnosti soudů. V kapitole 3 je okrajově zmíněna úprava určování příslušnosti ve smluvních závazkových vztazích, zejména s přihlédnutím ke kritériu zaměření. V kapitolách 4 a 5 je popsánajudikaturaevropskýchaamerickýchsoudůtýkajícíse zvláštní příslušnosti, a to včetně jejího vývoje. Na základě tohoto rozboru jsou poté v kapitole 6 zhodnoceny aktuálně používané metodologické postupy.V...
Query expansion for medical information retrieval
Bibyna, Feraena ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent)
Jedním z problémů ve vyhledávání medicínských informací je terminologická "propast" mezi jazykem dokumentů (které jsou obvykle psané odborníky používajícími odbornou terminologii) a jazykem vyhledávacích dotazů (které jsou častěji tvořeny neodborníky používajícími především laické výrazy). V této diplomové práci zkoumáme možnosti řešení tohoto problému pomocí rozšiřování dotazů s využitím doménově specifických datových zdrojů. K tomuto používáme Unified Medical Language System (UMLS) obsahující sdružené biomedicínské názvosloví z několika zdrojů. Konkrétně používáme jeho metatezaurus a sémantickou síť. V experimentech používáme sadu dotazů z evaluační kampaně CLEF eHealth z let 2014 a 2015, které reprezentují dvě různé vyhledávací úlohy. Použité metody zahrnují rozšiřování dotazů pomocí synonymních i nesynonymních vztahů, metodu blind relevance feedback, vážení termů a také kombinování různých systémů pomocí lineární interpolace. Powered by TCPDF (www.tcpdf.org)
Automatické doporučování ilustračních snímků
Odcházel, Ondřej ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent)
Cílem této práce je implementace webové aplikace určené k doporučování ilustračních obrázků. Aplikace dostane na vstupu novinový článek v češtině nebo angličtině a na základě textu sama doporučí vhodné ilustrační obrázky. Implementovaná aplikace také vyhledává obrázky dle vizuální podobnosti. Práce se věnuje teoretickým aspektům extrakce klíčových slov, nebo detekce jazyka textu. Dále jsou rozebrány některé možnosti efektivního hledání podobných vektorů, které jsou využity v komponentě pro vyhledávání vizuálně podobných obrázků. Práce dále popisuje moderní možnosti vývoje webového frontendu i backendu. Algoritmus doporučování obrázků je v rámci práce otestován na uživatelích. Powered by TCPDF (www.tcpdf.org)
Automatické vytváření sémantických sítí
Kirschner, Martin ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent)
Předložená práce si dává za cíl prozkoumat možnosti automatické konstrukce a rozšiřování sémantických sítí za použití metod strojového učení. Důraz je kladen na postup získávání rysů pro sadu dat. Práce prezentuje metodu získávání sémantických relací, založenou na distribuční hypotéze a trénovanou na datech z Czech WordNetu. Dále jsou prezentovány zatím první výsledky pro český jazyk v této oblasti. Součástí práce je sada programů pro zpracování a vyhodnocení dat a přehled a diskuze jejich výsledků na konkrétních datech. Výsledným nástrojem je možné zpracovávat data řádově v rozsahu stovek miliónů slov. Práce byla vypracována na českých morfologicky a syntakticky anotovaných datech, nicméně použité postupy nejsou na jazyce závislé.
Combining text-based and vision-based semantics
Tran, Binh Giang ; Holub, Martin (vedoucí práce) ; Straková, Jana (oponent)
Získání a reprezentace (lexikální) sémantické informace patří mezi nejdůležitější úlohy, které přispívají ke kvalitě automatického zpracování přirozeného jazyka (viz např. nedávná studie (Turney a Pantel, 2010)). V této práci je navržen nový, inovativní (ve skutečnosti první svého druhu) experimentální systém pro vytváření multimodálních distribučních sémantických modelů na základě kombinace nejlepších existujících modelů pracujících na základě zpracování textů nebo obrazu. Multimodální sémantický model testujeme pomocí úloh odhadu sémantické podobnosti, sémantického shlukování konceptů, a pomocí nedávno vyvinutého testu BLESS. Navrhujeme také efektivní algoritmus pro nalezení vhodných parametrů pro integraci multimodálních atributů za účelem získání robustnosti modelu. Naše experimenty ukazují, že navržená technika slibuje vysokou účinnost. Napříč různými experimenty se náš nejlepší multimodální model ukázal být na prvním místě. Při srovnání s jinými modely, které pracují pouze na základě analýzy textu, je náš navržený model mezi vůbec nejlepšími. V práci jsme zkoumali různé druhy vizuálních deskriptorů včetně metody SIFT, aby bylo možno posoudit, jak by se mohly metody počítačového vidění uplatnit v oblasti zpracování přirozeného jazyka. V práci ukazujeme důležité zjištění, že přidávání...
Automatické vytváření sémantických sítí
Kirschner, Martin ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent)
Předložená práce si dává za cíl prozkoumat možnosti automatické konstrukce a rozšiřování sémantických sítí za použití metod strojového učení. Důraz je kladen na postup získávání rysů pro sadu dat. Práce prezentuje robustní metodu získávání sémantických relací, založenou na distribuční hypotéze a trénovanou na datech z Czech WordNetu. Dále jsou prezentovány zatím první výsledky pro český jazyk v této oblasti. Součástí práce je sada programů pro zpracování a vyhodnocení dat a přehled a diskuze jejich výsledků na konkrétních datech. Výsledným nástrojem je možné zpracovávat data v rozsahu v řádech stovek miliónů slov. Práce byla vypracována na českých morfologicky a syntakticky anotovaných datech, nicméně použité postupy nejsou na jazyce závislé.
Classifier for semantic patterns of English verbs
Kríž, Vincent ; Holub, Martin (vedoucí práce) ; Bojar, Ondřej (oponent)
Cieľom tejto diplomovej práce je navrhnúť, implementovať a empiricky evaluovať klasifikátory pre rozpoznávanie sémantických patternov anglických slovies. Ako trénovacie a testovacie údaje používame konkordancie z pilotnej kolekcie 30 anglických slovies, ktorá bola spracovaná metódou Corpus Pattern Analysis. Modely klasifikátorov tvoríme pomocou algoritmov strojového učenia s učiteľom. Experimentujeme s rozhodovacími stromami, algoritmom k najbližších susedov (kNN), podpornými vektormi (SVM) a Adaboostom. V práci sa, okrem iného, zameriavame na návrh vhodnej množiny rysov pre strojové učenie (feature selection). Experimentujeme s množinami morfo-syntaktických i sémantických rysov. Naše výsledky ukazujú, že morfo-syntaktické rysy sú najdôležitejšie pre sémantickú desambiguáciu, hoci pre niektoré slovesá hrajú sémantické rysy dôležitú úlohu.

Národní úložiště šedé literatury : Nalezeno 60 záznamů.   začátekpředchozí27 - 36dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.