Národní úložiště šedé literatury Nalezeno 61 záznamů.  začátekpředchozí52 - 61  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Extrakce informací z webových stránek pomoci extrakčních ontologií
Labský, Martin ; Berka, Petr (vedoucí práce) ; Strossa, Petr (oponent) ; Vojtáš, Peter (oponent) ; Snášel, Václav (oponent)
S rozvojem Internetu a růstem množství textových dokumentů vzrostla během posledního desetiletí poptávka po nástrojích pro automatickou extrakci informací (IE - information extraction). Úkolem IE je nalézt v analyzovaných dokumentech údaje předem specifikovaného sémantického typu a tyto extrahovat pro potřeby dalších aplikací. Analyzovanými dokumenty mohou přitom být webové stránky, e-maily, dokumenty uvnitř firemních informačních systémů, ale i běžné textové zdroje jakými jsou noviny a časopisy. Aplikace, které nejčastěji využívají výsledky IE, zahrnují tradiční textové vyhledávače, které lze pomocí IE rozšířit o tzv. strukturované vyhledávání, dále systémy pro automatické zodpovídání otázek nebo např. aplikace pro podporu posuzování kvality webových stránek. Tato práce se zabývá vývojem metod a nástrojů pro IE, které jsou obzvláště vhodné pro extrakci ze semi-strukturovaných dokumentů, jakými jsou webové stránky, a pro situace kdy existuje málo trénovacích dat. Hlavním přínosem této práce je navržený přístup rozšířených extrakčních ontologií, který v sobě kombinuje využití extrakčních znalostí tří typů: (1) expertem zadané extrakční znalosti, (2) znalosti naučené z trénovacích dat a (3) znalosti indukované na základě opakující se formátovací struktury, která se často ve webových stránkách nachází. Naše hypotéza je, že současné využití všech tří typů znalostí extrakčním algoritmem může přispět k celkové přesnosti a robustnosti extrakce. Motivací pro tuto práci byl malý počet dosud popsaných metod pro IE, které by využívaly všechny zmíněné typy extrakční znalosti. Jako první je v tomto textu popsán statistický trénovaný přístup k IE založený na skrytých markovských modelech, který je dále integrován s několika trénovanými klasifikátory obrázků tak, aby bylo možno extrahovat jak textové položky, tak obrázky. Přístup je demonstrován a hodnocen na úloze extrakce popisů bicyklů nabízených různými internetovými obchody. Popsáno je i několik algoritmů pro klasifikaci obrázků s použitím různých množin rysů pro klasifikaci. Tyto trénované přístupy jsou posléze integrovány v rámci navržené metody rozšířených extrakčních ontologií, navazující na práci D.W. Embleyho, kterou rozšiřuje o současné využití všch tří výše zmíněných typů extrakční znalosti. Zamýšlenými přínosy extrakčních ontologií jsou rychlý vývoj funkčního prototypu, jeho plynulý přechod do finální IE aplikace a možnost využít různá množství tří typů extrační znalosti podle jejich dostupnosti. Protože extrakční ontologie je typicky odvozena z vhodné doménové ontologie a zůstává ve středu extrakčního procesu, minimalizuje tento přístup úsilí nutné pro zpětnou konverzi extrahovaných výsledků pro populaci zdrojové ontologie či datového schématu. Výsledky navrženého přístupu jsou prezentovány pro několik reálných domén.
Fuzzy GUHA
Ralbovský, Martin ; Rauch, Jan (vedoucí práce) ; Svátek, Vojtěch (oponent) ; Holeňa, Martin (oponent) ; Vojtáš, Peter (oponent)
Metoda GUHA je jednou z nejstarších metod explorační analýzy dat, která je považována za součást vědního oboru dobývání znalostí z databází. Na rozdíl od jiných metod tohoto oboru, metoda GUHA staví na pevných teoretických základech logiky a statistiky. Metoda vnímá nalezení zajímavé znalosti jako nalezení určité formule v dostatečně bohatém logickém kalkulu, kterému se říká observační kalkul. Hlavním tématem dizertační práce je aplikace "fuzzy paradigmatu" na metodu GUHA. Pod pojmem "fuzzy paradigma" myslíme přístupy, které používají vícehodnotové stupně náležení, nebo pravdivostní hodnoty, jmenovitě fuzzy teorii množin a fuzzy logiku. Práce se nesnaží pokrýt všechny aspekty této aplikace, soustředí se na: - asociační pravidla, která jsou nejpoužívanější typy formulí v metodě GUHA - použití fuzzy dat - logické aspekty dobývání fuzzy asociačních pravidel - porovnání GUHA teorie s výzkumem fuzzy asociačních pravidel hlavního proudu - implementaci teorie s použitím bitových řetízků Práce zevrubně rozpracovává teorii fuzzy asociačních pravidel a používá přitom teoretický aparát fuzzy teorie množin i fuzzy logiky. Fuzzy teorie množin slouží zejména k porovnání metody GUHA s existujícími pokusy o formalizaci fuzzy asociačních pravidel založených na algoritmu apriori. Fuzzy logika je použita k definici nové třídy logických kalkulů nazvaných logické kalkuly fuzzy asociačních pravidel (LCFAR). Práce se detailně zabývá problémem existence dedukčních pravidel v LCFAR. Vhodná část navržené teorie je implementována v systému Ferda za pomoci bitových řetízků, což znamená reprezentace charakteristik zkoumaných objektů jako řetezce bitů. Tento přístup lze v crisp případě efektivně implementovat. Pro zachování jeho výhod ve fuzzy případě bylo provedeno hloubkové testování datových struktur a algoritmů pro reprezentaci fuzzy bitových řetízků.
Začlenění agentových přístupů do komplexní metodiky popisu firemních procesů
Smolík, Jan ; Řepa, Václav (vedoucí práce) ; Vojtáš, Peter (oponent) ; Bukovský, Ivo (oponent)
Hlavním cílem této disertační práce je integrace pojmů agentově orientovaných přístupů do komplexní metodiky pro popis procesů MMABP, která je vyvíjena na VŠE v Praze. V první části práce popisuje a vysvětluje agentově orientované přístupy pro popis procesů (i*/TROPOS, AOR, OOEM a ontologii UFO) a demonstruje je na případové studii. Metodika MMABP je následně s těmito přístupy srovnána a vyhodnocena. Z vyhodnocení vyplývá, že metodika je nekompletní vzhledem k agentovým pojmům plán, vykonání plánu, přání, záměr, závazek a nárok a rovněž k pojmům stabilní a nestabilní stav. Jako nepřesné jsou vyhodnoceny pojmy agent, cíl a byznys proces. Druhá část práce argumentuje a definuje rozšíření metodiky MMABP, které odstraňuje tyto identifikované nedostatky. Do metamodelu je doplněno vykonání plánu, což je záměrně vykonaná akce, která směřuje k naplnění cíle. Plán je pak obecným popisem tohoto speciálního typu akce. Agent je pak entita, která má nějaké cíle a je schopna konat plány. Novou definici získává byznys proces, který je něčím co popisuje plány jakožto předpisy akcí, co má nějaké cíle a co používá agenty ke konání akcí. Byznys proces tak již není specializací akce, jako tomu je v původní metodice MMABP. Práce rovněž specifikuje metodický postup, kdy jsou koncepty postupně převáděny z jednoho diagramu do druhého.
Extrakce informací z webových stránek pro e-environment
Dědek, Jan ; Vojtáš, Peter
Článek diskutuje možnosti použití metod pro extrakci informací z webu, které by zlepšily dostupnost informací o životním prostředí na webových stránkách. Hlavním přínosem je automatická metoda pro získávání informací z webových stránek a jejich anotaci pomocí ontologií.
Experimenty s českými lingvistickými daty a ILP
Dědek, Jan ; Eckhardt, Alan ; Vojtáš, Peter
V tomto článku prezentujeme počáteční experimenty, které jsme provedli ve spojitosti s naším výzkumem Sémantického webu. Tyto experimenty by měly demonstrovat možnosti zapojení ILP při získávání sémantických informací z textů českých webových stránek. Těmto experimentům předchází komplexní lingvistická analýza, jejíž výstup je využit v induktivní proceduře ILP.
Sémantický web
Dědek, J. ; Eckhardt, Alan ; Galamboš, L. ; Vojtáš, Peter
Přehledová přednáška o možnostech sémantického webu, jeho potenciálu, problémech a možných řešeních. Práce zpracovává několik jednotlivých aspektů - jak získat strukturovaná data, jak rychle zpracovávat webové stránky a navrhuje jednoduchého agenta využívajícího možnosti sémantického webu.
Uživatelské preference při hledání ve webovských zdrojích
Eckhardt, Alan ; Vojtáš, Peter
Článek je zaměřen na modely uživatelských preferencí v sémantickém webu. Vytvoříme model pro dotazování s uživatelskými preferencemi nad RDF a pro uspořádání odpovědí podle uživatelské agregační funkce. Model má teoretický základ v modifikaci fuzzy deskripční logiky, která je vnořitelná do dvouhodnotové deskripční logiky a rozšiřuje OWL. Popisujeme některé testy, které jsme provedli nad pilotní implementací frameworku pro flexibilní dotazování Tokaf. Rozšířili jsme standardní algoritmus hledání k nejlepších odpovědí o nově navržené heuristiky. Tyto heuristiky jsme otestovali.
Multikriteriální optimalizace - východiska
Hliněná, D. ; Hliněný, P. ; Vojtáš, Peter
V tomto článku formulujeme problém multikriteriální optimalizace a různé modely na jeho řešení. To co sjednocuje modely jsou stejná data na vstupu a stejný typ výstupu, jen metody jsou odlišné. Je to východisko našeho výzkumu.
Webovské vyhledávání s proměnlivým uživatelským modelem
Gurský, P. ; Horváth, T. ; Jirásek, J. ; Krajči, S. ; Novotný, R. ; Vaneková, M. ; Vojtáš, Peter
Navrhujeme middleware systém pro vyhledávání na webu který se přizpůsobuje uživatelským preferencím a fulltextovému vyhledávání. Výsledky pokrývají indukci uživatelských preferencí a efektivnost odpovědí na dotazy. Popisujeme prototyp nového anotačního nástroje. Systém používá formální model uživatelských preferencí založený na fuzzy logice. Experimentální implementace integruje několik nezávislých softwarových nástrojů.

Národní úložiště šedé literatury : Nalezeno 61 záznamů.   začátekpředchozí52 - 61  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.