Národní úložiště šedé literatury Nalezeno 1,167 záznamů.  začátekpředchozí1158 - 1167  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Extrakce informací z webových stránek pomoci extrakčních ontologií
Labský, Martin ; Berka, Petr (vedoucí práce) ; Strossa, Petr (oponent) ; Vojtáš, Peter (oponent) ; Snášel, Václav (oponent)
S rozvojem Internetu a růstem množství textových dokumentů vzrostla během posledního desetiletí poptávka po nástrojích pro automatickou extrakci informací (IE - information extraction). Úkolem IE je nalézt v analyzovaných dokumentech údaje předem specifikovaného sémantického typu a tyto extrahovat pro potřeby dalších aplikací. Analyzovanými dokumenty mohou přitom být webové stránky, e-maily, dokumenty uvnitř firemních informačních systémů, ale i běžné textové zdroje jakými jsou noviny a časopisy. Aplikace, které nejčastěji využívají výsledky IE, zahrnují tradiční textové vyhledávače, které lze pomocí IE rozšířit o tzv. strukturované vyhledávání, dále systémy pro automatické zodpovídání otázek nebo např. aplikace pro podporu posuzování kvality webových stránek. Tato práce se zabývá vývojem metod a nástrojů pro IE, které jsou obzvláště vhodné pro extrakci ze semi-strukturovaných dokumentů, jakými jsou webové stránky, a pro situace kdy existuje málo trénovacích dat. Hlavním přínosem této práce je navržený přístup rozšířených extrakčních ontologií, který v sobě kombinuje využití extrakčních znalostí tří typů: (1) expertem zadané extrakční znalosti, (2) znalosti naučené z trénovacích dat a (3) znalosti indukované na základě opakující se formátovací struktury, která se často ve webových stránkách nachází. Naše hypotéza je, že současné využití všech tří typů znalostí extrakčním algoritmem může přispět k celkové přesnosti a robustnosti extrakce. Motivací pro tuto práci byl malý počet dosud popsaných metod pro IE, které by využívaly všechny zmíněné typy extrakční znalosti. Jako první je v tomto textu popsán statistický trénovaný přístup k IE založený na skrytých markovských modelech, který je dále integrován s několika trénovanými klasifikátory obrázků tak, aby bylo možno extrahovat jak textové položky, tak obrázky. Přístup je demonstrován a hodnocen na úloze extrakce popisů bicyklů nabízených různými internetovými obchody. Popsáno je i několik algoritmů pro klasifikaci obrázků s použitím různých množin rysů pro klasifikaci. Tyto trénované přístupy jsou posléze integrovány v rámci navržené metody rozšířených extrakčních ontologií, navazující na práci D.W. Embleyho, kterou rozšiřuje o současné využití všch tří výše zmíněných typů extrakční znalosti. Zamýšlenými přínosy extrakčních ontologií jsou rychlý vývoj funkčního prototypu, jeho plynulý přechod do finální IE aplikace a možnost využít různá množství tří typů extrační znalosti podle jejich dostupnosti. Protože extrakční ontologie je typicky odvozena z vhodné doménové ontologie a zůstává ve středu extrakčního procesu, minimalizuje tento přístup úsilí nutné pro zpětnou konverzi extrahovaných výsledků pro populaci zdrojové ontologie či datového schématu. Výsledky navrženého přístupu jsou prezentovány pro několik reálných domén.
Fast Dependency-Aware Feature Selection in Very-High-Dimensional Pattern Recognition Problems
Somol, Petr ; Grim, Jiří
The paper addresses the problem of making dependency-aware feature selection feasible in pattern recognition problems of very high dimensionality. The idea of individually best ranking is generalized to evaluate the contextual quality of each feature in a series of randomly generated feature subsets. Each random subset is evaluated by a criterion function of arbitrary choice (permitting functions of high complexity). Eventually, the novel dependency-aware feature rank is computed, expressing the average benefit of including a feature into feature subsets. The method is efficient and generalizes well especially in very-high-dimensional problems, where traditional context-aware feature selection methods fail due to prohibitive computational complexity or to over-fitting. The method is shown well capable of over-performing the commonly applied individual ranking which ignores important contextual information contained in data.
Introduction to Feature Selection Toolbox 3 – The C++ Library for Subset Search, Data Modeling and Classification
Somol, Petr ; Vácha, Pavel ; Mikeš, Stanislav ; Hora, Jan ; Pudil, Pavel ; Žid, Pavel
We introduce a new standalone widely applicable software library for feature selection (also known as attribute or variable selection), capable of reducing problem dimensionality to maximize the accuracy of data models, performance of automatic decision rules as well as to reduce data acquisition cost. The library can be exploited by users in research as well as in industry. Less experienced users can experiment with different provided methods and their application to real-life problems, experts can implement their own criteria or search schemes taking advantage of the toolbox framework. In this paper we first provide a concise survey of a variety of existing feature selection approaches. Then we focus on a selected group of methods of good general performance as well as on tools surpassing the limits of existing libraries. We build a feature selection framework around them and design an object-based generic software library. We describe the key design points and properties of the library.
Special Issue on Hybrid Intelligent Systems 2007
Abraham, A. ; Húsek, Dušan ; Snášel, V.
Special Issue on Hybrid Intelligent Systems 2007. Neural Network World. Vol. 17, No. 6 (2007), p.505-688 The issue contains papers prepared specially for this issue by authors of some best evaluated papers presented on HIS'07) at Kaiserslautern, Germany, during September 17-19, 2007. The Current research interests in HIS and covered in this issue focus on integration of the different computing paradigms such as fuzzy logic, euro-computation, evolutionary computation, probabilistic computing, intelligent agents, machine learning, and other intelligent computing frameworks. There is also a growing interest in the role of sensors, their integration and evaluation in such frameworks. The phenomenal growth of hybrid intelligent systems and related topics has obliged.
Využití imsetů při učení bayesovských sítí
Vomlel, Jiří ; Studený, Milan
Článek popisuje implementaci hladového algoritmu pro učení baysovských sítí. Algoritmus je založen na algebraických objektech - tzv. imsetech a na prohledávání tzv. inkluzivního okolí.
On the way to learning deterministic objects
Bůcha, Jindřich
The paper deals with learning knowledge about objects, i.e. entities of the real environment. This is an important topic, often neglected by machine learning. The whole experimental approach is implemented via the integration of several areas of AI, namely machine learning, knowledge base management, reasoning, especially Prolog-like and analogical. More specifically, the approach is based on further generalization of already learned (generalized) rules, and on analogy.
Strojové učení se schopností generalizace
Kůrková, Věra
Schopnost generalizace při učení umělých neuronových sítí na základě příkladů lze matematicky modelovat pomocí generalizace, která byla vyvinuta jako nástroj pro zajištění stability řešení inverzních úloh.

Národní úložiště šedé literatury : Nalezeno 1,167 záznamů.   začátekpředchozí1158 - 1167  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.