Národní úložiště šedé literatury Nalezeno 77 záznamů.  začátekpředchozí58 - 67další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Automatická tvorba rejstříku publikace
Strachota, Tomáš ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce si klade za cíl prozkoumat možnosti běžných metod automatického zpracování jazyka a vytvořit prototyp systému, který bude schopen automaticky generovat rejstříky. Systém bude vyzkoušen na testovacích datech a na základě výsledků bude stanoven hlavní směr dalšího vývoje.
Reprezentace textu a její vliv na kategorizaci
Šabatka, Ondřej ; Chmelař, Petr (oponent) ; Bartík, Vladimír (vedoucí práce)
Diplomová práce se zabývá strojovým zpracováním textových dat. V teoretické části jsou popsány problémy související se zpracováním přirozeného jazyka a dále jsou představeny různé způsoby předzpracování a reprezentace textu. Práce se také blíže věnuje použití N-gramů jako rysů pro reprezentaci dokumentů a popisuje některé algoritmy sloužící pro jejich extrakci. Další část je pak věnována přehledu používaných klasifikačních metod. V rámci praktické části práce byla navržena a implementována aplikace sloužící pro předzpracování a vytváření různých reprezentací textových dat. V rámci experimentů je pak sledován vliv těchto reprezentací na úspěšnost klasifikačních algoritmů.
Klasifikace textu pomocí metody SVM
Synek, Radovan ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Tato práce pojednává o dolování v textových datech. Zaměřuje se na problematiku klasifikace dokumentů a techniky s tím spojené, především předzpracování dat. Dále je představena metoda SVM, která byla zvolena pro samotnou klasifikaci, návrh a testování implementované aplikace.
Shlukování textových dat
Leixner, Petr ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Proces shlukování textových dat slouží pro analýzu, navigaci a strukturování velkých kolekcí textů nebo hypertextových dokumentů. Úkolem shlukování je rozklad množiny dokumentů do shluků na základě jejich podobnosti. Nejznámější metody z této oblasti dolování však neřeší specifické problémy textového shlukování, jako vysokou dimenzionalitu vstupních dat, velmi velkou velikost databází a srozumitelnost popisu shluků. Tato práce se zabývá uvedenou problematikou a popisuje moderní metodu shlukování textových dat založenou na použití frekventovaných množin termů, která se svým přístupem snaží řešit nedostatky jiných shlukovacích metod.
Mining of Textual Data from the Web for Speech Recognition
Kubalík, Jakub ; Plchot, Oldřich (oponent) ; Mikolov, Tomáš (vedoucí práce)
The preliminary goals of this project were to get familiar with language modeling for speech recognition and techniques for acquisition of text data from the Web. Speech recognition techniques are introduced and statistical language modeling is described in detail. The text also covers mining models and techniques, information retrieval especially. Specific problems of Web mining are discussed and Google search is introduced. Special attention was paid to detailed description of implementation of the text mining system. However, the main goal of this work was to determine, whether the data acquired from the Web can provide some improvement into the recognition systems. The text is describing experiments, which use the retrieved Web data to update sample language models.
Metody shlukování textových dat
Miloš, Roman ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Shlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means.
Odvození slovníku pro nástroj Process Inspector na platformě SharePoint
Pavlín, Václav ; Masařík, Karel (oponent) ; Kreslíková, Jitka (vedoucí práce)
Tato diplomová představuje metody pro dolování důležitých informací z textu. Analyzuje problém extrakce pojmů z rozsáhlé sady dokumentů a popisuje implementaci řešení s využitím jazyka C# a databázového systému Microsoft SQL Server. Systém k extrakci pojmů využívá lemmatizaci výrazů a několik statistických metod. Práce také srovnává použité metody a navrhuje postup odvození slovníku.
Extrakce klíčových slov z dokumentů
Matička, Jiří ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Práce se zabývá automatickou extrakcí klíčových slov z dokumentů. Jejím cílem je návrh a implementace aplikace, která bude schopná z dokumentu vyextrahovat množinu klíčových slov vyjadřující co nejpřesněji hlavní obsah dokumentu. Mezi požadavky na aplikaci patří zejména rychlost a přesnost. Proto byly nejprve prostudovány již existující principy a provedena klasifikace metod na základě různých kritérií. Další část práce se zaměřuje na výběr a podrobný popis funkčnosti jedné z metod, která by měla být využita při extrahování klíčových slov. Následuje podrobný návrh celé aplikace a její následná implementace. Důležitá je hlavně poslední kapitola zabývající se testováním aplikace na množině textových dokumentů a vyhodnocením úspěšnosti procesu extrakce.
Využití metod dolování dat pro analýzu sociálních sítí
Novosad, Andrej ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Práce se zabývá problematikou dolování dat v prostředí sociálních sítí. Podává přehled o dolování z dat a možných metodách dolování. Práce také zkoumá sociální média a sítě, co mohou poskytnout a jaké problémy se sebou přinášejí. Jsou prozkoumané API třech sociálních sítí a jejich možnosti z hlediska získání dat vhodných pro dolování. Zkoumají se techniky dolování znalostí z textových dat. Je popsán způsob implementace webové aplikace, která doluje data ze sociální sítě Twitter pomoci algoritmu SVM. Implementovaná aplikace klasifikuje zprávy na základě jejich textu do tříd reprezentujících kontinenty původu. Je provedeno několik experimentů v softwaru RapidMiner a v implementované webové aplikaci a jejich výsledky jsou prozkoumány.
Extrakce sémantických vztahů z textu
Schmidt, Marek ; Burget, Radek (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá extrakcí sémantických vztahů z anglických textů. Zaměřuje se především na použití syntaktické analýzy pro extrakci příznaků, které využívá jak pro různé statistické metody, tak i pro metodu založenou na syntaktických vzorech. Je vyhodnocena metoda extrakce vztahu hypernymie srovnáním s anglickým thesaurem WordNet. Na základě zkoumaných metod je pak navržen systém pro extrakci sémantických vztahů z textu spolu s uživatelským rozhraním, které je rovněž implementováno.

Národní úložiště šedé literatury : Nalezeno 77 záznamů.   začátekpředchozí58 - 67další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.