Národní úložiště šedé literatury Nalezeno 77 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Identifikace pohlaví z textu
Mačát, Jakub ; Burda, Karel (oponent) ; Červenec, Radek (vedoucí práce)
Práce je zaměřena na identifikaci pohlaví z textu výhradně z emailové formy a s tím spojené současné metody získávání dat a textu. Jejich výhody, nevýhody a možnosti použití. Dále byl realizován program na rozpoznávání pohlaví v programovacím jazyku Java. V programu Rapid Miner je ukázáno zpracování pomocí různých algoritmů strojového učení. U obou programů jsou popsány jejich základní vlastnosti, užité metody a použité operátory při realizaci. Programy byly testovány na reálných datech. Dále jsou zde uvedeny metody na rozšíření programů. Nakonec jsou zobrazeny příklady jak programy zpracovávají zadané úlohy.
Automatické zjišťování významu textu
Jeleček, Jiří ; Dvořák, Pavel (oponent) ; Povoda, Lukáš (vedoucí práce)
V rámci této práce byl navržen a implementován systém využívající technik dolování znalostí z textu za účelem rozpoznávání emocí v česky, anglicky a německy psaných textech a bylo provedeno zhodnocení jeho úspěšnosti. Protože je systém postaven převážně na metodě strojového učení, byla navrhnuta a vytvořena trénovací množina, která byla posléze použita k vytvoření modelu klasifikátoru pomocí vybraných algoritmů.
Extrakce metadat z vědeckých článků
Lokaj, Tomáš ; Dytrych, Jaroslav (oponent) ; Otrusina, Lubomír (vedoucí práce)
Tato práce se zabývá extrakcí metadat z vědeckých článků. Je zde obecně popsán problém extrakce informací se zaměřením na zpracování textových dokumentů. Dále je představen autorem vytvořený program clanky2meta.py určený k vyhledávání potřebných informací ve vědeckých publikacích. V závěru práce je provedeno srovnání toho programu s jinými systémy, především se systémem CiteSeerX.
Mining of Textual Data from the Web for Speech Recognition
Kubalík, Jakub ; Plchot, Oldřich (oponent) ; Mikolov, Tomáš (vedoucí práce)
The preliminary goals of this project were to get familiar with language modeling for speech recognition and techniques for acquisition of text data from the Web. Speech recognition techniques are introduced and statistical language modeling is described in detail. The text also covers mining models and techniques, information retrieval especially. Specific problems of Web mining are discussed and Google search is introduced. Special attention was paid to detailed description of implementation of the text mining system. However, the main goal of this work was to determine, whether the data acquired from the Web can provide some improvement into the recognition systems. The text is describing experiments, which use the retrieved Web data to update sample language models.
Automatická tvorba rejstříku publikace
Strachota, Tomáš ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce si klade za cíl prozkoumat možnosti běžných metod automatického zpracování jazyka a vytvořit prototyp systému, který bude schopen automaticky generovat rejstříky. Systém bude vyzkoušen na testovacích datech a na základě výsledků bude stanoven hlavní směr dalšího vývoje.
Určování typů a atributů entit napříč jazyky
Švub, Daniel ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je analýza článků na internetové encyklopedii Wikipedii a převod jejich textu psaného v přirozeném jazyce na strukturovanou databázi osob, míst a dalších entit. Podstatou implementovaného programu je určení typu entity na základě typických znaků, které ji charakterizují, a extrakce nejdůležitějších atributů této entity v českém a slovenském jazyce. Výsledkem práce je báze znalostí umožňující snadné vyhledávání a třídění informací. Díky snadné rozšiřitelnosti je možné do programu přidat identifikaci dalších typů entit a dalších vlastností, případně i podporu jiných jazyků.
Metody shlukování textových dat
Miloš, Roman ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Shlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means.
Extrakce sémantických vztahů z textu
Schmidt, Marek ; Burget, Radek (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá extrakcí sémantických vztahů z anglických textů. Zaměřuje se především na použití syntaktické analýzy pro extrakci příznaků, které využívá jak pro různé statistické metody, tak i pro metodu založenou na syntaktických vzorech. Je vyhodnocena metoda extrakce vztahu hypernymie srovnáním s anglickým thesaurem WordNet. Na základě zkoumaných metod je pak navržen systém pro extrakci sémantických vztahů z textu spolu s uživatelským rozhraním, které je rovněž implementováno.
Text Mining Based on Artificial Intelligence Methods
Povoda, Lukáš ; Tučková,, Jana (oponent) ; Brezany, Peter (oponent) ; Burget, Radim (vedoucí práce)
This work deals with the problem of text mining which is becoming more popular due to exponential growth of the data in electronic form. The work explores contemporary methods and their improvement using optimization methods, as well as the problem of text data understanding in general. The work addresses the problem in three ways: using traditional methods and their optimizations, using Big Data in train phase and abstraction through the minimization of language-dependent parts, and introduction of the new method based on the deep learning which is closer to how human reads and understands text data. The main aim of the dissertation was to propose a method for machine understanding of unstructured text data. The method was experimentally verified by classification of text data on 5 different languages – Czech, English, German, Spanish and Chinese. This demonstrates possible application to different languages families. Validation on the Yelp evaluation database achieve accuracy higher by 0.5% than current methods.
Text mining se zaměřením na shlukovací a fuzzy shlukovací metody
Zubková, Kateřina ; Karpíšek, Zdeněk (oponent) ; Žák, Libor (vedoucí práce)
Tato práce se zabývá shlukovou analýzou v oblasti text miningu (dolování v textech) a její aplikací na reálná data. Cílem práce je najít vhodné kategorie (shluky) v přepsaných hovorech zaznamenaných v kontaktním centru České pojišťovny a.s., a to převedením těchto textových dokumentů do vektorového prostoru za použití základních metod text miningu a následným využitím implementovaných algoritmů shlukové analýzy. Z formálního hlediska práce obsahuje popis předzpracování a reprezentace textových dat, dále popis několika běžných shlukovacích metod, validace shluků a samotnou aplikaci.

Národní úložiště šedé literatury : Nalezeno 77 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.