keywords:"Text mining" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"Text mining"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Hodnocení kvality IT služeb za pomoci analýzy nestrukturovaných dat Kovykov, Maxim ; Vencovský, Filip (vedoucí práce) ; Bruckner, Tomáš (oponent) Tato práce je zaměřena na dobývání informací z textu, zejména na vyhodnocování služeb pomocí sumarizace uživatelských recenzí (nestrukturovaného textu). Hlavním cílem práce je na základě doposud proběhlého výzkumu v oboru stanovit metodu vyhodnocování nestrukturovaných dat a tuto metodu aplikovat na reálná data. Tento cíl je naplněn vytvořením rešerše lituratury zabývající se daným tématem. Dalším cílem je popsat nástroje, které lze použít při řešení stanovených úloh, implementovat stanovenou metodu a aplikovat ji na reálná data. Tento cíl je naplněn v praktické části práce. Hlavním přínosem práce by měla být ukázka implementace teoretických postupů pomocí volně dostupných nástrojů. Práce je rozdělena na teoretickou a praktickou část. K práci jsou přiloženy výstupy implementace. Úplný záznam
	Statistické metody ve stylometrii Dupal, Pavel ; Kaspříková, Nikola (vedoucí práce) ; Šulc, Zdeněk (oponent) Cílem této práce je podat přehled nejpoužívanějších metod v odvětví identifikace autorského stylu (stylometrii). Úvodem je zrekapitulována historie tohoto oboru od konce 19. století do současnosti a je uvedena a vysvětlena potřebná terminologie z oblasti dolování znalostí z textu. Následuje představení několika vybraných metod z oblasti vícerozměrné statistiky (např. metoda hlavních komponent, shluková analýza) a strojového učení (Support Vector Machines, Naive Bayes) a jejich aplikace na stylometrické problémy, včetně několika metod vytvořených specificky pro použití v této oblasti (bootstrap consensus tree, kontrastní analýza). Nakonec jsou tyto metody aplikovány na praktický příklad verifikace autorství založeném na korpusu sestaveném z děl čtyř internetových spisovatelů. Úplný záznam
	Použití text miningových metod pro analýzu uživatelských recenzí filmů Palatínus, Vojtěch ; Matějka, Martin (vedoucí práce) ; Novotný, Ota (oponent) Tématem této práce je problematika spojená s potížemi, které nastávají při práci s nestrukturovanými daty. Konkrétně se zaměřuje na přeměnu nestrukturovaných dat na data strukturovaná pomocí technik text miningu a přiblížení teoretických poznatků v oblasti tzv. Big Data, strukturovaných, semistrukturovaných a nestrukturovaných dat. Cílem práce je ucelené představení problematiky nestrukturovaných dat, ukázat jejich přeměnu na data strukturovaná pomocí metod text miningu a na základě takto vydolovaných dat provést analýzu uživatelských recenzí filmů z webu Mezinárodní Internetové filmové databáze. Přínosem práce je přiblížit čtenáři problematiku nestrukturovaných dat a na praktické ukázce ukázat, jak lze využít text miningových metod při dolování relevantních informací z tohoto typu dat. Úplný záznam
	Mining texts at the discourse level Van de Moosdijk, Sara Francisca ; Pecina, Pavel (vedoucí práce) ; Novák, Michal (oponent) Lingvistický diskurz se zabývá významem delších kusů textu, od vět po celé dokumenty, mohl by se však uplatnit i v úlohách získávání informací z textu, např. vyhledávání dokumentů či jejich sumarizace. Cílem této práce je uplatnění informací o stavbě diskurzu psaného textu pro potřeby získávání znalostí. Jedná se o prvnípokus, který se snaží skloubit tyto dva velice odlišné obory, a jeho ambicí je tak připravit základ pro tento způsob získávání znalostí. Náš postup spočívá v použití metod neřízeného strojového učení k analýze diskurzních vztahů a jejich následovném modelování pomocí vzorových struktur z formální konceptuální analýzy. Naši metodu jsme aplikovali na korpus lékařských článků z databáze PubMed. Tyto lékařské texty potom obohacujeme o koncepty z metathesauru UMLS, které jsou kombinovány s daty ze sémantické sítě UMLS, která fungují jako ontologie ve vzorových strukturách. Naše výsledky ukazují, že i přes vysokou úroveň šumu je naše metoda slibná a bylo by možné ji aplikovat i na jiné domény. Powered by TCPDF (www.tcpdf.org) Úplný záznam
	How to Create Self-Driven Education: The Social Web & Social Sciences, Coursera & Khan Academy 2014 Case Study Růžička, Jakub ; Remr, Jiří (vedoucí práce) ; Soukup, Petr (oponent) Diplomová práce se zabývá možnostmi využití social web dat v sociálních vědách. Teoretická část popisuje změny ve vzdělávání v kontextu dynamiky soudobé společnosti v rámci třech základních (vzájemně souvisejících) dimenzích: technologie (příčina a/nebo nástroj změny); práce (nové modely spolupráce); ekonomie (udržitelnost free a open source obchodních modelů). Hlavní metodologická část práce je zaměřena na problematiku výběru vzorku, reprezentativity výběrového souboru, posouzení validity a reliability, etiky, a sběru dat ve formujícím se se social web výzkumu v sociálních vědách. Výzkumná část obsahuje ilustrativní analýzy sociálního webu a závěry autorova výzkumu "Coursera & Khan Academy on the Social Web" (2014). Závěry kompletní výzkumné zprávy (v přílohách práce) jsou porovnány se závěry teoretické části s cílem poskytnout "naivní" (odvozenou ze zmínek a sítí na sociálním webu) odpověď na základní otázku: "Jak vytvořit samostatně motivované vzdělávání?" Powered by TCPDF (www.tcpdf.org) Úplný záznam
	Vulnerability Reports Analysis and Management Domány, Dušan ; Toropila, Daniel (vedoucí práce) ; Galgonek, Jakub (oponent) Různé slabiny v softvérových produktech můžou často představovat značnou bezpečnostní hrozbu jestliže jsou objeveny nebezpečnými útočníky. Je proto důležité tyto slabiny identifikovat a ohlásit jejich existenci zodpovědným osobám dřív než jsou zneužity nebezpečnými subjekty. V průběhu posledního desetiletí počet bezpečnostních hlášení o objevených slabinách v různých softvérových produktech rapidně vzrostl. Stává se stále naročnejším zpracovávat všechny tyto hlášení manuálně. Tato práce rozebírá různé metody, které je možné použít pro automatizaci několika důležitých procesů při sbíraní reportů a jejich třídení. Reporty jsou analyzované různými způsoby, které zahrnují techniky text miningu, a výsledky této analýzy jsou aplikovány ve formě praktické implementace. Úplný záznam
	Analýza sentimentu s využitím dolování dat Sychra, Martin ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce) Obsahem práce je analýza sentimentu, především z informatického hlediska (okrajově z hlediska lingvistického). V lingvistické části je rozebrán pojem sentiment a jazykové metody pro jeho analýzu, např. lemmatizace, POS tagging, využití seznamu stopwords apod. Větší pozornost je následně věnována struktuře analyzátoru sentimentu, který je založen na některé z metod strojového učení (metoda podpůrných vektorů, naivní Bayesův klasifikátor a klasifikátor maximální entropie). Na základě teoretických východisek je navržen a implementován funkční analyzátor. Experimenty jsou zaměřeny především na porovnání klasifikačních metod a přínos využití jednotlivých metod předzpracování. Úspěšnost sestrojeného klasifikátoru dosahuje až 84 % v křížové validaci. Úplný záznam
	Automatické zjišťování významu textu Jeleček, Jiří ; Dvořák, Pavel (oponent) ; Povoda, Lukáš (vedoucí práce) V rámci této práce byl navržen a implementován systém využívající technik dolování znalostí z textu za účelem rozpoznávání emocí v česky, anglicky a německy psaných textech a bylo provedeno zhodnocení jeho úspěšnosti. Protože je systém postaven převážně na metodě strojového učení, byla navrhnuta a vytvořena trénovací množina, která byla posléze použita k vytvoření modelu klasifikátoru pomocí vybraných algoritmů. Úplný záznam
	Identifikace pohlaví z textu Mačát, Jakub ; Burda, Karel (oponent) ; Červenec, Radek (vedoucí práce) Práce je zaměřena na identifikaci pohlaví z textu výhradně z emailové formy a s tím spojené současné metody získávání dat a textu. Jejich výhody, nevýhody a možnosti použití. Dále byl realizován program na rozpoznávání pohlaví v programovacím jazyku Java. V programu Rapid Miner je ukázáno zpracování pomocí různých algoritmů strojového učení. U obou programů jsou popsány jejich základní vlastnosti, užité metody a použité operátory při realizaci. Programy byly testovány na reálných datech. Dále jsou zde uvedeny metody na rozšíření programů. Nakonec jsou zobrazeny příklady jak programy zpracovávají zadané úlohy. Úplný záznam
	Extrakce metadat z vědeckých článků Lokaj, Tomáš ; Dytrych, Jaroslav (oponent) ; Otrusina, Lubomír (vedoucí práce) Tato práce se zabývá extrakcí metadat z vědeckých článků. Je zde obecně popsán problém extrakce informací se zaměřením na zpracování textových dokumentů. Dále je představen autorem vytvořený program clanky2meta.py určený k vyhledávání potřebných informací ve vědeckých publikacích. V závěru práce je provedeno srovnání toho programu s jinými systémy, především se systémem CiteSeerX. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English