keywords:"text preprocessing" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"text preprocessing"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Metody stemmingu používané při dolování textu Adámek, Tomáš ; Chmelař, Petr (oponent) ; Bartík, Vladimír (vedoucí práce) Tématem této diplomové práce je problematika jednotlivých metod pro dolování z anglických textových dokumentů. Hlavní část této práce se zabývá analýzou metod pro předzpracování textu, konkrétně stemmingem. Jsou zde rozebrány jednotlivé algoritmy stemmingu (Lovinsův, Porterův a Paice/Husk), které z jednotlivých slov textového dokumentu získávají jejich základní tvar (kořen), za použití speciálních lexikografických pravidel anglického jazyka. Tyto kořeny slov jsou následně uloženy do strukturované podoby pro další zpracování. Další část práce se zabývá návrhem aplikace, která tyto algoritmy využívá pro svoji činnost. Aplikace je postavena na platformě Java s využitím grafické knihovny Swing a architektury MVC. Další kapitola popisuje implementaci navržené aplikace a stemovacích algoritmů v jazyce Java. Poslední kapitola je zaměřena na experimenty s jednotlivými algoritmy a jejich srovnání z hlediska vlivu na výsledky klasifikace textu. Úplný záznam
	Získávání znalostí z textových dat v prostředí jazyka Python Homola, Ján ; Hynek, Jiří (oponent) ; Bartík, Vladimír (vedoucí práce) Táto bakalárska práca sa zaoberá získavaním znalostí z textových dát, konkrétnejšie klasifikáciou textových recenzií užívateľov. Pomocou experimentov sa táto práca zameriava na metódy predspracovania textových dát a na porovnanie jednotlivých klasifikačných metód prostredníctvom vybraných dátových sád. Záverom práce je zhodnotenie dosiahnutých výsledkov experimentov, ktoré boli vykonané pomocou implementovanej aplikácie. Úplný záznam
	Programovací jazyk Scala a jeho využití pro analýzu dat Kohout, Tomáš ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce) Tato práce se zabývá porovnáním jazyka Scala s ostatními běžně používanými jazyky pro analýzu dat. Tyto jazyky se porovnávají z hlediska manipulace a zobrazení dat, strojvého učení a souběžného zpracování. Z tohoto porovnání následně vyplynou silné a slabé stránky jazyka Scala. Silné stránky jsou demonstrovány na implementované aplikaci pro kategorizaci e-mailů. Úplný záznam
	Zpracování uživatelských recenzí Cihlářová, Dita ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce) Velmi často lidé nakupují na internetu zboží, které si nemohou prohlédnout a vyzkoušet. Spoléhají se tedy na recenze ostatních zákazníků, ale těch už může být v dnešní době příliš mnoho na to, aby je člověk mohl sám rychle a pohodlně zpracovat. Cílem této práce je nabídnout aplikaci, která dokáže v českých recenzích rozpoznat, jaké vlastnosti produktu jsou nejvíce komentované a zda je vyznění komentářů pozitivní či negativní. Výsledky pak mohou ušetřit velké množství času zákazníkům e-shopů a poskytnout zajímavou zpětnou vazbu výrobcům prodávaných produktů. Úplný záznam
	Odhad emocí z textu Dufková, Aneta ; Fajčík, Martin (oponent) ; Szőke, Igor (vedoucí práce) Tato práce popisuje proces odhadování emocí z textu, při němž je využíváno strojové učení. Proces začíná průzkumem používaných metod, pokračuje výběrem vhodné metody a experimentováním. Využívá několik datových sad, kombinuje je a zkouší různé techniky předzpracování textu. Závěrem je webové rozhraní, které využívá předtrénovaný model a umožňuje detekovat emoce z příspěvků z Twitteru. Úplný záznam
	Assessment and implementation of text data preprocessing in neural network models Ratnasari, Febiyanti V oblasti zpracování textových dat měla tradičně významnou úlohu předzpracování textu. S nástupem neuronových sítí a nových reprezentací textových dat však bylo předzpracování textu relativně podceňováno. Tato výzkumná práce se snaží vyřešit tuto problematiku prostřednictvím zkoumání potenciálních výhod použití kompozitu více technik předzpracování textových dat společně s textovým zpracovacím modelem založeným na neuronových sítích. Úplný záznam
	Text Analysis in Specialized Translation: Accuracy and Error Rate Parobková, Alžbeta ; Marcoň, Petr (oponent) ; Dohnal, Přemysl (vedoucí práce) The focus of the thesis is on researching and applying text analysis and machine translation methods to quality evaluation of machine translated technical texts. The experimental part uses these methods to implement error identification and classification algorithm. The error and grammar correction neural model was also applied. The comparison of error rate and accuracy of different language tools is presented via error typology and standardized translation evaluation metrics. Úplný záznam
	Získávání znalostí z textových dat v prostředí jazyka Python Homola, Ján ; Hynek, Jiří (oponent) ; Bartík, Vladimír (vedoucí práce) Táto bakalárska práca sa zaoberá získavaním znalostí z textových dát, konkrétnejšie klasifikáciou textových recenzií užívateľov. Pomocou experimentov sa táto práca zameriava na metódy predspracovania textových dát a na porovnanie jednotlivých klasifikačných metód prostredníctvom vybraných dátových sád. Záverom práce je zhodnotenie dosiahnutých výsledkov experimentov, ktoré boli vykonané pomocou implementovanej aplikácie. Úplný záznam
	Rychlý a trénovatelný tokenizér pro přirozené jazyky Maršík, Jiří ; Bojar, Ondřej (vedoucí práce) ; Spousta, Miroslav (oponent) V této práci představujeme systém pro dezambiguaci hranic mezi tokeny a větami. Charakteristickým znakem programu je jeho značná konfigurovatelnost a všestrannost, tokenizér si dokáže poradit např. i s nepřerušovaným čínským textem. Tokenizér používá klasifikátory založené na modelech s maximální entropií, a jedná se tudíž o systém strojového učení, kterému je nutné předložit již tokenizovaná ukázková data k trénování. Program je doplněn nástrojem pro hlášení úspěšnosti tokenizace, což pomáhá zejména při rychlém vývoji a ladění tokenizačního procesu. Systém byl vyvinut pouze za pomoci multiplatformních knihoven a při vývoji byl kladen důraz zejména na efektivitu a správnost. Po nezbytném přehledu jiných tokenizérů a krátkém úvodu do teorie modelů s maximální entropií se většina textu práce zabývá vlastní implementací tokenizéru a vyhodnocením jeho úspěšnosti. Úplný záznam
	Odhad emocí z textu Dufková, Aneta ; Fajčík, Martin (oponent) ; Szőke, Igor (vedoucí práce) Tato práce popisuje proces odhadování emocí z textu, při němž je využíváno strojové učení. Proces začíná průzkumem používaných metod, pokračuje výběrem vhodné metody a experimentováním. Využívá několik datových sad, kombinuje je a zkouší různé techniky předzpracování textu. Závěrem je webové rozhraní, které využívá předtrénovaný model a umožňuje detekovat emoce z příspěvků z Twitteru. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English