keywords:"tf-idf" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"tf-idf"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Metody klasifikace webových stránek Nachtnebl, Viktor ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce) Tato práce se zabývá metodami klasifikace webových stránek. Vysvětluje pojem klasifikace a popisuje různé vlastnosti stránek využívané pro jejich klasifikaci. Dále rozebírá reprezentaci stránky a podrobným způsobem je popsána klasifikační metoda, která pracuje s hierarchickým modelem kategorií a je schopna dynamicky vytvářet nové kategorie. Ve své druhé polovině se věnuje implementaci zvolené metody a výsledkům, které popisuje. Úplný záznam
	Sémantická podobnost článků Veselovský, Martin ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce) Tato práce se zabývá modelováním struktury sémantických vztahů mezi články v anglickém jazyce. Představuje existující metody pro reprezentaci a výpočet podobnosti článků. Základnou metodou je vektorový model, který reprezentuje dokument jako vektor slov. Jednotlivým slovům jsou v rámci modelu určené váhy důležitosti metodou TF-IDF. Dále jsou zde popsány pokročilé metody modelování a to Latentní sémantická analýza (LSA) a Latentní Dirichletova alokace (LDA). Práce se také zabývá články, které jsou sémanticky anotované, přičemž váhy anotačních slov jsou vypočítány na základe metody SGD. Vyhodnocení výsledků probíhá na připraveném testovacím korpusu dokumentů, ke kterému existuje referenční hodnocení podobnosti. Úplný záznam
	Odvození slovníku pro nástroj Process Inspector na platformě SharePoint Pavlín, Václav ; Masařík, Karel (oponent) ; Kreslíková, Jitka (vedoucí práce) Tato diplomová představuje metody pro dolování důležitých informací z textu. Analyzuje problém extrakce pojmů z rozsáhlé sady dokumentů a popisuje implementaci řešení s využitím jazyka C# a databázového systému Microsoft SQL Server. Systém k extrakci pojmů využívá lemmatizaci výrazů a několik statistických metod. Práce také srovnává použité metody a navrhuje postup odvození slovníku. Úplný záznam
	Improved Prediction of Social Tags Using Data Mining Harár, Pavol ; Galáž, Zoltán (oponent) ; Kříž, Jiří (vedoucí práce) This master’s thesis deals with using Text mining as a method to predict tags of articles. It describes the iterative way of handling big data files, parsing the data, cleaning the data and scoring of terms in article using TF-IDF. It describes in detail the flow of program written in programming language Python 3.4.3. The result of processing more than 1 million articles from Wikipedia database is a dictionary of English terms. By using this dictionary one is capable of determining the most important terms from article in corpus of articles. Relevancy of consequent tags proves the method used in this case. Úplný záznam
	Sledovač aktuálního dění Odstrčilík, Martin ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce) Cílem diplomové práce bylo vytvoření aplikace pro sledování aktuálního dění v okolí jejího uživatele. Tato aplikace by měla umožňovat jejím uživatelům události nejen sledovat, ale také přidávat své vlastní či komentovat již existující. Diplomová práce se mimo tvorbu dané aplikace zaobírá analýzou předloženého problému. Analýza zahrnuje průzkum existujících řešení, dostupných technologií a aplikačních rámců využitelných k implementaci. Součástí práce je i popis teorie klasifikace dat, která je v rámci vyvíjené aplikace použita k analýze událostí a komentářů. V textu práce je dále zahrnut návrh řešení, jenž se zaměřuje na návrh uživatelského rozhraní, architektury aplikace, databáze, komunikačního protokolu a klasifikátorů. Jádrem práce je pak popis implementace aplikace. V závěru práce je pak shrnut její průběh a jsou navrhována vhodná rozšíření do budoucna. Úplný záznam
	Binární klasifikace zákaznických incidentů pomocí metod NLP Pokorný, Jiří Tato bakalářská práce se zabývá vybudováním modelu umožňujícího binární klasifikaci zákaznických incidentů v rámci systému SAP. Klasifikace je provedena pro věty obsažené v incidentech, dle čehož je určena konečná kategorie incidentu. Využitý text je v anglickém jazyce. Za účelem porovnání tradičních a moderních přístupů pro textovou klasifikaci, a získání optimálního výsledku, je provedena série experimentů obnášející využití různých metod vyvážení datasetu, vektorové reprezentace a klasifikačních algoritmů. Výsledky jsou v konečné řadě zhodnoceny a je zformulováno doporučení s ohledem na další rozvoj, včetně uplatnění získaných znalostí v prostředí SAP. Úplný záznam
	Detekce kategorie obsahu webové stránky prostřednictvím metod strojového učení. DOHNAL, Patrik Tato bakalářská práce se zabývá návrhem systému pro klasifikaci obsahu webových stránek včetně následné implementace v programovacím jazyce Python. K samotné klasifikaci jsou využívány modely strojového učení jako jsou Naivní Bayesův klasifikátor, K-Nejbližších sousedů a Support Vector Machines. V rámci celého procesu se rovněž předpokládá tvorba vlastní množiny dat, na kterých jsou tyto modely trénovány a následně testovány. Součástí práce je i podrobná rešerše použitých metod. Úplný záznam
	Metody dolování dat pro analýzu textů Kozák, Ondřej ; Marcoň, Petr (oponent) ; Dohnal, Přemysl (vedoucí práce) Tato bakalářská práce se zabývá prozkoumáním aktuální metodiky a možností textového dolování a následné aplikace některých metod. V rámci práce byly popsány metody pro předzpracování, metody pro převedení textu do vektorového prostoru a metody pro analýzu textu a diskutováno jejich možné použití. Na text byly použity jednotlivé metody pro předzpracování a následně bylo demonstrováno převedení do vektorového prostoru jednoduchými metodami jako jsou BOW, Bag of n-grams, TF-IDF nebo metodami se strojovým učením které jsou FastText a GloVe. Na získané vektory byly použity metody LSA, LDA, TextRank, kosinová podobnost, pro získání informací z textu. Úplný záznam
	Searching relevant articles in extensive collections Vojt, Ján ; Novák, Jiří (vedoucí práce) ; Bartoš, Tomáš (oponent) Vyhledávání textu v článcích se standartně řeší fulltextovým vyhledáváním. Při použití pokročilejších metod je možné dosáhnout výrazně lepších výsledků. Předmětem této práce je vytvořit univerzální knihovnu na prohledávání rozsáhlých kolekcí, která je přizpůsobena pro český jazyk. Využívá nástroje schopné pracovat s morfologií a zohledňovat důležitost slov. Součástí je experiment se slovnými spojeními, které do vyhledávání zapojují kontext. Míra uspěšnosti experimentu je ověřena na rozsáhlé kolekci dat. Vytvořená knihovna je tak unikátním nástrojem na zpracování rozsáhlých kolekcí českého textu, přičemž je připravena na rozšíření o další jazyky a metody. Úplný záznam
	Analýza dat síťové komunikace mobilních zařízení Abraham, Lukáš ; Bartík, Vladimír (oponent) ; Burgetová, Ivana (vedoucí práce) Práce na svém začátku popisuje protokoly DNS a SSL/TLS, věnuje se hlavně komunikaci mezi zařízeními pomocí těchto protokolů. Poté si povíme něco o předzpracování dat a jejich čištění. Dále se práce zaobírá základními technikami pro dolování dat, jako jsou klasifikace dat, asociační analýza, vyhledávání dokumentů, regresní analýza a shluková analýza. V další kapitole si můžeme přečíst něco o tom, jak se dají identifikovat mobilní zařízení v síti. Zhodnotíme datové sady, které obsahují nasbíraná data z komunikace mezi protokoly DNS a SSL/TLS se kterými se bude pracovat v praktické části. Po té se konečně dostaneme k návrhu systému pro analýzu dat síťové komunikace. Popíšeme si použité knihovny a celou implementaci systému. Provedeme velké množství experimentů, které na konec ohodnotíme. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English