Národní úložiště šedé literatury Nalezeno 127 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Construction of time-space trajectories from multimodal data
Hrbáček, Matěj ; Skopal, Tomáš (vedoucí práce) ; Lokoč, Jakub (oponent)
S nárůstem veřejných kamerových nahrávek a videozáznamů v posledních letech vzniká i rostoucí potřeba pro jejich automatické zpracování s omezeným lidským zásahem. Důleži- tou součástí tohoto zpracování jsou detekce pohybujících se objektů ve videu a shlukování jednotlivých detekcí přes celý obraz do trajektorií. Tato práce představuje sadu algoritmů pro vytváření trajektorií z detekcí objektu za použití analytického modelu. Představené algoritmy jsou jsou založeny na shlukování detekcí, později i jednoduchých trajektorií, do složitých trajektorií na základě vlastností jako jsou čas (framu), ohraničující obdélník ve framu, který určuje detekovaný objekt a případně i výřez obrázku určeného ohraničujícím obdélníkem. Pro ukázání použití vygenerovaných trajektorií jsme představili metody pro zlepšení vstupních detekcí tím, že přidají, kvůli chybě detektoru, chybějící nedetekované detekce. Jako druhé použití trajektorií generujeme jednoduché sémantické popisy trajek- torií tak, abychom v budoucnu mohli zkoumat chování objektů a případně je vyhledávat. 1
Named Entity Recognition and Its Application to Phishing Detection
Pop, Tomáš ; Skopal, Tomáš (vedoucí práce) ; Vomlelová, Marta (oponent)
Tato bakalářská práce se zabývá rozpoznáváním pojmenovaných entit a jeho aplikací pro detekci phishingu v emailové korespondenci. Rozpoznávání pojmenovaných entit je klasifikační úloha, jejíž cílem je extrahovat informace z textu klasifikovaného do pře- dem definované množiny kategorií (pojmenované entity) jako například názvy organizací, míst či osob. Dále práce popisuje různé přístupy k rozpoznávání pojmenovaných entit, od jednoduchého využití neuronových sítí k momentálně nejmodernějším architekturám. Nejrozšířenější knihovny a jejich modely týkající se rozpoznávání pojmenovaných entit jsou navzájem porovnávány z pohledu výpočetního výkonu a přesnosti predikcí na ve- řejně dostupném Enron email datasetu. Rozdíly v nalezených pojmenovaných entitách mezi pozitivními (včetně phishingových) a negativními emaily jsou určeny na proprie- tárním datasetu. Na závěr je tento dataset použit pro experiment, kde proces klasifikace phishingových e-mailů je obohacen o pojmenované entity k cílem dojít k závěru, zda jsou pojmenované entity užitečné pro klasifikátor ke zlepšení prediktivního výkonu. Na základě výsledků experimentů byla pozorována znatelná odlišnost v pozitivních a nega- tivních emailech. Nicméně v experimentu týkající se klasifikace phishingových emailů nad tímto datasetem se došlo k závěru, že...
Data Preprocessing Strategies in Imbalanced Data Classification
Haluška, Radovan ; Skopal, Tomáš (vedoucí práce) ; Svoboda, Martin (oponent)
Učenie sa z dát s nevyváženým pomerom tried je témou výskumu, ktorá sa skúma už mnoho rokov. V súčasnosti sa používajú dva hlavné prístupy - metódy na úrovni dát a metódy na úrovni algoritmov. Rozhodli sme sa študovať metódy vzorkovania, ktoré patria do kategórie metód na úrovni dát. Tieto metódy modifikujú trénovaciu časť dát, na rozdiel od metód na úrovni algoritmov, ktoré modifikujú samotný klasifikátor. Metódy vzorkovania sa ďalej delia na metódy prevzorkovani a podvzorkovania. Je náročné vedieť, ktorá skupina metód funguje lepšie a ktoré algoritmy vynikajú najviac. Usku- točnili sme preto experiment nevídaného rozsahu. Systematicky a robustne sme porovnali šestnásť metód prevzorkovania nad osemnástimi datasetmi s nevyváženým pomerom tried a zhrnuli sme výsledky v tejto práci. Výsledky ukazujú, že metódy prevzorkovania prekonali väčšinu metód podvzorkovania z hľadiska výkonu aj času predspracovania. 1
Index pro podobnostní vyhledávání ve vysokodimenzionálních prostorech
Krejčová, Martina ; Kopecký, Michal (vedoucí práce) ; Skopal, Tomáš (oponent)
V této práci se zabýváme indexováním a vyhledáváním vysokodimenzionálních dat pomocí metody Metrického indexu pro indexování a podobnostní vyhledávání v metrických prostorech. Použití této metody nám umožnilo vytvořit implementaci indexu vhodného pro indexaci obecných metrických prostoru. Díky tomuto indexu je krome ukládání dat umožněno i jejich efektivní vyhledávání. Vnitřní struktura dat indexu zůstává skryta, index od uživatele vyžaduje pouze definici extrakční funkce pro získání vektoru, který data reprezentuje, a podobnostní funkce, která má být na indexovaná data aplikována. V této práci vznikla implementace Metrického indexu jako data cartridge pro databázový server Oracle. Tato data cartridge rozšiřuje možnosti indexace v Oracle o vytváření doménových indexů nad nestrukturovanými daty, takzvanými LOBy.
Integrace Sociálních sítí
Mašíček, Viktor ; Tykal, Jaroslav (vedoucí práce) ; Skopal, Tomáš (oponent)
Sociální sítě jsou současným fenoménem a jejich integrace začíná získávat na duležitosti. Základem této integrace je spárování shodných informací v jednotlivých sociálních sítích a detekce nesrovnalostí mezi nimi. Nejduležitější data, která je potřeba integrovat, jsou proi ly uživatelů a seznamy jejich kontaktů. V naší práci jsme navrhli integraci jak profi lů a seznamů kontaktů, tak skupin uživatelů, které je možné v sociálních sítích vytvářet. Součástí práce není implementace. Návrh však počítá s Hlavní sociální sítí, která by webovým rozhraním zprostředkovala integraci koncovým uživatelům. Z pohledu uživatelů je přínosné zobrazení dat ze všech sociálních sítí na jednom místě a automatizovaná detekce rozdílů. Data uživatelů by pak mohla být využita pro obchodní účely, samozřejmě v rámci zákonných omezení. Z tohoto pohledu je největším přínosem Hlavní sociální sítě sociální graf. Ten by se skládal ze sociálních grafů jednotlivých sociálních sítí. Navíc by v nim byly informace o členství uživatelů v jednotlivých sociálních sítích. Součástí návrhu jsou hlavní procesy Hlavní sociální sítě, její datový model a způsob získávání informací z jednotlivých sítí. Při návrhu modelu jsme se částečně inspirovali existujícími projekty. Při získávání informací ze sociálních sítí by se dokonce některých projektů dalo...
Genetické algoritmy: charakteristické slabiky jazyka
Kuthan, Tomáš ; Lánský, Jan (vedoucí práce) ; Skopal, Tomáš (oponent)
Slabiková komprese je nový přístup ke kompresi textů po symbolech. Důležitým aspektem tohoto přístupu jsou slovníky častých slabik. Tyto slovníky slouží k počáteční inicializaci kompresních algoritmů a mají velký vliv na kompresní poměr. Doposud byly získávány přímočaře na základě četností výskytů slabik v korpusech. Věříme, že za pomoci genetického algoritmu bychom mohli dokázat přesněji určit množinu slabik, které jsou pro daný jazyk charakteristické, a tím dosáhnout lepších výsledků při samotné kompresi. V této práci se pokusíme takovýto algoritmus navrhnout a otestujeme jej na textech v anglickém a českém jazyce.
Modification of Pivot Tables method for persistent metric indexing
Moško, Juraj ; Skopal, Tomáš (vedoucí práce) ; Hoksza, David (oponent)
Metrická prístupová metóda pivot tables je jedna z najefektívnejších metód podobnostného vyhľadávania optimalizovaná na počet výpočtov vzdialeností medzi indexovanými objektmi. V tejto práci bola navrhnutá modifikácia metódy pivot tables, ktorá je navyše optimalizovaná aj na počet I/O operácií. Navrhnutá metóda Clustered pivot tables indexuje zhluky podobných objektov, ktoré boli vytvorené pomocou ďalšej metrickej prístupovej metódy - M-stromu. Indexovanie zhlukov podobných objektov prináša pozitívny efekt do vyhľadávania v indexovanej databáze, keď objekty z jedného zhluku sú uložené v stránke v sekundárnej pamäti, ktorá nemusí byť vôbec načítaná, ak daný zhluk dát neodpovedá príslušnému dotazu. Nerelevantné objekty tak nie sú zbytočne načítané zo sekundárnej pamäti, čím sa znižuje počet I/O operácií a celkový objem prenesených dát. Korektnosť daného prístupu bola experimentálne dokázaná a výsledky navrhovanej metódy bola porovnané s vybranými metrickými prístupovými metódami.
Fraktální komprese časových řad
Lysík, Martin ; Skopal, Tomáš (vedoucí práce) ; Koubková, Alena (oponent)
Cieľom tejto práce bolo vyhľadávanie jednorozmerných fraktálnych distribúcií v reálnych časových radoch a ich použitie na kompresiu týchto časových radov. Bola preskúmaná použiteľnosť tejto metódy na bezstratovú ako aj stratovú kompresiu. Na základe analýzy problému bol ako prvý navrhnutý a implementovaný základný kompresný algoritmus. Tento bol postupne doplnený o jednoduché heuristiky pre rýchlejšie spracovanie dat a tiež rozširovaný o ďalšie kroky, ktoré mali minimalizovať jeho nedostatky. Ako výsledok vznikli dva rozširujúce kompresné algoritmy a jeden algoritmus s rozdielnym spôsobom spracovania dat. Chovanie týchto algoritmov, veľkosť výstupov a kvalita dekomprimovaných dát boli porovnané na rôznych vstupných dátach a algoritmy boli porovnané aj s existujúcimi kompresnými algoritmami a metódami používanými pre uchovávanie časových radov.
Operace DELETE ve srůstajícím hašování
Mrkva, Lukáš ; Koubková, Alena (vedoucí práce) ; Skopal, Tomáš (oponent)
Nazev pracc: Opcra.ee DELETE ve srustajicim luisovani Autor: Lukas Mrkva Katedra (listav): Katedra softwaroveho inzenyrstvi Vedouci diplomovc prace: R.NDr. Alona Koubkova, CSc. E-rnail vedouciho: koubkova@ksi.ms.mff.cuni.cz Abstrakt: Diplomova pnioe jo vcnovana opcraci DELETE vo srustajicim hasovani. Nejprve jsou uvodeny principy hasovani a nektere jeho zakladni druhy. O srnstajicim hasovani pojednava ka])itola 3, kde jsou podrobnc ]>o- psany i ruznc melody koikstrukce h;usovaoi tal)ulky ro/dekuio die pofadi ko- liznich zaznamu a pfitonniosti sklepa. Dale jsou ])fcdstaveny tri rozdilne al- goritmy pro opora.ci DKLI^TK a dctailne diskutovtiny jojich implnincntacc pro jcdnutlivo inotody srustajiciho ha.sova.ni. Po tooroticke cayti naslcdiiji vy- slodky a koinontafo oxpcriincntu na siniulovanych datodi. Pracr jc zainefcna zejmena na porovnani casovu narooiiosti jednotlivych mazacich algoritnm a na porovnani ca.su potfcl)nych k vyhlcdavani za'/nanm prod a po smazani cast! tabulky. Pouzito algoritiny iiu])lciu(1iitovane v ja/yco C' a vyslodky ex- pcrimcntn jsou ]>rilozouy na CD. Klfcova slova: srustajici hasovani. delcto Title: Deletion in Coalesced Hashing Author: Lukas Mrkva Department: Dopartnicnt of Software Engineering Supervisor: RXDr. Aleua Koulikova,CSc. Supervisor's e-mail address:...
Vyhledávací stroj pro matematiku
Mišutka, Jozef ; Galamboš, Leo (vedoucí práce) ; Skopal, Tomáš (oponent)
Vyhladávacie stroje (napr. Google) vládnu obsahu dnešného WWW. Sú neoddelitelnou súcastou každodenného prístupu k informáciám. Veda, ktorá sa zaoberá práve vyhladávacími strojmi, sa sústreduje na vyhladávanie prirodzených castí jazyka - slov. V posledných rokoch sa rozšírila pôsobnost vyhladávacov aj na iné oblasti. Velkost matematických dát na WWW enormne narástla. Dôležitost matematických vyhladávacích strojov je evidentná. Aj napriek tomuto vývoju, sa oblast vedy skúmajúca matematické vyhladávanie donedávna zanedbávala. Napriek tomu, že aktívny výskum napreduje vo vývoji, zatial bolo prezentovaných len niekolko málo výsledkov. Hlavným cielom tejto práce je vyplnit túto medzeru. Nový matematický vyhladávací stroj bol navrhnutý so zameraním sa na použitelnost. Jediný vyhladávací stroj schopný efektívne indexovat WWW - cisto textový (fulltextový) vyhladávací stroj - bol použitý ako základ a vypracovaný návrh ako jeho rozšírenie. Toto umožnuje využívat všetky výhody fulltextového vyhladávacieho stroja. Väcšina matematických dokumentov neobsahuje informáciu o sémantike. Riešenie tohoto problému je základným cielom tejto diplomovej práce. Testovanie ukázalo, že navrhovaný vyhladávací stroj má viacero výhod. Najdôležitejšou je použitelnost pre velkú množinu matematických dokumentov s minimálnym sémantickým...

Národní úložiště šedé literatury : Nalezeno 127 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.