Národní úložiště šedé literatury Nalezeno 45 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Platform for Cryptocurrency Address Collection
Bambuch, Vladislav ; Pluskal, Jan (oponent) ; Veselý, Vladimír (vedoucí práce)
The goal of this work is to build a platform for collecting and displaying metadata about cryptocurrency addresses from public and also dark web. To achieve this goal, I use web parsing technologies written in PHP. Challenges accompanying a website parsing are solved by scaling capabilities of Apache Kafka streaming platform. The modularity of the platform is accomplished by microservice architecture and Docker containerization.      The work creates a unique way how to search for potential crypto criminal activities, that appeared outside of the blockchain world, by building a web page application on top of this platform (that serves for managing the platform and exploring the extracted data). The platform architecture allows adding loosely coupled modules smoothly where the Apache Kafka mediates communication of the modules.       The result of this article is meant to be used for cybercrime detection and prevention. Its users can be law enforcement authorities or other agencies and users interested in reputations and credibility of cryptocurrency addresses.
Analýza uživatelských nastavení sociálních sítí
Mlýnek, Martin ; Malinka, Kamil (oponent) ; Januš, Filip (vedoucí práce)
Bakalářská práce se zabývá tvorbou webového uživatelského rozhraní. Cílem bylo navrhnout a implementovat rozhraní pro serverovou část bezpečnostního nástroje Privchecker, který se zabývá bezpečností uživatelů na sociálních sítí. Zvolený problém byl vyřešen vytvořením klientské webové aplikace založené na JavaScriptové knihovně React. Dále se zde řeší problematika předávání údajů, testování implementovaného rozhraní a analýza uživatelských nastavení.
Rozpoznávání postojů z filmových recenzí
Bílý, Daniel ; Jon, Josef (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce je zaměřena na tvorbu systému, který je schopný pravidelně stahovat filmové recenze z webu a následně je analyzovat. Zdrojů recenzí je několik a to českých i anglických (čsfd, fdb, imdb a rotten tomatoes). Analýza sentimentu recenzí je prováděna za pomocí strojového učení. Výsledky analýz jsou zobrazovány ve webovém prohlížeči. 
Rozšíření uživatelských profilů pro účely cílené reklamy
Hadač, Filip ; Burgetová, Ivana (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Tato práce se zabývá návrhem a realizací obohacení uživatelských profilů pro účely vylepšení cílené reklamy. Pro získání nových informací je využita extrakce dat z webových stránek. Extrahovaná data pochází ze dvou serverů, ČSFD a Recepty. V případě ČSFD se jedná o filmové žánry, zatímco u Recepty se jedná o kategorie receptů. Pomocí streamovacích aplikací se tyto informace zpracují a uloží do databází uživatelských profilů. Nad profily spadajícími do určité reklamní kampaně se provádí předzpracování a následně klasifikační algoritmy strojového učení pro vyhodnocení přínosu nových informací. Vyhodnocením experimentů je poznatek, že nově obohacené informace mají mírný přínos pro vylepšení cílené reklamy.
Získávání znalostí z veřejných semistrukturovaných dat na webu
Kefurt, Pavel ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce)
První část této práce se zabývá způsoby a nástroji, které je možné využít pro získání dat z webových stránek. Dále také nástroji používanými pro dolování v datech. Druhá část textu je věnována praktické ukázce celého procesu. Jako zdrojové webové místo je použit web Českého svazu tanečního sportu dostupný na www.csts.cz.
Interaktivní vlakový jízdní řád pro tablety
Kalusek, Petr ; Bartík, Vladimír (oponent) ; Hynek, Jiří (vedoucí práce)
Tato bakalářská práce se zabývá návrhem a vývojem mobilní aplikaci pro operační systém Android. Cílem práce je implementace aplikace pro interaktivní porovnávání vlakových spojů pomocí grafikonu vlakové dopravy. Aplikace vyhledá trasy mezi zastávkami včetně přestupů a zobrazí spoje na těchto trasách v grafikonu. Ten umožňuje filtraci dat a operace posunutí a přiblížení. Data o vlakových spojích byly získány pomocí skriptu z webových služeb.
Web pro zobrazování archiválií
Tříska, David ; Zbořil, František (oponent) ; Rozman, Jaroslav (vedoucí práce)
Cílem této bakalářské práce je průzkum stavu digitalizace archivů v České republice. Návrh a implementace vlastního webu pro zobrazování archivních dat, se scripty pro automatizovné získávání těchto dat.
Automatizovaná extrakce údajů z HTML
Onderka, Jakub ; Koutný, Martin (oponent) ; Vrba, Kamil (vedoucí práce)
Tato práce se zabývá problematikou extrakce údajů z webových stránek zapsaných v jazyce HTML. Popisuje metody stažení stránek ze vzdáleného serveru protokolem HTTP, řešení převodu kódování dokumentu a možnosti pro extrakci obsahu elementů. Také uvádí postupy, kterými můžou autoři webových stránek zabránit automatickému web scrapingu a jak tyto postupy obejít. Popsané metody byly užity ve vytvořeních aplikacích v jazyce C# pro extrakci údajů ze dvou databází Policie ČR – Pátrání po osobách a Pátrání po vozidlech. Aplikace umožňují stažení údajů ze vzdálené databáze, uložení do lokální databáze a následné vyhledávání a zobrazování požadovaných dat.
Aktualizace dat z webových stránek
Valušek, Jan ; Šátek, Václav (oponent) ; Rozman, Jaroslav (vedoucí práce)
Tato práce se zabývá analýzou webových stránek archivů v České republice a jejich technologií s cílem vytvoření autonomního programu pro hromadné stahování detailů o archivních materiálech a jejich skenů. Výsledná aplikace je vytvořena v programovacím jazyce Python s použitím knihovny Scrapy. Výstupem programu jsou soubory s daty archiválií uložených v jednotlivých archivech.
Important Entity Recognition in Web Page Text
Svítková, Veronika ; Hynek, Jiří (oponent) ; Burget, Radek (vedoucí práce)
The aim of this thesis is training named entity recognition model on a dataset created using structured data. Datasets were created from the names of products and books extracted from structured data in JSON-LD and Microdata format. Structured data were extracted from e-shop and social cataloging websites by web scraping. Names were used as a dataset by themselves as well as webpage text with automatically annotated matches of the names. In total eight models in Czech language were trained for recognizing names of products and books using spaCy library. F-score results are up to 89.94 for products and up to 84.26 for books evaluated on a created testing dataset.

Národní úložiště šedé literatury : Nalezeno 45 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.