keywords:"web scraping" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"web scraping"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Platform for Cryptocurrency Address Collection Bambuch, Vladislav ; Pluskal, Jan (oponent) ; Veselý, Vladimír (vedoucí práce) The goal of this work is to build a platform for collecting and displaying metadata about cryptocurrency addresses from public and also dark web. To achieve this goal, I use web parsing technologies written in PHP. Challenges accompanying a website parsing are solved by scaling capabilities of Apache Kafka streaming platform. The modularity of the platform is accomplished by microservice architecture and Docker containerization. The work creates a unique way how to search for potential crypto criminal activities, that appeared outside of the blockchain world, by building a web page application on top of this platform (that serves for managing the platform and exploring the extracted data). The platform architecture allows adding loosely coupled modules smoothly where the Apache Kafka mediates communication of the modules. The result of this article is meant to be used for cybercrime detection and prevention. Its users can be law enforcement authorities or other agencies and users interested in reputations and credibility of cryptocurrency addresses. Úplný záznam
	Analýza uživatelských nastavení sociálních sítí Mlýnek, Martin ; Malinka, Kamil (oponent) ; Januš, Filip (vedoucí práce) Bakalářská práce se zabývá tvorbou webového uživatelského rozhraní. Cílem bylo navrhnout a implementovat rozhraní pro serverovou část bezpečnostního nástroje Privchecker, který se zabývá bezpečností uživatelů na sociálních sítí. Zvolený problém byl vyřešen vytvořením klientské webové aplikace založené na JavaScriptové knihovně React. Dále se zde řeší problematika předávání údajů, testování implementovaného rozhraní a analýza uživatelských nastavení. Úplný záznam
	Rozpoznávání postojů z filmových recenzí Bílý, Daniel ; Jon, Josef (oponent) ; Smrž, Pavel (vedoucí práce) Tato práce je zaměřena na tvorbu systému, který je schopný pravidelně stahovat filmové recenze z webu a následně je analyzovat. Zdrojů recenzí je několik a to českých i anglických (čsfd, fdb, imdb a rotten tomatoes). Analýza sentimentu recenzí je prováděna za pomocí strojového učení. Výsledky analýz jsou zobrazovány ve webovém prohlížeči. Úplný záznam
	Rozšíření uživatelských profilů pro účely cílené reklamy Hadač, Filip ; Burgetová, Ivana (oponent) ; Zendulka, Jaroslav (vedoucí práce) Tato práce se zabývá návrhem a realizací obohacení uživatelských profilů pro účely vylepšení cílené reklamy. Pro získání nových informací je využita extrakce dat z webových stránek. Extrahovaná data pochází ze dvou serverů, ČSFD a Recepty. V případě ČSFD se jedná o filmové žánry, zatímco u Recepty se jedná o kategorie receptů. Pomocí streamovacích aplikací se tyto informace zpracují a uloží do databází uživatelských profilů. Nad profily spadajícími do určité reklamní kampaně se provádí předzpracování a následně klasifikační algoritmy strojového učení pro vyhodnocení přínosu nových informací. Vyhodnocením experimentů je poznatek, že nově obohacené informace mají mírný přínos pro vylepšení cílené reklamy. Úplný záznam
	Získávání znalostí z veřejných semistrukturovaných dat na webu Kefurt, Pavel ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce) První část této práce se zabývá způsoby a nástroji, které je možné využít pro získání dat z webových stránek. Dále také nástroji používanými pro dolování v datech. Druhá část textu je věnována praktické ukázce celého procesu. Jako zdrojové webové místo je použit web Českého svazu tanečního sportu dostupný na www.csts.cz. Úplný záznam
	Interaktivní vlakový jízdní řád pro tablety Kalusek, Petr ; Bartík, Vladimír (oponent) ; Hynek, Jiří (vedoucí práce) Tato bakalářská práce se zabývá návrhem a vývojem mobilní aplikaci pro operační systém Android. Cílem práce je implementace aplikace pro interaktivní porovnávání vlakových spojů pomocí grafikonu vlakové dopravy. Aplikace vyhledá trasy mezi zastávkami včetně přestupů a zobrazí spoje na těchto trasách v grafikonu. Ten umožňuje filtraci dat a operace posunutí a přiblížení. Data o vlakových spojích byly získány pomocí skriptu z webových služeb. Úplný záznam
	Web pro zobrazování archiválií Tříska, David ; Zbořil, František (oponent) ; Rozman, Jaroslav (vedoucí práce) Cílem této bakalářské práce je průzkum stavu digitalizace archivů v České republice. Návrh a implementace vlastního webu pro zobrazování archivních dat, se scripty pro automatizovné získávání těchto dat. Úplný záznam
	Automatizovaná extrakce údajů z HTML Onderka, Jakub ; Koutný, Martin (oponent) ; Vrba, Kamil (vedoucí práce) Tato práce se zabývá problematikou extrakce údajů z webových stránek zapsaných v jazyce HTML. Popisuje metody stažení stránek ze vzdáleného serveru protokolem HTTP, řešení převodu kódování dokumentu a možnosti pro extrakci obsahu elementů. Také uvádí postupy, kterými můžou autoři webových stránek zabránit automatickému web scrapingu a jak tyto postupy obejít. Popsané metody byly užity ve vytvořeních aplikacích v jazyce C# pro extrakci údajů ze dvou databází Policie ČR – Pátrání po osobách a Pátrání po vozidlech. Aplikace umožňují stažení údajů ze vzdálené databáze, uložení do lokální databáze a následné vyhledávání a zobrazování požadovaných dat. Úplný záznam
	Aktualizace dat z webových stránek Valušek, Jan ; Šátek, Václav (oponent) ; Rozman, Jaroslav (vedoucí práce) Tato práce se zabývá analýzou webových stránek archivů v České republice a jejich technologií s cílem vytvoření autonomního programu pro hromadné stahování detailů o archivních materiálech a jejich skenů. Výsledná aplikace je vytvořena v programovacím jazyce Python s použitím knihovny Scrapy. Výstupem programu jsou soubory s daty archiválií uložených v jednotlivých archivech. Úplný záznam
	Important Entity Recognition in Web Page Text Svítková, Veronika ; Hynek, Jiří (oponent) ; Burget, Radek (vedoucí práce) The aim of this thesis is training named entity recognition model on a dataset created using structured data. Datasets were created from the names of products and books extracted from structured data in JSON-LD and Microdata format. Structured data were extracted from e-shop and social cataloging websites by web scraping. Names were used as a dataset by themselves as well as webpage text with automatically annotated matches of the names. In total eight models in Czech language were trained for recognizing names of products and books using spaCy library. F-score results are up to 89.94 for products and up to 84.26 for books evaluated on a created testing dataset. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English