keywords:"web scraping" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"web scraping"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Vztah změn sázkových kurzů a výsledků fotbalových zápasů Jurkovič, Juraj ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce) Cieľom tejto práce je demonštrovať techniky pre riešenie úloh extrakcie dát z webu a získavania znalostí z dát. Prípadová štúdia je zameraná na zber dát zo stávkových kancelárií a následnú analýzu týchto dát. Práca demonštruje riešenie úlohy získavania dát z webu v jazyku Python. Práca popisuje vybrané implementačné detaily pre vytvorenie systému na zber dát z webu a navrhuje schému databázy, ktorá môže byť v tomto systéme použitá. Získané dáta sú analyzované štatistickými metódami a vo vývojoch cien kurzov sú objavované frekventované vzory pomocou apriori algoritmu. Pozorované vzťahy a objavené frekventované vzory sú prezentované koncovému užívateľovi. Úplný záznam
	Interactive web crawling and data extraction Fejfar, Petr ; Ježek, Pavel (vedoucí práce) ; Nečaský, Martin (oponent) Název práce: Interaktivní procházení webu a extrakce dat Autor: Bc. Petr Fejfar E-mailová adresa autora: pfejfar@gmail.com Katedra: Katedra distribuovan˝ch a spolehliv˝ch systémů Vedoucí práce: Mgr. Pavel Je ek, Ph.D., Katedra distribuovan˝ch a spoleh- liv˝ch systémů Abstrakt: Tato práce se zaměřuje na problematiku automatického procháze- ní stránek a extrakce dat v kontextu moderních webov˝ch aplikací, obsahu- jících vysoké mno ství aplikační logiky implementované v prohlí eči pomocí JavaScriptu. V práci je provedena anal˝za moderních webov˝ch stránek, spolu s tech- nikami, které jsou be ně pou ívany k extrakci dat. Na základě této anal˝zy jsme navrhli nástroj, kter˝ moderní webové stránky prochází na základě instrukcí zadan˝ch u ivatelem pomocí grafického prostředí. Narozdíl od ostatních nástrojů na procházení a extrakci dat z moderních webov˝ch strá- nek, náö nástroj umo nuje práci u ivatelům, kteří nemají zkuöenosti s pro- gramováním. Navhrhovan˝ nástroj je implementován jako webová aplikace a vyu ívá pro- tokolu WebDriver pro automatizaci více prohl ečů pro procházení a extrakci dat z webov˝ch stránek pomocí u ivatelem definovan˝ch posloupností in- strukcí. Náö nástroj umo ňuje u ivateli prozkoumat aktuální stav prohlí eče extrahujícího data zobrazením aktuálně prochazené stránky. Toto... Úplný záznam
	Interaktivní vlakový jízdní řád pro tablety Kalusek, Petr ; Bartík, Vladimír (oponent) ; Hynek, Jiří (vedoucí práce) Tato bakalářská práce se zabývá návrhem a vývojem mobilní aplikaci pro operační systém Android. Cílem práce je implementace aplikace pro interaktivní porovnávání vlakových spojů pomocí grafikonu vlakové dopravy. Aplikace vyhledá trasy mezi zastávkami včetně přestupů a zobrazí spoje na těchto trasách v grafikonu. Ten umožňuje filtraci dat a operace posunutí a přiblížení. Data o vlakových spojích byly získány pomocí skriptu z webových služeb. Úplný záznam
	Automatizovaná rekonstrukce webových stránek Serečun, Viliam ; Ryšavý, Ondřej (oponent) ; Veselý, Vladimír (vedoucí práce) Mnoho právnych inštitúcií vyžaduje dôkazné bremeno týkajúce sa webového obsahu. Táto diplomová práca sa zaoberá problémom spojeným s automatizáciou webovej rekonštrukcie a webovou archiváciou. Hlavným cieľom je poskytnúť riešenie s s otvoreným zdrojovým kódom , ktoré uspokojí právne inštitúcie s ich požiadavkami. Táto práca predstavuje dva hlavné produkty. Prvý je rámcový program, ktorý je základným stavebným kameňom pre vývoj aplikácií na extrakciu a archiváciu webových stránok. Druhým produktom je prototyp webovej aplikácie. Tento prototyp ukazuje využitie rámcového programu pri riešení požiadavok týchto inštitúcií. Výstupom aplikácie je archív formátu MAFF, ktorý obsahuje zrekonštruovanú webovú stránku, snímku obrazovky webovej stránky a tabuľku meta-informácií. Táto tabuľka zobrazuje informácie o zhromaždených údajoch, informáciách o serveroch, ako sú napríklad IP adresy a porty zariadenia, na ktorom sa nachádzala pôvodná webová stránka, a časové razítko. Úplný záznam
	Analýza postojů českých uživatelů k obchodním řetězcům na základě dat ze sociálních sítí a webových diskusí Bolješik, Michal ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Cieľom tejto práce je navrhnúť a vytvoriť systém analyzujúci dáta z webu, ktoré sa týkajú českých potravinových obchodných reťazcov. Implementovaný systém umožňuje automatické sťahovanie takýchto dát, analýzu ich sentimentu, prípadnú extrakciu lokalít a názvov reťazcov z dát a následné indexovanie dát. Súčasťou systému je aj webové rozhranie zobrazujúce výsledky vykonaných analýz. Prvá časť práce sa venuje rozboru extrakcie dát z webu, analýze sentimentu a indexovaniu dokumentov. Nasleduje popis návrhu systému a popis jeho implementácie. Posledná časť práce obsahuje vyhodnotenie implementovaného systému. Úplný záznam
	Návrh a implementace systému na agregaci nabídky nemovitostí v České republice Drobník, Jakub ; Kučera, Jan (vedoucí práce) ; Chlapek, Dušan (oponent) Diplomová práce se zabývá návrhem a implementací systému na agregaci nabídky nemovitostí v České republice. Cíl práce je vytvořit systém, který umožní agregovat data o realitních nabídkách, které jsou dostupné na internetu. Práce se skládá ze dvou základních částí, v první části práce je čtenář uveden do řešené problematiky, v druhé části je pak popsán návrh a implementace systému. V první části práce se autor zabývá způsoby, jak lze získávat data z webových stránek, zejména extrakcí dat pomocí automatických robotů. Druhá část práce se věnuje návrhu a implementaci systému pro agregaci dat. V této části jsou identifikovány požadavky na systém, které jsou vytvořeny spolu se zadavatelem systému. Na základě definovaných požadavků je vytvořen návrh systému, tento návrh je poté implementován. Výstupem práce je funkční prototyp systému, který agreguje data z realitních portálů do připravené databáze. Hlavním přínosem práce je ukázka možného přístupu, jakým lze agregovat data z určitého segmentu trhu do databáze. Úplný záznam
	Použití information scrapingu pro tvorbu výukových simulací Dobrovolný, Viktor ; Šisler, Vít (vedoucí práce) ; Pokorný, Jan (oponent) Předložená bakalářská práce se zabývá možnostmi využití metody web scrapingu při tvorbě výukových simulací. V úvodu první části se autor věnuje rozdílům mezi pojmy information scraping, web scraping a screen scraping a vytvořením definice po zbytek práce používaného pojmu web scraping. Dále se věnuje historii a kontextu této metody zejména v americkém prostředí a na jednoduchém příkladu ukazuje, jak může vypadat web scraper. Rozebírá i příklady použití web scrapingu, na které je možné na internetu narazit a popisuje konkrétní projekty, které metody využívají. Závěrem první části se věnuje složité právní situaci, která kolem web scrapingu panuje a zmiňuje etické problémy, na které je možné v souvislosti s používání scrapingu narazit. V druhé části se krátce věnuje výukovým simulacím a prozkoumává možnosti využití web scrapingu pro tvorbu a aktualizaci výukových simulací, včetně typických znaků datové struktury simulací, které jsou pro použití s web scrapingem vhodné. V závěru je představen návrh příkladu výukové simulace z oblasti energetiky, která by mohla z použití scraperů ve fázi tvorby i ve fázi aktualizací těžit. Powered by TCPDF (www.tcpdf.org) Úplný záznam
	Automated web information extraction Smotrila, Tomáš ; Mráz, František (vedoucí práce) ; Dokulil, Jiří (oponent) 1 Webové stránky zpřístupňují ohromné množství informací. Často se jedná o stránky generované z dat uložených v databázích. Přitom je kladen důraz na zobrazení informací, ale ne na jejich strojové zpracování. V diplomové práci je navrhnut a implementován prototyp systému na získávání dat z dynamicky generovaných webových stránek technikou programování demonstrací (programming by demonstration). Tento systém umožní uživateli myší ukázat, jak má systém postupovat při sběru informací z dané webové stránky. Na základe této ukázky by systém měl odvodit postup, jak získávat informace na podobných stránkách. Implementovaný systém dokáže posbírat pro uživatele relevantní informace z podobných stránek například do tvaru jednoduché tabulky vhodné na další strojové zpracování. Úplný záznam
	Získávání znalostí z veřejných semistrukturovaných dat na webu Kefurt, Pavel ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce) První část této práce se zabývá způsoby a nástroji, které je možné využít pro získání dat z webových stránek. Dále také nástroji používanými pro dolování v datech. Druhá část textu je věnována praktické ukázce celého procesu. Jako zdrojové webové místo je použit web Českého svazu tanečního sportu dostupný na www.csts.cz. Úplný záznam
	Automatizovaná extrakce údajů z HTML Onderka, Jakub ; Koutný, Martin (oponent) ; Vrba, Kamil (vedoucí práce) Tato práce se zabývá problematikou extrakce údajů z webových stránek zapsaných v jazyce HTML. Popisuje metody stažení stránek ze vzdáleného serveru protokolem HTTP, řešení převodu kódování dokumentu a možnosti pro extrakci obsahu elementů. Také uvádí postupy, kterými můžou autoři webových stránek zabránit automatickému web scrapingu a jak tyto postupy obejít. Popsané metody byly užity ve vytvořeních aplikacích v jazyce C# pro extrakci údajů ze dvou databází Policie ČR – Pátrání po osobách a Pátrání po vozidlech. Aplikace umožňují stažení údajů ze vzdálené databáze, uložení do lokální databáze a následné vyhledávání a zobrazování požadovaných dat. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English