keywords:"data extraction" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"data extraction"

Hledej:



Tipy pro vyhledávaní :: Jednoduché hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Prostředí pro analýzu podezřelého zařízení Procházka, Jan ; Martinásek, Zdeněk (oponent) ; Malina, Lukáš (vedoucí práce) Bakalářská práce se zabývá návrhem prostředí pro analýzu podezřelého zařízení. Tímto zařízením může být například škodlivým kódem kontaminovaný disk nebo mobilní zařízení. Cílem práce je navrhnout efektivní a jednoduché prostředí s použitím open source produktů. Finální prostředí by mělo být schopné provádět jak povrchovou, tak i hloubkovou analýzu dat. Teoretická část poskytuje informace spojené s problematikou práce a obsahuje pojmy jako jsou Sandbox, Malware, Android. Ty jsou popsány z pohledu důležitého pro pochopení analýzy malwaru vyskytujícího se převážně na mobilním zařízení. Praktická část popisuje použitý hardware a software pro návrh prostředí a obsahuje názorné ukázky analýz škodlivým kódem kontaminovaných externích zařízení. Jedná se převážně o mobilních zařízení se systémem Android. Úplný záznam
	Portál pro agregaci dat z webových zdrojů Mikita, Tibor ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce) Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste. Úplný záznam
	Extrakcia informácií z formulárov Pálinkás, Adam Tato práce se zabývá návrhem a implementací aplikace, která využívá pokročilé techniky rozpoznávání textu a techniky zpracování obrazu na zpracování ručně vyplněných údajů z naskenovaných formulářů. V rámci práce jsou analyzované existující metody a technologie pro rozpoznávání textu a vybrané z nich jsou implementovány do výsledné aplikace, která zefektivňuje zpracování formulářů ve společnosti CYRRUS, a. s. Úplný záznam
	Extrakce dat z dokumentů na základě analýzy rozložení Sedláček, Martin ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce) Diplomová práce se zabývá automatizovanou extrakcí dat z lékařských zpráv ve formátu PDF na základě analýzy rozložení dokumentu. Hlavním obsahem práce je uvedení čtenáře do problematiky extrakce dat, srovnávaní existujících nástrojů a představení návrhu a požadavků vyvíjeného nástroje, který bude založen nad aplikačním rámcem FitLayout. Práce dále popisuje samotnou implementaci nástroje v jazyce Java a komentuje výsledky, kterých nástroj dosáhl na reálných datech. Úplný záznam
	Extrakce dat z dokumentů PDF Bartošák, Michal ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce) Práce se zaměřuje na extrakci informací ze zdravotních záznamů ve formátu PDF, které byly vytvořeny srdečními stimulátory při pravidelné kontrole pacientů v nemocnici. Výsledkem této práce je desktopová aplikace v programovacím jazyce Java, která získává a analyzuje informace ze záznamů pomocí knihoven PDFBox a pdf2dom. Výstupem aplikace je CSV soubor, který reprezentuje získané hodnoty formou tabulky, a extrahované obrázky, které se ukládají do výstupní složky určené uživatelem. Testování aplikace na záznamech od tří různých společností prokázalo, že je extrakce záznamů velmi spolehlivá (celkové metriky přesnosti i úplnosti dosáhly téměř vždy 100 %), pokud jsou správně nastaveny její argumenty. Úplný záznam
	Automated Processing of PDF Document Contents Gajdošík, Štefan ; Rychlý, Marek (oponent) ; Burget, Radek (vedoucí práce) This bachelor thesis deals with the extraction of data generated by pacemakers. The main content of this thesis is to introduce the PDF document format, tools for working with PDF documents, description of techniques for data extraction, and implementation of an application for automatic data extraction in Python programming language. Úplný záznam
	Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce) Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia. Úplný záznam
	Methods of Data Extraction from the Web Perina, Lukáš ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce) The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an application designed for data extraction (web scraping) from web documents. Unlike conventional methods, it is an extraction based on defining data types and regular expressions of requested elements. Extraction is executed in such a manner, where it is not necessary to know the detailed structure of given web document and the possibility of using just one definition to detect requested elements on different web pages. Algorithm is able to achieve overall accuracy of 85,51% and recall 80,28%. This approach can reduce the time required for analysis of web pages significantly and not to take the structure of the code as a determining factor while creating web scraping requests. Úplný záznam
	Inteligentní extrakce dat ve webovém prohlížeči Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce) Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje. Úplný záznam
	Portál pro agregaci dat z webových zdrojů Mikita, Tibor ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce) Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English