Národní úložiště šedé literatury Nalezeno 28 záznamů.  předchozí11 - 20další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Prostředí pro analýzu podezřelého zařízení
Procházka, Jan ; Martinásek, Zdeněk (oponent) ; Malina, Lukáš (vedoucí práce)
Bakalářská práce se zabývá návrhem prostředí pro analýzu podezřelého zařízení. Tímto zařízením může být například škodlivým kódem kontaminovaný disk nebo mobilní zařízení. Cílem práce je navrhnout efektivní a jednoduché prostředí s použitím open source produktů. Finální prostředí by mělo být schopné provádět jak povrchovou, tak i hloubkovou analýzu dat. Teoretická část poskytuje informace spojené s problematikou práce a obsahuje pojmy jako jsou Sandbox, Malware, Android. Ty jsou popsány z pohledu důležitého pro pochopení analýzy malwaru vyskytujícího se převážně na mobilním zařízení. Praktická část popisuje použitý hardware a software pro návrh prostředí a obsahuje názorné ukázky analýz škodlivým kódem kontaminovaných externích zařízení. Jedná se převážně o mobilních zařízení se systémem Android.
Portál pro agregaci dat z webových zdrojů
Mikita, Tibor ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste.
Extrakcia informácií z formulárov
Pálinkás, Adam
Tato práce se zabývá návrhem a implementací aplikace, která využívá pokročilé techniky rozpoznávání textu a techniky zpracování obrazu na zpracování ručně vyplněných údajů z naskenovaných formulářů. V rámci práce jsou analyzované existující metody a technologie pro rozpoznávání textu a vybrané z nich jsou implementovány do výsledné aplikace, která zefektivňuje zpracování formulářů ve společnosti CYRRUS, a. s.
Extrakce dat z dokumentů na základě analýzy rozložení
Sedláček, Martin ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Diplomová práce se zabývá automatizovanou extrakcí dat z lékařských zpráv ve formátu PDF na základě analýzy rozložení dokumentu. Hlavním obsahem práce je uvedení čtenáře do problematiky extrakce dat, srovnávaní existujících nástrojů a představení návrhu a požadavků vyvíjeného nástroje, který bude založen nad aplikačním rámcem FitLayout. Práce dále popisuje samotnou implementaci nástroje v jazyce Java a komentuje výsledky, kterých nástroj dosáhl na reálných datech.
Extrakce dat z dokumentů PDF
Bartošák, Michal ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Práce se zaměřuje na extrakci informací ze zdravotních záznamů ve formátu PDF, které byly vytvořeny srdečními stimulátory při pravidelné kontrole pacientů v nemocnici. Výsledkem této práce je desktopová aplikace v programovacím jazyce Java, která získává a analyzuje informace ze záznamů pomocí knihoven PDFBox a pdf2dom. Výstupem aplikace je CSV soubor, který reprezentuje získané hodnoty formou tabulky, a extrahované obrázky, které se ukládají do výstupní složky určené uživatelem. Testování aplikace na záznamech od tří různých společností prokázalo, že je extrakce záznamů velmi spolehlivá (celkové metriky přesnosti i úplnosti dosáhly téměř vždy 100 %), pokud jsou správně nastaveny její argumenty.
Automated Processing of PDF Document Contents
Gajdošík, Štefan ; Rychlý, Marek (oponent) ; Burget, Radek (vedoucí práce)
This bachelor thesis deals with the extraction of data generated by pacemakers. The main content of this thesis is to introduce the PDF document format, tools for working with PDF documents, description of techniques for data extraction, and implementation of an application for automatic data extraction in Python programming language.
Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů
Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce)
Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia.
Methods of Data Extraction from the Web
Perina, Lukáš ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an application designed for data extraction (web scraping) from web documents. Unlike conventional methods, it is an extraction based on defining data types and regular expressions of requested elements. Extraction is executed in such a manner, where it is not necessary to know the detailed structure of given web document and the possibility of using just one definition to detect requested elements on different web pages. Algorithm is able to achieve overall accuracy of 85,51% and recall 80,28%. This approach can reduce the time required for analysis of web pages significantly and not to take the structure of the code as a determining factor while creating web scraping requests.
Inteligentní extrakce dat ve webovém prohlížeči
Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje.
Portál pro agregaci dat z webových zdrojů
Mikita, Tibor ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste.

Národní úložiště šedé literatury : Nalezeno 28 záznamů.   předchozí11 - 20další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.