Národní úložiště šedé literatury Nalezeno 24 záznamů.  předchozí11 - 20další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Extrakce dat z dokumentů PDF
Bartošák, Michal ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Práce se zaměřuje na extrakci informací ze zdravotních záznamů ve formátu PDF, které byly vytvořeny srdečními stimulátory při pravidelné kontrole pacientů v nemocnici. Výsledkem této práce je desktopová aplikace v programovacím jazyce Java, která získává a analyzuje informace ze záznamů pomocí knihoven PDFBox a pdf2dom. Výstupem aplikace je CSV soubor, který reprezentuje získané hodnoty formou tabulky, a extrahované obrázky, které se ukládají do výstupní složky určené uživatelem. Testování aplikace na záznamech od tří různých společností prokázalo, že je extrakce záznamů velmi spolehlivá (celkové metriky přesnosti i úplnosti dosáhly téměř vždy 100 %), pokud jsou správně nastaveny její argumenty.
Automated Processing of PDF Document Contents
Gajdošík, Štefan ; Rychlý, Marek (oponent) ; Burget, Radek (vedoucí práce)
This bachelor thesis deals with the extraction of data generated by pacemakers. The main content of this thesis is to introduce the PDF document format, tools for working with PDF documents, description of techniques for data extraction, and implementation of an application for automatic data extraction in Python programming language.
Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů
Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce)
Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia.
Methods of Data Extraction from the Web
Perina, Lukáš ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an application designed for data extraction (web scraping) from web documents. Unlike conventional methods, it is an extraction based on defining data types and regular expressions of requested elements. Extraction is executed in such a manner, where it is not necessary to know the detailed structure of given web document and the possibility of using just one definition to detect requested elements on different web pages. Algorithm is able to achieve overall accuracy of 85,51% and recall 80,28%. This approach can reduce the time required for analysis of web pages significantly and not to take the structure of the code as a determining factor while creating web scraping requests.
Inteligentní extrakce dat ve webovém prohlížeči
Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje.
Portál pro agregaci dat z webových zdrojů
Mikita, Tibor ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste.
Prostředí pro analýzu podezřelého zařízení
Procházka, Jan ; Martinásek, Zdeněk (oponent) ; Malina, Lukáš (vedoucí práce)
Bakalářská práce se zabývá návrhem prostředí pro analýzu podezřelého zařízení. Tímto zařízením může být například škodlivým kódem kontaminovaný disk nebo mobilní zařízení. Cílem práce je navrhnout efektivní a jednoduché prostředí s použitím open source produktů. Finální prostředí by mělo být schopné provádět jak povrchovou, tak i hloubkovou analýzu dat. Teoretická část poskytuje informace spojené s problematikou práce a obsahuje pojmy jako jsou Sandbox, Malware, Android. Ty jsou popsány z pohledu důležitého pro pochopení analýzy malwaru vyskytujícího se převážně na mobilním zařízení. Praktická část popisuje použitý hardware a software pro návrh prostředí a obsahuje názorné ukázky analýz škodlivým kódem kontaminovaných externích zařízení. Jedná se převážně o mobilních zařízení se systémem Android.
Vztah změn sázkových kurzů a výsledků fotbalových zápasů
Jurkovič, Juraj ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Cieľom tejto práce je demonštrovať techniky pre riešenie úloh extrakcie dát z webu a získavania znalostí z dát. Prípadová štúdia je zameraná na zber dát zo stávkových kancelárií a následnú analýzu týchto dát. Práca demonštruje riešenie úlohy získavania dát z webu v jazyku Python. Práca popisuje vybrané implementačné detaily pre vytvorenie systému na zber dát z webu a navrhuje schému databázy, ktorá môže byť v tomto systéme použitá. Získané dáta sú analyzované štatistickými metódami a vo vývojoch cien kurzov sú objavované frekventované vzory pomocou apriori algoritmu. Pozorované vzťahy a objavené frekventované vzory sú prezentované koncovému užívateľovi.
Analýza spolehlivosti forenzních nástrojů pro zkoumání malé digitální techniky
PĚSTOVÁ, Karolína
Tato bakalářská práce se zabývá forenzními nástroji pro zkoumání malé digitální techniky. V teoretické části jsou popsány zásady digitální forenzní analýzy a postupy pro zkoumání mobilních telefonů. V praktické části je provedena analýza vybraných mobilních telefonů nástroji pro zkoumání malé digitální techniky, jsou zde vyhodnoceny výsledky a navrženo řešení pro zajištění co nejvíce relevantních dat.
Analýza postojů v oblasti automobilového průmyslu
Bezák, Adam ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto práce je oboznámiť sa so základnými metódami analýzy postojov na sociálnych sieťach.  Téma práce je zameraná na automobilový priemysel, avšak princíp práce je možné použiť na akékoľvek iné skúmané odvetie. Podstatou praktickej časti je získanie dát zo sociálnych sietí, ich analýza a následná indexácia do ElasticSearch databáze. Ďaľším cieľom práce je tieto dáta vizualizovať prostredníctvom portálu. Vytvorený webový portál poskytuje rôzne štatistiky popredných automobilových značiek, prehľad nových trendov alebo vizualizáciu názorov na konkrétne aspekty jednotlivých automobilov.

Národní úložiště šedé literatury : Nalezeno 24 záznamů.   předchozí11 - 20další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.