Národní úložiště šedé literatury Nalezeno 13 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Inteligentní extrakce dat ve webovém prohlížeči
Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje.
Vyhledávání objektů v obraze na základě předlohy
Novák, Pavel ; Mašek, Jan (oponent) ; Burget, Radim (vedoucí práce)
Tato práce se zabývá detekcí objektů v obraze na základě předlohy. Hlavním přínosem práce je nová metoda extrakce příznaků histogramu orientovaných gradientů používající sadu komparátorů pro extrakci dat. V práci jsou popsány použité metody komparace a extrakce. Hlavní část je věnována především metodě histogramu orientovaných gradientů, ze které vycházíme. V práci je užita malá sada trénovacích obrazů (celkem 100) ověřená křížovou validací, následně ověřená na reálných scénách. Dosažená úspěšnost křížové validace je až 98% pro SVM algoritmus.
Prostředí pro analýzu podezřelého zařízení
Procházka, Jan ; Martinásek, Zdeněk (oponent) ; Malina, Lukáš (vedoucí práce)
Bakalářská práce se zabývá návrhem prostředí pro analýzu podezřelého zařízení. Tímto zařízením může být například škodlivým kódem kontaminovaný disk nebo mobilní zařízení. Cílem práce je navrhnout efektivní a jednoduché prostředí s použitím open source produktů. Finální prostředí by mělo být schopné provádět jak povrchovou, tak i hloubkovou analýzu dat. Teoretická část poskytuje informace spojené s problematikou práce a obsahuje pojmy jako jsou Sandbox, Malware, Android. Ty jsou popsány z pohledu důležitého pro pochopení analýzy malwaru vyskytujícího se převážně na mobilním zařízení. Praktická část popisuje použitý hardware a software pro návrh prostředí a obsahuje názorné ukázky analýz škodlivým kódem kontaminovaných externích zařízení. Jedná se převážně o mobilních zařízení se systémem Android.
Extrakcia informácií z formulárov
Pálinkás, Adam
Tato práce se zabývá návrhem a implementací aplikace, která využívá pokročilé techniky rozpoznávání textu a techniky zpracování obrazu na zpracování ručně vyplněných údajů z naskenovaných formulářů. V rámci práce jsou analyzované existující metody a technologie pro rozpoznávání textu a vybrané z nich jsou implementovány do výsledné aplikace, která zefektivňuje zpracování formulářů ve společnosti CYRRUS, a. s.
Extrakce dat z dokumentů PDF
Bartošák, Michal ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Práce se zaměřuje na extrakci informací ze zdravotních záznamů ve formátu PDF, které byly vytvořeny srdečními stimulátory při pravidelné kontrole pacientů v nemocnici. Výsledkem této práce je desktopová aplikace v programovacím jazyce Java, která získává a analyzuje informace ze záznamů pomocí knihoven PDFBox a pdf2dom. Výstupem aplikace je CSV soubor, který reprezentuje získané hodnoty formou tabulky, a extrahované obrázky, které se ukládají do výstupní složky určené uživatelem. Testování aplikace na záznamech od tří různých společností prokázalo, že je extrakce záznamů velmi spolehlivá (celkové metriky přesnosti i úplnosti dosáhly téměř vždy 100 %), pokud jsou správně nastaveny její argumenty.
Inteligentní extrakce dat ve webovém prohlížeči
Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje.
Prostředí pro analýzu podezřelého zařízení
Procházka, Jan ; Martinásek, Zdeněk (oponent) ; Malina, Lukáš (vedoucí práce)
Bakalářská práce se zabývá návrhem prostředí pro analýzu podezřelého zařízení. Tímto zařízením může být například škodlivým kódem kontaminovaný disk nebo mobilní zařízení. Cílem práce je navrhnout efektivní a jednoduché prostředí s použitím open source produktů. Finální prostředí by mělo být schopné provádět jak povrchovou, tak i hloubkovou analýzu dat. Teoretická část poskytuje informace spojené s problematikou práce a obsahuje pojmy jako jsou Sandbox, Malware, Android. Ty jsou popsány z pohledu důležitého pro pochopení analýzy malwaru vyskytujícího se převážně na mobilním zařízení. Praktická část popisuje použitý hardware a software pro návrh prostředí a obsahuje názorné ukázky analýz škodlivým kódem kontaminovaných externích zařízení. Jedná se převážně o mobilních zařízení se systémem Android.
Analýza spolehlivosti forenzních nástrojů pro zkoumání malé digitální techniky
PĚSTOVÁ, Karolína
Tato bakalářská práce se zabývá forenzními nástroji pro zkoumání malé digitální techniky. V teoretické části jsou popsány zásady digitální forenzní analýzy a postupy pro zkoumání mobilních telefonů. V praktické části je provedena analýza vybraných mobilních telefonů nástroji pro zkoumání malé digitální techniky, jsou zde vyhodnoceny výsledky a navrženo řešení pro zajištění co nejvíce relevantních dat.
Návrh a implementace systému na agregaci nabídky nemovitostí v České republice
Drobník, Jakub ; Kučera, Jan (vedoucí práce) ; Chlapek, Dušan (oponent)
Diplomová práce se zabývá návrhem a implementací systému na agregaci nabídky nemovitostí v České republice. Cíl práce je vytvořit systém, který umožní agregovat data o realitních nabídkách, které jsou dostupné na internetu. Práce se skládá ze dvou základních částí, v první části práce je čtenář uveden do řešené problematiky, v druhé části je pak popsán návrh a implementace systému. V první části práce se autor zabývá způsoby, jak lze získávat data z webových stránek, zejména extrakcí dat pomocí automatických robotů. Druhá část práce se věnuje návrhu a implementaci systému pro agregaci dat. V této části jsou identifikovány požadavky na systém, které jsou vytvořeny spolu se zadavatelem systému. Na základě definovaných požadavků je vytvořen návrh systému, tento návrh je poté implementován. Výstupem práce je funkční prototyp systému, který agreguje data z realitních portálů do připravené databáze. Hlavním přínosem práce je ukázka možného přístupu, jakým lze agregovat data z určitého segmentu trhu do databáze.
Web page data figure finder
Janata, Dominik ; Vojtáš, Peter (vedoucí práce) ; Nečaský, Martin (oponent)
Tato práce se zabývá automatickým získávání sémantických dat z webových stránek. V rámci tohoto široké ho problému se zaměřuje na vyhledávání hodnot údajů v rámci stránky, která prezentuje nějakou entitu (například údaj cena u stránky notebooku). Hlavní myšlenka, kterou jsme chtěli ověřit, je, že můžeme automaticky najít údaj za využití jeho kontextu v rámci stránky: slov, která ho obklopují a slov uvnitř atributů HTML tagů, v nichž je obsažen, obzvlášt' atribut class. Náš výzkum odhalil, že soudobá řešení tohoto problému lze rozdělit do dvou typů: bud' musí autor webové stránky vepsat sémantické informace do kód stránky, nebo existují komerční nástroje, které mohou být naučeny na čtení konkrétního formátu stránky (se zaměřením a stránky z jedné webové domény). Prozkoumali jsme možnosti vývoje obecného řešení, které by pro danou entitu našlo hodnoty jeho údajů napříč webovými doménami za využití analýzy textu a strojového učení. Naivní algoritmus měl přesnost okolo 30%, učící algoritmy měly přesnost mezi 40 a 50 Klíčová slova: Webové stránky extrakce data 1

Národní úložiště šedé literatury : Nalezeno 13 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.