Národní úložiště šedé literatury Nalezeno 1 záznamů.  Hledání trvalo 0.01 vteřin. 
Web page data figure finder
Janata, Dominik ; Vojtáš, Peter (vedoucí práce) ; Nečaský, Martin (oponent)
Tato práce se zabývá automatickým získávání sémantických dat z webových stránek. V rámci tohoto široké ho problému se zaměřuje na vyhledávání hodnot údajů v rámci stránky, která prezentuje nějakou entitu (například údaj cena u stránky notebooku). Hlavní myšlenka, kterou jsme chtěli ověřit, je, že můžeme automaticky najít údaj za využití jeho kontextu v rámci stránky: slov, která ho obklopují a slov uvnitř atributů HTML tagů, v nichž je obsažen, obzvlášt' atribut class. Náš výzkum odhalil, že soudobá řešení tohoto problému lze rozdělit do dvou typů: bud' musí autor webové stránky vepsat sémantické informace do kód stránky, nebo existují komerční nástroje, které mohou být naučeny na čtení konkrétního formátu stránky (se zaměřením a stránky z jedné webové domény). Prozkoumali jsme možnosti vývoje obecného řešení, které by pro danou entitu našlo hodnoty jeho údajů napříč webovými doménami za využití analýzy textu a strojového učení. Naivní algoritmus měl přesnost okolo 30%, učící algoritmy měly přesnost mezi 40 a 50 Klíčová slova: Webové stránky extrakce data 1

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.