Název:
Extrakce dat z dynamických WWW stránek
Překlad názvu:
Data Extraction from Dynamic Web Pages
Autoři:
Puna, Petr ; Kunc, Michael (oponent) ; Burget, Radek (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce obsahuje stručný přehled technologií používaných pro prezentaci a získání dat na WWW a popisuje vybrané nástroje pro extrakci dat z webových stránek. Práce dále navrhuje nový nástroj pro získání stránek, generovaných na základě vyplnění webových formulářů, který umožňuje uživateli definovat data na takovýchto webových stránkách a dokáže takto definovaná data extrahovat a nabídnout ve formátu XML, použitelném pro další strojové zpracování.
This work contains a brief overview of technologies for representation and obtaining data on WWW and describes selected web data extraction tools. The work designs a new tool for obtaining pages generated by filling in web forms, which allows its user to define data on such web pages and which can extract those data and offer it in a XML format suitable for future machine processing.
Klíčová slova:
(X)HTML formuláře; Extrakce dat z WWW; HTML; HTML Parser; HTTP; Java; JavaScript; JSP; Lixto; WWW; XHTML; XML; (X)HTML forms; HTML; HTML Parser; HTTP; Java; JavaScript; JSP; Lixto; WWW; WWW data extraction; XHTML; XML
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53829