Název:
Pokročilý robot na procházení webu
Překlad názvu:
Advanced Web Crawler
Autoři:
Činčera, Jaroslav ; Jirák, Ota (oponent) ; Trchalík, Roman (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2010
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce se zabývá návrhem a implementací pokročilého robota na procházení webu. Tento robot je uživatelsky konfigurovatelný a slouží k pohybu po webových stránkách dle specifikovaných parametrů. Umí získávat a vyhodnocovat obsah, který je na nich umístěný. Jeho konfigurace probíhá pomocí vytváření projektů, které se skládají z různých typů kroků. Uživatel si tak může vytvořit jednoduché akce jako například stažení stránky, odeslání formuláře apod., nebo může vytvářet komplexnější a rozsáhlejší projekty.
This Master's thesis describes design and implementation of advanced web crawler. This crawler can be configured by user and is designed for web browsing according to specified parameters. Can acquire and evaluate content of web pages. Its configuration is performed by creating projects which are consisting of different types of steps. User can create simple action like downloading page, form submission, etc. or can create more complex and larger projects.
Klíčová slova:
HTML parser; HttpClient; Java; Java DB; procházení webu; Robot; Spring framework; HTML parser; HttpClient; Java; Java DB; Spring framework; web browsing; Web crawler
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54344