Original title:
Získávání dat z HTML stránek
Translated title:
Data Acquisition from HTML Sites
Authors:
Komenda, Tomáš ; Šimek, Václav (referee) ; Straka, Martin (advisor) Document type: Bachelor's theses
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Práce popisuje možnosti tvorby aplikací pro získávání a pozdější sledování textových dat z HTML stránek. Zabývá se lexikální a syntaktickou analýzou jazyka HTML. Charakterizuje možnosti filtrace a uchovávání dat. Dále se práce zaměřuje na nástroje pro tvorbu dynamických WWW stránek, způsoby extrakce dat a periodické spouštění aplikací. V neposlední řadě popisuje vyspělé možnosti rozesílání elektronické pošty a SMS zpráv z prostředí webové aplikace. Závěrečná část je věnována popisu dvou aplikací demonstrujících uváděné principy.
This work describes scope of creating application for extraction and following data from HTML sites. This work engages in lexical analyze and parsing HTML. This work describes filtration of data from HTML sites. This work describes saving of data in database and XML documents, creating of dynamic HTMP pages, timer cron, GNU utility wget, sending of SMS, sending email and extraction of date from internet. Final chapters describe two web applications. These applications follow data from HTML sites and inform users about changes.
Keywords:
cron; fopen; HTML; HTML filter; JavaScript; lexical analyze; Mail PEAR; Mail_mime PEAR; MySQL; parsing; PHP; scanning; SMS; wget; cron; fopen; HTML; HTML filtr; JavaScript; lexikální analýza; Mail PEAR; Mail_mime PEAR; MySQL; PHP; SMS; syntaktická analýza; wget
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/56345