Název:
Získávání dat z HTML stránek
Překlad názvu:
Data Acquisition from HTML Sites
Autoři:
Komenda, Tomáš ; Šimek, Václav (oponent) ; Straka, Martin (vedoucí práce) Typ dokumentu: Bakalářské práce
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Práce popisuje možnosti tvorby aplikací pro získávání a pozdější sledování textových dat z HTML stránek. Zabývá se lexikální a syntaktickou analýzou jazyka HTML. Charakterizuje možnosti filtrace a uchovávání dat. Dále se práce zaměřuje na nástroje pro tvorbu dynamických WWW stránek, způsoby extrakce dat a periodické spouštění aplikací. V neposlední řadě popisuje vyspělé možnosti rozesílání elektronické pošty a SMS zpráv z prostředí webové aplikace. Závěrečná část je věnována popisu dvou aplikací demonstrujících uváděné principy.
This work describes scope of creating application for extraction and following data from HTML sites. This work engages in lexical analyze and parsing HTML. This work describes filtration of data from HTML sites. This work describes saving of data in database and XML documents, creating of dynamic HTMP pages, timer cron, GNU utility wget, sending of SMS, sending email and extraction of date from internet. Final chapters describe two web applications. These applications follow data from HTML sites and inform users about changes.
Klíčová slova:
cron; fopen; HTML; HTML filtr; JavaScript; lexikální analýza; Mail PEAR; Mail_mime PEAR; MySQL; PHP; SMS; syntaktická analýza; wget; cron; fopen; HTML; HTML filter; JavaScript; lexical analyze; Mail PEAR; Mail_mime PEAR; MySQL; parsing; PHP; scanning; SMS; wget
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/56345