Original title:
Automatizované získávání informací z WWW
Translated title:
Automated Retrieval of Information from the WWW
Authors:
Žabka, Andrej ; Bartík, Vladimír (referee) ; Burget, Radek (advisor) Document type: Bachelor's theses
Year:
2022
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Táto bakalárska práca sa zaoberá extrakciou dát z webu (web scraping) a následným zobrazovaním týchto dát. Vytvorený nástroj umožňuje užívateľovi rýchlo a jednoducho vytvoriť celistvý projekt, ktorý dokáže získavať dáta z viacerých webových stránok a zobraziť ich v prívetivej podobe. Taktiež je súčasťou práce aj niekoľko príkladov, ktoré slúžia ako ukážka možností tohto nástroja a boli použité pri jeho testovaní.
This bachelor thesis deals with data extraction from web (web scraping) and displaying this data. The created tool allows it's user to quickly and simply create a project, that can extract data from multiple web sites and display them in a user friendly fashion. The thesis also contains examples, that showcase the abilities of this tool and were used in it's testing.
Keywords:
CSS; data presentation; DOM; HTML; JavaScript; Puppeteer; scraping; Web; CSS; DOM; HTML; JavaScript; Puppeteer; scraping; Web; zobrazovanie dát
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/207313