Název:
Integrace webových zdrojů dat do informačních systémů
Překlad názvu:
Integration of Web Data Sources to Information Systems
Autoři:
Hrubý, Erik ; Zaklová, Kristýna (oponent) ; Burget, Radek (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [slo][eng]
Cieľom tejto práce je vytvoriť knižnicu pre integráciu dát z webových zdrojov, typu HTML dokument, do informačných systémov. Knižnica je implementovaná v jazyku Java a programátor ju bude môcť použiť na rýchle a jednoduché mapovanie dát z dokumentu HTML na dátové štruktúry jazyku Java (objekty), ktoré bude môcť ďalej voľne využívať vo svojom informačnom systéme fungujúcom na platforme Java. Od programátora bude vyžadované aby dodal knižnici vlastnú implementáciu, v ktorej bude pomocou anotácií popísané akým spôsobom sa majú dané hodnoty vyhľadať pomocou selektoru CSS alebo výrazu XPath. Na stiahnutie webového dokumentu je použitá knižnica Jsoup.
The goal of this work is to create a library for the integration of data from web resources, such as HTML document, into information systems. The library is implemented in the Java language and the programmer will be able to use it for quick and easy mapping of data from the HTML document to Java data structures (objects), which he will be able to freely use in his information system operating on the Java platform. The programmer will be required to supply the library with his own implementation, in which the annotations will describe how the given values should be searched using the CSS selector or the XPath expression. The Jsoup library is used to download the web document.
Klíčová slova:
CSS; HTML; Information system; Java; Java annotations; Java Reflection API; Jsoup; Maven; Web scraping; XPath
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/247828