Original title:
Aktualizace dat z webových stránek
Translated title:
Data Updates from Web Sources
Authors:
Valušek, Jan ; Šátek, Václav (referee) ; Rozman, Jaroslav (advisor) Document type: Bachelor's theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá analýzou webových stránek archivů v České republice a jejich technologií s cílem vytvoření autonomního programu pro hromadné stahování detailů o archivních materiálech a jejich skenů. Výsledná aplikace je vytvořena v programovacím jazyce Python s použitím knihovny Scrapy. Výstupem programu jsou soubory s daty archiválií uložených v jednotlivých archivech.
This thesis deals with the analysis of archive websites in the Czech Republic and their technologies to create an autonomous program for bulk downloading of details about archival materials, and their scans. The resulting application is developed in the Python programming language using the Scrapy library. The output of the program is files with data of archival materials stored in individual archives.
Keywords:
archives; data updates; Python; Scrapy; web scraping; aktualizace dat; archivy; extrahování dat z webů; Python; Scrapy
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/212702