Original title:
Automatické zpracování obsahu dokumentů PDF
Translated title:
Automated Processing of PDF Document Contents
Authors:
Gajdošík, Štefan ; Rychlý, Marek (referee) ; Burget, Radek (advisor) Document type: Bachelor's theses
Year:
2023
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[slo][eng]
Táto bakalárska práca sa zaoberá extrakciou dát generovaných kardiostimulátormi. Hlavným obsahom tejto práce je oboznámenie s formátom PDF dokumentov, nástrojov na prácu s PDF dokumentami, popis techník pre extrakciu dát , a implementácia aplikácie pre automatickú extrakciu dát v jazyku Python.
This bachelor thesis deals with the extraction of data generated by pacemakers. The main content of this thesis is to introduce the PDF document format, tools for working with PDF documents, description of techniques for data extraction, and implementation of an application for automatic data extraction in Python programming language.
Keywords:
data extraction; PDF; PyMuPDF; PyPDF2; Python; text string search
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/211122