Název:
Automatické zpracování obsahu dokumentů PDF
Překlad názvu:
Automated Processing of PDF Document Contents
Autoři:
Gajdošík, Štefan ; Rychlý, Marek (oponent) ; Burget, Radek (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2023
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [slo][eng]
Táto bakalárska práca sa zaoberá extrakciou dát generovaných kardiostimulátormi. Hlavným obsahom tejto práce je oboznámenie s formátom PDF dokumentov, nástrojov na prácu s PDF dokumentami, popis techník pre extrakciu dát , a implementácia aplikácie pre automatickú extrakciu dát v jazyku Python.
This bachelor thesis deals with the extraction of data generated by pacemakers. The main content of this thesis is to introduce the PDF document format, tools for working with PDF documents, description of techniques for data extraction, and implementation of an application for automatic data extraction in Python programming language.
Klíčová slova:
data extraction; PDF; PyMuPDF; PyPDF2; Python; text string search
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/211122