Original title:
Active Learning pro zpracování archivních pramenů
Translated title:
Active Learning for Work with Archive Materials
Authors:
Štajerová, Alžbeta ; Hříbek, David (referee) ; Rozman, Jaroslav (advisor) Document type: Master’s theses
Year:
2023
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[slo][eng]
Cieľom tejto diplomovej práce je navrhnúť a implementovať systém na optické rozpoznávanie znakov v archívnych historických dokumentov. V prvej časti práce sa zaoberám štúdiom problematiky optického rozpoznávania znakov a procesom spracovania vstupných dát. Ďalej je opísaná téma aktívneho učenia a využívaných metód. Prehľadávam dostupné riešenia systémov pre rozpoznávanie ručne písaných historických dokumentov. Popisujem architektúry neurónových sietí využívaných na rozpoznávanie textu. Výsledkom práce návrh a následná implementácia systému pre rozpoznávanie textu, ktorý umožňuje anotáciu, doučovanie modelov a vyhľadávanie v záznamoch.
The aim of this Master's thesis is to design and implement an OCR system for archival historical documents containing handwriting text. The first part of the thesis deals with the study of optical character recognition, the process of OCR pipepline. Then the topic of active learning and its methods is described. The thesis reviews the available solutions for recognition of handwritten historical documents. I further describe the neural network architectures used for text detection. The thesis results in the design and subsequent implementation of system for text recognition of historical documents, enabling user annotation, full-text search in annotation records.
Keywords:
active learning; handwriting text recognition; HTR; machine learning; OCR; optical character recognition
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/211943