Název:
Active Learning pro zpracování archivních pramenů
Překlad názvu:
Active Learning for Work with Archive Materials
Autoři:
Štajerová, Alžbeta ; Hříbek, David (oponent) ; Rozman, Jaroslav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [slo][eng]
Cieľom tejto diplomovej práce je navrhnúť a implementovať systém na optické rozpoznávanie znakov v archívnych historických dokumentov. V prvej časti práce sa zaoberám štúdiom problematiky optického rozpoznávania znakov a procesom spracovania vstupných dát. Ďalej je opísaná téma aktívneho učenia a využívaných metód. Prehľadávam dostupné riešenia systémov pre rozpoznávanie ručne písaných historických dokumentov. Popisujem architektúry neurónových sietí využívaných na rozpoznávanie textu. Výsledkom práce návrh a následná implementácia systému pre rozpoznávanie textu, ktorý umožňuje anotáciu, doučovanie modelov a vyhľadávanie v záznamoch.
The aim of this Master's thesis is to design and implement an OCR system for archival historical documents containing handwriting text. The first part of the thesis deals with the study of optical character recognition, the process of OCR pipepline. Then the topic of active learning and its methods is described. The thesis reviews the available solutions for recognition of handwritten historical documents. I further describe the neural network architectures used for text detection. The thesis results in the design and subsequent implementation of system for text recognition of historical documents, enabling user annotation, full-text search in annotation records.
Klíčová slova:
active learning; handwriting text recognition; HTR; machine learning; OCR; optical character recognition
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/211943