Název:
Active Learning pro zpracování archivních pramenů
Překlad názvu:
Active Learning for Processing of Archive Sources
Autoři:
Hříbek, David ; Zbořil, František (oponent) ; Rozman, Jaroslav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2021
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
V teto praci je reseno vytvoreni systemu, ktery umoznuje nahrani a anotaci skenu historickych dokumentu a nasledne aktivni doucovani modelu pro rozpoznavani znaku (OCR) na dostupnych anotacich (vyznacenych radcich a jejich prepisech). V praci je popsan proces, klasifikovany techniky a uveden existujici system pro rozpoznavani znaku. Predevsim je kladen duraz na metody strojoveho uceni. Dale jsou vysvetleny metody aktivniho uceni a navrhnut zpusob doucovani OCR modelu z anotovanych skenu. Zbytek prace se zabyva konkretnim navrhem, implementaci, dostupnymi datasety, vyhodnocenim uspesnosti rozpoznavani znaku vlastnorucne vytvoreneho OCR modelu a testovanim celeho systemu.
This work deals with the creation of a system that allows uploading and annotating scans of historical documents and subsequent active learning of models for character recognition (OCR) on available annotations (marked lines and their transcripts). The work describes the process, classifies the techniques and presents an existing system for character recognition. Above all, emphasis is placed on machine learning methods. Furthermore, the methods of active learning are explained and a method of active learning of available OCR models from annotated scans is proposed. The rest of the work deals with a system design, implementation, available datasets, evaluation of self-created OCR model and testing of the entire system.
Klíčová slova:
aktivni uceni; aktivni uceni pro rozpoznavani rucne psaneho textu; anotace skenu historickych dokumentu.; OCR; opticke rozpoznavani znaku; Strojove uceni; uceni s ucitelem; active learning; active learning in handwritten text recognition; annotation of historical document scans.; Machine learning; OCR; optical character recognition; supervised learning
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/200159