Original title:
Rozpoznávání historických textů pomocí hlubokých neuronových sítí
Translated title:
Convolutional Networks for Historic Text Recognition
Authors:
Macurová, Nela ; Špaňhel, Jakub (referee) ; Hradiš, Michal (advisor) Document type: Bachelor's theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá rozpoznáváním historických textů pomocí hlubokých neuronových sítí, konkrétně rozpoznáváním jednotlivých slov v gotickém písmu v českém jazyce. Je zde vytvořen obecný přehled o konvolučních sítích a metodách rozpoznávání textu. Byl vytvořen dataset, který se skládá z reálných i generovaných dat. Síť byla trénovná na generovaných datech a testována na reálných obrázcích slov. Tato navrhovaná metoda klasifikace slov, nebyla moc úspěšná, kvůli rozdílným testovacím a~trénovacím datům.
This thesis deals with the recognition of historical texts using deep neural networks, specifically the recognition of individual words in Gothic script in Czech. Here is a general overview of convolutional networks and text recognition methods. A dataset was created with real and generated data. The network was trained on generated data and testing on real images of words. This proposed word classification method was not very successful due to different test and training data.
Keywords:
deep neural network; OCR; Word recognition; hluboká neuronová síť; OCR; Rozpoznávání slov
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/85147