Original title:
Rozpoznávání textu z obrazových dat
Translated title:
Optical character recognition from image data
Authors:
Marinič, Michal ; Uher, Václav (referee) ; Burget, Radim (advisor) Document type: Master’s theses
Year:
2014
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato práce se zabývá rozpoznáváním textu v obrazových datech s pomocí různých metod, které jsou využity ke klasifikaci neznámých objektů v obraze. V první teoretické části se práce zaměřuje na vysvětlení všech důležitých částí systému pro optické rozpoznávání znaků. Praktická část práce popisuje ukázku segmentace obrazu, realizaci umělé neuronové sítě pro rozpoznávání obrazových dat a vytvoření jednoduché trénovací množiny dat pro vyhodnocení této sítě. Rovněž popisuje proces trénování nástroje Tesseract a jeho implementaci v jednoduché aplikaci EasyTessOCR pro rozpoznávání znaků.
The thesis is concerned with optical character recognition from image data with different methods used for character classification. In the first theoretical part it focuses on explanation of all important parts of system for optical character recognition. The latter practical part of the thesis describes an example of image segmentation, the implementation of artificial neural networks for image recognition and create simple training set of data for the evaluation of the network. It also describes the process of training Tesseract tool and its implementation in a simple application EasyTessOCR for character recognition.
Keywords:
Artificial intelligence; artificial neural networks; classification of image data; computer vision; image description; image segmentation; optical recognition; Tesseract; klasifikace obrazových dat; optické rozpoznávaní; popis obrazu; počítačové vidění; segmentace obrazu; Tesseract; Umělá inteligence; umělé neuronové sítě
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/32895