Název:
Rozpoznávání textu z obrazových dat
Překlad názvu:
Optical character recognition from image data
Autoři:
Marinič, Michal ; Uher, Václav (oponent) ; Burget, Radim (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá rozpoznáváním textu v obrazových datech s pomocí různých metod, které jsou využity ke klasifikaci neznámých objektů v obraze. V první teoretické části se práce zaměřuje na vysvětlení všech důležitých částí systému pro optické rozpoznávání znaků. Praktická část práce popisuje ukázku segmentace obrazu, realizaci umělé neuronové sítě pro rozpoznávání obrazových dat a vytvoření jednoduché trénovací množiny dat pro vyhodnocení této sítě. Rovněž popisuje proces trénování nástroje Tesseract a jeho implementaci v jednoduché aplikaci EasyTessOCR pro rozpoznávání znaků.
The thesis is concerned with optical character recognition from image data with different methods used for character classification. In the first theoretical part it focuses on explanation of all important parts of system for optical character recognition. The latter practical part of the thesis describes an example of image segmentation, the implementation of artificial neural networks for image recognition and create simple training set of data for the evaluation of the network. It also describes the process of training Tesseract tool and its implementation in a simple application EasyTessOCR for character recognition.
Klíčová slova:
klasifikace obrazových dat; optické rozpoznávaní; popis obrazu; počítačové vidění; segmentace obrazu; Tesseract; Umělá inteligence; umělé neuronové sítě; Artificial intelligence; artificial neural networks; classification of image data; computer vision; image description; image segmentation; optical recognition; Tesseract
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/32895