Název:
Rozpoznání textu s využitím neuronových sítí
Překlad názvu:
Text recognition with artificial neural networks
Autoři:
Peřinová, Barbora ; Hesko, Branislav (oponent) ; Mézl, Martin (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2018
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce se zabývá rozpoznáváním textu v obraze. V první části práce jsou popsány základní typy úloh rozpoznání textu a rozdělení algoritmu na jednotlivé fáze. Pro každou fázi jsou v následující části popsány nejpoužívanější metody. V rámci fáze rozpoznávání znaků je vysvětlena problematika umělých neuronových sítí a jejich využití v této fázi, konkrétně vícevrstvého perceptronu a konvolučních neuronových sítí. Druhá část se zabývá definicí požadavků na konkrétní aplikaci využitelnou jako zpětná vazba pro robotický systém. Je představena implementace algoritmu v .NET využívající konvoluční neuronové sítě a knihovnu CNTK pro hluboké učení. V neposlední řadě jsou diskutovány výsledky testování jednotlivých fází navrženého řešení a porovnány s volně dostupnou technikou Tesseract.
This master’s thesis deals with optical character recognition. The first part describes the basic types of optical character recognition tasks and divides algorithm into individual phases. For each phase the most commonly used methods are described in the next part. Within the character recognition phase the problematics of artificial neural networks and their usage in given phase is explained, specifically multilayer perceptron and convolutional neural networks. The second part deals with requirements definition for specific application to be used as feedback for robotic system. Convolution neural networks and CNTK library for deep learning using algorithm implementation in .NET is introduced. Finally, the test results of the individual phases of the proposed solution and the comparison with the open source Tesseract engine are discussed.
Klíčová slova:
CNTK; konvoluční neuronové sítě; OCR; segmentace textu; Tesseract; umělé neuronové sítě; vícevrstvý perceptron; artificial neural networks; CNTK; convolutional neural networks; multiplayer perceptron; OCR; Tesseract; text segmentation
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/81925