Original title:
Využití hlubokého učení pro rozpoznání textu v obrazu grafického uživatelského rozhraní
Translated title:
Deep Learning for OCR in GUI
Authors:
Hamerník, Pavel ; Špaňhel, Jakub (referee) ; Lysek, Tomáš (advisor) Document type: Master’s theses
Year:
2019
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Optické rozpoznání znaků (OCR) je již mnoho let oblastí zájmu. Je definován jako proces digitalizace obrazu dokumentu do sekvence znaků. Navzdory desetiletím intenzivních výzkumů jsou systémy OCR, které jsou srovnatelné s lidským zrakem, stále otevřenou výzvou. V této práci je vytvořen návrh takového systému, je implementován, který je schopen detekovat text v grafických uživatelských rozhraních.
Optical character recognition (OCR) has been a topic of interest for many years. It is defined as the process of digitizing a document image into a sequence of characters. Despite decades of intense research, OCR systems with capabilities to that of human still remains an open challenge. In this work there is presented a design and implementation of such system, which is capable of detecting texts in graphical user interfaces.
Keywords:
CNN; convolutional neural network; deep learning; LSTM; neural network; OCR; recurent neural network; RNN; text recognition; CNN; hluboké učení neuronových sítí; konvoluční neuronové sítě; LSTM; neuronové sítě; OCR; rekurentní neuronové sítě; RNN; rozpoznání textu
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/180625