Original title:
OCR cíleně znehodnocených textů
Translated title:
OCR of image based web form protection
Authors:
Peluch, Tibor ; Hrabec, Jakub (referee) ; Honzík, Petr (advisor) Document type: Master’s theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Diplomová práce pojednává o programování grafického uživatelského rozhraní pro operační systém Windows. V krátkosti jsou shrnuty hlavní rysy aplikačního systému Microsoft Foundation Class. V druhá část se zabývá realizací konkrétní aplikace s grafickým uživatelským rozhraním, která umožňuje pomocí tvorby schématu zpracovávat data. Třetí část pojednává o možnostech implementace bloků do dynamických knihoven a je nastíněna možnost využití zpracování dat tohoto programu jako externího modulu a možnost realtime zpracování dat, jako je například obraz a zvuk. Ověření funkčnosti aplikace je v poslední části. Aplikace je konkrétně testována na rozpoznání znehodnoceného textu pro ochranu elektronických formulářů serveru www.centrum.cz. Jsou navrženy bloky, které realizují načítání obrázku přímo z internetu, preprocessing, segmentaci, extrakci příznaků, vyhodnocení neuronovou sítí a bloky, jenž umožňují načítat a ukládat zpracovaná data na disk.
The thesis deals with programming of application in operating system Windows. Main features of application system Microsoft Foundation Class are resumed in brief here. In following part there is idea about implementing an application with graphic user interface that makes, using schema, work with data, possible. The third part deals with implementation of blocks into dynamic linked libraries and there is outlined a possibility to use data of this programme as an external module and a possibility of realtime data processing e.g. picture and sound. The verification of a good functionality of this application is in the last part. The application is really tested in diagnosing of devaluated texts for protecting web forms www.centrum.cz. There were designed blocks making picture read possible just from internet, preprocessing, segmentation, feature extraction, evaluationg in neural network and blocks that make possible to read and save processed data into the disc.
Keywords:
Component Object Model; Dynamic link library; Microsoft Foundation Class Library; OCR; Signal Processing; User Interface; WinApi; Component Object Model; Dynamicka knihovna; Microsoft Foundation Class; OCR; Uživatelsné rozhraní; Winapi; Zpracování signálu
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/11485