Original title:
Detekce formulářových polí ve skenovaných dokumentech
Translated title:
Form Input Fileds Detection in Scanned Documents
Authors:
Moravec, Michal ; Šimon, Martin (referee) ; Beran, Vítězslav (advisor) Document type: Bachelor's theses
Year:
2016
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cílem práce bylo navrhnout algoritmus, který bude schopen z obrazu naskenované karty zdravotní pojišťovny vyseparovat pouze textová pole, která se budou dát dále použít v libovolném softwaru na převedení obrázku na text. Program by měl počítat se špatně naskenovanými a libovolně otočenými kartami. Celkový projekt je dělán jako zakázka pro firmu Medingo, která chce algoritmus zakomponovat do svého stávajícího systému. Co se týče výsledků, tak algoritmus dokáže detekovat a vyseparovat textová pole s velmi vysokou pravděpodobností.
Main goal of the work was to implement an algorithm, which is able to separate input fields from card of the health insurance company, which are then used in some optical character recognition (OCR) software to convert it to text. The program should also work on incorrectly scanned and arbitrarily rotated cards. The whole project was made as a contract for the Medingo company, which will be able to implement the algorithm in their existing system. As for the results, the program is able to detect and separate input fields from cards with very high probability.
Keywords:
Computer vision; Form input fields detection; Health insurance company card; Image processing; OpenCV; Python; Detekce formulářových polí; Karta zdravotní pojišťovny; OpenCV; Počítačové vidění; Python; Zpracování obrazu
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/62116