Original title:
Automatický přepis dodacích listů
Translated title:
Automatic Delivery Note Transcription
Authors:
Necpál, Dávid ; Kišš, Martin (referee) ; Hradiš, Michal (advisor) Document type: Bachelor's theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cieľom tejto bakalárskej práce je vytvorenie systému pre automatický prepis dodacích listov - dokumentov s pevnou štruktúrou. Riešenie práce je rozdelené do dvoch častí. Prvou časťou je detekcia čiar tabuliek a z nich následná detekcia a extrakcia buniek, ktoré obsahujú požadované dáta. Druhá časť je samotné rozpoznanie ručne písaných numerických znakov v obrázkoch vyrezaných buniek. Výsledný systém dokáže pri kvalitne naskenovaných dodacích listoch detegovať bunky s požadovanými údajmi s presnosťou 100 %, pričom úspešnosť samotného rozpoznávania numerických znakov je viac ako 95 % pre samostatné znaky a vyše 92 % pre celé sekvencie znakov. Prínosom tejto práce je systém pre automatický prepis dodacích listov, ktorý zabezpečuje rýchlejšie a jednoduchšie inak zdĺhavé "prepisovanie obsahu dodacích listov do informačného systému maloobchodu. Využitím tohoto systému ušetrí pracovník na každom dodacom liste viac než 50 % času.
This bachelor thesis aims to create a system for automatic transcription of delivery notes - documents with a fixed structure. The solution is divided into two parts. The first part is table lines detection and subsequent detection and extraction of cells, that contain required data. The second part is handwritten numeric characters recognition in the images of the cutted cells. The resulting system can detect cells with the required data with 100 % accuracy with well-scanned delivery notes, while the success rate of numerical character recognition is more than 95 % for individual characters and more than 92 % for entire character sequences. The benefit of this work is a system for automatic transcription of delivery notes, which provides faster and easier otherwise lengthy rewriting of the contents of delivery notes to the information system in the retail. By using this system, the employee saves more than 50 % of the time on each delivery note.
Keywords:
convolutional recurrent neural network; CRNN; delivery notes; document images; handwritten text; HTR; HWR; image based documents; image processing; neural network; NN; OCR; table processing; tables; text recognition; text transcription; CRNN; dodacie listy; dokumenty založené na obrázkoch; HTR; HWR; konvolučná rekurentná neurónová sieť; neurónová sieť; NN; obrázkové dokumenty; OCR; prepis textu; rozpoznávanie textu; ručne písaný text; spracovanie obrazu; spracovanie tabuliek; tabuľky
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/194946