Original title:
Úloha OCR technologie a její využití v digitalizaci dokumentů
Translated title:
The Function of OCR Technology and its Usage in Document Processing
Authors:
Pouzar, Aleš ; Horný, Stanislav (advisor) ; Krsek, Libor (referee) Document type: Bachelor's theses
Year:
2009
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Optické rozpoznávání znaků se stalo v posledních letech díky boomu informačních technologií oblíbenou a cenově přívětivou technologií, která umožňuje efektivně sdílet velké množství informací obsažených v papírových dokumentech. Tato práce se zaměřuje na systémy určené pro zpracování dokumentů do elektronické editovatelné podoby. Podává přehled o základních metodách OCR technologie, měří výkonnost systémů a zkoumá přínos technik pro vylepšování obrazu pomocí srovnávacích testů na vzorku rozmanitých dokumentů.Owing to a boom of information technologies optical character recognition has recently become a popular and affordable technology, enabling an effective way of sharing a large amount of information stored in paper documents. This work deals with systems for document conversion of analog data into electronic and editable form. It outlines the main methodology of OCR technology, evaluates a performance of OCR applications and analyses the contribution of imaging technologies through the benchmark tests on the set of paper documents.
Keywords:
character recognition; document page segmentation; document processing; OCR; digitalizace dokumentů; OCR; rozpoznávání znaků
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/20285