Original title:
OCR ručně kreslených chemických strukturních vzorců
Translated title:
OCR of handwritten structural chemical formulae
Authors:
Zajíc, Vítězslav ; Pangrác, Ondřej (referee) ; Bálek, Martin (advisor) Document type: Bachelor's theses
Year:
2009
Language:
cze Abstract:
[cze][eng] Práce se zabývá metodami a algoritmy použitými ve vypracovaném programu na rozpoznávání ručně kreslených chemických strukturních vzorců. Popisuje předzpracování vstupního obrazu pomocí Gaussova filtru, rozpoznávání čar v obraze pomocí hledání sousedních tmavých pixelů. Ukazuje nevhodnost Houghovy transformace pro rozpoznávání čar. Věnuje se hledání co nejpřesnější aproximace nalezených čar pomocí co nejméně úseček. Zavádí pohled na strukturní vzorec jako na graf a popisuje algoritmus vytváření vrcholů a hran grafu z rozpoznaných úseček za použití jednoduchých pravidel, které zkoumají délku úseček a jejich okolí. Obsahuje kapitolu věnující se rozpoznávání písmen heteroatomů a funkčních skupin pomocí porovnávání vůči předloze. Součástí práce je i samotný program.This work is concerned with methods and algorithms used in developed program for recognition of the hand-drawn chemical structural formulae. It describes the preprocessing of the input image by using Gauss filter, the recognition of lines in the image by searching adjacent dark pixels. It shows inapplicability of Hough transform for line recognition. It covers searching for the most accurate approximation of the found lines using as few segments as possible. It shows similarity of structural formulae to graphs and describes algorithm of creating vertices and edges from recognized segments by using simple rules, that examine the length and neighbourhood of segments. It contains a chapter about recognition of the letters of heteroatoms and functional groups by comparing to pattern. In the end it shows errors in recognition on inappropriate input image. The program itself is also included in the work.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/26776