Název:
OCR ručně kreslených chemických strukturních vzorců
Překlad názvu:
OCR of handwritten structural chemical formulae
Autoři:
Zajíc, Vítězslav ; Pangrác, Ondřej (oponent) ; Bálek, Martin (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2009
Jazyk:
cze
Abstrakt: [cze][eng] Práce se zabývá metodami a algoritmy použitými ve vypracovaném programu na rozpoznávání ručně kreslených chemických strukturních vzorců. Popisuje předzpracování vstupního obrazu pomocí Gaussova filtru, rozpoznávání čar v obraze pomocí hledání sousedních tmavých pixelů. Ukazuje nevhodnost Houghovy transformace pro rozpoznávání čar. Věnuje se hledání co nejpřesnější aproximace nalezených čar pomocí co nejméně úseček. Zavádí pohled na strukturní vzorec jako na graf a popisuje algoritmus vytváření vrcholů a hran grafu z rozpoznaných úseček za použití jednoduchých pravidel, které zkoumají délku úseček a jejich okolí. Obsahuje kapitolu věnující se rozpoznávání písmen heteroatomů a funkčních skupin pomocí porovnávání vůči předloze. Součástí práce je i samotný program.This work is concerned with methods and algorithms used in developed program for recognition of the hand-drawn chemical structural formulae. It describes the preprocessing of the input image by using Gauss filter, the recognition of lines in the image by searching adjacent dark pixels. It shows inapplicability of Hough transform for line recognition. It covers searching for the most accurate approximation of the found lines using as few segments as possible. It shows similarity of structural formulae to graphs and describes algorithm of creating vertices and edges from recognized segments by using simple rules, that examine the length and neighbourhood of segments. It contains a chapter about recognition of the letters of heteroatoms and functional groups by comparing to pattern. In the end it shows errors in recognition on inappropriate input image. The program itself is also included in the work.