Název:
Automatická segmentace dokumentů
Překlad názvu:
Automatic Segmentation of Documents Stored as Images
Autoři:
Jakub, Dušan ; Španěl, Michal (oponent) ; Szőke, Igor (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2012
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Práce se zabývá rozčleněním dokumentů uložených jako obrázek do segmentů trojího druhu - pozadí, text a grafické objekty. Představuje různé způsoby řešení a podrobněji popisuje postup využívající Gaborovy filtry a neuronové sítě. Je diskutována volba vhodných parametrů filtrů i trénování sítě. Pro zpřesnění výsledků je použita metoda hledání souvislých komponent. Součástí práce je klasifikátor v jazyce C++ vytvořený za použití knihovny OpenCV. Navržený postup byl koncipován pro segmentaci dokumentů publikovaných ve vědeckých časopisech a uložených jako obrázek např. po skenování. Vedle výsledků segmentace odborných textů jsou v práci prezentovány také experimenty se segmentací dokumentů jiného charakteru, např. reklamního letáku a slidů prezentace. V závěru je demonstrován přínos navrženého postupu při zapojení do procesu optického rozpoznávání znaků.
This work deals with dividing the documents stored as images into three groups of segments - background, text and graphics. It introduces various solutions and the method using Gabor filters and artficial neural networks is described in detail. The selection of apropriate settings of the filters and training parameters of the network is discussed. Connected components searching is used for improving the results. A classifier writen in C++ and OpenCV library is part of the work. The designed procedure is applied for segmentation of scanned scientific papers, but also the results of segmentation of more complex documents (advertisements, presentation slides) are presented.
Klíčová slova:
detekce textu; Gaborovy filtry; OpenCV; Segmentace dokumentu; texturové příznaky; umělá neuronová síť; artificial neural network; Document segmentation; Gabor filters; OpenCV; text detection; texture analysis
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/55144