Název:
Zlepšování kvality digitalizovaných textových dokumentů
Překlad názvu:
Document Quality Enhancement
Autoři:
Trčka, Jan ; Zemčík, Pavel (oponent) ; Juránek, Roman (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Cílem této práce je zvýšení úspěšnosti při rozpoznávání textových dokumentů. Práce je zaměřena především na texty nacházející se na degradovaném materiálu jako jsou noviny nebo staré knihy. K řešení tohoto problému jsou analyzovány současné metody a problémy spojené s rozpoznáváním textu. Na základě získaných poznatků je zvolena implementovaná metoda založena na GAN sítích. Na těchto sítích jsou provedeny experimenty pro nalezení jejich vhodné velikosti a parametrů učení. Následně je provedeno testování pro porovnání různých metod učení a srovnání jejich výsledků. Trénování a testování je provedeno na umělém datovém setu, u kterého se zvýší přesnost přepisu z 65.61 % pro nezpracované řádky textu na 93.23 % u řádků zpracovaných sítí GAN.
The aim of this work is to increase the accuracy of the transcription of text documents. This work is mainly focused on texts printed on degraded materials such as newspapers or old books. To solve this problem, the current method and problems associated with text recognition are analyzed. Based on the acquired knowledge, the implemented method based on GAN network architecture is chosen. Experiments are a performer on these networks in order to find their appropriate size and their learning parameters. Subsequently, testing is performed to compare different learning methods and compare their results. Both training and testing is a performer on an artificial data set. Using implemented trained networks increases the transcription accuracy from 65.61 % for the raw damaged text lines to 93.23 % for lines processed by this network.
Klíčová slova:
GAN sítě; hluboké neuronové sítě; konvoluční neuronové sítě; Neuronové sítě; TensorFlow; zlepšování kvality obrazu; convolution neural networks; deep neural networks; GAN networks; image quality enhancement; Neural networks; TensorFlow
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/192507