Název:
Automatické rozpoznávání matematických výrazů pomocí neuronových sítí
Překlad názvu:
Neural Networks for Automatic Equation Recognition
Autoři:
Halva, Vladislav ; Zemčík, Pavel (oponent) ; Hradiš, Michal (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2022
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá problematikou automatického rozpoznávání matematických výrazů pomocí neuronových sítí. Obsahuje přehled existujících přístupů pro tuto úlohu a zaměřuje se zejména na rozpoznávání ručně psaných matematických výrazů a využití grafových neuronových sítí. Jádrem navrženého systému pro rozpoznávání ručně psaných matematických výrazů je model neuronové sítě typu kodér-dekodér využívající grafové neuronové sítě pro přirozenou práci s hierarchickou strukturou matematických výrazů. Úspěšnost systému je vyhodnocena na datové sadě CROHME, která byla publikována v rámci stejnojmenné soutěže v rozpoznávání matematických výrazu. Součástí práce jsou také experimenty, které blíže studují navržený model. Navržené řešení dosahuje úspěšnosti 13.34% ExpRate, tedy přesného rozpoznání matematického výrazu na testovacích datech sady CROHME 2019. Přínosem této práce je zejména návrh metody použití grafových neuronových sítí pro rozpoznávání matematických výrazu z obrázků a obecně jejich zpracování v grafové doméně.
This thesis deals with automatic mathematical expressions recognition using deep neural networks. It contains an overview of existing approaches and focuses mainly on handwritten mathematical expressions and the use of graph neural networks. The core of the proposed system for handwritten mathematical expressions recognition is an encoder-decoder neural network model using graph neural networks to exploit the hierarchical structure of mathematical expressions. The designed system is evaluated on the CROHME dataset, which was published within the competition of the same name on mathematical expression recognition. The work also includes description of experiments performed with the designed model. The proposed solution achieves an exact expression recognition rate of 13.34% on the CROHME 2019 test dataset. The contribution of this work is mainly a method of using graph neural networks for mathematical expression recognition from images and their processing in the graph domain.
Klíčová slova:
Grafové neuronové sítě; OCR; rozpoznávání matematických výrazů; equation recognition; Graph neural networks; mathematical expression recognition; OCR
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/207463