Original title:
Analýza obsahu dokumentů pomocí grafových neuronových sítí
Translated title:
Graph Neural Networks for Document Analysis
Authors:
Patrik, Nikolas ; Španěl, Michal (referee) ; Hradiš, Michal (advisor) Document type: Master’s theses
Year:
2023
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
V tejto práci sa zameriaveme na analýzu dokumentov pomocou grafových neuronových sietí. Na začiatok si predstavíme ako tieto grafove konvolučné siete fungujú a predstavíme si koncept na základe ktorého sa dajú naimplementovať. Ďalej rozoberieme súčasné riešenia ktoré sa zaoberajú semantickým označovaním entít v skenovaných dokumentoch, čo je aj cieľom tejto práce. Následne si predstavíme navrh riešenie ktoré by malo riešiť túto problematiku spolu s ďaľším problémom na ktorý sa chceme zamariať v tejto práci a tým je výber textových entít z dokumentov pomocou aktívneho učenia. Postupne si predstavíme ako bolo toto riešenie implementované a aké nástroje sme pritom použili. Pred koncom si predstavíme dataset ktorý sme annotovali pre vyhodnotenie a tréning našeho riešenia. Na záver si predstavíme výsledky tejto práce, porovnáme vysledky s ostatnými prístupmi ktoré sa zamerievajú na podobný problém a ešte vyhodnotíme ako náš model zvládol extrakciu informácii pomocou aktívneho učenia.
In this thesis we use for graph neural networks for document analysis. In the beggining we introduce how these graph convolutional networks work and also we introduce concept which is used for their implementation. Next, we explain current solution that solves semantic labeling of text entities in scanned documents, what is also same as the goal of this thesis. In following chapter we present solution which should be used for the mentioned problem as well as another problem which is extraction of specific data using active learning. Gradually, we explain how this solution was implemented and what tools we have used. Before ending, we show our dataset, we have annotated and we meant to use for evaluation and training of our solution. In the end, we present results of this thesis, compare our model with others and also evaluate how our model was able to extract specified data using active learning.
Keywords:
aktívne učenie; analýza rozloženia dokumentov; docformer; fudge; funsd; grafové konvolučné siete; grafové neuronové sieťe; label studio; layoutlm; naf; neuronové siete; porozumenie tlačeným dokumentom; strojové učenie; active learning; docformer; document understanding; fudge; funsd; graph convolutional networks; graph neural networks; label studio; layout analysis; layoutlm; machine learning; naf; neural networks
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/211964