Název:
Analýza obsahu dokumentů pomocí grafových neuronových sítí
Překlad názvu:
Graph Neural Networks for Document Analysis
Autoři:
Patrik, Nikolas ; Španěl, Michal (oponent) ; Hradiš, Michal (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
V tejto práci sa zameriaveme na analýzu dokumentov pomocou grafových neuronových sietí. Na začiatok si predstavíme ako tieto grafove konvolučné siete fungujú a predstavíme si koncept na základe ktorého sa dajú naimplementovať. Ďalej rozoberieme súčasné riešenia ktoré sa zaoberajú semantickým označovaním entít v skenovaných dokumentoch, čo je aj cieľom tejto práce. Následne si predstavíme navrh riešenie ktoré by malo riešiť túto problematiku spolu s ďaľším problémom na ktorý sa chceme zamariať v tejto práci a tým je výber textových entít z dokumentov pomocou aktívneho učenia. Postupne si predstavíme ako bolo toto riešenie implementované a aké nástroje sme pritom použili. Pred koncom si predstavíme dataset ktorý sme annotovali pre vyhodnotenie a tréning našeho riešenia. Na záver si predstavíme výsledky tejto práce, porovnáme vysledky s ostatnými prístupmi ktoré sa zamerievajú na podobný problém a ešte vyhodnotíme ako náš model zvládol extrakciu informácii pomocou aktívneho učenia.
In this thesis we use for graph neural networks for document analysis. In the beggining we introduce how these graph convolutional networks work and also we introduce concept which is used for their implementation. Next, we explain current solution that solves semantic labeling of text entities in scanned documents, what is also same as the goal of this thesis. In following chapter we present solution which should be used for the mentioned problem as well as another problem which is extraction of specific data using active learning. Gradually, we explain how this solution was implemented and what tools we have used. Before ending, we show our dataset, we have annotated and we meant to use for evaluation and training of our solution. In the end, we present results of this thesis, compare our model with others and also evaluate how our model was able to extract specified data using active learning.
Klíčová slova:
active learning; docformer; document understanding; fudge; funsd; graph convolutional networks; graph neural networks; label studio; layout analysis; layoutlm; machine learning; naf; neural networks; aktívne učenie; analýza rozloženia dokumentov; docformer; fudge; funsd; grafové konvolučné siete; grafové neuronové sieťe; label studio; layoutlm; naf; neuronové siete; porozumenie tlačeným dokumentom; strojové učenie
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/211964