Národní úložiště šedé literatury Nalezeno 11 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Deep Neural Networks for Historical Document Classification
Pinkeová, Bettina ; Kohút, Jan (oponent) ; Kišš, Martin (vedoucí práce)
The aim of this work is to create a system for historical documents classification . The task is specifically about classification of documents according to the place of origin. Several systems are proposed for solving this problem, in the work. The first designed and implemented system is based on a convolutional neural network with a self-attention mechanism instead of an average pooling layer. Another system is based on the BEiT model, which is built on a visual transformer. The BEiT model was pretrained on the task of masked image modelling and subsequently trained on the given classification task. The system based on convolutional neural network achieved an accuracy of 81.6% and the system based on masked image modelling achieved an accuracy of 82.9%. The systems implemented in this work, surpassed the systems participating in the ICDAR 2021 conference in terms of success.
Fast Discriminative Neural Networks for Text Correction
Chupáč, Sebastián ; Beneš, Karel (oponent) ; Kohút, Jan (vedoucí práce)
The goal of this work is to propose and implement a fast discriminating neural network with only one forward pass, to detect and correct mistakes in text data. Multiple architectures were implemented for detection and correction separately. These models make use of convolution layers, LSTM layers and CTC loss function. Models were trained and evaluated on datasets made from three different text corpora. Experiments and evaluation present the ability of these models to detect and correct mistakes on character level with only one, fast forward pass.
Automatické rozpoznávání hudebního zápisu pomocí neuronových sítí
Vlach, Vojtěch ; Kohút, Jan (oponent) ; Hradiš, Michal (vedoucí práce)
Tato práce řeší problém rozpoznání hudebních zápisů z obrázku do textové podoby pomocí umělé inteligence a neuronových sítí. Zaměřuje se konkrétně na tištěnou polyfonní hudbu (více not a hlasů naráz). Cílem práce je vytvořit model schopný rozpoznat složité zápisy a jeho úspěšnost porovnat s předchozí literaturou a známými modely. Zvolený problém jsem vyřešil díky využití architektury Vision-transformer, kde jsem testoval několik variant sítě za účelem nalezení té nejvýkonější, a vytvoření nového datasetu s polyfonní hudbou. Práce představuje proces vytvoření datasetu pomocí syntetizování obrázků z formátu MusicXML programem MuseScore. Nejúspěšnější varianta architektury Vision-Transformer dosahuje minimální chybovosti pouze 7,86 %, což je velmi slibné pro další vývoj a využití. Hlavním zjištěním je, že architektura má potenciál dominovat na tomto poli stejně jako na jiných polích výzkumu a pro konkrétní úlohu rozpoznání polyfonních hudebních zápisů existuje funkční řešení, což bylo doteď předmětem debaty.
Transformer Neural Networks for Handwritten Text Recognition
Vešelíny, Peter ; Beneš, Karel (oponent) ; Kohút, Jan (vedoucí práce)
This Master's thesis aims to design a system using the transformer neural network and perform experiments with this proposed model in the task of handwriting text recognition. In this thesis, a multilingual dataset with predominate Czech texts is used. The experiments examine the influence of basic hyperparameters, such as network size, convolutional encoder type, and the use of different text tokenizers. In this work, I also use text corpora of the Czech language which is used to train the network decoder. Furthermore, I experiment with the usage of additional textual information during the decoding process. This information comes from the previous line of the transcribed image. The transformer achieves a character recognition error rate of 3.41 % on the test data set which is 0.16 % worse performance than the recurrent neural network achieves. To compare this model with other transformer-based models from available articles, the network was trained on the IAM dataset, where it achieved an error of 2.48 % and therefore outperformed other models in handwriting text recognition task.
Hodnocení neurčitosti predikcí neuronových sítí v úlohách klasifikace, detekce a segmentace
Vlasák, Jiří ; Kohút, Jan (oponent) ; Herout, Adam (vedoucí práce)
Tato práce se zaměřuje na porovnání tří široce používaných metod pro zlepšení odhadů neurčitosti: hlubokých ansámlů, monte carlo dropout a temperature scaling. Tyto metody jsou aplikovány na šest modelů pro počítačové vidění, mezi nimiž jsou předtrénované modely i modely trénované od nuly. Tyto modely jsou hodnoceny na datasetech počítačového vidění pro úlohy klasifikace, sémantické segmentace a detekce objektů, při použití široké škály metrik. Modely jsou rovněž evaluovány na transformovaných datasetech, kvůli jejich ohodnocení na datech mimo trénovací distribuci.       Tyto modifikované modely dosahují slibných výsledků. Ansámbly překonávají ostatní modely až o 70 % v přesnosti a o 0.2 v IOU na transformovaném segmentačním datasetu MedSeg COVID-19 a zároveň překonávají ostatní modely na datasetech CIFAR-100 a FMNIST.
Rozpoznání hranic jízdního pruhu v záběrech palubní kamery
Fridrich, David ; Kohút, Jan (oponent) ; Herout, Adam (vedoucí práce)
Tato práce se zabývá detekcí jizdních pruhů. Konkrétně vlastního generátoru syntetických dat, jeho využití při trénování neuronových sítí, testování výsledků na konvoluční neuronové síti (CNN) modelu UNet a možnosti rozšíření tohoto modelu na SALMNet model (Structure-Aware Lane Marking Detection Network) pomocí přidání SGCA modulu (Semantic-Guided Channel Attention) a pyramidového modulu PDC (Pyramid deformable convolution). Výsledky trénování syntetických dat ukazují že síť umí rozpoznávat silniční pruhy velmi dobře, s přesností kolem 95\,\% (na jednodušších obrázcích dosahuje i 99\,\%). Nad reálným datasetem se výsledky lišily pro jednotlivé datasety, TuSimple dosahoval větší přesnosti kvůli menší obtížnosti obrázků, a sice kolem 62\,\%. Datová sada CuLane dosahovala pouze kolem 37\,\% velmi nestabilně.
Rozpoznávání textu s využitím informace o pisateli
Trněný, Matěj ; Kišš, Martin (oponent) ; Kohút, Jan (vedoucí práce)
Cílem práce je vytvořit neuronovou síť pro rozpoznání textu s využitím informace o pisateli. Pro tento účel byla vybrána metoda adversarial learning. Účinost teto metody byla ověřena experimentálně. Vytvořená síť by měla díky použité metodě adversarial learning dosahovat lepších výsledků na datech, která nejsou podobná datům obsaženým v trénovací sadě oproti stávající metodě single-task learning. Výsledná síť dosažená pomocí uvedené metody byla porovnána se současnou metodou rozpoznávání textu metodou single-task learning a multi-task learning. Síť implementující single-task learning dosahuje průměrné chyby při rozpoznávání znaku 7, 995%, síť implementující multi-task learning dosahuje průměrné chyby 7, 565% v porovnání se sítí využívající adversarial learning, která dosahuje úspěšnosti 7, 573%. V porovnání single-task learning dosahuje multi-task learning 5, 38% zlepšení a adversarial learning 5, 28%.
Adaptace neuronových sítí na cílového pisatele
Sekula, Jakub ; Hradiš, Michal (oponent) ; Kohút, Jan (vedoucí práce)
Tato bakalářská práce se zabývá adaptací neuronových sítí na pisatele s cílem zlepšení rozpoznání ručně psaného písma tohoto pisatele. Metoda, kterou používám, je rychlá, vyžaduje malou trénovací množinu dat a využívá regularizaci, která se snaží udržet distribuci regularizovaných vah adaptační sítě podobnou té z předadaptační sítě. Tuto metodu jsem testoval nad datasetem tištěných textů IMPACT a datasetem ručně psaných textů. Nad datasetem ručně psaných textů se mi na dvou denících podařilo snížit chybovost z počátečních 10,82 % a 1,82 % na chybovost 8,48 % a 0,77 % v rámci malého počtu adaptačních iterací a připoužití malého množství trénovacích řádků. Na datasetu IMPACT se mi podařilo snížit chybovost nad polské historické písmo z počáteční chybovosti 32,88 % na 5,30 %.
Generating Animations with Neural Networks
Dráber, Filip ; Kohút, Jan (oponent) ; Hradiš, Michal (vedoucí práce)
While motion capture serves as a mean for animators to circumvent some of the most arduous aspects of creating realistic animation, there is still a lot of work hiding in annotating and structuring the data. I solve this problem by designing a neural network which can be trained on a motion capture data file to reproduce human locomotion visualized in an application which allows for the user to control the character's direction. I also subject various methods of training an autoregressive model to experiments and find which method trades training times for performance the best. Additionally, I remark how the addition of certain control features to frame-by-frame generations impacts the use of recurrent neural networks for this task.
Aktivní učení pro rozpoznávání textu
Kohút, Jan ; Kolář, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce je navrhnout metody aktivního učení a provést experimenty nad datovou sadou historických dokumentů. Pro experimenty využívám rozsáhlý a rozmanitý dataset IMPACT o více než jednom milionu řádků. Pomocí neuronových sítí provádím kontrolu vhodnosti řádků, tzn. čitelnosti a správnosti přepisů. Nejprve srovnávám architektury neuronových sítí, a to jak sítě čistě konvoluční, tak sítě obsahující obousměrnou rekurentní vrstvu LSTM. Dále se zabývám přístupy k učení neuronových sítí pomocí aktivního učení a samotnými metodami aktivního učení. Aktivní učení využívám zejména pro adaptaci neuronových sítí na jiné textové dokumenty, než na kterých byla původní síť učena. Aktivní učení tedy slouží k výběru vhodných adaptačních dat. Čistě konvoluční neuronové sítě dosahují úspěšnosti 98.6 %, rekurentní sítě pak 99.5 %. Chyba při adaptaci s využitím aktivního učení je o 26 % nižší než chyba při náhodném výběru dat.

Národní úložiště šedé literatury : Nalezeno 11 záznamů.   1 - 10další  přejít na záznam:
Viz též: podobná jména autorů
1 Kohút, Jakub
2 Kohút, Jiří
2 Kohút, Josef
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.