Národní úložiště šedé literatury Nalezeno 22 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.03 vteřin. 
Detekce typu a bodového ohodnocení kartiček ve hře Hobiti
Hlinský, Martin ; Kohút, Jan (oponent) ; Vaško, Marek (vedoucí práce)
Cílem této práce je vytvořit detektor karet, který s využitím umělé generace datové sady dokáže natrénovat model, jenž umožňuje zjistit bodové ohodnocení karty a její typ. K samotnému trénování je využit model YOLOv8. Prvním krokem je nafocení karet, které se následně zpracovávají tak, aby neobsahovaly pozadí a byly zarovnány. Tyto předzpracované fotky karet se v kombinaci s obrázky z jiných datových sad spojí v generátoru, který karty náhodně rozmisťuje, otáčí a simuluje fotky reálných případů. Výstupem tohoto generátoru je v případě hry Hobiti ideálně zhruba 50 000 obrázků, avšak v rámci experimentů jsou porovnávány různé velikosti datasetu a předtrénovaných váh. Poslední generace natrénovaných detektorů byla validována na reálné datové sadě za účelem nezaujatého testování a nejpřesnější model trénovaný na čistě syntetických datasetech dosáhl přesnosti až 81,5 % podle metriky 50. Na finálním detektoru je pak možné implementovat například počítadlo bodů, jehož prototyp je v této práci rovněž popsán.
Automatizovaná extrakce strukturovaných dat dokumentů
Křivánek, Jakub ; Vaško, Marek (oponent) ; Kohút, Jan (vedoucí práce)
Tato bakalářská práce řeší problém získávání strukturovaných dat ze skenů dokumentů českých knihoven. Cílem práce je usnadnit časově náročný manuální proces knihovníkům. Zaměřil jsem se vytvoření datových sad z dokumentů českých knihoven a na detekci metadat na těchto datasetech. Datové sady jsem vytvořil pro knihy a druhou pro periodika. Detekce byla realizována způsoben klasifikace řádků přečtených z dokumentů. Pro to jsou použita plně propojená neuronoví síť a síť využívající Transformer Encoder. Druhý způsob detekce metadat je založen na detekci objektů na skenech dokumentů pomocí modelu YOLOv8. Detekce pomocí plně propojené neuronové sítě dosahuje F1 skóre 0,83 na datasetu knih a 0,78 na datasetu periodik. F1 skóre sítě s Transformer Encoder dosahuje hodnot 0,84 na datasetu knih a 0,59 na datasetu periodik. Model YOLO dosahuje F1 skóre 0,86 (confidece na 0,549) na datasetu knih a 0,7 (confidence na 0,336) na datasetu periodik.
Webová aplikace pro efektivní anotaci atributů objektů ve videu
Pernický, Michal ; Kohút, Jan (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce je vytvořit webovou aplikaci pro anotaci atributů objektů ve videu, která kombinuje efektivní uživatelské rozhraní s asistenčním klasifikátorem poskytujícím predikce. Na rozdíl od aktuálně dostupných nástrojů se řešení zaměřuje přímo na objekty bez jejich zařazení do původních videí. Důležitá je možnost filtrace objektů podle jejich atributů a hromadné potvrzení či zamítnutí predikované hodnoty atributu. Testováním na uživatelích bylo zjištěno snížení času stráveného prací až o polovinu. Ukazuje to, že další práce s tímto principem anotace má význam.
Hodnocení neurčitosti predikcí neuronových sítí v úlohách klasifikace, detekce a segmentace
Vlasák, Jiří ; Kohút, Jan (oponent) ; Herout, Adam (vedoucí práce)
Tato práce se zaměřuje na porovnání tří široce používaných metod pro zlepšení odhadů neurčitosti: hlubokých ansámlů, monte carlo dropout a temperature scaling. Tyto metody jsou aplikovány na šest modelů pro počítačové vidění, mezi nimiž jsou předtrénované modely i modely trénované od nuly. Tyto modely jsou hodnoceny na datasetech počítačového vidění pro úlohy klasifikace, sémantické segmentace a detekce objektů, při použití široké škály metrik. Modely jsou rovněž evaluovány na transformovaných datasetech, kvůli jejich ohodnocení na datech mimo trénovací distribuci.       Tyto modifikované modely dosahují slibných výsledků. Ansámbly překonávají ostatní modely až o 70 % v přesnosti a o 0.2 v IOU na transformovaném segmentačním datasetu MedSeg COVID-19 a zároveň překonávají ostatní modely na datasetech CIFAR-100 a FMNIST.
Rozpoznání hranic jízdního pruhu v záběrech palubní kamery
Fridrich, David ; Kohút, Jan (oponent) ; Herout, Adam (vedoucí práce)
Tato práce se zabývá detekcí jizdních pruhů. Konkrétně vlastního generátoru syntetických dat, jeho využití při trénování neuronových sítí, testování výsledků na konvoluční neuronové síti (CNN) modelu UNet a možnosti rozšíření tohoto modelu na SALMNet model (Structure-Aware Lane Marking Detection Network) pomocí přidání SGCA modulu (Semantic-Guided Channel Attention) a pyramidového modulu PDC (Pyramid deformable convolution). Výsledky trénování syntetických dat ukazují že síť umí rozpoznávat silniční pruhy velmi dobře, s přesností kolem 95\,\% (na jednodušších obrázcích dosahuje i 99\,\%). Nad reálným datasetem se výsledky lišily pro jednotlivé datasety, TuSimple dosahoval větší přesnosti kvůli menší obtížnosti obrázků, a sice kolem 62\,\%. Datová sada CuLane dosahovala pouze kolem 37\,\% velmi nestabilně.
Rozpoznávání textu s využitím informace o pisateli
Trněný, Matěj ; Kišš, Martin (oponent) ; Kohút, Jan (vedoucí práce)
Cílem práce je vytvořit neuronovou síť pro rozpoznání textu s využitím informace o pisateli. Pro tento účel byla vybrána metoda adversarial learning. Účinost teto metody byla ověřena experimentálně. Vytvořená síť by měla díky použité metodě adversarial learning dosahovat lepších výsledků na datech, která nejsou podobná datům obsaženým v trénovací sadě oproti stávající metodě single-task learning. Výsledná síť dosažená pomocí uvedené metody byla porovnána se současnou metodou rozpoznávání textu metodou single-task learning a multi-task learning. Síť implementující single-task learning dosahuje průměrné chyby při rozpoznávání znaku 7, 995%, síť implementující multi-task learning dosahuje průměrné chyby 7, 565% v porovnání se sítí využívající adversarial learning, která dosahuje úspěšnosti 7, 573%. V porovnání single-task learning dosahuje multi-task learning 5, 38% zlepšení a adversarial learning 5, 28%.
Generating Animations with Neural Networks
Dráber, Filip ; Kohút, Jan (oponent) ; Hradiš, Michal (vedoucí práce)
While motion capture serves as a mean for animators to circumvent some of the most arduous aspects of creating realistic animation, there is still a lot of work hiding in annotating and structuring the data. I solve this problem by designing a neural network which can be trained on a motion capture data file to reproduce human locomotion visualized in an application which allows for the user to control the character's direction. I also subject various methods of training an autoregressive model to experiments and find which method trades training times for performance the best. Additionally, I remark how the addition of certain control features to frame-by-frame generations impacts the use of recurrent neural networks for this task.
Adaptace neuronových sítí na cílového pisatele
Sekula, Jakub ; Hradiš, Michal (oponent) ; Kohút, Jan (vedoucí práce)
Tato bakalářská práce se zabývá adaptací neuronových sítí na pisatele s cílem zlepšení rozpoznání ručně psaného písma tohoto pisatele. Metoda, kterou používám, je rychlá, vyžaduje malou trénovací množinu dat a využívá regularizaci, která se snaží udržet distribuci regularizovaných vah adaptační sítě podobnou té z předadaptační sítě. Tuto metodu jsem testoval nad datasetem tištěných textů IMPACT a datasetem ručně psaných textů. Nad datasetem ručně psaných textů se mi na dvou denících podařilo snížit chybovost z počátečních 10,82 % a 1,82 % na chybovost 8,48 % a 0,77 % v rámci malého počtu adaptačních iterací a připoužití malého množství trénovacích řádků. Na datasetu IMPACT se mi podařilo snížit chybovost nad polské historické písmo z počáteční chybovosti 32,88 % na 5,30 %.
Generování obrazu pomocí konvolučních neuronových sítí
Kohút, Jan ; Kolář, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Tato bakalářská práce se zabývá navržením a analýzou konvolučních neuronových sítí generujících obrázky znaků na základě jejich parametrů. Parametry znaků jsou typ znaku, font, barva znaku, barva pozadí, translace a rotace. Neuronové sítě si vytvořily mnohorozměrnou reprezentaci jednotlivých parametrů. V rámci těchto reprezentací existují podobné vztahy jako v rámci samotných parametrů. Neuronové sítě generují znaky s novými hodnotami prametrů na základě interpolace mezi naučenými hodnotami parametrů. Neuronové sítě jsou schopné generalizace problému generování obrazu.
Transformer Neural Networks for Handwritten Text Recognition
Vešelíny, Peter ; Beneš, Karel (oponent) ; Kohút, Jan (vedoucí práce)
This Master's thesis aims to design a system using the transformer neural network and perform experiments with this proposed model in the task of handwriting text recognition. In this thesis, a multilingual dataset with predominate Czech texts is used. The experiments examine the influence of basic hyperparameters, such as network size, convolutional encoder type, and the use of different text tokenizers. In this work, I also use text corpora of the Czech language which is used to train the network decoder. Furthermore, I experiment with the usage of additional textual information during the decoding process. This information comes from the previous line of the transcribed image. The transformer achieves a character recognition error rate of 3.41 % on the test data set which is 0.16 % worse performance than the recurrent neural network achieves. To compare this model with other transformer-based models from available articles, the network was trained on the IAM dataset, where it achieved an error of 2.48 % and therefore outperformed other models in handwriting text recognition task.

Národní úložiště šedé literatury : Nalezeno 22 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
1 Kohút, Jakub
4 Kohút, Jiří
4 Kohút, Josef
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.