Národní úložiště šedé literatury Nalezeno 215 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Document Information Extraction
Janík, Roman ; Špaňhel, Jakub (oponent) ; Hradiš, Michal (vedoucí práce)
With development of digitization comes the need for historical document analysis. Named Entity Recognition is an important task for Information extraction and Data mining. The goal of this thesis is to develop a system for extraction of information from Czech historical documents, such as newspapers, chronicles and registry books. An information extraction system was designed, the input of which is scanned historical documents processed by the OCR algorithm. The system is based on a modified RoBERTa model. The extraction of information from Czech historical documents brings challenges in the form of the need for a suitable corpus for historical Czech. The corpora Czech Named Entity Corpus (CNEC) and Czech Historical Named Entity Corpus (CHNEC) were used to train the system, together with my own created corpus. The system achieves 88.85 F1 score on CNEC and 87.19 F1 score on CHNEC, obtaining new state-of-the-art results.
Generování trénovacích dat pomocí GAN pro odhad věku z fotografie
Venkrbec, Tomáš ; Herout, Adam (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce je implementace některé z nejmodernějších metod generativních neuronových sítí a návrh jejího rozšíření o podmíněné generování. To bylo využito pro generování fotorealistických snímků lidských tváří se specifikovanými charakteristikami, jako například věk a pohlaví. K tomuto účelu byla sloučením a čištěním existujících anotovaných datových sad obličejů vytvořena velmi různorodá datová sada, čítající přes 230 tisíc vzorků. Hojně jsou v ní zastoupeny všechny věkové kategorie, pohlaví a různé etnické skupiny. StyleGAN2 generátorem natrénovaným na této datové sadě bylo dosaženo hodnoty FID 7,14. S poměrem syntetických dat bylo následně experimentováno při trénování klasifikátoru věku. V případě testovací podmnožiny datové sady bylo přidáním syntetických dat docíleno snížení střední absolutní chyby z 3,499 roku na 3,294 roku. U nezávislé testovací datové sady došlo ke snížení průměrné chyby z 4,012 roku na 3,875 roku.
Deep Neural Networks for Text Recognition
Kavuliak, Daniel ; Hradiš, Michal (oponent) ; Kišš, Martin (vedoucí práce)
The aim of this work is to build a model for handwritten text recognition, which will use non-autoregressive decoder. This type of decoder calculates character predictions independently of other predicted characters, which can be advantageous in terms of inference speed, but the quality of the prediction is worse. The motivation is to design a non-autoregressive decoder, which will have the task of refining the encoder's predictions. The task was solved with the help of decoders, which mask the encoder's predictions or partially suppress the information due to the use of information about unmasked symbols or using input sequence information. Subsequently, a series of experiments was performed, where the best model reached a character error rate of 8.92 %. But the assignment was not fulfilled, because the encoder itself reached 6.38 %.
Identifikace osob pomocí obrazu duhovky
Žákovic, Marek ; Hradiš, Michal (oponent) ; Vaško, Marek (vedoucí práce)
The goal of this bachelor’s thesis was to create a system for person identification using iris images. The thesis describes existing methods and procedures for iris recognition. The proposed method utilizes a convolutional neural network trained to extract features, which are then used to compare whether the image belongs to the same person or not. The experiments involve training and evaluating the neural network. For the purposes of this thesis, freely available datasets were used, which were modified for specific use.
Graph Neural Networks for Document Analysis
Patrik, Nikolas ; Španěl, Michal (oponent) ; Hradiš, Michal (vedoucí práce)
In this thesis we use for graph neural networks for document analysis. In the beggining we introduce how these graph convolutional networks work and also we introduce concept which is used for their implementation. Next, we explain current solution that solves semantic labeling of text entities in scanned documents, what is also same as the goal of this thesis. In following chapter we present solution which should be used for the mentioned problem as well as another problem which is extraction of specific data using active learning. Gradually, we explain how this solution was implemented and what tools we have used. Before ending, we show our dataset, we have annotated and we meant to use for evaluation and training of our solution. In the end, we present results of this thesis, compare our model with others and also evaluate how our model was able to extract specified data using active learning.
Model Compression of Denoising Diffusion Probabilistic Models for Image Generation
Dobiš, Lukáš ; Kišš, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
This thesis is dedicated to optimizating computation in generative diffusion models by evaluating conventional model compression aproaches on Denoising Diffusion Probabilistic Model (DDPM). Model compression was done on parameters of pretrained baseline DDPM neural network by several quantization and pruning methods. These methods were evaluated on three image dataset benchmarks. Results show that quantization and pruning are viable compression methods for downsizing diffusion networks, because they showed little decrease in quality of generated imagery. These results confirm that implemented compression approaches are vital for deployment of diffusion models on resource constrained Edge devices or to offset their compute costs.
Znovupoužitelný 2D editor pro webové aplikace
Schneider, Martin ; Hradiš, Michal (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je realizovat 2D editor jako knihovnu pro webové aplikace společně s testovací aplikací. Knihovna primárně cílí na prostředí segmentačních neuronových sítí a vzdáleného použití s optimalizacemi na přenos dat. Nejprve se čtenář seznámí s problematikou vývoje frontendových aplikací se zaměřením na editaci 2D grafiky a zobrazování obrazových dat. Dále je uvedena analýza potřeb na 2D editor s využitím pro editaci anotací a zobrazování výsledků v úlohách počítačového vidění. Výsledek analýzy je posléze převeden na návrh systému, který je následně implementován a otestován.
Reidentifikace automobilů v obraze
Ohradzanská, Karolína ; Hradiš, Michal (oponent) ; Herout, Adam (vedoucí práce)
Vehicle re-identification is a helpful technic for tracking and monitoring traffic in various situations. This thesis deals with the issue of re-identification cars in the image to track vehicles using camera systems. Specifically, it focuses on the multi-camera vehicle tracking task from the international AI City Challenge competition. In this work were trained five types of convolutional networks and one transformer model. It investigated how successfully different convolutional networks worked compared to the transformer model in the re-identification task. Several experiments were performed with these networks on several datasets, while the resNeXt model achieved a success rate of up to 86.35~\% on the VeRi dataset. Participation in the AI City Challenge in 2023 required creating a dataset with people for the re-identification task.
Re-identifikace vozidel pomocí vision transformerů
Jelínek, Zdeněk ; Hradiš, Michal (oponent) ; Špaňhel, Jakub (vedoucí práce)
Hlavním cílem této práce bylo zjištění možností vision transformerů při re-identifikaci vozidel. V této oblasti počítačového vidění doposud dominují konvoluční neuronové sítě. Celkem byly vyzkoušeny dva modely - TransReID a CMT. TransReID je model založený čistě na vision transformerech a byl vytvořený přímo pro re-identifikaci vozidel. Hlavní část experimentů s tímto modelem jsem věnoval využití klíčových bodů na vozidle. Při správné extrakci oblastí okolo klíčových bodů a využití postprocessingu jsem dosáhl state-of-the-art výsledků. Model CMT je kombinací konvolučních sítí a transformerů, který nebyl vytvořen pro re-identifikaci vozidel. Model jsem upravil a provedl s ním rozsáhlé experimenty pro získání nejlepší konfigurace pro re-identifikaci vozidel. Modely jsem vyhodnotil na standardních datasetech VeRi-776, VehicleID, CityFlowV2-ReID a CarsReId74k a porovnal se state-of-the-art modely. S modelem CMT jsem dosáhl na datasetu VeRi-776 nejlepšího výsledku 0,860 na metrice mAP a na datasetu VehicleID jsem dosáhl nejlepšího výsledku 97,6% na metrice Rank5.
Porozumění videozáznamům badmintonu
Mašláň, Vojtěch ; Hradiš, Michal (oponent) ; Herout, Adam (vedoucí práce)
Cílem této bakalářské práce bylo experimentování s modely strojového učení pro porozumění záznamů badmintonu. V první částí práce byl zmapován aktuální stav v oblasti využití počítačového vidění pro analýzu sportu, následně v experimentální části bylo navrženo několik modelů pro detekci úderů badmintonu. Navržené modely využívají již existující modely pro extrakci póz lidí. Vypracované modely dosáhly přesnosti 80,1 % pro detekci 7 různých činností a 84,0 % pro detekci 4 různých činností. Natrénované modely byly demonstrovány na jednoduché webové aplikaci pro analýzu krátkých videí badmintonu.

Národní úložiště šedé literatury : Nalezeno 215 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.