Národní úložiště šedé literatury Nalezeno 55 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Modul pro rozpoznávání nápisů pro robota
Hartman, Zdeněk ; Materna, Zdeněk (oponent) ; Španěl, Michal (vedoucí práce)
Tato bakalářská práce popisuje návrh modulu pro detekci a rozpoznávání nápisů pro použití v robotických systémech. K detekci znaků je použita Stroke Width transformace, která je aplikována na vstupní hranový obraz. Ve výstupním obraze po Stroke Width transfromaci jsou nalezeny spojité oblasti. K seskupení znaků do slov a detekci orientace slov je použita Houghova transformace aplikována na vytvořený binární obraz, který obsahuje body odpovídající pozici nalezených spojitých oblastí. K rozpoznání nápisů v detekovaných oblastech je použita knihovna Tesseract. Před provedení rozpoznávání jsou detekované oblasti extrahovány a natočeny do vodorovné polohy. Takto navržený detektor dokáže detekovat i natočený text. Podařilo se dosáhnout úspěšnosti detekce 75% nad testovací sadou "informační tabule".
Transformer Neural Networks for Handwritten Text Recognition
Vešelíny, Peter ; Beneš, Karel (oponent) ; Kohút, Jan (vedoucí práce)
This Master's thesis aims to design a system using the transformer neural network and perform experiments with this proposed model in the task of handwriting text recognition. In this thesis, a multilingual dataset with predominate Czech texts is used. The experiments examine the influence of basic hyperparameters, such as network size, convolutional encoder type, and the use of different text tokenizers. In this work, I also use text corpora of the Czech language which is used to train the network decoder. Furthermore, I experiment with the usage of additional textual information during the decoding process. This information comes from the previous line of the transcribed image. The transformer achieves a character recognition error rate of 3.41 % on the test data set which is 0.16 % worse performance than the recurrent neural network achieves. To compare this model with other transformer-based models from available articles, the network was trained on the IAM dataset, where it achieved an error of 2.48 % and therefore outperformed other models in handwriting text recognition task.
Rozpoznávání historických textů pomocí hlubokých neuronových sítí
Kišš, Martin ; Zemčík, Pavel (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce je vytvořit nástroj pro automatický přepis textu historických dokumentů. Práce je zaměřena především na rozpoznávání textů pocházejících z období novověku psané písmem zvané Fraktura. Problém je řešen pomocí nově navržených rekurentních konvolučních neuronových sítí a také pomocí sítě zvané Spatial Transformer Network. Součástí řešení je také implementovaný generátor umělých historických textů. Pomocí tohoto generátoru je vytvořena umělá datová sada, na níž je natrénována konvoluční neuronová síť pro rozpoznávání řádků. Tato síť je následně otestována na reálných historických řádcích textu, na kterých natrénovaná sít dosahuje úspešnosti až 89.0 % znakové přesnosti. Přínosem této práce je především nově navržená neuronová síť pro rozpoznávání řádků textu a implementovaný generátor umělých historických textů, s jehož pomocí je možné natrénovat neuronovou síť tak, aby zvládala rozpoznávat reálné historické řádky textu.
Rozpoznávání historických textů pomocí hlubokých neuronových sítí
Vešelíny, Peter ; Kolář, Martin (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá rozpoznávaním riadkov z historických textov. Historické texty pochádzajú z obdobia od 17. až 19 storočia a sú napísané pomocou fraktúry. Pri rozpoznávaní písma sa používa architektúra neurónovej siete zvaná sequence-to-sequence . Táto architektúra vychádza z modelu kodér-dekodér a používa mechanizmus attention . V rámci práce bola z textov, pochádzajúcich z archívu Deutsches Textarchiv , vytvorená dátová sada. Tento archív obsahuje 3 897 rôznych nemeckých diel, ku ktorým sú dostupné snímky strán a ich prepisy. Vytvorená dátová sada sa následne používa pri trénovaní a experimentovaní s neurónovou sieťou. V rámci experimentov sú skúmané rôzne modely konvolučných sietí, vplyv hyperparametrov siete a účinok pozičného kódovania na výsledky rozpoznávania. Výsledný model dokáže rozpoznať znaky s presnosťou 99,63 %. Prínosom tejto práce je spomínaná dátová sada a neurónová sieť, ktorá sa môže použivať pri rozpoznávaní historických dokumentov.
Aktivní učení pro rozpoznávání textu
Kohút, Jan ; Kolář, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce je navrhnout metody aktivního učení a provést experimenty nad datovou sadou historických dokumentů. Pro experimenty využívám rozsáhlý a rozmanitý dataset IMPACT o více než jednom milionu řádků. Pomocí neuronových sítí provádím kontrolu vhodnosti řádků, tzn. čitelnosti a správnosti přepisů. Nejprve srovnávám architektury neuronových sítí, a to jak sítě čistě konvoluční, tak sítě obsahující obousměrnou rekurentní vrstvu LSTM. Dále se zabývám přístupy k učení neuronových sítí pomocí aktivního učení a samotnými metodami aktivního učení. Aktivní učení využívám zejména pro adaptaci neuronových sítí na jiné textové dokumenty, než na kterých byla původní síť učena. Aktivní učení tedy slouží k výběru vhodných adaptačních dat. Čistě konvoluční neuronové sítě dosahují úspěšnosti 98.6 %, rekurentní sítě pak 99.5 %. Chyba při adaptaci s využitím aktivního učení je o 26 % nižší než chyba při náhodném výběru dat.
Digitization of Handwritten Chess Game Sheets
Šiška, Krištof ; Vaško, Marek (oponent) ; Španěl, Michal (vedoucí práce)
Chess is one of the most popular board games in the world. An enormous amount of chess games are played daily and its popularity is still on the rise. When playing live chess games, transcripts of the chess matches are created as chess records, also known as chess score sheets. Transcribing these score sheets into digital format is a tedious and time-consuming task. The time spent on transcription increases exponentially if the handwriting is illegible or if the game contains a large number of moves. This work focuses on the problem of transcribing chess score sheets into digital format and reducing the amount of time spent by humans on this necessary but often tedious task in many areas.
Transformer Neural Networks for Handwritten Text Recognition
Vešelíny, Peter ; Beneš, Karel (oponent) ; Kohút, Jan (vedoucí práce)
This Master's thesis aims to design a system using the transformer neural network and perform experiments with this proposed model in the task of handwriting text recognition. In this thesis, a multilingual dataset with predominate Czech texts is used. The experiments examine the influence of basic hyperparameters, such as network size, convolutional encoder type, and the use of different text tokenizers. In this work, I also use text corpora of the Czech language which is used to train the network decoder. Furthermore, I experiment with the usage of additional textual information during the decoding process. This information comes from the previous line of the transcribed image. The transformer achieves a character recognition error rate of 3.41 % on the test data set which is 0.16 % worse performance than the recurrent neural network achieves. To compare this model with other transformer-based models from available articles, the network was trained on the IAM dataset, where it achieved an error of 2.48 % and therefore outperformed other models in handwriting text recognition task.
Multi-modální přepis textu
Kabáč, Michal ; Herout, Adam (oponent) ; Kišš, Martin (vedoucí práce)
Cieľom tejto práce je popísať a vytvoriť metódu pre korekciu výstupov rozpoznávača textu pomocou rozpoznávača reči. Práca popisuje prehľad súčasných metód pre rozpoznávanie textu a reči pomocou neurónových sietí. Popisuje tiež existujúce metódy prepájania výstupov dvoch modalít. V rámci práce je navrhnutých a implementovaných niekoľko prístupov pre korekciu rozpoznávačov, ktoré sú založené na algoritmoch, alebo neurónových sieťach. Ako najlepší prístup sa ukázal algoritmus založený na princípe prehľadávania výstupov rozpoznávačov zarovnaných pomocou levenshtainového zarovnania. Algoritmus prehľadáva výstupy v prípade že neistota znaku rozpoznávača textu je menšia ako predom zvolená hranica. V rámci práce bol ku textovým prepisom vytvorený anotačný server, pomocou ktorého sa robil zber nahrávok pre vyhodnotenie experimentov.
Zvyšování konzistence v datových sadách pro rozpoznávání textu
Tvarožný, Matúš ; Hradiš, Michal (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.
Načítání dat z tištěných dokladů
Macháč, Bohuslav ; Kolomazník, Jan (vedoucí práce) ; Krajíček, Václav (oponent)
V této práci jsem vyvinul aplikaci schopnou extrahovat data z naskenovaných dokumentů. Pro optické rozpoznávání znaků jsem použil externí OCR engine Tesseract, který lze snadno vyměnit. Pro jednotlivé doklady používám šablony s informacemi o datových oblastech a jejich datových typech. Pokusil jsem se automatizovat většinu kroků nutných pro extrakci dat a vytvoření nové datové šablony. Uživatel má možnost opravit nebo změnit výsledky těchto kroků. Pro výstup z aplikace jsem implementoval komponenty, které exportují data do formátů XML, HTML a do obyčejného textu. Další komponenty mohou být snadno přidány, aby přizpůsobily aplikaci různým použitím.

Národní úložiště šedé literatury : Nalezeno 55 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.