Národní úložiště šedé literatury Nalezeno 8 záznamů.  Hledání trvalo 0.01 vteřin. 
Multi-modální přepis textu
Kabáč, Michal ; Herout, Adam (oponent) ; Kišš, Martin (vedoucí práce)
Cieľom tejto práce je popísať a vytvoriť metódu pre korekciu výstupov rozpoznávača textu pomocou rozpoznávača reči. Práca popisuje prehľad súčasných metód pre rozpoznávanie textu a reči pomocou neurónových sietí. Popisuje tiež existujúce metódy prepájania výstupov dvoch modalít. V rámci práce je navrhnutých a implementovaných niekoľko prístupov pre korekciu rozpoznávačov, ktoré sú založené na algoritmoch, alebo neurónových sieťach. Ako najlepší prístup sa ukázal algoritmus založený na princípe prehľadávania výstupov rozpoznávačov zarovnaných pomocou levenshtainového zarovnania. Algoritmus prehľadáva výstupy v prípade že neistota znaku rozpoznávača textu je menšia ako predom zvolená hranica. V rámci práce bol ku textovým prepisom vytvorený anotačný server, pomocou ktorého sa robil zber nahrávok pre vyhodnotenie experimentov.
Zvyšování konzistence v datových sadách pro rozpoznávání textu
Tvarožný, Matúš ; Hradiš, Michal (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.
Automatický přepis dodacích listů
Necpál, Dávid ; Kišš, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Cieľom tejto bakalárskej práce je vytvorenie systému pre automatický prepis dodacích listov - dokumentov s pevnou štruktúrou. Riešenie práce je rozdelené do dvoch častí. Prvou časťou je detekcia čiar tabuliek a z nich následná detekcia a extrakcia buniek, ktoré obsahujú požadované dáta. Druhá časť je samotné rozpoznanie ručne písaných numerických znakov v obrázkoch vyrezaných buniek. Výsledný systém dokáže pri kvalitne naskenovaných dodacích listoch detegovať bunky s požadovanými údajmi s presnosťou 100 %, pričom úspešnosť samotného rozpoznávania numerických znakov je viac ako 95 % pre samostatné znaky a vyše 92 % pre celé sekvencie znakov. Prínosom tejto práce je systém pre automatický prepis dodacích listov, ktorý zabezpečuje rýchlejšie a jednoduchšie inak zdĺhavé "prepisovanie obsahu dodacích listov do informačného systému maloobchodu. Využitím tohoto systému ušetrí pracovník na každom dodacom liste viac než 50 % času.
Rozpoznávání historických textů pomocí hlubokých neuronových sítí
Vešelíny, Peter ; Kolář, Martin (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá rozpoznávaním riadkov z historických textov. Historické texty pochádzajú z obdobia od 17. až 19 storočia a sú napísané pomocou fraktúry. Pri rozpoznávaní písma sa používa architektúra neurónovej siete zvaná sequence-to-sequence . Táto architektúra vychádza z modelu kodér-dekodér a používa mechanizmus attention . V rámci práce bola z textov, pochádzajúcich z archívu Deutsches Textarchiv , vytvorená dátová sada. Tento archív obsahuje 3 897 rôznych nemeckých diel, ku ktorým sú dostupné snímky strán a ich prepisy. Vytvorená dátová sada sa následne používa pri trénovaní a experimentovaní s neurónovou sieťou. V rámci experimentov sú skúmané rôzne modely konvolučných sietí, vplyv hyperparametrov siete a účinok pozičného kódovania na výsledky rozpoznávania. Výsledný model dokáže rozpoznať znaky s presnosťou 99,63 %. Prínosom tejto práce je spomínaná dátová sada a neurónová sieť, ktorá sa môže použivať pri rozpoznávaní historických dokumentov.
Multi-modální přepis textu
Kabáč, Michal ; Herout, Adam (oponent) ; Kišš, Martin (vedoucí práce)
Cieľom tejto práce je popísať a vytvoriť metódu pre korekciu výstupov rozpoznávača textu pomocou rozpoznávača reči. Práca popisuje prehľad súčasných metód pre rozpoznávanie textu a reči pomocou neurónových sietí. Popisuje tiež existujúce metódy prepájania výstupov dvoch modalít. V rámci práce je navrhnutých a implementovaných niekoľko prístupov pre korekciu rozpoznávačov, ktoré sú založené na algoritmoch, alebo neurónových sieťach. Ako najlepší prístup sa ukázal algoritmus založený na princípe prehľadávania výstupov rozpoznávačov zarovnaných pomocou levenshtainového zarovnania. Algoritmus prehľadáva výstupy v prípade že neistota znaku rozpoznávača textu je menšia ako predom zvolená hranica. V rámci práce bol ku textovým prepisom vytvorený anotačný server, pomocou ktorého sa robil zber nahrávok pre vyhodnotenie experimentov.
Zvyšování konzistence v datových sadách pro rozpoznávání textu
Tvarožný, Matúš ; Hradiš, Michal (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.
Automatický přepis dodacích listů
Necpál, Dávid ; Kišš, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Cieľom tejto bakalárskej práce je vytvorenie systému pre automatický prepis dodacích listov - dokumentov s pevnou štruktúrou. Riešenie práce je rozdelené do dvoch častí. Prvou časťou je detekcia čiar tabuliek a z nich následná detekcia a extrakcia buniek, ktoré obsahujú požadované dáta. Druhá časť je samotné rozpoznanie ručne písaných numerických znakov v obrázkoch vyrezaných buniek. Výsledný systém dokáže pri kvalitne naskenovaných dodacích listoch detegovať bunky s požadovanými údajmi s presnosťou 100 %, pričom úspešnosť samotného rozpoznávania numerických znakov je viac ako 95 % pre samostatné znaky a vyše 92 % pre celé sekvencie znakov. Prínosom tejto práce je systém pre automatický prepis dodacích listov, ktorý zabezpečuje rýchlejšie a jednoduchšie inak zdĺhavé "prepisovanie obsahu dodacích listov do informačného systému maloobchodu. Využitím tohoto systému ušetrí pracovník na každom dodacom liste viac než 50 % času.
Rozpoznávání historických textů pomocí hlubokých neuronových sítí
Vešelíny, Peter ; Kolář, Martin (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá rozpoznávaním riadkov z historických textov. Historické texty pochádzajú z obdobia od 17. až 19 storočia a sú napísané pomocou fraktúry. Pri rozpoznávaní písma sa používa architektúra neurónovej siete zvaná sequence-to-sequence . Táto architektúra vychádza z modelu kodér-dekodér a používa mechanizmus attention . V rámci práce bola z textov, pochádzajúcich z archívu Deutsches Textarchiv , vytvorená dátová sada. Tento archív obsahuje 3 897 rôznych nemeckých diel, ku ktorým sú dostupné snímky strán a ich prepisy. Vytvorená dátová sada sa následne používa pri trénovaní a experimentovaní s neurónovou sieťou. V rámci experimentov sú skúmané rôzne modely konvolučných sietí, vplyv hyperparametrov siete a účinok pozičného kódovania na výsledky rozpoznávania. Výsledný model dokáže rozpoznať znaky s presnosťou 99,63 %. Prínosom tejto práce je spomínaná dátová sada a neurónová sieť, ktorá sa môže použivať pri rozpoznávaní historických dokumentov.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.