Národní úložiště šedé literatury Nalezeno 5 záznamů.  Hledání trvalo 0.05 vteřin. 
Příprava trénovacích dat pomocí generativních neuronových sítí
Ševčík, Pavel ; Kolář, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce byla příprava trénovací datové sady pro detekci dopravních značek pomocí generativních neuronových sítí. V řešení byla použita upravená architektura U-Net a bylo experimentováno s aplikací stylů pomocí vrstev AdaIN podobně jako v modelu StyleGAN. Rozšířením reálné datové sady GTSDB o uměle vytvořené snímky bylo dosaženo úspěšnosti 80,36 %, což představuje zlepšení o 19,27 % oproti úspěšnosti detektoru natrénovanému pouze na reálných datech.
Generativní neuronové sítě pro ručně psané písmo
Ševčík, Pavel ; Dobeš, Petr (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce bylo vytvořit model pro generování řádků ručně psaného písma. Model na základě očekávaného stylu a libovolně dlouhého textu vytváří odpovídají obrázek s písmem. Navržené řešení překonává existující přístupy v kvalitě generovaného písma a umožňuje generování jak samostatných slov, tak i řádků. Kombinuje vyhledávání příznaků pro jednotlivé symboly pomocí attention a jejich rozmístění na řádek pomocí vkládání mezer. Nový přístup umožňuje specifikovat pozice symbolů na řádku jemněji než celými čísly, a tak vytvářet plynulejší interpolace mezi různými styly. Na rozdíl od předchozího řešení tento přístup využívá Gaussův filtr pro rozšíření jednotlivých příznaků symbolů do blízkého okolí. Současně tento přístup otevírá množnost trénování modelu pro odhad pozic symbolů na řádku adversariální chybou (GAN). Navíc byly vytvořeny anotace horizontálních pozic symbolů na řádcích datové sady ručně psaného písma IAM.
Automatické rozpoznávání hudebního zápisu pomocí neuronových sítí
Vlach, Vojtěch ; Kohút, Jan (oponent) ; Hradiš, Michal (vedoucí práce)
Tato práce řeší problém rozpoznání hudebních zápisů z obrázku do textové podoby pomocí umělé inteligence a neuronových sítí. Zaměřuje se konkrétně na tištěnou polyfonní hudbu (více not a hlasů naráz). Cílem práce je vytvořit model schopný rozpoznat složité zápisy a jeho úspěšnost porovnat s předchozí literaturou a známými modely. Zvolený problém jsem vyřešil díky využití architektury Vision-transformer, kde jsem testoval několik variant sítě za účelem nalezení té nejvýkonější, a vytvoření nového datasetu s polyfonní hudbou. Práce představuje proces vytvoření datasetu pomocí syntetizování obrázků z formátu MusicXML programem MuseScore. Nejúspěšnější varianta architektury Vision-Transformer dosahuje minimální chybovosti pouze 7,86 %, což je velmi slibné pro další vývoj a využití. Hlavním zjištěním je, že architektura má potenciál dominovat na tomto poli stejně jako na jiných polích výzkumu a pro konkrétní úlohu rozpoznání polyfonních hudebních zápisů existuje funkční řešení, což bylo doteď předmětem debaty.
Generativní neuronové sítě pro ručně psané písmo
Ševčík, Pavel ; Dobeš, Petr (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce bylo vytvořit model pro generování řádků ručně psaného písma. Model na základě očekávaného stylu a libovolně dlouhého textu vytváří odpovídají obrázek s písmem. Navržené řešení překonává existující přístupy v kvalitě generovaného písma a umožňuje generování jak samostatných slov, tak i řádků. Kombinuje vyhledávání příznaků pro jednotlivé symboly pomocí attention a jejich rozmístění na řádek pomocí vkládání mezer. Nový přístup umožňuje specifikovat pozice symbolů na řádku jemněji než celými čísly, a tak vytvářet plynulejší interpolace mezi různými styly. Na rozdíl od předchozího řešení tento přístup využívá Gaussův filtr pro rozšíření jednotlivých příznaků symbolů do blízkého okolí. Současně tento přístup otevírá množnost trénování modelu pro odhad pozic symbolů na řádku adversariální chybou (GAN). Navíc byly vytvořeny anotace horizontálních pozic symbolů na řádcích datové sady ručně psaného písma IAM.
Příprava trénovacích dat pomocí generativních neuronových sítí
Ševčík, Pavel ; Kolář, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Cílem této práce byla příprava trénovací datové sady pro detekci dopravních značek pomocí generativních neuronových sítí. V řešení byla použita upravená architektura U-Net a bylo experimentováno s aplikací stylů pomocí vrstev AdaIN podobně jako v modelu StyleGAN. Rozšířením reálné datové sady GTSDB o uměle vytvořené snímky bylo dosaženo úspěšnosti 80,36 %, což představuje zlepšení o 19,27 % oproti úspěšnosti detektoru natrénovanému pouze na reálných datech.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.