Národní úložiště šedé literatury Nalezeno 424 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Transcription and annotation components for web editor in React
Dugovič, Jakub ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
This thesis aims to implement modular user interface for audio transcription and annotation. It expands upon existing work in order to enable and improve working with hours-long conversation recordings. The solution is implemented in TypeScript using React and additional libraries from the React ecosystem. Applying principles from the studied literature, avoiding issues identified during the research a similar platform, and verifying the interface throughout the development using qualitative testing, the interface strives to achieve high degree of good user experience.
Automatický přepis řeči s podporou code switching
Bílek, Štěpán ; Karafiát, Martin (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá problematikou automatického rozpoznávání řeči. Zaměřuje se na rozpoznávání audia obsahující vícejazyčné promluvy, tzv. code-switching. Problém nedostatku vícejazyčných dat pro trénování je řešen kombinováním nahrávek v angličtině a němčině dohromady. Pro co největší přiblížení ke skutečné dvojjazyčné řeči je část datasetů tvořena spojováním nahrávek podobných mluvčích. Na vytvořených datech je trénován a testován model Whisper. Ten v původní neadaptované verzi dosahuje chybovosti až 70 %. Nejlepší modely trénované na kombinovaných datasetech dosahují chybovosti jen lehce přes 7 %. Výsledky této práce ukazují způsoby jak modely trénovat, aby dosahovaly co nejlepších výsledků.
Ovládání mobilní aplikace hlasem
Cologna, Adam ; Szőke, Igor (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je prozkoumat, analyzovat a porovnat dostupné knihovny pro ovládání mobilních aplikací hlasovými pokyny. Zvolený problém jsem dle zadání práce řešil hlavně pro operační systém Android a bral jsem v potaz nejen knihovny pro detekci klíčových slov, ale i knihovny se zaměřením na porozumění řeči. Pro zvolené knihovny jsem provedl testování přesnosti detekce hlasových pokynů a zátěžové testy. Pro potřeby propojení vybraných knihoven vznikla aplikace v moderním programovacím jazyce Kotlin s využitím Jetpack Compose. Hlavním přínosem této práce jsou právě provedené experimenty a výsledná doporučení ohledně zkoumaných knihoven. Mezi nejefektivnější řešení patřila ta od Microsoft Azure a třída Android Speech Recognizer. Hlavními překážkami pro jednotlivé knihovny byla vzdálenost mezi řečníkem a mikrofonem a rušivá hudba v pozadí.
Framework for event modeling a prediction in football.
Geffert, Maroš ; Beneš, Karel (oponent) ; Szőke, Igor (vedoucí práce)
This thesis investigates current methods of predicting football events such as the number of goals in a match, the outcome of a match, or whether both teams will score. The models analyzed were neural network, RandomForest and XGBoost. Extensive historical data on matches and players were collected as part of the work. The main objectives were to determine whether detailed statistics significantly affect prediction, to evaluate the effectiveness of using betting odds as features, to investigate the impact of historical data on the quality of predictions, and to determine whether success can be achieved in the betting market with such models. The results showed that detailed statistics improve the accuracy of the predictions, but the use of odds as features generally degrades the predictions. The results regarding the use of historical data for predictions were inconclusive. RandomForest and neural network models achieved promising results with ROI of 32.38% and 29.04%, respectively.
Integrace augmentace dat do Pytorch
Vašina, Ladislav ; Polok, Alexander (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce představuje nástroj, který tvoří sjednocené, jednoduché a uživatelsky přívětivé rozhraní nad knihovnami pro augmentaci zvukových dat, jež je možné využít spolu s knihovnou PyTorch. Implementovaný nástroj nabízí možnost použití širokého spektra augmentací z různých knihoven a umožňuje je jednoduše aplikovat na datové sady. Podpory takto velkého spektra augmentací by bylo možné dosáhnout pouze za použití mnoha rozhraní jednotlivých knihoven. Nástroj je schopný od uživatele přijímat seznam augmentací s jejich parametry a sám rozhoduje, jakou z integrovaných knihoven pro dané augmentace použít. Vytvořený nástroj byl testován na úkolu ladění automatického rozpoznávače řeči Whisper. Hlavním přínosem této práce je implementace řešení velkého množství knihoven pro augmentaci zvukových dat, kde každá knihovna poskytuje jiný počet a různé druhy augmentací zvuku a zároveň má i jiné vlastnosti a rozhraní.
Automatický přepis řeči letecké komunikace do textu
Nevařilová, Veronika ; Veselý, Karel (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá adaptací Whisperu, modelu automatického rozpoznávání řeči vyvinutého společností OpenAI, na českých a anglických záznamech letecké komunikace. Poskytuje základní vhled do problematiky rozpoznávání řeči, neuronových sítí a modelů stavěných na transformer architektuře. Popsány jsou také sběr a anotace dat a nakonec průběh a porovnání učení na dvou různých formách přepisu – plném, kdy se model učí přepisovat nahrávky slovo od slova, a zkráceném, který je snadnější pro rychlé vyhledávání informací v textu a přirozenější pro řídící letového provozu.
Simulace fotovoltaické elektrárny v rodinném domě
Gabrys, Adam ; Zachariáš, Michal (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá simulací systému fotovoltaické elektrárny pro rodinný dům s následnou optimalizací vůči návratnosti investice. Klade důraz na vizualizaci výsledků a možnost zahrnutí vlastních fotovoltaických sestav zahrnující střídač, fotovoltaické panely a baterii. Nástroj pracuje s třífázovou soustavou, kdy je schopen analyzovat spotřebu jednotlivých fází a provádět simulace s dodávaným výkonem z fotovoltaických panelů. Optimalizace jednotlivých komponent elektrárny je prováděna za pomocí použití genetického algoritmu. Simulace je implementována v Pythonu na základě principů objektově orientovaného programování s cílem možnosti přidání nových modulů.
Framework pro backtestování strategií algoritmického obchodování na burze včetně podpory pro vylepšování strategií s pomocí evolučních algoritmů.
Kmenta, Martin ; Plchot, Oldřich (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce se soustředí na vývoj pokročilého frameworku pro backtestování algoritmických obchodních strategií, přičemž klade důraz na optimalizaci strategií pomocí evolučních algoritmů. Zabývá se analýzou a aplikací technické analýzy v kontextu obchodování na burze. Dále se zaměřuje na návrh a vývoj modulů pro efektivní získávání, zpracování, vizualizaci a analýzu různých typů tržních dat, což umožňuje uživatelům vytvářet a backtestovat své vlastní indikátory a obchodní strategie s využitím robustního frameworku.
Síťová hra: Hon na ponorku
Jašek, Petr ; Mlích, Jozef (oponent) ; Szőke, Igor (vedoucí práce)
Tato bakalářská práce se zabývá vývojem jednoduché síťové počítačové hry. Práce popisuje základní schéma vývoje počítačové hry. Je v ní také provedena analýza různých možností síťové implementace. Výstupem práce je počítačový program psaný v jazyce C++. K implementaci síťového rozhraní byla použita knihovna Boost 1.50.0. Síťová komunikace byla implementována jako architektura klient-server s pomocí protokolu UDP. K implementaci grafického rozhraní a zvuku byla použita knihovna Allegro 5.0.7.
Smart Sheet Music Reader for Android
Smejkal, Vojtěch ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Automatic page turning and automatic music accompaniment have been studied for several decades. This work summarizes the state of art approaches to real-time score following. It studies various audio features such as chroma classes and synthesized spectral templates. It also describes short-time Fourier transform and online Dynamic time warping as key components of the system. This project analyzes in detail developed solution for tracking the player position in score, which was then implemented as mobile application. Final system is able to follow pieces even with changing tempo, pauses during performance, and minor deviations from the original score.

Národní úložiště šedé literatury : Nalezeno 424 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.