Národní úložiště šedé literatury Nalezeno 14 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Ovládání mobilní aplikace hlasem
Cologna, Adam ; Szőke, Igor (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je prozkoumat, analyzovat a porovnat dostupné knihovny pro ovládání mobilních aplikací hlasovými pokyny. Zvolený problém jsem dle zadání práce řešil hlavně pro operační systém Android a bral jsem v potaz nejen knihovny pro detekci klíčových slov, ale i knihovny se zaměřením na porozumění řeči. Pro zvolené knihovny jsem provedl testování přesnosti detekce hlasových pokynů a zátěžové testy. Pro potřeby propojení vybraných knihoven vznikla aplikace v moderním programovacím jazyce Kotlin s využitím Jetpack Compose. Hlavním přínosem této práce jsou právě provedené experimenty a výsledná doporučení ohledně zkoumaných knihoven. Mezi nejefektivnější řešení patřila ta od Microsoft Azure a třída Android Speech Recognizer. Hlavními překážkami pro jednotlivé knihovny byla vzdálenost mezi řečníkem a mikrofonem a rušivá hudba v pozadí.
Search in speech recordings based on semantic vectors
Boboš, Dominik ; Karafiát, Martin (oponent) ; Schwarz, Petr (vedoucí práce)
In the current era of information overload, efficient methods for information retrieval are crucial. This thesis summarises methods for obtaining vector representations for text and audio, also known as semantic vectors. We took a deeper look at joint-representation models such as SpeechT5 and SeamlessM4T, which transform these various forms of input into one shared vector space. Based on these models, we built a system which allows us to search in data regardless of the modality. In order to evaluate the proposed solution on semantic search tasks, apart from standard keyword spotting tasks, we labelled a dataset to capture similar semantic meanings of the keywords or phrases. Finally, we conducted several experiments, where we explored the possibilities of the models used by limiting the context seen during finetuning or involving text-to-speech (TTS) systems to improve overall performance.
Query-by-Example Keyword Spotting
Skácel, Miroslav ; Hannemann, Mirko (oponent) ; Szőke, Igor (vedoucí práce)
The aim of the thesis is to get acquainted with modern approach of keyword spotting and spoken term detection in speech data. The bases of keyword spotting are described at first. The data representation used for experiments and evaluation are introduced. Keyword spotting methods where query is provided as an audio example (Query-by-Example) are presented. The scoring metrics are described and experiments follow. The results are discussed. Further, modern approaches of keyword spotting are suggested and implemented. The system with new techniques is evaluated and the discussion of results achieved follows. The conclusions are drawn and the discussion of future directions of development is held. The Appendix contains user manual for using implemented system.
Multimediální prohlížeč pro přednášky
Kubalík, Jakub ; Potúček, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
V úvodní části čtenář pochopí význam toho projektu a proč vlastně vznikl. Jedná se o rozsáhlejší týmový projekt, proto popis jeho struktury představuje významnou část práce. Jádro prohlížeče zahrnuje řadu technik, jako např. komponentový systém, speciální systém vnitřní komunikace a další. Vysoký důraz je kladen na přenositelnost a znovupoužitelnost systému - bylo nutné jasně specifikovat pravidla pro syntaxi a používané datové formáty. Nezaměnitelnou úlohu v projektu hraje formát XML. Poslední úpravy představovali především vývoj nových komponent, které současně počítají s budoucím využitím projektu a jeho zapojením do komplexního vyhledávacího systému - ten představuje závěrečná kapitola.
Detekce klíčových slov v mluvené řeči
Zemánek, Tomáš ; Ošmera, Pavel (oponent) ; Pfeifer, Václav (vedoucí práce)
Tato diplomová práce je zaměřena pro návrh detektoru klíčových slov. Práce obsahuje popis metod, které se pro tyto účely používají a návrh vlastního detektoru. Navržený detektor je založen na metodě DTW (DYNAMIC TIME WARPING). Analýza problému proběhla na naprogramovaném modulu v jazyce ANSI C, který byl v rámci diplomové práce vytvořen. Výsledky detektoru byli vyhodnoceny pomocí metriky WER (WORD ERROR RATE) a AUC (AREA UNDER CURVE).
Optimalizace rozpoznávání řeči pro mobilní zařízení
Tomec, Martin ; Zbořil, František (oponent) ; Hanáček, Petr (vedoucí práce)
Práce se zabývá optimalizací algoritmů pro detekci klíčových slov na procesorové architektuře ARM Cortex-A8. Nejprve je popsána tato architektura a zejména její jednotka NEON pro vektorové výpočty. Dále jsou stručně popsány algoritmy pro detekci klíčových slov a navržena jejich optimalizace pro danou architekturu. Jádro práce tvoří implementace těchto optimalizací a zhodnocení jejich vlivu na výkon.
Protection of sensitive data contained in images
Mezina, Anzhelika ; Rajnoha, Martin (oponent) ; Burget, Radim (vedoucí práce)
This work is focused on application of deep learning in security problem of escape sensitive information, that is contained in images. The presented solution of this problem is using Single Shot Multibox Detector and Fully Connected Network (FCN). FCN is faster than other methods and can be applied in industry, where is a need to analyse input and output information very quickly, for example, in network traffic analysis. In the first part of this work, methods that can be used in keyword detection are described. The second part contains a description of experiment and achieved results for two models of neural network: Single Shot Multibox Detector and Fully Connected Network. The second one gave better results and can be used in practice.
Analýza entit v psychoterapeutických sezeních
Polok, Alexander ; Karafiát, Martin (oponent) ; Matějka, Pavel (vedoucí práce)
Tato práce se zabývá analýzou psychoterapeutických sezení v rámci výzkumného projektu DeePsy. Jejím cílem je navrhnout a vytvořit sadu příznaků modelujících průběh sezení, jež mohou odhalit na první pohled nepatrné nuance. Zmíněné příznaky jsou automaticky extrahovány ze zdrojové nahrávky s využitím hlubokých neuronových sítí. Příznaky jsou zpracovány, porovnány napříč sezeními a graficky zobrazeny, čímž vzniká dokument plnící roli zpětné vazby o sezení pro terapeuta. Tato zpětná vazba může posloužit k profesnímu růstu a kvalitnější psychoterapii v budoucnu. Bylo dosaženo relativního zlepšení detekce řečové aktivity o 37,82 %. Byl zobecněn diarizační systém VBx ke konvergenci ke dvěma mluvčím s minimálním relativním zhoršením chybovosti o 0,66 %. Byl natrénován systém pro automatické rozpoznávání řeči, jehož chybovost je o 17,06 % relativně lepší než nejlepší dostupný hybridní model. Dále byly natrénovány systémy pro klasifikaci sentimentu, typu terapeutických intervencí a detekci překrývající se řeči.
Protection of sensitive data contained in images
Mezina, Anzhelika ; Rajnoha, Martin (oponent) ; Burget, Radim (vedoucí práce)
This work is focused on application of deep learning in security problem of escape sensitive information, that is contained in images. The presented solution of this problem is using Single Shot Multibox Detector and Fully Connected Network (FCN). FCN is faster than other methods and can be applied in industry, where is a need to analyse input and output information very quickly, for example, in network traffic analysis. In the first part of this work, methods that can be used in keyword detection are described. The second part contains a description of experiment and achieved results for two models of neural network: Single Shot Multibox Detector and Fully Connected Network. The second one gave better results and can be used in practice.
Multimediální prohlížeč pro přednášky
Kubalík, Jakub ; Potúček, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
V úvodní části čtenář pochopí význam toho projektu a proč vlastně vznikl. Jedná se o rozsáhlejší týmový projekt, proto popis jeho struktury představuje významnou část práce. Jádro prohlížeče zahrnuje řadu technik, jako např. komponentový systém, speciální systém vnitřní komunikace a další. Vysoký důraz je kladen na přenositelnost a znovupoužitelnost systému - bylo nutné jasně specifikovat pravidla pro syntaxi a používané datové formáty. Nezaměnitelnou úlohu v projektu hraje formát XML. Poslední úpravy představovali především vývoj nových komponent, které současně počítají s budoucím využitím projektu a jeho zapojením do komplexního vyhledávacího systému - ten představuje závěrečná kapitola.

Národní úložiště šedé literatury : Nalezeno 14 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.