Národní úložiště šedé literatury Nalezeno 82 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Detection of key information in emergency calls
Sarvaš, Marek ; Plchot, Oldřich (oponent) ; Schwarz, Petr (vedoucí práce)
Emergency calls are usually made under extremely stressful conditions, where callers often provide crucial information rapidly, making it difficult for emergency line agents to capture all details accurately. This can result in repeated questions about information that was already provided and cause delays in response times from emergency services. This work aims to mitigate this problem and potentially speed up the response of emergency services by deploying a neural network models for information extraction, specifically targeting the Named Entity Recognition (NER) task. This work explores various Transformer-based approaches for NER task, such as pre-trained encoder-only, encoder-decoder (sequence-2-sequence) and Large Language Models. The best models achieved state-of-the-art results on publicly available Czech NER datasets. In addition, new NER datasets were created from available recordings of real emergency calls and the corresponding metadata. The models were trained and evaluated on the created datasets successfully achieving reasonable performance in name and location extraction.
Search in speech recordings based on semantic vectors
Boboš, Dominik ; Karafiát, Martin (oponent) ; Schwarz, Petr (vedoucí práce)
In the current era of information overload, efficient methods for information retrieval are crucial. This thesis summarises methods for obtaining vector representations for text and audio, also known as semantic vectors. We took a deeper look at joint-representation models such as SpeechT5 and SeamlessM4T, which transform these various forms of input into one shared vector space. Based on these models, we built a system which allows us to search in data regardless of the modality. In order to evaluate the proposed solution on semantic search tasks, apart from standard keyword spotting tasks, we labelled a dataset to capture similar semantic meanings of the keywords or phrases. Finally, we conducted several experiments, where we explored the possibilities of the models used by limiting the context seen during finetuning or involving text-to-speech (TTS) systems to improve overall performance.
Vyhledávání hlasem na internetu
Belobrad, Michal ; Matějka, Pavel (oponent) ; Schwarz, Petr (vedoucí práce)
Tato bakalářská práce se zabývá tvorbou aplikace pro dotykové telefony s operačním systémem Bada. Cílem této aplikace je umožnit uživatelům vyhledávat na internetu pomocí svého hlasu. Seznámíme se s telefonem Samsung Wave, pro který byla tato aplikace vyvíjena. Dále blíže se podíváme na zpracování výsledků rozpoznávače, našeptávače a jejich kombinace.
Implementace on-line API pro rozpoznávač řeči a Android demoaplikace
Gabčo, Jakub ; Schwarz, Petr (oponent) ; Szőke, Igor (vedoucí práce)
V moderní době se lidé snaží všechno si ulehčit. Tohle může splniť rozpoznávaní řeči. Lokální rozpoznávání řeči je výpočetně náročné, proto se mnoho společností snaží vytvořit vzdálene takzvané síťové rozpoznávaní řeči. V téhle práci se venujeme vytvoření serveru pro rozpoznávání řeči, Android aplikace a výber vhodného protokolu na komunikaci klienta se serverem. Rozebírají se zde prokoly HTTP a Websocketový protokol, rozdíli a výhody  mezi nimi.
Webový editor audia
Myler, Jan ; Pešán, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Tato práce se zabývá tvorbou jednoduchého webového editoru audia s využitím JavaScriptu, HTML5 a nových webových API pro zpracování zvuku (zejména Web Audio API). Popisuje současný stav vývoje a implementace API pro zpracování zvuku v prohlížečích. Dále obsahuje popis návrhu výsledné aplikace až po její implementaci. V závěru práce se nachází shrnutí poznatků získaných při vývoji aplikace a návrh možného budoucího využití a rozšíření.
Přidávání nových slov v dynamickém dekodéru pro rozpoznávání řeči
Škrdlík, Kryštof ; Veselý, Karel (oponent) ; Schwarz, Petr (vedoucí práce)
Výstupem této práce je modifikovaný rozpoznávač řeči firmy Phonexia, do kterého je možné za běhu přidávat nová slova, která nejsou obsažena v jeho slovníku. Zvolená implementovaná metoda funguje na principu vkládání konečných automatů s novými slovy přímo do modifikované statické rozpoznávací sítě popisující kombinovaný jazykový a výslovnostní model rozpoznávače na předem připravená místa. Tato metoda poskytuje srovnatelné výsledky s výchozím rozpoznávačem.
Webový editor audia
Kadlčík, Stanislav ; Žižka, Josef (oponent) ; Schwarz, Petr (vedoucí práce)
Diplomová práce Webový editor audia se zabývá specifikací požadavků, výběrem technologií pro realizaci i samotnou implementací audio editoru. Práce využívá mo­derních přístupů standar­dů HTML5. Je rozdělena na klientskou a serverovou část. Jak samotná webová aplikace, tak i server jsou implementovány v jazyce Javascript. Webový editor audia umožňuje základní editační prvky jako je střih, posouvání, mazání. To vše ve více zvukových stopách. Aplikace běží v posledních verzích nejpoužívanějších webových prohlížečů.
Integrace hlasových technologií na mobilní platformy
Černičko, Sergij ; Černocký, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem práce je seznámit se s metodami a technikami využívanými při zpracování řeči. Popsat současný stav výzkumu a vývoje řečových technologií. Navrhnout a implementovat serverový rozpoznávač řeči, který využívá BSAPI. Integrovat klienta, který bude využívat server pro rozpoznání řeči, do mobilních slovníků společnosti Lingea.
Skutečně off-line čtení RSS
Dresto, Erik ; Schwarz, Petr (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá problematikou čtení RSS článků bez internetového připojení. Cílem bylo získat informace z oblasti čtení RSS článků, seznámit se s formátem RSS, poznat jeho strukturu a historii. Dále s dostupnými RSS čtečkami, zhodnotit jejich výhody a nevýhody z hlediska jednoduchosti rozšíření, aktualizace a možnosti převodu na mobilní zařízení. V práci se dále nachází stručný popis technologii, které se využívají při práci s RSS kanály. Jsou vysvětlené důvody zavedení formátu RSS pro publikaci článků na internetu, následně je vypracován návrh aplikace pro čtení RSS článků bez internetového připojení a popis implementace. Výsledkem práce je vytvořená aplikace OfflineRSS Reader naprogramována v jazyku Java.
Diktovací systém - uživatelské rozhraní
Svoboda, Martin ; Fapšo, Michal (oponent) ; Schwarz, Petr (vedoucí práce)
Pod pojmem diktovací systém chápeme software, který se skládá ze dvou hlavních částí. První částí je rozpoznávač pro rozpoznávání mluveného slova, druhou částí je uživatelské rozhraní pro interakci s uživatelem a zpracování výstupu rozpoznávače. Tato práce se zaměřuje na uživatelské rozhraní diktovacího systému, popis komunikace mezi rozpoznávačem a uživatelským rozhraním, opravou slov přicházejících od rozpoznávače a převodem čísel ze slovní podoby na číselnou.

Národní úložiště šedé literatury : Nalezeno 82 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
4 SCHWARZ, Pavel
4 Schwarz, Pavel
2 Schwarz, Petra
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.