Národní úložiště šedé literatury Nalezeno 5 záznamů.  Hledání trvalo 0.00 vteřin. 
Transcription and annotation components for web editor in React
Dugovič, Jakub ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
This thesis aims to implement modular user interface for audio transcription and annotation. It expands upon existing work in order to enable and improve working with hours-long conversation recordings. The solution is implemented in TypeScript using React and additional libraries from the React ecosystem. Applying principles from the studied literature, avoiding issues identified during the research a similar platform, and verifying the interface throughout the development using qualitative testing, the interface strives to achieve high degree of good user experience.
Vizualizace výstupu z řečových technologií pro potřeby kontaktních center
Zhezhela, Oleksandr ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Diplomová práce se zabývá vizualizací dat získaných pomocí řečových technologií pro potřeby kontaktních center. Jsou prozkoumány metody získávání informaci z řečových signálů a existující nástroje, které řeší podobné úlohy. Je analyzován rozsah dat, která lze z řečových technologií získat. Procesy a standardy používané v kontaktních centrech. Na základě požadavků pracovníků kontaktních center bylo implementováno uživatelské rozhraní pro vizualizaci dat a audio přehrávačznázorňující řečová data. Získané poznatky a řešení byly implementovány do nástroje Speech Analytics Server (SPAS).
Nástroj pro simultánní přehrávání více interpretací jedné skladby
Švejcar, Michael ; Ištvánek, Matěj (oponent) ; Miklánek, Štěpán (vedoucí práce)
Cílem této bakalářské práce bylo vytvoření programu umožňujícího simultánní přehrávání více interpretací jedné skladby a plynulého přepínání mezi nimi. K těmto účelům byl použit App Designer v prostředí MATLAB, jenž je určen k vývoji aplikací s grafickým uživatelským rozhraním. Pro vývoj aplikace bylo klíčové zejména použití dostupných toolboxů spolu s algoritmy pro výpočet víceúrovňového dynamického borcení časové osy. Výsledný přehrávač IntSwitcher umožňuje uživateli načíst dvě nahrávky interpretací jedné skladby. Ze vstupních souborů jsou nejprve vypočteny chromagramy, které jednotlivé nahrávky charakterizují z hlediska tónového vývoje v čase. Následně je na chromagramy aplikována metoda víceúrovňového dynamického borcení časové osy, jejímž výstupem je optimální cesta. Jedná se o matici, ve které jsou k sobě přiřazeny hudebně korespondující vzorky načtených audio souborů s rozlišením 50 ms. Dle této závislosti je během přehrávání určována korespondující časová pozice aktuálně neaktivní stopy, společně s pozicí jejího posuvníku. V případě přepnutí přehrávané nahrávky tedy začne druhá stopa hrát ve stejné části skladby, i pokud se tato část nachází v rozdílných časech jednotlivých nahrávek. Výsledná aplikace se jeví jako užitečný nástroj ke studování rozdílů mezi různými interpretacemi stejného hudebního díla.
Nástroj pro simultánní přehrávání více interpretací jedné skladby
Švejcar, Michael ; Ištvánek, Matěj (oponent) ; Miklánek, Štěpán (vedoucí práce)
Cílem této bakalářské práce bylo vytvoření programu umožňujícího simultánní přehrávání více interpretací jedné skladby a plynulého přepínání mezi nimi. K těmto účelům byl použit App Designer v prostředí MATLAB, jenž je určen k vývoji aplikací s grafickým uživatelským rozhraním. Pro vývoj aplikace bylo klíčové zejména použití dostupných toolboxů spolu s algoritmy pro výpočet víceúrovňového dynamického borcení časové osy. Výsledný přehrávač IntSwitcher umožňuje uživateli načíst dvě nahrávky interpretací jedné skladby. Ze vstupních souborů jsou nejprve vypočteny chromagramy, které jednotlivé nahrávky charakterizují z hlediska tónového vývoje v čase. Následně je na chromagramy aplikována metoda víceúrovňového dynamického borcení časové osy, jejímž výstupem je optimální cesta. Jedná se o matici, ve které jsou k sobě přiřazeny hudebně korespondující vzorky načtených audio souborů s rozlišením 50 ms. Dle této závislosti je během přehrávání určována korespondující časová pozice aktuálně neaktivní stopy, společně s pozicí jejího posuvníku. V případě přepnutí přehrávané nahrávky tedy začne druhá stopa hrát ve stejné části skladby, i pokud se tato část nachází v rozdílných časech jednotlivých nahrávek. Výsledná aplikace se jeví jako užitečný nástroj ke studování rozdílů mezi různými interpretacemi stejného hudebního díla.
Vizualizace výstupu z řečových technologií pro potřeby kontaktních center
Zhezhela, Oleksandr ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Diplomová práce se zabývá vizualizací dat získaných pomocí řečových technologií pro potřeby kontaktních center. Jsou prozkoumány metody získávání informaci z řečových signálů a existující nástroje, které řeší podobné úlohy. Je analyzován rozsah dat, která lze z řečových technologií získat. Procesy a standardy používané v kontaktních centrech. Na základě požadavků pracovníků kontaktních center bylo implementováno uživatelské rozhraní pro vizualizaci dat a audio přehrávačznázorňující řečová data. Získané poznatky a řešení byly implementovány do nástroje Speech Analytics Server (SPAS).

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.