Národní úložiště šedé literatury Nalezeno 29 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Normalization of numbers into spoken form for text-to-speech systems
Růžička, Jakub ; Dušek, Ondřej (vedoucí práce) ; Peterek, Nino (oponent)
Název práce: Normalizace čísel pro výslovnost syntézou řeči Autor: Jakub Růžička Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. et Mgr. Ondřej Dušek, Ph.D., Ústav formální a apliko- vané lingvistiky Abstrakt: Nezbytnou součástí každého systému pro syntézu řeči je normalizace slov obsahujících číslice. Přesnost tohoto procesu může významně ovlivnit kvalitu výsledné promluvy. Hlavním cílem této práce je návrh a implementace modulu pro normalizaci číslic v češtině. Slova obsahující číslice jsou nejprve zařazena do jedné z předem defino- vaných kategorií. Na jejímž základě jsou následně generovány možné rozepsané podoby. Pro výběr kontextově správné varianty je využit existující jazykový model. Systém je distribuován jako balíček v jazyce Python. Může běžet na systému Linux nebo v Docker kontejneru, jehož konfigurace je součástí projektu. Současně byla navržena a napsána specializovaná aplikace pro anotaci dat, která slouží k vytváření datových sad pro nor- malizaci textu. Pomocí aplikace byly vytvořeny dvě datové sady s 1.882 větami a 3.185 slovy vyžadujícími normalizaci. Systém dosáhl na obou získaných datasetech přesnosti přes 80 % (měřeno na úrovni věty). Na základě analýzy chyb popisujeme možná zlepšení. Klíčová slova: normalizace českého textu, normalizace čísel, systém pro...
Restoring and improving the technical quality of audio recordings using machine learning methods
Lechovský, Adam ; Peterek, Nino (vedoucí práce) ; Dušek, Ondřej (oponent)
Cílem této práce je vytrénovat umělou neuronovou síť, která bude schopna zlepšovat technickou kvalitu zvukových nahrávek. Abych toho docílil, použil jsem tři druhy umělých zarušení zvukových nahrávek k natrénování sedmi různých hlubokých neuronových sítí na párech zarušeného a nezarušeného audia. Výsledných 21 sítí jsem následně ohod- notil pomocí objektivních i subjektivních způsobů. Ve výsledku se neuronové sítě naučily odstraňovat umělá zarušení velice dobře, nicméně vylepšovat nezarušené vstupy se ne- naučily. 1
Návrh a implementace systému rozpoznávání druhů kobylek na základě jejich zvukových projevů
Schwarz, Jan ; Peterek, Nino (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Ze strany biologů vzešel nápad na vytvoření systému na rozpoznávání druhů kobylek podle stridulací nahraných v terénu. V této práci se zabýváme rozlišením prozatím pěti druhů kobylek vyskytujících se na území České republiky za pomoci volně dostupného nástroje na rozpoznávání řeči HTK. Kromě samotného akustického modelu je součástí práce i internetové rozhraní, které pořízenou nahrávku vyhodnotí a výsledek zaznamená pro další zpracování. V současné fázi máme vytvořený model založený na omezeném počtu trénovacích nahrávek, který dává uspokojivé výsledky. Internetové rozhraní nicméně funguje i jako sběrný systém, tudíž cesta k rozšiřování a zlepšování modelu je otevřená.
Rozhraní v mluveném jazyce pro korpusové anotační nástroje
Přikryl, Leoš ; Hajič, Jan (vedoucí práce) ; Peterek, Nino (oponent)
Práce se zabývá návrhem a implementací rozhraní ke korpusovým anotačním nástrojům využívaným na ÚFALu (TrEd a jeho přídavné moduly) v přirozeném jazyce (mluvené řeči). Využity jsou již existující moduly pro rozpoznávání řeči ze ZČU Plzeň.
Prohlížeč vektorové mapy České republiky pro mobilní telefony s podporou Javy
Stach, David ; Machek, Pavel (vedoucí práce) ; Peterek, Nino (oponent)
Bakalářská práce je zaměřena na vytvoření aplikace do mobilního telefonu, která umožní zobrazovat mapu České republiky reprezentovanou vektorovými daty. Vytvoření vektorových dat není součástí této práce, aplikace přebírá již hotovou vektorovou mapu. Úkolem práce je především zpracovat vektorová data a umožnit jejich zobrazení na display mobilního telefonu. Aplikace musí používat takové algoritmy, které umožní rychlou práci s mapou i přes omezené zdroje zařízení.
Detekce chyb v rozpoznávání mluvené řeči
Tobolíková, Petra ; Hajič, Jan (vedoucí práce) ; Peterek, Nino (oponent)
Tématem této diplomové práce je detekce chyb v rozpoznávání mluvené řeči. Nejprve jsou stručně představeny principy současného rozpoznávání řeči. Jsou nastíněny problémy, se kterými se rozpoznávání řeči potýká a které způsobují, že stále nefunguje bezchybně. Dále jsou uvedeny stávající známé metody výpočtu tzv. skóre spolehlivosti. V následující části jsou popsány tři metody strojového učení, které byly využity pro implementovanou detekci chyb: logistická regrese, neuronové sítě a rozhodovací stromy. Poté jsou navrženy atributy slov v rozpoznaných větách, které jsou použity jako vstupní proměnné metod strojového učení. Výstupní proměnnou je odhad skóre spolehlivosti. Je zde předveden způsob, jakým byly využity implementace metod strojového učení v softwaru R. Metody byly testovány na nahrávkách českého rádia a televize. Výsledky jednotlivých metod jsou porovnány pomocí křivek ROC, směrodatné chyby detekce a možnosti redukce WER v rozpoznaných větách. Je připojen rovněž popis programu, který je součástí práce. Na závěr jsou shrnuty vlastnosti slova, které se osvědčily jako účinné atributy při detekci chyb.
Výslovnostní rysy češtiny - dialektová analýza
Michlíková, Vendula ; Peterek, Nino (vedoucí práce) ; Korvas, Matěj (oponent)
Implementovali jsme nástroj Výrče:SW pro neasistovaný sběr zvukových nahrávek s nastavitelnými nahrávacími scénáři, které umožňují také analýzu vytvořených dat a zobrazování výsledků. S pomocí vytvořeného nástroje jsme sesbírali Výrče:Korpus, převážně čtený korpus o 2376 nahrávkách od 34 mluvčích v celkové délce 7 hodin. Součástí korpusu jsou také vyplněné dotazníky mluvčích pro přesné určení dialektologické příslušnosti a spolehlivosti. Dostatek mluvčích pro nářeční analýzu pochází ze středočeské oblasti nářečí a ze slezské oblasti nářečí. Na těchto dvou nejpočetnějších skupinách v korpusu jsme natrénovali jednoduchý monofonémový rozpoznávač nářeční oblastí založený na skrytých Markovovských modelech. Powered by TCPDF (www.tcpdf.org)
Distribuovaný systém pro ověřování vlastností přirozených čísel
Tomisová, Martina ; Mírovský, Jiří (vedoucí práce) ; Peterek, Nino (oponent)
Výsledkem práce je systém pro distribuované ověřování vlastností přirozených čísel. Systém má dvě části - klientskou a serverovou. Komunikace mezi nimi probíhá přes HTTP protokol. Server distribuuje zadání (přirozená čísla) a ukládá výsledky (vlastnost čísel) od klientů. Klienti provádí výpočty. Zadáním jednoho výpočtu je jedno přirozené číslo, výsledkem rovněž. Distribucí výpočtů je možné ověřit danou vlastnost pro více přirozených čísel. Konkrétní postup pro výpočet lze klientu poskytnout jako modul. Součástí práce jsou dva příklady modulů. První je jednoduchý a slouží jako vzor pro jejich vytváření. Druhý modul určuje, zda je číslo prvočíslo. Je v něm zahrnuta vlastní knihovna pro aritmetiku dlouhých čísel. Server tedy může distribuovat (potenciálně velká) čísla, klient ověří, zda dané číslo je prvočíslo.
Spoken Language Translation via Phoneme Representation of the Source Language
Polák, Peter ; Bojar, Ondřej (vedoucí práce) ; Peterek, Nino (oponent)
Revidujeme tradičný dvojkrokový prístup automatického rozpoznávania reči pre pre- klad hovoreného jazyka. Namiesto konvenčných grafémov používame fonémy ako reprezen- táciu reči v medzikroku. Počnúc akustickým modelom, revidujeme prenos medzi jazykmi a navrhujeme "coarse-to-fine" metódu, ktorá poskytuje ďalšie zrýchlenie konvergencie a zvýšenie výkonu. Ďalej skúmame prekladový model. Experimentujeme so zdrojovým a cieľovým kódovaním a zvyšujeme robustnosť pomocou fine-tuningu a transferu medzi ASR a SLT. Empiricky dokumentujeme, že toto konvenčné nastavenie s alternatívnou reprezentáciou nielen dobre funguje na štandardných testovacích súboroch, ale tiež posky- tuje kvalitné transkripty a preklady na náročných (napr. nerodilých) testovacích dátach. Náš ASR systém prekonáva komerčné ASR systémy. 1
Multilingual speech synthesis
Nekvinda, Tomáš ; Dušek, Ondřej (vedoucí práce) ; Peterek, Nino (oponent)
Tato práce se zabývá vícejazyčnou syntézou řeči. Porovnali jsme tři odlišné modely, které jsou založeny na Tacotronu. Tyto modely se liší především v přístupu ke sdílení infor- mací a parametrů mezi jazyky. Dva z nich navazují na současné systémy pro vícejazyčnou konverzi textu na řeč. První využívá plně sdíleného enkodéru a doménově specifického klasifikátoru, který je modifikovaný za účelem odstranění informací, které závisí na syn- tetizovaném hlase, z enkodéru. Druhý model používá separátní enkodér pro každý jazyk. V této práci navrhujeme nový přístup, který kombinuje nejlepší z obou zmíněných metod. Díky technikám metaučení umožnujě efektivní sdílení parametrů při zachování flexibility. Tyto tři modely porovnáváme na dvou úlohách. Jedna z nich se zaměřuje na sdružené vícejazyčné učení na deseti jazycích a odhaluje možnosti porovnávaných modelů sdílet znalosti mezi jazyky. Druhá se zabývá syntézou vět, které obsahují výrazy z několika různých jazyků. Dokládáme, že náš nový přístup umožˇuje efektivní sdílení informace mezi jazyky a že dle subjektivního hodnocení produkuje přirozenější řeč bez častých přeřeků a chyb ve výslovnosti.

Národní úložiště šedé literatury : Nalezeno 29 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.