Národní úložiště šedé literatury Nalezeno 145 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Odhad obličeje z řečového signálu
Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce)
Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu.
Hledání nových cest v rozpoznávání řečníka založeného na neuronových sítích
Sova, Damián ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce)
Keďže zadanie tejto práce je veľmi široké, tak sa bolo treba sústrediť len na určitú sféru. Nakoniec, cieľom tejto práce je aplikovať optimalizačnú metódu Stochastického Spriemerovania Váh do tréningového procesu Hlbokej Neurónovej Siete. Po predstavení potrebných teoretických vedomostí v prvej časti práce, nasleduje druhá časť s priebehmi jednotlivých experimentov. V teoretickej časti je dôraz kladený hlavne na objasnenie celého životného cyklu trénovacieho a vyhodnocovacieho procesu, vrátane popisu jednotlivých komponentov. Praktická časť poskytuje podrobný pohľad na každý experiment, ktorých cieľom je demonštrovať dosiahnuteľnosť zvýšenia výkonnosti systému rozpoznávania rečníka. Celkové zlepšenie výkonu sa podarilo dosiahnuť postupným aplikovaním rôznych tréningových konfigurácií, v ktorých sa zohľadňujú skúsenosti z predchádzajúcich experimentov. Kľúčovou zložkou úspešného Stochastického Spriemerovania Váh v experimentoch bola dostatočne vysoká konštantná hodnota Miery Učenia s aplikovaným postupným prechodom alebo Cyklický priebeh Miery Učenia.
Robustní rozpoznávání mluvčího pomocí neuronových sítí
Profant, Ján ; Rohdin, Johan Andréas (oponent) ; Matějka, Pavel (vedoucí práce)
Tématem této práce je analýza nejmodernějších systémů pro rozpoznávání řečníka za použití neurónových sítí (nazývaných x-vektory) v rozličných podmínkách, jako jsou širokopásmové a úzkopásmové data, který je robustní vůči neviděnému jazyku, specifickému hluku nebo telefonnimu kodeku. Automatický systém mapuje zvukovou nahrávku variabilní délky do fixně dlouhého vektoru, který je následně využit jako reprezentace řečníka. V této práci jsme porovnali systémy založené na neurónových sítich s výsledkem VUT týmu v Speakers in the Wild Speaker Recognition Challenge (SITW), který využíval donedávna velmi populární statistický model - i-vektory. Pozorovali jsme, že s nedávno publikovanými x-vektory dosahujeme 4.38 krát nižší Equal Error Rate pro SITW core-core evaluační sadu v porovnání s výsledkem z roku 2016 od VUT v SITW soutěži. Kromě toho jsme ukázali, že diarizace v nahrávkach s více mluvčími významně snižuje chybovost systému pro SITW core-multi evaluační data, ale podobný trend jsme neviděli pro dataset NIST SRE 2018 VAST.
Rešerše automatické výměny nástrojů u frézovacích center
Podloucký, Milan ; Matějka, Petr (oponent) ; Pavlík, Jan (vedoucí práce)
Cílem této bakalářské práce je vytvoření rešerše a uceleného roztřídění v současnosti používaných zařízení pro automatickou výměnu nástrojů u frézovacích center.
Aplikace průmyslových robotů v oblasti tváření
Coufal, Jiří ; Matějka, Petr (oponent) ; Knoflíček, Radek (vedoucí práce)
Bakalářská práce má seznámit čtenáře s aplikací průmyslových robotů a manipulátorů v oblasti tváření. Jsou zde popsány vybrané způsoby tváření kovů a typické tvářecí stroje, zvláště druhy průmyslových robotů a manipulátorů (rozdělení, klasifikace, výrobci). Práce také popisuje současnost používání průmyslových robotů a manipulátorů v průmyslových odvětvích a v technologii tváření kovů. Veškerá problematika je názorně zobrazena na charakteristických obrázcích s popisky.
Detekce lidské řeči v audio nahrávce
Břenek, Roman ; Grézl, František (oponent) ; Matějka, Pavel (vedoucí práce)
Tato práce se zabývá technikami detekce lidské řeči v nahrávkách. Je nutné při rozpoznávání správně klasifikovat všechny neřečové segmenty a naopak rozpoznat veškerou řeč i v hlučných a zašuměných prostředích. V práci je popsán celý proces rozpoznávání, tzn. digitalizace audio signálu, extrakce příznaků, trénování klasifikátoru, rozpoznávání a samotné vyhodnocení a úpravy před vyhodnocením. Pro rozpoznávání byly použity tři systémy, z nichž jeden je založen na fonémovém rozpoznávání pomocí neuronových sítí, další dva jsou založené na GMM, přičemž každý systém byl testován na třech datových sadách - Tactical Speaker Identification Speech Corpus (TSID), Ham Radio (HR) a Rich Transcription Evaluation (RT05-RT07).  Nejlepší výsledky každého systému jsou pak zhodnoceny i s výsledky třetích stran.
Konstrukce vidlicové azimutální montáže astronomického dalekohledu
Dostál, Jan ; Matějka, Petr (oponent) ; Pavlík, Jan (vedoucí práce)
Cílem této diplomové práce bylo navrhnout konstrukční řešení montáže astronomického dalekohledu vidlicového typu s nosností do 20kg a to včetně náhonu obou os. Obsahem řešení je návrh variant vidlicových montáží, výpočtová dokumentace, konstrukční návrh a výkresová dokumentace hřídele, vidlice a sestavy montáže.
Speaker Recognition Based on Long Temporal Context
Fér, Radek ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
This work deals with temporal features for automated speaker recognition. We give overview of currently known temporal feature extraction methods and afterwards, we propose and preliminarily evaluate a general phoneme-level temporal feature extraction scheme based on factor analysis i-vector paradigm. Much effort has been made to reasonably represent temporal context and make speaker recognition systems more robust, namely speech prosody modeling. Our approach does not explicitly model any temporal parameters of speech, rather it uses the occurrence of neighboring frames as a source of temporal information. We test and analyze this method on standard evaluation database NIST SRE 2008. The results indicate, however, that for speaker recognition, no useful gain can be obtained using this technique. We describe and discuss this discovery at the end.
Konstrukce hydraulické štípačky dřeva
Šimčík, Jaroslav ; Opl, Miroslav (oponent) ; Matějka, Petr (vedoucí práce)
Bc. Jaroslav Šimčík Konstrukce hydraulické štípačky dřeva DP, Ústav Výrobních strojů, systémů a robotiky, 2010, str. 60, obr. 30, přílohy 7 Tato diplomová práce spadá do oblasti techniky zpracovávající dřevo se zaměřením na konstrukci hydraulické štípačky dřeva se štípací silou 120 kN.
Odhad obličeje z řečového signálu
Kyjonka, Mojmír ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce)
Tato práce se zaobírá problematikou rekonstrukce obličeje na základě hlasu. V rámci této práce je prozkoumán současný stav této problematiky a následně je natrénován model pro generování obličeje z krátké audionahrávky. Natrénovaný model vychází z práce "Reconstructing faces from voices", jenž je založen na architektuře GAN. V této práci byly použity datasety VGGFace, VoxCeleb. Pro účely bakalářské práce byl vytvořen malý audiovizuální dataset česky mluvících osob. Práce je implementovaná pomocí skriptovacího jazyka Python s využitím knihovny PyTorch.

Národní úložiště šedé literatury : Nalezeno 145 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
10 MATĚJKA, Petr
12 Matějka, Pavel
10 Matějka, Petr
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.