Matějka, Pavel - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: Matějka, Pavel

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Hledání nových cest v rozpoznávání řečníka založeného na neuronových sítích Sova, Damián ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce) Keďže zadanie tejto práce je veľmi široké, tak sa bolo treba sústrediť len na určitú sféru. Nakoniec, cieľom tejto práce je aplikovať optimalizačnú metódu Stochastického Spriemerovania Váh do tréningového procesu Hlbokej Neurónovej Siete. Po predstavení potrebných teoretických vedomostí v prvej časti práce, nasleduje druhá časť s priebehmi jednotlivých experimentov. V teoretickej časti je dôraz kladený hlavne na objasnenie celého životného cyklu trénovacieho a vyhodnocovacieho procesu, vrátane popisu jednotlivých komponentov. Praktická časť poskytuje podrobný pohľad na každý experiment, ktorých cieľom je demonštrovať dosiahnuteľnosť zvýšenia výkonnosti systému rozpoznávania rečníka. Celkové zlepšenie výkonu sa podarilo dosiahnuť postupným aplikovaním rôznych tréningových konfigurácií, v ktorých sa zohľadňujú skúsenosti z predchádzajúcich experimentov. Kľúčovou zložkou úspešného Stochastického Spriemerovania Váh v experimentoch bola dostatočne vysoká konštantná hodnota Miery Učenia s aplikovaným postupným prechodom alebo Cyklický priebeh Miery Učenia. Úplný záznam
	Unsupervised Evaluation of Speaker Recognition System Odehnal, Ondřej ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce) The context of this thesis is the state-of-the-art system for speaker identification (SID) based on the deep nerual network with x-vector embeddings. This thesis aims to propose and experimentally assess several techniques for evaluating the SID system using unlabelled datasets. For this purpose, discriminative embedding is created for every recording in the dataset. These embeddings are used to cluster the recordings and thus create pseudo-labels corresponding to different clusters. The SID system evaluation is based on equal error rate (EER), which uses these pseudo-labels. We proposed several unsupervised learning algorithms to achieve this; K-means, Gaussian mixture models (GMM), and agglomerative hierarchical clustering (AHC). After thorough testing, the K-means model with the Silhouette value showed the best results. This method achieved an estimate of 5.72 % EER with the reference EER equal to 5.15 % on SITW dev-core-core. Similar results were observed on the SITW eval-core-core, where the estimated EER is equal to 5.86 % and the reference 5.08 %. The difference between estimated and reference EER is 0.57 % for the dev-core-core and 0.78 % for the eval-core-core. Another series of experiments were conducted on NIST SRE16 and VoxCeleb1 to verify robustness of the proposed method. Generally, the developed testing process had an estimated error of around 1 % in all test databases, an excellent result for an unsupervised learning technique. Úplný záznam
	Odhad obličeje z řečového signálu Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce) Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu. Úplný záznam
	Teoretický a experimentální rozvoj Ramanovy optické aktivity jako metody studia biomolekul ve vodním prostředí Kapitán, Josef ; Baumruk, Vladimír (vedoucí práce) ; Matějka, Pavel (oponent) ; Sychrovský, Vladimír (oponent) Úplný záznam
	Magnetic circular dichroism and aromatic compounds Štěpánek, Petr ; Bouř, Petr (vedoucí práce) ; Matějka, Pavel (oponent) ; Srnec, Martin (oponent) Název práce: Magnetický cirkulární dichroismus a aromatické sloučeniny Autor: Petr Štěpánek Katedra/Ústav: Ústav organické chemie a biochemie AV ČR, v.v.i. Vedoucí disertační práce: prof. RNDr. Petr Bouř, DSc., Ústav organické chemie a biochemie AV ČR, v.v.i. Abstrakt: Práce představuje sérii studií zabývajících se magnetickým cirkulárním dichroismem (MCD), spektroskopickou metodou, u které v posledních letech došlo k intenzívnímu teoretickému rozvoji. Díky vývoji kvantově-chemických pro- gramů se otevírají nové možnosti výpočtů a interpretace MCD spekter větších a různorodějších molekul než bylo doposud možné. V představovaných studiích jsme využili nově vyvinutých výpočetních prostředků k rozšíření možných aplikací MCD a představujeme zde MCD například jako metodu pro získání informace o struktuře fullerenů. Dále jsme studovali vliv konformace a implicitního a explic- itního rozpouštědla na MCD spektra aromatických amino kyselin s pomocí nově implementovaného alternativního výpočetního postupu využívajícího sčítání přes excitované stavy. Představujeme také teoretické předpovědi spekter nukleárního spinově-indukovaného cirkulárního dichroismu coby nové strukturně-analytické metody.... Úplný záznam
	Spectroscopy of Conducting Polymers Thin Films Šeděnková, Ivana ; Trchová, Miroslava (vedoucí práce) ; Matějka, Pavel (oponent) ; Vohlídal, Jiří (oponent) Úplný záznam
	Odhad obličeje z řečového signálu Kyjonka, Mojmír ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce) Tato práce se zaobírá problematikou rekonstrukce obličeje na základě hlasu. V rámci této práce je prozkoumán současný stav této problematiky a následně je natrénován model pro generování obličeje z krátké audionahrávky. Natrénovaný model vychází z práce "Reconstructing faces from voices", jenž je založen na architektuře GAN. V této práci byly použity datasety VGGFace, VoxCeleb. Pro účely bakalářské práce byl vytvořen malý audiovizuální dataset česky mluvících osob. Práce je implementovaná pomocí skriptovacího jazyka Python s využitím knihovny PyTorch. Úplný záznam
	Analýza audio hovoru mezi dvěma účastníky Polok, Alexander ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce) Cílem této práce je analýza psychoterapeutických sezení. Z audionahrávek jsou extrahovány klasifikátory, které popisují proběhlou terapii. Ty jsou následně agregovány, porovnány s ostatními sezeními a graficky prezentovány v podobě zprávy shrnující daný rozhovor. Terapeutům je tímto způsobem k proběhlým sezením poskytnuta zpětná vazba, která může sloužit k profesnímu růstu a kvalitnější psychoterapii v budoucnu. Úplný záznam
	Detection of Pre-Recorded Messages in Speech Boboš, Dominik ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce) Recognition of pre-recorded messages in speech is useful for any follow-up speech data mining. This thesis summarises the theory of searching similar utterances in speech and efficient approaches to compare two sequences. To investigate identification of redundant information in audio, it is necessary to have a large amount of data with the exact phrases repeated multiple times. We generated a dataset by mixing pre-recorded messages into phone calls with variations in speed, volume and repetitions. Our system tackles known messages and unknown messages'' scenarios by using approaches like clustering or detection in chunks. Dynamic time warping, approximate string matching and recurrent quantification analysis are compared, and finally, all mentioned techniques are combined to obtain a precise and efficient system. Úplný záznam
	Robustní rozpoznávání mluvčího pomocí neuronových sítí Profant, Ján ; Rohdin, Johan Andréas (oponent) ; Matějka, Pavel (vedoucí práce) Tématem této práce je analýza nejmodernějších systémů pro rozpoznávání řečníka za použití neurónových sítí (nazývaných x-vektory) v rozličných podmínkách, jako jsou širokopásmové a úzkopásmové data, který je robustní vůči neviděnému jazyku, specifickému hluku nebo telefonnimu kodeku. Automatický systém mapuje zvukovou nahrávku variabilní délky do fixně dlouhého vektoru, který je následně využit jako reprezentace řečníka. V této práci jsme porovnali systémy založené na neurónových sítich s výsledkem VUT týmu v Speakers in the Wild Speaker Recognition Challenge (SITW), který využíval donedávna velmi populární statistický model - i-vektory. Pozorovali jsme, že s nedávno publikovanými x-vektory dosahujeme 4.38 krát nižší Equal Error Rate pro SITW core-core evaluační sadu v porovnání s výsledkem z roku 2016 od VUT v SITW soutěži. Kromě toho jsme ukázali, že diarizace v nahrávkach s více mluvčími významně snižuje chybovost systému pro SITW core-multi evaluační data, ale podobný trend jsme neviděli pro dataset NIST SRE 2018 VAST. Úplný záznam

Viz též: podobná jména autorů
10	MATĚJKA, Petr
10	Matějka, Petr

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English