National Repository of Grey Literature 8 records found  Search took 0.02 seconds. 
Aligning pre-trained models for spoken language translation
Sedláček, Šimon ; Beneš, Karel (referee) ; Kesiraju, Santosh (advisor)
Tato práce zkoumá nový end-to-end přístup k překladu mluveného jazyka (ST) využívající předtrénovaných modelů pro přepis řeči (ASR) a strojový překlad (MT), propojené malým spojovacím modulem (Q-Former, STE). Ten má za úkol překlenout mezeru mezi modalitami řeči a textu mapováním embedding reprezentací ASR enkodéru do latentního prostoru reprezentací MT modelu. Během trénování jsou zvolené ASR a MT model zmrazeny, laděny jsou pouze parametry spojovacího modulu. Trénování a evaluace jsou prováděny na datasetu How2, obsahujícím ST data z Angličtiny do Portugalštiny. V našich experimentech zjišťujeme, že většina sladěných systémů překonává referenční kaskádový ST systém, přičemž využívají stejné základní modely. Navíc, při zachování konstantní a ve srovnání malé (10M parametrů) velikosti spojovacího modulu, větší a silnější ASR a MT modely univerzálně zlepšují výsledky překladu. Zjišťujeme, že spojovací moduly mohou také sloužit jako doménové adaptéry pro zvolené základní systémy, kdy významně zlepšují výsledky překladu ve sladěném ST prostředí, a to i oproti holému MT výkonu daného MT modelu. Nakonec navrhujeme proceduru pro předtrénování spojovacího modulu s potenciálem snížit množství ST dat potřebných pro trénink obdobných sladěných systémů.
Personal Voice Activity Detection
Sedláček, Šimon ; Landini, Federico Nicolás (referee) ; Švec, Ján (advisor)
Cílem této práce je implementovat, otestovat a vyhodnotit řečníkem podmíněnou metodu pro detekci hlasu ( Voice Activity Detection , VAD) nazvanou Personal VAD. Pro detekci využívá tato metoda LSTM neuronových sítí a jejím účelem je vytvoření systému schopného spolehlivě detekovat řečové signály cílového řečníka při zachování vlastností typického VAD systému co se velikosti modelu, odezvy a nízkých nároků na zdroje týče. Systém je trénován pro klasifikaci řečových rámců do tří tříd: neřeč, řeč necílového a řeč cílového řečníka. Za tímto účelem využívá metoda speaker embedding vektory pro reprezentaci cílového řečníka jako součást vstupních příznaků. Některé z náročnějších variant systému využívají skórování rámců systémem pro verifikaci řečníka, což vede ke zvýšení spolehlivosti klasifikace. Vedle základní metody skórování představené v originálním článku byly navrženy dvě modifikace, jež základní metodu překonaly a zlepšily spolehlivost výsledného systému i v akusticky náročných prostředích.
The Impact of Media on Consumer Behaviour in the Energy Sector
Sedláček, Štěpán ; Hála, Tomáš (referee) ; Langerová, Petra (referee) ; Šedrlová, Magdalena (advisor)
This bachelor thesis deals with the analysis of the aspects that prevent or allow the integration of the principles of social networks into the system of smart meters as well as the study of their potential and possibilities of implementation. The issue of how the future smart grid consumer will benefit from the future smart city grid services are hot topics. Here, a survey is presented that focuses on these aspects. An analysis of the survey results and key messages identifies view of the people on the topic and proposes directions that may be followed when designing applications and services of residential smart city consumers.
Authorship and actorship on Czech Wikipedia
Sedláček, Štěpán ; Abu Ghosh, Yasar (advisor) ; Kuřík, Bohuslav (referee)
The author carried out an ethnographic study of Czech Wikipedia in which he mapped human and non-human actors involved in the creation of an internet encyclopedia. As part of this process, he himself became one of the users and reflected how authorship, collective compiling of meanings, and supervision are constructed.
Personal Voice Activity Detection
Sedláček, Šimon ; Landini, Federico Nicolás (referee) ; Švec, Ján (advisor)
Cílem této práce je implementovat, otestovat a vyhodnotit řečníkem podmíněnou metodu pro detekci hlasu ( Voice Activity Detection , VAD) nazvanou Personal VAD. Pro detekci využívá tato metoda LSTM neuronových sítí a jejím účelem je vytvoření systému schopného spolehlivě detekovat řečové signály cílového řečníka při zachování vlastností typického VAD systému co se velikosti modelu, odezvy a nízkých nároků na zdroje týče. Systém je trénován pro klasifikaci řečových rámců do tří tříd: neřeč, řeč necílového a řeč cílového řečníka. Za tímto účelem využívá metoda speaker embedding vektory pro reprezentaci cílového řečníka jako součást vstupních příznaků. Některé z náročnějších variant systému využívají skórování rámců systémem pro verifikaci řečníka, což vede ke zvýšení spolehlivosti klasifikace. Vedle základní metody skórování představené v originálním článku byly navrženy dvě modifikace, jež základní metodu překonaly a zlepšily spolehlivost výsledného systému i v akusticky náročných prostředích.
The Impact of Media on Consumer Behaviour in the Energy Sector
Sedláček, Štěpán ; Hála, Tomáš (referee) ; Langerová, Petra (referee) ; Šedrlová, Magdalena (advisor)
This bachelor thesis deals with the analysis of the aspects that prevent or allow the integration of the principles of social networks into the system of smart meters as well as the study of their potential and possibilities of implementation. The issue of how the future smart grid consumer will benefit from the future smart city grid services are hot topics. Here, a survey is presented that focuses on these aspects. An analysis of the survey results and key messages identifies view of the people on the topic and proposes directions that may be followed when designing applications and services of residential smart city consumers.
Authorship and actorship on Czech Wikipedia
Sedláček, Štěpán ; Abu Ghosh, Yasar (advisor) ; Kuřík, Bohuslav (referee)
The author carried out an ethnographic study of Czech Wikipedia in which he mapped human and non-human actors involved in the creation of an internet encyclopedia. As part of this process, he himself became one of the users and reflected how authorship, collective compiling of meanings, and supervision are constructed.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.