National Repository of Grey Literature 2 records found  Search took 0.00 seconds. 
Aligning pre-trained models for spoken language translation
Sedláček, Šimon ; Beneš, Karel (referee) ; Kesiraju, Santosh (advisor)
Tato práce zkoumá nový end-to-end přístup k překladu mluveného jazyka (ST) využívající předtrénovaných modelů pro přepis řeči (ASR) a strojový překlad (MT), propojené malým spojovacím modulem (Q-Former, STE). Ten má za úkol překlenout mezeru mezi modalitami řeči a textu mapováním embedding reprezentací ASR enkodéru do latentního prostoru reprezentací MT modelu. Během trénování jsou zvolené ASR a MT model zmrazeny, laděny jsou pouze parametry spojovacího modulu. Trénování a evaluace jsou prováděny na datasetu How2, obsahujícím ST data z Angličtiny do Portugalštiny. V našich experimentech zjišťujeme, že většina sladěných systémů překonává referenční kaskádový ST systém, přičemž využívají stejné základní modely. Navíc, při zachování konstantní a ve srovnání malé (10M parametrů) velikosti spojovacího modulu, větší a silnější ASR a MT modely univerzálně zlepšují výsledky překladu. Zjišťujeme, že spojovací moduly mohou také sloužit jako doménové adaptéry pro zvolené základní systémy, kdy významně zlepšují výsledky překladu ve sladěném ST prostředí, a to i oproti holému MT výkonu daného MT modelu. Nakonec navrhujeme proceduru pro předtrénování spojovacího modulu s potenciálem snížit množství ST dat potřebných pro trénink obdobných sladěných systémů.
Deep Learning for 3D Mesh Registration
Pukanec, Dávid ; Beran, Vítězslav (referee) ; Španěl, Michal (advisor)
Zosúhlasovanie 3D modelov je často robené za pomoci registrácie mračien bodov. Úloha registrátie spočíva v nájdení transformácie, ktorá na seba zarovná dané mračná bodov. Existuje mnoho metód založených na hlbokom učení, ktoré sa daju deliť do dvoch kategórií. Tieto metódy zvyčajne poskytujú vyhodnotenie v rámci jednej kategórie a navyše na ro- zličných datasetoch či metrikách. Táto práca sa zaoberá hlbším prieskumom metód Lepard a FINet. Za pomoci datasetov ModelNet40 a Teeth3DS je vykonaná séria experimentov zameriavajúca sa na zložíté prípady registrácie. Experimenty ukázali, že FINet dokáže zarovnať predtým nevidené tvary s translačnou chybou 4.16% veľkosti modelu a rotačnou chybou 3.640 stupňov. Zatiaľ čo Lepard má translačnú chybu 6.73% veľkosti modelu a rotačnú chybu 7.265 stupňov.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.