National Repository of Grey Literature 4 records found  Search took 0.01 seconds. 
Semi-Supervised Speech-to-Text Recognition with Text-to-Speech Critic
Baskar, Murali Karthick ; Manohar, Vimal (referee) ; Trmal, Jan (referee) ; Burget, Lukáš (advisor)
Modely pro automatické rozpoznávání řeči (ASR) vyžadují pro dosažení přijatelné přesnosti velké množství trénovacích dat. Z tohoto důvodu se v poslední době zvýšil zájem o trénování seq2seq modelů bez dohledu a s částečným dohledem. Tato práce vychází z nedávných výsledků, které ukázaly výrazné zlepšení trénování s částečným dohledem pomocí cyklické konzistence a souvisejících technik. Ty využívají trénovací postupy a kritéria schopná pomocí kombinace ASR s modely převodu textu na řeč (TTS) zužitkovat nesouvisející řečová a/nebo textová data.  Tato práce nejprve navrhuje nový rámec pro modelování kombinující diferencovatelné end-to-end kritérium ASR->TTS s kritériem TTS->ASR. Tato metoda dokáže využít nesouvisející řečová a textová data a překonat související techniky ve slovní chybovosti (WER). Práce obsahuje rozsáhlou sadu výsledků analyzujících vliv množství dat i vliv podílu řeči a textu na opravách chyb. Výsledky dokládají konzistentní zlepšení na korpusech WSJ a LibriSpeech.   Práce se rovněž zabývá omezeními modelu ASR<->TTS v podmínkách mimo doménu trénovacích dat (out-of-domain). Navrhujeme vylepšený model ASR<->TTS (EAT), zahrnující dva klíčové komponenty: 1) směr ASR->TTS je doplněn jazykovým model, který penalizuje hypotézy ASR před jejich vstupem do TTS; a 2) ve směru TTS->ASR je zavedena regularizace trénovaná bez dohledu tak, aby opravovala syntetizovanou řeč před vstupem do modelu ASR. Zkoumáme strategie trénování a účinnost modelu EAT a porovnáme jej s přístupy umělého zvyšování množství (augmentace) dat. Výsledky ukazují, že model EAT snižuje rozdíl v úspěšnosti mezi trénováním bez dohledu a trénováním s částečným dohledem absolutně o 2,6% WER na LibriSpeech datech a o 2,7% WER na BABEL datech.
Automated speaker for orienteering races
Šabata, Milan ; Lázna, Tomáš (referee) ; Chromý, Adam (advisor)
This work describes an automatic commentator application for a sport called orienteering. This is an autonomous commentary on the ongoing race. The reason is to increase the attractiveness for the average viewer.Communication with humans is guaranteed using the text to speech function. The application uses inputs directly from the plant premises with the help of RACOM, where it then decides and selects interesting moments using an algorithm and a mathematical formula.
Automated speaker for orienteering races
Šabata, Milan ; Lázna, Tomáš (referee) ; Chromý, Adam (advisor)
This work describes an automatic commentator application for a sport called orienteering. This is an autonomous commentary on the ongoing race. The reason is to increase the attractiveness for the average viewer.Communication with humans is guaranteed using the text to speech function. The application uses inputs directly from the plant premises with the help of RACOM, where it then decides and selects interesting moments using an algorithm and a mathematical formula.
Sound interface in application for the blind
Načeradský, Hynek ; Samec, Marek (advisor) ; Vacek, Martin (referee)
This work addresses use of sound interface in application for blind users. Correct application design is achieved by analysis of similar applications and by assesment of problematic areas in creation of applications for blind users. This work suggests rules for solving these problematic areas, which are underlined in practical part. Practical part of this work is mainly focused on design and creation of application, which offers alternative approach to file management. Application is based on speech synthesis and accessibility for blind users, which is achieved by use of open source libraries. The main benefit of this work is suggesting rules, which can serve in creating accessible applications and realization of application, which is based on those rules.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.