National Repository of Grey Literature 5 records found  Search took 0.00 seconds. 
Methods for Realtime Voice Deepfakes Creation
Alakaev, Kambulat ; Pleško, Filip (referee) ; Malinka, Kamil (advisor)
Tato práce zkoumá možnosti generování hlasových deepfake v reálném čase pomocí nástrojů s otevřeným zdrojovým kódem. Experimenty bylo zjištěno, že rychlost generování hlasových deepfakes je ovlivněna výpočetním výkonem zařízení, na kterých jsou nástroje pro tvorbu řeči spuštěny. Byl identifikován model hlubokého učení, který je schopen generovat řeč téměř v reálném čase. Omezení nástroje obsahujícího tento model však bránila kontinuálnímu zadávání vstupních dat pro generování v reálném čase. K řešení tohoto problému byl vyvinut program, který tato omezení překonává. Kvalita generovaných deepfakes byla hodnocena jak pomocí modelů pro detekci hlasových deepfake, tak pomocí online průzkumů na lidech. Výsledky ukázaly, že zatímco model dokázal oklamat detekční modely, nebyl úspěšný při oklamání lidí. Tento výzkum upozorňuje na dostupnost nástrojů pro syntézu hlasu s otevřeným zdrojovým kódem a na možnost jejich zneužití jednotlivci k podvodným účelům.
Support Tools for Verifying Human Ability to Detect Deepfakes
Potančok, Patrik ; Malinka, Kamil (referee) ; Firc, Anton (advisor)
Cieľom tejto práce je vytvoriť webovú aplikáciu s použitím PHP a MySQL, ktorá bude testovať schopnosť ľudí rozpoznať deepfake nahrávky a pritom zbierať ich údaje ako dátum narodenia, rodný jazyk, znalosti ďalších jazykov, koľkokrát a ako dlho počúvali nahrávku a počet správnych odpovedí. Aplikácia zahŕňa správu nahrávok a používateľov, a možnosť exportu údajov používateľov vo formáte CSV. Aplikácia bola implementovaná s použitím Laravel, Vue.js a MySQL.
Differential-based deepfake speech detection
Staněk, Vojtěch ; Černocký, Jan (referee) ; Firc, Anton (advisor)
Technologie deepfake řeči umožňuje vytvářet velmi realistické sytnetické nahrávky. Tato možnost představuje významné riziko, neboť hrozí její zneužití v mnoha oblastech, od milionových podvodů po rozporování pravosti důkazních materiálů. Tato diplomová práce představuje inovativní metodu pro detekci takových deepfake nahrávek, a to s využitím reálných nahrávek řečníka. Na rozdíl od ostatních přísupů využívá pravé nahrávky k získání důležité dodatečné informace o mluvčím. Porovnáním opravdových nahrávek s potenciálně upravenými nebo vygenerovanými lze efektivně a spolehlivě určit pravost řeči na nahrávce. Dosavadní výsledky ukazují, že tento inovativní přístup může být hodnotným nástrojem v rozpoznávání deepfake řeči, zejména nahrávek vytvořených s využitím technologie konverze hlasu (voice conversion), čímž nabízí zcela nový způsob obrany proti hrozbě deepfake zločinů.
Assessing the Human Ability to Recognize Synthetic Speech
Prudký, Daniel ; Malinka, Kamil (referee) ; Firc, Anton (advisor)
Tato práce reaguje na vývoj umělé inteligence a jejího potencionálního zneužití v oblasti kybernetické bezpečnosti. Jejím cílem je otestovat a ohodnotit lidskou schopnost rozpoznávat podmnožinu syntetické řeči, zvanou hlasový deepfake. Práce popisuje experiment, ve kterém jsme s respondenty komunikovali pomocí hlasových zpráv. Respondentům jsme odprezentovali krycí příběh o tom, že testujeme uživatelskou přívětivost hlasových zpráv a přitom jim tajně během konverzace poslali předpřipravenou deepfake nahrávku a sledovali například jejich reakce, znalosti o deepfakes nebo kolik z respondentů správně určí, která zpráva byla upravená. Výsledky práce ukázali, že žádný z respondentů nezareagoval na podvodnou deepfake zprávu a pouze jeden zpětně přiznal, že si všiml něčeho konkrétního. Na druhou stranu, hlasovou zprávu, která obsahovala deepfake, po experimentu správně označilo 96,8% respondentů. Z výsledků tedy vyplývá, že ačkoli byla deepfake nahrávka snadno identifikovatelná mezi ostatními, nikdo na ni nezareagoval. Práce ukazuje, že lidská schopnost rozpoznávat hlasové deepfakes není na takové úrovni, abychom jí mohli důvěřovat. Pro lidi je velmi obtížné rozlišit mezi skutečnými a falešnými nahrávkami, zvláště pokud je nečekají.
Implementation of 1D mathematical model of vocal cavities into TTS synthesizer – preliminary study
Radolf, Vojtěch ; Horák, Petr
Simplified 1D mathematical models of the human vocal tract were modified for using them in Text-To-Speech systems so that they help to simulate emotional speech. The geometry (area function) of the models for all Czech vowels was modified using the inverse task optimization procedure so that the computed formant frequencies match the measured formant frequencies of utterances of professional speaker. Output acoustic pressure signal generated from the models in wav format sounded satisfactorily for all the vowels and fundamental frequencies varied in an octave range from 77 Hz to 156 Hz. Neverthelles more testing procedures are needed to verify reliability and quickness of the model as well as intelligibility of generated utterances especially in formant TTS system and linear predictive TTS system.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.