Název:
Development of a cloud platform for automatic speech recognition
Překlad názvu:
Development of a cloud platform for automatic speech recognition
Autoři:
Klejch, Ondřej ; Jurčíček, Filip (vedoucí práce) ; Bojar, Ondřej (oponent) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
eng
Abstrakt: [eng][cze] This thesis presents a cloud platform for automatic speech recognition, CloudASR, built on top of Kaldi speech recognition toolkit. The platform sup- ports both batch and online speech recognition mode and it has an annotation interface for transcription of the submitted recordings. The key features of the platform are scalability, customizability and easy deployment. Benchmarks of the platform show that the platform achieves comparable performance with Google Speech API in terms of latency and it can achieve better accuracy on limited domains. Furthermore, the benchmarks show that the platform is able to handle more than 1000 parallel requests given enough computational resources. 1Tato diplomová práce představuje cloudovou platformu pro automatické rozpoznávání řeči, CloudASR, která je postavena na systému pro rozpoznávání řeči Kaldi. Platforma podporuje dávkový a online způsob rozpoznávání řeči a také obsahuje anotační prostředí pro přidávání přepisů k odeslaným nahrávkám. Mezi klíčové vlastnosti této platformy patří škálovatelnost, přizpůsobitelnost a jednoduchý proces nasazení. Provedená měření dokázala, že latence platformy je porovnatelná s latencí Google Speech API a přesnost přepisů na omezených doménách může být dokonce lepší. Dále bylo ukázáno, že je platforma schopná zpracovat více než 1000 paralelních dotazů, pokud má dostatek výpočetních zdrojů. 1
Klíčová slova:
cloud; Kaldi; rozpoznávání řeči; automatic speech recognition; cloud; Kaldi