Název:
Mutlimediální diff - audio dokumenty
Překlad názvu:
Multimedia Diff - Audio Documents
Autoři:
Komadel, Michal ; Dittrich, Petr (oponent) ; Chmelař, Petr (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá vývojem nástroje, který umožňuje funkci diff nad audio soubory obsahujícími obecný zvuk jako hudbu, řeč a jiné zvuky. Jsou zde uvedeny poznatky z různých oblastí vědy zabývající se zvuky jako například psychoakustiky, zpracování řeči a automatické kategorizace hudby podle žánru. Jsou zde popsány některé algoritmy diffu a také externí nástroje potřebné pro vývoj cílové aplikace. Dále tato práce uvádí návrh a implementaci výsledné aplikace, nastavení použitá pro extrakci charakteristických znaků zvuku a zhodnocení dosažených výsledků.
This work describes development of a diff tool working with audio files containing general sound such as music, speech and other sounds. There are presented facts from different domains of science related to sound, such as psychoacoustics, speech recognition and automatic music genre categorisation. This paper also contains description of some diff algorithms and external tools needed for development of the goal application. Moreover, there is introduced design and implementation of the application, settings used for sound features extraction and evaluation of attained results.
Klíčová slova:
audio dokument; cepstrum mel-frekvence; diff; HTK.; SVD; audio document; diff; HTK.; mel-frequency cepstrum; SVD
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54217