Original title:
Mutlimediální diff - audio dokumenty
Translated title:
Multimedia Diff - Audio Documents
Authors:
Komadel, Michal ; Dittrich, Petr (referee) ; Chmelař, Petr (advisor) Document type: Master’s theses
Year:
2011
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá vývojem nástroje, který umožňuje funkci diff nad audio soubory obsahujícími obecný zvuk jako hudbu, řeč a jiné zvuky. Jsou zde uvedeny poznatky z různých oblastí vědy zabývající se zvuky jako například psychoakustiky, zpracování řeči a automatické kategorizace hudby podle žánru. Jsou zde popsány některé algoritmy diffu a také externí nástroje potřebné pro vývoj cílové aplikace. Dále tato práce uvádí návrh a implementaci výsledné aplikace, nastavení použitá pro extrakci charakteristických znaků zvuku a zhodnocení dosažených výsledků.
This work describes development of a diff tool working with audio files containing general sound such as music, speech and other sounds. There are presented facts from different domains of science related to sound, such as psychoacoustics, speech recognition and automatic music genre categorisation. This paper also contains description of some diff algorithms and external tools needed for development of the goal application. Moreover, there is introduced design and implementation of the application, settings used for sound features extraction and evaluation of attained results.
Keywords:
audio document; diff; HTK.; mel-frequency cepstrum; SVD; audio dokument; cepstrum mel-frekvence; diff; HTK.; SVD
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54217