Název:
Simulace zkreslení zvukového signálu v percepčním zvukovém kodéru
Překlad názvu:
Simulation of Audio Signal Distortion in Perceptual Audio Encoder
Autoři:
Peloušek, Tomáš ; Rajmic, Pavel (oponent) ; Schimmel, Jiří (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2021
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá problematikou tvorby programu, který simuluje zkreslení vznikající při ztrátovém kódování zvukového signálu, a to v programovacím prostředí MATLAB. V rámci práce byl vytvořen kodér s dynamickou alokací bitů a přepínám délek oken pro váhování, který v závislosti na uživatelském požadavku na velikost datového toku mění výslednou subjektivní kvalitu signálu. Teoretická část představuje rešerši základních principů ztrátového kódování a detailněji popisuje fungování kodéru standardu MPEG 1 vrstva 3. V praktické části je pak popsán princip fungování realizovaného programu a jeho součástí. Dále je provedeno srovnání kvality výstupu programu pro různé úrovně zkreslení s odpovídajícím nastavením u běžně dostupného kodéru MP3 a to pomocí metody PEMO-Q.
This thesis deals with the issue of the creation of a programme that would simulate the distortion that appears during the process of lossy audio coding. As the environment for the creation, the MATLAB programming language has been chosen. An encoder, which changes the subjective signal quality according to customer preferences for the bitrate, has been created as a practical part of this thesis. Its function is based on a dynamic bit allocation technique and includes an optional window switching algorithm. The theoretical background for the creation of the programme consists of an explanation of the main principles of lossy coding with emphasis on MPEG1 layer 3 operating principles. The practical chapter describes how the created programme and its parts work, and it includes results of the run quality testing. The testing was conducted using the objective assessment method PEMO-Q, and consisted of comparing the objective quality of the programme’s outputs to the quality of samples on which a regular MP3 encoder with identical settings was used.
Klíčová slova:
alokace bitů; MP3; MPEG-1 vrstva 3; PEMO-Q; percepční kódování; psychoakustický model; přepínání délek oken; bit allocation; MP3; MPEG-1 layer 3; PEMO-Q; perceptual encoding; psychoacoustic model; window switching
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/197098