Original title:
Identifikace známých segmentů ve zvukovém signálu pomocí strojového učení
Translated title:
Identification of specified segments in the audio signal using machine learning
Authors:
Pařízek, Radim ; Galáž, Zoltán (referee) ; Zvončák, Vojtěch (advisor) Document type: Bachelor's theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Bakalářská práce se věnuje návrhu systému pro identifikaci zvuků přírodního prostředí ve zvukovém záznamu. V práci jsou prozkoumány datasety a modely využívané pro tento typ úloh a je popsána jejich struktura. Byly navrhnuty systémy pro identifikaci zvuků v jedné vrstvě a ve dvou vrstvách pro sedm vybraných označení. Klasifikátor použitý pro tento systém byl vytvořen přetrénováním transformer modelu z platformy Hugging Face. Byly zhodnoceny výsledky dvou přístupů trénování a jednoho systému pro identifikaci.
The bachelor thesis deals with the design of a system for the identification of natural environmental sounds in audio recordings. The datasets and models used for this type of tasks are surveyed and their structure is described. A system for the identification of sounds in one layer and in two layers has been proposed for seven selected labels. The classifier used for this system was created by fine-tuning a transformer model from the Hugging Face platform. The results of two training approaches and one identification system were evaluated.
Keywords:
AST; dataset; ESC; machine learning; neural networks; PyTorch; transformer; AST; dataset; ESC; neuronové sítě; PyTorch; strojové učení; transformer
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/210882