Název:
Identifikace známých segmentů ve zvukovém signálu pomocí strojového učení
Překlad názvu:
Identification of specified segments in the audio signal using machine learning
Autoři:
Pařízek, Radim ; Galáž, Zoltán (oponent) ; Zvončák, Vojtěch (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2023
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Bakalářská práce se věnuje návrhu systému pro identifikaci zvuků přírodního prostředí ve zvukovém záznamu. V práci jsou prozkoumány datasety a modely využívané pro tento typ úloh a je popsána jejich struktura. Byly navrhnuty systémy pro identifikaci zvuků v jedné vrstvě a ve dvou vrstvách pro sedm vybraných označení. Klasifikátor použitý pro tento systém byl vytvořen přetrénováním transformer modelu z platformy Hugging Face. Byly zhodnoceny výsledky dvou přístupů trénování a jednoho systému pro identifikaci.
The bachelor thesis deals with the design of a system for the identification of natural environmental sounds in audio recordings. The datasets and models used for this type of tasks are surveyed and their structure is described. A system for the identification of sounds in one layer and in two layers has been proposed for seven selected labels. The classifier used for this system was created by fine-tuning a transformer model from the Hugging Face platform. The results of two training approaches and one identification system were evaluated.
Klíčová slova:
AST; dataset; ESC; neuronové sítě; PyTorch; strojové učení; transformer; AST; dataset; ESC; machine learning; neural networks; PyTorch; transformer
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/210882