Název:
Segmentace řeči
Překlad názvu:
Speech segmentation
Autoři:
Andrla, Petr ; Míča, Ivan (oponent) ; Sysel, Petr (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2010
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
V rámci diplomové práce byl vytvořen program pro segmentaci nahrávek řeči na fonémy. Tento program byl vytvořen v prostředí Matlab a skládá se z několika skriptů. Program umožňuje automatickou segmentaci. Segmentace řeči je proces nalezení hranic mezi fonémy v mluvené řeči. Automatická segmentace je založena na metodě vektorové kvantizace. V prvním kroku výpočtu je provedena extrakce příznaků. Dále jsou části řeči přiděleny k určeným centroidům. Místo změny centroidu je označeno jako hranice fonémů. Tímto programem byla zpracována skupina nahrávek a vyhodnocena účinnost automatické segmentace. K programu byl vytvořen podrobný návod k obsluze. Dále jsou v práci stručně rozebrány jednotlivé použité metody zpracování řeči s uvedením jejich implementace v programu a odůvodnění nastavení jejich proměnných parametrů.
The programme for the segmentation of a speech into fonems was created as a part of the master´s thesis. This programme was made in the programme Matlab and consists of several scripts. The programme serves for automatic segmentation. Speech segmentation is the process of identifying the boundaries between phonemes in spoken natural languages. Automatic segmentation is based on vector quantization. In the first step of algorithm, feature extraction is realized. Then speech segments are assigned to calculated centroids. Position where centroid is changed is marked as a boundary of phoneme. The audiorecords were elaborated by the programme and a operation of the automatic segmentation was analysed. A detailed manual was created to the programme too. Individual used methods of the elaboration of a speech were in the master´s thesis briefly descripted, its implementations in the programme and reasons of set of its parameters.
Klíčová slova:
centroid; foném; hláska; k-means algoritmus; segmentace řečového signálu; TIMIT.; Vektorová kvantizace; řeč; centroid; k-means algorithm; phone; phoneme; segmentation of speech signal; speech; TIMIT.; Vector quantization
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/5458