Název:
Využití dlouhodobé formantové distribuce pro rozpoznatelnost mluvčího v různých akustických podmínkách
Překlad názvu:
Using long-term formant distributions for speaker identification in various acoustic conditions
Autoři:
Lazárková, Dita ; Skarnitzl, Radek (vedoucí práce) ; Bořil, Tomáš (oponent) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
cze
Abstrakt: [cze][eng] Analýza dlouhodobé formantové distribuce (LTF) je poměrně mladou, ale slibnou disciplínou identifikace mluvčích. Jde o metodu mapující dlouhodobé chování formantů v řeči jednotlivých mluvčích. Častými problémy, s nimiž se v praxi setkáváme, je zhoršená akustická kvalita a příliš krátké trvání zkoumaných nahrávek. Tato práce má za cíl představit historický vývoj forenzní fonetiky a současné používané metody. V praktické části se zabýváme využitelností LTF metody ve forenzní praxi, zvláště pak u nahrávek obsahujících šum v pozadí. Ukázalo se, že šum extrahované LTF hodnoty znatelně ovlivňuje, bohužel nejde o žádné systematické změny. Proto jsme navrhli několik metod, jak šum v nahrávce kompenzovat, aby bylo možné navzájem srovnávat i čisté a zašuměné nahrávky. Zkoumali jsme též minimální trvání nahrávky, jež je nutné pro statistickou spolehlivost výsledných hodnot. Tato hranice není přesná a je pro jednotlivé mluvčí značně individuální, ale je patrné, že nahrávky (vokalické proudy) kratší než 15 s mají již často sníženou vypovídající hodnotu, nelze je tedy pro analýzu doporučit. Klíčová slova: LTF, dlouhodobá formantová distribuce, identifikace mluvčích, forenzní fonetika, akustická kvalita nahrávky, šumThe analysis of long-time formant distribution is relatively young but promising discipline of speaker identification. It is a method of mapping the long-term behavior of formants in speech of individual speakers. Frequently encountered problems in practice are bad acoustic quality and very short duration of analyzed recordings. This work aims to present the historical development of forensic phonetics and currently used methods. In the practical part, it deals with the usability of LTF method in forensic practice, especially in recordings containing background noise. It was shown that the noise appreciably affects extracted LTF values and unfortunately the change is not systematic. Therefore, we proposed several methods to compensate the noise in recordings, in order to be able to compare recordings with and without noise. We also investigated the minimum duration of recording, which is necessary for statistical reliability of the resulting values. This boundary is not exact and for each speaker, it is substantially individual. But it is apparent that recordings (vocalic streams) shorter than 15 s often provide incomplete information, wherefore they cannot be recommended for analysis. Keywords: LTF, long-time formant distribution, speaker identification, forensic phonetics, acoustic quality of...
Klíčová slova:
akustická kvalita nahrávky; dlouhodobá formantová distribuce; forenzní fonetika; identifikace mluvčích; LTF; šum; acoustic quality of recording; forensic phonetics; long-time formant distribution; LTF; noise; speaker identification