Název:
Způsoby využití základní frekvence pro identifikaci mluvčích
Překlad názvu:
Ways of exploiting fundamental frequency for speaker identification
Autoři:
Hývlová, Dita ; Skarnitzl, Radek (vedoucí práce) ; Šturm, Pavel (oponent) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
cze
Abstrakt: [cze][eng] Předkládaná diplomová práce se zabývá forenzním využitím údajů o základní frekvenci, konkrétně jejích středních hodnot a ukazatelů variability. Mezi fonetiky zabývajícími se forenzní analýzou řeči je obecně známo, že F0 nemá příliš velký potenciál jako parametr využitelný při identifikaci mluvčích, protože podléhá mnoha vnějším faktorům (jako je momentální citové rozpoložení, okolní hluk, přenosový kanál nebo dokonce vlastní snaha maskovat svůj hlas), jež zapříčiňují vysokou intraindividuální variabilitu. Přesto však platí, že forenzní užití F0 skýtá i určité výhody, například snadnost extrakce jejích hodnot ze signálu a nižší ovlivnitelnost lexikálním obsahem - na rozdíl od vokalických formantů. V této práci zkoumáme nahrávky osmi mužských mluvčích pořízené ve dvou mluvních stylech (spontánním a čteném) a porovnáváme příslušné ukazatele stability i variability základní frekvence, které jsou pokud možno robustní vůči proměnlivým vnějším okolnostem: za střední hodnoty je to základní hladina a za deskriptory variability percentilové rozpětí. Kromě toho si všímáme řečových jevů, jako je třepená fonace, které jsou idiosynkratické a napomáhají rozlišitelnosti daného mluvčího od ostatních. Klíčová slova: forenzní fonetika, identifikace mluvčího, základní frekvence, češtinaThe present Master's thesis deals with the forensic use of fundamental frequency characteristics, specifically with F0 mean values and indicators of variability. Phoneticians who specialise in the forensic analysis of speech generally believe that F0 does not hold much potential as a parameter useful for speaker identification, mainly because it is easily influenced by extrinsic factors (e.g. the speaker's emotional state, interfering noise, transmission channel or even the speaker's own effort to mask his voice), which cause high intra-individual variability. Despite these facts, however, the forensic use of F0 offers a number of advantages, namely straightforward extraction from the speech signal and lower susceptibility to varying lexical content - unlike, for example, vowel formants. This thesis investigates the recordings of 8 male speakers made in two different speech styles (spontaneous and read) and compares the respective indicators of F0 stability and variability, in particular those that are robust in varying external conditions: that is, the baseline for mean values and the 10.-90. percentile range for variability indicators. Apart from that, we take into account phenomena such as the creaky voice, which are idiosyncratic and contribute to easier speaker discrimination. Key words:...
Klíčová slova:
forenzní fonetika; identifikace mluvčího; základní frekvence; čeština; Czech; forensic phonetics; fundamental frequency; speaker identification