Optimizacija parametara tro-parametarskog kubnog interpolaricaionog jezgra za procenu fundamentalne frekvence govornog signala u govornom domenu
The optimization of three-parametic cubic interpolation kernel parameters in order to estimate the fundamental frequency of speech signal in spectral domain
Author
Savić, NatašaMentor
Milivojević, ZoranCommittee members
Petrović, MileDenić, Nebojša
Kopanja, Lazar
Metadata
Show full item recordAbstract
Iznalaženje optimalnih algoritama za procenu parametara govora i slike aktuelan je zadatak u
obradi signala. Kod diskretnih električnih signala često se javlja potreba za interpolacijom (gubitak
sempla, promena frekvencije odmeravanja, promena dimenzije slike, transformacija slike, zumiranje,
rotacija, procena fundamentalne frekvencije u vremenskom i frekvencijskom domenu itd.)
u cilju procene nekih parametara signala. Danas se intenzivno primenjuje konvoluciona interpolacija,
kod koje se koristi interpolaciono jezgro. Mnogi algoritmi baziraju se na primeni
parametarskih konvolucionih jezgara. Parametarska interpolaciona konvoluciona jezgra su pogodna
su za prilagođavanje jezgra problematici u cilju smanjenja greške interpolacije. Minimiziranjem
greške saglasno definisanom kriterijumu određuju se optimalne vrednosti parametra jezgra.
U ovoj doktorskoj disertaciji tretirana je problematika optimizacije parametara parametarskih interpolacionih
konvolucionih jezgara za procenu f...undamentalne frekvencije sinusnog i govornog signala.
Kako bi se povećala preciznost interpolacije u ovom radu izvršena je konstrukcija, odnosno
određen je analitički izraz za tro-parametarsko kubno konvoluciono jezgro. Određen je algoritam za
optimizaciju parametara, i algoritam procene fundamentalne frekvencije čijom primenom je došlo
do povećanja preciznosti procene fundamentalne frekvencije.
Opisan je algoritam minimiziranja talasavosti spektralne karakteristike. Primenom ovog algoritma
određeni su optimalni parametri: a) Kvadratnog 1P, b) Kejsovog 1P, c) Kejsovog 2P, d) Grevilleovog
1P, e) Grevilleovog 2P i f) tro-parametarskog kubnog konvolucionog jezgra. Polazeći od
ideje da spektralna karakteristika jezgra, H(f) bude dobra aproksimacija karakteristike idealnog
jezgra oblika sin(πx)/(πx) u propusnom i nepropusnom opsegu (Box funkcija HB(f)) i minimiziranjem
greške sličnosti određene su optimalne vrednosti parametra Kejsovog 1P, Kejsovog 2P i Grevilleovog
1P jezgra. Sa idejom da prvi izvod spektralne karakteristike 1P Kejsovog jezgra bude dobra
aproksimacija prvog izvoda box funkcije i minimiziranjem njihove razlike određena je optimalna
vrednost parametra jezgra.
Procena fundamentalne frekvencije sinusoidalnog i govornog signala vršena je uz prethodnu
modifikaciju signala prozorskim funkcijama. U ovoj disertaciji korišćene su: a) Hamming-ova, b)
Hann-ova c) Blackman-ova, d) pravougaona, e) Kaiser-ova i f) trougaona prozorska funkcije.
Kao mera kvaliteta, odnosno mera preciznosti algoritma za procenu f0, korišćena je srednje kvadratne
greška (engl. Mean Square Error, MSE). Kao test signali korišćeni su: a) simulacioni sinusni
test signal i b) realni govorni test signal.
U cilju povećanja: a) preciznosti procene i b) brzine izvršenja algoritma određeni su analitički izrazi
za poziciju maksimuma rekonstruisane funkcije Xr(f) koja je dobijena primenom konvolucije sa
Kejsovim 2P jezgrom i 3PCC jezgrom.
Izvršena je komparativna analiza konvolucionih jezgara i primenjenih prozorskih funkcija. Detaljnom
komparativnom analizom pokazano je da se najmanja greška procene fundamentalne frekvencije
govornog signala dobija primenom troparametarskog interpolacionog jezgra.