Escolar Documentos
Profissional Documentos
Cultura Documentos
Parametrizac
0.8
0.6
0.4
0.2
-0.2
-0.4
-0.6
-0.8 S[n]
-1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
M
3.1.1.- Enventanado de la seal
0.4 0.4
0.2 0.2
0 0
0 10 20 30 0 10 20 30
Rectangular Hanning
1 1
0.8
0.6
0.5
0.4
0.2
0 0
0 10 20 30 0 10 20 30
Hamming Blackman
3.1.1.- Enventanado de la seal
20 20
0 0
dB
dB
-20 -20
-40 -40
20 20
0 0
dB
dB
-20 -20
-40 -40
Lbulos laterales 0 0.5 1 0 0.2 0.4 0.6 0.8
Hamming Blackman
3.1.1.- Enventanado de la seal
Autocorrelacin
n n 0
Energa localizada de la palabra Hipotenusa: Forma de onda
1
A m p l it u d
0.5
-0.5
-1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.4
i p o t e n u s a
Muestras
Energa
4
x 10
A m p li t u d
0.3
0.2
0.1
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Muestras 4
x 10
3.2.1.- Energa localizada
n 0
Esto a su vez se puede interpretar como:
M[m]: Magnitud
N 1
M [m] x[n] w[n m]
n 0
0.5
A m p litu d
-0.5
-1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
i p o t e n u s a Muestras
Magnitud
4
x 10
0.5
0.4
A m p litu d
0.3
0.2
0.1
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Muestras 4
x 10
3.2.3.- Tasa de cruces por cero
1, x 0
sgn( x)
1, x 0
3.2.3.- Tasa de cruces por cero
0.5
-0.5
-1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
h i p o te n u
Muestras
Tcc
s a 4
x 10
0.4
A m p lit u d
0.3
0.2
0.1
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Muestras 4
3.2.4.- Aplicaciones E, M y Tcc
Detector de actividad:
E[m] M No Tcc[m]
> No Ruido
>
Umbral? Umbral?
Si Si
Voz
3.2.5.- Autocorrelacin
Rm[k]: Autocorrelacin
N 1
Rm [ k ] w[ m n] x[ n] w[ m ( n k )]x[ n k ]
n 0
k 0, 1, 2, ...p.
Propiedades:
Es una funcin par
Rm [ k ] Rm [0]
Tiene un mximo en k=0, i.e.:
Rm [0] Energa
3.2.5.- Autocorrelacin
10
-10
-20
0 20 40 60 80 100 120 140 160 180
Muestras
Segmento sordo
10
Autocorrelacin
-10
0 20 40 60 80 100 120 140 160 180
Muestras
3.2.5.- Autocorrelacin
A partir de la correlacin
Es el mayor mximo local de la autocorrelacin
(excluyendo el mximo global)
Segmento
Sonoro
Segmento
Sordo
3.2.6.- Estimacin del Pitch
Problema:
No siempre el mayor mximo local
corresponde con el pitch
Funcin de recorte:
3.2.6.- Estimacin del Pitch
m
3.3.1- Espectrogramas
Tipos de espectrogramas:
Banda ancha
Banda estrecha
3.3.1- Espectrogramas
3500
3000
2500
Time
2000
1500
1000
500
3500
3000
2500
Time
2000
1500
1000
500
Utilidad:
Permite separar la seal de excitacin de la
respuesta del filtro del tracto vocal
0.4
0.3
0.2
cepstrum
0.1
-0.1
-0.2
-0.3
Periodo Fundamental
-0.4
0 50 100 150 200 250 300 350 400 450 500
quefrency
3.3.2- Anlisis Homomrfico: Cepstrum
0.3 -20
Amplitud(dB)
0.2
-30
cepstrum
0.1
-40
0
-0.1 -50
-0.2
-60
-0.3
-70
-0.4 0 1 2 3 4 5 6 7 8
0 50 100 150 200 250 300 350 400 450 500 Frecuencia(KHz)
quefrency
3.3.2- Anlisis Homomrfico: Cepstrum
Terminologa empleada:
Spectrum Cepstrum
Frecuency Quefrency
Filtering Liftering
Analysis Alanysis
3.4.- Anlisis de prediccin lineal
Glotis
A1 A2 AN ALabios
3.4.- Anlisis de prediccin lineal
Glotis
A1 A2 AN ALabios
1-kN
Ug ULabios
-1 kN
Estructura de filtro en celosa (lattice)
tiempo de propagacin para atravesar una
3.4.- Anlisis de prediccin lineal
Coeficientes de reflexin:
1-km +
+
Um Um+1
Interconexin Am -km km Am+1
de secciones:
Um- -
Um+1
1+km
Prediccin lineal:
Vamos a intentar predecir el valor de s[n] a
partir de sus valores anteriores s[n-1], s[n-2],
, s[n-M]
Coeficientes de prediccin:
a1 , a2 ,..., aP
Error de prediccin:
P
e[n] s[n] s[n] s[n] ai s[n i ]
i 1
3.4.- Anlisis de prediccin lineal
i 1
Minimizar: Para cada ak derivar e igualar a 0
Ep
0 k 1,.., P
ak
i
i 1
Rs [ k ] Rs [ k i ]
3.4.- Anlisis de prediccin lineal
r Ra a R 1 r
Algoritmo de Durbin:
Solucin recursiva para calcular los
coeficientes ak aprovechando que R es toeplitz.
Inicio: E ( 0 ) r[0]
Recursin: i=1,...,P
1 i 1
Coef. Reflexin ki r[i ] a ( i 1)
r[i j ]
E ( i 1) j
(PARCOR) j 1
ai(i ) ki
Coef.
LPC a (ji ) a (ji 1) ki ai(i j1) j 1,..., i 1
Energa residual E (i ) 1 ki2 E ( i 1)
3.4.- Anlisis de prediccin lineal
Algoritmo de Durbin:
Calcula los coeficiente de reflexin (PARCOR)
Calcula los coeficientes de prediccin lineal a
partir de los de reflexin
El filtro resultante siempre es estable:
|km|<1
0.8
0.6
Fs/2 Hz 0.4 0 Hz
Imaginary Part
0.2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
Real Part
3.4.- Anlisis de prediccin lineal
Orden de prediccin:
Un par de polos complejos conjugados por cada
formante
Aadir dos o tres polos ms
En general
20
P suele estar entre 10 y 14 coeficientes
LPC-5
10
0
LPC-10
LPC-14
Amplitud (dB)
-10
-20
-30
-40
-50
0 500 1000 1500 2000 2500 3000 3500 4000
Frecuencia (Hz)
3.4.- Anlisis de prediccin lineal
Envolvente Voz
espectral
G
Ruido
Aleatorio
3.4.- Anlisis de prediccin lineal
1
e[n] P s[n]
1 ai s[n i ]
i 1
3.4.- Anlisis de prediccin lineal
0.08 0.08
0.06 0.06
0.04 0.04
0 0
-0.02 -0.02
-0.04 -0.04
-0.06 -0.06
-0.08 -0.08
0 50 100 150 200 250 300 350 400 450 0 50 100 150 200 250 300 350 400 450
Muestras Muestras
3.4.- Anlisis de prediccin lineal
10
H ( z) -10
0 -20
Amplitud (dB)
Amplitud (dB)
-10 -30
-20 -40
-30
1 -50
-40
-50
H ( z) -60
-70
0 500 1000 1500 2000 2500 3000 3500 4000 0 500 1000 1500 2000 2500 3000 3500 4000
Frecuencia (Hz) Frecuencia (Hz)
Anlisis LPC
P=4
Localizar
Mximo
Sonoro / sordo?
Interpolacin
Estimar F0
3.4.5.- Mtodo SIFT, estimacin del Pit
Conversin de Hz a MELs
m 1125 log 0.0016 f 1
3.5.2.- MEL-Frequency Cepstrum (MFC
0.4
0.2
-0.2
-0.4
0 100 200 300 400 500 600 700 800 900 1000
[samples]
a
0
-10
-20
-30
-40
-50
-60
0 500 1000 1500 2000 2500 3000 3500 4000 4500
[Hz]
3.5.2.- MEL-Frequency Cepstrum (MFC
0.8
Banco de 0.6
filtros 0.4
0.2
0
0 1000 2000 3000 4000 5000 6000 7000
[Hz]
0
-2
Espectro -4
suavizado -6
-8
-10
0 2 4 6 8 10 12 14 16 18
3.5.2.- MEL-Frequency Cepstrum (MFC
Cepstrum obtenido:
El nmero de coeficientes resultante es muy
inferior
El cepstrum obtenido es una aproximacin
1
0.5
-0.5
0 2 4 6 8 10 12 14 16
3.5.3.- Cepstrum LPC (LPCC)
Coeficientes PARCOR:
PARtial autoCORrelation coefficients.
Se calculan como paso intermedio en el
algoritmo de durbin.
Son los coeficientes de Reflexin ya vistos.
Q( z ) A( z ) z ( p 1) A( z 1 )
Pasos a realizar:
Pre-nfasis de la trama
Enventanado con solapamiento
Clculo de la autocorrelacin
Anlisis LPC, obtencin de los coeficientes
Clculo del cepstrum a partir de la LPC
Anlisis de los parmetros obtenidos