Você está na página 1de 7

[Escribir texto]

ESCUELA POLITCNICA DEL EJRCITO

FACULTAD DE ELECTRNICA EN TELECOMUNICACIONES

MATERIA: COMUNICACIN Y CODIFICACIN DIGITAL

CARACTERSTICAS DE LA SEAL DE VOZ Nombre:


Calvopia Katherine

[CARACTERISTICAS DE LA SEAL DE VOZ]

ESPE

Muestreo de la seal de voz


Para iniciar nuestro anlisis requerimos una seal de voz de muestra, para lo que vamos a grabar el sonido de la letra a utilizando el programa MATLAB y siguiendo los pasos detallados a continuacin: 1. Verificamos que se encuentre activo el micrfono el computador. 2. Abrimos MATLAB 3. Definimos la frecuencia fm.
fm=8000;

4. Pronunciamos la letra a mientras ejecutamos en la lnea de comando


y=wavrecord(5*fm,fm)

En este caso se graba por el micrfono la letra a por dos segundos, con una frecuencia de muestreo, fm, de 8kHz, es decir obtendremos 16000 muestras en la variable x. 5. Reproducimos el sonido utilizamos la funcin sound(y,fm) 6. Graficamos la seal x usando la funcin
plot(y)

CODIGO:
%MUESTREO DE LA SEAL DE LA VOZ fm=8000; y=wavrecord(2*fm,fm) sound(y,fm) figure(1) plot(y);grid on title('Seal de Voz') xlabel('Muestras') ylabel('Amplitud de Sonido')

Figura 1. Seal de voz en funcin al nmero de muestras

[CARACTERISTICAS DE LA SEAL DE VOZ]

ESPE

Espectro de la Seal de Voz


Confirmamos que la seal de voz se encuentra en un rango de frecuencia de 0 a 4000 Hz. Para lo que obtenemos la transformada rpida de Fourier usando la funcin fft(x). CODIGO:
%ESPECTRO DE SEAL DE VOZ L=length(y); NFFT = 2^nextpow2(L); Y = fft(y,NFFT)/L; f = fm/2*linspace(0,2,NFFT/2); figure(2) plot(f,2*abs(Y(1:NFFT/2)));grid on title('Espectro de la seal de voz') xlabel('Frecuencia[Hz]') ylabel('Amplitud')

Figura 2. Seal de voz en funcin en funcin de la frecuencia

Espectrograma
Para obtener el espectrograma de nuestra seal de voz en una ventana de 256 muestras con frecuencia de muestreo 8kHz utilizamos la funcin specgram(x,256,8000).
%ESPECTOGRAMA figure(3) specgram(y,256,fm) title('Espectograma de la seal de voz') xlabel('Tiempo') ylabel('Frecuencia')

[CARACTERISTICAS DE LA SEAL DE VOZ]

ESPE

Figura 3.-espectograma de la seal de voz

Frecuencia Fundamental (Pitch fo)


Es la tasa de vibracin de las cuerdas vocales, es decir el nmero de veces que vibran las cuerdas vocales por segundo. La frecuencia fundamental y el periodo fundamental son magnitudes inversas. Para obtener la frecuencia fundamental, vamos a observar con detalle la seal en funcin del nmero de muestras presentado en la Figura 1. Si hacemos un Zoom podemos observar que existe una regin donde aparentemente la seal se repite por ciclos, para el ejemplo, esta caracterstica lo podemos observar en la Figura 4.

Figura 4. Seal de voz en funcin al nmero de muestras

(1)

[CARACTERISTICAS DE LA SEAL DE VOZ]

ESPE

Finalmente, al fijar ampliar ms se puede obtener un perodo de repeticin y verificar el nmero de muestras que contiene este perodo y obtener as el perodo fundamental N0.

Figura 5. Seal de voz en funcin al nmero de muestras (Perodo fundamental)

El sonido de la voz comenz en 3700 muestras por lo que el nmero de muestras que resulta son 34 muestras. Cuando se tiene la seal de voz discretizada, se define No al periodo fundamental en el dominio del tiempo discreto, y es dado por:

[ [

] ] [

[
[ [ ]

]
]

[ ]

(2) (3)

] [ ] ]

El rango tpico de variacin de la frecuencia fundamental es para el hombre de 50 a 250 Hz y para la mujer de 120 a 500 Hz. Entonces concluimos que la frecuencia obtenida se encuentra en el rango de frecuencia fundamental que corresponde a la mujer al encontrarse en el rago de 120 a 235 [Hz].

[CARACTERISTICAS DE LA SEAL DE VOZ]

ESPE

Determinacin del la frecuencia fundamental por autocorrelacin


Podemos usar una forma automtica para obtener el valor de la frecuencia fundamental, comparndola en espacios de tiempo con ella misma por correlacin. Para esto vamos a considerar ventanas de tiempo de 20 ms: 1. Cargamos la seal de la voz en la variable y muestreada a 8 kHz 2. Obtenemos el nmero de muestras en 20 ms >> N=floor(0.02*fm) 3. Obtenemos la correlacin en espacios de 20 ms, normalizada en uno. >> C=xcorr(y,N,'coeff') 4. Para verificar los valores de correlacin graficamos C. 5. Se puede observar que tenemos como resultado una funcin idntica en la parte positiva y la parte negativa. 6. Para obtener la frecuencia fundamental, vamos a buscar el pico ms alto de correlacin, diferente a uno. Para ello incrementamos um desvio de 2ms o 500 Hz >> N1=floor(0.002*fm); 7. Obtenemos el valor mximo y su posicin: [x0,vmax]=max(C(N+N1:2*N+1)) 8. De esta forma podemos obtener el perodo fundamental y la frecuencia fundamental >> t0=(vmax+N1)/fm; >> f0=1/t0;
%FRECUENCIA FUNDAMENTAL POR AUTOCORRELACION N=floor(0.02*fm) C=xcorr(y,N,'coeff') figure(4) plot(C) N1=floor(0.002*fm); [y0,vmax]=max(C(N+N1:2*N+1)) t0=(vmax+N1)/fm f0=1/t0

Resultados obtenidos de la frecuencia fundamental por autocorrelacin:

[CARACTERISTICAS DE LA SEAL DE VOZ]

ESPE

COMPARACIN CON LOS RESULTADOS DE UN COMPAERO


Comparando la frecuencia fundamental que le dio como resultado a un compaero que fue 115Hz con la que me resulto con mi voz que fue de 235.29Hz podemos concluir primero que la voz se encuentra en el rango de 0 a 4000 Hz como se observo tambin en la grfica de transformada de Fourier en funcin de la frecuencia, y segundo concluimos que los rangos de frecuencia para la voz de hombres y mujeres es correcto debido a que las frecuencias fundamentales se encuentran en dichos rangos correspondientementes.

Você também pode gostar