Você está na página 1de 16

UNIVERSIDAD NACIONAL DE QUILMES CARRERA DE COMPOSICION CON MEDIOS ELECTROACUSTICOS COMPUTACION APLICADA A LA MUSICA II Prof.

Oscar Pablo Di Liscia ANALISIS ESPECTRAL DE SEALES DIGITALES N.B.: el siguiente apunte se elabor bsicamente con traducciones parciales de la bibliografa que se cita al final del mismo. Numerosos datos fueron omitidos por considerrselos fuera del alcance de este curso. Algunos fueron agregados y replanteados. ESPECTROS Como casi todos sabemos, dos instrumentos musicales tocando la misma nota a la misma intensidad por la misma duracin y desde la misma direccin, no suenan iguales a causa de lo que se llama su timbre. Desgraciadamente, esta definicin del timbre slo dice lo que no es: timbre es esa cualidad del sonido que no es la frecuencia fundamental, ni tampoco la intensidad, ni la duracin, ni la localizacin. Lo que queda es la microestructura del sonido y, para examinarla, debemos usar una manera de, literalmente, diseccionar sonidos, i.e., separarlos en sus partes constituyentes. Obviamente, una completa descripcin de las partes de un sonido debe incluir informacin acerca de sus frecuencias, intensidades y, de manera general, podemos incluir esas cualidades en nuestra definicin de timbre. A excepcin de algunos instrumentos electrnicos como el Theremin, o los rganos electrnicos, el timbre no permanece igual cuando se tocan distintas notas, debido a la variacin de longitud de tubos o cuerdas, tensin de los labios, etc. Ya que todas esas variaciones de timbre son bastante relevantes para la determinacin de las caractersticas de los instrumentos musicales, vemos que el anlisis de la microestructura de un sonido aislado slo informa de las caractersticas de ese sonido en particular. Aun dos notas sucesivas tocadas por el mismo intrprete y de igual manera en el mismo instrumento, pueden tener sorprendentes diferencias en su microestructura. El estudio de esta microestructura y su relacin con lo que escuchamos es una de las mayores preocupaciones en la investigacin sobre msica por computadoras, ya que es all en donde las complejidades de las caractersticas fsicas de los instrumentos musicales, acstica de recintos y psicoacstica entran en juego. Nuestro modelo para describir esta microestructura se llama espectro de un sonido, por analoga con el espectro de un rayo de luz que puede obtenerse al hacer pasar la luz a travs de un prisma. El prisma produce que la luz -formada por varias frecuencias, o colores- es refractada en montos variables, siendo el ndice de refraccin dependiente del componente o color primario en cuestin. Al observar las intensidades de la luz a esas diferentes frecuencias somos capaces de determinar la constitucin del rayo de luz original. Si el rayo es luz "blanca pura", obtenemos un "espectro completo", proverbialmente los colores del arco iris. El prisma para los sonidos es el anlisis de Fourier. Al aplicar la transformada Fourier a la forma de onda de un sonido podemos determinar matemticamente cules montos de qu frecuencias son los responsables de esa silueta en la forma de onda y podemos usar nuestro anlisis como gua para sintetizar ese sonido. Si el resultado de nuestro anlisis es que todas las frecuencias se encuentran en la misma proporcin, aproximadamente, llamamos al resultado "sonido blanco", por analoga con la luz blanca, o bien "ruido blanco", ya que el arco iris es mucho mas atrayente que el espectro de su contrapartida sonora. Sin embargo, si algunas frecuencias son considerablemente ms predominantes que otras, el sonido se vuelve "coloreado", y si las relaciones entre los componentes que predominan son armnicas atribumos al sonido una fundamental definida. Cuando la forma de onda fu generada slo

con frecuencias en relacin armnica, es peridica, con un perodo igual al inverso de la frecuencia de la fundamental (que no necesita estar presente para que el sonido generado sea escuchado a esa frecuencia). La medicin del espectro de un sonido es complicada por el hecho de que el espectro de casi todos los sonidos cambia rpida y drsticamente a travs del tiempo. Esto se empeora por otro hecho: la precisin con la que medimos el espectro decrece en la medida en que intentamos hacerlo en intervalos de tiempo cada vez menores. El espectro de cada instante de la evolucin temporal de una forma de onda casi no existe, por ejemplo, no podemos decir nada de los componentes de frecuencia de una seal digital examinando una sola muestra de la misma. Podemos solamente medir lo que pasa en el espectro promedio sobre un intervalo breve de tiempo, tal vez un milisegundo. Cuanto ms largo el intervalo de medida es ms precisa nuestra medida del contenido espectral promedio durante ese intervalo, pero sabemos menos de las variaciones de espectro ocurridas en ese intervalo. Por esto, el problema de la medicin de espectro puede ser visto como la bsqueda del mejor compromiso entre estos dos fines opuestos. No se sabe exactamente cuanta precisin se necesita, esto es una cuestin abierta para la psicoacstica: en algunos casos nuestro sistema auditivo parece ser ms tolerante que en otros. El modelo histrico de espectro planteado por Hermann von Hemholtz es claramente inadecuado para una resntesis efectiva. Un modelo ms reciente caracteriza una nota por tres segmentos: ataque, estado de regimen y extincin. Dicho modelo es, ciertamente, una mejora, pero tiene todava limitaciones en las transiciones de una nota a otra. Adems de ello el "estado de rgimen" de cualquier sonido real no es "estable" para nada... Estas consideraciones no pretenden afirmar que la situacin es desesperanzada, slo indican que advertir las limitaciones de las tcnicas de medicin espectral es tan importante como tomar conciencia de su poder. LA TRANSFORMADA FOURIER DISCRETA La DFT se usa para calcular el espectro de una forma de onda en trminos de un conjunto de sinusoides relacionadas armnicamente, cada una con una amplitud y fase propias. Se implementa habitualmente con un algoritmo ms eficiente llamado FFT (Fast Fourier Transform) cuyo descubrimiento ha posibilitado a la computacin de espectros ser mucho ms real de lo que era antes. Ya que la DFT es menos restrictiva (aunque menos eficiente) se considerar aqu slo esta. La operacin fundamental de la DFT es descomponer una forma de onda arbitraria en su espectro. El espectro de una forma de onda es una descripcin de esta en trminos de un nmero de "bloques bsicos", que, en este caso, son sinusoides cuyas frecuencias se relacionan armnicamente. La DFT trabaja tomando a N muestras de una forma de onda como si fueran un perodo de N muestras de una forma de onda infinitamente larga compuesta solamente de sinusoides que son todas armnicos de la frecuencia fundamental que se corresponde con el perodo de N muestras. Debemos tambin discutir el concepto de energa en una frecuencia particular. Una forma de onda puede, en expresiones corrientes para DSP, tener energa, por ejemplo a 100 Hz, lo que significa que, al menos, existe en su espectro un componente sinusoidal de 100 Hz con amplitud distinta de cero. Con la palabra energa se designa en este caso a "aquello que existe" a 100 Hz, que no existe a , por ejemplo, 150 Hz. La DFT funciona midiendo las amplitudes de componentes sinusoidales a frecuencias particulares en una forma de onda y ya que la energa puede ser mostrada como proporcional al cuadrado de la amplitud, podemos ver que este proceso mide la energa a estas frecuencias. Podemos imaginar la realizacin de este proceso en un laboratorio con un conjunto de filtros, cada uno de ellos dejando pasar energa a una sola frecuencia y rechazando a las otras. (Para una explicacin ms detallada

de la DFT desde el punto de vista matemtico, referirse al apndice 1 de este apunte) Cuntos armnicos estarn presentes? De acuerdo con el teorema de muestreo, necesitamos al menos dos muestras por perodo para evitar aliasing as que, si N=8 y la frecuencia de muestreo es de 8000 Hz, los nicos armnicos posibles que obtendremos estarn separados a distancia de 8000/8=1000 Hz, a esa separacin se la llama Frecuencia de Anlisis. Sin embargo, el teorema de muestreo admite perfectamente frecuencias negativas, de manera tal que obtendremos datos, en el ejemplo anterior sobre: -4000 Hz (armnico "-4") -3000 -2000 -1000 0 1000 (Frecuencia de anlisis) 2000 3000 4000 Podemos comprobar que obtenemos slo la mitad de la amplitud real en nuestro anlisis, la otra mitad est representada por el componente de frecuencia negativa correspondiente (para una explicacin de las causas de esto, ver Moore(1) y (2)). Por lo dems, a efectos prcticos, se consideran slo los valores positivos del espectro, ya que los negativos son la imagen especular de estos. La ecuacin para la DFT es:
N-1

X(k)=

S x(n) e^-jwnk
n=0

en donde: w = 2p/N e-jwnk = cos(wnk) - j sin(wnk) (Identidad de Euler, V. Moore(2)) para k igual o mayor que 0 e igual o menor que N-1 Por convencin se usa x(n) para la forma de onda y X(k) para el vector que contiene su espectro (integrado de parejas de valores -un nmero complejo con una parte real y otra imaginaria- que tienen informacin de Amplitud y Fase de cada uno de los componentes sinusoidales). Tambin es posible calcular la Transformada Fourier inversa(IDFT) y ninguna informacin se pierde en el proceso, esto es: DFT(x(n))=X(k)

IDFT(X(k))=x(n) Lo que indica que si tenemos la forma de onda x(n), estamos en condiciones de obtener su espectro mediante la DFT y, si tenemos el espectro X(k), estamos en condiciones de obtener su forma de onda mediante una IDFT. La ecuacin de la IDFT:
N-1

x(n)= 1/N S X(k) e^+jwnk


k=0

El signo + en el exponente complejo ha sido includo para evidenciar que ambas ecuaciones difieren slo en esto. Los parmetros fundamentales de la DFT son: a)SR, o la frecuencia de muestreo de la seal digital a analizar. b)N, o el nmero de muestras de la seal digital a analizar, llamado tambin tamao ("size") de la transformada. c)FA, o la Frecuencia de anlisis, que es igual a SR/N. Cuando se usa de manera prctica en DSP, la DFT se ejecuta con un algoritmo ms eficiente, llamado FFT (Fast Fourier Transform), al igual que su inversa (IFFT). Este algoritmo requiere que N (el nmero de muestras de la seal) sea una potencia de 2. Si N no es una potencia de 2, se utiliza el recurso de asignar a N la potencia de 2 ms cercana y no menor que el nmero de muestras, rellenando con ceros los valores restantes ("zero pad"). Quedan en evidencia algunas de las limitaciones de la DFT que ya se haban mencionado. Para tener ms precisin debemos disminuir la FA (SR/N), ya sea disminuyendo SR o aumentando N. Como generalmente no se cambia SR, el recurso es aumentar N. Y aqu est el problema: al aumentar N tenemos ms precisin al definir las frecuencias, pero obtenemos un porcentaje del espectro en un intervalo temporal mayor: si el espectro cambia en ese lapso, no seremos capaces de registrar sus modificaciones. En otras palabras: cuanto ms analizamos, ms precisin tenemos, pero no registramos cambios. Cuanto menos analizamos, ms podemos ver cambios de espectro, pero tenemos menos precisin para evaluarlos. La DFT trata a la seal digital como si fuera una seal peridica, con perodo N/SR. Hasta ahora nuestros ejemplos usaron seales que contienen armnicos de 1/N/SR Qu ocurre para el caso de que la seal tenga componentes que no sean armnicos de la frecuencia 1/N/SR? En este caso la DFT mostrar energa en otros componentes que no estn en la seal original. Y esto no se debe a fallas en su funcionamiento. Supongamos que analizamos N muestras de una seal x(n)= A sin(2pfn/SR), siendo f=.7 y N=SR, por lo tanto, FA=1 Hz. La DFT seguir mostrando energa a intervalos de la frecuencia de anlisis (1Hz, 2hz, 3Hz, etc.), ya que est tomando slo una parte del perodo completo de sin(2p.7n/SR) y asumiendo que es una funcin peridica y que, por lo tanto se repite con un perodo N/SR. Dicho de otra manera: para la DFT ya no estamos analizando una sinusoide. De hecho esto es comprobable con un grfico de la forma de onda analizada, repitindose varias veces (ver grfico 1). Se puede visualizar que no es sinusoidal para nada... Las bruscas discontinuidades en el punto de repeticin de la forma de onda crean componentes que, generalmente superan la frecuencia de Nyquist (SR/2) y se reflejan en alias que son, justamente, los armnicos "falsos" que vemos en el espectro. Con todo, la DFT ha funcionado perfectamente y estamos en condiciones de restituir exactamente la forma de onda original usando la IDFT con el espectro. Slo que nosotros vemos algo diferente a lo que esperbamos porque suponemos algo que la

DFT no sabe. La DFT, en este caso, mostrar una estimacin del verdadero espectro. A los componentes espreos se los llama "artefactos de anlisis" y, aunque no se los puede evitar completamente, se puede minimizar su efecto usando las llamadas Ventanas de Anlisis. Antes de tratarlas, describiremos el procedimiento de convolucin. Grfico 1

CONVOLUCION Cuando dos formas de onda son sumadas, o restadas, el espectro de la forma de onda resultante es igual a la suma o a la resta de ambos espectros. Esto es: x(n)+a(n) = X(k)+A(k) x(n)-a(n) = X(k)-A(k) Sin embargo, cuando dos formas de onda son multiplicadas, el espectro de la forma de onda resultante no es la multiplicacin de ambos espectros, sino la convolucin de estos. De la misma manera, la forma de onda resultante de la multiplicacin de dos espectros es igual a la convolucin de sus dos formas de onda. Dicho de otra manera: x(n)a(n) = X(k) * A(k) X(k)A(k)= x(n) * a(n) N.B. : el asterisco denota la operacin de convolucin. La convolucin lineal de dos secuencias x(n) e y(n), de duracin Nx y Ny, respectivamente, se define como:
n

h(n) = x(n)*y(n)= S x(m)y(n-m)


m=0

Por ejemplo, sean las dos secuencias: x(n) = 1, 3, 5 ,3 ,5, 1

y(n) = 1, 2, 4, 2 Su convolucin, h(n), puede expresarse como: 135351 2 6 10 6 10 2 4 12 20 12 20 4 2 6 10 6 10 2 ---------------------------------------cuya suma 1 5 15 27 37 33 28 14 2 es el resultado h(n) Puede comprobarse que la secuencia resultante tiene ms elementos que las dos que se procesaron. El resultado es de Nx + Ny - 1 elementos. La convolucin es conmutativa, al igual que la multiplicacin, esto es: x(n)*y(n) = y(n)*x(n) Para explicarla con dos espectros, tendramos que seguir las reglas de las operaciones con nmeros complejos, sin embargo, hay una manera de hacerlo que es ms familiar a todos los msicos. Si multiplicamos dos formas de onda sinusoidales de frecuencia f1 y f2 el espectro resultante (la convolucin de sus espectros) estar integrado por dos componentes de frecuencias f1 + f2 y f1 - f2. La operacin de convolucin en el espectro puede explicarse entonces como el establecimiento de una copia del espectro de una de las formas de onda, centrada sobre cada uno de los componentes de frecuencia del espectro de la otra forma de onda. (Ver grfico 2) La multiplicacin de dos formas de onda es corrientemente denominada en msica electroacstica modulacin en amplitud o tambin modulacin en anillo("ring modulation"). Esta ltima denominacin alude a la forma del circuito electrnico encargado de realizar esa tarea, y no tiene nada que ver con la operacin matemtica. Grfico 2

Si volvemos ahora a la operacin de convolucin de dos formas de onda, hemos visto que esto da como resultado la multiplicacin de sus respectivos espectros. Esto posibilita una gran variedad de procesos de DSP(procesamiento de seal digital). Para explicarlos, primero se describir la funcin impulso o, ms corrientemente llamada pulso. La funcin impulso se define como sigue: u(n) = 1,0,0,0,0,0.... (para n igual o mayor que cero) es decir, un primer valor de amplitud mximo seguido de N valores cero. La convolucin de cualquier forma de onda con una funcin impulso la deja invariante. Ntese que no es lo mismo que la multiplicacin de ambas formas de onda, que dara como resultado una funcin impulso. Una de las ms interesantes propiedades de la funcin impulso es que su espectro presenta energa uniforme en todas las frecuencias(esto se puede demostrar realizando una DFT de esta funcin). Es entonces la funcin ideal para alimentar cualquier sistema y estudiar sus caractersticas, ya que la salida del proceso mostrar claramente cul es el efecto de ste sobre un espectro uniforme, en otras palabras la respuesta a impulso del sistema. Por ejemplo, si queremos evaluar la accin de un determinado filtro (su banda de rechazo, de transicin y de paso, la atenuacin, etc.), podemos filtrar un pulso con ste y realizar una DFT de la forma de onda resultante: este ser el espectro de la respuesta a impulso del filtro. (Ver grfico 3). Grfico 3

Imaginemos ahora a la operacin de convolucin como el proceso de suma (mezcla) de diferentes copias de la forma de onda de una seal digital, a diferentes retardos y escalando cada copia con la amplitud de cada muestra sucesiva de la otra seal. Si produjramos un pulso (o una seal lo ms parecida a un pulso, eg. un estallido de un petardo, etc.) en un determinado recinto, obtendramos la respuesta a impulso del recinto. Esta respuesta a impulso se integra con la suma de todos los ecos que se producen al rebotar las ondas de sonido del pulso ("directo") con las paredes, techo, piso, etc. del recinto ("reverberacin") o, la convolucin del espectro del pulso con el espectro del recinto. Si grabamos el resultado (la respuesta a impulso del recinto) podemos usarlo para convolver cualquier seal y obtener con sta una reverberacin igual a la de se recinto. De manera similar (pero no con un petardo...) podramos intentar obtener la respuesta a impulso de una caja armnica de un piano, violn, etc. De hecho, esta es una manera de implementar filtros digitales llamada convolucin directa. En la prctica comn la convolucin se efecta con un procedimiento ms eficiente que se denomina convolucin rpida (fast convolution). Una explicacin de este procedimiento permite comprender la relacin entre convolucin y multiplicacin. La convolucin rpida usa las ventajas del algoritmo de la FFT (Transformada rpida de Fourier). Ya que la convolucin de dos formas de onda equivale a la multiplicacin de sus espectros, los pasos a seguir son los siguientes: x(n) * y(n) = c(n) 1)Dadas dos formas de onda a convolver, x(n) e y(n), se calculan sus dos espectros X(k) e Y(k) por medio de una FFT. FFT(x(n))=X(k), FFT(y(n))=Y(k) 2)Se multiplican los espectros X(k) e Y(k) X(k) Y(k)=C(k) 3)Se realiza una IFFT del producto, transformando el espectro resultante en la forma de onda correspondiente, que es la convolucin de x(n) con y(n). IFFT(C(k))= c(n) = x(n) * y (n) Esto se puede clarificar con el grfico siguiente (Grfico 4): Grfico 4

La reversibilidad de la FFT, a travs de la IFFT, constituye la base para uno de los mtodos de diseo de filtros (FIR, o filtros de respuesta a impulso finita, con el llamado mtodo de ventanas o tambin filtros FFT), ya que nada nos impide crear una respuesta a impulso "artificial" por medio de un programa (i.e., "dibujar" el espectro de una respuesta a impulso) y usar esta para convolver cualquier seal digital modificndola. Por ltimo, tambin es posible convolver dos formas de onda cualesquiera. El resultado (la multiplicacin de sus espectros) ser una especie de "hbrido" cuyo espectro es la interseccin de los dos espectros involucrados, mutuamente escalados. A este procedimiento se le suele denominar sntesis cruzada ("cross synthesis"). El nico posible inconveniente es que si hay muy poca energa o cero en una regin de alguno de los espectros se causar la anulacin de la energa del otro en la banda correspondiente, por lo que hay que tomar la precaucin de que los espectros de las formas de onda a convolver tengan algn rasgo en comn (si no lo tienen, el resultado ser nulo...). VENTANAS Hemos visto los llamados "artefactos de anlisis" que surgen al realizar una DFT de una forma de onda de N muestras que contiene componentes de frecuencias que no estn relacionadas de manera entera con la Frecuencia de Anlisis (SR/N). Esto se debe a que las muestras que se analizan no contienen un nmero completo de perodos de la frecuencia que "realmente" contienen. Es imposible eliminar estos artefactos completamente, pero su efecto puede ser reducido considerablemente a travs del uso de Ventanas de anlisis. El hecho de elegir N muestras de una forma de onda es equivalente a especificar una DFT de la forma de onda multiplicada por w(n), en donde w(n)=1 para n=0,1,....N-1 y 0 en cualquier otro punto. A la funcin w(n), descripta anteriormente, se la denomina ventana rectangular. Esta multiplicacin produce la convolucin del espectro de la forma de onda elegida con el espectro de la ventana rectangular antes de que la transformacin se efecte. El espectro de la ventana rectangular tiene la forma de una conocida funcin llamada sinc x. sinc x = sin(x) / x Se puede observar que su espectro ( Ver grfico 5 ) tiene la silueta de una onda coseno que decrece en amplitud a medida que x aumenta. Grfico 5

Advertir que la convolucin reemplaza cada componente de un espectro con una copia escalada del otro centrada a la misma frecuencia explica de otra manera porqu una multiplicacin implcita por una ventana rectangular puede producir los artefactos que explicamos. Cuando est presente un nmero completo de perodos, los armnicos de la frecuencia de anlisis se alnean con los cruces a cero del espectro de la ventana rectangular, produciendo una sla lnea slo en el centro. Si est presente un nmero no entero de perodos la funcin sinc se centra sobre cada componente en el espectro subyacente. A causa de que estos componentes ocurren generalmente entre los armnicos de la frecuencia de anlisis, los cruces a cero de la funcin sinc no se alnean con los armnicos de la frecuencia de anlisis, "contaminando" la medicin de la DFT al producir componentes falsos en el espectro analizado. (Ver grficos 6 y 7) Grfico 6

Grfico 7

Otras ventanas pueden ser usadas en vez de la rectangular, es cuestin de multiplicar la forma de onda a analizar por otra forma de onda(la funcin de la ventana) antes de que la transformacin se realice (efectivamente, convolver el espectro de la forma de onda a analizar con el espectro de la ventana usada). El efecto de las ventanas se caracteriza por su contorno que, casi siempre, comienza desde cero, alcanza su mximo y decrece simtricamente hasta cero nuevamente. Dicho en trminos ms simples, las funciones de las ventanas tienen por objetivo "suavizar" las bruscas discontinuidades en los extremos de la forma de onda analizada, reduciendo los artefactos de anlisis al costo de una pequea reduccin en los componentes "reales" del espectro analizado. Muchas ventanas tienen nombres: entre ellos podemos citar, las ventanas: Hamming, Hanning (no he cometido un error de tipeo...), Kaiser, Blackman, Parzen (o triangular), etc. (Ver grfico 8) Por ejemplo, la ventana Hamming generalizada est definida por la siguiente ecuacin: Wh(n)= a - (1-a) cos(2pn / N) en donde a=.54 genera la llamada ventana Hamming, muy comunmente usada en aplicaciones de audio. Grfico 8

La eleccin de la ventana habitualmente no es crtica y, por lo general, es una cuestin de gusto. Sin embargo, para estimaciones de espectro, es altamente recomendable el uso de una ventana distinta de la rectangular. ANALISIS DE ESPECTROS CAMBIANTES Como sealamos al comienzo, el espectro de los sonidos naturales (sean estos musicales o no) no es constante en el tiempo. En otras palabras, la forma de onda de estos sonidos no es estrictamente peridica. Para estudiar las propiedades variables de los sonidos naturales, es til tener una manera de realizar una FFT de una forma de onda variable en el tiempo. Esto se hace usualmente en aplicaciones de msica por computadoras al combinar los conceptos de la DFT con los de una funcin de ventana dependiente del tiempo. Este procedimiento se puede describir como la realizacin de DFT sucesivas, cada una de N muestras (el tamao de la DFT, que equivale al de la ventana) a lo largo de la forma de onda a analizar. Algo as como tomar una serie de fotografas sucesivas de un objeto en movimiento. Podemos considerar que la ventana de anlisis "se desliza" a lo largo de la forma de onda (por eso, a veces se la llama "ventana deslizante"). (Ver grfico 9) Grfico 9

Una manera posible de usar la FFT dependiente del tiempo sera deslizar la ventana muestra por muestra. Esto motivara una "explosin de datos" ya que cada muestra de la forma de onda a analizar sera asociada con N valores complejos de su DFT. En muchos casos es posible reducir ese monto de datos (y el tiempo necesario para calcularlos...) deslizando la ventana por un monto mayor que el de una muestra (un tpico valor usado es N/4 o, dicho de otra manera, un "overlap factor"-factor de solapamiento- del 75%). En el caso ms extremo podemos calcular el espectro de las primeras N muestras, luego de las N muestras sucesivas, y as sucesivamente (overlap factor=0). Si N es ligeramente pequeo, sern posibles de observar en este caso las variaciones de espectro de la seal analizada. Sin embargo, a causa de que N adems determina la resolucin de frecuencia de la DFT (FA=SR/N), cada espectro puede no ser adecuadamente resuelto en frecuencia. Podramos incrementar N para obtener una mejor resolucin y seguir deslizando la ventana por el mismo monto de N. Pero desgraciadamente no obtenemos con ello -a pesar de mejorar la resolucin de la frecuencia- una mejor resolucin temporal en el anlisis, ya que la DFT de

N muestras resulta en una indicacin del contenido espectral promedio de la forma de onda por el tiempo de N/SR segundos. Como se comprueba, hay que realizar en este tipo de anlisis un "comercio" entre resolucin de frecuencia (tamao de la DFT) y resolucin temporal (tiempo entre las DFT sucesivas). Es importante tener en cuenta las caractersticas de la seal a analizar para elegir los parmetros adecuados. Los datos obtenidos a travs del anlisis de DFT con ventana deslizante raramente se observan en forma de nmeros (salvo para operaciones de procesamiento muy especficas...), de la misma manera en que rara vez examinamos los valores numricos de una forma de onda. En este caso se suelen presentar grficamente de dos maneras: 1)Plot tridimensional: en el que un eje representa la amplitud (habitualmente el vertical), otro la frecuencia (habitualmente el horizontal) y el tercero el tiempo (indicado en muestras o segundos). Este es, tal vez, el ms adecuado para observar variaciones rpidas del espectro en una seal que representa un slo sonido. (Ver grfico 10) Grfico 10

2)Espectrograma: el eje horizontal representa el tiempo (indicado en muestras o segundos) y el vertical la frecuencia. La amplitud es representada por una mayor intensidad de grisado (en algunos casos se utilizan colores). Esta es una manera de representacin ms apta para observar las variaciones globales de espectro a travs de una seal de mayor duracin que representa una secuencia de distintos sonidos. (Ver Grfico 11) Grfico 11

Apndice 1 - Explicacin matemtica de la operacin de la DFT Supongamos que x(n) es una secuencia de nmeros que representa a N muestras de un perodo completo de una forma de onda. Por ejemplo, sea x(n)= A sin(wn), con w=2p/N y n igual o mayor que cero y no mayor que N-1. Para N=8 tendremos: x(n)= 0, A(.707), A, A(.707), 0, -A(.707), -A, -A(.707) NB: .707 es una aproximacin de la cifra correcta. Podemos medir la energa a la frecuencia w extrayendo la amplitud A de la sinusoide a esta frecuencia. Esto se hace al formar el producto de x(n) con sin(wn) y sumar todos los nmeros de la secuencia:
N-1

S A sin(wn) x(n) = 0 + A/2 + A + A/2 + 0 + A/2 + A + A/2= 4A = N (A/2


n=0)

El resultado es A/2, la mitad de la amplitud de la sinusoide con frecuencia w, escalada por N, el nmero de muestras en consideracin. No podramos obtener esto simplemente sumando los valores de x(n), ya que sumar todos los valores de un perodo de una sinusoide dara cero por resultado. Sin embargo, al multiplicar x(n) por sin(wn), formamos la secuencia: x(n) sin(wn) =A ( sin(wn))2 y todos los valores de sin2 son positivos. As hemos extrado la amplitud de una sinusoide de frecuencia w en x(n) por medios puramente matemticos. Qu pasara si intentramos extraer la amplitud de un componente de frecuencia 2w de x(n)? Con x(n) definido como antes, se espera que dicho componente no sea detectado, es decir, que su amplitud sea igual a cero. Y esto es lo que realmente ocurre si realizamos el producto de x(n) con sin(2wn) y sumamos la secuencia. Ms aun: si realizamos la suma de los productos de x(n) con sin(kwn), en donde k es un entero no mayor que N/2 y distinto de 1, obtendremos 0 por resultado, indicando que no existe energa a la frecuencia k.

No hemos considerado todava la fase de la sinusoide de frecuencia w. Una sinusoide con una fase y amplitud arbitrarias se puede tambin representar ,gracias a identidades trigonomtricas, como: A sin(wn+f) = a cos(wn) + b sin(wn) en donde: A es la amplitud f es el ngulo de la fase a = A sin(f) b = A cos(f) esto da: A sin(wn+f) = A sin(f) cos(wn) + A cos(f) sin(wn) La amplitud y la fase de nuestro componente sinusoidal se pueden calcular usando nuestro procedimiento de multiplicacin y suma, primero con cos(wn), para calcular el coeficiente a, y luego con sin(wn) para calcular el coeficiente b. Ambos valores forman un nmero complejo con una parte real y la otra imaginaria, indicado en coordenadas rectangulares, para obtener informacin ms clara acerca de la amplitud A y la fase f, se convierten a coordenadas polares, de acuerdo con: A = SQRT(a2+b2) (eq. 1.1) f = tan -1(b/a) (eq. 1.2) NB: SQRT=raz cuadrada Por ejemplo, sea la secuencia x(n): x(n) = A sin(wn + f1) + B sin(2wn + f2) = a1 cos(wn) + b 1 sin(wn) + a2 cos(2wn) + b 2 sin(2wn) , repitamos el procedimiento, usando cos(wn):
N-1

S cos(wn) x(n) =
n=0 N-1

S ( a1 cos(wn)2 + b 1 sin(wn) cos(wn) + a2 cos(2wn) cos(wn) + n=0 b 2 sin(2wn) cos(wn) )


N-1

=a1 S (1/2+1/2 cos(2wn) = N (a1/2)


n=0

De forma similar, si usramos sin(wn) como multiplicador, hubieramos extrado b 1; con cos(2wn) hubieramos extrado a2; y as en adelante. Teniendo a y b, obtenemos A(Magnitud o mdulo) y f(ngulo) con las ecuaciones 1.1 y 1.2. Este es el principio de operacin de la DFT: la multiplicacin y suma aplicadas para determinar las amplitudes y fases de cada uno de los armnicos de la forma de onda. Apndice 2 - Bibliografa 1)Moore, F. R. Elements of computer music Prentice Hall, New Jersey, USA, 1990. 2)Moore, F. R. An introduction to the mathematics of DSP, Part II CMJ 2(2):38-60, MIT Press, USA, 1978 3)Smith, J. O. III Introduction to Digital Filter Theory, Report N STAN-M-20, CCRMA, Stanford University, USA, 1985 4)Embree, P. & Kimble, B. C languaje algorithms for DSP,Prentice Hall, New Jersey, USA, 1991.

Você também pode gostar