Você está na página 1de 4

Extrao de Centroide Espectral Atravs da Tranformada Wavelet Packet

Thiago Rossi Roque , Rafael Santos Mendes (Orientador) DCA FEEC Universidade Estadual de Campinas (Unicamp)
ra072515@fee.unicamp.br,rafael@dca.fee.unicamp.br Resumo Este trabalho tem como objetivo propor uma nova tcnica de extrao do descritor tempo-frequencial centroide (pr-AO 1990: centride [4]) espectral a partir da transformada wavelet packet. Inicialmente dada uma introduo ao MIR e aos descritores. Na segunda parte ser feita uma breve explanao sobre o centroide espectral em sua forma convencional seguido por uma seo sobre a transformada wavelet e sua tcnica de anlise espectral. Na quarta seo apresentada a tcnica aqui proposta de clculo do centroide espectral atravs da transformada wavelet packet sendo concludo com uma discusso sobre os resultados obtidos e idias de aprofundamento na pesquisa. Palavras-chave: wavelet, MIR, momento espectral, descritores.

1. Introduo
Devido ao intenso crescimento das capacidades de armazenamento de contedo de udio digital nas duas ltimas dcadas, o interesse em anlise e classicao de udio digital tem aumentado consideravelmente. Diversas tcnicas de extrao e anlise de informao de contedo digital veem se desenvolvendo ao longo dos ltimos anos para os mais diversos ns como, por exemplo, reconhecimento de voz, classicao de gnero musical e de instrumentos musicais, transcrio automtica de msicas, entre outros. O campo de pesquisa que lida com essas tcnicas denominado Music Information Retrieval (MIR) e se fundamenta na extrao e anlise de descritores. Descritores so conjuntos de informaes que buscam quanticar aspectos qualitativos de um determinado sinal, ou seja, descrever o sinal de forma objetiva. Ao longo do tempo diversos descritores foram criados com o objetivo de concentrar as informaes pertinentes sobre uma determinada caracterstica a ser analisada de forma mais objetiva e fcil de ser tratada. Dentre os diversos descritores existentes, um dos principais usados para anlise de timbre, tanto de instrumentos musicais quanto de voz o centroide espectral, pois nota-se uma forte correlao entre as medidas do centroide espectral com a sensao de brilho de um som [8]. Este trabalho tem como proposta um clculo alternativo do centroide espectral baseado na estimativa espectral da transformada wavelet packet, aqui chamado de centroide espectral wavelet, em oposio s tcnicas tradicionais baseadas na transformada de Fourier.

2. Centroide Espectral
O centroide espectral utilizado para caracterizar o espectro do sinal, seu clculo se baseia na busca por uma frequncia mdia do sinal ponderada pela amplitude de cada componente espectral. Este descritor pode ser interpretado como o primeiro momento estatstico da funo densidade de probabilidade dada pelo espectro do sinal, onde cada frequncia a varivel aleatria e sua probabilidade de observao dada pela sua magnitude [7], portanto conhecido como o primeiro momento espectral. Seu clculo expresso pela frmula (1). Onde n representa a componente espectral e F (n) sua magnitude.
N n=1 F (n) n N n=1 F (n)

Cs =

(1)

Pelo fato da grande maioria dos sinais de udio ter um perl passa-baixas, o centroide espectral se torna uma boa medida da presena de altos harmnicos signicativos no sinal analisado, o que est diretamente ligado sensao de brilho em um som. Quanto mais intensa for a presena de harmnicos de alta ordem, maior ser a medida do centroide espectral e gerar sensaes mais "brilhantes" em um som quando ouvido [5].

2.1. Anlise Espectral


fundamental para o clculo do centroide espectral um mtodo eciente e preciso para extrao dos componentes espectrais. A principal tcnica para este tipo de anlise indiscutivelmente a transformada discreta de Fourier (TDF). Atualmente todos os algoritmos de clculo do centroide espectral

so baseados na TDF, porm pelo fato desta transformada ser esttica no domnio temporal, anlises de variao do descritor envolvem a transformada de fourier janelada (STFT), causando uma provvel falta de resoluo temporal em certas aplicaes.

diretamente com as funes wavelets, o processo de obteno dos coecientes da transformada pode ser observado como um processo de ltragem, onde os coecientes do ltro so extrados da wavelet escolhida. Detalhes sobre essa aproximao podem ser obtidos em [3]. A TWD pode ser inteiramente calculada atravs de um banco de ltros. O sinal a ser analisado ltrado tanto por um ltro passa-baixas quanto por um ltro passa-altas e em seguida decimado, o resultado da ltragem feita pelo passa-baixas ento novamente ltrado por ambos ltros e decimado, esse processo ento repetido quantas vezes for necessrio a m de buscar o nvel de detalhamento desejado. Ambos os ltros so extrados da wavelet escolhida e esto relacionados com a funo de escala da wavelet que determina sua dilatao e compresso. Um esquema em blocos representando a transformada wavelet discreta est apresentado na gura (1) para uma transformada de 3 nveis de profundidade. Onde h1 (n) o ltro passa-altas, h0 (n) o ltro passa-baixas e os coecientes obtidos c e d so conhecidos por aproximao e detalhe, respectivamente.

3. Wavelets
A transformada wavelet foi criada como uma alternativa a transformada de Fourier. Ao invs de decompor um sinal a partir somente de funes limitadas entre e (senos e cossenos). A transformada wavelet utiliza uma funo base (t), chamada de wavalet me, que alm de possuir energia nita e no possuir nenhuma componente de frequncia nula, capaz de se dilatar, comprimir e se deslocar, gerando novas funes , chamadas de wavelets lha, denidas na equao (2). A partir do produto interno entre as wavelets lha e um sinal a ser analisado, para diversos valores de deslocamento (k ) e compresso/dilatao (j ) se obtm os coecientes da transformada wavelet como descrito na frmula (3) [2]. 1 tk j,k (t) = ( ) j 2 (2)

W (k, j ) = < f (t), j,k (t) >

(3)

f (t)j,k (t)dt
Figure 1. Transformada Wavelet Discreta de trs Nveis.

Pelo fato da transformada wavelet realizar uma decomposio tanto no universo frequencial quanto temporal, possvel se obter melhores taxas de resoluo tempo-frequencial do que na STFT para muitas aplicaes. Outra vantagem da transformada wavelet sobre a STFT est no fato de possibilitar anlises em diversos nveis de profundidade de resoluo ao variar as possibilidades de dilatao e compresso das wavelets lha. Resolues mais grosseiras fornecem informaes que caracterizam o contexto do objeto analisado enquanto nveis mais profundos de resoluo fornecem detalhes mais sutis sobre o objeto. [2].

Como resultado, a TWD decompe o sinal em diversas bandas frequenciais de largura variada de f forma a manter a relao f constante. Essa relao chamada de Q-constante e muito interessante pois o sistema auditivo possui caractersticas similares, dedicando maior largura de banda para frequncias mais altas.

3.2. Anlise Espectral atravs da Transformada Wavelet


Outro formato da transformada wavelet a transformada wavelet packet (WP). Baseada na TWD, A WP busca renar a decomposio do sinal para todas as faixas de frequncia. Portanto durante o processo de ltragem, o resultado dos dois ltros so sucessivamente ltrados e decimados, gerando as-

3.1. A Transformada Wavelet Discreta


Quando se tratando de sinais discretos, a transformada wavelet assume caractersticas interessantes em nvel computacional. Para clculo da transformada wavelet discreta (TWD) no necessrio lidar

sim uma rvore binria conforme exemplicado na gura (2).

Gray convertido de binrio para decimal (0, 1, 3, 2, 6, etc...), obter-se- um ordenamento freqncial [6], facilitando assim a anlise e o clculo do centroide espectral. O terceiro fator est no nvel de profundidade da WP. WP com nveis mais profundos resultaro em melhores resolues frequenciais, pois apresentaro maior nmero de folhas e consequentemente bandas mais estreitas em cada folha. Porm quanto maior o nmero de nveis da WP, maior ser a complexidade de seu clculo. Neste trabalho a WP foi utilizada com 7 nveis, resultando em 128 folhas que, para uma frequncia de amostragem de 44100 Hz (como utilizada nos exemplos aqui tratados), possuem banda de aproximadamente 172 Hz. O resultado obtido pelo ordenamento das folhas da WP pode ser interpretado como uma matriz onde o eixo x representa a variao no tempo e o eixo y a variao na frequncia, de forma anloga um espectrograma. Um exemplo da estimao espectral atravs da WP pode ser visto na gura (3) onde foi analisado o som de um trompete entoando a nota L (A3) com intensidade mezzo-forte. O nvel de cinza representa a amplitude do coeciente da transformada, sendo preto os coecientes mais negativos e branco os coecientes mais positivos, nota-se a predominncia da cor cinza demonstrando o alto ndice de coecientes nulos.

Figure 2. Transformada Wavelet Packet de trs Nveis.

A WP pode ser interpretada como a decomposio do sinal em 2n bandas, onde n o nvel de profundidade da transformada. Ao decompormos um sinal em um nmero suciente de bandas possvel utilizarmos a WP para estimao espectral, porm para que isso seja feito necessrio que a WP obedea ao teorema de Parseval, que garante uma relao entre a amplitude do sinal e seus coecientes WP, e tenha uma relao denida entre a potncia espectral e a potncia dos coecientes de um n terminal da rvore (folha) da WP. A validao dessas condies necessrias pode ser observada em [1], juntamente com uma comparao entre esta tcnica e outras tradicionais, como o periodograma e o mtodo de Welch. Trs fatores so fundamentais para uma boa estimao espectral a partir da WP, o primeiro deles envolve a wavelet adotada. Diferentes wavelets resultaro em diferentes ltros com diferentes respostas em frequncia. Aps alguns testes notouse uma melhor resoluo frequencial a partir da wavelet "Meyer" em sua forma discreta, o que levou a adoo dessa wavelet para o futuro clculo do centroide espectral atravs da WP. O segundo fator necessrio para estimao espectral se encontra no ordenamento dos coecientes obtidos pela WP. Ao decimar o resultado de uma ltragem passa-altas, o espectro do sinal resultante sofre um espelhamento que, ao longo dos ramos da rvore da WP, induz um ordenamento no freqncial das folhas a priori. Porm pode observar que se as folhas forem reordenadas seguindo o cdigo de

Figure 3. Estimao Espectral de um Trompete (A3 Mezzo-forte).

4. O Centroide Espectral Wavelet


A partir da estimao espectral obtida na seo 3.2. foi possvel o clculo do centroide espectral wavelet a partir da frmula (1) apresentada na seo (2.), aps algumas consideraes. O espectrograma obtido pela STFT e usado como base para o cl-

culo do centroide espectral no possui valores negativos, porm os coecientes wavelet sim, portando necessrio utilizar valores absolutos dos coecientes. O centroide foi ento calculado entre os coecientes de uma mesma posio (deslocamento) para cada folha. Onde sua folha representa a frequncia (n na frmmula (1)) e o valor de cada coeciente sua magnitude (F (n) na frmula (1)). Nas guras 4 e 5 esto apresentados os resultados obtidos no clculo do centroide espectral wavelet e no centroide espectral convencional, respectivamente, para o mesmo som apresentado na gura (3).

Ainda so necessrios mais estudos comparativos entre as duas tcnicas, principalmente na anlise de outros tipos de sinais, e a respeito da complexidade do clculo. Seriam interessantes tambm novos ensaios para diferentes conguraes da WP, como outros valores de nveis de profundidade e outras wavelets. A partir do centroide espectral wavelet novos descritores podem ser criados seguindo o mesmo conceito, como o espalhamento espectral e qualquer outro descritor baseado em momentos espectrais.

References
[1] Dyonisius Donyand Ariananda, Madan Kumar Lakshmanan, and Homayoun Nikookar. An investigation of wavelet packet transform for spectrum estimation. In The 12th International Symposium on Wireless Personal Multimedia Communications (WPMC 09), 2009. [2] Maurcio Jos Alves Bolzan. Transformada em ondeleta: Uma necessidade. Revista Brasileira de Ensino de Fsica, 28:563 567, 2006. [3] C. Sidney Burrus, Ramesh A. Gopinath, and Haitao Guo. Introduction to Wavelets and Wavelet Transform: A Primer. Prentice Hall, 1998. [4] Editora Moderna. Guia do Acordo Ortogrco, 2008. [5] John M. Grey and John W. Gordon. Perceptual effects of spectral modications on musical timbres. The Journal of the Acoustical Society of America, Volume 63, Issue 5, 05/1978. [6] Arne Jensen and Anders la Cour-Harbo. Ripples in Mathematics: The Discrete Wavelet Transform. Springer, 2001. [7] Geoffroy Peeters. A large set of auio features for sound description (similarity and classication) in the cuidado project. Technical report, IRCAM, 2004. [8] Emery Schubert, Joe Wolfe, and Alex Tarnopolsky. Spectral centroid and timbre in complex, multiple instrumental textures. In Proc. of the 8th International Conference on Music Perception & Cognition (ICMPC), 2004.

Figure 4. Centroide Espectral Wavelet de um Trompete.

Figure 5. Centroide Espectral Convencional de um Trompete.

5. Concluses e Prximos Passos


Neste artigo foi apresentada toda a teoria que sustenta o novo conceito de clculo do centroide espectral atravs da transformada wavelet packet. A partir dos resultados obtidos nas guras (4) e (5) sugerida uma boa correlao entre as duas tcnicas apresentadas, o que valida a idia aqui apresentada.

Você também pode gostar