Você está na página 1de 4

ISSN 2317-3297

Uso de equaes de diferenas para obteno de filtros na reduo de rudo em sinais de voz no domnio wavelet.
Caio C. E. de Abreu
Departamento de Engenharia Eltrica, FEIS UNESP, 15385-000, Ilha Solteira, SP E-mail: caioenside@aluno.feis.unesp.br

Marco A. Q. Duarte
Universidade Estadual do Mato Grosso do Sul UEMS l 79540-000, Cassilndia, MS E-mail: marco@uems.br

Francisco Villarreal
Departamento de Matemtica, FEIS UNESP, 15385-000, Ilha Solteira, SP E-mail: villa@mat.feis.unesp.br

Palavras-chave: Wavelet, diferenas finitas, reduo de rudo. Resumo: O mtodo proposto neste trabalho tem por objetivo superar algumas deficincias que os mtodos que utilizam o limiar apresentam. A principal mudana est na construo de um filtro que atue no sinal levando em considerao informaes contidas em cada coeficiente ou em uma pequena vizinhana do mesmo. Com isso, no se faz necessrio o uso de um nico valor (valor do limiar) como referncia para processar todos os coeficientes de uma faixa de frequncia do sinal. Seis sinais de voz so avaliados, a anlise feita a partir dos valores de SNR e das respectivas notas PESQ obtidas para os sinais processados.

Introduo

Quando se fala em reduo de rudo em sinais de voz, o objetivo melhorar a qualidade do sinal. Existem vrios mtodos para a reduo de rudo. Alguns usando a transformada de Fourier [7] e outros, a transformada wavelet [2-5]. Dentre os que utilizam a transformada wavelet, alguns so baseados em Limiar, ou seja, consideram com rudo os coeficientes do sinal cujo valor absoluto menor que um determinado valor [2], e outros considerados No-Limiar [5]. Os mtodos que usam limiar so os mais utilizados na literatura, porm, possuem grandes limitaes que aos poucos esto sendo superadas pelos mtodos que no fazem uso do Limiar [4,5]. Neste trabalho, assume-se que os sinais ruidosos em questo, possam ser descritos pelo modelo aditivo: , (1) em que o sinal de voz, o rudo e representa o ndice de tempo discreto. A contaminao do sinal de voz para estes mtodos pode ser feita com o rudo colorido, que o tipo de rudo presente em situaes reais. A melhoria dos sinais de voz, aqui considerados, consiste em recuperar o sinal original, , a partir do sinal ruidoso .

Metodologia Proposta

A metodologia de reduo de rudo proposta neste trabalho consiste na estimao do sinal de sada a partir do original, no domnio wavelet, sem o uso do limiar. O sinal estimado pelas equaes de diferenas usadas na resoluo numrica de derivadas e equaes diferenciais [3,6]. Para a estimao do rudo usado o operador SNRP proposto por Soares et al. em [5], que aplicado em cada uma das equaes de diferenas. Uma combinao polinomial realizada de maneira a condensar todas as equaes de diferenas em uma nica funo de transferncia, esta por sua vez sofrer um ajuste sigmoidal visando uma melhor adequao entre as amplitudes dos sinais originais e processados. Porm, antes disto prope-se uma pr-filtragem, realizada por um operador denominado Dif. O filtro obtido no ltimo passo, que o ajuste sigmoidal.

376

ISSN 2317-3297

2.1

O uso das equaes de diferenas para estimar o sinal de sada

Alm do uso das diferenas centradas e avanadas de primeira e segunda ordem, proposto por Duarte em [3], prope-se o uso das diferenas de terceira e quarta ordem. Considere um sinal de voz no domnio wavelet , os coeficientes obtidos pelas diferenas finitas centradas e avanadas so representados respectivamente por e . O ndice representa a ordem das equaes e o ndice representa uma posio arbitrria no tempo discreto do sinal em processamento. Diferenas centradas de primeira a quarta ordem [6]: , (2) , , (3) (4)

(5) Diferenas avanadas de primeira a quarta ordem [6]: , (6) , (7) , (8) . (9) Desta forma obtm-se os vetores , , , , , , , , todos no domnio wavelet. Uma interpretao pertinente relativa s diferenas finitas seria que, quando se analisa um determinado coeficiente de um sinal de voz, leva-se em considerao informaes contidas em uma pequena vizinhana prxima ao mesmo. Neste sentido, quanto maior o grau das equaes de diferenas usadas, maior a vizinhana onde se extrai as informaes utilizadas na construo do respectivo coeficiente de filtro [3]. 2.2 Combinao polinomial

A combinao polinomial proposta consiste na criao de uma funo , cujos elementos so obtidos de acordo com a equao (10). Toma-se uma janela de comprimento do sinal a ser processado e aplica-se o operador SNRP proposto em [5], aqui denotado por , a cada uma das diferenas usadas. Verifica-se se a janela est em uma regio de silncio ou em uma regio de voz. Para fins didticos, cria-se uma varivel binria denominada . Se a janela estiver numa regio no-vozeada, atribui-se varivel o valor 0 (zero), caso contrrio ser atribudo o valor 1 (um). Sendo assim, os coeficientes da funo so obtidos da seguinte forma:
se se
(10)

As potncias aplicadas s diferenas de terceira e quarta ordem, foram determinadas de modo emprico com o objetivo de reduzir o rudo presente nos trechos de voz. Quando o trecho em processamento vozeado necessita-se de maior quantidade de informaes para construo do filtro. Para isso, utilizam-se as diferenas de terceira e quarta ordem. 2.4 O operador Dif

Para entender o funcionamento deste operador, considera-se o esquema de um banco de filtros, onde o sinal no domnio wavelet pode ser dividido em diferentes faixas de frequncia. Os sons unvoiced so reconhecidos com o aumento de energia em altas frequncias quando comparado s regies voiced [2]. O operador proposto Dif realiza um tratamento especfico nas altas frequncias, tendo como objetivo eliminar rudo ao mesmo tempo em que evidencia as regies voiced e unvoiced. Este processo pode ser encarado como uma pr-filtragem.

377

ISSN 2317-3297

Em particular, divide-se o sinal de voz no domnio wavelet em 3 faixas diferentes e equivalentes: , e . O operador Dif aplicado sobre os coeficientes obtidos do processo de combinao polinomial conforme a equao (11).

,se

est contido em

ou

(11)

, caso contrrio. Este operador propicia uma maior reduo de rudo sem haver perdas de coeficientes relevantes.
2.5 Obteno do filtro de reduo de rudo

A fim de preservar a amplitude original do sinal, o filtro utilizado no processo de filtragem, adquirido via ajuste sigmoidal dos coeficientes do sinal estimado. Os coeficientes de so obtidos conforme a equao (12) [3,5]: . (12) O parmetro , que controla a inclinao da sigmoide, depende apenas do perfil do rudo [5]. O objetivo deste ajuste combinar os processamentos propostos pelas equaes de diferenas apresentadas na seo 2.1, mantendo a amplitude do sinal original. O processo de filtragem se faz atravs do produto entre os coeficientes do filtro , construdo a partir do mtodo proposto, pelos correspondentes coeficientes do sinal ruidoso , no domnio wavelet. Aps a filtragem o sinal processado no domnio do tempo obtido atravs da transformada wavelet discreta inversa.

Testes computacionais e anlise dos resultados

Para constatar a eficincia do mtodo, verificaram-se os nveis de reduo de rudo e de distoro usando duas medidas de qualidade objetivas, a SNR (Signal to Noise Ratio) e a PESQ (perceptual evaluation of speech quality). A avaliao realizada pela PESQ baseada em caractersticas psicoacusticas do ouvido humano. A nota PESQ varia entre 1 e 5. Ser considerado de boa qualidade o sinal que obtiver nota PESQ maior ou igual a 3 [1]. Durante os testes foram utilizados seis sinais de voz, divididos em voz masculina e feminina, nos idiomas ingls e portugus, todos sugeridos pela ITU-T (Test Signals for Telecommunication Systems). As simulaes foram realizadas no ambiente MATLAB e a funo wavelet utilizada na aplicao da DWT foi wavelet de Daubechies de ordem 10 (db10). A contaminao dos sinais originais foi feita com trs tipos de rudo colorido, presentes em situaes reais, rudo de carro, de restaurante e de metr. Os sinais foram analisados com dois nveis de SNR, 5dB e 10dB. A Figura 1a apresenta as mdias das notas PESQ obtidas para os sinais ruidosos e processados, bem como a Figura 1b exibe as mdias de SNRs dos sinais limpo e processados.

Notas PESQ
5 4 PESQ 3 2 1 0 SNR (dB)

Valores de SNR
40 30 20
Rudo de Carro

10 0
Limpo 10dB 5dB

Rudo de Restaurante Rudo de Metr

(a)

(b)

Figura 1: Resultados obtidos por meio de avaliaes objetivas.

378

ISSN 2317-3297

Analisando os valores de SNRs apresentados na Figura 1b, verifica-se que o mtodo proposto reduz significativamente o rudo presente no sinal. Como a SNR uma medida de qualidade objetiva que serve para avaliar o nvel do rudo presente em um sinal, ela no mede a inteligibilidade dos sinais processados. Para isso, deve-se levar em considerao as notas PESQ dos mesmos. Sendo assim, analisando as notas PESQ apresentadas na Figura 1a, constata-se que no houve distores nos sinais processados. Alm disso, estes sinais podem ser considerados de boa qualidade do ponto de vista auditivo, pois em mdia, obtiveram notas iguais ou superiores a 3.

Consideraes finais

A proposta deste trabalho foi o uso de um mtodo no-limiar para reduo de rudo em sinais de voz no domnio wavelet. Este mtodo tem como principal objetivo o processamento eficaz de sinais contaminados por rudo reais, sem o uso de um limiar. Os valores de SNR dos sinais processados estiveram sempre prximos dos valores dos sinais limpos, indicando boa reduo de rudo sem inserir distores nos trechos de voz do sinal. As notas PESQ, em mdia, estiveram sempre iguais ou superiores a 3, indicando uma boa qualidade dos sinais processados. A principal vantagem do mtodo no-limiar proposto neste trabalho, em relao aos demais mtodos de reduo de rudo no domnio wavelet, a construo de um filtro que atua no sinal levando em considerao informaes contidas em cada coeficiente e numa vizinhana do mesmo. Outro fato positivo, que a reduo de rudo realizada pelo mtodo proposto uniforme em todo o sinal, evitando desconforto ao ouvinte. Devido atuao das diferenas em conjunto com o operador Dif, foi possvel realizar uma forte reduo de rudo inserindo perdas insignificantes na amplitude dos coeficientes de voz. Estas perdas so imperceptveis ao ouvido humano. Os testes continuam em andamento, o prximo objetivo a avaliao do mtodo da forma como foi feita neste trabalho, porm desta vez utilizando em torno de 60 sinais de voz. Agradecimentos Os autores agradecem ao suporte financeiro por parte do Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico (CNPq). Referncias [1] J.G. Beerends,; A. P. Hekstra; A. W. Rix; M. P. Hollier. Perceptual evaluation of speech quality (PESQ) the new ITU standard for end-to-end speech quality assessment part ii: psychoacoustic model. AES Journal, New York, v. 50, n.10, p. 765-778, 2002. [2] M. A. Q. Duarte. Reduo de rudo em sinais de voz no domnio wavelet., Tese de Doutorado, FEIS, UNESP, 2005. [3] M. A. Q. Duarte. Processamento de sinais de voz no domnio wavelet. Relatrio de pesquisa, UEMS, 2010. [4] W. C. Soares; M. A. Q. Duarte; F. Villarreal; J. Vieira Filho. Anlise de mtodos de reduo de rudo por limiar no domnio wavelet. TEMA: Tendncias em Matemtica Aplicada e Computacional, So Carlos, v.9, n.3, p.471-480, 2008. [5] W. C. Soares; F. Villarreal; M. A. Q. Duarte; J. Vieira Filho. Wavelets in a Problem of Signal Processing, Novi Sad Journal of Mathematics, v.41, n.1, p.11-2-, 2011. [6] D. Sperandio; J. T. Mendes; L. H. M. Silva. Clculo Numrico Caractersticas Matemticas e Computacionais dos Mtodos Numricos, Prentice Hall, So Paulo, 2003. [7] J. Vieira Filho. Reduo de rudo em sinais de voz nos sistemas rdio mveis veiculares., Tese de Doutorado, FEEC, UNICAMP, 1996.

379

Você também pode gostar