Você está na página 1de 18

Artigo: Um novo mtodo de reduo

de rudo em
sinais de voz baseados em Wavelets
Metodologia empregada e resultados obtidos

PROJETO: TRANSFORMADA WAVELET PARA TRATAMENTO DE RUDOS EM


SISTEMAS DE RECONHECIMENTO AUTOMTICO DE FALA

Orientadora:
Daniella Dias Cavalcante da Silva, DSc.
daniella.silva@ifpb.edu.br
Integrantes:
Carlos Alberto Arajo de Andrade
Nathlia Alves Rocha Batista
Pedro talo Ribeiro Albuquerque

Metodologia utilizada e
objetivos desse trabalho

Metodologia empregada: O clculo do limiar realizado nos instantes de


silncio, com aplicao em todo o sinal de voz com rudo. A reduo do rudo feita
comparando os coeficientes Wavelets do sinal ruidoso com o limiar obtido nos
instantes de silncio, de modo a se obter um novo sinal no domnio Wavelet.

Objetivos:
Eficincia para o tratamento de rudos brancos e tambm coloridos,
tal como: rudo de um carro em movimento constante;
Menores perdas de informao legtima do sinal de voz por extrao
do sinal rudo, reduo de rudo residual e minimizao de
distores no sinal processado.

Tcnicas Clssicas e a
Proposta pelo trabalho
Segundo as literaturas atuais:

A relao SNR(SignalNoise Rate) quando ALTA = Bons resultados para


a aplicao das Wavelets;
Quando SNR for BAIXA = Resultados no sero satisfatrios;
Utilizam como base o clculo de um limiar no sinal ruidoso, com
posterior eliminao de coeficientes Wavelets importantes.
Consequncias : Clculo pr-definido de um limiar causa a entrada de
rudos residuais incmodos a audio humana;
O rudo residual aparece quando o limiar aplicado aos coeficientes,
gerando novos coeficientes, sendo eles: Nulos ou no;
Para o domnio Wavelet em DWTs, os rudos residuais so parecidos
com rudos musicais;

Aplicar um nico valor de limiar para todas as faixas de frequncia no uma


boa ideia. O sinal de voz possu energia diferenciada nas diferentes faixas de
frequncia;
Alguns mtodos em uso assumem a deteco desses trechos e aplicao de
limiares para as frequncias ALTAS e BAIXAS;
Desvantagem: Inviabiliza muitas aplicaes, pois a mesma fica muito
presa ao rudo em estudo.
Com relao ao limiar, sendo ele HardThreshold ou SoftThreshold, ambos
tornaram o sinal processado descontnuo no tempo e na frequncia;
Causam a Degradao da qualidade auditiva do sinal aps processado, mas
tambm reduzem significativamente o nvel de rudos;

Mtodo Proposto pelo autor


do trabalho
Como mencionado anteriormente, os mtodos clssicos j utilizados determinam
um clculo do limiar que feito com base em todos os coeficientes Wavelets, no
havendo diferenciao de faixas de frequncia.
So muitos satisfatrios para rudos do tipo AWGN, pois, tem emisses em
todas as faixas de frequncia e mdia igual a zero no domnio do tempo.
Entretanto:
No so mtodos satisfatrios para serem empregados em rudos coloridos;

Mas, primeiramente, permita-nos lhes


apresentar...
Considerando a i-sima janela de silncio do sinal de voz e a j-sima faixa de
frequncia no domnio Wavelet, obtm-se inicialmente o Perfil do Rudo (ou
Desvio Padro do Sinal), de acordo com a equao (1), que dado por:

(1)
com sendo o conjunto de coeficientes Wavelets em cada banda

j.

O limiar a ser aplicado dado por:

, (2)
Onde, os limiares da janela atual e anterior so calculados de acordo com a equao (3).
(3) , sendo N o comprimento do sinal no domnio Wavelet e, a estimativa de potncia do sinal rudo;

Verifica-se que o limiar utilizado neste novo mtodo criado uma MDIA entre
os limiares da janela atual e da janela anterior , para cada faixa de frequncia

O fator indica o Grau de Variao dessa mdia; Para , bons resultados foram
adquiridos.

Nos mtodos anteriores


utilizados...
O uso de DWTs em compresso de sinais de voz faz com que seja
primeiramente realizado um clculo pr-definido de limiar para cada segmento de
voz no domnio Wavelet; assim, anulam-se todos os coeficientes com valores
abaixo desse valor de limiar;
O que causa?
Eliminao da redundncia do sinal(Coeficientes com baixa energia), depois a
compresso do sinal;
Considerando que as fases do sinal de voz limpo e as fases do rudo sejam
aleatrias, muito provvel que o valor de limiar quando pr-definido j esteja
muito acima dos valores contendo informao no sinal. Sero eliminados!

Portanto,
O aumento no valor do limiar deve manter um compromisso entre o nvel de
reduo de rudo que se deseja e as distores introduzidas no sinal processado
pois, quando se aplica o limiar, pode-se eliminar de forma aleatria
coeficientes Wavelets importantes para o sinal de voz.
Isso gera os rudos residuais que incomodam a audio humana e a
intelegibilidade do sinal quando acompanhado por um reconhecimento subjetivo,
por exemplo;
Alguns autores propem a aplicao de um limiar suave, mantendo uma
relao direta com o sinal, utilizado funes no lineares para calcular os novos
coeficientes Wavelets, abaixo e acima do limiar obtido. Mesmo assim, o rudo
residual ainda persiste com resultados um pouco melhores.

O mtodo proposto
As proposta para aplicao do limiar neste trabalho, so:
O limiar obtido aumentado por um fator ;
Os coeficientes Wavelet abaixo do limiar so substitudos pela sua sigmide e, multiplicada pelo prprio coeficiente;
Desta forma, o conjunto de coeficientes de cada faixa alterado como segue:

K varia de acordo com o nmero mximo de coeficientes da faixa de


frequncia j.
A funo
Onde,

Caractersticas funcionais
antes e durante os testes

Implementao feita no MatLab;


Foi utilizada uma DWT da famlia Daubechies de ordem 10;
Caractersticas dos sinais:
Obtido a partir de um sinal de voz limpo, em Portugus, com faixa de
frequncia de 16 KHz;
Adicionado posteriormente um sinal rudo do tipo Branco e um sinal
com rido de carro em movimento, a 90 Km/h, tambm em uma faixa
de 16 KHz;
O nmero de amostras para cada segmento de voz de 256.
A decomposio no domnio Wavelet foi feita em 8 faixas de
frequncia. Isso porque o sinal de entrada deve ser decomposto em
potncia 2;
Houveram as separaes entre os trechos de voz e de silncio de forma

Resultados para os
testes

Fontes para pesquisas


Marco A. Q. Duarte, Jozu V. Filho e Francisco Villarreal, Um Novo Mtodo de
Reduo de Rudo em Sinais de Voz Baseado em Wavelets, in: Anais do XXI
Simpsio Brasileiro de Telecomunicaes (SBT), Belm PR, Setembro de 2004.
Marco A. Q. Duarte, Jozu V. Filho e Francisco Villarreal, Um Mtodo Simples e
Eficiente para Deteco de Atividade de Voz Usando a Transformada Wavelet , in:
Anais do Congresso Nacional de Matemtica Aplicada e Computacional (CNMAC), 1984.

Você também pode gostar