Escolar Documentos
Profissional Documentos
Cultura Documentos
=
) 1 . 3 (
A lei de Fourier diz que, conforme exibido na Equao 3.2, a quantidade de calor Q
que atravessa uma parede, sob uma diferena de temperatura constante, diretamente
19
proporcional rea da seco transversal A, diferena de temperatura () entre as regies
separadas pela parede e ao tempo (t) de transmisso e inversamente proporcional
extenso atravessada, ou espessura (e) da parede.
e
t A k
Q
=
. . .
) 2 . 3 (
Como o calor se propaga de partcula para partcula, corpos mais densos, com maior
nmero de partcula por unidade de volume, especialmente partculas livres, so bons
condutores. Isto explica por que os metais so bons condutores. Pelo mesmo motivo, os
lquidos e gases no so bons condutores de calor. Os materiais em que a conduo trmica
praticamente no ocorre so chamados isolantes trmicos, por exemplo, a madeira e o
isopor.
3.4.3 - Transformadas
Sinais so quantidades fsicas ou variveis detectveis por meio das quais
informaes podem ser transmitidas. Existem duas formas tradicionais de se representar
sinais fsicos:
Representao no domnio do tempo - onde a amplitude do sinal
representada como uma funo do tempo;
Representao no domnio da freqncia - onde a funo que representa o
sinal mostra a amplitude de cada freqncia que o compe.
Diversos estudos vm sendo feitos na rea de processamento digital de sinais com o
intuito de melhorar a aquisio dos sinais que registram informaes, necessrias para uma
avaliao confivel. Na literatura existem vrios tipos de transformadas que auxiliam na
captura e interpretao da informao de um sinal, mtodos que definem a melhor forma de
sinal a ser utilizada, por exemplo, como entrada de uma Rede Neural Artificial. A seguir
sero citadas algumas transformadas que so muito utilizadas em processamento digital de
sinais.
Transformada Z
A Transformada Z uma generalizao da Transformada de Fourier de sinais discretos
desenvolvido por De Moivre em 1730. Tal como a Transformada de Laplace, a
Transformada Z permite que sistemas com funo de transferncia racional sejam
caracterizados pelo seu mapa de plos e zeros.
20
A Transformada Z desempenha para os sinais discretos o mesmo papel que a
Transformada de Laplace para os sinais contnuos. Para uma seqncia x(n), definido para
todo n, a Transformada Z de x(n) exibida pela Equao 3.3, onde z uma varivel
complexa e X(z) a funo desta varivel complexa.
=
n
n
z n x z X ) ( ) (
) 3 . 3 (
A localizao dos plos e da regio de convergncia permite determinar caractersticas
como a causalidade e a estabilidade. O mapa de plos e zeros permite esboar
geometricamente a Transformada de Fourier parte um fator de escala.
Transformada de Laplace
Est tcnica est presente quase sempre em estudos da dinmica e do controle de
processos. usada em sistemas lineares e permite converter equaes diferenciais comuns
em equaes algbricas. A transformada de Laplace tem seu nome em homenagem ao
matemtico francs Pierre Simon Laplace (Figura 3.3).
Figura 3.3 - Pierre Simon Laplace.
Em Matemtica, e em particular na anlise funcional, a transformada de Laplace de
uma funo f(t) definida para todo nmero real t 0 a funo F(s), definida abaixo pela
Equao 3.4.
= =
0
.
) ( {f(t)} ) ( dt t f e s F
t s
) 4 . 3 (
21
As propriedades desta transformada a tornam til para a anlise de sistemas dinmicos
lineares. A vantagem mais interessante desta transformada que a integrao e a derivao
tornam-se multiplicaes e divises, da mesma maneira que o logaritmo transforma a
multiplicao em adio. Ela permite levar a resoluo de equaes diferenciais resoluo
de equaes polinomiais, que so muito mais simples de resolver.
Transformada de Wavelet
As wavelets so funes matemticas que surgiram em meados da dcada de 80 e que
se destacaram em diversas reas da cincia e da engenharia. A principal motivao atrs do
desenvolvimento das wavelets foi busca por um algoritmo rpido que representasse
funes e conjuntos de dados de forma compacta.
As funes da Transformada Discreta de Wavelet (Discrete Wavelet Transform
DWT) so operaes lineares em um vetor cujo tamanho uma potncia de dois,
transformando-o em outro vetor, numericamente diferente e de mesmo tamanho.
Estudos na rea de processamento de sinais destacaram as wavelets como uma
transformada capaz de capturar a essncia de um conjunto de dados com apenas um
pequeno conjunto de coeficientes, de forma superior s tradicionais transformadas, o que
contribui para a compactao dos udios digitais. Existem algumas famlias de wavelets,
citadas abaixo:
Haar - a primeira e a mais simples de todas. descontnua e equivale a
Daubechies citada a seguir;
Daubechies - Compactly-supported orthonormal wavelets;
Biortogonal - Apresenta a propriedade de fase linear, que necessria na
reconstruo de sinais e imagens. Utiliza duas wavelets, uma para decomposio
e outra para reconstruo, o que gera propriedades interessantes;
Coiflets - A funo wavelet possui 2N momentos iguais a zero e a funo escala
tem 2N-1 momentos iguais a zero;
Symlets - So wavelets simtricas. Foi proposta como uma modificao da
famlia Daubechies pela prpria, possuindo caractersticas similares as desta
famlia;
Morlet - No possui funo escala e explcita;
Mexican Hat - Tambm no possui funo escala, mas no explcita;
Meyer - A wavelet e a funo de escala esto definidas no domnio de
freqncia.
22
Transformada de Mellin
Em matemtica, a Transformada de Mellin uma transformada integral que pode ser
vista como uma verso multiplicativa da Transformada de Laplace. Esta transformada
integral extremamente conectada com as Sries de Dirichlet freqentemente usada na
teoria numrica e a teoria de expanses assintticas, sendo muito relacionada com a
Transformada de Laplace e a Transformada de Fourier. A transformada de Mellin de uma
funo F exibida na Equao 3.5 abaixo:
= =
0
1
) ( )} ( { ) ( dx x f x x f s F
s
) 5 . 3 (
Transformada de Hilbert
Em processamento digital de sinais freqentemente necessrio olhar as relaes entre
as partes reais e imaginrias de um sinal complexo. Essas relaes so geralmente descritas
pelas Transformadas de Hilbert. Esta metodologia utilizada em anlises complexas para
gerar funes analticas de valores complexos de funes reais. A transformada de Hilbert
usada para gerar funes o quais os componentes so conjugados harmnicos.
A transformada de Hilbert de um sinal x(t) definido a ser um sinal o quais
componentes da freqncia so todas divididas em fases por ( / 2) radianos. A
transformada de Hilbert de um sinal real dada pela Equao 3.6 abaixo:
= dt
t
s
t s H
1
)] ( [
) 6 . 3 (
Com a transformada de Hilbert, pode-se calcular diretamente a fase acstica atravs da
freqncia de resposta. Ou seja, dada uma freqncia de resposta de magnitude acstica de
um sistema de caixas de auto-falante, por exemplo, pode-se transformar os dados em
freqncia de resposta de fase acstica, atravs da Transformada de Hilbert.
Alm dessas transformadas abordadas, h outras tambm muito utilizadas em
processamento digital de sinais como, por exemplo, a Transformada K que a reviso das
transformadas de Fourier, Mellin e Hilbert o qual propiciou a fundao do projeto para o
desenvolvimento desta nova transformada.
23
3.4.4 - Aplicaes
A Transformada de Fourier possui muitas aplicaes em disciplinas cientficas.
Como exemplo pode-se citar:
Fsica;
Teoria dos nmeros;
Anlise combinatria;
Processamento de sinais;
Teoria da probabilidade;
Estatstica;
Criptografia;
Acstica;
Oceanografia;
ptica;
Geometria;
Nos campos relacionados com o processamento digital de sinal, a Transformada de
Fourier tipicamente utilizada para decompor sinais nos seus componentes em freqncia e
sua amplitudes. Atualmente existem diversas ferramentas matemticas que provm
transformao de uma funo (sinal) do domnio do tempo para o domnio da freqncia.
Em muitas aplicaes necessrio conhecer no apenas quais as freqncias que
compem um sinal, mas a localizao desta freqncia no domnio do tempo (exemplo: a
freqncia de 50 Hertz existe no intervalo de tempo de 100ms a 125 ms). Como exemplo,
pode-se fazer uma analogia com o processamento de um radar onde a existncia de
determinada freqncia detecta a presena de um objeto e a localizao dessa freqncia
permite determinar a posio deste objeto.
3.4.5 - Algoritmo da Transformada de Fourier
A Transformada de Fourier uma transformada integral que expressa uma funo em
termos de funes de base senoidal, como soma ou integral de funes senoidais
multiplicadas por coeficientes (amplitudes). Existem vrias variaes diretamente
relacionadas desta transformada, dependendo do tipo de funo a transformar.
A Transformada de Fourier normalmente apresentada em sua forma contnua. No
entanto a sua implementao computacional invivel j que os computadores s realizam
clculos discretos. Da a importncia do entendimento da Transformada Discreta de Fourier
(DFT Discrete Fourier Transform).
24
De acordo com Fourier, toda funo real peridica de perodo 2, pode ser escrita
como uma soma infinita de senos e co-senos, conforme mostra a Equao 3.6 abaixo:
( )
=
+ + =
1
) . ( ) . cos( ) (
k
k k o
x k sen b x k a a x f
) 6 . 3 (
Onde os coeficientes a
0
, a
k
e b
k
so calculados segundo as equaes a seguir:
2
0
0
) (
2
1
dx x f a
) 7 . 3 (
2
0
) . cos( ) (
1
dx x k x f a
k ) 8 . 3 (
2
0
) . ( ) (
1
dx x k sen x f b
k ) 9 . 3 (
A Tabela 3.1 abaixo apresenta a correspondncia entre a funo no domnio do tempo e
a funo correspondente no domnio da freqncia, para vrios tipos de funo [BRI - 74].
A transformada de Fourier construda a partir da srie de Fourier dada pela Equao 3.6 e
sua forma discreta descrita conforme a Equao 3.10 abaixo:
)] sen( ) )[cos( (
2
1
) (
2
1
) (
1 2
0
1 2
0
k p
N
p
k p k
N
p
t i
k p
t i t t f
N
e t f
N
F
k p
=
+ = = ) 10 . 3 (
Esta transformada recebe um sinal de entrada no domnio do tempo, ) (
k
t f , e retorna um
sinal no domnio da freqncia, ) (
p
F .
25
Domnio do Tempo Domnio da Freqncia
Real
Parte real par
Parte imaginria mpar
Imaginria
Parte real mpar
Parte imaginria par
Parte real par
Parte imaginria mpar
Real
Parte real mpar
Parte imaginria par
Imaginria
Real e par Real e par
Real e mpar Imaginria e mpar
Imaginria e par Imaginria e par
Imaginria e mpar Real e mpar
Tabela 3.1 Relaes de domnios de tempos dos sinais
Para se realizar o clculo da Transformada de Fourier de um sinal, necessrio
saber qual ser a sua taxa de amostragem. A taxa de amostragem indica quantas vezes num
segundo se podem tirar amostras de voz ou msica analgica. A taxa de amostragem
exprime-se em hertz, isto , nmero de amostras por segundo onde as mais comuns so
5.500, 11.025, 22.050 e 44.100 Hertz. Um mtodo prtico mostra que a taxa de amostragem
tem de ter uma freqncia pelo menos duas vezes mais elevada que o som que se est a
registrar. Por outras palavras, se quisermos converter um som numa representao digital
utilizando toda a capacidade de audio humana (20 - 20.000 Hertz), as amostras do sinal
tm de ser registradas a uma taxa igual utilizada pelos leitores de CD - 44.100 Hertz.
A preciso da amostragem indica a quantidade de valores numricos diferentes que
uma amostra pode conter. Tanto a taxa como a preciso da amostragem afeta a qualidade
do som e o nmero de bits necessrio para os representar. Quanto mais elevada for a taxa e
a preciso da amostragem, melhor ser a qualidade do som. Contudo, um maior nmero de
bits requer mais espao de armazenagem e maior capacidade de transmisso de dados.
26
3.4.6 - Propriedades da Transformada de Fourier
Sabe-se ento que h duas maneiras de representar uma mesma funo ou sinal:
uma representao no domnio do tempo ou do espao e outra no domnio da freqncia.
A representao de um sinal no domnio do tempo est presente, naturalmente, no nosso dia
a dia. Contudo, certas operaes, principalmente na engenharia, tornam-se muito mais
simples e esclarecedoras se trabalharmos no domnio da freqncia, domnio este,
conseguido atravs das Transformadas de Fourier. muito importante observar o que
ocorre em um domnio, quando efetuamos certas operaes no outro domnio.
A seguir sero citadas apenas algumas propriedades da Transformada de Fourier.
Desde j se deve enfatizar que as frmulas e variveis apresentadas a seguir no sero
provadas matematicamente, mas somente citadas de acordo com a propriedade em questo,
pois se tem como objetivo apenas mostrar algumas propriedades desta metodologia.
Separabilidade
Esta propriedade nos mostra que o par de transformadas F(u,v) e f(x,y) pode ser
obtido em dois passos separados. Em outras palavras, a funo F(u,v) obtida pela
transformao em cada linha de f(x,y) e o resultado multiplicado pelo nmero total das
mesmas, M, obtendo-se F(x,v). F(u,v) obtida, agora, transformando-se F(x,v) coluna por
coluna. A Equao 3.11 abaixo mostra esta propriedade.
=
1
0
/ 2
1
0
/ 2
) , (
1 1
) , (
N
y
N yv j
M
x
M ux j
e y x f
N
e
M
v u F
) 11 . 3 (
Translao
Esta propriedade mostra, conforme exibido pela Equao 3.12, que a multiplicao
de f(x,y) pela exponencial e
j2p(u0 x/M + v0 y/N)
resulta num deslocamento na freqncia para o
ponto (u
0
, v
0
). De maneira anloga, se multiplicarmos a transformada F(u,v) pela mesma
exponencial e tomarmos a transformada inversa, efetuamos um deslocamento espacial da
origem para o ponto (x
0
, y
0
).
) , ( ] ) , ( [
0 0
) / / ( 2
0 0
v v u u F e y x f
N y v M x u j
=
+
) 12 . 3 (
Periodicidade e Continuidade das Funes
A periodicidade mostra que se f(x,y) peridica, somente um perodo necessrio
para especificar completamente F(u,v) no domnio da freqncia. O mesma se aplica a
f(x,y) no domnio espacial Equao 3.13.
27
) , ( ) , ( )] , ( [ v u F N v M u F N y M x f = + + = + +
) 13 . 3 (
Verifica-se, atravs da Figura 3.4, a analogia entre continuidade e periodicidade que
esta propriedade est relacionada com a natureza do sinal, da mesma maneira que o tipo de
representao de Fourier est relacionado com a natureza do sinal. Esta propriedade
permite se ter uma anlise qualitativa da funo, seja qual for o domnio, evitando assim
um trabalho quantitativo exaustivo e, s vezes, desnecessrio.
Figura 3.4 - Analogia entre Continuidade e Periodicidade.
Rotao
Esta propriedade nos mostra que uma rotao em f(x,y) por ngulo , produz a
mesma rotao em F(u,v) e vice-versa Equao 3.14.
)] cos( [ )]} cos( [ { + = + F r f
) 14 . 3 (
Teorema da Convoluo
O teorema da convoluo , provavelmente, uma das ferramentas mais eficazes na
anlise em freqncia. A importncia da convoluo no domnio da freqncia consiste no
fato que se f(x) tem a transformada de Fourier F(u) e g(x) tem sua transformada de Fourier
G(u) ento f(x)*g(x) tem F(u)G(u) como transformada, ou seja f(x)*g(x) F(u)G(u)
como exibido na Equao 3.15 abaixo.
= = ) ( ) ( ) ( ) ( )] ( * ) ( [
2
u G u F u G d e f x g x f
u j
) 15 . 3 (
DOMNIO DO TEMPO DOMNIO DA FREQNCIA
Continuidade
Discreto
Contnuo
Periodicidade
Peridico
No-Peridico
Periodicidade
Peridico
No-Peridico
Discreto
Contnuo
Continuidade
28
Linearidade
Esta propriedade utilizada na soluo de funes complexas, quando estas so
fracionadas em sub-funes mais simples. Este mtodo conhecido como fatorao em
fraes parciais. Deve-se observar, entretanto, que no caso de funes peridicas, o pr-
suposto bsico de que as sub-funes possuam o mesmo perodo fundamental. A tcnica
de fatorao de uma funo no domnio da freqncia realizada, normalmente, com base
na natureza das razes do polinmio-denominador desta funo.
3.4.7 - Exemplo Prtico
Antes de aplicar na prtica esta metodologia num computador, teve-se como interesse a
resoluo de um teste de mesa para comprovar matematicamente o funcionamento da
Transformada Discreta de Fourier. A partir de um sinal f(t
k
) com apenas quatro amplitudes
foram transformadas do domnio do tempo para o domnio da freqncia, conforme
ilustrado abaixo. Para este exemplo s foram capturadas quatro freqncias (0, 1, 2 e 3) do
sinal apenas como demonstrao da veracidade da aplicao.
( )
k
t f Sinal =
(
=
2
1
, 1 , 1 , 0
Para o clculo dos coeficientes e utilizada a frmula da Transformada Discreta de
Fourier, conforme exibido pela Equao 3.16:
( ) ( ) ( ) | |
=
+ =
3
0
cos
2
1
) (
k
k p k p k p
t w sen i t w t f
N
w F
) 16 . 3 (
Onde as freqncias, tempos e o perodo so definidos a seguir:
o A varivel w
p
o clculo da freqncia no perodo (T) em que se quer
analisar o sinal:
T
p
w
p
=
2
o A varivel t
k
o tempo que se pega do sinal de entrada:
N
T K
t
k
=
2
o A varivel T a determinao da taxa de amostragem:
2 = T
29
Calculando as freqncias e os tempos do sinal de acordo com a tabela 3.2:
Freqncias Tempos
1
2
1 2
0
2
0 2
1
0
=
=
=
=
w
w
3
2
3 2
2
2
2 2
3
2
=
=
=
=
w
w
2 2 2
2 1
0
2 2
2 0
1
0
=
=
=
t
t
2
3
2 2
2 3
2 2
2 2
3
2
=
=
=
t
t
Tabela 3.2 Freqncias e tempos do sinal a ser analisado.
A seguir so apresentados todos os clculos para a obteno dos coeficientes:
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
125 , 0
8
1
...
cos cos
cos cos
2
1
3 0 3 0 3 2 0 2 0 2
1 0 1 0 1 0 0 0 0 0
0
= = =
+ + +
+
+ + +
=
t w sen i t w t f t w sen i t w t f
t w sen i t w t f t w sen i t w t f
N
w F
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
i
i
t w sen i t w t f t w sen i t w t f
t w sen i t w t f t w sen i t w t f
N
w F 375 , 0 25 , 0
8
3
4
1
...
cos cos
cos cos
2
1
3 1 3 1 3 2 1 2 1 2
1 1 1 1 1 0 1 0 1 0
1
= = =
+ + +
+
+ + +
=
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
375 , 0
8
3
..
cos cos
cos cos
2
1
3 2 3 2 3 2 2 2 2 2
1 2 1 2 1 0 2 0 2 0
2
= = =
+ + +
+
+ + +
=
t w sen i t w t f t w sen i t w t f
t w sen i t w t f t w sen i t w t f
N
w F
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
i
i
t w sen i t w t f t w sen i t w t f
t w sen i t w t f t w sen i t w t f
N
w F 375 , 0 25 , 0
8
3
4
1
...
cos cos
cos cos
2
1
3 3 3 3 3 2 3 2 3 2
1 3 1 3 1 0 3 0 3 0
3
+ = + = =
+ + +
+
+ + +
=
A seguir so calculados os espectros de potncia para os quatro coeficientes
calculados:
Freqncia 0: 125 , 0 0
8
1
8
1
2
= + |
.
|
\
|
Freqncia 1: 450 , 0
8
3
4
1
8
3
4
1
2 2
= |
.
|
\
|
+ |
.
|
\
|
i
Freqncia 2: 375 , 0
8
3
8
3
2
= |
.
|
\
|
30
Freqncia 3: 450 , 0
8
3
4
1
8
3
4
1
2 2
= |
.
|
\
|
+ |
.
|
\
|
+
i
Para a verificao da confiabilidade do sinal obtido no domnio da freqncia torna-
se necessrio realizao do processo inverso para a obteno do sinal original
novamente (domnio do tempo). Para isso utilizado a Transformada Discreta Inversa
de Fourier (IDFT Inverse Discrete Fourier Transform), conforme ilustrado pela
Equao 3.17 abaixo:
( ) ( ) ( ) | |
=
=
3
0
cos ) (
p
k p k p k p
t w sen i t w t f w F
) 17 . 3 (
A seguir so apresentados todos os clculos para o retorno ao sinal original:
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
0 ...
cos cos
cos cos
0 3 0 3 3 0 2 0 2 2
0 1 0 1 1 0 0 0 0 0
0
= =
+
+
+
=
t w sen i t w w f t w sen i t w w f
t w sen i t w w f t w sen i t w w f
t F
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
1 ...
cos cos
cos cos
1 3 1 3 3 1 2 1 2 2
1 1 1 1 1 1 0 1 0 0
1
= =
+
+
+
=
t w sen i t w w f t w sen i t w w f
t w sen i t w w f t w sen i t w w f
t F
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
1 ...
cos cos
cos cos
2 3 2 3 3 2 2 2 2 2
2 1 2 1 1 2 0 2 0 0
2
= =
+
+
+
=
t w sen i t w w f t w sen i t w w f
t w sen i t w w f t w sen i t w w f
t F
( )
( ) ( ) ( ) | | ( ) ( ) ( ) | |
( ) ( ) ( ) | | ( ) ( ) ( ) | |
2
1
...
cos cos
cos cos
3 3 3 3 3 3 2 3 2 2
3 1 3 1 1 3 0 3 0 0
3
= =
+
+
+
=
t w sen i t w w f t w sen i t w w f
t w sen i t w w f t w sen i t w w f
t F
Verificou-se ento que este processamento funciona realmente, j que dado um sinal
qualquer no domnio do tempo, foi possvel calcular os coeficientes do sinal (DFT), o seu
espectro de potncia, e o retorno para o sinal original atravs da IDFT. A tabela 3.3 mostra
as etapas desta aplicao.
31
Processos da Transformada Discreta de Fourier
Sinal Original 0 -1 1
2
1
Clculo da DFT
8
1
8
3
4
1 i
8
3
8
3
4
1 i
+
Espectro de Potncia 0,125 0,450 0,375 0,450
Clculo da IDFT 0 -1 1
2
1
Tabela 3.3 Etapas da Transformada Discreta de Fourier
3.5 - Implementao da Transformada de Fourier
Para colocar em prtica todos os estudos relacionados a tcnicas de Fourier, foi
realizada uma implementao da Transformada Discreta de Fourier e nela utilizadas
algumas aplicaes existentes na literatura. Para isso, foi utilizando a ferramenta
MATLAB 7.0 como mostra a Figura 3.5 abaixo. Foi escolhido este aplicativo, pois o
MATLAB (MATrix LABoratory) um software interativo de alta performance voltado
para o clculo numrico e cientfico. O MATLAB integra anlise numrica, clculo
com matrizes, processamento de sinais e construo de grficos em ambiente fcil de
usar onde problemas e solues podem ser expressos como eles so escritos na
matemtica ou na forma de uma linguagem de programao.
32
Figura 3.5 Software MATLAB.
A implementao da Transformada Discreta de Fourier abaixo mostra todo o
processo de clculos dos coeficientes do sinal, seu espectro de potncia, o clculo da
Transformada Inversa de Fourier bem como a comparao desta com o sinal original.
Pode-se perceber que esta implementao realizada no MATLAB comparada com
outras arquiteturas muito mais simples, pois o elemento bsico de informao uma
matriz que no requer dimensionamento permitindo a resoluo de muitos problemas
numricos em apenas uma frao do tempo que se gastaria para escrever um programa
semelhante em linguagem Fortran, Basic ou C.
Com base neste software, foi produzido um algoritmo no que realizasse a
Transformada Discreta de Fourier que ilustrada a seguir. Neste algoritmo so
executados procedimentos divididos por etapas conforme a tabela 3.4 abaixo.
Algoritmo da Transformada Discreta de Fourier
Etapas Procedimento
I Leitura do sinal que se deseja processar
II Configurao das freqncias que sero obtidas a partir do sinal
III Clculo da Transformada Discreta de Fourier
IV Clculo do espectro de potncia
V Clculo da Inversa da Transformada Discreta de Fourier
VI Verificando a correlao entre o sinal original e sua inversa
Tabela 3.4 Etapas do algoritmo da DFT.
33
ALGORITMO DA TRANSFORMADA DISCRETA DE FOURIER
I Varivel que ir receber o sinal que ser analisado:
x = sinal que ser processado.
II - Configurando os dados para o clculo a partir do sinal (x):
N = size(x,2);
w= freqncias que sero capturadas do sinal;
M = size(w,2);
soma=0;
cont2=1:N;
tempo= ((cont2-1)*2*pi)/N;
III - Clculo da DFT do sinal:
for cont=1:M
coeficientes(cont) = sum(x.*(cos(w(cont)*tempo) + i*sin(w(cont)*tempo)))/N;
end
IV - Clculo do espectro do sinal:
espectro = sqrt( real(fw).^2 + imag(fw).^2 );
V - Clculo da IDFT:
for cont=1:N
inversa(cont) = sum(fw.*(cos(w*tempo(cont)) - i*sin(w*tempo(cont))));
end
VI - Verificando a correlao da inversa do sinal com o sinal original:
corrcoef(x,inversa)
3.6 - Aplicaes da implementao da DFT
Como aplicaes para teste teve-se como interesse abordar alguns tipos de sinais para
verificar se a implementao da Transformada de Fourier no MatLab obtm os resultados
desejados no domnio da freqncia.
34
3.6.1 - Primeiro Procedimento
Neste procedimento teve-se como interesse utilizar o sinal do exemplo prtico do
tpico 3.4.7 para verificar se esta implementao da Transformada de Fourier obtm os
mesmos resultados. Dado a implementao do tpico 3.5, algumas etapas para esta
aplicao so alteradas como ilustradas a seguir.
Etapa I Varivel que ir receber o sinal que ser analisado:
o x = [0 1 -1 0.5];
Etapa II - Configurando as freqncias que sero adquiridas:
o w= 0:3;
A seguir so exibidos os clculos dos coeficientes atravs da varivel chamada
coeficientes da etapa III:
( ) 125 , 0
8
1
0
= == w F
( ) i
i
w F 375 , 0 25 , 0
8
3
4
1
1
= =
( ) 375 , 0
8
3
2
= = w F
( ) i
i
w F 375 , 0 25 , 0
8
3
4
1
3
+ = + =
A seguir so calculados os espectros de potncia para os quatro coeficientes
calculados atravs da varivel chamada espectro da etapa IV, onde o resultado pode ser
exibido pela Figura 3.6:
( ) 125 , 0 ... 125 , 0
0
= = = w F
( ) 450 , 0 ... 375 , 0 25 , 0
1
= = = i w F
( ) 375 , 0 ... 375 , 0
2
= = = w F
( ) 450 , 0 ... 375 , 0 25 , 0
3
= = + = i w F
Figura 3.6 Espectro de potncia
35
A seguir foi realizado o clculo da Inversa da Transformada Discreta de Fourier.
Atravs da varivel inversa da implementao da etapa V, o sinal retornado do
domnio da freqncia para o domnio do tempo conforme ilustrado pela Tabela 3.5.
Pela etapa VI da implementao da DFT, foi comparado o sinal original com a sua
transformada inversa, obtendo uma correlao de 100% de acerto.
.
Sinal original (x) IDFT do sinal (inversa)
Tabela 3.5 Comparao entre o sinal original e sua inversa
3.6.2 - Segundo Procedimento
Para o prximo teste da implementao da DFT foi utilizado um sinal de voz de 2
segundos (88.200 x 1), conforme ilustrado na Figura 3.7.
Figura 3.7 - Sinal de voz de 2 segundos.
36
Dado a implementao da DFT do tpico 3.5, segue abaixo algumas etapas que sero
alteradas como ilustradas a seguir.
Etapa I Varivel que ir receber o sinal de voz que ser analisado:
o x = wavread(sinal_2_segundos);
Etapa II - Configurando as freqncias que sero adquiridas:
o w= 0:0.5:22050;
Aps o clculo dos coeficientes do sinal, foi produzido o espectro de potncia da voz
exibido pela Figura 3.8.
Figura 3.8 Espectro de potncia do sinal de voz de 2 segundos.
Para verificao da confiabilidade do espectro de potncia do sinal de voz, foi
calculada a Transformada Discreta Inversa de Fourier e comparado com o sinal original
(Tabela 3.6), obtendo uma correlao de 100%.
.
37
Sinal original (x) IDFT do sinal (inversa)
Tabela 3.6 Correlao entre a voz de 2 segundo e sua inversa.
Com os resultados mostrados pela Tabela 3.6, est claro que a transformao do
sinal do domnio do tempo para o domnio da freqncia confivel j que o retorno desta
para tempo contnuo mostra sua confiabilidade nas informaes contidas no sinal.
Com esta aplicao torna-se possvel e principalmente confivel o desenvolvimento
do prottipo computacional proposto neste projeto que a utilizao das vozes pr-
processadas pela DFT (espectro de potncia das vozes) que sero utilizadas no treinamento
de Redes Neurais Artificiais para o reconhecimento de padres emocionais na voz.
38
4 - RNAS NO RECONHECIMENTO DE STRESS
NA VOZ
4.1 - Aplicao
O objetivo desta aplicao verificar se, com o pr-processamento da voz humana
atravs da aplicao da Transformada Discreta de Fourier, o treinamento realizado pela
Rede Neural Artificial se torna mais otimizado, possibilitando um aprendizado maior pela
rede comparado com um treinamento sem este pr-processamento.
Em Matuck (2004) foi produzido um banco de dados contendo vozes de 14 pessoas,
todas geradas com a leitura de um texto pr-determinado. As vozes foram capturadas
atravs de um gravador de mo porttil, o qual foram observados vrios fatores externos
que estavam presentes junto voz como chiados, rudos, entre outros. Parte deste banco de
dados (10 vozes calmas e nervosas) foi treinado pela rede Perceptron de Mltiplas Camadas
e a segunda parte (4 vozes calmas e nervosas) foi utilizada no processo de generalizao da
rede o qual obteve um reconhecimento de 50,2% das vozes nunca vistas anteriormente pela
rede neural.
Para este projeto teve-se como interesse melhorar o modo de captura das vozes
calmas e nervosas bem como a melhorar a capacidade de aprendizado pela RNAs. Para tal,
foi formulado um banco de dados contendo falas de diversas pessoas em estado de estresse
e normal. Para aumentar a qualidade do banco de dados das vozes, foram capturadas vozes
da televiso, onde o nico som emitido por esta era a voz de uma pessoa (estressada ou
calma).
Todas as vozes foram gravadas da televiso para o computador no formato WAV
utilizando, para isto, o software Sound Forge 4.5 (Figura 4.1) considerado um dos melhores
editores de udio existentes no mercado atualmente. Neste programa foi realizado a edio
de todas as vozes para utilizao no reconhecimento pelas RNAs, onde o tempo de cada
voz foi estipulado para dez segundos (10s).
Figura 4.1 Software Sound Forge.
39
No total, foram capturadas 35 vozes calmas e 35 vozes nervosas, retiradas de diversos
programas como, novelas, filmes, jornais de notcias, programas esportivos, entre outros.
Abaixo so ilustradas duas vozes de cada tipo.
Banco de dados de vozes calmas e nervosas
Voz 1 Calma Voz 1 Nervosa
Voz 2 calma Voz 2 nervosa
Figura 4.2 - Ilustrao das vozes gravadas.
Este banco de dados de voz foram bases para a aplicao em dois procedimentos
especficos em Redes Neurais Artificiais envolvendo a rede Perceptron de Mltiplas
Camadas (MLP Multilayer Perceptron). A primeira aplicao tinha como objetivo o
treinamento das vozes pelas RNAs sem o pr-processamento destas pela Transformada
Discreta de Fourier, ou seja, no seu estado original de como foram capturadas e
digitalizadas.
J o segundo procedimento consistiu em pr-processar as vozes pela Transformada
Discreta de Fourier, transformando-as para o domnio da freqncia. Em seguida, estas
vozes foram tambm utilizadas no treinamento das RNAs pela rede Perceptron de
Mltiplas Camadas. Aps os dois procedimentos foi realizada uma comparao entre as
40
duas aplicaes para identificar qual a tcnica a mais qualificada para o problema em
questo.
4.2 - Treinamento das RNAs sem o pr-processamento da DFT
4.2.1 - Aplicao
As trinta e seis vozes gravadas foram divididas e utilizadas no treinamento e
generalizao da rede Perceptron de Mltiplas Camadas (Back-Propagation) conforme
mostra a tabela 4.1.
Vozes Diagnsticos Treinamento Generalizao
1 a 25 Calmas e Nervosas X
26 a 36 Calmas e Nervosas X
Tabela 4.1 - Disposio das vozes utilizadas na rede MLP
Como a rede Perceptron de Mltiplas Camadas possui um aprendizado
supervisionado, h a necessidade de um professor externo auxiliando o seu treinamento, o
que chamamos de sada desejada para cada padro que fornecido a rede. A sada desejada
para essas vozes pode ser vista codificada na tabela 4.2 onde a voz s pode ser
diagnosticada como calma ou nervosa.
Diagnstico Codificao
Voz calma 0 1
Voz nervosa 1 0
Tabela 4.2 Codificao dos diagnsticos de voz
Como cada vetor de voz possui uma dimenso muito grande (441000 x 1), este foi
divididos em blocos de mil dados (441 blocos com o tamanho: 1000 x 1 ) e assim
colocados seqencialmente cada bloco na camada de entrada da rede MLP. A Figura 4.3
ilustra esse processo.
41
Figura 4.3 Ilustrao das etapas utilizadas no treinamento da rede MLP sem o pr-
processamento da DFT
X
1
X
2
X
1000
Camada de Entrada
(Input Layer)
Camada de Sada
(Output Layer)
T
T
T
T
V
O
Z
1
C
A
L
M
A
V
O
Z
1
N
E
R
V
O
S
A
V
O
Z
25
N
E
R
V
O
S
A
Camada Oculta
(Hidden Layer)
V
O
Z
2
C
A
L
M
A
Matriz de voz
Tamanho: 441000 x 25
Tamanho: 441000 x 1
V
O
Z
1
C
A
L
M
A
13 x 1
42
Para o treinamento da rede foi utilizada uma taxa de aprendizado (velocidade com
que a rede ir aprender) variada, onde a cada poca (perodo em que todos os exemplos de
voz so apresentados para a rede) a taxa era adaptada de acordo com o erro encontrado na
sada da rede. Se o erro da poca atual menor que o erro da poca anterior, a taxa de
aprendizado aumentada, caso contrrio diminudo.
A funo de ativao utilizada na rede foi funo logstica sigmoidal, com apenas
uma camada oculta (hidden layer) com 100 neurnios, ou seja, o nmero de neurnios
equivalente a apenas 10% da camada de entrada da rede, que possui 1000 entradas. A rede
MLP foi processada durante 13.754 pocas, ou seja, as 50 vozes (entre calmas e nervosas)
foram apresentadas 13.754 vezes com o objetivo de diminuir o erro quadrtico mdio da
rede adaptando os pesos sinpticos da melhor maneira possvel.
Neste treinamento o menor erro encontrado pela rede foi de 26.8855, ou seja, este
erro definido pela soma dos erros de todas as entradas da rede que o produto das 50
vozes por 441.000 (nmero de entrada de cada voz) dando um total de 22.050.000 dados. A
Figura 4,4 mostra o erro encontrado na rede em funo do nmero de pocas
Figura 4.4 - Erro encontrado no treinamento da rede MLP.
O prximo passo foi fazer a generalizao das dez vozes que foram utilizadas no
treinamento, para saber se a rede Perceptron de Mltiplas Camadas aprendeu os padres o
qual treinou. Na ativao da rede com as vozes que foram treinadas, observou um acerto de
96,15%. Cada voz utilizada no treinamento conseguiu determinada taxa de acerto
conforme mostra a tabela 4.3.
43
Voz Diagnstico Acerto Voz Diagnstico Acerto
Calmo 95.01 % Calmo 90.48 %
1
Nervoso 20.41 %
14
Nervoso 70.29 %
Calmo 95.92 % Calmo 96.60 %
2
Nervoso 27.21 %
15
Nervoso 94.78 %
Calmo 95.01 % Calmo 74.38 %
3
Nervoso 35.37 %
16
Nervoso 96.37 %
Calmo 85.94 % Calmo 92.97 %
4
Nervoso 19.05 %
17
Nervoso 50.57 %
Calmo 97.73 % Calmo 95.46 %
5
Nervoso 90.48 %
18
Nervoso 28.12 %
Calmo 90.02 % Calmo 90.25 %
6
Nervoso 16.55 %
19
Nervoso 56.92 %
Calmo 63.95 % Calmo 90.48 %
7
Nervoso 88.89 %
20
Nervoso 93.88 %
Calmo 90.70 % Calmo 92.74 %
8
Nervoso 88.21 %
21
Nervoso 20.41 %
Calmo 92.97 % Calmo 96.37 %
9
Nervoso 92.52 %
22
Nervoso 94.56 %
Calmo 91.16 % Calmo 96.60 %
10
Nervoso 93.20 %
23
Nervoso 93.65 %
Calmo 91.16 % Calmo 93.88 %
11
Nervoso 36.73 %
24
Nervoso 60.32 %
Calmo 92.97 % Calmo 96.37 %
12
Nervoso 63.95 %
25
Nervoso 24.49 %
Calmo 93.20 %
13
Nervoso 75.06 %
Tabela 4.3 Porcentagem de acerto das vozes treinadas na rede MLP
Num segundo experimento, foram mostradas rede as 22 vozes (entre calmas e
nervosas) que no foram utilizadas no treinamento, com o intuito de verificar a
porcentagem de acerto com padres de vozes nunca vistos anteriormente pela rede MLP.
Verificou-se que na ativao a rede conseguiu obter um acerto de 56,56% com um erro
44
quadrtico mdio encontrado na generalizao de 18.365. A porcentagem de acerto dos
diagnsticos de cada voz pode ser visto na tabela 4.4 abaixo.
Voz Diagnstico Acerto Voz Diagnstico Acerto
Calmo 86.39 % Calmo 56.91 %
1
Nervoso 83.90 %
7
Nervoso 69.84 %
Calmo 89.57 % Calmo 84.35 %
2
Nervoso 78.91 %
8
Nervoso 49.89 %
Calmo 85.71 % Calmo 72.79 %
3
Nervoso 91.16 %
9
Nervoso 51.32 %
Calmo 89.34 % Calmo 84.13 %
4
Nervoso 92.97 %
10
Nervoso 41.50 %
Calmo 83.90 % Calmo 87,98 %
5
Nervoso 95.01 %
11
Nervoso 75,96 %
Calmo 78.00 %
6
Nervoso 36.96 %
Tabela 4.4 Porcentagem de acerto das vozes generalizadas na rede MLP
4.2.2 - Concluso
Atravs desta aplicao percebe-se que com a formulao de um banco de vozes de
maior qualidade quando comparadas com os resultados de Matuck (2004), a capacidade de
aprendizado dos padres de voz pela rede neural mais eficiente. O reconhecimento das
vozes calmas e nervosas tanto no treinamento como na generalizao pode ser vista na
Tabela 4.5 abaixo.
Rede Perceptron de Mltiplas Camadas - MLP
Treinamento da rede Generalizao da rede
Vozes
calmas
91,29 %
Vozes
calmas
80,13 %
Vozes
nervosas
61,28 %
Vozes
nervosas
32,98 %
Tabela 4.5 Comparao entre vozes calmas e de estresse.
45
Torna-se necessrio ressaltar algumas desvantagens percebidas durante o processo de
treinamento da rede neural nesta aplicao. O tempo demandado para o treinamento de
cada poca foi estipulado em torno de 8 minutos, o que necessitou o treinamento da rede
durante um perodo de quatro meses direto (24 horas de processamento por dia) para
chegar na poca 13.754. O ideal para este procedimento seria deixar a rede treinando por
um perodo de tempo maior para que a mesma pudesse aprender com uma maior eficincia
os padres de voz, o que no foi possvel devido ao tempo destinado para este projeto.
Outro fator foi memria do computador necessria para a realizao deste
treinamento no Matlab que tinha de ser maior do que 256 megabytes de RAM. Pois o
computador no aceitou uma rede com 100 neurnios na camada interna (hidden layer) e
com 441 blocos de mil dados na camada de entrada cada bloco, tornando-se necessrio um
computador com no mnimo 512 megabytes de RAM para realizar este procedimento.
4.3 - Treinamento das RNAs com o pr-processamento da DFT
4.3.1 - Pr-processamento da DFT nas vozes
Antes do treinamento das vozes pelas RNAs, todas as vozes foram transformadas do
domnio do tempo para o domnio da freqncia atravs da Transformada Discreta de
Fourier (algoritmo de implementao do tpico 3.5). Como cada voz tem a durao de dez
segundos com 441.000 pontos, tem-se que a taxa de amostragem para este sinal :
Taxa amostral do sinal de voz 100 . 44
10
000 . 441
= =
tempo
Sinal
Em seguida foram determinados quais as freqncias que sero capturadas do sinal
que exatamente a metade da taxa de amostragem desta voz, ou seja, ir da freqncia zero
at a freqncia 22050. A seguir so ilustradas algumas etapas da implementao da DFT
do tpico 3.5 que so configuradas para este processo.
Etapa I Varivel que ir receber o sinal que ser analisado A voz 1 calma,
por exemplo:
o x = wavread(voz_01_calma.wav);
Etapa II - Configurando as freqncias que sero adquiridas Neste caso ir
da freqncia 0 at a 22050, indo de 0,5 em 0,5:
o w= 0:0,5:22050;
46
Para exemplificar este procedimento, so ilustradas duas vozes (uma calma e uma
nervosa tabela 4.6) no seu estado original e no domnio da freqncia aps realizado o
clculo da Transformada Discreta de Fourier (etapa III da implementao do tpico 3.5) e
do seu espectro de potncia (etapa IV da implementao do tpico 3.5).
Voz Calma Voz Nervosa
V
o
z
O
r
i
g
i
n
a
l
E
s
p
e
c
t
r
o
d
e
P
o
t
n
c
i
a
Tabela 4.6 Clculo do espectro de potncia das vozes.
Aps o clculo do espectro de potncia do sinal, foi realizado o procedimento de
clculo da Transformada Discreta Inversa de Fourier, exibida na tabela 4.7, atravs da etapa
V do tpico 3.5 para a verificao da correlao entre o sinal original e o sinal da IDFT.
Esta comparao mostrou que a correlao entre os dois sinais, para todas as vozes que
foram pr-processadas pela DFT, ficou em torno de 96% a 98%, o que considerado uma
aplicao com sucesso na rea de processamento digital de sinais.
47
Voz 1 Calma Voz 1 Nervosa
V
o
z
O
r
i
g
i
n
a
l
I
n
v
e
r
s
a
d
o
s
i
n
a
l
Tabela 4.7 Comparao entre a voz original e a inversa do sinal
Sabendo a confiabilidade no processo de pr-processamento das vozes pela
Transformada Discreta de Fourier atravs da tabela 4.7, o espectro de potncia produzido
de cada voz realmente representa as freqncias que esto presentes no sinal durante os 10
segundos.
Para melhorar os dados de voz, foi realizado um processo de filtragem do sinal. Este
procedimento consiste na eliminao das freqncias abaixo de 20% da freqncia mdia
do sinal. No caso da voz exibida na Figura 4.5 abaixo, a freqncia mdia encontrada foi de
0,923x10
-3
exibida por uma linha vermelha.
48
Figura 4.5 Filtragem do sinal de voz.
Aps a realizao de todas as etapas do procedimento da Transformada Discreta de
Fourier, algumas etapas foram adicionadas para a realizao da filtragem do sinal que pode
ser vista a seguir:
Etapa VII Calculando a freqncia mdia do sinal:
o freq_media = sum(espectro) / size(espectro,2);
Etapa VIII Filtrando o sinal eliminando as freqncias abaixo de 20% da
freqncia mdia:
o sinal_filtrado = espectro .* (espectro >= 0.2 * freq_media);
Como para o treinamento da rede neural artificial os dados da camada de entrada da
rede so inseridas em blocos de mil pontos, teve-se como interesse a utilizao apenas das
freqncias nas faixas de 50 a 6549,5 Hertz, totalizando 13 blocos com mil pontos cada.
49
4.3.2 - Processamento das vozes pela RNA
Aps a realizao do pr-processamento das vozes pela DFT as trinta e seis vozes
foram divididas, igualmente a aplicao anterior, e utilizadas no treinamento e
generalizao da rede Perceptron de Mltiplas Camadas (Back-Propagation) conforme
mostra a tabela 4.8.
Vozes Diagnsticos Treinamento Generalizao
1 a 25 Calmas e Nervosas X
26 a 36 Calmas e Nervosas X
Tabela 4.8 - Disposio das vozes pr-processadas utilizadas na rede MLP
Atravs da Tabela 4.9 abaixo so ilustradas as respostas desejadas para cada padro
de voz que fornecida na camada de entrada da rede Perceptron de Mltiplas Camadas.
Diagnstico Codificao
Voz calma 0 1
Voz nervosa 1 0
Tabela 4.9 Codificao dos diagnsticos das vozes pr-processadas
Tambm para este procedimento cada vetor de voz (13.000 x 1) foi dividido em
blocos de mil (13 blocos com o tamanho: 1000 x 1 ) e inserido na camada de entrada da
rede MLP. A seguir so ilustradas todas as etapas que sero utilizadas para o
reconhecimento de nveis de stress na voz humana com vozes pr-processadas pela
Transformada Discreta de Fourier.
50
V
O
Z
25
N
E
R
V
O
S
A
V
O
Z
1
C
A
L
M
A
X
1
X
2
X
1000
Camada de Entrada
(Input Layer)
Camada de Sada
(Output Layer)
T
T
T
T
Camada Oculta
(Hidden Layer)
Matriz de voz com tamanho: 441000 x 25
V
O
Z
F
I
L
T
R
A
D
A
DFT
Tamanho: 441000 x 1
Tamanho: 13000 x 1
FILTRAGEM DO SINAL
V
O
Z
1
C
A
L
M
A
V
O
Z
1
N
E
R
V
O
S
A
V
O
Z
2
C
A
L
M
A
Pr-processamento
13 x 1
51
Figura 4.6 Ilustrao das Etapas utilizadas no treinamento da rede MLP com o pr-
processamento da DFT
Para o treinamento da rede, como na aplicao anterior, foi utilizada uma taxa de
aprendizado variada, onde a cada poca a taxa era adaptada de acordo com o erro
encontrado na sada da rede. A funo logstica utilizada na rede foi funo de ativao
sigmoidal, com apenas uma camada oculta (hidden layer) com 100 neurnios.
A rede MLP foi processada durante 56.622 pocas, ou seja, as 50 vozes (entre calmas
e nervosas) foram apresentadas 56.622 vezes com o objetivo de diminuir o erro quadrtico
mdio da rede adaptando os pesos sinpticos da melhor maneira possvel. Neste
experimento o menor erro encontrado pela rede foi de 2.128, ou seja, este erro a soma dos
erros de todas as entradas que so apresentadas rede. A Figura 4.7 ilustra a trajetria do
erro em funo do nmero de pocas no processo de treinamento.
Figura 4.7 - Erro encontrado no treinamento da rede MLP.
O procedimento seguinte consistiu em fazer a generalizao das dez vozes que foram
utilizadas no treinamento, para saber se a rede Perceptron de Mltiplas Camadas aprendeu
os padres o qual treinou. Na ativao (generalizao) da rede com as vozes que foram
treinadas, observou um acerto de 90% com um erro quadrtico mdio de 0.04. Cada voz
52
utilizada no treinamento conseguiu determinada taxa de acerto conforme mostra a tabela
4.10, com destaque para algumas vozes nervosas que obtiveram um acerto de 100%.
Voz Diagnstico Acerto Voz Diagnstico Acerto
Calmo 92.31 % Calmo 92.31 %
1
Nervoso 84.62 %
14
Nervoso 84.62 %
Calmo 84.62 % Calmo 92.31 %
2
Nervoso 100.00 %
15
Nervoso 92.31 %
Calmo 92.31 % Calmo 92.31 %
3
Nervoso 92.31 %
16
Nervoso 100.00 %
Calmo 92.31 % Calmo 92.31 %
4
Nervoso 100.00 %
17
Nervoso 92.31 %
Calmo 92.31 % Calmo 84.62 %
5
Nervoso 92.31 %
18
Nervoso 100.00 %
Calmo 76.92 % Calmo 76.92 %
6
Nervoso 100.00 %
19
Nervoso 92.31 %
Calmo 69.23 % Calmo 92.31 %
7
Nervoso 100.00 %
20
Nervoso 100.00 %
Calmo 92.31 % Calmo 84.62 %
8
Nervoso 100.00 %
21
Nervoso 76.92 %
Calmo 84.62 % Calmo 92.31 %
9
Nervoso 92.31 %
22
Nervoso 92.31 %
Calmo 84.62 % Calmo 84.62 %
10
Nervoso 100.00 %
23
Nervoso 100.00 %
Calmo 84.62 % Calmo 92.31 %
11
Nervoso 92.31 %
24
Nervoso 100.00 %
Calmo 84.62 % Calmo 69.23 %
12
Nervoso 53.85 %
25
Nervoso 100.00 %
Calmo 84.62 %
13
Nervoso 69.23 %
Tabela 4.10 Porcentagem de acerto das vozes treinadas pela rede MLP.
Num segundo experimento, foram mostradas rede as vinte e duas vozes (entre
calmas e nervosas) que no foram utilizadas no treinamento, com o intuito de verificar a
53
porcentagem de acerto com padres de vozes nunca vistos anteriormente pela rede MLP.
Verificou-se que na ativao a rede conseguiu obter um acerto de 71,33% com um erro
quadrtico mdio encontrado na generalizao de 0.266461. A porcentagem de acerto dos
diagnsticos de cada voz pode ser visto na tabela 4.11 abaixo.
Voz Diagnstico Acerto Voz Diagnstico Acerto
Calmo 69.23 % Calmo 15.38 %
1
Nervoso 69.23 %
7
Nervoso 61.54 %
Calmo 92.31 % Calmo 61.54 %
2
Nervoso 100.00 %
8
Nervoso 92.31 %
Calmo 38.46 % Calmo 84.62 %
3
Nervoso 76.92 %
9
Nervoso 100.00 %
Calmo 76.92 % Calmo 69.23 %
4
Nervoso 84.62 %
10
Nervoso 69.23 %
Calmo 76.92 % Calmo 76.92 %
5
Nervoso 84.62 %
11
Nervoso 61.54 %
Calmo 61.54 %
6
Nervoso 84.62 %
Tabela 4.11 Porcentagem de acerto das vozes generalizadas pela rede MLP.
4.3.3 - Concluso
Com a realizao deste procedimento concluiu-se que, com o pr-processamento
das vozes pela aplicao da Transformada Discreta de Fourier, o treinamento destas pela
RNA foi muito mais promissor do que com o as vozes em seu estado original. O tempo
demandado para o treinamento da rede MLP foi muito menor, onde se verificou que a rede
obteve um reconhecimento melhor para as vozes nervosas do que para as calmas com
destaque para as duas vozes (2 e 9) nervosas demarcadas na Tabela 4.11 que obtiveram
100% de acerto pela rede neural.O acerto no diagnstico de cada voz tanto no treinamento
quanto na generalizao da rede neural pode ser visualizada na tabela 4.12.
Rede Neural MLP com pr-processamento pela DFT
Treinamento da rede Generalizao da rede
Vozes
calmas
89,95 %
Vozes
calmas
67,83 %
Vozes
nervosas
90,15 %
Vozes
nervosas
74,83 %
54
Tabela 4.12 Comparao entre vozes pr-processadas calmas e de estresse.
A desvantagem decorrida desta aplicao foi o tempo de processamento das vozes
pela Transformada Discreta de Fourier, que durou cerca de 3 horas para cada voz. Deve-se
ressaltar que esta implementao da DFT foi realizada apenas com o intuito de aprendizado
e de mostrar que o pr-processamento da voz melhora o aprendizado de padres pela rede
neural.
Treinamento da RNA COM a DFT SEM a DFT
Durao de cada poca 15 segundos 8 minutos
Tempo de treinamento (pocas) 56.622 mil 13.754 mil
Durao total do treinamento Cerca de 3 semanas Cerca de 4 meses
Erro encontrado no treinamento
da rede MLP
2,128 26,8855
Acerto no Treinamento das
vozes calmas e nervosas
90 % 96,15 %
Acerto das vozes calmas 89,95 % 91.29 %
Acerto das vozes nervosas 90,15 % 61,07 %
Acerto na Generalizao das
vozes calmas e nervosas
71,33 % 56,56 %
Acerto das vozes calmas 67,83 % 80,13 %
Acerto das vozes nervosas 74,83 % 32,98 %
Figura 4.13 - Comparao entre os dois treinamentos realizados
Na tabela 4.13 acima, foi realizada uma comparao entre o aprendizado da RNA
com o pr-processamento da voz pela DFT e o aprendizado sem este procedimento. Torna-
se claro ento que para a realizao de diagnsticos de voz numa rede neural artificial o
pr-processamento do sinal de voz para o domnio da freqncia muito mais eficiente,
diminuindo consideravelmente o tempo de processamento e com um reconhecimento muito
maior por parte das Redes Neurais Artificiais.
55
5 - CONCLUSES E RECOMENDAES
FINAIS
O principal objetivo deste trabalho foi mostrar que o pr-processamento do sinal de
voz pode propiciar uma melhora no reconhecimento de padres de voz pelas Redes Neurais
Artificiais. Para isto foi realizado um breve estudo sobre os conceitos de processamento de
sinais e das caractersticas da voz humana.
O estudo realizado sobre tcnicas de Fourier (Transformada Discreta de Fourier)
propiciou o conhecimento e a implementao de alguns exemplos prticos para demonstrar
a confiabilidade na transformao de um sinal no domnio do tempo para o domnio da
freqncia. O processamento digital dos sinais de voz realizado no domnio da
freqncia.
A realizao do pr-processamento pela Transformada Discreta de Fourier mostrou
que uma capacidade melhor de aprendizado de padres de vozes por uma rede neural do
tipo Perceptron de Mltiplas Camadas, obtendo-se um desempenho de mais promissor
(73,07%) do que o aprendizado utilizando os sinais de voz no estado original (56,5% -
domnio do tempo). Outro fator relevante foi o tempo de treinamento da RNA realizado
com as vozes pr-processadas que correspondeu cerca de 97% mais rpido do que o
treinamento sem o pr-processamento pela DFT.
Acredita-se na possibilidade de que, com um banco de dados com um nmero maior de
vozes pr-processadas pela Transformada de Fourier e um tempo maior destinado ao
treinamento da RNAs, os diagnsticos de ndices de stress humano podem atingir ndices
de confiabilidade maiores, permitindo que se faa uma avaliao eficiente de pessoas que
se encontram em estado de isolamento social.
Os resultados apresentados neste trabalho poderiam ser melhores. Mas muito tempo
teve de ser dedicado ao estudo das tcnicas de Transformada de Fourier, em detrimento do
treinamento dos padres de vozes.
Para a continuidade deste trabalho, tem-se como sugesto a utilizao de outras
tcnicas em conjunto com a de processamento de sinais de voz, como por exemplo, a
captura de freqncias fundamentais caractersticas de uma voz em seu estado calmo ou de
estresse. Outros mecanismos podem ser utilizados tambm para melhorar a identificao de
uma pessoa em estado de isolamento social como, por exemplo, a utilizao de testes
psicolgicos especficos na identificao de uma pessoa em confinamento, a presso com
que uma pessoa responde um questionrio atravs de um teclado, a expresso facial,
dispositivo de medio de batimentos cardacos, da sudorese humana, impulsos eltricos
emitidos pelo crebro entre outros.
56
6 - EFERNCIAS BIBLIOGRFICAS
[HAY-94] HAYKIN, Simon. Neural Networks: A Comprehensive Foundation
[FAU-94] FAUSET, Laurene. Fundamentals of Neural Networks: Architectures,
Algorithms, and Applications.
[BRI-74] BRIGHAM, R., 1974, The Fast Fourier Transform: Time sequence Analysis
in Geophysics.
[KOV-96] KOVCS, Zsolt L. Redes Neurais Artificiais: Fundamentos e Aplicaes.
[GUE-77] GUEDES, Djairo de Fiquereido. Anlise de Fourier e Equaes Diferenciais
Parciais
[ALB-XX] ALBERTO, Luiz Vieira Dias, Marcio Magini. Introduo Anlise de
Dados.
[SED-95] SEDGEWICK, Robert. Algorithms in C.
Princeton University - Cap.41 - The Fast Fourier Transform p.583.
[BOY-96] BOYCE, Willian E. e Richard C. DiPrima. Equaes Diferenciais
Elementares e Problemas de Valores de Contorno.
[GOL-97] GOLD, Ben. e Nelson Morgan. Speech and Audio Signal Processing:
Processing and Perception of speech and music.
[ALB-67] ALBERTO, Carlos Loprete. Introduo a Oratria Moderna: Voz Humana.