Você está na página 1de 26

1

Caractersticas do sinal de voz


Anlise na frequncia:
a voz apresenta um contedo espectral que vai de 20 Hz a 20 kHz;
os sons vozeados ou nasais (e.g. vogais e algumas consoantes j, l, m)
apresentam um espectro discreto com uma frequncia fundamental de 100
a 200 Hz nos homens e 200 a 400 Hz nas mulheres;
os sons no vozeados (e.g. f, s, p, ch) que so gerados pelo fluxo de ar na
boca modulado pelos maxilares, lngua e lbios apresentam uma variao
aleatria. O seu espectro contnuo;
500 3500 Hz
E
n
e
r
g
i
a

(
d
B
)
Discurso de voz bsico
Emoo
25
5
as frequncias mais baixas
transportam a energia do sinal e
as mais elevadas a emoo.
2
Caractersticas do sinal de voz (cont.)
Anlise no tempo:
vrias slabas por segundo;
a fala concentra-se em intervalos de durao aleatria (com mdia de
cerca de 1 seg.) separados por intervalos de durao aleatria (superior a
100 ms, quando se est a falar) variao temporal bastante irregular e
aleatria;
o sinal de voz s est presente num canal telefnico, em mdia, em 40%
do tempo. Pode-se aproveitar este facto para intercalar outras
conversaes (sistema TASI - time assignement speech interpolation).
3
Caracterizao do sistema auditivo
Um indivduo normal com idade compreendida entre os 18 e 25 anos
capaz de detectar sons puros entre 20 Hz e 20 kHz;
Com a idade, o limite superior da frequncia audvel reduz-se
significativamente, e.g. em mdia um homem de 65 anos tem a 8 kHz
uma perda de sensibilidade de 40 dB;
A sensibilidade do ouvido varia com a frequncia e com a intensidade
sonora. Este aspecto ter de se reflectir na anlise do desempenho das
redes telefnicas, em particular na medida da potncia do rudo:
potncia psofomtrica (dBmp)
Rudo branco (0-4000Hz) 3.6dB; (300-3400Hz) 2.5dB
O ouvido tem uma elevada gama dinmica, com valores que podem ir
acima dos 100 dB. Para uma boa reproduo da voz basta valores da
ordem dos 30 dB.
4
Banda de frequncias normalizada para a voz
As recomendaes G.132 e G.151 do ITU-T indicam a banda atribuda
ao sinal de voz de 300 - 3400 Hz;
Nos EUA a banda de frequncias atribuda para um canal de voz 200
- 3200 Hz;
Estas larguras de banda resultam de um compromisso entre o que os
assinantes telefnicos pretendem e o que lhes pode ser fornecido
economicamente.
300 3400 Hz
Largura de banda total, 4 kHz
Banda dos sinais de voz
humana
B
a
n
d
a

d
e

g
u
a
r
d
a
B
a
n
d
a

d
e

g
u
a
r
d
a
5
Transmisso digital de sinais analgicos
Fonte de
informao
Transdutor Amostrador Quantificador
Codificador
de fonte
Descodificador
de fonte
Conversor
D/A
Transdutor Destino
Fluxo de bits codificados
e.g. microfone
Transforma o sinal da fonte
num sinal elctrico
e.g. auscultador
e.g. pessoa a falar
e.g. ouvido da pessoa
6
PCM - Pulse Code Modulation
- Diagrama de blocos -
F Hz
Filtro passa-baixo Quantificador de L nveis
s(t) s(iT)
f
s
= 2F
Entrada analgica
F Hz
Codificador
Canal
de tx
Descodificador
s(t) (estimativa)
Converso das
amostras num
conjunto de
amplitudes
discretas Erro
de quantificao
Palavras de N
b
bits, N
b
=log
2
L
Filtro passa-baixo
Circuito de
amostragem e
reteno
7
PCM - Pulse Code Modulation
- Exemplo -
1.4
3.3
2.2
4.1
1.1
2.8
2.4
4.6
3.0
T
s
1
3
2
4
1
3
2
5
3
001 011 010 100 001 011 010 101 011
Sinal original
Resultado da amostragem
Resultado da quantificao pelo
inteiro mais prximo
Resultado da codificao
(palavra binria), i.e. sinal
PCM
8
Amostragem
A base do PCM comea com o Teorema da Amostragem:
Um sinal de banda limitada pode ser representado pelas suas amostras obtidas a um
ritmo f
s
que deve ser pelo menos igual ao dobro da frequncia mxima presente no
sinal (F), i.e. f
s
2F.
-F F f t
g(t)
G(f)
Transformada
de Fourier
Domnio do tempo: Domnio da frequncia:
g
s
(t)
T
s
t
-F F f
G
s
(f)
Resposta do filtro
do receptor
f
s
=1/T
s
f
s
2f
s
0 -f
s
-2f
s
Se f
s
= 2F (Ritmo de Nyquist):
Consideraes:
Sinal g(t) tem uma largura de banda finita (F Hz) - Na prtica no se verifica Aliasing
As amostras so retiradas com pulsos de largura infinitsimal
Filtro passa-baixo ideal
9
Quantificao
A quantificao converte um sinal contnuo em amplitude num sinal
discreto em amplitude. Notar que o processo de amostragem converte
um sinal contnuo no tempo num sinal discreto no tempo - Pulse
Amplitude Modulation (PAM).
x, entrada
y=F(x), sada
x
0
x
1
x
2
y
i
x
i
x
i-1
q
Caracterstica do quantificador linear ou uniforme:
Erro = y-x =
q
x
x
N
x
0
Erro de sobrecarga Erro de sobrecarga Erro de quantificao
Caracterstica do erro:
limiares de deciso
NOTA: Quando o valor de entrada est entre
x
i-1
e x
i
o quantificador ir produzir o valor y
i
O erro est limitado a q/2
Caracterstica ideal
10
Rudo de quantificao
O desempenho de um quantificador pode ser descrito pela relao
sinal-rudo de quantificao;
A potncia de rudo de quantificao descrita em termos estatsticos
atravs do erro quadrtico mdio:
q q q q
d p
}
+

>= < ) (
2 2
/ 2
2
2 2
/ 2
1
12
q
q q q q
q
q
n d
q

=< >= =
}
Para uma distribuio uniforme do erro em cada intervalo de
quantificao de largura q;
Para um quantificador linear, todos os intervalos de quantificao
apresentam o mesmo erro quadrtico mdio.
p(
q
)
-q/2
q/2 0
q
1/q
11
Clculo da relao sinal-rudo de quantificao
Assume-se que o sinal de entrada uma sinuside com amplitude A,
logo a potncia mdia desse sinal vem
A relao sinal-rudo de quantificao, em dB:
Para PCM uniforme, relao sinal-rudo de quantificao no inferior a
26dB
Nmero de intervalos de quantificao para uma gama de
quantificao de -A
max
a A
max
:
Nmero de bits por amostra:
( )
2
2
2
A
t x s >= =<
|
|
.
|

\
|
+ =
|
|
.
|

\
|
=
|
|
.
|

\
|
=
q
A
q
A
n
s
N
S
q q
10
2
2
10 10
log 20 78 . 7
12
2
log 10 log 10
( )
q
A
q
A A
L
max max max
2
=

=
2
2 log
b
N
b
L N L = =
12
Clculo da relao sinal-rudo de quantificao (cont.)
Relao sinal-rudo de quantificao em termos do nmero de bits, N
b
Para um determinado n de bits por amostra constante a relao sinal-
rudo de quantificao depende da amplitude A do sinal a quantificar:
sinais com baixa amplitude tm uma relao S/N
q
baixa, enquanto os
sinais com amplitude elevada apresentam S/N
q
elevadas;
sinais com elevadas amplitudes tm pouca probabilidade de ocorrer e os
sinais com baixas amplitudes ocorrem mais frequentemente.
PCM uniforme pouco eficiente.
|
|
.
|

\
|
+ + =
max
10
log 20 02 . 6 76 . 1
A
A
N
N
S
b
q
13
Gama dinmica
Conceito: Relao entre a amplitude mxima, A
max
, e a amplitude
mnima, A
min
, em que o sistema deve ser capaz de funcionar com a
qualidade mnima
Se se quiser assegurar uma qualidade S/N
q
para toda a gama dinmica,
ento o n de bits necessrio deve verificar
O sistema telefnico deve ser capaz de transmitir uma elevada gama de
amplitudes, i.e. deve ter uma gama dinmica elevada (30 dB um
valor tpico).
|
|
.
|

\
|
=
min
max
10
log 20
A
A
GD
GD N
N
S
b
q
+ = 02 . 6 76 . 1
14
Quantificao no-uniforme
Com quantificao uniforme
gamas dinmicas elevadas exigem um n de bits por amostra, N
b
, elevado
para garantir uma S/N
q
especificada;
Exemplo: GD = 50 dB, S/N
q
= 30 dB 13 bits/amostra
a S/N
q
resultante demasiado elevada para sinais fortes;
clientes diferentes so servidos com qualidade diferente.
Soluo: Quantificao no-uniforme
Para se obter S/N
q
independente da amplitude do sinal, o intervalo de
quantificao deve ser proporcional amplitude do sinal.
GD N
N
S
b
q
+ = 02 . 6 76 . 1
15
Quantificao no-uniforme (cont.)
Soluo: dividir a amplitude do sinal de entrada em intervalos no-
uniformes, i.e. intervalos de quantificao mais largos para os sinais de
amplitudes elevadas e intervalos mais estreitos para amplitudes baixas
S/N
q
constante para uma caracterstica de quantificao apropriada.
Entrada, x
Sada, F(x)
x
j
x
j-1
Como se realiza esta funo ?
Possvel soluo: compresso
das amostras seguida de
quantificao linear.
Caracterstica do quantificador no-uniforme:
16
Implementao do quantificador no-uniforme
F(x)
Quantificador
linear
Compressor
x y Descodificador
linear
F
-1
(x)
Expansor
x y
Emissor:
Receptor:
Caracterstica normalizada do
compressor (s valores positivos):
F(x) = y
q
L nveis na gama de -1 a 1: q = 2/L
Declive da caracterstica do compressor
(L elevado, q 0, x
i
0)
x
i
x
i
- x
i
/2 x
i
+ x
i
/2
x
1
1 0
|
|
.
|

\
|
=
dy
dx
L
x
i
2

x
i
NOTA: x
i
1/2x
i
x x
i
+ 1/2x
i
Este sinal x vai ser representado
pela amplitude quantificada x
i
17
Potncia do rudo de quantificao no-uniforme
O erro quadrtico mdio total dado, em termos estatsticos, por
( ) ( ) ( )
}

}


=
+

=
>= =<
2
2
2
1
2
2
1
2
2
i
i
i i
i i
x
x
i i
L
i
x x
x x
L
i
i i q q
d x p dx x p x x n


Contribuio de cada intervalo de quantificao Assume-se que a fdp de x constante em cada intervalo
( )
( ) ( )
( ) ( )
i
L
i
i
L
i
i i
i
L
i
i
i q
x x p
dy
dx
L
x x p
x x
x p n
3
1

12

12

1
2
2
1
2
1
3



= = =
|
|
.
|

\
|
= = =
No caso em que L elevado ( ):
( )dx x p
dy
dx
L
n
q
}

|
|
.
|

\
|
=
1
1
2
2
3
1
0
i
x
|
|
.
|

\
|
=
dy
dx
L
x
i
2

Probabilidade do sinal x estar
no i-simo intervalo
NOTA: no caso da
quantificao uniforme x
i
= q
resultando em n
q
= q
2
/12
O rudo de
quantificao
depende da estatstica
do sinal analgico a
discretizar

i
o erro de
quantificao
do intervalo i
18
Relao sinal-rudo de quantificao
Potncia do sinal (tambm
depende da estatstica do sinal):
Relao sinal-rudo de
quantificao:
Tem interesse em definir-se
uma relao sinal-rudo de
quantificao independente (da
estatstica) do sinal de entrada:
( ) x d x p x x s
}

>= =<
1
1
2 2
( )
( )dx x p
dy
dx
dx x p x
L
n
s
q
}
}

|
|
.
|

\
|
=
1
1
2
1
1
2
2
3
2
2
3
k
L
n
s
kx
dy
dx
q
= =
Relao sinal-rudo
proporcional ao quadrado
do n de nveis
melhoria de 6 dB por cada
bit a mais na codificao
kx dx
dy 1
= x
k
y ln
1
1+ =
Compresso logartmica: caracterstica irrealizvel
devido assimptota vertical para x = 0
x = 1 y = 1
Resoluo da eq. diferencial:
19
PCM no-linear (leis A e )
Duas implementaes de caractersticas de compresso logartmicas
na Europa: lei A
nos EUA e Japo: lei ( define o grau de compresso e = 255 um
valor tpico)
( )
( )
( )
( )
( )

= =
|
.
|

\
|
+
=

+
+

(

+
=
87.6) ( dB 24
ln 1
log 10
1
1
ln 1
ln 1
sgn
1
0
ln 1
sgn
2
10
A V
A
A
V
x
A A
x A
x
A
x
A
x A
x
y
c
c
( )
( )
( )
( )

= =
|
|
.
|

\
|
+
=

+
+
=
255) ( dB 3 . 33
1 ln
log 10
1 ln
1 ln
sgn
2
10

c
c
V
V
x
x y
Melhoria de 24 dB na
zona das baixas
amplitudes em relao
quantificao uniforme
Vantagem de
compresso
20
Quantificao no uniforme usada para a voz
Numa GD de 40 dB a
lei tem uma S/N
q
mais
uniforme que a lei A.
0
10
-60 -50 -40 -30 -20 -10
0
40
30
20
Limites especificados na Rec. G.712 da
ITU-T com rudo gaussiano entrada
33 dB Lei A - 8 bits
Lei - 8 bits
R
e
l
a

o

s
i
n
a
l
-
r
u

d
o
d
e

q
u
a
n
t
i
f
i
c
a

o
,

S
/
N
q
(
d
B
)
Nvel de entrada (dBm
0
)
21
Tcnicas de quantificao no-uniforme
Compresso e expanso logartmica analgica (e.g. dodos) seguida de
quantificao uniforme com 8 bits,
dificuldade em garantir a reciprocidade exacta das caractersticas de
compresso e expanso.
Compresso aproximada por uma caracterstica segmentada (e
perfeitamente adaptada ao processamento digital),
PCM segmentado de 13 segmentos usando a lei A;
PCM segmentado de 15 segmentos usando a lei .
22
PCM segmentado de 13 segmentos (lei A, A = 87.6, 8 bits)
N do segmento
Intervalos de quantificao com largura
maior do que com quantificao linear
Intervalos de
quantificao
com largura
menor do que
com
quantificao
linear
1:4
1/2 1
16:1
16:1
8:1
4:1
2:1
1:1
1:2
1/8 1/4
1/16 1/32 1/64
x
y
1
1:1
7
1
5
6
4
3
2
1
V
c
= 24 dB (16
2
)
Largura do intervalo de quantificao
aumenta 2 vezes de um segmento para o
seguinte
Segmento central com declive 16 e
reduo do declive 2 vezes de cada
segmento para o seguinte
23
Tabela de codificao da lei A segmentada
N do
segmento
gama do
sinal
dimenso do
passo
cdigo do
segmento
cdigo de
quantificao
0-2 0000
2-4 0001
1 000
30-32 2 1111
32-34 0000
001
62-64 1111
64-68 0000
2 4 010
124-128 1111
128-136 0000
3 8 011
248-256 1111
256-272 0000
4 16 100
496-512 1111
512-544 0000
5 32 101
992-1024 1111
1024-1088 0000
6 64 110
1984-2048 1111
2048-2176 0000
7 128 111
3968-4096 1111
Estrutura da palavra PCM
P S
Q
Polaridade da amostra
0 - positiva
1 - negativa
Identificador de
segmento (de 000
a 111)
Identificador do
intervalo (dentro do
segmento) (de 0000 a
1111)
24
Requisitos do sinal de voz / Parmetros tpicos do PCM para a voz
Requisitos para transmisso de voz:
Testes demonstraram que para garantir uma boa qualidade de transmisso
de voz necessrio garantir
Esta condio deve ser respeitada para uma gama dinmica da ordem dos
30 dB.
Caractersticas do sistema PCM para a voz:
Frequncia de amostragem: 8000 amostras/s
Quantificao no uniforme com L = 256 nveis;
Compresso segundo a lei A com 13 segmentos (Europa) ou lei (EUA e
Japo) com 15 segmentos;
palavras PCM de 8 bits;
Ritmo binrio: 64 kbit/s.
dB 35
dB

|
|
.
|

\
|
q
N
S
25
Multiplexagem no tempo (Time-Division Multiplexing, TDM)
Bits
Sincr.
Canal
K
Canal
2
Canal
1
Bits
Sincr.
Canal
1
Trama
... ...
Multiplexer
TDM
Demultiplexer
TDM
Canal 1
Canal 2
Canal K
Canal 1
Canal 2
Canal K
...
b1 b8 b2
...
b1 b8 b2
...
Canal 1
Canal 2
b1 b8 b2
...
Fb
...
Canal 24
193 bits em 125 s (i.e. 8000 tramas/s) r
b
= 1.544 Mbps
Frame bit
(Sincronizao)
Exemplo: Estrutura da trama para 24 canais (DS-1)
o mais pequeno grupo de bits contendo
pelo menos 1 amostra de cada canal mais os
bits de sincronizao
V
e
r

C
a
r
l
s
o
n
,

C
a
p
.

1
2
.
5


!
26
Multiplexagem de canais PCM e hierarquias adoptadas pelo
ITU-T
2048
(30)
8448
(120)
34368
(480)
139264
(1920)
1544
(24)
6312
(96)
32064
(480)
97728
(1440)
44736
(672)
274176
(4032)
391200
(5760)
x4
x6
x4 x3
x7
x5
x4
x4 x4
EUA (AT&T)
Japo (NTT)
Europa
1 hierarquia 4 hierarquia 3 hierarquia 2 hierarquia
NOTA: Os valores entre parntesis
indicam o n de canais de 64 kbit/s
disponveis e os outros esto em
kbit/s.
5 hierarquia
E-x (European-x)
E-1, , E-4
DS-x (Digital Signal-x)
DS-1, , DS-4
Tx (Transmission lines x)
T1,, T4

Você também pode gostar