Escolar Documentos
Profissional Documentos
Cultura Documentos
• Análise na frequência:
– a voz apresenta um conteúdo espectral que vai de 20 Hz a 20 kHz;
– os sons vozeados ou nasais (e.g. vogais e algumas consoantes j, l, m)
apresentam um espectro discreto com uma frequência fundamental de 100
a 200 Hz nos homens e 200 a 400 Hz nas mulheres;
– os sons não vozeados (e.g. f, s, p, ch) que são gerados pelo fluxo de ar na
boca modulado pelos maxilares, língua e lábios apresentam uma variação
aleatória. O seu espectro é contínuo;
Energia (dB)
transportam a energia do sinal e Emoção
500 3500 Hz
Características do sinal de voz (cont.)
• Análise no tempo:
– várias sílabas por segundo;
– a fala concentra-se em intervalos de duração aleatória (com média de
cerca de 1 seg.) separados por intervalos de duração aleatória (superior a
100 ms, quando se está a falar) variação temporal bastante irregular e
aleatória;
– o sinal de voz só está presente, em média, em 40% do tempo. Pode-se
aproveitar este facto para intercalar outras conversações (sistema TASI -
time assignement speech interpolation).
Caracterização do sistema auditivo
Banda de guarda
Banda de guarda
300 3400 Hz
Transmissão digital de sinais analógicos
Transforma o sinal da fonte
num sinal eléctrico
Fonte de Codificador
informação Transdutor Amostrador Quantificador
de fonte
e.g. pessoa a falar e.g. microfone
fs = 2F
F Hz
Filtro passa-baixo
F Hz
Palavras de Nb bits, Nb=log2L
PCM - Pulse Code Modulation
- Exemplo -
Sinal original
4.1 4.6
3.3 3.0
2.8 2.4
2.2
Resultado da amostragem
1.4 1.1
Ts
5
4
Resultado da quantificação pelo 3 3 3
inteiro mais próximo 2 2
1 1
Resultado da codificação
001 011 010 100 001 011 010 101 011
(palavra binária), i.e. sinal
PCM
Amostragem
t -F F f
q
x0 x1 x2 xN
x
xi-1 xi x, entrada x0
limiares de decisão
S A
= 1.76 + 6.02Nb + 20log10
Nq Amax
S
• Com quantificação uniforme = 1.76 + 6.02Nb − GD
Nq
– gamas dinâmicas elevadas exigem um nº de bits por amostra, Nb, elevado
para garantir uma S/Nq especificada;
xj-1 xj Entrada, x
Implementação do quantificador não-uniforme
Emissor: Receptor:
F(x) F-1(x)
x y Quantificador Descodificador y x
linear linear
Contribuição de cada intervalo de quantificação Assume-se que a fdp de x é constante em cada intervalo
(δ xi )3 L (δ xi )2
2
L
1 L
dx
nq = p( x )
i = p( x )δ x i i = 2 p( xi )δ xi
i =1 12 i =1 12 3L i =1 dy
Probabilidade do sinal x estar 2 dx O ruído de
NOTA: no caso da
quantificação uniforme δxi = q
no i-ésimo intervalo δ xi = quantificação
resultando em nq = q2/12
L dy depende da estatística
do sinal analógico a
1 2 discretizar
1 dx
δ
No caso em que L é elevado ( ix → 0): q
n = 2
p( x)dx
3L −1 dy
Relação sinal-ruído de quantificação
• Relação sinal-ruído de 1
x2 p( x)dx
quantificação: s
= 3L2 −1
2
nq 1
dx
p( x)dx
−1
dy
• Tem interesse em definir-se
uma relação sinal-ruído de Relação sinal-ruído
2
quantificação independente (da dx s 3L proporcional ao quadrado
= kx = 2 do nº de níveis
estatística) do sinal de entrada: dy nq k melhoria de 6 dB por cada
Resolução da eq. diferencial: bit a mais na codificação
dy 1 1 Compressão logarítmica: característica irrealizável
= x=1 y=1 y = 1+ ln x
dx kx k devido à assimptota vertical para x = 0
Ganho de compressão / Vantagem de compressão
• Numa GD de 40 dB a
lei µ tem uma S/Nq mais Lei A - 8 bits 33 dB
40
uniforme que a lei A. Lei µ - 8 bits
20
0
-60 -50 -40 -30 -20 -10 0
Nível de entrada (dBm0)
Técnicas de quantificação não-uniforme
1:1 5
Largura do intervalo de quantificação
2:1 4 aumenta 2 vezes de um segmento para o
Intervalos de seguinte
quantificação 4:1 1:1 3
com largura
menor do que
com 8:1 2
quantificação Intervalos de quantificação com largura
linear maior do que com quantificação linear
16:1 Vc = 24 dB (162) 1
16:1 1
– Esta condição deve ser respeitada para uma gama dinâmica da ordem dos
30 dB.
• Características do sistema PCM para a voz:
– Frequência de amostragem: 8000 amostras/s
– Quantificação não uniforme com L = 256 níveis;
– Compressão segundo a lei A com 13 segmentos (Europa) ou lei µ (EUA e
Japão) com 15 segmentos;
– palavras PCM de 8 bits;
– Ritmo binário: 64 kbit/s.
Multiplexagem no tempo (Time-Division Multiplexing, TDM)
é o mais pequeno grupo de bits contendo
pelo menos 1 amostra de cada canal mais os
bits de sincronização
Trama
Canal 1 Canal 1
Bits Canal Canal
Canal 2 ... Sincr. 1 2
... Canal Bits Canal
K Sincr. 1
... Canal 2
Multiplexer Demultiplexer
TDM TDM
Canal K Canal K
• Exemplo: Estrutura da trama para 24 canais (DS-1)
Frame bit
r l son, Canal 1 Canal 24 (Sincronização)
C a ! Canal 2
r
Ve . 12.5
Cap
Multiplexagem de canais PCM e hierarquias adoptadas pelo
ITU-T
1ª hierarquia 2ª hierarquia 3ª hierarquia 4ª hierarquia
Europa
2048 x4 8448 x4 34368 x4 139264 E-x (European-x)
(30) (120) (480) (1920) E-1, …, E-4
5ª hierarquia
Japão (NTT)
1544 x4 6312
(24) (96)
EUA (AT&T)
NOTA: Os valores entre parêntesis 44736 274176
indicam o nº de canais de 64 kbit/s x7 (672) x6 (4032) DS-x (Digital Signal-x)
disponíveis e os outros estão em DS-1, …, DS-4
kbit/s. Tx (Transmission lines x)
T1,…, T4