Você está na página 1de 33

UNIVERSIDADE ESTADUAL DE MARINGÁ

DEPARTAMENTO DE ENGENHARIA QUÍMICA


CURSO DE ENGENHARIA ELÉTRICA

Guilherme El Kadri Ribeiro

DOLBY PRO LOGIC II: DESENVOLVIMENTOS NA


CODIFICAÇÃO E DECODIFICAÇÃO DA MATRIZ

MARINGÁ
2017
GUILHERME EL KADRI RIBEIRO

DOLBY PRO LOGIC II: DESENVOLVIMENTOS NA


CODIFICAÇÃO E DECODIFICAÇÃO DA MATRIZ

Trabalho de Conclusão de Curso sub-


metido à Universidade Estadual de Ma-
ringá, como requisito necessário para
obtenção do grau de Bacharel em En-
genharia Elétrica

Maringá, dezembro de 2017


UNIVERSIDADE ESTADUAL DE MARINGÁ

GUILHERME EL KADRI RIBEIRO

Esta Monografia foi julgada adequada para a obtenção do título de Bacharel em


Engenharia Elétrica, sendo aprovada em sua forma final pela banca examinadora:

Orientador: Prof. Dr. Rafael Krummenauer


Universidade Estadual de Maringá - UEM

Prof. Dr. Abel Fidalgo Alves


Universidade Estadual de Maringá - UEM

Prof. Me. Rubens Zenko Sakiyama


Universidade Estadual de Maringá - UEM

Maringá, 06 de dezembro de 2017


Agradecimentos

Gostaria de agradecer ao meu orientador Dr. Rafael Krummenauer pela ajuda e


dedicação transmitida ao longo deste trabalho. Também gostaria de agradecer a todos
os elementos da Universidade Estadual de Maringá, que de alguma maneira ou de outra
tornaram este trabalho realizável.
Também gostaria de agradecer ao Dr. Abel Alves e Me. Rubens Sakiyama, pela
ajuda preciosa na parte de concepção de processamento de sinais e eletrônica.
Queria também agradecer a todos os meus colegas desta jornada, em especial aos
meus amigos Guido Zoner e Mauro Brandão pela interajuda ao longo de todo o curso.
Aos meus pais, Washington e Soraya, meus irmãos, Caio e Natalia, o meu agrade-
cimento por não me deixarem desistir contra todas a adversidades que foram surgindo.
Sempre me ajudaram a seguir em frente e me fizeram sonhar para conseguir sempre mais
e melhor.
Como academico tive oportunidade de aprender e agora poder de alguma forma
retribuir isso a sociedade, estou ciente que esta é apenas mais uma etapa, e há muito
trabalho pela frente.
Por fim, à minha namorada Isabela Marcon por tudo o que ela significa para mim
e ajuda fundamental na concepção deste documento.
A todos o meu Muito Obrigado!
Resumo
O sistema de codificação Dolby Pro Logic II foi projetado para transmitir a quantidade
total de informação direcional contida em um sinal mono ou stereo, os canais decodificados
é a projeção do sinal stereo. Este trabalho discute métodos de decodificação de tais sinais
para reprodução de um som surround.

A forma do decoder é uma matriz linear de coeficientes complexos, que definem a amplitude
e diferença de fase dos sinais de saída, dependentes do sinal da fonte de entrada. São
discutidas técnicas de aprimoramento da lógica, que procuram melhorar a separação entre
os canais.

O decoder descrito é capaz de fornecer uma boa reprodução do som surround. Em particular,
mostrou um desempenho muito próximo de um sistema discreto de 5 canais de uma matriz
decoder ativo, matrizes originalmente gravados para a reprodução surround. As falhas
normalmente associadas ao decorder passivo, decodificados, são quase inaudíveis e bem
atenuadas visto que o sinal esta sendo tratado digitalmente, atribuindo uma boa fidelidade
na qualidade do sinal processado comparado a outros tecnologias surround.

Palavras-chave: Surround, Dolby, decoder, encoder:.


Abstract
The Dolby Pro Logic II encoding system is designed to transmit a full amount of directional
information contained in a mono or stereo signal. This paper discusses methods of decoding
transmission signals for surround sound reproduction.

The form of the decoder is a linear matrix of complex coefficients that define the power
and phase difference of the output signals dependent on the input source signal. Logic
enhancement techniques are discussed that seek to improve how separations between
channels.

The described decoder is capable of providing a good reproduction of the surround sound.
In particular, it showed very close performance of a discrete 5-channel system of an
active matrix decoder, i.e. originally recorded for surround playback. The faults normally
associated with passive decoded decoded are almost inaudible and well attenuated as the
signal is treated digitally, attributing a good fidelity in the quality of the processed signal.

Keywords: Surround, Dolby, decoder, encoder:.


Lista de ilustrações

Figura 1 – Amostragem uniforme do sinal analógico . . . . . . . . . . . . . . . . . 14


Figura 2 – Espectro de sinais idealmente ampliado e uniformemente amostrado. . 14
Figura 3 – Reconstrução (Interpolação usando filtro passa-baixa) . . . . . . . . . . 15
Figura 4 – Aliasing quando ω < 2B . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Figura 5 – Sistema LTI e operação de convolução . . . . . . . . . . . . . . . . . . 17
Figura 6 – Filtro RC passa-baixa . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Figura 7 – Posicionamento de reprodução surround . . . . . . . . . . . . . . . . . 18
Figura 8 – Matriz de gerenciamento do subwoofer . . . . . . . . . . . . . . . . . . 18
Figura 9 – Decoder Dolby Pro Logic II . . . . . . . . . . . . . . . . . . . . . . . . 20
Figura 10 – Resposta a função transferência do crossover . . . . . . . . . . . . . . 21
Figura 11 – Janela Kaiser no domínio tempo . . . . . . . . . . . . . . . . . . . . . 22
Figura 12 – Resposta em frequência do filtro FIR com janela de Kaiser . . . . . . . 23
Figura 13 – Resposta ao impulso da função sinc(x) . . . . . . . . . . . . . . . . . . 23
Figura 14 – Coeficientes do filtro no domínio tempo . . . . . . . . . . . . . . . . . . 24
Figura 15 – Os vetores decodificados em power ratio . . . . . . . . . . . . . . . . . 25
Figura 16 – Espectro do sinal codificado . . . . . . . . . . . . . . . . . . . . . . . . 28
Figura 17 – Espectrograma do canal subwoofer . . . . . . . . . . . . . . . . . . . . 28
Figura 18 – Espectrograma do canal left . . . . . . . . . . . . . . . . . . . . . . . . 29
Figura 19 – Espectrograma do canal right . . . . . . . . . . . . . . . . . . . . . . . 29
Figura 20 – Espectrograma do canal center . . . . . . . . . . . . . . . . . . . . . . 30
Figura 21 – Espectrograma do canal left surround . . . . . . . . . . . . . . . . . . . 30
Figura 22 – Espectrograma do canal right surround . . . . . . . . . . . . . . . . . . 31
Figura 23 – Espectro do sinal decodificado . . . . . . . . . . . . . . . . . . . . . . . 31
Lista de tabelas

Tabela 1 – Especificações de taxas de amostragem e largura de bandas . . . . . . 15


Tabela 2 – Especificações do filtro . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Lista de abreviaturas e siglas

DSP Digital Signal Processing

CFT Continuous Fourier transform

LPF Low Pass Filter

LTI Linear Time Invariant

RC Resistor Capacitor

LFE Low Frequencies Effects

FIR Finite Impulse Response

FT Função Transferência

WAV Waveform Audio File

FLAC Free Lossless Audio Codec

l Left

r Right

c Center

ls Left Surround

rs Right Surround
Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1 Problemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Organização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . . 13
2.1 Teorema da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.1 Bit rate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.2 Compressão de áudio . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Reprodução Surround . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.1 Canal LFE (Subwoofer) . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.2 Decibel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 MATERIAIS E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1 Sistema Físico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Crossover . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.2 Filtro FIR passa-baixa . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Modelagem Matemática . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2.1 Matriz surround . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.1 Espectrogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

5 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.1 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.2 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
11

1 Introdução

A história da reprodução de som teve seu início apenas um canal (mono), poste-
riormente desenvolveu-se com dois canais, convencionado de stereo e o som multicanal,
também conhecido como surround. A empresa Dolby iniciou sua aplicação nesta área,
com atenuadores de ruído com a Dolby Noise Reduction em 1968, após isso começou
seu trabalho em processamento de áudio. Seu primeiro padrão multicanal foi o Dolby
Surround, utilizado em 1976 pelo filme A Star is Born. Em menos de dez anos depois a
Dolby reformulou o sistema para uso doméstico, evoluindo a tecnologia comercializada no
padrão Dolby Pro Logic.
O sistema matriz Dolby Surround (5-2-5) foi projetado principalmente para superar
as limitações de compatibilidade mono e estéreo de outros sistemas de matriz 5-2-5
propostos, mantendo a capacidade de fornecer um decoder passivo. Para que a reprodução
da Dolby forneça um aprimoramento significativo na sensação do som, juntamente com
uma maior sensação de realidade para o ouvinte, o decoder estudado deve ser efetivo
na extração da informação direcional contida na matriz 5-2-5 cujo o sinal stereo está
codificado.
A notação 5-2-5 consiste no número de canais de áudio discretos separados por
dois pontos a partir do número de canais codificados e decodificados. A decodificação dos
sinais 5-2-5 não se limita a um único método, e é o propósito deste trabalho averiguar a
lógica dos decoders que foram implementados. É altamente provável, no entanto, que a
evolução continuará a ser feita no campo da decodificação.
Formatos populares de som surround :

• Dolby Pro Logic II;

• Som Quadrifônico;

• DTS-ES;

• THX Ultra2.

1.1 Problemática
A tentativa de reprodução do som surround vem sendo estudada junto ao avanço
da tecnologia na área de processamento de sinais, usando métodos de localização psico-
acústica para simular campos 3D. Embora o cinema represente o principal uso do surround,
seu campo de aplicação é mais amplo. As técnicas de áudio multicanal podem ser usadas
Capítulo 1. Introdução 12

para reproduzir música, fala, sons naturais ou sintéticos para cinema, televisão, rádio ou
computadores. Em termos de música, por exemplo, uma performance ao vivo pode usar
técnicas surround no contexto de um show, orquestras e teatros.

1.2 Objetivo
O trabalho tem como objetivo o estudo da tecnologia criada e comercializada pela
Dolby Laboratories, Pro Logic II de codificação e decodificação de áudio. Apesar de não ser
o único método, o projeto também apresenta a essência do processamento, quantização e
amostragem no sinal.

1.3 Organização
O presente trabalho está organizado da seguinte forma:
Capítulo 1: é explicado o advento da tecnologia assim como a organização deste
trabalho.
Capítulo 2: os conceitos relacionados a processamento digital de sinais de áudio
serão abordados neste capítulo, bem como o levantamento da discretização física dos canais
no espaço.
Capítulo 3: o sistema físico e a matriz decoder foram discutidas, assim como as
especificações de cada dispositivo.
Capítulo 4: resultados em espectros de frequência para localizar as atenuações das
frequências de cada canal e suas devidas potências.
Capítulo 5: remete o tema de forma sucinta visando trabalho futuros e considerações
sobre o trabalho.
13

2 Fundamentação Teórica

2.1 Teorema da Amostragem


Em todos os tópicos discutidos adiante, estaremos tratando sinais de áudio e sistemas
associados em tempo discreto. As condições para reprodução de áudio são provadas pelo
teorema da amostragem. Este teorema afirma que um sinal que é estritamente limitado
por uma banda com um tamanho B rad/s pode ser representado de forma exclusiva pelos
seus valores amostrados espaçados em intervalos uniformes com π/B segundos. Em outras
palavras, se denotarmos o período de amostragem como Ts , então o teorema da amostragem
afirma que Ts 6 π/B, Para uma frequência de amostragem dada por ωs = 2πfs = 2π/Ts ,
o critério de Nyquist determina que,

B
ωs > 2B(rad/s) ou fs > (2.1)
π
Matematicamente, o processo de amostragem é representado pelo multiplicação do
sinal x(t), no domínio do tempo, pelo trem de pulsos, p(t), conforme a Figura 1.
Essa multiplicação de x(t) no tempo, é equivalente a convolução no domínio da
frequência, a CFT, Continuous Fourier transform, do sinal amostrado, xs (t), corresponde
a convolução da CFT de x(t) com o trem de pulso, p(t). O espectro dos impulsos é também
um trem de impulsos uniformemente espaçados em frequência espaçada 1/Ts Hz. A CFT
do sinal amostrado é, portanto, uma extensão periódica da CFT do sinal analógico como
mostrado na Figura 2. Na Figura 2, o sinal analógico foi considerado idealmente limitado
em banda e a frequência de amostragem, ωs , foi escolhido para ser mais do que 2B para
evitar aliasing (sobreposição espectral). A CFT do sinal amostrado é dado pela equação


1 X
Xs (ω) = X(ω − kωs ). (2.2)
Ts k=−∞

Note que o espectro do sinal amostrado na Figura 2 pode ser usado um filtro passa-
baixas (LPF) para recuperar a banda do sinal e, portanto, reconstruir o sinal analógico
original a partir do sinal digital. O processo de reconstrução é mostrado na Figura 3. A
reconstrução LPF interpola entre as amostras e reproduz o sinal analógico a partir do sinal
digital.A interpolação fica evidente uma vez que a operação de filtragem é interpretada no
domínio do tempo como convolução. A reconstrução ocorre interpolando com a função
sinc, que é a resposta de impulso do filtro passa-baixa ideal. O processo de reconstrução
Capítulo 2. Fundamentação Teórica 14

Figura 1 – Amostragem uniforme do sinal analógico

Adaptado de: [Spanias, Painter e Atti 2005]

Figura 2 – Espectro de sinais idealmente ampliado e uniformemente amostrado.

Fonte: [Spanias, Painter e Atti 2005]

para ωs = 2B é dado por,


X
x(t) = x(nTs )sinc(B(t − nTs )). (2.3)
n=−∞

Caso a frequência de amostragem seja inferior a 2B, o aliasing ocorrerá, logo o


sinal não será reconstruído perfeitamente conforme a Figura 4 ilustra. Em aplicações reais,
o sinal analógico não é idealmente limitado. O processo de amostragem não é perfeito, ou
seja, os impulsos de amostragem tem amplitude finita e duração finita. Portanto, algum
nível de aliasing está sempre presente em sistemas físicos. Para redução do mesmo o sinal
é filtrado com um filtro anti-aliasing passa-baixa ω > 2B. Para reconstrução da alta
qualidade do sinal, o filtro anti-aliasing dever ter boas características de atenuação na
banda de rejeição. Atualmente, a taxa de amostragem é sempre mais alta que o calculado
para obter-se uma margem de erro para filtros como anti-aliasing. Na prática quanto
menor a taxa de amostragem, menor o custo do Hardware para processamento do sinal. As
Capítulo 2. Fundamentação Teórica 15

diferentes taxas de áudio utilizadas como padrão estão apresentadas na Tabela 1 [Spanias,
Painter e Atti 2005].

Figura 3 – Reconstrução (Interpolação usando filtro passa-baixa)

Adaptado de: [Spanias, Painter e Atti 2005]

Figura 4 – Aliasing quando ω < 2B

Fonte: [Spanias, Painter e Atti 2005]

Tabela 1 – Especificações de taxas de amostragem e largura de bandas

Formato Largura de banda Frequência de amostragem


Telefonia 3.2 kHz 8 kHz
Audio de banda larga 7 kHz 16 kHz
High-fidelity, CD 20 kHz 44.1 kHz
Digital audio tape (DAT) 20 kHz 48kHz
Super audio CD (SACD) 100 kHz 2.8224 MHz
DVD audio (DVD-A) 96 kHz 44.1, 48, 88.2, 96, 176.4, ou 192 kHz
Fonte: [Spanias, Painter e Atti 2005]

2.1.1 Bit rate


Bitrate é a taxa de fluxo de bits da amostra em que se transfere a cada unidade de
tempo de uma mídia digital. Este bitrate depende de diversos fatores:
Capítulo 2. Fundamentação Teórica 16

• Frequência de amostragem;

• Níveis de bits quantizados;

• Número de canais da mídia;

• Algoritmo de compressão do áudio (audio codec).

Quanto maior o bitrate, maior a qualidade e o tamanho do arquivo, o inverso


também vale, quanto menor for o bitrate, menor a qualidade e o tamanho da mídia. Seu
calculo é feito da seguinte maneira,

bitrate = Fs .(canais).(bits quantizados) (2.4)

Fs é a frequência de amostragem. O bitrate é medido em bits por segundo ou


kbps, kilo bits per second. O bitrate máximo para reprodução de áudio stereo, cada
canal quantizado em 16 bits, amostrado a uma frequência de amostragem de 44,1kHz é
1411, 2kbps. Para áudio decodificado em 6 canais o bitrate será 4233, 6kbps. Esta taxa só
há em formatos de arquivo .WAV (Waveform Audio File Format) e .FLAC (Free Lossless
Audio Codec).

2.1.2 Compressão de áudio


A compressão do áudio define como as amostras do sinal, serão codificadas a
uma estrutura comprimida, denominado de bitstream, e posteriormente decodificadas,
expandidas para a reprodução do arquivo pelo player.
O padrão utilizado pela Dolby Digital Pro Logic II é o AC-3 bitstream, Acoustic
Coding 3, permite uma compressão no bitrate entre 320kbps a 640kbps, dependo da mídia
de reprodução, CD, DVD ou Blu-ray.

2.2 Filtros
Seja um sistema LTI (Linear Time Invariant), mostrado na Figura 5, um filtro
linear que satisfaça a propriedade de superposição, portanto, a sua saída y(t), é a convolução
da entrada, x(t), com a resposta ao impulso do filtro, h(t). Matematicamente, a convolução
é representada pela integral

Z ∞
y(t) = h(τ )x(t − τ )dτ = h(t) ∗ x(t). (2.5)
−∞

Na Figura 6 está representado um circuito RC simples de primeira ordem operando


como um filtro passa-baixa. A resposta do impulso para este filtro RC é uma exponencial
Capítulo 2. Fundamentação Teórica 17

Figura 5 – Sistema LTI e operação de convolução

Adaptado de : [Spanias, Painter e Atti 2005]

Figura 6 – Filtro RC passa-baixa

Adaptado de: [Spanias, Painter e Atti 2005]

decrescente, e sua resposta em frequência é dado pela função de primeira ordem, H(ω).
Essa função complexa representa o ganho do filtro em relação a frequência no estado
estacionário. Se uma senoidal entrar no filtro, a saída é uma senoidal com frequência
filtrada. Porém, sua amplitude é dimensionada e a fase é deslocada com a mesma magnitude
e fase da função de resposta em frequência, respectivamente.

2.3 Reprodução Surround


A sua reprodução adiciona três canais a mais de alto-falantes, um central e outros
dois por trás do ouvinte, deste modo, há uma sensação de som proveniente de 360◦
sobre o ouvinte. O sistema 5.1 é posicionado cada canal como: centro (c), esquerda (l)
e direita (r) espaçados de 2-4 metros em ângulo de 30◦ em relação a tela, com largura
H, posicionado a frente do ouvinte, esquerda surround (ls) e direita surround (rs) em
ângulos de 100◦ − 120◦ [Rumsey 2001], além do subwoofer posicionado geralmente em
canto do ambiente, conforme ilustra a Figura 7, padronizada pela ITU-R BS.775 (ITU
1993) [ITU-R 1993].
Capítulo 2. Fundamentação Teórica 18

Figura 7 – Posicionamento de reprodução surround

Tela 1(TV): 3H(2β1 = 33◦ )


Tela 2(projetor): 2H(2β2 = 48◦ )
Adaptado de: [Rumsey 2001]

2.3.1 Canal LFE (Subwoofer)


O canal subwoofer, reproduz sons de baixas frequências que se estende no máximo
até 120Hz [Rumsey 2001]. O ganho dentro dessa banda é geralmente +10dB maior que
nos outros canais individuais. Para a reprodução do canal LFE, o subwoofer é gerenciado
pelo somatório das frequências selecionado pelo crossover, estudado adiante no capítulo 3,
coforme a Figura 8.

Figura 8 – Matriz de gerenciamento do subwoofer

Adaptado de: [Breebaart e Faller 2008]


Capítulo 2. Fundamentação Teórica 19

2.3.2 Decibel
No âmbito do processamento de áudio, usa-se a unidade de medida logarítmica
decibel (dB), esta unidade serve para indicar grandezas como potencia e amplitude do sinal.
O tipo de medida utilizados neste trabalho são dBV (decibel-Voltage), conhecido também
como Amplitude ratio, e dBm (decibel-Miliwatt), utilizado para medir a quantidade de
potência em determinado instante de tempo pelo espectrograma.
Amplitude ratio
Vs
dB = 20log10 , (2.6)
Ve
onde Vs e Ve é a tensão de entrada e a tensão de saída respectivamente.
Decibel-Miliwatt
Ps
dBm = 10log10 , (2.7)
1mW
Ps é a potência de saída do sistema, que sai da relação de potência Power ratio, dado por

Ps
dB = 10log . (2.8)
Pe
20

3 Materiais e Métodos

Primeiramente, definiu-se o sistema físico, trabalhado especificando desde a entrada


do decoder a sua saída. O segundo passo foi modelar matematicamente e implementar o
processamento dos sinais de som dos canais.
O sistema foi concebido e analisado usando-se o software de computação científica
MATLABr , desde a leitura dos arquivos de áudio estéreo até a reprodução do áudio
decodificado para surround.

3.1 Sistema Físico


O decoder mapeia 6 canais, apartir do sinal original stereo (2 canais), este sistema
físico compõe-se por: crossover, onde são separadas as frequências baixas das altas. Seletor
de colunas, trate-se individualmente cada coluna, left (l) e right (r), da matriz para
obter o canal desejado. Pontos de soma para realizar operações matemáticas nas mesmas.
Pontos de ganho onde controla-se quantidade de Amplitude ratio [Dressler 2000]. Filtros
passa-baixa para preservar apenas conteúdo de frequência abaixo de 7kHz para os canais
left surround (ls ) e right surround (rs ). Pontos de delay, de 10ms, no canal surround para
alcançar um efeito Precedence, ou efeito de Haas [Rumsey 2001]. Matriz somatória onde
left e right limitados a 120Hz são somados produzindo o canal mono, indo para a saída do
subwoofer para reprodução dos sons graves. Conforme representado na Figura 9.

Figura 9 – Decoder Dolby Pro Logic II

Fonte: Autoria própria.


Capítulo 3. Materiais e Métodos 21

3.1.1 Crossover
O crossover realiza uma compressão multi-banda que comprime diferentes bandas
de frequência de áudio separadamente, primeiro dividindo o sinal em duas faixas e depois
passando cada banda através de seu próprio filtro de forma independente. Foi utilizado um
filtro crossover Linkwitz-Riley, também conhecido como um filtro quadrado Butterworth,
pois são projetados em cascata pelo mesmo, cada um com um ganho de -3dB na frequência
de corte, ou seja, a resposta dos dois filtros produz um ganho de 0dB na frequência do
cruzamento, de modo que o crossover atua como um filtro passa-tudo, e, portanto, não
apresenta distorção no sinal de áudio [MathWorks 2013].
Foi implementado um filtro de ordem 4, logo sua inclinação, ou joelho, será
24dB/oitava, que realiza um crossover na frequência de 120Hz, ilustrado na Figura
10.

Figura 10 – Resposta a função transferência do crossover


0
Banda 1

Banda 2

-10

-20
Magnitude (dB)

-30

-40

-50

-60

-70
10 2 10 3 10 4
Frequência (Hz)

Fonte: Autoria própria.

3.1.2 Filtro FIR passa-baixa


Um filtro digital passa-baixa do tipo FIR, Finite Impulse Response, é um filtro
não-recursivo e causal. Há diversos métodos de implementar o mesmo, adotou-se o método
por janelamento de Kaiser, tanto por fins didáticos quanto pela eficiência visto que sua
atenuação é de -90dB entre as magnitudes do lóbulo principal e do lóbulo lateral, conforme
a Figura 11 e 12 [Oppenheim e Schafer 1975].
Para implementar o filtro consideremos, x[n] a entrada, h[n] a FT (função transfe-
rência) e y[n] a saída do sistema. Os coeficientes da FT será um produto vetorial elemento
a elemento entre a janela de Kaiser w[n] e a resposta de um filtro ideal hd [n]

h[n] = hd [n].w[n]. (3.1)


Capítulo 3. Materiais e Métodos 22

Tabela 2 – Especificações do filtro

Medida Frequência/Ripple Frequência normalizada


Faixa de passagem 0 a fp = 0.5kHz 0 a ωp = 0.9261
Largura de transição 0.5kHz 4ω = 0.0712
Frequência de parada fs = 7.5kHz ωs = 1.0686
Máximo Ripple na faixa de passagem Rp = 0.000274dB
Mínima atenuação na faixa de rejeição Rs = 90dB
Frequência de amostragem Fs = 44.1KHz
Adaptado de: [Oppenheim e Schafer 1975].

O comprimento do filtro Kaiser : 5.71/N , 4ω/2π = N. Logo N=252.

Figura 11 – Janela Kaiser no domínio tempo

0.9

0.8

0.7

0.6
Amplitude

0.5

0.4

0.3

0.2

0.1

0
0 50 100 150 200 250
Amostras

Fonte: Autoria própria.

A resposta ao impulso utilizada foi a de um filtro passa-baixas ideal:

sin ωc (n − nd )
hd [n] = . (3.2)
π(n − nd )

Onde n são amostras do sinal e nd as amostras atrasadas que ornam o filtro causal.
Nota-se que a resposta impulsiva é a função sinc(x) com 145 amostras, conforme a Figura
13. A janela de Kaiser é descrita pela equação 3.3.

 q 
2n
2
I0 πα 1 − N −1
−1
w[n] = , (3.3)
I0 (πα)
Capítulo 3. Materiais e Métodos 23

Figura 12 – Resposta em frequência do filtro FIR com janela de Kaiser

10
FIR LPF com Kaiser
0

-10
Magnitude da resposta H(f) (dB)

-20

-30

-40

-50

-60

-70

-80

-90

-100
0 0.5 1 1.5 2
f (Hz) ×10 4

Fonte: Autoria própria

Figura 13 – Resposta ao impulso da função sinc(x)

0.35

0.3

0.25

0.2
Amplitude

0.15

0.1

0.05

-0.05

-0.1
0 50 100 150 200 250
Amostras

Fonte: Autoria própria.

onde I0 é uma função de Bessel modificada do primeiro tipo e de ordem zero, α é um número
arbitrário não negativo que determina a forma da janela. Logo os coeficientes do filtro
são descritos pela equação 3.1, onde a janela Kaiser é vetorialmente multiplicada por a
resposta ideal. Ao multiplicar a função sinc(x) pela janela Kaiser, tem-se o comportamento
desejado para manter o lóbulo principal e desprezar os lóbulos secundários, conforme a
Figura 14
Como o sinal filtrado y[n] será está sendo multiplicado no domínio da frequência,
Capítulo 3. Materiais e Métodos 24

Figura 14 – Coeficientes do filtro no domínio tempo

0.35

0.3

0.25

0.2
Amplitude

0.15

0.1

0.05

-0.05

-0.1
0 50 100 150 200 250
Amostras

Fonte: Autoria própria.

podemos calcular sua resposta fazendo uma convolução entre x[n] e h[n].

y[n] = x[n] ∗ h[n] (3.4)

3.2 Modelagem Matemática


3.2.1 Matriz surround
O sistema matricial decodifica dois canais de áudio em 5.1, os valores dos canais
são a razão da tensão de saída pela entrada, Amplitude ratio [Dressler 2000]. Adiante, a
matriz Dolby Pro Logic II (5-2-5) é descrita pela equação 3.5 para codificar os canais de
um áudio surround 5.1 ou decodificar de um stereo.

 
l(t)
 r(t) 
" #  q q   
lt (t) 1 0 √1 −i 23 −i 13 
2
(3.5)

= q q  .  c(t)  ,
rt (t) 0 1 √1 i 13 i 23
 
 ls (t) 
2
 

rs (t)
o i indica mudança de fase de 90◦ [Breebaart e Faller 2008]. Alternativamente, o sistema
pode ser escrito como

" " # # " # " #  q   q 


2
lt (t) 1 0 √1 − 3 − 13
= l(t) + r(t) + 12 c(t) + i  q  ls (t) + i  q  rs (t)
rt (t) 0 1 √
2
1 2
3 3
Capítulo 3. Materiais e Métodos 25

" #
lt (t)
= vl l(t) + vr r(t) + vc c(t) + vls ls (t) + vrs rs (t), (3.6)
rt (t)
onde os cinco vetores são vetores unitários que mapeiam os cinco canais de entrada para
os dois canais de saída. Os vetores são mostrados em relação a lt (t) e rt (t) na Figura 15.

Figura 15 – Os vetores decodificados em power ratio

Fonte: [Breebaart e Faller 2008]

A maneira mais simples de decodificar um sinal codificado por matriz é aplicar


um decoder passivo. Formulados em termos de vetores previamente definidos, os canais
decodificados por matriz são

l(t) = [lt (t) rt (t)]vl


r(t) = [lt (t) rt (t)]vr
c(t) = [lt (t) rt (t)]vc . (3.7)
ls (t) = [lt (t) rt (t)]vls
rs (t) = [lt (t) rt (t)]vrs

Cada canal de saída é igual à projeção do sinal codificado da matriz no vetor de


codificação da matriz correspondente.
A estratégia de codificação/decodificação descrita reconstrói perfeitamente um
canal em um cenário onde apenas um único canal está ativo. No entanto, os outros canais
não são zero neste caso, isto é, há um efeito crosstalk. A situação em que apenas um canal
está ativo pode ser facilmente detectada. Em tal situação, pode-se ajustar todos os outros
Capítulo 3. Materiais e Métodos 26

canais de áudio para zero e assim melhorar a separação do canal. Esta é a principal ideia
por trás dos decoders ativos [Breebaart e Faller 2008].
27

4 Resultados

O sistema físico explicado no capítulo 3, apresentava a decodificação do sinal de


entrada stereo em surround. Adiante apresenta-se espectros de frequência das bandas
codificadas, decodificadas e individuais a cada canal.

4.1 Espectrogramas
O áudio de entrada x[n] usado como exemplo é uma faixa stereo em formato
WAV, pois este bitstream é codificado de forma linear sem perdas ou compressão. Para
reprodução, selecionou-se uma música tocada por violino, visto que abrange bem as bandas
de frequência audível ao ser humano, com duração de aproximadamente 54.3 segundos.
Quantizado em 16bits cada canal e amostrado a uma frequência de 44,1kHz conforme a
Figura 16.
Como visto no espectro de frequência da Figura 16, a reprodução é audível entre
as frequências 20Hz a 20kHz e separados nos canais left e right.
Pode-se analisar pela Figura 17 o canal subwoofer a frequência esta limitada a
120Hz com a compressão multi-banda do crossover, e reproduzido como canal mono, visto
que somou-se os dois canais originalmente codificados.
Ambos canais left e right permanecem inalterados do áudio stereo codificado, como
constata na Figura 18 e 19.
Pode-se analisar que a potência em dBm do canal center está mais atenuada, as
cores vermelho e amarelo mais enfraquecidas do que as dos canais left e right visto que
sua amplitude é reduzida em 29% visto na Figura 20.
Nota-se que ambos os canais ls e rs são filtrados as frequências acima de 7kHz,
fazendo com que as magnitudes do sinal mais forte que os demais, de acordo com as
Figuras 21 e 22 respectivamente. Filtrando o conteúdo de alta frequência também tem
o efeito de fazer com que os alto-falantes surround saem mais longe e mais difíceis de
localizar, fazendo com que o som pareça ecoado [Dressler 2000]. Pelos gráficos não pode-se
constatar o delay de 10ms, pois este é um efeito sutil para analisar em um escopo de
tempo. No prática, foi adicionado 441 amostras nulas ao sinal x[n],

x[n] = 0, 0 < n < 441,

visto que a frequência de amostragem é 44.1kHz, formando o efeito Hass [Breebaart e


Faller 2008]. Na prática acontece um prolongamento do canal em relação aos auto-falantes
frontais para um sensação auditiva mais envolvente.
Capítulo 4. Resultados 28

Observando a figura 23, pode-se analisar o áudio decodificado, discriminando cada


canal.

Figura 16 – Espectro do sinal codificado


20
left
right
0

-20
dBm

-40

-60

-80

-100

10 -1 10 0 10 1
RBW=21.53 Hz Frequência (kHz)

Fonte: Autoria própria.

Figura 17 – Espectrograma do canal subwoofer

Fonte: Autoria própria.


Capítulo 4. Resultados 29

Figura 18 – Espectrograma do canal left

Fonte: Autoria própria.

Figura 19 – Espectrograma do canal right

Fonte: Autoria própria.


Capítulo 4. Resultados 30

Figura 20 – Espectrograma do canal center

Fonte: Autoria própria.

Figura 21 – Espectrograma do canal left surround

Fonte: Autoria própria.


Capítulo 4. Resultados 31

Figura 22 – Espectrograma do canal right surround

Fonte: Autoria própria.

Figura 23 – Espectro do sinal decodificado

20 subwoofer
left
0 right
center
left surround
-20 right surround

-40
dBm

-60

-80

-100

-120

-140

10 -1 10 0 10 1
RBW=21.53 Hz Frequência (kHz)

Fonte: Autoria própria.


32

5 Conclusão

Neste trabalho foi implementado um sistema de decodificação de áudio da Dolby


Pro Logic II, com intuito de se conhecer os estágios matemáticos utilizados apartir de
processamento digital de sinal stereo. Os testes realizados mostraram que o sistema é capaz
de reproduzir bem o efeito psicoacústico discretizado espacialmente, resultando em efeitos
sonoros desejados, com a maioria de aplicações em cinemas e reprodução de aparelhos
Home Theater.
A forma do decoder é uma matriz linear de coeficientes complexos, que definem
a amplitude e diferença de fase dos sinais de saída, dependentes do sinal da fonte de
entrada. Foram discutidas técnicas de aprimoramento da lógica, que procuram melhorar
as separações entre os canais da fonte principal de som e o sinal da fonte secundária.
Obteve-se uma resposta esperada visto que pode-se comprovar os resultados pelo
MATLAB e testados posteriormente, obtendo um desempenho perceptível.

5.1 Trabalhos futuros


Ao longo da pesquisa deste trabalho, atentou-se abranger o campo de estudo para
novas pesquisas e aplicações para aprimoramentos da tecnologia Dolby Pro Logic II, como
inclusão do controle automático de ganho para emular a lógica de separação de canais, e a
implementação deste sistema em DSP.

5.2 Considerações finais


O intuito do trabalho foi poder aplicar o conhecimento obtido na graduação do curso,
utilizando conhecimentos de filtros digitais, CFT’s, análise matricial e outras aplicações de
processamento digital de sinal em ambiente MATLAB. Tendo como referência os artigos da
Dolby e livros que envolvem o assunto de computação espacial de áudio, pode-se comprovar
os resultados a partir de gráficos no domínio do tempo e de espectro de frequências para
uma analise mais detalhada do sinal.
Motivado pelo decoder mais comercializado no ramo, Dolby Pro Logic II, este
trabalho preza averiguar a metodologia de matrizes decoders passivos, porem já há diversos
decoders que discretizam o sinal stereo em mais de 6 canais como o estudado aqui. Contudo
se utiliza a mesma lógica de tratamento de sinal como o Pro Logic II.
33

Referências

BREEBAART, J.; FALLER, C. Spatial Audio Processing: MPEG Surround and


Other Applications. New York, NY, USA: Wiley-Interscience, 2008. ISBN 0470033509,
9780470033500. Citado 5 vezes nas páginas 18, 24, 25, 26 e 27.

DRESSLER, R. Dolby surround pro logic ii decoder: Principles of operation. v. 1, p. 16,


2000. Citado 3 vezes nas páginas 20, 24 e 27.

ITU-R. Recommendation bs. 775: Multi-channel stereophonic sound system with or


without accompanying picture. International Telecommunications Union, v. 1, p. 10, 1993.
Citado na página 17.

MATHWORKS. Multiband Dynamic Range Compression. 2013. [Online; accessado


22-Novembro-2017]. Disponível em: <https://www.mathworks.com/help/audio/examples/
multiband-dynamic-range-compression.html>. Citado na página 21.

OPPENHEIM, A. V.; SCHAFER, R. W. Digital Signal Processing. [S.l.]: Prentice–Hall,


1975. Citado 2 vezes nas páginas 21 e 22.

RUMSEY, F. Spatial Audio. illustrated, reprint. Oxford, United Kingdom: Focal Press,
2001. ISBN 0240516230, 9780240516233. Citado 3 vezes nas páginas 17, 18 e 20.

SPANIAS, A.; PAINTER, T.; ATTI, V. Audio Signal Processing and Coding. [S.l.]: John
Wiley & Sons, Inc., 2005. ISBN 9780471791478. Citado 3 vezes nas páginas 14, 15 e 17.