Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Ondas sonoras
Parte 1
Algum conhecimento inicial das ondas sonoras é essencial para que os capítulos
posteriores sejam totalmente significativos. A seguir, um breve resumo de suas
propriedades mais importantes. Fatos e números científicos são apresentados na Parte 2 ,
no final deste capítulo, para aqueles que possam achá-los úteis ou interessantes.
Eles são descritos como ondas de compressão e rarefação no ar. Isso significa que, quando
as ondas sonoras passam por um ponto fixo, a pressão atmosférica nesse ponto fica
ligeiramente acima e abaixo da pressão barométrica constante. Mas essas flutuações são
pequenas e rápidas demais para serem registradas por um barômetro. Um microfone, por
outro lado, pode ser pensado como uma espécie de barômetro elétrico extra-sensível
capaz de detectar essas rápidas flutuações na pressão do ar, ao contrário de um barômetro
normal, que só pode indicar mudanças de pressão relativamente lentas. A Figura
1.1 mostra como seria uma onda sonora se pudéssemos vê-la.
DEFINIÇÕES
Há uma compressão onde as linhas estão mais próximas e uma rarefação onde estão
amplamente espaçadas. Ondas desse tipo são chamadas de ondas longitudinais. As ondas
que vemos na água, por exemplo, são chamadas de ondas transversais porque os pedaços
individuais (moléculas) da água se movem para cima e para baixo quando a onda é
horizontal. Nas ondas longitudinais, como o som, as moléculas de ar oscilam de um lado
para o outro.
Figura 1.1 Compressão e rarefações
Frequência
Comprimento de onda
Amplitude
Esta é a 'altura' da onda em quaisquer unidades que sejam mais convenientes – no trabalho
elétrico, por exemplo, a amplitude pode ser expressa em volts ou ampères.
No ar, em condições normais, as ondas sonoras viajam a cerca de 340 metros por segundo
(m/s). Isso é próximo a 760 milhas/hora, ou cerca de 1120 pés/segundo. A velocidade
varia um pouco com a temperatura do ar, por isso os instrumentistas de sopro precisam,
literalmente, aquecer seus instrumentos, pois a afinação depende da velocidade com que
as ondas sonoras oscilam dentro do instrumento. Para a maioria dos propósitos práticos,
além do exemplo que acabamos de citar, a variação na velocidade da onda sonora com a
temperatura não é importante. Os detalhes são fornecidos na Parte 2 deste capítulo. O
símbolo para a velocidade da onda sonora é, neste livro, v.
Essas três coisas estão ligadas por uma fórmula importante, mas felizmente simples. Um
momento de reflexão mostrará que, se, digamos, 1.000 ondas por segundo estão sendo
emitidas de uma fonte (ou seja, a frequência é de 1 kHz) e cada uma tem um comprimento
de onda de λ, então, após um segundo, as primeiras ondas emitidas estarão a 1.000 × λ de
distância . Ou, sua velocidade é de 1000 × λ metros por segundo.
O que fizemos foi multiplicar a frequência pelo comprimento de onda para chegar à
velocidade:
IMPORTANTE
Deve ser bastante óbvio que, se a frequência for dobrada (para 2 kHz), o comprimento
de onda será reduzido pela metade (para 17 cm) e assim por diante. Cálculos simples
nesse sentido mostrarão que a frequência mais baixa que o ouvido normal pode detectar
– 16 Hz – corresponde a um comprimento de onda de cerca de 21 m (70 pés), enquanto
na frequência mais alta, em torno de 16 kHz, o comprimento de onda é de cerca de 2 cm,
ou melhor, menos de uma polegada.
Veremos nas próximas duas seções que essa vasta gama de comprimentos de onda
apresenta problemas em muitas situações de gravação de som, pois o grau em que as
ondas sonoras são refletidas ou contornadas por obstáculos depende criticamente do
comprimento de onda.
Everyone is familiar with echoes – sounds being reflected from a large building or a cliff.
What is perhaps not so obvious is that for this reflection to occur to any significant effect
the sound wavelength must be smaller than the dimensions of the reflecting object. For
example, the side of a building might be 10 m high and 20 m long. Sounds striking this
building at right angles will be reflected if their wavelength is less than 10 m – that is, for
frequencies greater than about 30 Hz. The most predominant frequencies in the human
voice range from roughly 200 Hz to around 500 Hz, so a shout near to this building will
be easily reflected.
Por outro lado, se o objeto tiver dimensões menores que o comprimento de onda, não
haverá reflexão. Em vez disso, as ondas se curvam ao redor do objeto, um processo
chamado difração, do qual trataremos na próxima seção.
Não há divisão nítida entre reflexão e difração. Por exemplo, e tomando figuras
simples, suponha que temos um obstáculo que é uma placa rígida de um metro
quadrado. Um comprimento de onda de um metro corresponde a uma frequência de cerca
de 340 Hz. O que vai acontecer é que as ondas sonoras dessa frequência serão
parcialmente refletidas, com curvatura parcial ao redor da placa. Frequências em torno de
um terço de 340 Hz – cerca de 100 Hz – e o comprimento de onda de cerca de 3 m será
quase totalmente não refletido. Para um comprimento de onda de cerca de 30 cm, haverá
reflexão quase completa, sendo a frequência neste caso de cerca de 3 kHz. Uma
consequência de tudoé que em qualquer sala ou estúdio usado para gravação de som, o
efeito dos obstáculos pode ser muito difícil de prever, pois eles atuarão como refletores
para algumas frequências e não para outras. E neste contexto os obstáculos podem
significar estantes de partituras, pessoas, estojos de partituras e até os próprios
instrumentos!
Isso pode ser pensado como um efeito complementar à reflexão, pois as ondas que não
são refletidas serão contornadas por um obstáculo. Se o comprimento de onda for muito
maior que o tamanho do obstáculo, haverá uma curvatura marcada pelas ondas (há então
pouca reflexão). Se o comprimento de onda for pequeno, haverá pouca difração, mas
considerável reflexão. A Figura 1.3 (a) mostra a difração quase completa.
DEFINIÇÃO
A Figura 1.4 mostra o que acontece quando as ondas sonoras passam por uma
abertura. Possivelmente ao contrário do que se poderia esperar, se a abertura for pequena
em relação ao comprimento de onda, há um espalhamento considerável do feixe de ondas
emergentes; se for grande, há pouco espalhamento. Muitas vezes é fácil ver efeitos como
este na água quando ondulações, ou mesmo ondas grandes, encontram obstruções ou
lacunas, por exemplo, nas paredes de um cais.
Existem muitos experimentos fáceis de realizar, mas altamente instrutivos, que o
leitor pode realizar por si mesmo. Por exemplo, tente segurar algo como uma prancheta
ou qualquer outra folha rígida de formato conveniente entre o ouvido e uma fonte de
som. Ver-se-á que as altas frequências da fonte são reduzidas no ouvido.
Em seguida, incline a placa para que os sons sejam refletidos no ouvido e veja qual
faixa de frequências é afetada. Observe como o caráter do som varia quando uma
aeronave passa atrás de uma casa, árvores ou outros objetos.
Vale ressaltar que todas as ondas, e não apenas as ondas sonoras, sofrem reflexão e
difração quando as condições são adequadas. Com a luz, por exemplo, os comprimentos
de onda são tão pequenos em relação ao tamanho dos objetos do dia-a-dia que
praticamente 100% de reflexão ocorre quase o tempo todo. A difração ocorre, mas os
efeitos geralmente não são óbvios.
Poder
Como as ondas sonoras são uma forma de energia, podemos legitimamente usar watts
como unidades de sua potência. No entanto, na prática, o watt é, em termos de ondas
sonoras, inconvenientemente grande para a maioria dos propósitos. Ou talvez devêssemos
dizer que o ouvido humano é tão sensível que precisamos de unidades menores do que
watts.
DEFINIÇÃO
Neste ponto, o leitor não deve ficar confuso, ou possivelmente até alarmado, pelo fato
de que seus alto-falantes provavelmente têm rótulos citando potências muito maiores do
que as minúsculas potências, como um milionésimo de watt, que o ouvido pode
suportar. Os alto-falantes geralmente são classificados em muitos watts, 50 W ou mais,
mesmo para um sistema doméstico modesto. Esta potência refere-se à potência elétrica
máxima que pode ser alimentadano alto-falante sem causar danos ou distorção grave. A
potência sonora que sai provavelmente será de cerca de 1% ou 2% da potência elétrica
que entra no alto-falante - e apenas uma fração muito pequena disso provavelmente
entrará no ouvido do ouvinte!
Intensidade
DEFINIÇÃO
Intensidade é a energia caindo, emitida por ou passando por uma área específica.
Pressão
Assim, as pressões das ondas sonoras são normalmente dadas como tantos
newtons/metro quadrado, abreviado para N/m 2 .
Para complicar ainda mais, tornou-se prática oficial lembrar o cientista francês Blaise
Pascal (1623-1662), chamando o N/m 2 de pascal (Pa para abreviar).
Esta seção sobre unidades pode parecer pesada. O leitor não deve se preocupar muito
se for esse o caso, pois na maior parte do tempo nestelivro, usaremos essas unidades
apenas como base de comparação. A familiaridade trará, espera-se, não desprezo, mas
uma pronta aceitação deles.
DEFINIÇÃO
Dificilmente é preciso afirmar que os sons diminuem de volume quanto mais nos
afastamos da fonte do som. Aqui podemos ser um pouco mais precisos e indicar que a
intensidade (veja acima) diminui com a distância a uma taxa tal que, para
cada duplicação da distância, a intensidade (I) é dividida em quatro.
Para ajudar a entender isso, imagine um balão parcialmente inflado com um quadrado
de 1 cm × 1 cm desenhado nele. Agora, se o tamanho do balão for dobrado, o quadrado
passa a ter 2 cm × 2 cm – os lados dobram, mas a área aumenta quatro vezes. A
intensidade (potência por unidade de área) de uma onda sonora atingindo o quadrado é,
portanto, um quarto do que era inicialmente. (Existem cláusulas importantes sobre essa
lei, às quais trataremos em breve.) Essa relação entre intensidade e distância é expressa
por
onde d é a distância da fonte. Por exemplo, suponha que a uma distância de 1 m de uma
fonte sonora a intensidade I seja de 4 W/m 2 . A 2 m a intensidade será de 1 W/m 2 e a 8
m será um décimo sexto de W/m 2 , e assim por diante. Essa relação é conhecida como Lei
do Quadrado Inverso.
decibéis
O decibel (dB para abreviar) é uma unidade muito útil, mas infelizmente pode causar
confusão e pavor até que seja completamente compreendido. Por essa razão, vamos nos
limitar aqui a não mais sobre o dB do que o absolutamente necessário, mas mais sobre
isso é dado na Parte 2 do capítulo.
Este é o mais breve dos resumos sobre decibéis, mas eles ocorrerão muitas vezes ao
longo deste livro. No entanto, a exposição gradual e contínua a eles os tornará cada vez
mais significativos para o leitor. Provavelmente sem muito esforço também.
DEFINIÇÃO
Ondas sonoras
Parte 2
Isso varia ligeiramente com a temperatura do ar, mas não, como geralmente se supõe,
com a pressão do ar, pelo menos não em todas as faixas de temperatura e pressão
normalmente encontradas.
A 0°C, a velocidade das ondas sonoras no ar pode ser considerada como 331 m/s, e
isso aumenta em 0,6 m/s para cada aumento de 1°C na temperatura.
Por isso:
Tabela 1.1
Água 1480
Vidro 5200
Aço 5000–5900
Madeira 3000–4000
dependendo da madeira
Unidades
1. A barra. Esta é outra unidade de pressão, mas é mais comumente usada em meteorologia,
pois é aproximadamente igual à pressão atmosférica normal. Está relacionado com o
pascal por:
ou 10 μbar = 1 Pa
2. Ao lidar com pressões de ondas sonoras, é claro que devemos lembrar que as pressões
são alternadas. Deve-se então usar o conceito de uma pressão constante que é equivalente
à pressão alternada. Um problema semelhante ocorre na rede elétrica CA (corrente
alternada), que no Reino Unido é cotada como tendo uma tensão de 230 V. Na verdade,
a tensão da rede passa por um ciclo de no máximo cerca de 340 V, caindo para zero e
atingindo então um máximo de 340 V na direção oposta. Ele então volta a zero e repete a
operação, levando um quinquagésimo de segundo para cada ciclo (daí a frequência de 50
Hz). Essa flutuação pode ser considerada equivalente em potência a uma CC (corrente
contínua) de 230 V. Os engenheiros usam o termo raiz quadrada média (rms)para este
equivalente. As pressões em Pa das ondas sonoras são equivalentes da mesma forma.
16 Hz 21h25
20 Hz 17,0
50 Hz 6.8
100 Hz 3.4
500 Hz 0,68
1 kHz 0,34 *
decibéis
o aumento dB é de 10 log(100/50)
= 10 registros(2)
= 3,010 ou aproximadamente 3 dB
Será lembrado na Parte 1 do capítulo que esse aumento de 3 dB é quase detectável! Para
obter o dobro do volume do alto-falante, assumindo que ele suportará o aumento de
potência sem ser danificado, a potência deve ser aumentada em 10 dB. Isso significa que
o amplificador de 50 W terá que ser substituído por um de 500 W:
dB = 10 log(500/50)
= 10 registros(10)
= 10 × 1
Questões
Tente respondê-las da forma mais honesta possível. Você pode trapacear olhando as
respostas primeiro, mas isso não ajuda muito. As respostas são dadas no final do livro.
a. 160–1600 Hz b. 16–1600 Hz
O mecanismo pelo qual as ondas sonoras são convertidas em percepção pelo cérebro é
extremamente complicado e partes dele ainda não são totalmente compreendidas. Este
livro não é o lugar nem mesmo para um relato limitado do assunto. É, no entanto, um
tema fascinante e o leitor que quiser saber mais deve consultar a lista de livros para leitura
complementar no final. Existem, no entanto, vários aspectos do processo auditivo que são
importantes no contexto da tecnologia de áudio e estes serão descritos aqui.
A resposta do ouvido
Para começar, estamos lidando com uma faixa de frequência de cerca de 16 Hz a cerca
de 16 kHz. Esses números não são precisos. Na extremidade inferior, não é fácil dizer
quando o som deixa de ter um tom identificável e começa a se tornar uma espécie de
vibração. Valores de 16–20 Hz são citados por diferentes autoridades. A extremidade
superior depende do indivíduo e também da idade da pessoa. Vinte kilohertz podem ser
detectados por uma pessoa no final da adolescência; algumas pessoas de 60 anos podem
ter dificuldade em ouvir qualquer coisa acima de 8 ou 10 kHz. Os efeitos da exposição a
ruídos altos também podem ter um efeito muito significativo. Dezesseis quilohertz é, no
entanto, um número bastante bom para citar como o limite superior de audição para o
adulto médio.
A curva sólida na Figura 2.1 é chamada de Limiar da Audição. Ele mostra a pressão
sonora mínima necessária apenas para criar uma sensação no ouvido. Aliás, é uma
curiosidade do ouvido que em níveis mais altos a curva de resposta é bem mais achatada.
Figura 2.1 A resposta do ouvido a sons de baixo nível
Sonoridade. O dB(A)
Sugerimos no Capítulo 1 que o decibel pode ser a base de uma unidade de medida,
mas uma medição direta da pressão sonora em decibéis obviamente não é boa o suficiente,
pois não levaria em consideração a resposta de frequência desigual do ouvido normal. Se,
no entanto, o dispositivo de medição incorporar um circuito de correção elétrica que lhe
dê uma resposta de frequência semelhante à do ouvido, podem ser feitas aproximações
razoáveis ao volume.
Tal circuito foi concebido há muitos anos e está incorporado em dispositivos
chamados medidores de nível de som. Estes têm um microfone, amplificador, medidor e
os circuitos apropriados para corresponder aproximadamente às características do
ouvido. Tais medições são cotadas com a unidade dB(A), significando decibéis com o
circuito 'A' incorporado. Eles são frequentemente denominados medições ponderadas
. (As características B e C também foram concebidas, mas descobriu-se que o circuito A
mais se aproxima das avaliações subjetivas de sonoridade.) A Tabela 2.1 lista alguns sons
típicos com suas 'intensidades' em dB(A).
Pode ser importante notar que os regulamentos de ruído atuais no Reino Unido exigem
que os protetores auriculares sejam disponibilizados em um local de trabalho industrial
onde os níveis de ruído atinjam 85 dB(A). Acima de 90 dB(A) seu uso é obrigatório e
também os níveis de ruído do maquinário devem ser reduzidos, se possível.
DEFINIÇÃO
Tom musical
Com isso, queremos dizer a posição de uma nota na escala musical. O tom pode ser um
assunto muito complicado – como tantas outras coisas no som! Deve ser o suficiente
aqui para dar os contornos de alguns fatos básicos:
1. O tom está basicamente relacionado à frequência, mas o tom percebido de uma nota pode
ser afetado pelo volume.
2. O padrão de afinação é considerado um som com frequência de 440 Hz. Isso é conhecido
como 'Internacional A'. É a nota soprada, geralmente por um oboé, como um sinal de
afinação antes de uma apresentação orquestral. (Os oboés têm uma nota estável e também
um som muito penetrante que pode ser ouvido com razoável clareza pelos outros
membros da orquestra.)
3. Apesar do que foi dito em 1 acima é possível fazer uma tabela relacionando altura e
frequência. A nota designada C é aquela chamada 'Middle C' em um instrumento de
teclado. A Tabela 2.2 lista as frequências para diferentes notas de altura.
Fonte dB(A)
Orquestra, média a 5 m 80
TV doméstica, a 3 m 70
Fala a 1 m 60–65
5. Semitons adjacentes (por exemplo, de uma nota em um teclado para a adjacente acima ou
abaixo, o que pode significar ir de uma nota branca para uma preta, ou vice-versa) têm
frequências na proporção de cerca de 1,06:1. Em outras palavras, há uma diferença de
frequência de 6%. Uma nota elevada por um semitom é indicada pelo sinal de 'sustenido'
#. Uma nota abaixada em um semitom é marcada como ' '.
Por timbre (pronuncia -se 'tarmbre'), entendemos os fatores que permitem ao ouvido
distinguir um instrumento de outro. Um trompete e um saxofone produzem sons
claramente diferentes, mesmo que toquem a mesma nota de altura.
1. Harmônicos. Estes são tons com frequências que são múltiplos exatos da frequência base
(chamada de fundamental). Um instrumento tocando a nota a = 220 Hz provavelmente
produzirá não apenas 220 Hz, mas também muitos múltiplos dessa frequência, como 440,
660, 880, 1100, 1320 e assim por diante. Geralmente, os vários harmônicos diminuem em
amplitude à medida que aumentam em frequência. Os músicos geralmente se referem aos
harmônicos como harmônicos , mas o primeiro harmônico é o segundo harmônico e
assim por diante.
2. Transientes iniciais. Por um breve período no início de uma nota – e isso pode ser tão
pouco quanto um centésimo de segundo, e raramente mais do que cerca de um quinto de
um segundo – existem frequências adicionais presentes que não são numericamente
relacionadas com a fundamental como o harmônicos são. Essas frequências desaparecem
rapidamente, daí o nome 'transitório'. Eles dependem, possivelmente entre outras coisas,
da maneira e da taxa em que as vibrações se acumulam em um instrumento. Eles são uma
espécie de impressão digital.
DEFINIÇÕES
Por alguma razão, o ouvido e o cérebro atribuem grande importância aos transientes
iniciais. Se forem removidos ou distorcidos, é possível que a qualidade percebida do som
instrumental seja radicalmente alterada, mesmo que apenas uma fração de segundo tenha
sido alterada no início de uma nota que dura vários segundos. Por exemplo, pode ser
quase impossível dizer a diferença entre o som de uma flauta e um trompete, tocando a
mesma nota constante, se os primeiros segundos dos sons forem suprimidos de alguma
forma.
A 440
G# 415
G 392
F# 370
F 349
D# 330
D 294
C# 277
C 262 *
b 247
a# 233
a 220
C médio = 262 Hz
São bem conhecidas as ilusões de ótica, nas quais o cérebro sobrepõe sua própria
interpretação ao que os olhos recebem como luz. As pessoas envolvidas com o som
precisam estar cientes de que existem equivalentes auditivos.
1. Para começar, é importante perceber que a memória realmente precisa do cérebro para sons
é muito curta – cerca de 1 a 2 segundos. Parapor exemplo, se dois alto-falantes de boa
qualidade, mas ligeiramente diferentes, devem ser comparados, isso deve ser feito
alternando diretamente de um para o outro – um processo às vezes conhecido como 'fazer
comparações A–B'. É impossível fazer julgamentos confiáveis ouvindo um e depois o
outro com um dia de intervalo! As comparações entre um alto-falante bom e um medíocre
podem ser feitas com um intervalo de tempo, mas aqui estamos falando de comparações
precisas entre dispositivos de qualidade semelhante. Este é um tópico tão importante que
voltaremos a ele mais tarde.
2. É muito fácil para o sistema ouvido/cérebro ouvir o que ele acha que deveria ouvir! A
maioria dos operadores de som profissionais conhece casos em que ajustaram um controle
em um equipamento e ficaram bem satisfeitos com o resultado, apenas para descobrir
mais tarde que o controle havia sido desligado do circuito e, portanto, não estava fazendo
nada!
3. Às vezes, efeitos curiosos podem ocorrer em estéreo. Por exemplo, muitas pessoas que
ouvem gravações estéreo de aeronaves, nas quais a imagem do som da aeronave vai de
um alto-falante para o outro, descobrem que a imagem do som parece elevar-se acima do
nível dos alto-falantes e pode até parecer ser a sobrecarga. A explicação é claramente que
o cérebro associa o ruído da aeronave com a altura e então imagina um efeito de altura
mesmo quando as fontes sonoras reais estão ao nível do ouvido.
5. O item restante nesta lista curta é conhecido como Efeito Haas. Dito brevemente, se sons
semelhantes chegam aos ouvidos de um ouvinte, então os sons que chegam primeiro
determinam a direção aparente da fonte sonora, mesmo que o som que chega mais tarde
possa ter um nível de até 10 dB mais alto. O leitor pode verificar isso alimentando um par
de alto-falantes estéreo com uma fonte mono e, em seguida, movendo-se em direção a
um dos alto-falantes para que o som dele chegue primeiro aos ouvidos. Isso fará com que
a imagem do som mono se mova para aquele alto-falante. É improvável que o ajuste do
controle de equilíbrio para aumentar o nível no outro alto-falante mude a imagem até que
haja uma diferença de volume muito apreciável entre eles.
Uma comparação precisa de dois dispositivos de áudio semelhantes (como dois alto-
falantes) só pode ser feita alternando rapidamente de um para o outro. Isso é chamado
de 'comparação A–B '.
Tom
Dissemos anteriormente que a relação de frequência entre dois semitons adjacentes era
de aproximadamente 6%. Em termos científicos (mas não necessariamente musicais), o
número exato é
Este é o número que, multiplicado por si mesmo 12 vezes, é igual a 2 e é 1,0594631. Uma
mudança de tom de um semitom é, portanto, equivalente a uma mudança de frequência
de 5,94631%. (Seis por cento é uma aproximação boa o suficiente para a maioria dos
propósitos!)
O leitor interessado com uma calculadora científica pode tentar inserir 1,0594631 na
memória da calculadora e, em seguida, usar Memory Recall 12 vezes da seguinte maneira:
RM × 1,0594631 = 1,122462
Este é o nome dado a um efeito interessante pelo qual o sistema ouvido/cérebro pode, de
alguma forma, parecer inserir frequências muito baixas que deveriam estar presentes, mas
que não são reproduzidas. Pode ser que o cérebro reconheça uma série de harmônicos
como baseados em uma frequência específica e compense mentalmente essa frequência
se ela não estiver presente.
Para dar um exemplo, a Tabela 2.3 mostra que as notas mais baixas de um grande
órgão de tubos podem chegar a 15 Hz. Existem muito poucos alto-falantes que podem
reproduzir frequências tão baixas e, no entanto, nossos ouvidos geralmente não percebem
essa deficiência.
de para
Fagote 60 600
Violoncelo 70 600
Piano 30 4000
Questões
1. Decibéis podem ser apropriados para comparação em dois dos seguintes. Que dois?
2. Uma nota tem uma frequência de 200 Hz. Qual é a frequência da nota uma oitava acima?
a. 10 Hz b. 50 Hz c. 100 Hz d. 188 Hz
7 estéreo
Parte 1
A palavra 'estéreo' vem de uma palavra grega que significa 'sólido'. 'Visão estereoscópica'
significa perceber as coisas como sólidas quando vistas com os dois olhos. Embora o
termo '3D' tenha se tornado o padrão (mais fácil de soletrar!), 'estereoscopia' ainda é
basicamente correto. A partir daí, foi apenas um pequeno passo para estender a parte
'estéreo' ao som e, portanto, temos 'estereofonia', ou 'estéreo' para abreviar.
Para começar, precisamos considerar como localizamos os sons na vida real. Vários
fatores entram nisso, incluindo pistas visuais. À primeira vista, pode-se pensar que as
intensidades relativas do som nos dois ouvidos seriam o principal ingrediente na
localização do som, mas embora isso possa ter significado em algumas condições, o fator
mais importante acaba sendo a diferença de tempo de chegada em as duas orelhas.
Se uma fonte de som está diretamente na frente de uma pessoa, então claramente não
há diferença no tempo que os sons dessa fonte levam para chegar aos ouvidos. No caso
de um som vindo de qualquer direção, exceto dofrente, então haverá uma diferença de
hora de chegada. (Não vamos nos preocupar aqui com sons que se originam acima ou
abaixo do nível dos ouvidos). é aproximadamente 1 ms (1 milissegundo = 1/1000
segundo). O que é bastante interessante é que, em condições de escuta razoavelmente
boas, a maioria das pessoas pode detectar quando uma fonte de som se moveu cerca de
1° a partir do eixo frontal, e isso representa uma diferença de tempo de chegada nos
ouvidos de aproximadamente 10 μs – dez milionésimos ou centésimo milésimo de
segundo! Como o cérebro faz isso não está claro.
Diferença de tempo de chegada – Em geral, o som de uma determinada fonte chegará aos
ouvidos de uma pessoa em momentos ligeiramente diferentes. Isso é importante para
detectar a direção aparente da fonte.
(A questão de como localizamos os sons que estão acima ou atrás da cabeça ainda é
um pouco obscura. Os movimentos da cabeça ajudam a localizar a origem de um som.
para cada movimento da cabeça, o cérebro pode realizar cálculos que permitem ao ouvinte
diminuir a incerteza. Além disso, há evidências de que as dobras no ouvido externo - a
parte visível - podem criar reflexões múltiplas em altas frequências e o padrão dessas
reflexões vai depender do ângulo de incidência do som.)
Segue-se que, para recriar a informação direcional para um ouvinte, pelo menos em
uma área frontal, precisamos criar diferenças de tempo de chegada nos ouvidos da pessoa.
Agora acontece que se os sinais elétricos nos dois canais – os caminhos esquerdo e
direito dos microfones aos alto-falantes – diferem um do outro apenas em
amplitude, então uma dispersão razoável de imagens sonorasentre os alto-falantes pode
ser esperado. A explicação para isso está além do escopo deste livro, mas há explicações
legíveis em alguns dos livros listados no final. No momento, vamos simplesmente afirmar
que, para a audição de alto-falantes, é necessário que haja diferenças de amplitude entre
os dois canais – diferenças entre canais – e, paradoxalmente, nenhuma diferença de
tempo entre os sinais neles contidos.
Figura 7.1 Um par coincidente de microfones cardióides
Um som que sai do eixo central dos microfones, digamos de X no diagrama, resultará
em uma saída maior do microfone da direita do que da esquerda e isso nos dá a necessária
diferença entre canais.
Figura 7.2 Um panpot
2. Métodos puramente elétricos. A Figura 7.2 mostra de forma simplificada o que é chamado
de panpot (de 'potenciômetro panorâmico'). Um potenciômetro é uma resistência elétrica
variável com três terminais. Dois estão nas extremidades de uma pista resistiva, enquanto
o terceiro está conectado a um controle deslizante cuja posição ao longo da pista pode ser
alterada por meio de um botão.
Par coincidente – Dois microfones direcionais com seus diafragmas montados o mais
próximo possível.
Terminologia
Audição estéreo
Já sugerimos que o ouvinte deve estar na linha central entre os dois alto-falantes e que
estes devem ser um par 'combinado'. E não só devem ser combinados em termos de
qualidade, mas devem ser 'balanceados' de modo que, se alimentados com exatamente o
mesmo sinal (ou seja, mono), a imagem sonora resultante seja verdadeiramente
central. (Como verificar a correspondência é explicado abaixo, assim como as formas de
obter um sinal mono.)
Se o equilíbrio estiver incorreto, é uma questão de corrigir isso ajustando os controles
de ganho (volume) nos amplificadores que alimentam os alto-falantes ou ajustando
o controle de equilíbrio, se houver um, como geralmente ocorre em equipamentos de alta
fidelidade domésticos decentes .
A sala de audição ideal será acusticamente simétrica entre esquerda e direita. Por
exemplo, é indesejável ter uma parede nua de um lado e uma janela com cortinas pesadas
do outro lado. Se o ouvinte não estiver muito longe dos alto-falantes, alguma falta de
simetria pode não ser muito grave, pois o som direto dos alto-falantes será muito mais
forte nos ouvidos do que o som refletido nas paredes. No entanto, quanto mais atrás o
ouvinte estiver, maior será a influência dos sons refletidos. Poucas salas podem ser
verdadeiramente simétricas, de modo que há um limite para a distância dos alto-falantes
em que um bom estéreo é ouvido.
Uma posição de audição notavelmente insatisfatória está mais próxima do que o ápice
do triângulo equilátero, pois as imagens podem se tornar um tanto irreais. Pode ser um
pouco como ouvir fones de ouvido estéreo.
Parte do que foi escrito acima pode facilmente parecer muito preocupante para a pessoa
comum que simplesmente gosta de ouvir estéreo razoável. A tal pessoa diríamos
simplesmente: 'Não se preocupe!' Não reorganize sua sala de estar para torná-la
acusticamente simétrica; não preencha uma janela ou cortina uma parede oposta. Se você
gostou da sua música até agora, continue a apreciá-la. (No entanto, em um ambiente
profissional, terá que haver mais cuidado ao projetar as áreas de escuta.)
Pode ser, é claro, que imagens peculiares tenham sido um problema e há dicas aqui
que podem ajudar. É mais ou menos como os casos em minha própria experiência, quando
as respostas dos alto-falantes eram medidas por pessoas com alto-falantes dos quais elas
tinham muito orgulho. Os gráficos quase inevitavelmente desiguais causaram grande
sofrimento – realmente desnecessariamente. Esses eram casos de um pouco de
conhecimento sendo, não perigoso, mas perturbador – ou talvez alguém pudesse dizer
que a leve ignorância era uma bênção!
Isso significa garantir que a qualidade de saída dos dois alto-falantes seja a mais próxima
possível. A melhor maneira de verificar isso é alimentar ambos os alto-falantes com
música mono que contenha uma ampla gama de frequências.
Estágio
Quão óbvia é uma condição fora de fase pode depender muito do tipo de material do
programa. Com imagens estéreo amplas e pouco som central, um sinal fora de fase pode
não ser tão óbvio. Será mais aparente com imagens monocromáticas ou centrais. Esta,
então, é a maneira de verificar as conexões fora de fase. Reproduza um sinal mono central
(e aqui um boletim de notícias simples será bastante adequado) e verifique se há uma
imagem central clara. Se houver alguma dúvida, a fiação de um dos canais deve ser
trocada e, provavelmente, a maneira mais fácil de fazer isso será nos terminais de um dos
alto-falantes. Se o sistema estiver fora de fase e a fiação dos alto-falantes estiver
obviamente correta, será necessário verificar o restante do sistema.
Questões
1. Qual é a diferença aproximada do tempo de chegada nos dois ouvidos de uma pessoa
quando uma fonte de som está a 90° da frente?
a. 10 μs b. 0,01ms c. 0,1ms d. 1ms
d. Alto-falantes incompatíveis
3. Um panpot é ajustado com seu controle totalmente no sentido horário. Onde é provável
que a imagem dele esteja na imagem estéreo final?
4. O que deveria ser uma imagem central clara em uma cena estéreo é difícil de localizar
ouvindo. Qual é a causa provável?
7 estéreo
Parte 2
As desvantagens são:
1. A complexidade técnica pode ser considerável e, paradoxalmente, por vezes pode dificultar
a obtenção de bons resultados. Há também mais para dar errado!
2. É possível que os microfones formem pares estéreo indesejados. Isso significa que, além
das imagens panpotted, pode haver imagens adicionais espúrias causadas por mais de um
microfone captando o mesmo som. Na prática, é improvável que isso signifique que
haverá várias imagens; em vez disso, as imagens panorâmicas serão deslocadas de suas
posições pretendidas. Como um risco adicional, mover um fader para alterar a saída de
qualquer microfone pode resultar no movimento de algumas das imagens deslocadas. A
única maneira de evitar esse efeito é ter todos os instrumentos, seções da banda ou o que
quer que seja 'microfonado de perto', ou seja, ter omicrofones o mais próximo possível de
suas respectivas fontes. Às vezes, isso pode ser difícil, especialmente porque nem sempre
é fácil manter o som característico de um instrumento com microfones posicionados
próximos.
Em suma, é justo dizer que as técnicas de multi-microfone geralmente não são tentadas a
menos que haja muitos microfones disponíveis e o equipamento de mixagem seja
adequadamente abrangente.
Hipercardióides 135°
Cardióides 180°
Observe que estamos assumindo que os microfones estão a 90° um do outro. Isso é
bastante normal, e é improvável que uma diferença de alguns graus em ambos os lados
de 90° tenha qualquer efeito significativo, embora o ângulo possa ser aumentado
consideravelmente com cardióides, resultando em uma imagem estéreo mais ampla.
Talvez a grande questão agora seja: qual sistema de diagrama polar usar
quando? Muitas vezes, é claro, há pouca escolha. Normalmente, os únicos microfones
disponíveis são um par de cardióides (como, por exemplo, nos microfones estéreo
integrados da maioria das filmadoras). No entanto, o posicionamento de um par de
microfones coincidentes, seja qual for o padrão polar, é em grande parte uma questão de
geometria.
Vamos supor que temos dois cardióides – e repetimos que eles devem ser o mais
parecidos possível, mesmo fabricante, mesmo número de tipo e assim por diante. A
Figura 7.6 mostra os prováveis spreads de imagem para duas posições para tal par de
microfones. Em (a), os microfones estariam próximos à frente da fonte sonora (banda,
coro, orquestra, etc.). Em (b), os microfones estão mais para trás de forma que os eixos
dos cardióides estejam apontando aproximadamente para as bordas da fonte. Lembre-se
que o ângulo de aceitação para um par de cardióides é de cerca de 180°. Em (a), a
propagação das imagens sonoras preencherá quase completamente a região entre os alto-
falantes;em (b), apenas uma parte da região será preenchida. Observe que o estado de
coisas na Figura 7.6 (b) não é necessariamente errado. Um piano solo geralmente soará
um pouco bobo se parecer ter toda a largura entre os alto-falantes! Da mesma forma, um
quarteto de cordas clássico deve normalmente preencher apenas parte do quadro.
Com uma banda de rock é difícil dizer qual deve ser a imagem reproduzida, pois
muitas vezes não há tentativa de reproduzir a realidade do som original.
Em segundo lugar, há uma região de captação traseira de 90°, o que pode ou não ser
bom. Por exemplo, pode ser útil se for necessária muita reverberação; por outro lado,
pode haver ruídos indesejados vindos de trás – uma plateia tossindo, por exemplo! Um
ponto final e às vezes muito importante é que os quadrantes laterais são regiões fora de
fase e isso significa que os sons vindos dessas direções podem ser difíceis de localizar
pelo ouvinte. Os lados, portanto, devem ser considerados como 'zonas proibidas', embora
a reverberação que chega dos lados não sofra nenhum efeito peculiar porque é, por sua
natureza, tão difusa que a fase não tem significado real. Isso é ilustrado na Figura 7.7 .
2. Se a acústica da sala ou outra área de gravação for ruim, por exemplo, com reverberação
excessiva ou ruído externo, microfones mais próximos, como cardióides, podem ajudar.
Pode valer a pena mencionar que, dada uma boa banda, orquestra ou coro em acústica
favorável, um par de microfones em oito pode, na opinião de muitos balanceadores de
som experientes, dar a reprodução mais natural. É também o arranjo mais simples
tecnicamente falando.
Não foi mencionado um par de hipercardióides, mas o leitor poderá rapidamente
adaptar o que foi dito sobre cardióides e oito para hipercardióides, lembrando que eles
podem ser considerados a meio caminho entre os outros dois.
Por fim, ao planejar uma gravação estéreo, vale a pena estudar a situação com
antecedência para ter uma ideia de quais microfones usar e onde colocá-los. Então, e isso
é o mais importante, um ensaio deve ser usado para testar o mais minuciosamente possível
se as posições ideais do microfone foram alcançadas. Isso significa ouvir criticamente, de
preferência em alto-falantes. Se isso não puder ser feito no local de gravação, significa
fazer uma gravação e reproduzi-la nas melhores condições de audição possíveis.
Muitas vezes, tudo isso é mais fácil dizer do que fazer, especialmente porque há
complicações como o fato de que a presença de uma platéia quase certamente modificará
a acústica, e os músicos tocarão mais alto e melhor quando houver alguém para tocar! No
entanto, com a experiência, é possível fazer algumas concessões para essas coisas.
Questões
Com um par estéreo coincidente de microfones em ângulo de 90° entre si, quais são os
'ângulos de aceitação' efetivos para o seguinte?
1. Cardióides
2. Hipercardióides
3. Figura de oito
4. Omnis
5. Com qual arranjo de par coincidente é provável que haja uma região fora de fase
significativa nas laterais?
10 Áudio digital
Parte 1
Na edição anterior deste livro, publicada em 1997 – não muitos anos atrás – sugeri que o
equipamento digital naquela época provavelmente seria muito caro para o leitor amador
e semi-profissional! As coisas mudam. Gravadores digitais de boa qualidade e
dispositivos associados são agora muito acessíveis.
Histórico
A forma mais moderna, conhecida como NICAM, permite que o som estéreo seja
transmitido como parte do sinal de televisão. O NICAM também será explicado mais
detalhadamente na Parte 2 .
Então, no início dos anos 1970, a rádio BBC, enfrentando o problema de enviar
estéreo de alta qualidade para seus transmissores, adotou o áudio digital. Isso não apenas
permitiu que os programas de rádio fossem enviados por todo o Reino Unido quase sem
deterioração da qualidade, mas também financeiramente muito econômico. O uso dos
princípios do áudio digital, mas com padrões um pouco melhorados, apareceu com o disco
compacto – o CD – por volta de 1980, e outros sistemas digitais surgiram desde então.
Princípios básicos
Nos sistemas analógicos, onde o sinal elétrico é uma réplica, ou deveria ser, das ondas
sonoras originais, existe um problema fundamental: qualquerdeficiência causada por
qualquer motivo é praticamente impossível de corrigir. Tais deficiências podem ser o
resultado de interferência captada durante uma transmissão de rádio, efeitos de sujeira e
poeira em uma ranhura de gravação e imperfeições no meio de gravação (manchas nuas
ou finas no óxido magnético da fita, por exemplo).
Qual é o processo de codificação com áudio digital? Aqui está uma história
ligeiramente simplificada.
Amostragem
quantizando
Em seguida, cada amostra deve ser medida. Isso é conhecido como quantização.
A Figura 10.2 ilustra um arranjo de quantização muito básico. Ele mostra seis níveis
de quantização – e pense neles como graduações em uma régua que mede a amplitude de
cada amostra. O sistema não nos permite usar frações de divisão, então as medições do
sinal vão, neste caso, ser bastante grosseiras.
Quanto mais precisa for essa medição de amplitude, melhor será a qualidade do
resultado final. Para uma precisão real, é necessário que haja um grande número de
graduações nesta régua. Cerca de 8.000 é o mínimo utilizável, mas não é suficiente para
gravações de alta qualidade (por exemplo, qualidade de CD), quando são necessárias
cerca de 65.000 graduações ou níveis de quantização!
Nesse ponto, o cérebro começa a ficar confuso com a magnitude das coisas – medindo
a música 44.000 vezes por segundo, cada medição sendo um número entre 0 e
65.000! Felizmente, a eletrônica moderna pode lidar com tudo isso com bastante
facilidade. No entanto, vamos fazer uma pausa para ver com o que estamos
comprometendo o sistema. Uma fita ou disco digital deve armazenar números que podem
ser de até 65.000 e fazer isso a uma taxa de pouco mais de 44.000 deles por segundo!
aritmética binária
Felizmente, as coisas começam a ficar um pouco mais simples quando procuramos tipos
alternativos de aritmética. O áudio digital usa aritmética binária. Com nossa aritmética
diária usual, contamos de 0 a 9 e, em seguida, colocamos um 1 na frente para ir de 10 a
19, depois um 2 e assim por diante. Na aritmética binária existem apenas dois dígitos, 1
e 0, em vez de dez, e a contagem é de 0 a 1, e então um 1 é colocado na frente para fazer
10. O próximo número tem um adicionado para fazer 11 (não chame-o de 'onze' – não é!)
e então um 1 adicional é colocado na frente para que tenhamos 100, 101 e assim por
diante. A Tabela 10.1 compara nossa aritmética decimal padrão com a binária. Se o leitor
não estiver familiarizado com a aritmética binária, deve-se tentar continuar a tabela.
Tabela 10.1
0 0 1
1 1 1
2 10 2
3 11 2
4 100 3
5 101 3
6 110 3
7 111 3
8 1000 4
9 1001 4
10 1010 4
1×0=0
1×1=1
Porém, vejamos onde isso nos leva – não devemos deixar que um estudo de aritmética
binária, por mais breve que seja, nos distraia do objetivo principal, que é o áudio digital.
Este é o tipo de código que queríamos. Pulsos individuais podem ser degradados, mas,
desde que ainda sejam apenas identificáveis, podem ser reconstruídos, se necessário.
Cada 1 ou 0 no áudio digital é chamado de bit, abreviação de dígito binário . A Figura
10.3 ilustra um número de 15 bits: há seis 1s e nove 0s. O número de bits dá uma
indicação da qualidade do sistema. CDs usam 16 bits. A comunicação por telefone pode
ser satisfatória com menos de dez.
Regeneração de pulsos
Pelo que dissemos, pode parecer que a restauração dos pulsos digitais pode continuar
indefinidamente. Isso não é bem verdade. Eventualmente, haverá pulsos que estão muito
longe de serem regenerados e, embora a maioria dos sistemas digitais faça uso
de detecção e correção de erros – que descreveremos brevemente abaixo e explicaremos
um pouco mais detalhadamente na Parte 2 –, no final, haverá uma degradação
perceptível. No entanto, os dígitos fornecem uma maneira muito mais confiável e robusta
de lidar com qualquer tipo de sinal do que o analógico é capaz. Vale a pena mencionar
que grande parte do sistema telefônico do Reino Unido usa sinais digitais para
distribuição – para melhorar a qualidade e também para economia.
Figura 10.4 Regeneração de (a) sinais analógicos, (b) pulsos em um sistema digital
taxa de bits
Com 16 bits para cada amostra e cerca de 44.000 amostras por segundo, temos
Agora, a fita analógica comum grava até 20 kHz e, embora não seja correto dizer que
a frequência em hertz é precisamente a mesma que em bits por segundo, a discrepância
entre 20 kHz e 4 MHz é claramente enorme. A gravação em fita convencional
simplesmente não consegue lidar com o áudio digital. Trataremos da fita digital no
próximo capítulo, mas é suficiente, por enquanto, mostrar que um preço deve ser pago
pela qualidade potencialmente alta que o áudio digital pode oferecer.
Tabela 10.2
Detecção de erro
Já mencionamos que, com sistemas analógicos, não há uma maneira realmente eficaz de
detectar erros de qualquer tipo.
É um pouco diferente com os dígitos. Um método simples, mas com certas limitações,
muito eficaz e amplamente utilizado é conhecido como paridade. O que acontece é
isso. Antes de gravar ou transmitir uma amostra, o número de 1s nela é contado e, se
necessário, compensado para ser um número par. Um bit de paridade é adicionado, um 0
se já houver um número par de uns, um 1 se houver um número ímpar de 1s. Assim, cada
amostra gravada ou transmitida contém um número par de 1s.
Suponha que ocorra um erro de modo que um 1 seja destruído ou um 1 espúrio apareça
onde deveria haver um 0. Haverá agora um número ímpar de 1s. Portanto, no replay ou
no final do recebimento, quando os 1s são contados e um número ímpar é encontrado em
uma amostra, o sistema sabe que ocorreu um erro e podem ser tomadas medidas para
reduzir o efeito. Uma dessas etapas é repetir a amostra anterior e, como elas têm apenas
1/44.000 de segundo de diferença, é provável que o engano não seja percebido. A Tabela
10.2 pode ajudar a esclarecer o cálculo da paridade. Para simplificar, ele usa um sistema
de 10 bits.
Claro, isso aumenta o número de bits/segundo, mas apenas em uma pequena
proporção.
atraso digital
3. Para auxiliar no 'rastreamento duplo automático' (ADT), onde um único vocalista aparece
para cantar um dueto. Um pequeno atraso de alguns milissegundos, de preferência com
um elemento de mudança de tom (veja abaixo), pode ser muito eficaz.
5. Para habilitar o que é chamado de 'atraso de palavrões' em alguns programas de rádio por
telefone. Tudo passa por um atraso de talvez cerca de 15 segundos. Se o chamador usar
linguagem inaceitável, o apresentador do programa pressiona um botão que exclui o
conteúdo da loja, incluindo as palavras indesejadas. A eletrônica inteligente aumenta
gradualmente o atraso, de modo que o fato de que algum material foi removido é quase
imperceptível. No entanto, requer um apresentador muito capaz e de raciocínio rápido.
reverberação artificial
'Eco', como muitas vezes é chamado de forma imprecisa, já foi criado por alto-falantes e
microfones em salas reverberantes; mais tarde, placas de aço especiais foram usadas e
podiam ser colocadas em vibração eletricamente para dar uma imitação muito aceitável
de reverberação. Ambos os métodos eram volumosos e caros.
Mais barato e mais compacto era o reverberador de mola, no qual uma ou mais molas
eram colocadas em vibração por um pequeno transdutor fixado à(s) mola(s) com um outro
transdutor para captar as reverberações. Unidades muito caras eram razoavelmente boas,
mas as baratas pareciam - bem - molas vibrantes!
O advento do áudio digital mudou tudo isso. Em um dispositivo de reverberação
digital, os dígitos de entrada são armazenados em chips de memória e, em seguida,
liberados de maneira cuidadosamente controlada, de modo que haja uma amplitude de
saída aleatória e constantemente decrescente.
Atraso
Uma maneira de criar melhor realismo com reverberação artificial é fazer uso de
atrasos. Isso pode ser feito com uma unidade de atraso como mencionado acima, mas
muitos dispositivos de reverberação digital têm atrasos variáveis embutidos. A razão para
ter um atraso é esta. A combinação ouvido/cérebro humano é muito boa para detectar
pequenos intervalos de tempo, como aqueles que ocorrem, digamos, em uma sala quando
os ouvidos recebem primeiro o som direto da fonte e depois a primeira reflexão, como é
chamada, vindo de uma parede, piso ou teto. Se o atraso entre o som direto e a primeira
reflexão for maior do que cerca de 40 ms (=1/25 segundo), então a pessoa está ciente de
um intervalo de tempo. Essa é a definição adequada de 'eco' - quando alguém está ciente
de um intervalo de tempo entre dois sons.
Mudança de tom
Suponha, porém, que a chave de saída gire mais rápido que a de entrada. O efeito será
que o tom da saída analógica será mais alto que o tom da entrada. O leitor, sem dúvida,
se perguntará como isso pode ser um processo contínuo, porque mais cedo ou mais tarde
um interruptor alcançará ou será alcançado pelo outro! Na verdade não pode, mas com o
uso de tecnologia inteligente pode-se dar a impressão de que é contínuo. O leitor curioso
e intrigado é encaminhado para a seção 'Leitura adicional'.
MIDI
Isso significa Interface Digital de Instrumento Musical. Isso realmente se relaciona com
a música eletrônica, mas uma breve menção pode não ser inapropriada aqui.
Compressão de dados
Isso significa reduzir o número de bits em uma amostra de áudio sem uma redução séria
na qualidade. Graças a um desenvolvimento bastante recente do áudio digital, é possível
recorrer a truques muito inteligentes, mas legítimos, aproveitando as características do
ouvido humano.
Para começar, existem muitos 'sons' que não podemos ouvir: frequências na região de
30 Hz, a menos que sejam de nível alto, por exemplo. O ouvido normal é cerca de 70 dB
menos sensível a 30 Hz do que a cerca de 3 kHz e não é particularmente sensível às
frequências de áudio mais altas acima de cerca de 3 kHz. Além disso, certos sons podem
ser 'mascarados' por outros. Já se sabe há algum tempo que um som em um determinado
nível pode tornar o ouvido bastante insensível às frequências próximas (geralmente mais
altas) em um nível mais baixo.
Fazendo uso de circuitos que, por assim dizer, imitam essas características do ouvido
humano, é possível evitar a gravação dos sons indetectáveis. Existem vários
processos. Uma delas é conhecida como Precision Adaptive Subband Coding (PASC)
ou codificação perceptual, e permite descartar até cerca de 80% dos dados
originais. Outro método, usado pelos MiniDiscs (dos quais mais tarde) é chamado
ATRAC, que significa Adaptive Transform Acoustic Coding. O MP3 também usa
compactação de dados inteligente.
Terminologia adicional
1. ADC: conversor analógico-digital. Este é o dispositivo (na forma de um chip) que amostra
o sinal analógico e fornece uma saída digital. O dispositivo complementar é o
2. DAC: conversor digital-analógico, que traduz um sinal digital de volta para analógico.
Questões
a. 5 b. 7 c. 9 d. 11
10 Áudio digital
Parte 2
Discos compactos
O componente vital em um CD player é o laser, e sem ele seria impossível fazer CDs ou
reproduzi-los. Então, o que é um laser? É claro que é uma fonte de luz, mas a luz que
emite é particularmente pura, pois consiste em apenas um comprimento de onda. A luz
comum, como se sabe, é composta por uma ampla gama de comprimentos de onda e isso
causa dificuldades quando a luz é focalizada com uma lente. Os vários comprimentos de
onda são tratados de forma ligeiramente diferente e isso pode ser visto nos efeitos de cor
quando se olha através de uma lupa comum. O efeito é particularmente perceptível perto
das bordas da lente. As lentes para câmeras de alta qualidade são projetadas para reduzir
essa aberração cromática,como é chamado, a níveis aceitáveis. O feixe de um laser,
porém, é tão puro que pode ser focalizado com extrema precisão com uma lente bastante
simples.
Ao fazer um CD, o feixe de luz de um laser é modulado – isto é, feito para flutuar em
brilho – com o sinal de áudio digital a ser gravado e então focalizado no disco mestre em
rotação. Um material adequado na superfície do disco é gravado pelo feixe intenso,
produzindo um padrão de pontos correspondente ao sinal digital. Cópias precisas do
mestre podem ser feitas tomando moldes e, finalmente, extrudando o plástico nos
moldes. O processo não é diferente daquele usado para fazer discos de gramofone
tradicionais.
A razão para colocar a grade de difração é produzir feixes adicionais que terminam
nos sensores de luz do lado direito. Estes são usados para direcionar o feixe de laser sobre
a superfície do disco. Uma tendência ao desvio é mostrada por um sinal aumentado em
um dos sensores de ponto lateral e um sistema mecânico retorna o laser ao alinhamento
correto. Como os pontos laterais fazem isso é mostrado na Figura 10.7 .
Para dar uma ideia da finura das faixas de um CD, elas têm cerca de 0,5 μm de largura
(0,5 milionésimo de metro) e os centros das faixas estão separados por 1,6 μm. Em termos
mais simples, existem cerca de 600 faixas por milímetro.
Para adicionar fatos e números sobre CDs, o tempo máximo de reprodução é de cerca
de 75 minutos. O tempo máximo de replay é sempre dado como 74 minutos, mas na
verdade pode ser um pouco mais do que isso. CDs com duração de 76 minutos não são
incomuns! O comprimento da pista é de aproximadamente 5,5 km, ou pouco menos de
3,5 milhas! O disco é feito para girar de modo que a velocidade de varredura do laser
seja constante. Isso significa que os dados são lidos a uma taxa constante. Para conseguir
isso, a velocidade de rotação deve variar de cerca de 500 rpm no interior a 200 rpm no
exterior. Colocamos as cifras nessa ordem porque o início é por dentro e o fim por fora –
ao contrário de um disco de vinil convencional.
Figura 10.7 Como os pontos laterais garantem o rastreamento correto
Correção de erros
Alguns métodos muito poderosos de detecção e correção de erros são incorporados aos
CD players. Estes são necessários porque é impossível garantir a perfeição na fabricação
de discos em bases comerciais. Basta segurar um CD, especialmente um produzido há
pelo menos alguns anos, em frente a uma lâmpada brilhante para ver muitos minúsculos
pontos de luz. Eles podem ser muito pequenos – talvez apenas um centésimo de milímetro
em alguns casos, mas mesmo isso representaria uma perda significativa de dados. (Pode
ser que a fabricação de CDs tenha melhorado. Tenho a impressão de que os CDs recentes
que comprei mostram menos pontos de luz do que os comprados há alguns anos. Pode
ser, é claro, que eu tenha sorte!)
Uma experiência que pode ser tentada é pegar uma caneta hidrográfica com
tinta lavável NÃO permanente e traçar uma linha radial ao longo do disco. Quandoa
tinta secou, reproduza o disco e se a linha for fina – menos de um milímetro – não deve
haver efeitos audíveis. Em seguida, torne a linha mais larga em etapas até que o jogador
silencie ou repita uma faixa. Por fim, limpe as linhas e o disco ficará tão bom quanto
antes! Eu demonstrei isso muitas vezes na frente do público – que geralmente fica muito
impressionado. Uma explicação resumida é dada na p. 150.
IMPORTANTE: nem o autor nem os editores podem aceitar qualquer responsabilidade
se o experimento der errado.
Devemos acrescentar que essa capacidade de corrigir os dados ausentes requer muito
mais bits do que os necessários apenas para o áudio. No momento em que todos os outros
dados, alguns para temporização, alguns para correção de erros e assim por diante, são
levados em consideração, a taxa de bits final é de pouco mais de quatro milhões por
segundo.
CDs de limpeza
Existem alguns dispositivos muito atraentes no mercado para a limpeza de CDs. A regra
1, porém, é não sujar o disco em primeiro lugar! Mantenha os dedos sujos – ou mesmo
limpos – fora da superfície (sem esquecer que a superfície importante é a não etiqueta, ou
parte inferior, do disco).
Há poucas evidências que sugiram que a qualidade do som de tocadores muito caros seja
melhor do que de tocadores muito mais baratos. É provável que haja mais recursos nos
caros, mas se eles são importantes depende do comprador. Nos primórdios dos CDs, a
correção de erros pode ter sido melhor nas máquinas caras, mas isso não parece mais ser
verdade. De maior importância é a forma como o sinal analógico extraído é tratado – a
qualidade dos amplificadores, alto-falantes, etc.
NICAM
Isso significa Multiplex de Áudio Companding Quase Instantâneo, a maioria dos quais
tentaremos explicar! A forma de NICAM usada para som estéreo para televisão é fruto
de duas tecnologias separadas. O primeiro, ao qual nos referimos brevemente
anteriormente, é um método de ocultar o sinal de som da televisão (originalmente mono)
com o sinal de imagem, de modo que apenas um caminho de sinal seja necessário dos
estúdios aos transmissores.
Figura 10.8 Um sinal de linha de televisão
A Figura 10.8 mostra uma voltagem típica de sinal de linha de televisão – quanto
maior a voltagem, mais brilhante a linha vai da esquerda para a direita na tela.
No final de cada linha, o receptor deve ser informado exatamente quando voltar para
a esquerda e iniciar uma nova linha – ele precisa de um sinal de sincronização. Isso
assume a forma do pulso de sincronismo de linha no diagrama, e o sinal de som da
televisão em formato digital é encaixado onde está o pulso de sincronismo de linha, daí o
termo som em sincronismo.
O sinal completo só é enviado desta forma até os transmissores. Antes de sair para os
receptores domésticos, o sinal digital é removido e convertido em um formato analógico
para transmissão e os pulsos de sincronização são restaurados, caso contrário, os
receptores teriam problemas para tentar sincronizar as linhas.
Stereo NICAM para televisão é um método muito engenhoso de pegar sinais de som
estéreo em formato digital, aplicando um processo de compressão para ter um número
gerenciável de bits e ajustando o resultado na forma de onda de vídeo como uma nova
forma de som em sincronia. Isso acontece até os transmissores. Lá, o sinal estéreo é
encaixado em uma seção do sinal de televisão transmitido e atinge os receptores
equipados com NICAM dessa forma. Para benefício dos receptores não NICAM, uma
versão mono analógica é produzida nos transmissores e transmitida da maneira normal.
Além de estéreo, a qualidade digital é muito melhor do que o som comum da televisão,
embora não tão boa quanto a qualidade do CD, apesar do que alguns anúncios afirmam.
O leitor que tentou, ou ficou tentado a tentar, o experimento com uma caneta hidrográfica
à base de água e fazer marcas em um CD pode ter se perguntado como as lacunas se
tornaram inaudíveis.
Agora suponha que houve uma grande perda de dados – talvez causada por uma
lacuna do tamanho de um orifício no disco, ou algum idiota desenhando linhas radiais
com uma caneta! Isso é mostrado pelo retângulo pontilhado e os blocos de dados D, H e
M são perdidos. No entanto, após a remontagem, esses blocos perdidos são bem dispersos
e, desde que não haja muita perda, várias verificações de paridade podem percorrer um
longo caminho para 'preencher' os dados ausentes.