Engenharia de som explicada

Engenharia de som explicada, 2ª edição
Por Michael Talbot-Smith
Escreva o primeira revisão
1 Ondas sonoras
Parte 1
Algum conhecimento inicial das ondas sonoras é essencial para que os capítulos
posteriores sejam totalmente significativos. A seguir, um breve resumo de suas
propriedades mais importantes. Fatos e números científicos são apresentados na Parte 2 ,
no final deste capítulo, para aqueles que possam achá-los úteis ou interessantes.
O que são ondas sonoras?
Eles são descritos como ondas de compressão e rarefação no ar. Isso significa que, quando
as ondas sonoras passam por um ponto fixo, a pressão atmosférica nesse ponto fica
ligeiramente acima e abaixo da pressão barométrica constante. Mas essas flutuações são
pequenas e rápidas demais para serem registradas por um barômetro. Um microfone, por
outro lado, pode ser pensado como uma espécie de barômetro elétrico extra-sensível
capaz de detectar essas rápidas flutuações na pressão do ar, ao contrário de um barômetro
normal, que só pode indicar mudanças de pressão relativamente lentas. A Figura
1.1 mostra como seria uma onda sonora se pudéssemos vê-la.
DEFINIÇÕES
1. Compressão – região onde o ar é comprimido. Nas ondas sonoras a compressão é

realmente muito pequena.
2. Rarefação – o oposto de uma compressão. A pressão do ar está ligeiramente abaixo do

normal.
3. ' Pressão barométrica estável ' – a pressão atmosférica normal do ar.
Há uma compressão onde as linhas estão mais próximas e uma rarefação onde estão
amplamente espaçadas. Ondas desse tipo são chamadas de ondas longitudinais. As ondas
que vemos na água, por exemplo, são chamadas de ondas transversais porque os pedaços
individuais (moléculas) da água se movem para cima e para baixo quando a onda é
horizontal. Nas ondas longitudinais, como o som, as moléculas de ar oscilam de um lado
para o outro.
Figura 1.1 Compressão e rarefações
Apesar de as ondas sonoras serem longitudinais, sempre as desenhamos como ondas

transversais – é muito mais fácil!
Frequência
Este é o número de ondas emitidas ou recebidas em um segundo. Até a década de 1950,

a frequência era expressa em países de língua inglesa como tantos ciclos por segundo
(cps ou c/s), mas isso foi substituído pelo hertz, para comemorar o nome do físico alemão
Heinrich Hertz (1857– 1894), que foi associado aos primeiros trabalhos em ondas de
rádio. A abreviação é 'Hz'. Esta unidade é comumente encontrada em casa em
equipamentos alimentados pela rede elétrica, onde a frequência especificada do
fornecimento na maior parte da Europa é de 50 Hz.
O ouvido humano normal pode detectar frequências de ondas sonoras na faixa de

aproximadamente 16 Hz a cerca de 16 kHz (kHz = quilohertz ou mil hertz – 16 kHz é
16.000 Hz). A resposta do ouvido ao som será tratada mais detalhadamente no Capítulo
2.
Relacionado à frequência está o período – a duração de um ciclo. É igual a 1/f.
Comprimento de onda
Com qualquer onda, a distância entre pontos correspondentes em ondas sucessivas é

denominada comprimento de onda. O símbolo usado para comprimento de onda é a letra
grega λ (pronuncia-se 'lambda'). A Figura 1.2 ilustra o comprimento de onda.
Amplitude
Esta é a 'altura' da onda em quaisquer unidades que sejam mais convenientes – no trabalho
elétrico, por exemplo, a amplitude pode ser expressa em volts ou ampères.
Figura 1.2 Comprimento de onda
A velocidade das ondas sonoras
No ar, em condições normais, as ondas sonoras viajam a cerca de 340 metros por segundo
(m/s). Isso é próximo a 760 milhas/hora, ou cerca de 1120 pés/segundo. A velocidade
varia um pouco com a temperatura do ar, por isso os instrumentistas de sopro precisam,
literalmente, aquecer seus instrumentos, pois a afinação depende da velocidade com que
as ondas sonoras oscilam dentro do instrumento. Para a maioria dos propósitos práticos,
além do exemplo que acabamos de citar, a variação na velocidade da onda sonora com a
temperatura não é importante. Os detalhes são fornecidos na Parte 2 deste capítulo. O
símbolo para a velocidade da onda sonora é, neste livro, v.
As ondas sonoras viajam no ar a cerca de 340 m/s, ou seja, v = 340 m/s.
Velocidade, frequência e comprimento de onda
Essas três coisas estão ligadas por uma fórmula importante, mas felizmente simples. Um
momento de reflexão mostrará que, se, digamos, 1.000 ondas por segundo estão sendo
emitidas de uma fonte (ou seja, a frequência é de 1 kHz) e cada uma tem um comprimento
de onda de λ, então, após um segundo, as primeiras ondas emitidas estarão a 1.000 × λ de
distância . Ou, sua velocidade é de 1000 × λ metros por segundo.
O que fizemos foi multiplicar a frequência pelo comprimento de onda para chegar à
velocidade:
Frequência × Comprimento de onda = Velocidade (ou f × λ = v)
IMPORTANTE
Frequência × Comprimento de onda = Velocidade (ou f × λ = v)
Escrevendo de outra forma:
Comprimento de onda = Velocidade/Frequência (ou λ = v/f)
Colocando 340 m/s como a velocidade e 1000 Hz como a frequência, temos
Comprimento de onda = 340/1000 metros
= 0,34 metros (ou 34 cm)
Deve ser bastante óbvio que, se a frequência for dobrada (para 2 kHz), o comprimento
de onda será reduzido pela metade (para 17 cm) e assim por diante. Cálculos simples
nesse sentido mostrarão que a frequência mais baixa que o ouvido normal pode detectar
– 16 Hz – corresponde a um comprimento de onda de cerca de 21 m (70 pés), enquanto
na frequência mais alta, em torno de 16 kHz, o comprimento de onda é de cerca de 2 cm,
ou melhor, menos de uma polegada.
Veremos nas próximas duas seções que essa vasta gama de comprimentos de onda
apresenta problemas em muitas situações de gravação de som, pois o grau em que as
ondas sonoras são refletidas ou contornadas por obstáculos depende criticamente do
comprimento de onda.
Ondas sonoras e obstáculos
Everyone is familiar with echoes – sounds being reflected from a large building or a cliff.
What is perhaps not so obvious is that for this reflection to occur to any significant effect
the sound wavelength must be smaller than the dimensions of the reflecting object. For
example, the side of a building might be 10 m high and 20 m long. Sounds striking this
building at right angles will be reflected if their wavelength is less than 10 m – that is, for
frequencies greater than about 30 Hz. The most predominant frequencies in the human
voice range from roughly 200 Hz to around 500 Hz, so a shout near to this building will
be easily reflected.
Por outro lado, se o objeto tiver dimensões menores que o comprimento de onda, não
haverá reflexão. Em vez disso, as ondas se curvam ao redor do objeto, um processo
chamado difração, do qual trataremos na próxima seção.
Se as ondas sonoras com um comprimento de onda curto atingem um objeto e são

refletidas, há o que é chamado de sombra sonora atrás do objeto. A Figura 1.3 mostra o
que acontece nos casos em que o comprimento de onda é maior (a) e menor (b) que o
obstáculo.
Não há divisão nítida entre reflexão e difração. Por exemplo, e tomando figuras
simples, suponha que temos um obstáculo que é uma placa rígida de um metro
quadrado. Um comprimento de onda de um metro corresponde a uma frequência de cerca
de 340 Hz. O que vai acontecer é que as ondas sonoras dessa frequência serão
parcialmente refletidas, com curvatura parcial ao redor da placa. Frequências em torno de
um terço de 340 Hz – cerca de 100 Hz – e o comprimento de onda de cerca de 3 m será
quase totalmente não refletido. Para um comprimento de onda de cerca de 30 cm, haverá
reflexão quase completa, sendo a frequência neste caso de cerca de 3 kHz. Uma
consequência de tudoé que em qualquer sala ou estúdio usado para gravação de som, o
efeito dos obstáculos pode ser muito difícil de prever, pois eles atuarão como refletores
para algumas frequências e não para outras. E neste contexto os obstáculos podem
significar estantes de partituras, pessoas, estojos de partituras e até os próprios
instrumentos!
A curvatura das ondas sonoras (difração)
Isso pode ser pensado como um efeito complementar à reflexão, pois as ondas que não
são refletidas serão contornadas por um obstáculo. Se o comprimento de onda for muito
maior que o tamanho do obstáculo, haverá uma curvatura marcada pelas ondas (há então
pouca reflexão). Se o comprimento de onda for pequeno, haverá pouca difração, mas
considerável reflexão. A Figura 1.3 (a) mostra a difração quase completa.
DEFINIÇÃO
A difração é a curvatura das ondas ao redor de um obstáculo. Essa curvatura só ocorre

com efeito significativo se o comprimento de onda for maior que as dimensões do
obstáculo (as dimensões como 'vistas' pelas ondas).
A Figura 1.4 mostra o que acontece quando as ondas sonoras passam por uma
abertura. Possivelmente ao contrário do que se poderia esperar, se a abertura for pequena
em relação ao comprimento de onda, há um espalhamento considerável do feixe de ondas
emergentes; se for grande, há pouco espalhamento. Muitas vezes é fácil ver efeitos como
este na água quando ondulações, ou mesmo ondas grandes, encontram obstruções ou
lacunas, por exemplo, nas paredes de um cais.
Existem muitos experimentos fáceis de realizar, mas altamente instrutivos, que o
leitor pode realizar por si mesmo. Por exemplo, tente segurar algo como uma prancheta
ou qualquer outra folha rígida de formato conveniente entre o ouvido e uma fonte de
som. Ver-se-á que as altas frequências da fonte são reduzidas no ouvido.
Em seguida, incline a placa para que os sons sejam refletidos no ouvido e veja qual
faixa de frequências é afetada. Observe como o caráter do som varia quando uma
aeronave passa atrás de uma casa, árvores ou outros objetos.
A gama de observações simples é quase infinita.
Vale ressaltar que todas as ondas, e não apenas as ondas sonoras, sofrem reflexão e
difração quando as condições são adequadas. Com a luz, por exemplo, os comprimentos
de onda são tão pequenos em relação ao tamanho dos objetos do dia-a-dia que
praticamente 100% de reflexão ocorre quase o tempo todo. A difração ocorre, mas os
efeitos geralmente não são óbvios.
Figura 1.3 Ondas sonoras atingindo um obstáculo
Unidades usadas no som

Será útil procurar maneiras de expressar a intensidade, ou poder, das ondas sonoras – mas
não, no momento, o que chamamos de 'intensidade'. Por várias razões que devem vir mais
tarde, no Capítulo 2 .
Poder
Isso é relativamente fácil. Em todos os equipamentos domésticos, a potência necessária

para operar o dispositivo é medida em watts (W é a abreviação) e isso será indicado em
algum lugar. Estamos acostumados com lâmpadas de 100 W, aquecedores de 3 kW
(quilowatts) e assim por diante.
Como as ondas sonoras são uma forma de energia, podemos legitimamente usar watts
como unidades de sua potência. No entanto, na prática, o watt é, em termos de ondas
sonoras, inconvenientemente grande para a maioria dos propósitos. Ou talvez devêssemos
dizer que o ouvido humano é tão sensível que precisamos de unidades menores do que
watts.
Figura 1.4 Difração em uma abertura
DEFINIÇÃO
Potência é a taxa na qual o trabalho é feito ou na qual a energia é produzida ou consumida.

Uma unidade muito mais útil é o milionésimo de watt, ou microwatt. Isso geralmente
é escrito μW, sendo μ uma letra grega chamada 'mu' e geralmente usada para significar
'um milionésimo'.
Neste ponto, o leitor não deve ficar confuso, ou possivelmente até alarmado, pelo fato
de que seus alto-falantes provavelmente têm rótulos citando potências muito maiores do
que as minúsculas potências, como um milionésimo de watt, que o ouvido pode
suportar. Os alto-falantes geralmente são classificados em muitos watts, 50 W ou mais,
mesmo para um sistema doméstico modesto. Esta potência refere-se à potência elétrica
máxima que pode ser alimentadano alto-falante sem causar danos ou distorção grave. A
potência sonora que sai provavelmente será de cerca de 1% ou 2% da potência elétrica
que entra no alto-falante - e apenas uma fração muito pequena disso provavelmente
entrará no ouvido do ouvinte!
Intensidade
Para muitas pessoas, essa palavra provavelmente seria considerada sinônimo de

sonoridade. No entanto, em termos científicos, tem um significado diferente. A
intensidade é definida como a energia caindo, emitida por ou passando por uma área
específica. As unidades possivelmente ajudam a deixar isso mais claro, sendo watts/metro
quadrado ou microwatts/metro quadrado, conforme o caso. Vamos escrevê-los como
W/m 2 ou μW/m 2 .
DEFINIÇÃO
Intensidade é a energia caindo, emitida por ou passando por uma área específica.
Pressão
Em termos científicos, isso é definido como a força atuando em uma unidade de

área. Muitos leitores devem ter visto 'libras por polegada quadrada' (psi) como uma
medida de pressão. (As pressões dos pneus dos carros são frequentemente dadas em psi:
cerca de 28 psi é um valor típico, embora a 'bar' seja a unidade métrica preferida.)
Usando essas unidades, a pressão atmosférica normal ao nível do mar é de cerca de

14 psi Unidades imperiais, como a libra e a polegada, não são recomendadas para
trabalhos científicos atualmente, portanto, devemos introduzir seus equivalentes
métricos. Estes são, para força, o newton (em homenagem a Sir Isaac Newton, 1642-
1727) e, para área, o metro quadrado novamente.
O newton leva um pouco de explicação. É propriamente definida como a força que

fará com que uma massa de 1 quilograma acelere a uma taxa de 1 metro/segundo a cada
segundo. Esta não é uma definição fácil de visualizar. O que é mais fácil de entender,
embora menos preciso, é que uma maçã média (e lembre-se da suposta associação entre
Sir Isaac Newton e maçãs!) Segura na mão exerce uma força para baixo, por causa da
gravidade, de aproximadamente 1 N (N = newton).
Assim, as pressões das ondas sonoras são normalmente dadas como tantos
newtons/metro quadrado, abreviado para N/m 2 .
Para complicar ainda mais, tornou-se prática oficial lembrar o cientista francês Blaise
Pascal (1623-1662), chamando o N/m 2 de pascal (Pa para abreviar).
Esta seção sobre unidades pode parecer pesada. O leitor não deve se preocupar muito
se for esse o caso, pois na maior parte do tempo nestelivro, usaremos essas unidades
apenas como base de comparação. A familiaridade trará, espera-se, não desprezo, mas
uma pronta aceitação deles.
DEFINIÇÃO
Pressão é a força que age sobre uma unidade de área.
Intensidade sonora e o efeito da distância
Dificilmente é preciso afirmar que os sons diminuem de volume quanto mais nos
afastamos da fonte do som. Aqui podemos ser um pouco mais precisos e indicar que a
intensidade (veja acima) diminui com a distância a uma taxa tal que, para
cada duplicação da distância, a intensidade (I) é dividida em quatro.
Para ajudar a entender isso, imagine um balão parcialmente inflado com um quadrado
de 1 cm × 1 cm desenhado nele. Agora, se o tamanho do balão for dobrado, o quadrado
passa a ter 2 cm × 2 cm – os lados dobram, mas a área aumenta quatro vezes. A
intensidade (potência por unidade de área) de uma onda sonora atingindo o quadrado é,
portanto, um quarto do que era inicialmente. (Existem cláusulas importantes sobre essa
lei, às quais trataremos em breve.) Essa relação entre intensidade e distância é expressa
por
I ∝ 1/d 2 ( ∝ significa 'é proporcional a')
onde d é a distância da fonte. Por exemplo, suponha que a uma distância de 1 m de uma
fonte sonora a intensidade I seja de 4 W/m 2 . A 2 m a intensidade será de 1 W/m 2 e a 8
m será um décimo sexto de W/m 2 , e assim por diante. Essa relação é conhecida como Lei
do Quadrado Inverso.
As ressalvas importantes que mencionamos acima são:
1. A fonte sonora é pequena comparada com as distâncias envolvidas (teoricamente deveria

ser infinitamente pequena). A Lei do Quadrado Inverso não se aplicaria a meio metro do
sino de uma tuba! Daria, no entanto, boas aproximações a algumas centenas de metros de
uma banda de metais completa.
2. Não há superfícies refletoras nas proximidades.
Consequentemente, a Lei do Quadrado Inverso raramente se aplica com muita precisão

na vida real. Por outro lado, muitas vezes pode ser usado como uma aproximação valiosa.
decibéis
O decibel (dB para abreviar) é uma unidade muito útil, mas infelizmente pode causar
confusão e pavor até que seja completamente compreendido. Por essa razão, vamos nos
limitar aqui a não mais sobre o dB do que o absolutamente necessário, mas mais sobre
isso é dado na Parte 2 do capítulo.
O decibel é uma unidade de comparação – basicamente de duas potências, mas

também aplicável a pressões sonoras e tensões elétricas. Se duas potências, duas pressões
ou duas tensões são iguais então há 0 (zero) dB de diferença entre elas. No caso do som,
uma mudança de 3 dB na fala ou na música é quase detectável pelo ouvido normal. E uma
mudança de 10 dB representa, para a maioria das pessoas, o dobro ou a metade do volume
de um som. Essas, então, são aplicações práticas da ideia do dB sendo usado para
comparar potências ou pressões sonoras.
Às vezes é particularmente conveniente adotar potências, tensões ou pressões padrão

para fornecer referências com as quais outras potências, etc. podem ser comparadas. Tais
padrões são basicamente bastante arbitrários, mas são escolhidos, no entanto, para serem
úteis. Para dar um exemplo, o ouvido normal em sua maior sensibilidade pode apenas
detectar variações de pressão de ondas sonoras de 0,00002 Pa (das quais falaremos mais
adiante). Esta pressão particular é tomada como um padrão e outras pressões sonoras
podem ser citadas como tantos dB acima de 0,00002 Pa. Estamos então no caminho certo
para poder usar decibéis como unidades de volume.
Este é o mais breve dos resumos sobre decibéis, mas eles ocorrerão muitas vezes ao
longo deste livro. No entanto, a exposição gradual e contínua a eles os tornará cada vez
mais significativos para o leitor. Provavelmente sem muito esforço também.
DEFINIÇÃO
O decibel é uma unidade de comparação de duas potências, pressões, tensões, etc.
Ondas sonoras
Parte 2
A velocidade das ondas sonoras
Isso varia ligeiramente com a temperatura do ar, mas não, como geralmente se supõe,
com a pressão do ar, pelo menos não em todas as faixas de temperatura e pressão
normalmente encontradas.
A 0°C, a velocidade das ondas sonoras no ar pode ser considerada como 331 m/s, e
isso aumenta em 0,6 m/s para cada aumento de 1°C na temperatura.
Por isso:
a –10°C a velocidade é de 325 m/s
a +10°C é 337 m/s
a +20°C é de 343 m/s.

340 m/s é um valor razoável para usar em temperaturas ambientes normais.
Em outras substâncias além do ar, as ondas sonoras viajam em velocidades bem

diferentes ( Tabela 1.1 ).
A alta velocidade do som no hélio, cerca de três vezes a do ar comum, é responsável

pelas vozes agudas dos mergulhadores e de outras pessoas cujos pulmões e tratos vocais
contêm o gás. (Não é um experimento a ser tentado por mais do que alguns segundos!)
Tabela 1.1
Substância Velocidade (m/s)
Água 1480
Vidro 5200
Aço 5000–5900
dependendo do tipo de aço
Madeira 3000–4000
dependendo da madeira
Gás dióxido de carbono 259 (a 0°C)
gás hélio 965 (a 0°C)
Unidades
1. A barra. Esta é outra unidade de pressão, mas é mais comumente usada em meteorologia,
pois é aproximadamente igual à pressão atmosférica normal. Está relacionado com o
pascal por:
1 bar = 100 000 Pa
ou 10 μbar = 1 Pa
(Os gráficos meteorológicos da televisão mostram as pressões do ar em milibares.)
2. Ao lidar com pressões de ondas sonoras, é claro que devemos lembrar que as pressões
são alternadas. Deve-se então usar o conceito de uma pressão constante que é equivalente
à pressão alternada. Um problema semelhante ocorre na rede elétrica CA (corrente
alternada), que no Reino Unido é cotada como tendo uma tensão de 230 V. Na verdade,
a tensão da rede passa por um ciclo de no máximo cerca de 340 V, caindo para zero e
atingindo então um máximo de 340 V na direção oposta. Ele então volta a zero e repete a
operação, levando um quinquagésimo de segundo para cada ciclo (daí a frequência de 50
Hz). Essa flutuação pode ser considerada equivalente em potência a uma CC (corrente
contínua) de 230 V. Os engenheiros usam o termo raiz quadrada média (rms)para este
equivalente. As pressões em Pa das ondas sonoras são equivalentes da mesma forma.
Tabela 1.2 Frequências sonoras para diferentes comprimentos de onda
Frequência Comprimento de onda (metros)
16 Hz 21h25
20 Hz 17,0
50 Hz 6.8
100 Hz 3.4
500 Hz 0,68
1 kHz 0,34 *
2 kHz 0,17 (17 cm)
5 kHz 0,068 (6,8 cm)
10 kHz 0,034 (3,4 cm)
16 kHz 0,021 (2,1 cm)
* Vale a pena notar que isso é aproximadamente igual a 1 pé.
A faixa de frequências coberta na tabela (16 Hz a 16 kHz) é aproximadamente a faixa

de frequências que o ouvido humano adulto normal pode detectar.
decibéis
Expresso corretamente, o número de decibéis representando uma razão de duas potências

é
dB = 10 log (relação de potência)

Se estivermos lidando com pressões ou tensões, a expressão torna-se
dB = 20 log(taxa de pressão) ou dB = 20 log(taxa de tensão)
Como exemplo, suponha que o amplificador de potência que alimenta um alto-falante

está fornecendo 50 W, mas é substituído por um que fornece 100 W:
o aumento dB é de 10 log(100/50)
= 10 registros(2)
= 10 × 0,3010 (facilmente encontrado em uma calculadora científica)
= 3,010 ou aproximadamente 3 dB
Será lembrado na Parte 1 do capítulo que esse aumento de 3 dB é quase detectável! Para
obter o dobro do volume do alto-falante, assumindo que ele suportará o aumento de
potência sem ser danificado, a potência deve ser aumentada em 10 dB. Isso significa que
o amplificador de 50 W terá que ser substituído por um de 500 W:
dB = 10 log(500/50)
= 10 registros(10)
= 10 × 1
Questões
Tente respondê-las da forma mais honesta possível. Você pode trapacear olhando as
respostas primeiro, mas isso não ajuda muito. As respostas são dadas no final do livro.
1. Que faixa de frequências de ondas sonoras o adulto normal pode detectar?
a. 160–1600 Hz b. 16–1600 Hz
c. 16–16 000 Hz d. 160–16 000 Hz
2. Qual é a velocidade das ondas sonoras no ar em temperaturas normais?
a. 300 m/s b. 340 m/s
c. 400 m/s d. 440 m/s

3. Uma sala destinada a gravações musicais tem a sua galeria sustentada por pilares de secção
quadrada. Estes são 0,5 m por 0,5 m de seção transversal. Qual faixa de frequência do
som será refletida de cada pilar?
a. Abaixo de aproximadamente 700 Hz b. Abaixo de aproximadamente 350 Hz
c. Acima de aproximadamente 700 Hz d. Acima de aproximadamente 350 Hz
2 Audição e a natureza do som

Parte 1
O mecanismo pelo qual as ondas sonoras são convertidas em percepção pelo cérebro é
extremamente complicado e partes dele ainda não são totalmente compreendidas. Este
livro não é o lugar nem mesmo para um relato limitado do assunto. É, no entanto, um
tema fascinante e o leitor que quiser saber mais deve consultar a lista de livros para leitura
complementar no final. Existem, no entanto, vários aspectos do processo auditivo que são
importantes no contexto da tecnologia de áudio e estes serão descritos aqui.
A resposta do ouvido
Para começar, estamos lidando com uma faixa de frequência de cerca de 16 Hz a cerca
de 16 kHz. Esses números não são precisos. Na extremidade inferior, não é fácil dizer
quando o som deixa de ter um tom identificável e começa a se tornar uma espécie de
vibração. Valores de 16–20 Hz são citados por diferentes autoridades. A extremidade
superior depende do indivíduo e também da idade da pessoa. Vinte kilohertz podem ser
detectados por uma pessoa no final da adolescência; algumas pessoas de 60 anos podem
ter dificuldade em ouvir qualquer coisa acima de 8 ou 10 kHz. Os efeitos da exposição a
ruídos altos também podem ter um efeito muito significativo. Dezesseis quilohertz é, no
entanto, um número bastante bom para citar como o limite superior de audição para o
adulto médio.
Supõe-se, ou pelo menos espera-se, que dispositivos como microfones, gravadores e

alto-falantes tenham o que é conhecido como resposta de frequência plana. Ou seja, eles
respondem igualmente bem a todos os sons, independentemente da frequência. O ouvido
humano não é assim. A Figura 2.1 mostra um gráfico de um aspecto da resposta do ouvido
normal para toda a gama de frequências de ondas sonoras.
A curva sólida na Figura 2.1 é chamada de Limiar da Audição. Ele mostra a pressão
sonora mínima necessária apenas para criar uma sensação no ouvido. Aliás, é uma
curiosidade do ouvido que em níveis mais altos a curva de resposta é bem mais achatada.
Figura 2.1 A resposta do ouvido a sons de baixo nível
O eixo horizontal representa a frequência. O eixo vertical está em dB relativo a uma

pressão sonora de 0,00002 Pa, à qual nos referimos no Capítulo 1 . (0,00002 Pa às vezes
é escrito como 20 μPa. Um lápis e o verso de um envelope podem confirmar que os dois
são iguais!) Este valor representa a pressão sonora que pode ser detectada apenas quando
o ouvido está mais sensível, o que para o ouvido normal é uma frequência de cerca de 3
kHz. Um ponto importante a ser observado sobre o limiar da curva auditiva é que uma
pressão sonora muito maior é necessária para produzir uma sensação no ouvido em baixas
frequências do que em torno de 3 kHz. Em outras palavras, em níveis de som baixos, o
ouvido é muito insensível a baixas frequências. Também é insensível a frequências muito
altas, mas isso geralmente é menos óbvio na prática.
A insensibilidade do ouvido a baixas frequências pode ser facilmente demonstrada

ouvindo uma música com uma ampla faixa de frequência e diminuindo o volume para um
nível baixo. Ver-se-á que a música se torna 'toppy'. A perda de alta frequência que ocorre
ao mesmo tempo é menos aparente porque na maioria das músicas há relativamente
menos energia nas altas frequências do que nas baixas.
Muitos sistemas de áudio domésticos têm um controle de 'volume' que, quando

ativado, aumenta as baixas frequências conforme o volume é reduzido. (Pessoalmente,
tenho algumas dúvidas sobre o quão útil isso realmente é!)
Sonoridade. O dB(A)
O volume é um efeito subjetivo: em outras palavras, o volume de um som depende do

indivíduo que o experimenta. Portanto, não pode ser medido. É possível, no entanto, fazer
medições que concordam razoavelmente com as avaliações de sonoridade da maioria das
pessoas.
Sugerimos no Capítulo 1 que o decibel pode ser a base de uma unidade de medida,
mas uma medição direta da pressão sonora em decibéis obviamente não é boa o suficiente,
pois não levaria em consideração a resposta de frequência desigual do ouvido normal. Se,
no entanto, o dispositivo de medição incorporar um circuito de correção elétrica que lhe
dê uma resposta de frequência semelhante à do ouvido, podem ser feitas aproximações
razoáveis ao volume.
Tal circuito foi concebido há muitos anos e está incorporado em dispositivos
chamados medidores de nível de som. Estes têm um microfone, amplificador, medidor e
os circuitos apropriados para corresponder aproximadamente às características do
ouvido. Tais medições são cotadas com a unidade dB(A), significando decibéis com o
circuito 'A' incorporado. Eles são frequentemente denominados medições ponderadas
. (As características B e C também foram concebidas, mas descobriu-se que o circuito A
mais se aproxima das avaliações subjetivas de sonoridade.) A Tabela 2.1 lista alguns sons
típicos com suas 'intensidades' em dB(A).
Pode ser importante notar que os regulamentos de ruído atuais no Reino Unido exigem
que os protetores auriculares sejam disponibilizados em um local de trabalho industrial
onde os níveis de ruído atinjam 85 dB(A). Acima de 90 dB(A) seu uso é obrigatório e
também os níveis de ruído do maquinário devem ser reduzidos, se possível.
DEFINIÇÃO
O dB(A) é uma aproximação razoavelmente boa para a avaliação de sonoridade da

maioria das pessoas.
Tom musical
Com isso, queremos dizer a posição de uma nota na escala musical. O tom pode ser um
assunto muito complicado – como tantas outras coisas no som! Deve ser o suficiente
aqui para dar os contornos de alguns fatos básicos:
1. O tom está basicamente relacionado à frequência, mas o tom percebido de uma nota pode
ser afetado pelo volume.
2. O padrão de afinação é considerado um som com frequência de 440 Hz. Isso é conhecido
como 'Internacional A'. É a nota soprada, geralmente por um oboé, como um sinal de
afinação antes de uma apresentação orquestral. (Os oboés têm uma nota estável e também
um som muito penetrante que pode ser ouvido com razoável clareza pelos outros
membros da orquestra.)
3. Apesar do que foi dito em 1 acima é possível fazer uma tabela relacionando altura e
frequência. A nota designada C é aquela chamada 'Middle C' em um instrumento de
teclado. A Tabela 2.2 lista as frequências para diferentes notas de altura.
Tabela 2.1 Alguns 'volumes' típicos em dB(A)
Fonte dB(A)
Orquestra, fortissimo a 5 m 100 *
Rua movimentada, oficina 95
Orquestra, média a 5 m 80
TV doméstica, a 3 m 70
Fala a 1 m 60–65
Dentro do carro silencioso 50
dentro de casa tranquila 30
Dentro da tranquila igreja do interior 25
* Uma orquestra pode atingir picos momentâneos de 120 dB.
4. Uma oitava musical representa uma duplicação ou redução pela metade da

frequência. Assim, na Tabela 2.2 , a está uma oitava abaixo de A e sua frequência é
metade de 440 Hz. A oitava acima do dó central tem uma frequência de aproximadamente
523 Hz.
5. Semitons adjacentes (por exemplo, de uma nota em um teclado para a adjacente acima ou
abaixo, o que pode significar ir de uma nota branca para uma preta, ou vice-versa) têm
frequências na proporção de cerca de 1,06:1. Em outras palavras, há uma diferença de
frequência de 6%. Uma nota elevada por um semitom é indicada pelo sinal de 'sustenido'
#. Uma nota abaixada em um semitom é marcada como ' '.
O assunto do pitch é complicado. A Tabela 2.2 mostra o que é chamado de

escala temperada igual , a escala padrão para teclados enele C# é o mesmo que D . No
entanto, para um bom ouvido musical, essas não devem ser a mesma nota. Os teclados
têm afinação de compromisso!
Figura 2.2 Parte de um teclado

Qualidade musical ('timbre')
Por timbre (pronuncia -se 'tarmbre'), entendemos os fatores que permitem ao ouvido
distinguir um instrumento de outro. Um trompete e um saxofone produzem sons
claramente diferentes, mesmo que toquem a mesma nota de altura.
Existem dois fatores importantes na determinação do timbre:
1. Harmônicos. Estes são tons com frequências que são múltiplos exatos da frequência base
(chamada de fundamental). Um instrumento tocando a nota a = 220 Hz provavelmente
produzirá não apenas 220 Hz, mas também muitos múltiplos dessa frequência, como 440,
660, 880, 1100, 1320 e assim por diante. Geralmente, os vários harmônicos diminuem em
amplitude à medida que aumentam em frequência. Os músicos geralmente se referem aos
harmônicos como harmônicos , mas o primeiro harmônico é o segundo harmônico e
assim por diante.
2. Transientes iniciais. Por um breve período no início de uma nota – e isso pode ser tão
pouco quanto um centésimo de segundo, e raramente mais do que cerca de um quinto de
um segundo – existem frequências adicionais presentes que não são numericamente
relacionadas com a fundamental como o harmônicos são. Essas frequências desaparecem
rapidamente, daí o nome 'transitório'. Eles dependem, possivelmente entre outras coisas,
da maneira e da taxa em que as vibrações se acumulam em um instrumento. Eles são uma
espécie de impressão digital.
DEFINIÇÕES
A frequência fundamental em um som musical é a frequência mais baixa.
Frequências harmônicas são múltiplos da frequência fundamental.
Por alguma razão, o ouvido e o cérebro atribuem grande importância aos transientes
iniciais. Se forem removidos ou distorcidos, é possível que a qualidade percebida do som
instrumental seja radicalmente alterada, mesmo que apenas uma fração de segundo tenha
sido alterada no início de uma nota que dura vários segundos. Por exemplo, pode ser
quase impossível dizer a diferença entre o som de uma flauta e um trompete, tocando a
mesma nota constante, se os primeiros segundos dos sons forem suprimidos de alguma
forma.
Tabela 2.2 Frequências das notas musicais
Observação Frequência para Hz mais próximo
A 440
G# 415
G 392
F# 370
F 349
D# 330
D 294
C# 277
C 262 *
b 247
a# 233
a 220
* Também conhecido como 'Middle C'.
É importante perceber que as frequências necessárias para reproduzir adequadamente

o som de um instrumento musical ou da voz humana se estendem, por causa dos
harmônicos, muito além do alcance musical aparente. Por exemplo, a nota mais alta de
um piano tem uma frequência fundamental de pouco mais de 4 kHz. No entanto, os
harmônicos se estendem pela maior parte da faixa de áudio. Por exemplo, tomando uma
nota apenas duas oitavas acima do dó central e usando frequências aproximadas para
simplificar:
C médio = 262 Hz
uma oitava acima = 523 Hz
duas oitavas acima = 1046 Hz
O décimo harmônico do Dó central (que pode ou não ser muito significativo na

prática, dependendo do instrumento) é 10 × 1046, que é 10 460 Hz. As notas de topo de
um violino têm frequências fundamentais em torno de 3 kHz. O quinto harmônico de tais
notas é de cerca de 15 kHz.
Uma lista mais completa de faixas de instrumentos musicais é fornecida na Parte

2 deste capítulo.
A percepção do cérebro do som
São bem conhecidas as ilusões de ótica, nas quais o cérebro sobrepõe sua própria
interpretação ao que os olhos recebem como luz. As pessoas envolvidas com o som
precisam estar cientes de que existem equivalentes auditivos.
1. Para começar, é importante perceber que a memória realmente precisa do cérebro para sons
é muito curta – cerca de 1 a 2 segundos. Parapor exemplo, se dois alto-falantes de boa
qualidade, mas ligeiramente diferentes, devem ser comparados, isso deve ser feito
alternando diretamente de um para o outro – um processo às vezes conhecido como 'fazer
comparações A–B'. É impossível fazer julgamentos confiáveis ouvindo um e depois o
outro com um dia de intervalo! As comparações entre um alto-falante bom e um medíocre
podem ser feitas com um intervalo de tempo, mas aqui estamos falando de comparações
precisas entre dispositivos de qualidade semelhante. Este é um tópico tão importante que
voltaremos a ele mais tarde.
2. É muito fácil para o sistema ouvido/cérebro ouvir o que ele acha que deveria ouvir! A
maioria dos operadores de som profissionais conhece casos em que ajustaram um controle
em um equipamento e ficaram bem satisfeitos com o resultado, apenas para descobrir
mais tarde que o controle havia sido desligado do circuito e, portanto, não estava fazendo
nada!
3. Às vezes, efeitos curiosos podem ocorrer em estéreo. Por exemplo, muitas pessoas que
ouvem gravações estéreo de aeronaves, nas quais a imagem do som da aeronave vai de
um alto-falante para o outro, descobrem que a imagem do som parece elevar-se acima do
nível dos alto-falantes e pode até parecer ser a sobrecarga. A explicação é claramente que
o cérebro associa o ruído da aeronave com a altura e então imagina um efeito de altura
mesmo quando as fontes sonoras reais estão ao nível do ouvido.
4. O sistema ouvido/cérebro tem uma capacidade extraordinária de discriminar sons que

considera sem importância. Ele pode fazer isso porque, por ter dois ouvidos, o cérebro
pode localizar a direção dos sons desejados. Às vezes, esse efeito é chamado de efeito
coquetel. (Você pode adivinhar o porquê!) Os microfones, mesmo quando há dois em
estéreo, não podem fornecer essa discriminação, ou pelo menos em um pequeno grau, de
modo que o que pode parecer ser condições acústicas aceitáveis quando um ambiente é
ouvido 'ao vivo ' pode revelar-se totalmente inaceitável, por motivos de ruído de fundo
ou reverberação excessiva, quando uma gravação é reproduzida.
5. O item restante nesta lista curta é conhecido como Efeito Haas. Dito brevemente, se sons
semelhantes chegam aos ouvidos de um ouvinte, então os sons que chegam primeiro
determinam a direção aparente da fonte sonora, mesmo que o som que chega mais tarde
possa ter um nível de até 10 dB mais alto. O leitor pode verificar isso alimentando um par
de alto-falantes estéreo com uma fonte mono e, em seguida, movendo-se em direção a
um dos alto-falantes para que o som dele chegue primeiro aos ouvidos. Isso fará com que
a imagem do som mono se mova para aquele alto-falante. É improvável que o ajuste do
controle de equilíbrio para aumentar o nível no outro alto-falante mude a imagem até que
haja uma diferença de volume muito apreciável entre eles.
Uma comparação precisa de dois dispositivos de áudio semelhantes (como dois alto-
falantes) só pode ser feita alternando rapidamente de um para o outro. Isso é chamado
de 'comparação A–B '.
Audição e a natureza do som

Parte 2
Tom
Dissemos anteriormente que a relação de frequência entre dois semitons adjacentes era
de aproximadamente 6%. Em termos científicos (mas não necessariamente musicais), o
número exato é
12 2 (a décima segunda raiz de 2)
Este é o número que, multiplicado por si mesmo 12 vezes, é igual a 2 e é 1,0594631. Uma
mudança de tom de um semitom é, portanto, equivalente a uma mudança de frequência
de 5,94631%. (Seis por cento é uma aproximação boa o suficiente para a maioria dos
propósitos!)
O raciocínio por trás da matemática é que existem 12 'intervalos' de semitons iguais em

uma oitava, que em si é uma relação de frequência de 2:1. Cada passo deve, portanto, ser
12 2.
O leitor interessado com uma calculadora científica pode tentar inserir 1,0594631 na
memória da calculadora e, em seguida, usar Memory Recall 12 vezes da seguinte maneira:
RM × 1,0594631 = 1,122462
MR × 1,122462 = ... e assim por diante, num total de 12 vezes.
O resultado final será 2, ou algo bem próximo disso, dependendo da calculadora.
Faixas de frequência na música
A Tabela 2.3 fornece as faixas aproximadas de frequências fundamentais de alguns sons

musicais. A faixa das notas mais baixas às mais altas é frequentemente chamada de
bússola do instrumento ou da voz. Em cada caso, os harmônicos estenderão a frequência
superior, em alguns casos consideravelmente.
Figura 2.3 Parte de um teclado

'falso baixo'
Este é o nome dado a um efeito interessante pelo qual o sistema ouvido/cérebro pode, de
alguma forma, parecer inserir frequências muito baixas que deveriam estar presentes, mas
que não são reproduzidas. Pode ser que o cérebro reconheça uma série de harmônicos
como baseados em uma frequência específica e compense mentalmente essa frequência
se ela não estiver presente.
Para dar um exemplo, a Tabela 2.3 mostra que as notas mais baixas de um grande
órgão de tubos podem chegar a 15 Hz. Existem muito poucos alto-falantes que podem
reproduzir frequências tão baixas e, no entanto, nossos ouvidos geralmente não percebem
essa deficiência.
Tabela 2.3 Faixas de frequência aproximadas de sons musicais
Fonte Frequência (Hz)
de para
Cantora 250 1000
Cantor masculino 100 350
Flauta 250 2500
Fagote 60 600
Saxofone alto 125 650
Trompete 200 1000
Violino 200 3500
Violoncelo 70 600
Piano 30 4000
Órgão de tubos (grande) 15 8000
Xilofone 700 4000
Questões
1. Decibéis podem ser apropriados para comparação em dois dos seguintes. Que dois?
a. Duas frequências b. Duas pressões sonoras
c. Duas sonoridades d. Dois fundamentos
e. dois poderes f. Dois alto-falantes
2. Uma nota tem uma frequência de 200 Hz. Qual é a frequência da nota uma oitava acima?
a. 212 Hz b. 300 Hz c. 400 Hz d. 2000 Hz
3. E qual seria a frequência de uma nota uma oitava abaixo?
a. 10 Hz b. 50 Hz c. 100 Hz d. 188 Hz
7 estéreo
Parte 1
A palavra 'estéreo' vem de uma palavra grega que significa 'sólido'. 'Visão estereoscópica'
significa perceber as coisas como sólidas quando vistas com os dois olhos. Embora o
termo '3D' tenha se tornado o padrão (mais fácil de soletrar!), 'estereoscopia' ainda é
basicamente correto. A partir daí, foi apenas um pequeno passo para estender a parte
'estéreo' ao som e, portanto, temos 'estereofonia', ou 'estéreo' para abreviar.
Há uma espécie de solidez, de certo modo, quando as imagens sonoras se espalham

diante do ouvinte. Aqui vamos lidar com a forma usual onde há dois alto-falantes, duas
faixas em uma fita, e assim por diante. Na verdade, o som estéreo pode ter qualquer
número desses canais – há boas razões para dizer quanto mais, melhor – mas aspectos
práticos como a economia significam que dois é a norma, pelo menos no momento. Isto
não é para ignorar o fato de que existem várias versões comerciais que possuem três alto-
falantes, muitas vezes com o alto-falante principal de graves no centro. Isso é justificado
pelo fato de frequências muito baixas serem muitas vezes indeterminadas em sua
direção. No entanto, vamos lidar com sistemas de dois canais.
Neste capítulo, consideraremos como o estéreo funciona e examinaremos as técnicas

para produzir estéreo.
Como funciona o estéreo
Para começar, precisamos considerar como localizamos os sons na vida real. Vários
fatores entram nisso, incluindo pistas visuais. À primeira vista, pode-se pensar que as
intensidades relativas do som nos dois ouvidos seriam o principal ingrediente na
localização do som, mas embora isso possa ter significado em algumas condições, o fator
mais importante acaba sendo a diferença de tempo de chegada em as duas orelhas.
Se uma fonte de som está diretamente na frente de uma pessoa, então claramente não
há diferença no tempo que os sons dessa fonte levam para chegar aos ouvidos. No caso
de um som vindo de qualquer direção, exceto dofrente, então haverá uma diferença de
hora de chegada. (Não vamos nos preocupar aqui com sons que se originam acima ou
abaixo do nível dos ouvidos). é aproximadamente 1 ms (1 milissegundo = 1/1000
segundo). O que é bastante interessante é que, em condições de escuta razoavelmente
boas, a maioria das pessoas pode detectar quando uma fonte de som se moveu cerca de
1° a partir do eixo frontal, e isso representa uma diferença de tempo de chegada nos
ouvidos de aproximadamente 10 μs – dez milionésimos ou centésimo milésimo de
segundo! Como o cérebro faz isso não está claro.
Diferença de tempo de chegada – Em geral, o som de uma determinada fonte chegará aos
ouvidos de uma pessoa em momentos ligeiramente diferentes. Isso é importante para
detectar a direção aparente da fonte.
(A questão de como localizamos os sons que estão acima ou atrás da cabeça ainda é
um pouco obscura. Os movimentos da cabeça ajudam a localizar a origem de um som.
para cada movimento da cabeça, o cérebro pode realizar cálculos que permitem ao ouvinte
diminuir a incerteza. Além disso, há evidências de que as dobras no ouvido externo - a
parte visível - podem criar reflexões múltiplas em altas frequências e o padrão dessas
reflexões vai depender do ângulo de incidência do som.)
Segue-se que, para recriar a informação direcional para um ouvinte, pelo menos em
uma área frontal, precisamos criar diferenças de tempo de chegada nos ouvidos da pessoa.
Assumindo que o ouvinte estará sentado em frente a um par de alto-falantes e

equidistante deles, não pode haver diferenças significativas de tempo de chegada nos
ouvidos da pessoa. Eles podem ser criados no estúdio? À primeira vista, isso pareceria a
coisa óbvia a se fazer e, de fato, era o que se fazia nos primórdios do estéreo comercial,
deixando os microfones a uma certa distância. Infelizmente, isso geralmente não funciona
bem. Com um par de microfones espaçados, digamos, alguns metros ou mais, o ouvinte
pode ouvir duas imagens sonoras separadas, uma em cada alto-falante e nada entre elas –
uma situação geralmente descrita como hole-in-the-middle ou ' pingue-
pongue'estéreo. (Um estéreo agradável pode ser produzido se os microfones não
estiverem muito espaçados – talvez não mais do que um metro).
Agora acontece que se os sinais elétricos nos dois canais – os caminhos esquerdo e
direito dos microfones aos alto-falantes – diferem um do outro apenas em
amplitude, então uma dispersão razoável de imagens sonorasentre os alto-falantes pode
ser esperado. A explicação para isso está além do escopo deste livro, mas há explicações
legíveis em alguns dos livros listados no final. No momento, vamos simplesmente afirmar
que, para a audição de alto-falantes, é necessário que haja diferenças de amplitude entre
os dois canais – diferenças entre canais – e, paradoxalmente, nenhuma diferença de
tempo entre os sinais neles contidos.
Figura 7.1 Um par coincidente de microfones cardióides
Métodos de produção de diferenças entre canais
Em geral, existem duas técnicas, embora na prática seu uso geralmente se

sobreponha. Estes são:
1. Usando um par de microfones direcionais muito próximos. Eles são inclinados

simetricamente em torno de uma linha imaginária que aponta para o centro da área de
gravação. A Figura 7.1 mostra dois microfones cardióides posicionados dessa
maneira. Um par de microfones com os diafragmas o mais próximo possível forma o que
é conhecido como par coincidente.
Se os sons chegarem diretamente na frente dos dois microfones – 0° no diagrama –

então ambos os microfones receberão os mesmos níveis de som e as saídas serão
exatamente iguais. (É muito importante que os dois microfones tenham um desempenho
próximo. O mesmo vale para os alto-falantes em estéreo.)
Um som que sai do eixo central dos microfones, digamos de X no diagrama, resultará
em uma saída maior do microfone da direita do que da esquerda e isso nos dá a necessária
diferença entre canais.
Figura 7.2 Um panpot
2. Métodos puramente elétricos. A Figura 7.2 mostra de forma simplificada o que é chamado
de panpot (de 'potenciômetro panorâmico'). Um potenciômetro é uma resistência elétrica
variável com três terminais. Dois estão nas extremidades de uma pista resistiva, enquanto
o terceiro está conectado a um controle deslizante cuja posição ao longo da pista pode ser
alterada por meio de um botão.
Par coincidente – Dois microfones direcionais com seus diafragmas montados o mais
próximo possível.
A posição do controle deslizante, que neste caso está conectado à saída de um

microfone, determina qual proporção da saída do microfone é enviada para qual
canal. Isso nos dá uma segunda maneira de produzir diferenças entre canais.
Terminologia
É mais ou menos universal no mundo profissional do Reino Unido usar as seguintes

convenções em estéreo:
O canal ESQUERDO é indicado pela letra A e, quando apropriado, a cor

VERMELHA é usada para indicar isso – por exemplo, em cabos e em diagramas.
O canal DIREITO é indicado pela letra B e a cor é VERDE.
Essa convenção profissional é facilmente lembrada: na escrita, o alfabeto A está à

ESQUERDA de B; na navegação VERMELHO indica bombordo (ESQUERDA)
enquanto VERDE significa estibordo ou DIREITA.
Observe, no entanto, que em equipamentos domésticos L e R são normalmente usados

para esquerda e direita, e também a convenção de cores é diferente: BRANCO é
comumente usado para ESQUERDA e VERMELHO para DIREITA. Para aumentar a
confusão, os fones de ouvido podem ter AMARELO para a esquerda, com VERMELHO
ainda para a direita.
CONVENÇÕES ESTÉREO PROFISSIONAIS
A – esquerda, cor vermelha
B – direita, cor Verde
Audição estéreo
Já sugerimos que o ouvinte deve estar na linha central entre os dois alto-falantes e que
estes devem ser um par 'combinado'. E não só devem ser combinados em termos de
qualidade, mas devem ser 'balanceados' de modo que, se alimentados com exatamente o
mesmo sinal (ou seja, mono), a imagem sonora resultante seja verdadeiramente
central. (Como verificar a correspondência é explicado abaixo, assim como as formas de
obter um sinal mono.)
Se o equilíbrio estiver incorreto, é uma questão de corrigir isso ajustando os controles
de ganho (volume) nos amplificadores que alimentam os alto-falantes ou ajustando
o controle de equilíbrio, se houver um, como geralmente ocorre em equipamentos de alta
fidelidade domésticos decentes .
A posição de escuta ideal, então, está no ápice de um triângulo equilátero formado

pelo ouvinte e pelos alto-falantes, mas na prática o ouvinte pode estar mais afastado desse
ponto. Quanto mais para trás depende das circunstâncias, principalmente da forma,
tamanho e simetria da sala.
A sala de audição ideal será acusticamente simétrica entre esquerda e direita. Por
exemplo, é indesejável ter uma parede nua de um lado e uma janela com cortinas pesadas
do outro lado. Se o ouvinte não estiver muito longe dos alto-falantes, alguma falta de
simetria pode não ser muito grave, pois o som direto dos alto-falantes será muito mais
forte nos ouvidos do que o som refletido nas paredes. No entanto, quanto mais atrás o
ouvinte estiver, maior será a influência dos sons refletidos. Poucas salas podem ser
verdadeiramente simétricas, de modo que há um limite para a distância dos alto-falantes
em que um bom estéreo é ouvido.
Os alto-falantes não devem ficar muito próximos das paredes. Em muitas

circunstâncias, cerca de meio metro da parede traseira pode ser aceitável, e o espaço entre
eles não deve refletir o som. Em uma situação doméstica, isso pode ser difícil de
conseguir, embora na sala de estar do autor o espaço entre os alto-falantes seja preenchido
por uma lareira projetada deliberadamente para se parecer com uma parede de pedra
tradicional de Cotswold. Isso parece ser perfeitamente satisfatório, possivelmente porque
existem irregularidades suficientes para quebrar pelo menos algumas das ondas refletidas,
e também as bordas das peças de calcário podem ser ligeiramente absorventes das ondas
sonoras.
Uma posição de audição notavelmente insatisfatória está mais próxima do que o ápice
do triângulo equilátero, pois as imagens podem se tornar um tanto irreais. Pode ser um
pouco como ouvir fones de ouvido estéreo.
Figura 7.3 Posições de escuta

Tendo dito que o ouvinte deve estar na linha central entre os alto-falantes, uma
pergunta razoável a se fazer é: a que distância dessa linha central o ouvinte pode estar
antes que as imagens estéreo se tornem excessivamente destras ou canhotas? A resposta
resumida é que, para uma audição realmente crítica, há muito pouca latitude, talvez 2 ou
3 cm, com um espaçamento de alto-falante de alguns metros. No entanto, pode haver
audição estéreo agradável, o que é uma questão diferente, quando o ouvinte está
visivelmente fora da linha central. Muito pode depender dos alto-falantes
específicos. Alguns tipos oferecem uma propagação razoável do som quando o ouvinte
está a um metro ou mais da linha central, assumindo novamente uma linha de base de 2
metros.
Algumas palavras de segurança sobre ouvir
Parte do que foi escrito acima pode facilmente parecer muito preocupante para a pessoa
comum que simplesmente gosta de ouvir estéreo razoável. A tal pessoa diríamos
simplesmente: 'Não se preocupe!' Não reorganize sua sala de estar para torná-la
acusticamente simétrica; não preencha uma janela ou cortina uma parede oposta. Se você
gostou da sua música até agora, continue a apreciá-la. (No entanto, em um ambiente
profissional, terá que haver mais cuidado ao projetar as áreas de escuta.)
Pode ser, é claro, que imagens peculiares tenham sido um problema e há dicas aqui
que podem ajudar. É mais ou menos como os casos em minha própria experiência, quando
as respostas dos alto-falantes eram medidas por pessoas com alto-falantes dos quais elas
tinham muito orgulho. Os gráficos quase inevitavelmente desiguais causaram grande
sofrimento – realmente desnecessariamente. Esses eram casos de um pouco de
conhecimento sendo, não perigoso, mas perturbador – ou talvez alguém pudesse dizer
que a leve ignorância era uma bênção!
Correspondência de alto-falante estéreo
Isso significa garantir que a qualidade de saída dos dois alto-falantes seja a mais próxima
possível. A melhor maneira de verificar isso é alimentar ambos os alto-falantes com
música mono que contenha uma ampla gama de frequências.
Supondo que os alto-falantes estejam equilibrados em volume, todas as frequências

devem parecer estar no meio do caminho entre eles. Se, no entanto, não for esse o caso e,
para dar um exemplo, as altas frequências vierem de um ponto à direita do centro, isso
significa que há saída excessiva de altas frequências do alto-falante direito ou, muito mais
provavelmente, há uma deficiência de alta frequência no alto-falante esquerdo. Uma
possibilidade nesse caso é que o tweeter desse alto-falante esteja com defeito.
Dissemos com bastante fluência que a maneira mais fácil de verificar a

correspondência e também o equilíbrio dos alto-falantes é alimentá-los com música
mono. O problema é que nem sempre é fácil encontrar uma fonte de música
mono! Equipamentos profissionais geralmente são fornecidos com um switch que pode
converter material estéreo em mono para propósitos como este. Equipamento doméstico
muitas vezes não. O problema, porém, não é insuperável. Alguns receptores de rádio
destinados à conexão em um sistema hi-fi têm um botão mono/estéreo para ser usado
quando o estéreo da transmissão é fraco e ruidoso, mas a versão mono é aceitável. Isso
pode ser usado para fornecer música mono diretamente ou uma fita de música mono.
As coisas ficam um pouco mais difíceis se não houver um botão mono/estéreo. Uma
solução parcial, embora sem uma ampla faixa de frequência, é sintonizar o receptor para
uma transmissão de notícias quando o leitor de notícias quase certamente será central e,
portanto, mono.
Estágio
Isso significa, basicamente, que a polaridade da fiação é a mesma em ambos os canais de

um sistema estéreo. A Figura 7.4 ilustra isso.
Na Figura 7.4 (b) as conexões elétricas foram, em algum momento, invertidas em UM

dos canais. O efeito é que uma compressão de onda sonora é emitida de um alto-falante
quando uma rarefação é emitida do outro. Este é um efeito muito antinatural para um
ouvinte, sendo algo que não ocorre na vida real, ou se ocorre, apenas brevemente e de
forma incompleta.
O resultado do estéreo fora de fase é que as imagens são muito difíceis de

localizar. Eles podem aparecer por trás ou mesmo dentro da cabeça e podem se mover se
houver qualquer tentativa de localizá-los virando a cabeça. Geralmente não é uma
experiência agradável e a audição prolongada de estéreo fora de fase pode causar dor de
cabeça. Houve até casos relatados de náusea física.
Figura 7.4 (a) Fase correta (b) Fase incorreta
Quão óbvia é uma condição fora de fase pode depender muito do tipo de material do
programa. Com imagens estéreo amplas e pouco som central, um sinal fora de fase pode
não ser tão óbvio. Será mais aparente com imagens monocromáticas ou centrais. Esta,
então, é a maneira de verificar as conexões fora de fase. Reproduza um sinal mono central
(e aqui um boletim de notícias simples será bastante adequado) e verifique se há uma
imagem central clara. Se houver alguma dúvida, a fiação de um dos canais deve ser
trocada e, provavelmente, a maneira mais fácil de fazer isso será nos terminais de um dos
alto-falantes. Se o sistema estiver fora de fase e a fiação dos alto-falantes estiver
obviamente correta, será necessário verificar o restante do sistema.
Questões
1. Qual é a diferença aproximada do tempo de chegada nos dois ouvidos de uma pessoa
quando uma fonte de som está a 90° da frente?
a. 10 μs b. 0,01ms c. 0,1ms d. 1ms
2. Qual é a causa provável do estéreo 'buraco no meio'?
a. Condições fora de fase
b. Microfones muito espaçados
c. Sinais em um canal sendo muito maiores do que no outro canal
d. Alto-falantes incompatíveis
3. Um panpot é ajustado com seu controle totalmente no sentido horário. Onde é provável
que a imagem dele esteja na imagem estéreo final?
a. Totalmente b. totalmente à c. meia d. metade

certo esquerda direita esquerda
4. O que deveria ser uma imagem central clara em uma cena estéreo é difícil de localizar
ouvindo. Qual é a causa provável?
a. Há uma condição fora de fase em algum lugar
b. Panpots estão sendo usados incorretamente
c. Um microfone de par coincidente é montado de cabeça para baixo
d. Um dos microfones está distorcendo
7 estéreo
Parte 2
Técnicas de microfone para estéreo
Aqui podemos examinar um pouco mais profundamente o uso do microfone para

estéreo. Existem várias técnicas, mas aqui vamos olhar para três, e apenas brevemente
para duas delas. O leitor que desejar aprofundar o assunto deverá consultar a lista de livros
intitulada 'Leitura adicional'.
A primeira técnica, e em muitos aspectos a mais simples de entender, é a de multi-
microfonia – fazendo uso de vários microfones cujas saídas são 'posicionadas' na imagem
estéreo com panpots. Do ponto de vista do usuário não profissional, a dificuldade com
esta abordagem pode ser não ter um número suficiente de entradas e circuitos associados
no equipamento de mixagem. Além disso, é claro, pode ser necessário um grande número
de microfones - na opinião de alguns balanceadores de som profissionais, o kit de bateria
sozinho pode precisar de seis a dez ou até mais!
A principal vantagem da abordagem multimicrofone é que pode haver um bom

controle sobre o equilíbrio do som – ou seja, seções fracas de, digamos, uma banda ou
coro podem ser aumentadas de nível para corresponder às seções mais altas.
As desvantagens são:
1. A complexidade técnica pode ser considerável e, paradoxalmente, por vezes pode dificultar
a obtenção de bons resultados. Há também mais para dar errado!
2. É possível que os microfones formem pares estéreo indesejados. Isso significa que, além
das imagens panpotted, pode haver imagens adicionais espúrias causadas por mais de um
microfone captando o mesmo som. Na prática, é improvável que isso signifique que
haverá várias imagens; em vez disso, as imagens panorâmicas serão deslocadas de suas
posições pretendidas. Como um risco adicional, mover um fader para alterar a saída de
qualquer microfone pode resultar no movimento de algumas das imagens deslocadas. A
única maneira de evitar esse efeito é ter todos os instrumentos, seções da banda ou o que
quer que seja 'microfonado de perto', ou seja, ter omicrofones o mais próximo possível de
suas respectivas fontes. Às vezes, isso pode ser difícil, especialmente porque nem sempre
é fácil manter o som característico de um instrumento com microfones posicionados
próximos.
Em suma, é justo dizer que as técnicas de multi-microfone geralmente não são tentadas a
menos que haja muitos microfones disponíveis e o equipamento de mixagem seja
adequadamente abrangente.
A segunda abordagem do microfone é usar pares coincidentes, aos quais já nos

referimos. Aqui muito depende dos diagramas polares dos dois microfones. Deve-se
assumir que os diafragmas dos dois microfones estão o mais próximos possível, embora
deva-se admitir que resultados satisfatórios podem ser obtidos quando eles estão
separados por vários centímetros (consulte 'Estéreo binaural' na p. 101).
O principal efeito dos diagramas polares está no ângulo de aceitação do par de

microfones. Por 'ângulo de aceitação' entendemos o ângulo na frente dos microfones, que
corresponde a uma imagem sonora estendendo-se por toda a distância entre os alto-
falantes. Os fotógrafos perceberão que o ângulo de visão de uma lente é um conceito
muito semelhante.
O conhecimento dos ângulos de aceitação para diferentes sistemas de diagramas

polares é essencial para obter resultados satisfatórios. No entanto, não é difícil carregar
essa informação na cabeça quando se lembra que os microfones hipercardióides têm
padrões polares intermediários entre oito e cardióides. Então, para microfones que estão
a 90° um do outro, os ângulos de aceitação são aproximadamente:
Figura 7.5 'Ângulo de aceitação' para um par coincidente
algarismos de oito 90°
Hipercardióides 135°
Cardióides 180°
(135° é a metade entre 90° e 180°)
Observe que estamos assumindo que os microfones estão a 90° um do outro. Isso é
bastante normal, e é improvável que uma diferença de alguns graus em ambos os lados
de 90° tenha qualquer efeito significativo, embora o ângulo possa ser aumentado
consideravelmente com cardióides, resultando em uma imagem estéreo mais ampla.
Talvez a grande questão agora seja: qual sistema de diagrama polar usar
quando? Muitas vezes, é claro, há pouca escolha. Normalmente, os únicos microfones
disponíveis são um par de cardióides (como, por exemplo, nos microfones estéreo
integrados da maioria das filmadoras). No entanto, o posicionamento de um par de
microfones coincidentes, seja qual for o padrão polar, é em grande parte uma questão de
geometria.
Vamos supor que temos dois cardióides – e repetimos que eles devem ser o mais
parecidos possível, mesmo fabricante, mesmo número de tipo e assim por diante. A
Figura 7.6 mostra os prováveis spreads de imagem para duas posições para tal par de
microfones. Em (a), os microfones estariam próximos à frente da fonte sonora (banda,
coro, orquestra, etc.). Em (b), os microfones estão mais para trás de forma que os eixos
dos cardióides estejam apontando aproximadamente para as bordas da fonte. Lembre-se
que o ângulo de aceitação para um par de cardióides é de cerca de 180°. Em (a), a
propagação das imagens sonoras preencherá quase completamente a região entre os alto-
falantes;em (b), apenas uma parte da região será preenchida. Observe que o estado de
coisas na Figura 7.6 (b) não é necessariamente errado. Um piano solo geralmente soará
um pouco bobo se parecer ter toda a largura entre os alto-falantes! Da mesma forma, um
quarteto de cordas clássico deve normalmente preencher apenas parte do quadro.
Figura 7.6 Provável propagação de imagem para um par de cardióides
Com uma banda de rock é difícil dizer qual deve ser a imagem reproduzida, pois
muitas vezes não há tentativa de reproduzir a realidade do som original.
Em ambos os casos, porém, o som reverberante tenderá a preencher a imagem estéreo,

aumentando assim o realismo, mesmo que a imagem básica do(s) instrumento(s) seja
estreita. Tudo depende do que parecerá razoável para o ouvinte no replay.
Um par de microfones em forma de oito tem características bastante diferentes. Para

começar, o ângulo de aceitação é menor do que para cardióides (90°) e para uma cobertura
completa de alto-falante a alto-falante, os microfones devem estar mais para trás – mais
ou menos onde os dois cardióides estão na Figura 7.6 (b).
Em segundo lugar, há uma região de captação traseira de 90°, o que pode ou não ser
bom. Por exemplo, pode ser útil se for necessária muita reverberação; por outro lado,
pode haver ruídos indesejados vindos de trás – uma plateia tossindo, por exemplo! Um
ponto final e às vezes muito importante é que os quadrantes laterais são regiões fora de
fase e isso significa que os sons vindos dessas direções podem ser difíceis de localizar
pelo ouvinte. Os lados, portanto, devem ser considerados como 'zonas proibidas', embora
a reverberação que chega dos lados não sofra nenhum efeito peculiar porque é, por sua
natureza, tão difusa que a fase não tem significado real. Isso é ilustrado na Figura 7.7 .
Afirmou-se que, em igualdade de condições, os pares de microfones em forma de oito

precisam estar mais afastados do que os cardióides. Existem alguns prós e contras como
resultado:
1. Quanto mais atrás estiverem os microfones, melhor (provavelmente) será o equilíbrio

relativo entre a frente e o fundo de uma orquestra ou banda. Dito de outra forma, um par
de microfones próximo, como cardióides, pode fazer com que os instrumentos ou vozes
mais próximos sejam muito altos em relação aos mais distantes. As perspectivas de som
relativo (consulte o Capítulo 5 ) serão exageradas.
2. Se a acústica da sala ou outra área de gravação for ruim, por exemplo, com reverberação
excessiva ou ruído externo, microfones mais próximos, como cardióides, podem ajudar.
3. Quanto mais próximos os microfones estiverem da banda, orquestra ou coro, mais

importante pode ser ter microfones mono adicionais para reforçar as seções mais
distantes. Em seguida, panpots devem ser usados para colocar as saídas desses microfones
em suas posições corretas na 'imagem'.
Figura 7.7 Microfones em forma de oito como um par coincidente
Pode valer a pena mencionar que, dada uma boa banda, orquestra ou coro em acústica
favorável, um par de microfones em oito pode, na opinião de muitos balanceadores de
som experientes, dar a reprodução mais natural. É também o arranjo mais simples
tecnicamente falando.
Não foi mencionado um par de hipercardióides, mas o leitor poderá rapidamente
adaptar o que foi dito sobre cardióides e oito para hipercardióides, lembrando que eles
podem ser considerados a meio caminho entre os outros dois.
Uma terceira técnica de microfone é a do estéreo binaural. Destina-se principalmente

a ouvir com fones de ouvido, mas feito com cuidado fornece resultados aceitáveis em
alto-falantes. A ideia é que os ouvidos de uma pessoa sejam substituídos por microfones,
ou pelo menos os microfones sejam colocados nos ouvidos ou mesmo dentro deles. A
teoria (bastante incorreta!) é que se esses microfones estiverem conectados a fones de
ouvido, o ouvinte é 'transportado' para a posição de usuário dos microfones.
Cabeças falsas especiais foram projetadas e comercializadas comercialmente, mas

muito mais simples e barato é ter um disco de perspex, com cerca de 6 a 8 mm de
espessura e 200 a 250 mm de diâmetro. Dois pequenos microfones são montados em lados
opostos do disco, em seu eixo e aproximadamente 100 mma partir dele. Estes formam o
par estéreo. (Observe que os dois microfones têm um espaçamento que é
aproximadamente igual ao dos ouvidos humanos.) Resultados interessantes podem ser
obtidos, embora a maioria dos ouvintes de fones de ouvido ache que as imagens sonoras
tendem a ficar atrás deles. Há espaço para experimentação pelo leitor com dois pequenos
microfones e modestas instalações de oficina.
Fones de ouvido para monitoramento estéreo
Tendo mencionado o uso de fones de ouvido, vale a pena acrescentar um comentário

sobre seu uso em estéreo.
Para começar, o monitoramento sério do estéreo é quase impossível com fones de

ouvido, porque as posições das imagens sonoras em geral quase não têm relação com
aquelas percebidas ao ouvir o mesmo material estéreo nos alto-falantes. Alguns sons
podem parecer estar atrás ou mesmo dentro da cabeça. Certa vez, realizei alguns
experimentos para ver se havia alguma correlação entre as posições das 'imagens de fone
de ouvido' e das 'imagens de alto-falante', mas mesmo ouvintes experientes diferiam tanto
entre si na localização das imagens de fone de ouvido que a conclusão final foi que não
havia correlação significativa em tudo.
Por fim, ao planejar uma gravação estéreo, vale a pena estudar a situação com
antecedência para ter uma ideia de quais microfones usar e onde colocá-los. Então, e isso
é o mais importante, um ensaio deve ser usado para testar o mais minuciosamente possível
se as posições ideais do microfone foram alcançadas. Isso significa ouvir criticamente, de
preferência em alto-falantes. Se isso não puder ser feito no local de gravação, significa
fazer uma gravação e reproduzi-la nas melhores condições de audição possíveis.
Muitas vezes, tudo isso é mais fácil dizer do que fazer, especialmente porque há
complicações como o fato de que a presença de uma platéia quase certamente modificará
a acústica, e os músicos tocarão mais alto e melhor quando houver alguém para tocar! No
entanto, com a experiência, é possível fazer algumas concessões para essas coisas.
Questões
Com um par estéreo coincidente de microfones em ângulo de 90° entre si, quais são os
'ângulos de aceitação' efetivos para o seguinte?
1. Cardióides
a. 90° b. 135° c. 180°
2. Hipercardióides
a. 90° b. 135° c. 180°
3. Figura de oito
a. 90° b. 135° c. 180°
4. Omnis
a. 90° b. 135° c. 180°
5. Com qual arranjo de par coincidente é provável que haja uma região fora de fase
significativa nas laterais?
a. Cardióides b. Hipercardióides c. algarismos de oito d. Omnis
10 Áudio digital
Parte 1
Na edição anterior deste livro, publicada em 1997 – não muitos anos atrás – sugeri que o
equipamento digital naquela época provavelmente seria muito caro para o leitor amador
e semi-profissional! As coisas mudam. Gravadores digitais de boa qualidade e
dispositivos associados são agora muito acessíveis.
Histórico
No Reino Unido, a primeira aplicação generalizada de um sistema de áudio digital

ocorreu no final da década de 1960, quando os engenheiros de pesquisa da BBC
desenvolveram um sistema para combinar o sinal de som da televisão com as imagens
para distribuição às estações transmissoras. O sinal de som foi convertido de uma forma
analógica para uma consistindo de pulsos que foram "introduzidos" no sinal de visão
composto. Esse sistema, conhecido como som em sincronizações, ainda é usado, não
apenas pela BBC, mas também por empresas de televisão independentes do Reino
Unido. Ele é mencionado na Parte 2 deste capítulo.
A forma mais moderna, conhecida como NICAM, permite que o som estéreo seja
transmitido como parte do sinal de televisão. O NICAM também será explicado mais
detalhadamente na Parte 2 .
Então, no início dos anos 1970, a rádio BBC, enfrentando o problema de enviar
estéreo de alta qualidade para seus transmissores, adotou o áudio digital. Isso não apenas
permitiu que os programas de rádio fossem enviados por todo o Reino Unido quase sem
deterioração da qualidade, mas também financeiramente muito econômico. O uso dos
princípios do áudio digital, mas com padrões um pouco melhorados, apareceu com o disco
compacto – o CD – por volta de 1980, e outros sistemas digitais surgiram desde então.
Princípios básicos
Nos sistemas analógicos, onde o sinal elétrico é uma réplica, ou deveria ser, das ondas
sonoras originais, existe um problema fundamental: qualquerdeficiência causada por
qualquer motivo é praticamente impossível de corrigir. Tais deficiências podem ser o
resultado de interferência captada durante uma transmissão de rádio, efeitos de sujeira e
poeira em uma ranhura de gravação e imperfeições no meio de gravação (manchas nuas
ou finas no óxido magnético da fita, por exemplo).
Outra causa de degradação é a cópia. A qualidade de uma gravação em fita analógica

pode ser muito boa, mas uma cópia feita a partir dela nunca terá um padrão tão alto. As
cópias da cópia, um processo que pode ser muito importante na indústria fonográfica,
serão ainda mais degradadas. Com fita e processos de redução de ruído adequados, pode
levar várias gerações de cópias antes que a degradação se torne muito óbvia, mas, no
entanto, ocorre e é irreversível.
Com o agora quase extinto disco de gramofone de vinil, a qualidade se deteriorou

muito ligeiramente a cada execução - talvez não muito obviamente. A ponta
gradualmente causava desgaste e deformação nas ranhuras e também os efeitos da poeira
eram quase impossíveis de evitar. Os entusiastas do hi-fi tinham removedores de poeira
eletrostáticos e líquidos de limpeza especiais, mas o fato era que minúsculas partículas de
poeira ainda encontravam seu caminho para as ranhuras e podiam até ser empurradas para
a superfície pela caneta. Havia vários circuitos inteligentes projetados para remover os
efeitos de cliques e arranhões sérios, mas é verdade que eles foram, na melhor das
hipóteses, apenas parcialmente bem-sucedidos. Tal circuito nunca poderia ter certeza de
que um ruído foi causado por um arranhão ou se era um instrumento de percussão
especial! Um número incrível desses problemas é evitado ao se tornar digital.
Com o áudio digital, o sinal analógico original é convertido em um código de sinais

muito mais robustos. Basicamente, estes assumem a forma de pulsos de tensão de altura
e duração padrão. Uma vez que cada parte da cadeia digital sabe qual deve ser a altura e
a duração de um pulso, então, se um ficar distorcido, é possível, dentro de certos limites,
reconstruí-lo. Há uma comparação aqui com o Código Morse (mas parece que está em
declínio!). Todas as mensagens são enviadas na forma de pontos e traços. A pessoa na
extremidade receptora geralmente pode detectá-los e decodificá-los, embora alguns
possam estar muito distorcidos e esse fato representou o uso generalizado de Morse para
comunicação em grandes distâncias quando a interferência em sinais de rádio tornava a
fala difícil de entender.
Qual é o processo de codificação com áudio digital? Aqui está uma história
ligeiramente simplificada.
Amostragem
A primeira etapa é a amostragem. O sinal analógico é dividido em pequenas amostras,

cuja 'altura' (na verdade deveríamos dizer amplitude) será medida no próximo
estágio. Uma coisa muito importante sobre este processo de amostragem é que ele deve
ser realizado em grande velocidade. Nos CDs e em muitos outros sistemas digitais
modernos, essa taxa é de pouco mais de 44.000 vezes por segundo, mas 48.000 também
é usada em alguns equipamentos. As linhas verticais na Figura 10.1 representam amostras
individuais.
Figura 10.1 Amostragem
quantizando
Em seguida, cada amostra deve ser medida. Isso é conhecido como quantização.
A Figura 10.2 ilustra um arranjo de quantização muito básico. Ele mostra seis níveis
de quantização – e pense neles como graduações em uma régua que mede a amplitude de
cada amostra. O sistema não nos permite usar frações de divisão, então as medições do
sinal vão, neste caso, ser bastante grosseiras.
Quanto mais precisa for essa medição de amplitude, melhor será a qualidade do
resultado final. Para uma precisão real, é necessário que haja um grande número de
graduações nesta régua. Cerca de 8.000 é o mínimo utilizável, mas não é suficiente para
gravações de alta qualidade (por exemplo, qualidade de CD), quando são necessárias
cerca de 65.000 graduações ou níveis de quantização!
Amostragem – O processo de examinar um sinal de som em uma taxa muito alta. Em

muitos sistemas de áudio digital, a taxa de amostragem é de pouco mais de 44.000 vezes
por segundo.
Quantização – O processo de 'medir' a amplitude de cada amostra. Áudio de boa

qualidade precisa de pelo menos 65.000 níveis de quantização.
Nesse ponto, o cérebro começa a ficar confuso com a magnitude das coisas – medindo
a música 44.000 vezes por segundo, cada medição sendo um número entre 0 e
65.000! Felizmente, a eletrônica moderna pode lidar com tudo isso com bastante
facilidade. No entanto, vamos fazer uma pausa para ver com o que estamos
comprometendo o sistema. Uma fita ou disco digital deve armazenar números que podem
ser de até 65.000 e fazer isso a uma taxa de pouco mais de 44.000 deles por segundo!
Figura 10.2 Um sistema de quantização muito simples
aritmética binária
Felizmente, as coisas começam a ficar um pouco mais simples quando procuramos tipos
alternativos de aritmética. O áudio digital usa aritmética binária. Com nossa aritmética
diária usual, contamos de 0 a 9 e, em seguida, colocamos um 1 na frente para ir de 10 a
19, depois um 2 e assim por diante. Na aritmética binária existem apenas dois dígitos, 1
e 0, em vez de dez, e a contagem é de 0 a 1, e então um 1 é colocado na frente para fazer
10. O próximo número tem um adicionado para fazer 11 (não chame-o de 'onze' – não é!)
e então um 1 adicional é colocado na frente para que tenhamos 100, 101 e assim por
diante. A Tabela 10.1 compara nossa aritmética decimal padrão com a binária. Se o leitor
não estiver familiarizado com a aritmética binária, deve-se tentar continuar a tabela.
A princípio, a aritmética binária pode parecer muito complicada. Na verdade, isso

ocorre apenas porque não estamos acostumados com isso – pelo menos, não a maioria de
nós. Na realidade, é muito mais simples do que a aritmética decimal. O conjunto
completo de tabelas de multiplicação é:
Tabela 10.1
Decimal Binário Nº de bits
0 0 1
1 1 1
2 10 2
3 11 2
4 100 3
5 101 3
6 110 3
7 111 3
8 1000 4
9 1001 4
10 1010 4
Com 16 bits podemos ir até pouco mais de 65 000.
Figura 10.3 Um sinal binário
1×0=0
1×1=1
As regras de adição e subtração na aritmética binária são as mesmas da aritmética

decimal.
Porém, vejamos onde isso nos leva – não devemos deixar que um estudo de aritmética
binária, por mais breve que seja, nos distraia do objetivo principal, que é o áudio digital.
Após o processo de quantização, os números resultantes são convertidos em binário,

de modo que, por exemplo, o número 17 832, que representa uma amostra de cerca de um
quarto da altura máxima em um sinal de CD, quando convertido para binário torna-se
100010110101000. Agora, se cada 1 representa um pulso de tensão temos então o sinal
mostrado na Figura 10.3 .
Este é o tipo de código que queríamos. Pulsos individuais podem ser degradados, mas,
desde que ainda sejam apenas identificáveis, podem ser reconstruídos, se necessário.
Cada 1 ou 0 no áudio digital é chamado de bit, abreviação de dígito binário . A Figura
10.3 ilustra um número de 15 bits: há seis 1s e nove 0s. O número de bits dá uma
indicação da qualidade do sistema. CDs usam 16 bits. A comunicação por telefone pode
ser satisfatória com menos de dez.
Regeneração de pulsos
A Figura 10.4 compara um sistema analógico com um digital, ambos sujeitos a

interferência em cada seção. Os símbolos triangulares na cadeia analógica representam
amplificadores. Os geradores de pulsos são circuitos que detectam a presença de um
pulso, desde que não tenha sido muito danificado, e criam um novo em seu lugar.
Pelo que dissemos, pode parecer que a restauração dos pulsos digitais pode continuar
indefinidamente. Isso não é bem verdade. Eventualmente, haverá pulsos que estão muito
longe de serem regenerados e, embora a maioria dos sistemas digitais faça uso
de detecção e correção de erros – que descreveremos brevemente abaixo e explicaremos
um pouco mais detalhadamente na Parte 2 –, no final, haverá uma degradação
perceptível. No entanto, os dígitos fornecem uma maneira muito mais confiável e robusta
de lidar com qualquer tipo de sinal do que o analógico é capaz. Vale a pena mencionar
que grande parte do sistema telefônico do Reino Unido usa sinais digitais para
distribuição – para melhorar a qualidade e também para economia.
Figura 10.4 Regeneração de (a) sinais analógicos, (b) pulsos em um sistema digital
Tomando um sistema de 16 bits e com uma taxa de amostragem de pouco mais de 44

kHz (na verdade, 44,1 kHz), é possível atingir uma faixa de frequência tão baixa quanto
desejamos até 20 kHz. A faixa de áudio completa é facilmente coberta. E quando se trata
de relações sinal-ruído, cerca de 100 dB podem ser cobertos. Tudo parece bom demais
para ser verdade. Não surpreendentemente, há uma penalidade e este é o número de bits
por segundo a serem manipulados. Alguma aritmética muito simples pode mostrar isso.
taxa de bits
Com 16 bits para cada amostra e cerca de 44.000 amostras por segundo, temos
16 × 44.000 = 704.000 bits/segundo

E isso é para mono! Dobre o número para estéreo e descobrimos que precisamos de
1.408.000 por segundo ou 1,4 megabits/segundo! Veremos mais adiante que há muito
mais dados para encaixar, como a detecção de erros que mencionamos, e podemos chegar
a mais de 4 milhões de bits por segundo.
Agora, a fita analógica comum grava até 20 kHz e, embora não seja correto dizer que
a frequência em hertz é precisamente a mesma que em bits por segundo, a discrepância
entre 20 kHz e 4 MHz é claramente enorme. A gravação em fita convencional
simplesmente não consegue lidar com o áudio digital. Trataremos da fita digital no
próximo capítulo, mas é suficiente, por enquanto, mostrar que um preço deve ser pago
pela qualidade potencialmente alta que o áudio digital pode oferecer.
Tabela 10.2
Amostra original Número Adicionar bit de Nova amostra Novo

de 10 bits de 1s paridade? número de
1s
0011100101 5 Sim 0011100101 1 6
1100110011 6 Não 1100110011 0 6
0001010110 4 Não 0001010110 0 4
1000100010 3 Sim 1000100010 1 4
O bit de paridade está em negrito e itálico.
Detecção de erro
Já mencionamos que, com sistemas analógicos, não há uma maneira realmente eficaz de
detectar erros de qualquer tipo.
É um pouco diferente com os dígitos. Um método simples, mas com certas limitações,
muito eficaz e amplamente utilizado é conhecido como paridade. O que acontece é
isso. Antes de gravar ou transmitir uma amostra, o número de 1s nela é contado e, se
necessário, compensado para ser um número par. Um bit de paridade é adicionado, um 0
se já houver um número par de uns, um 1 se houver um número ímpar de 1s. Assim, cada
amostra gravada ou transmitida contém um número par de 1s.
Suponha que ocorra um erro de modo que um 1 seja destruído ou um 1 espúrio apareça
onde deveria haver um 0. Haverá agora um número ímpar de 1s. Portanto, no replay ou
no final do recebimento, quando os 1s são contados e um número ímpar é encontrado em
uma amostra, o sistema sabe que ocorreu um erro e podem ser tomadas medidas para
reduzir o efeito. Uma dessas etapas é repetir a amostra anterior e, como elas têm apenas
1/44.000 de segundo de diferença, é provável que o engano não seja percebido. A Tabela
10.2 pode ajudar a esclarecer o cálculo da paridade. Para simplificar, ele usa um sistema
de 10 bits.
Claro, isso aumenta o número de bits/segundo, mas apenas em uma pequena
proporção.
Outras aplicações de áudio digital
Os leitores familiarizados com o computador sem dúvida já perceberam que há uma

grande semelhança entre os sinais de áudio digital e os pulsos elétricos usados nos
computadores. Nesse caso, os computadores não poderiam ser usados com áudio
digital? A resposta é sim. De fato, a edição digital mencionada mais adiante utiliza a
tecnologia do computador para realizar sua tarefa. No entanto, podemos ir além disso, e
pode ser suficiente aqui fazer apenas delinear alguns dos processamentos que podem ser
realizados.
atraso digital
Assim como em um computador os dados podem ser armazenados em chips de memória,

as amostras de áudio digital podem ser armazenadas em chips (enquanto a energia estiver
ligada!). Isso significa que, com memória suficiente, um sinal digital pode ser alimentado
em uma unidade de atraso e emergir da saída pouco tempo depois - talvez de uma fração
de segundo até vários segundos. Os usos para isso são muitos. Uma pequena lista de
aplicações é:
1. Para adicionar realismo na reverberação (consulte 'Reverberação artificial' abaixo).
2. Como efeito na música (geralmente não na música clássica!) e drama.
3. Para auxiliar no 'rastreamento duplo automático' (ADT), onde um único vocalista aparece
para cantar um dueto. Um pequeno atraso de alguns milissegundos, de preferência com
um elemento de mudança de tom (veja abaixo), pode ser muito eficaz.
4. Para melhorar a inteligibilidade no trabalho de PA (endereço público).
5. Para habilitar o que é chamado de 'atraso de palavrões' em alguns programas de rádio por
telefone. Tudo passa por um atraso de talvez cerca de 15 segundos. Se o chamador usar
linguagem inaceitável, o apresentador do programa pressiona um botão que exclui o
conteúdo da loja, incluindo as palavras indesejadas. A eletrônica inteligente aumenta
gradualmente o atraso, de modo que o fato de que algum material foi removido é quase
imperceptível. No entanto, requer um apresentador muito capaz e de raciocínio rápido.
reverberação artificial
'Eco', como muitas vezes é chamado de forma imprecisa, já foi criado por alto-falantes e
microfones em salas reverberantes; mais tarde, placas de aço especiais foram usadas e
podiam ser colocadas em vibração eletricamente para dar uma imitação muito aceitável
de reverberação. Ambos os métodos eram volumosos e caros.
Mais barato e mais compacto era o reverberador de mola, no qual uma ou mais molas
eram colocadas em vibração por um pequeno transdutor fixado à(s) mola(s) com um outro
transdutor para captar as reverberações. Unidades muito caras eram razoavelmente boas,
mas as baratas pareciam - bem - molas vibrantes!
O advento do áudio digital mudou tudo isso. Em um dispositivo de reverberação
digital, os dígitos de entrada são armazenados em chips de memória e, em seguida,
liberados de maneira cuidadosamente controlada, de modo que haja uma amplitude de
saída aleatória e constantemente decrescente.
Isso pode simular a reverberação natural de maneira notavelmente eficaz e

normalmente haverá controle do tempo de reverberação junto com várias outras
características. Torna-se possível, então, produzir, dentro de limites bastante amplos,
quase qualquer tipo de reverberação necessária. Unidades de reverberação digital
modernas podem ter um custo comparável a uma máquina de fita cassete decente e
ocupam menos espaço. Existem outros, com facilidades mais completas, que custam dez
vezes mais, mas para muitos fins os mais baratos podem ser adequados.
Atraso
Uma maneira de criar melhor realismo com reverberação artificial é fazer uso de
atrasos. Isso pode ser feito com uma unidade de atraso como mencionado acima, mas
muitos dispositivos de reverberação digital têm atrasos variáveis embutidos. A razão para
ter um atraso é esta. A combinação ouvido/cérebro humano é muito boa para detectar
pequenos intervalos de tempo, como aqueles que ocorrem, digamos, em uma sala quando
os ouvidos recebem primeiro o som direto da fonte e depois a primeira reflexão, como é
chamada, vindo de uma parede, piso ou teto. Se o atraso entre o som direto e a primeira
reflexão for maior do que cerca de 40 ms (=1/25 segundo), então a pessoa está ciente de
um intervalo de tempo. Essa é a definição adequada de 'eco' - quando alguém está ciente
de um intervalo de tempo entre dois sons.
Se esse intervalo de tempo – o atraso de tempo inicial (que já mencionamos

no Capítulo 3 ) – for menor que cerca de 40 ms, o cérebro não reconhece o intervalo como
tal, mas, no entanto, está subconscientemente ciente dele e usa as informações para avaliar
o tamanho da sala. (Tente vendar alguém e levá-lo para uma sala em que nunca esteve
antes. Depois de alguns momentos de conversa, quase sempre descobrirá que a pessoa
pode fazer um julgamento aproximado do tamanho da sala.) Para recriar um artificial
convincente reverberação, então, significa usar um atraso de tempo apropriado, bem
como o tempo de reverberação correto. Para dar um exemplo, um grande salão só será
totalmente simulado se um tempo de reverberação longo, talvez 2 ou 3 segundos, for
usado com um atraso inicial de talvez 20 ou 30 ms.
Mudança de tom
Se alguém imaginar amostras digitais sendo alimentadas em um conjunto de lojas, mas

depois retiradas em uma taxa ligeiramente diferente, veremos, esperamos, que o efeito
será alterar o tom do original. A Figura 10.5 mostra em forma esquemática simples o
princípio da alteração digital da afinação.
Na Figura 10.5 , as caixas marcadas A, B, ..., n representam armazenamentos de

memória digital. Imagine o 'interruptor eletrônico de entrada' movendo-se ao redor do
círculo, colocando uma amostra digital em cada loja por vez. O 'interruptor eletrônico de
saída' lê o conteúdo de cada armazenamento e então o esvazia para que esteja pronto para
outra amostra. As amostras que são lidas serão finalmente convertidas de volta em sinais
analógicos.
Figura 10.5 Mudança de pitch simplificada
Suponha, porém, que a chave de saída gire mais rápido que a de entrada. O efeito será
que o tom da saída analógica será mais alto que o tom da entrada. O leitor, sem dúvida,
se perguntará como isso pode ser um processo contínuo, porque mais cedo ou mais tarde
um interruptor alcançará ou será alcançado pelo outro! Na verdade não pode, mas com o
uso de tecnologia inteligente pode-se dar a impressão de que é contínuo. O leitor curioso
e intrigado é encaminhado para a seção 'Leitura adicional'.
MIDI
Isso significa Interface Digital de Instrumento Musical. Isso realmente se relaciona com
a música eletrônica, mas uma breve menção pode não ser inapropriada aqui.
MIDI não é um dispositivo específico, mas um padrão internacionalmente aceito para

conectar dois ou mais instrumentos eletrônicos. O link MIDI carrega informações sobre
os horários de início e fim de uma nota, sua afinação e outros dados para que, por
exemplo, um órgão eletrônico ou um PC comum com o software correto possam 'acionar'
outros equipamentos. Um instrumento típico, como um sintetizador, pode ser capaz não
apenas de gerar MIDIdados, mas também para receber MIDI de outra fonte e depois
passá-los para outro instrumento. A lista de livros no final sugere leitura adicional
adequada.
Compressão de dados
Isso significa reduzir o número de bits em uma amostra de áudio sem uma redução séria
na qualidade. Graças a um desenvolvimento bastante recente do áudio digital, é possível
recorrer a truques muito inteligentes, mas legítimos, aproveitando as características do
ouvido humano.
Para começar, existem muitos 'sons' que não podemos ouvir: frequências na região de
30 Hz, a menos que sejam de nível alto, por exemplo. O ouvido normal é cerca de 70 dB
menos sensível a 30 Hz do que a cerca de 3 kHz e não é particularmente sensível às
frequências de áudio mais altas acima de cerca de 3 kHz. Além disso, certos sons podem
ser 'mascarados' por outros. Já se sabe há algum tempo que um som em um determinado
nível pode tornar o ouvido bastante insensível às frequências próximas (geralmente mais
altas) em um nível mais baixo.
Fazendo uso de circuitos que, por assim dizer, imitam essas características do ouvido
humano, é possível evitar a gravação dos sons indetectáveis. Existem vários
processos. Uma delas é conhecida como Precision Adaptive Subband Coding (PASC)
ou codificação perceptual, e permite descartar até cerca de 80% dos dados
originais. Outro método, usado pelos MiniDiscs (dos quais mais tarde) é chamado
ATRAC, que significa Adaptive Transform Acoustic Coding. O MP3 também usa
compactação de dados inteligente.
Terminologia adicional
Dois termos merecem uma breve menção:
1. ADC: conversor analógico-digital. Este é o dispositivo (na forma de um chip) que amostra
o sinal analógico e fornece uma saída digital. O dispositivo complementar é o
2. DAC: conversor digital-analógico, que traduz um sinal digital de volta para analógico.
Questões
1. A taxa de amostragem usada em discos compactos é aproximadamente quantas vezes por

segundo?
a. 44 000 b. 48 000 c. 65 000 d. 704 000
2. O que representaria o número binário 1001 na aritmética ordinária?
a. 5 b. 7 c. 9 d. 11
3. O que significa MIDI?
a. Instrumento digital integrado musical
b. Inserção Direta de Instrumento Musical
c. Inserção Digital Integrada Musical

d. Interface digital de instrumentos musicais
10 Áudio digital
Parte 2
Discos compactos
O componente vital em um CD player é o laser, e sem ele seria impossível fazer CDs ou
reproduzi-los. Então, o que é um laser? É claro que é uma fonte de luz, mas a luz que
emite é particularmente pura, pois consiste em apenas um comprimento de onda. A luz
comum, como se sabe, é composta por uma ampla gama de comprimentos de onda e isso
causa dificuldades quando a luz é focalizada com uma lente. Os vários comprimentos de
onda são tratados de forma ligeiramente diferente e isso pode ser visto nos efeitos de cor
quando se olha através de uma lupa comum. O efeito é particularmente perceptível perto
das bordas da lente. As lentes para câmeras de alta qualidade são projetadas para reduzir
essa aberração cromática,como é chamado, a níveis aceitáveis. O feixe de um laser,
porém, é tão puro que pode ser focalizado com extrema precisão com uma lente bastante
simples.
Ao fazer um CD, o feixe de luz de um laser é modulado – isto é, feito para flutuar em
brilho – com o sinal de áudio digital a ser gravado e então focalizado no disco mestre em
rotação. Um material adequado na superfície do disco é gravado pelo feixe intenso,
produzindo um padrão de pontos correspondente ao sinal digital. Cópias precisas do
mestre podem ser feitas tomando moldes e, finalmente, extrudando o plástico nos
moldes. O processo não é diferente daquele usado para fazer discos de gramofone
tradicionais.
Na máquina de replay, um laser de baixa potência é focado na pista e a luz refletida é

detectada e convertida em sinais elétricos. Após uma decodificação adequada, acabamos
com um sinal de áudio de alta qualidade. A ótica de um CD player é mostrada na Figura
10.6 .
A grade de difração mostrada no diagrama é um dispositivo que consiste em muitas

linhas gravadas estreitamente espaçadas que agem para produzir imagens separadas da
passagem de luz. (Com luz branca, uma grade desse tipo cria cores espectrais. Elas são
facilmente vistas quando um CD é mantido em ângulo reto com a luz, as faixas do disco
agindo como uma grade. A mesma coisa ocorre com a madrepérola devido à existência
de linhas finas na superfície.)
Figura 10.6 A ótica de um CD player
A razão para colocar a grade de difração é produzir feixes adicionais que terminam
nos sensores de luz do lado direito. Estes são usados para direcionar o feixe de laser sobre
a superfície do disco. Uma tendência ao desvio é mostrada por um sinal aumentado em
um dos sensores de ponto lateral e um sistema mecânico retorna o laser ao alinhamento
correto. Como os pontos laterais fazem isso é mostrado na Figura 10.7 .
Para dar uma ideia da finura das faixas de um CD, elas têm cerca de 0,5 μm de largura
(0,5 milionésimo de metro) e os centros das faixas estão separados por 1,6 μm. Em termos
mais simples, existem cerca de 600 faixas por milímetro.
Para adicionar fatos e números sobre CDs, o tempo máximo de reprodução é de cerca
de 75 minutos. O tempo máximo de replay é sempre dado como 74 minutos, mas na
verdade pode ser um pouco mais do que isso. CDs com duração de 76 minutos não são
incomuns! O comprimento da pista é de aproximadamente 5,5 km, ou pouco menos de
3,5 milhas! O disco é feito para girar de modo que a velocidade de varredura do laser
seja constante. Isso significa que os dados são lidos a uma taxa constante. Para conseguir
isso, a velocidade de rotação deve variar de cerca de 500 rpm no interior a 200 rpm no
exterior. Colocamos as cifras nessa ordem porque o início é por dentro e o fim por fora –
ao contrário de um disco de vinil convencional.
Figura 10.7 Como os pontos laterais garantem o rastreamento correto
Correção de erros
Alguns métodos muito poderosos de detecção e correção de erros são incorporados aos
CD players. Estes são necessários porque é impossível garantir a perfeição na fabricação
de discos em bases comerciais. Basta segurar um CD, especialmente um produzido há
pelo menos alguns anos, em frente a uma lâmpada brilhante para ver muitos minúsculos
pontos de luz. Eles podem ser muito pequenos – talvez apenas um centésimo de milímetro
em alguns casos, mas mesmo isso representaria uma perda significativa de dados. (Pode
ser que a fabricação de CDs tenha melhorado. Tenho a impressão de que os CDs recentes
que comprei mostram menos pontos de luz do que os comprados há alguns anos. Pode
ser, é claro, que eu tenha sorte!)
A velocidade de gravação, ou seja, a velocidade da trilha sob o feixe de laser, é de

cerca de 1,2 m/s. Um orifício de apenas 1/100 mm de diâmetro é atravessado pelo feixe
em aproximadamente 1/100 de milissegundo. Agora, já apontamos que um sinal digital
estéreo requer quase 1,5 milhão de bits/segundo, portanto, mesmo esse minúsculo pinhole
representaria algo em torno de 15 bits.
A história completa da detecção e correção de erros de CD (e outros digitais) está

além deste livro, mas basta dizer que um bom reprodutor compensará 'buracos' de até 2
mm de diâmetro.
Uma experiência que pode ser tentada é pegar uma caneta hidrográfica com
tinta lavável NÃO permanente e traçar uma linha radial ao longo do disco. Quandoa
tinta secou, reproduza o disco e se a linha for fina – menos de um milímetro – não deve
haver efeitos audíveis. Em seguida, torne a linha mais larga em etapas até que o jogador
silencie ou repita uma faixa. Por fim, limpe as linhas e o disco ficará tão bom quanto
antes! Eu demonstrei isso muitas vezes na frente do público – que geralmente fica muito
impressionado. Uma explicação resumida é dada na p. 150.
IMPORTANTE: nem o autor nem os editores podem aceitar qualquer responsabilidade
se o experimento der errado.
Devemos acrescentar que essa capacidade de corrigir os dados ausentes requer muito
mais bits do que os necessários apenas para o áudio. No momento em que todos os outros
dados, alguns para temporização, alguns para correção de erros e assim por diante, são
levados em consideração, a taxa de bits final é de pouco mais de quatro milhões por
segundo.
CDs de limpeza
Existem alguns dispositivos muito atraentes no mercado para a limpeza de CDs. A regra
1, porém, é não sujar o disco em primeiro lugar! Mantenha os dedos sujos – ou mesmo
limpos – fora da superfície (sem esquecer que a superfície importante é a não etiqueta, ou
parte inferior, do disco).
Se for necessário limpar um disco, um pano úmido passado

cuidadosamente nas faixas deve resolver o problema. Manchas ao longo da linha dos
trilhos podem dificultar a leitura dos dados pelo sistema. É por isso que a caneta de tinta
lavável no experimento acima é desenhada radialmente – ou seja, ao longo dos trilhos.
Custo dos leitores de CD
Há poucas evidências que sugiram que a qualidade do som de tocadores muito caros seja
melhor do que de tocadores muito mais baratos. É provável que haja mais recursos nos
caros, mas se eles são importantes depende do comprador. Nos primórdios dos CDs, a
correção de erros pode ter sido melhor nas máquinas caras, mas isso não parece mais ser
verdade. De maior importância é a forma como o sinal analógico extraído é tratado – a
qualidade dos amplificadores, alto-falantes, etc.
NICAM
Isso significa Multiplex de Áudio Companding Quase Instantâneo, a maioria dos quais
tentaremos explicar! A forma de NICAM usada para som estéreo para televisão é fruto
de duas tecnologias separadas. O primeiro, ao qual nos referimos brevemente
anteriormente, é um método de ocultar o sinal de som da televisão (originalmente mono)
com o sinal de imagem, de modo que apenas um caminho de sinal seja necessário dos
estúdios aos transmissores.
Figura 10.8 Um sinal de linha de televisão
A Figura 10.8 mostra uma voltagem típica de sinal de linha de televisão – quanto
maior a voltagem, mais brilhante a linha vai da esquerda para a direita na tela.
No final de cada linha, o receptor deve ser informado exatamente quando voltar para
a esquerda e iniciar uma nova linha – ele precisa de um sinal de sincronização. Isso
assume a forma do pulso de sincronismo de linha no diagrama, e o sinal de som da
televisão em formato digital é encaixado onde está o pulso de sincronismo de linha, daí o
termo som em sincronismo.
O sinal completo só é enviado desta forma até os transmissores. Antes de sair para os
receptores domésticos, o sinal digital é removido e convertido em um formato analógico
para transmissão e os pulsos de sincronização são restaurados, caso contrário, os
receptores teriam problemas para tentar sincronizar as linhas.
A forma original do NICAM, a outra tecnologia pai, era um método de redução do

número de bits/segundo. Operou quase instantaneamente ('Near Instantaneous') e
trabalhou para comprimir o número de bits, depois expandindo o número quando era
apropriado fazê-lo. Esse processo de compactação com expansão subsequente é
conhecido como companding. O A em NICAM significa áudio – bem, seria, não seria? –
e multiplexação significa combinar sinais juntos. Daí o NICAM.
Stereo NICAM para televisão é um método muito engenhoso de pegar sinais de som
estéreo em formato digital, aplicando um processo de compressão para ter um número
gerenciável de bits e ajustando o resultado na forma de onda de vídeo como uma nova
forma de som em sincronia. Isso acontece até os transmissores. Lá, o sinal estéreo é
encaixado em uma seção do sinal de televisão transmitido e atinge os receptores
equipados com NICAM dessa forma. Para benefício dos receptores não NICAM, uma
versão mono analógica é produzida nos transmissores e transmitida da maneira normal.
Além de estéreo, a qualidade digital é muito melhor do que o som comum da televisão,
embora não tão boa quanto a qualidade do CD, apesar do que alguns anúncios afirmam.
Um pouco mais sobre correção de erros
O leitor que tentou, ou ficou tentado a tentar, o experimento com uma caneta hidrográfica
à base de água e fazer marcas em um CD pode ter se perguntado como as lacunas se
tornaram inaudíveis.
Com quase todos os sistemas de gravação digital, os blocos de dados – ou seja, os 1s

e 0s que compõem uma amostra – são dispersos de acordo com um código universalmente
aceito. Isso é mostrado na Figura 10.9 . A linha superior representa os dados originais em
sua ordem correta. A linha do meio mostra o efeito da dispersão, enquanto a linha inferior
são os dados colocados de volta em sua ordem correta.
Agora suponha que houve uma grande perda de dados – talvez causada por uma
lacuna do tamanho de um orifício no disco, ou algum idiota desenhando linhas radiais
com uma caneta! Isso é mostrado pelo retângulo pontilhado e os blocos de dados D, H e
M são perdidos. No entanto, após a remontagem, esses blocos perdidos são bem dispersos
e, desde que não haja muita perda, várias verificações de paridade podem percorrer um
longo caminho para 'preencher' os dados ausentes.
Figura 10.9 Uso de um código de dispersão

Engenharia de som explicada

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Engenharia de som explicada

Enviado por

Direitos autorais:

Formatos disponíveis

Engenharia de som explicada, 2ª edição

Por Michael Talbot-Smith

Escreva o primeira revisão

O que são ondas sonoras?

1. Compressão – região onde o ar é comprimido. Nas ondas sonoras a compressão é

2. Rarefação – o oposto de uma compressão. A pressão do ar está ligeiramente abaixo do

3. ' Pressão barométrica estável ' – a pressão atmosférica normal do ar.

Apesar de as ondas sonoras serem longitudinais, sempre as desenhamos como ondas

Este é o número de ondas emitidas ou recebidas em um segundo. Até a década de 1950,

O ouvido humano normal pode detectar frequências de ondas sonoras na faixa de

Relacionado à frequência está o período – a duração de um ciclo. É igual a 1/f.

Com qualquer onda, a distância entre pontos correspondentes em ondas sucessivas é

Figura 1.2 Comprimento de onda

A velocidade das ondas sonoras

As ondas sonoras viajam no ar a cerca de 340 m/s, ou seja, v = 340 m/s.

Velocidade, frequência e comprimento de onda

Frequência × Comprimento de onda = Velocidade (ou f × λ = v)

Frequência × Comprimento de onda = Velocidade (ou f × λ = v)

Escrevendo de outra forma:

Comprimento de onda = Velocidade/Frequência (ou λ = v/f)

Colocando 340 m/s como a velocidade e 1000 Hz como a frequência, temos

Comprimento de onda = 340/1000 metros

= 0,34 metros (ou 34 cm)

Ondas sonoras e obstáculos

Se as ondas sonoras com um comprimento de onda curto atingem um objeto e são

A curvatura das ondas sonoras (difração)

A difração é a curvatura das ondas ao redor de um obstáculo. Essa curvatura só ocorre

A gama de observações simples é quase infinita.

Figura 1.3 Ondas sonoras atingindo um obstáculo

Unidades usadas no som

Isso é relativamente fácil. Em todos os equipamentos domésticos, a potência necessária

Figura 1.4 Difração em uma abertura

Potência é a taxa na qual o trabalho é feito ou na qual a energia é produzida ou consumida.

Para muitas pessoas, essa palavra provavelmente seria considerada sinônimo de

Em termos científicos, isso é definido como a força atuando em uma unidade de

Usando essas unidades, a pressão atmosférica normal ao nível do mar é de cerca de

O newton leva um pouco de explicação. É propriamente definida como a força que

Pressão é a força que age sobre uma unidade de área.

Intensidade sonora e o efeito da distância

I ∝ 1/d 2 ( ∝ significa 'é proporcional a')

As ressalvas importantes que mencionamos acima são:

1. A fonte sonora é pequena comparada com as distâncias envolvidas (teoricamente deveria

2. Não há superfícies refletoras nas proximidades.

Consequentemente, a Lei do Quadrado Inverso raramente se aplica com muita precisão

O decibel é uma unidade de comparação – basicamente de duas potências, mas

Às vezes é particularmente conveniente adotar potências, tensões ou pressões padrão

O decibel é uma unidade de comparação de duas potências, pressões, tensões, etc.

A velocidade das ondas sonoras

a –10°C a velocidade é de 325 m/s

a +10°C é 337 m/s

a +20°C é de 343 m/s.

Em outras substâncias além do ar, as ondas sonoras viajam em velocidades bem

A alta velocidade do som no hélio, cerca de três vezes a do ar comum, é responsável

Substância Velocidade (m/s)

dependendo do tipo de aço

Gás dióxido de carbono 259 (a 0°C)

gás hélio 965 (a 0°C)

1 bar = 100 000 Pa

(Os gráficos meteorológicos da televisão mostram as pressões do ar em milibares.)

Tabela 1.2 Frequências sonoras para diferentes comprimentos de onda

Frequência Comprimento de onda (metros)

2 kHz 0,17 (17 cm)