Engenharia de Som Explicada, 2 Edição

Engenharia de som explicada, 2ª edição
Por Michael Talbot-Smith
Escreva o primeira revisão
1 Ondas sonoras
Parte 1
Algum conhecimento inicial das ondas sonoras é essencial para que os capítulos
posteriores sejam totalmente significativos. A seguir, um breve resumo de suas
propriedades mais importantes. Fatos e números científicos são apresentados na Parte
2 , no final deste capítulo, para aqueles que possam achá-los úteis ou interessantes.
O que são ondas sonoras?
Eles são descritos como ondas de compressão e rarefação no ar. Isso significa que,
quando as ondas sonoras passam por um ponto fixo, a pressão atmosférica nesse ponto
fica ligeiramente acima e abaixo da pressão barométrica constante. Mas essas flutuações
são pequenas e rápidas demais para serem registradas por um barômetro. Um
microfone, por outro lado, pode ser pensado como uma espécie de barômetro elétrico
extra-sensível capaz de detectar essas rápidas flutuações na pressão do ar, ao contrário
de um barômetro normal, que só pode indicar mudanças de pressão relativamente
lentas. A Figura 1.1 mostra como seria uma onda sonora se pudéssemos vê-la.
DEFINIÇÕES
1. Compressão – região onde o ar é comprimido. Nas ondas sonoras a compressão é

realmente muito pequena.
2. Rarefação – o oposto de uma compressão. A pressão do ar está ligeiramente abaixo do

normal.
3. ' Pressão barométrica estável ' – a pressão atmosférica normal do ar.
Há uma compressão onde as linhas estão mais próximas e uma rarefação onde estão

amplamente espaçadas. Ondas desse tipo são chamadas de ondas longitudinais. As
ondas que vemos na água, por exemplo, são chamadas de ondas transversais porque os
pedaços individuais (moléculas) da água se movem para cima e para baixo quando a
onda é horizontal. Nas ondas longitudinais, como o som, as moléculas de ar oscilam de
um lado para o outro.
Figura 1.1 Compressão e rarefações
Apesar de as ondas sonoras serem longitudinais, sempre as desenhamos como ondas

transversais – é muito mais fácil!
Frequência
Este é o número de ondas emitidas ou recebidas em um segundo. Até a década de 1950,

a frequência era expressa em países de língua inglesa como tantos ciclos por segundo
(cps ou c/s), mas isso foi substituído pelo hertz, para comemorar o nome do físico
alemão Heinrich Hertz (1857– 1894), que foi associado aos primeiros trabalhos em
ondas de rádio. A abreviação é 'Hz'. Esta unidade é comumente encontrada em casa em
equipamentos alimentados pela rede elétrica, onde a frequência especificada do
fornecimento na maior parte da Europa é de 50 Hz.
O ouvido humano normal pode detectar frequências de ondas sonoras na faixa de

aproximadamente 16 Hz a cerca de 16 kHz (kHz = quilohertz ou mil hertz – 16 kHz é
16.000 Hz). A resposta do ouvido ao som será tratada mais detalhadamente no Capítulo
2 .
Relacionado à frequência está o período – a duração de um ciclo. É igual a 1/f.
Comprimento de onda
Com qualquer onda, a distância entre pontos correspondentes em ondas sucessivas é

denominada comprimento de onda. O símbolo usado para comprimento de onda é a
letra grega λ (pronuncia-se 'lambda'). A Figura 1.2 ilustra o comprimento de onda.
Amplitude
Esta é a 'altura' da onda em quaisquer unidades que sejam mais convenientes – no

trabalho elétrico, por exemplo, a amplitude pode ser expressa em volts ou ampères.
Figura 1.2 Comprimento de onda
A velocidade das ondas sonoras
No ar, em condições normais, as ondas sonoras viajam a cerca de 340 metros por
segundo (m/s). Isso é próximo a 760 milhas/hora, ou cerca de 1120 pés/segundo. A
velocidade varia um pouco com a temperatura do ar, por isso os instrumentistas de
sopro precisam, literalmente, aquecer seus instrumentos, pois a afinação depende da
velocidade com que as ondas sonoras oscilam dentro do instrumento. Para a maioria dos
propósitos práticos, além do exemplo que acabamos de citar, a variação na velocidade
da onda sonora com a temperatura não é importante. Os detalhes são fornecidos na Parte
2 deste capítulo. O símbolo para a velocidade da onda sonora é, neste livro, v.
As ondas sonoras viajam no ar a cerca de 340 m/s, ou seja, v = 340 m/s.
Velocidade, frequência e comprimento de onda
Essas três coisas estão ligadas por uma fórmula importante, mas felizmente simples. Um
momento de reflexão mostrará que, se, digamos, 1.000 ondas por segundo estão sendo
emitidas de uma fonte (ou seja, a frequência é de 1 kHz) e cada uma tem um
comprimento de onda de λ, então, após um segundo, as primeiras ondas emitidas estarão
a 1.000 × λ de distância . Ou, sua velocidade é de 1000 × λ metros por segundo.
O que fizemos foi multiplicar a frequência pelo comprimento de onda para chegar à
velocidade:
Frequência × Comprimento de onda = Velocidade (ou f × λ = v)
IMPORTANTE
Frequência × Comprimento de onda = Velocidade (ou f × λ = v)
Escrevendo de outra forma:
Comprimento de onda = Velocidade/Frequência (ou λ = v/f)
Colocando 340 m/s como a velocidade e 1000 Hz como a frequência, temos
Comprimento de onda = 340/1000 metros
= 0,34 metros (ou 34 cm)
Deve ser bastante óbvio que, se a frequência for dobrada (para 2 kHz), o
comprimento de onda será reduzido pela metade (para 17 cm) e assim por
diante. Cálculos simples nesse sentido mostrarão que a frequência mais baixa que o
ouvido normal pode detectar – 16 Hz – corresponde a um comprimento de onda de
cerca de 21 m (70 pés), enquanto na frequência mais alta, em torno de 16 kHz, o
comprimento de onda é de cerca de 2 cm, ou melhor, menos de uma polegada.
Veremos nas próximas duas seções que essa vasta gama de comprimentos de onda
apresenta problemas em muitas situações de gravação de som, pois o grau em que as
ondas sonoras são refletidas ou contornadas por obstáculos depende criticamente do
comprimento de onda.
Ondas sonoras e obstáculos
Everyone is familiar with echoes – sounds being reflected from a large building or a
cliff. What is perhaps not so obvious is that for this reflection to occur to any significant
effect the sound wavelength must be smaller than the dimensions of the reflecting
object. For example, the side of a building might be 10 m high and 20 m long. Sounds
striking this building at right angles will be reflected if their wavelength is less than 10
m – that is, for frequencies greater than about 30 Hz. The most predominant frequencies
in the human voice range from roughly 200 Hz to around 500 Hz, so a shout near to this
building will be easily reflected.
Por outro lado, se o objeto tiver dimensões menores que o comprimento de onda,
não haverá reflexão. Em vez disso, as ondas se curvam ao redor do objeto, um processo
chamado difração, do qual trataremos na próxima seção.
Se as ondas sonoras com um comprimento de onda curto atingem um objeto e são

refletidas, há o que é chamado de sombra sonora atrás do objeto. A Figura 1.3 mostra o
que acontece nos casos em que o comprimento de onda é maior (a) e menor (b) que o
obstáculo.
Não há divisão nítida entre reflexão e difração. Por exemplo, e tomando figuras

simples, suponha que temos um obstáculo que é uma placa rígida de um metro
quadrado. Um comprimento de onda de um metro corresponde a uma frequência de
cerca de 340 Hz. O que vai acontecer é que as ondas sonoras dessa frequência serão
parcialmente refletidas, com curvatura parcial ao redor da placa. Frequências em torno
de um terço de 340 Hz – cerca de 100 Hz – e o comprimento de onda de cerca de 3 m
será quase totalmente não refletido. Para um comprimento de onda de cerca de 30 cm,
haverá reflexão quase completa, sendo a frequência neste caso de cerca de 3 kHz. Uma
consequência de tudoé que em qualquer sala ou estúdio usado para gravação de som, o
efeito dos obstáculos pode ser muito difícil de prever, pois eles atuarão como refletores
para algumas frequências e não para outras. E neste contexto os obstáculos podem
significar estantes de partituras, pessoas, estojos de partituras e até os próprios
instrumentos!
A curvatura das ondas sonoras (difração)
Isso pode ser pensado como um efeito complementar à reflexão, pois as ondas que não
são refletidas serão contornadas por um obstáculo. Se o comprimento de onda for muito
maior que o tamanho do obstáculo, haverá uma curvatura marcada pelas ondas (há então
pouca reflexão). Se o comprimento de onda for pequeno, haverá pouca difração, mas
considerável reflexão. A Figura 1.3 (a) mostra a difração quase completa.
DEFINIÇÃO
A difração é a curvatura das ondas ao redor de um obstáculo. Essa curvatura só ocorre

com efeito significativo se o comprimento de onda for maior que as dimensões do
obstáculo (as dimensões como 'vistas' pelas ondas).
A Figura 1.4 mostra o que acontece quando as ondas sonoras passam por uma
abertura. Possivelmente ao contrário do que se poderia esperar, se a abertura for
pequena em relação ao comprimento de onda, há um espalhamento considerável do
feixe de ondas emergentes; se for grande, há pouco espalhamento. Muitas vezes é fácil
ver efeitos como este na água quando ondulações, ou mesmo ondas grandes, encontram
obstruções ou lacunas, por exemplo, nas paredes de um cais.
Existem muitos experimentos fáceis de realizar, mas altamente instrutivos, que o
leitor pode realizar por si mesmo. Por exemplo, tente segurar algo como uma prancheta
ou qualquer outra folha rígida de formato conveniente entre o ouvido e uma fonte de
som. Ver-se-á que as altas frequências da fonte são reduzidas no ouvido.
Em seguida, incline a placa para que os sons sejam refletidos no ouvido e veja qual
faixa de frequências é afetada. Observe como o caráter do som varia quando uma
aeronave passa atrás de uma casa, árvores ou outros objetos.
A gama de observações simples é quase infinita.
Vale ressaltar que todas as ondas, e não apenas as ondas sonoras, sofrem reflexão e
difração quando as condições são adequadas. Com a luz, por exemplo, os comprimentos
de onda são tão pequenos em relação ao tamanho dos objetos do dia-a-dia que
praticamente 100% de reflexão ocorre quase o tempo todo. A difração ocorre, mas os
efeitos geralmente não são óbvios.
Figura 1.3 Ondas sonoras atingindo um obstáculo
Unidades usadas no som

Será útil procurar maneiras de expressar a intensidade, ou poder, das ondas sonoras –
mas não, no momento, o que chamamos de 'intensidade'. Por várias razões que devem
vir mais tarde, no Capítulo 2 .
Poder
Isso é relativamente fácil. Em todos os equipamentos domésticos, a potência necessária

para operar o dispositivo é medida em watts (W é a abreviação) e isso será indicado em
algum lugar. Estamos acostumados com lâmpadas de 100 W, aquecedores de 3 kW
(quilowatts) e assim por diante.
Como as ondas sonoras são uma forma de energia, podemos legitimamente usar
watts como unidades de sua potência. No entanto, na prática, o watt é, em termos de
ondas sonoras, inconvenientemente grande para a maioria dos propósitos. Ou talvez
devêssemos dizer que o ouvido humano é tão sensível que precisamos de unidades
menores do que watts.
Figura 1.4 Difração em uma abertura
DEFINIÇÃO
Potência é a taxa na qual o trabalho é feito ou na qual a energia é produzida ou

consumida.
Uma unidade muito mais útil é o milionésimo de watt, ou microwatt. Isso
geralmente é escrito μW, sendo μ uma letra grega chamada 'mu' e geralmente usada
para significar 'um milionésimo'.
Neste ponto, o leitor não deve ficar confuso, ou possivelmente até alarmado, pelo
fato de que seus alto-falantes provavelmente têm rótulos citando potências muito
maiores do que as minúsculas potências, como um milionésimo de watt, que o ouvido
pode suportar. Os alto-falantes geralmente são classificados em muitos watts, 50 W ou
mais, mesmo para um sistema doméstico modesto. Esta potência refere-se à potência
elétrica máxima que pode ser alimentadano alto-falante sem causar danos ou distorção
grave. A potência sonora que sai provavelmente será de cerca de 1% ou 2% da potência
elétrica que entra no alto-falante - e apenas uma fração muito pequena disso
provavelmente entrará no ouvido do ouvinte!
Intensidade
Para muitas pessoas, essa palavra provavelmente seria considerada sinônimo de

sonoridade. No entanto, em termos científicos, tem um significado diferente. A
intensidade é definida como a energia caindo, emitida por ou passando por uma área
específica. As unidades possivelmente ajudam a deixar isso mais claro, sendo
watts/metro quadrado ou microwatts/metro quadrado, conforme o caso. Vamos escrevê-
los como W/m 2 ou μW/m 2 .
DEFINIÇÃO
Intensidade é a energia caindo, emitida por ou passando por uma área específica.
Pressão
Em termos científicos, isso é definido como a força atuando em uma unidade de

área. Muitos leitores devem ter visto 'libras por polegada quadrada' (psi) como uma
medida de pressão. (As pressões dos pneus dos carros são frequentemente dadas em psi:
cerca de 28 psi é um valor típico, embora a 'bar' seja a unidade métrica preferida.)
Usando essas unidades, a pressão atmosférica normal ao nível do mar é de cerca de

14 psi Unidades imperiais, como a libra e a polegada, não são recomendadas para
trabalhos científicos atualmente, portanto, devemos introduzir seus equivalentes
métricos. Estes são, para força, o newton (em homenagem a Sir Isaac Newton, 1642-
1727) e, para área, o metro quadrado novamente.
O newton leva um pouco de explicação. É propriamente definida como a força que

fará com que uma massa de 1 quilograma acelere a uma taxa de 1 metro/segundo a cada
segundo. Esta não é uma definição fácil de visualizar. O que é mais fácil de entender,
embora menos preciso, é que uma maçã média (e lembre-se da suposta associação entre
Sir Isaac Newton e maçãs!) Segura na mão exerce uma força para baixo, por causa da
gravidade, de aproximadamente 1 N (N = newton).
Assim, as pressões das ondas sonoras são normalmente dadas como tantos
newtons/metro quadrado, abreviado para N/m 2 .
Para complicar ainda mais, tornou-se prática oficial lembrar o cientista francês
Blaise Pascal (1623-1662), chamando o N/m 2 de pascal (Pa para abreviar).
Esta seção sobre unidades pode parecer pesada. O leitor não deve se preocupar
muito se for esse o caso, pois na maior parte do tempo nestelivro, usaremos essas
unidades apenas como base de comparação. A familiaridade trará, espera-se, não
desprezo, mas uma pronta aceitação deles.
DEFINIÇÃO
Pressão é a força que age sobre uma unidade de área.
Intensidade sonora e o efeito da distância
Dificilmente é preciso afirmar que os sons diminuem de volume quanto mais nos
afastamos da fonte do som. Aqui podemos ser um pouco mais precisos e indicar que a
intensidade (veja acima) diminui com a distância a uma taxa tal que, para
cada duplicação da distância, a intensidade (I) é dividida em quatro.
Para ajudar a entender isso, imagine um balão parcialmente inflado com um

quadrado de 1 cm × 1 cm desenhado nele. Agora, se o tamanho do balão for dobrado, o
quadrado passa a ter 2 cm × 2 cm – os lados dobram, mas a área aumenta quatro
vezes. A intensidade (potência por unidade de área) de uma onda sonora atingindo o
quadrado é, portanto, um quarto do que era inicialmente. (Existem cláusulas importantes
sobre essa lei, às quais trataremos em breve.) Essa relação entre intensidade e distância
é expressa por
I ∝ 1/d 2 ( ∝ significa 'é proporcional a')
onde d é a distância da fonte. Por exemplo, suponha que a uma distância de 1 m de uma

fonte sonora a intensidade I seja de 4 W/m 2 . A 2 m a intensidade será de 1 W/m 2 e a 8
m será um décimo sexto de W/m 2 , e assim por diante. Essa relação é conhecida
como Lei do Quadrado Inverso.
As ressalvas importantes que mencionamos acima são:
1. A fonte sonora é pequena comparada com as distâncias envolvidas (teoricamente deveria

ser infinitamente pequena). A Lei do Quadrado Inverso não se aplicaria a meio metro do
sino de uma tuba! Daria, no entanto, boas aproximações a algumas centenas de metros
de uma banda de metais completa.
2. Não há superfícies refletoras nas proximidades.
Consequentemente, a Lei do Quadrado Inverso raramente se aplica com muita precisão

na vida real. Por outro lado, muitas vezes pode ser usado como uma aproximação
valiosa.
decibéis
O decibel (dB para abreviar) é uma unidade muito útil, mas infelizmente pode causar
confusão e pavor até que seja completamente compreendido. Por essa razão, vamos nos
limitar aqui a não mais sobre o dB do que o absolutamente necessário, mas mais sobre
isso é dado na Parte 2 do capítulo.
O decibel é uma unidade de comparação – basicamente de duas potências, mas

também aplicável a pressões sonoras e tensões elétricas. Se duas potências, duas
pressões ou duas tensões são iguais então há 0 (zero) dB de diferença entre elas. No
caso do som, uma mudança de 3 dB na fala ou na música é quase detectável pelo ouvido
normal. E uma mudança de 10 dB representa, para a maioria das pessoas, o dobro ou a
metade do volume de um som. Essas, então, são aplicações práticas da ideia do dB
sendo usado para comparar potências ou pressões sonoras.
Às vezes é particularmente conveniente adotar potências, tensões ou pressões

padrão para fornecer referências com as quais outras potências, etc. podem ser
comparadas. Tais padrões são basicamente bastante arbitrários, mas são escolhidos, no
entanto, para serem úteis. Para dar um exemplo, o ouvido normal em sua maior
sensibilidade pode apenas detectar variações de pressão de ondas sonoras de 0,00002 Pa
(das quais falaremos mais adiante). Esta pressão particular é tomada como um padrão e
outras pressões sonoras podem ser citadas como tantos dB acima de 0,00002 Pa.
Estamos então no caminho certo para poder usar decibéis como unidades de volume.
Este é o mais breve dos resumos sobre decibéis, mas eles ocorrerão muitas vezes ao
longo deste livro. No entanto, a exposição gradual e contínua a eles os tornará cada vez
mais significativos para o leitor. Provavelmente sem muito esforço também.
DEFINIÇÃO
O decibel é uma unidade de comparação de duas potências, pressões, tensões, etc.
Ondas sonoras
Parte 2
A velocidade das ondas sonoras
Isso varia ligeiramente com a temperatura do ar, mas não, como geralmente se supõe,
com a pressão do ar, pelo menos não em todas as faixas de temperatura e pressão
normalmente encontradas.
A 0°C, a velocidade das ondas sonoras no ar pode ser considerada como 331 m/s, e
isso aumenta em 0,6 m/s para cada aumento de 1°C na temperatura.
Por isso:
a –10°C a velocidade é de 325 m/s
a +10°C é 337 m/s

a +20°C é de 343 m/s.
340 m/s é um valor razoável para usar em temperaturas ambientes normais.
Em outras substâncias além do ar, as ondas sonoras viajam em velocidades bem

diferentes ( Tabela 1.1 ).
A alta velocidade do som no hélio, cerca de três vezes a do ar comum, é responsável

pelas vozes agudas dos mergulhadores e de outras pessoas cujos pulmões e tratos vocais
contêm o gás. (Não é um experimento a ser tentado por mais do que alguns segundos!)
Tabela 1.1
Substância Velocidade (m/s)
Água 1480
Vidro 5200
Aço 5000–5900
dependendo do tipo de aço
Madeira 3000–4000
dependendo da madeira
Gás dióxido de carbono 259 (a 0°C)
gás hélio 965 (a 0°C)
Unidades
1. A barra. Esta é outra unidade de pressão, mas é mais comumente usada em meteorologia,

pois é aproximadamente igual à pressão atmosférica normal. Está relacionado com o
pascal por:
1 bar = 100 000 Pa
ou 10 μbar = 1 Pa
(Os gráficos meteorológicos da televisão mostram as pressões do ar em milibares.)

2. Ao lidar com pressões de ondas sonoras, é claro que devemos lembrar que as pressões
são alternadas. Deve-se então usar o conceito de uma pressão constante que é
equivalente à pressão alternada. Um problema semelhante ocorre na rede elétrica CA
(corrente alternada), que no Reino Unido é cotada como tendo uma tensão de 230 V. Na
verdade, a tensão da rede passa por um ciclo de no máximo cerca de 340 V, caindo para
zero e atingindo então um máximo de 340 V na direção oposta. Ele então volta a zero e
repete a operação, levando um quinquagésimo de segundo para cada ciclo (daí a
frequência de 50 Hz). Essa flutuação pode ser considerada equivalente em potência a
uma CC (corrente contínua) de 230 V. Os engenheiros usam o termo raiz quadrada
média (rms)para este equivalente. As pressões em Pa das ondas sonoras são
equivalentes da mesma forma.
Tabela 1.2 Frequências sonoras para diferentes comprimentos de onda
Frequênci Comprimento de onda

a (metros)
16 Hz 21h25
20 Hz 17,0
50 Hz 6.8
100 Hz 3.4
500 Hz 0,68
1 kHz 0,34 *
2 kHz 0,17 (17 cm)
5 kHz 0,068 (6,8 cm)
10 kHz 0,034 (3,4 cm)
16 kHz 0,021 (2,1 cm)
* Vale a pena notar que isso é aproximadamente igual a 1 pé.
A faixa de frequências coberta na tabela (16 Hz a 16 kHz) é aproximadamente a faixa

de frequências que o ouvido humano adulto normal pode detectar.
decibéis
Expresso corretamente, o número de decibéis representando uma razão de duas
potências é
dB = 10 log (relação de potência)
Se estivermos lidando com pressões ou tensões, a expressão torna-se
dB = 20 log(taxa de pressão) ou dB = 20 log(taxa de tensão)
Como exemplo, suponha que o amplificador de potência que alimenta um alto-falante

está fornecendo 50 W, mas é substituído por um que fornece 100 W:
o aumento dB é de 10 log(100/50)
= 10 registros(2)
= 10 × 0,3010 (facilmente encontrado em uma calculadora científica)
= 3,010 ou aproximadamente 3 dB
Será lembrado na Parte 1 do capítulo que esse aumento de 3 dB é quase detectável! Para
obter o dobro do volume do alto-falante, assumindo que ele suportará o aumento de
potência sem ser danificado, a potência deve ser aumentada em 10 dB. Isso significa
que o amplificador de 50 W terá que ser substituído por um de 500 W:
dB = 10 log(500/50)
= 10 registros(10)
= 10 × 1
Questões
Tente respondê-las da forma mais honesta possível. Você pode trapacear olhando as

respostas primeiro, mas isso não ajuda muito. As respostas são dadas no final do livro.
1. Que faixa de frequências de ondas sonoras o adulto normal pode detectar?
a. 160–1600 Hz b. 16–1600 Hz
c. 16–16 000 Hz d. 160–16 000 Hz
2. Qual é a velocidade das ondas sonoras no ar em temperaturas normais?

a. 300 m/s b. 340 m/s
c. 400 m/s d. 440 m/s
3. Uma sala destinada a gravações musicais tem a sua galeria sustentada por pilares de
secção quadrada. Estes são 0,5 m por 0,5 m de seção transversal. Qual faixa de
frequência do som será refletida de cada pilar?
a. Abaixo de aproximadamente 700 Hz b. Abaixo de aproximadamente 350 Hz
c. Acima de aproximadamente 700 Hz d. Acima de aproximadamente 350 Hz
2 Audição e a natureza do som

Parte 1
O mecanismo pelo qual as ondas sonoras são convertidas em percepção pelo cérebro é
extremamente complicado e partes dele ainda não são totalmente compreendidas. Este
livro não é o lugar nem mesmo para um relato limitado do assunto. É, no entanto, um
tema fascinante e o leitor que quiser saber mais deve consultar a lista de livros para
leitura complementar no final. Existem, no entanto, vários aspectos do processo
auditivo que são importantes no contexto da tecnologia de áudio e estes serão descritos
aqui.
A resposta do ouvido
Para começar, estamos lidando com uma faixa de frequência de cerca de 16 Hz a cerca
de 16 kHz. Esses números não são precisos. Na extremidade inferior, não é fácil dizer
quando o som deixa de ter um tom identificável e começa a se tornar uma espécie de
vibração. Valores de 16–20 Hz são citados por diferentes autoridades. A extremidade
superior depende do indivíduo e também da idade da pessoa. Vinte kilohertz podem ser
detectados por uma pessoa no final da adolescência; algumas pessoas de 60 anos podem
ter dificuldade em ouvir qualquer coisa acima de 8 ou 10 kHz. Os efeitos da exposição a
ruídos altos também podem ter um efeito muito significativo. Dezesseis quilohertz é, no
entanto, um número bastante bom para citar como o limite superior de audição para o
adulto médio.
Supõe-se, ou pelo menos espera-se, que dispositivos como microfones, gravadores e

alto-falantes tenham o que é conhecido como resposta de frequência plana. Ou seja,
eles respondem igualmente bem a todos os sons, independentemente da frequência. O
ouvido humano não é assim. A Figura 2.1 mostra um gráfico de um aspecto da resposta
do ouvido normal para toda a gama de frequências de ondas sonoras.
A curva sólida na Figura 2.1 é chamada de Limiar da Audição. Ele mostra a pressão

sonora mínima necessária apenas para criar uma sensação no ouvido. Aliás, é uma
curiosidade do ouvido que em níveis mais altos a curva de resposta é bem mais
achatada.
Figura 2.1 A resposta do ouvido a sons de baixo nível
O eixo horizontal representa a frequência. O eixo vertical está em dB relativo a uma

pressão sonora de 0,00002 Pa, à qual nos referimos no Capítulo 1 . (0,00002 Pa às vezes
é escrito como 20 μPa. Um lápis e o verso de um envelope podem confirmar que os dois
são iguais!) Este valor representa a pressão sonora que pode ser detectada apenas
quando o ouvido está mais sensível, o que para o ouvido normal é uma frequência de
cerca de 3 kHz. Um ponto importante a ser observado sobre o limiar da curva auditiva é
que uma pressão sonora muito maior é necessária para produzir uma sensação no
ouvido em baixas frequências do que em torno de 3 kHz. Em outras palavras, em níveis
de som baixos, o ouvido é muito insensível a baixas frequências. Também é insensível a
frequências muito altas, mas isso geralmente é menos óbvio na prática.
A insensibilidade do ouvido a baixas frequências pode ser facilmente demonstrada

ouvindo uma música com uma ampla faixa de frequência e diminuindo o volume para
um nível baixo. Ver-se-á que a música se torna 'toppy'. A perda de alta frequência que
ocorre ao mesmo tempo é menos aparente porque na maioria das músicas há
relativamente menos energia nas altas frequências do que nas baixas.
Muitos sistemas de áudio domésticos têm um controle de 'volume' que, quando

ativado, aumenta as baixas frequências conforme o volume é reduzido. (Pessoalmente,
tenho algumas dúvidas sobre o quão útil isso realmente é!)
Sonoridade. O dB(A)
O volume é um efeito subjetivo: em outras palavras, o volume de um som depende do

indivíduo que o experimenta. Portanto, não pode ser medido. É possível, no entanto,
fazer medições que concordam razoavelmente com as avaliações de sonoridade da
maioria das pessoas.
Sugerimos no Capítulo 1 que o decibel pode ser a base de uma unidade de medida,
mas uma medição direta da pressão sonora em decibéis obviamente não é boa o
suficiente, pois não levaria em consideração a resposta de frequência desigual do ouvido
normal. Se, no entanto, o dispositivo de medição incorporar um circuito de correção
elétrica que lhe dê uma resposta de frequência semelhante à do ouvido, podem ser feitas
aproximações razoáveis ao volume.
Tal circuito foi concebido há muitos anos e está incorporado em dispositivos

chamados medidores de nível de som. Estes têm um microfone, amplificador, medidor e
os circuitos apropriados para corresponder aproximadamente às características do
ouvido. Tais medições são cotadas com a unidade dB(A), significando decibéis com o
circuito 'A' incorporado. Eles são frequentemente
denominados medições ponderadas . (As características B e C também foram
concebidas, mas descobriu-se que o circuito A mais se aproxima das avaliações
subjetivas de sonoridade.) A Tabela 2.1 lista alguns sons típicos com suas 'intensidades'
em dB(A).
Pode ser importante notar que os regulamentos de ruído atuais no Reino Unido
exigem que os protetores auriculares sejam disponibilizados em um local de trabalho
industrial onde os níveis de ruído atinjam 85 dB(A). Acima de 90 dB(A) seu uso é
obrigatório e também os níveis de ruído do maquinário devem ser reduzidos, se
possível.
DEFINIÇÃO
O dB(A) é uma aproximação razoavelmente boa para a avaliação de sonoridade da

maioria das pessoas.
Tom musical
Com isso, queremos dizer a posição de uma nota na escala musical. O tom pode ser um
assunto muito complicado – como tantas outras coisas no som! Deve ser o suficiente
aqui para dar os contornos de alguns fatos básicos:
1. O tom está basicamente relacionado à frequência, mas o tom percebido de uma nota pode
ser afetado pelo volume.
2. O padrão de afinação é considerado um som com frequência de 440 Hz. Isso é conhecido

como 'Internacional A'. É a nota soprada, geralmente por um oboé, como um sinal de
afinação antes de uma apresentação orquestral. (Os oboés têm uma nota estável e
também um som muito penetrante que pode ser ouvido com razoável clareza pelos
outros membros da orquestra.)
3. Apesar do que foi dito em 1 acima é possível fazer uma tabela relacionando altura e
frequência. A nota designada C é aquela chamada 'Middle C' em um instrumento de
teclado. A Tabela 2.2 lista as frequências para diferentes notas de altura.
Tabela 2.1 Alguns 'volumes' típicos em dB(A)
Fonte dB(A)
Orquestra, fortissimo a 5 m 100 *
Rua movimentada, oficina 95
Orquestra, média a 5 m 80
TV doméstica, a 3 m 70
Fala a 1 m 60–65
Dentro do carro silencioso 50
dentro de casa tranquila 30
Dentro da tranquila igreja do interior 25
* Uma orquestra pode atingir picos momentâneos de 120 dB.
4. Uma oitava musical representa uma duplicação ou redução pela metade da

frequência. Assim, na Tabela 2.2 , a está uma oitava abaixo de A e sua frequência é
metade de 440 Hz. A oitava acima do dó central tem uma frequência de
aproximadamente 523 Hz.
5. Semitons adjacentes (por exemplo, de uma nota em um teclado para a adjacente acima ou
abaixo, o que pode significar ir de uma nota branca para uma preta, ou vice-versa) têm
frequências na proporção de cerca de 1,06:1. Em outras palavras, há uma diferença de
frequência de 6%. Uma nota elevada por um semitom é indicada pelo sinal de
'sustenido' #. Uma nota abaixada em um semitom é marcada como ' '.
O assunto do pitch é complicado. A Tabela 2.2 mostra o que é chamado de

escala temperada igual , a escala padrão para teclados enele C# é o mesmo que D . No
entanto, para um bom ouvido musical, essas não devem ser a mesma nota. Os teclados
têm afinação de compromisso!
Figura 2.2 Parte de um teclado
Qualidade musical ('timbre')
Por timbre (pronuncia -se 'tarmbre'), entendemos os fatores que permitem ao ouvido

distinguir um instrumento de outro. Um trompete e um saxofone produzem sons
claramente diferentes, mesmo que toquem a mesma nota de altura.
Existem dois fatores importantes na determinação do timbre:
1. Harmônicos. Estes são tons com frequências que são múltiplos exatos da frequência base
(chamada de fundamental). Um instrumento tocando a nota a = 220 Hz provavelmente
produzirá não apenas 220 Hz, mas também muitos múltiplos dessa frequência, como
440, 660, 880, 1100, 1320 e assim por diante. Geralmente, os vários harmônicos
diminuem em amplitude à medida que aumentam em frequência. Os músicos
geralmente se referem aos harmônicos como harmônicos , mas o primeiro harmônico é
o segundo harmônico e assim por diante.
2. Transientes iniciais. Por um breve período no início de uma nota – e isso pode ser tão
pouco quanto um centésimo de segundo, e raramente mais do que cerca de um quinto de
um segundo – existem frequências adicionais presentes que não são numericamente
relacionadas com a fundamental como o harmônicos são. Essas frequências
desaparecem rapidamente, daí o nome 'transitório'. Eles dependem, possivelmente entre
outras coisas, da maneira e da taxa em que as vibrações se acumulam em um
instrumento. Eles são uma espécie de impressão digital.
DEFINIÇÕES
A frequência fundamental em um som musical é a frequência mais baixa.
Frequências harmônicas são múltiplos da frequência fundamental.

Por alguma razão, o ouvido e o cérebro atribuem grande importância aos transientes
iniciais. Se forem removidos ou distorcidos, é possível que a qualidade percebida do
som instrumental seja radicalmente alterada, mesmo que apenas uma fração de segundo
tenha sido alterada no início de uma nota que dura vários segundos. Por exemplo, pode
ser quase impossível dizer a diferença entre o som de uma flauta e um trompete,
tocando a mesma nota constante, se os primeiros segundos dos sons forem suprimidos
de alguma forma.
Tabela 2.2 Frequências das notas musicais
Observaçã Frequência para Hz mais

o próximo
A 440
G# 415
G 392
F# 370
F 349
D# 330
D 294
C# 277
C 262 *
b 247
a# 233
a 220
* Também conhecido como 'Middle C'.
É importante perceber que as frequências necessárias para reproduzir

adequadamente o som de um instrumento musical ou da voz humana se estendem, por
causa dos harmônicos, muito além do alcance musical aparente. Por exemplo, a nota
mais alta de um piano tem uma frequência fundamental de pouco mais de 4 kHz. No
entanto, os harmônicos se estendem pela maior parte da faixa de áudio. Por exemplo,
tomando uma nota apenas duas oitavas acima do dó central e usando frequências
aproximadas para simplificar:
C médio = 262 Hz
uma oitava acima = 523 Hz
duas oitavas acima = 1046 Hz
O décimo harmônico do Dó central (que pode ou não ser muito significativo na

prática, dependendo do instrumento) é 10 × 1046, que é 10 460 Hz. As notas de topo de
um violino têm frequências fundamentais em torno de 3 kHz. O quinto harmônico de
tais notas é de cerca de 15 kHz.
Uma lista mais completa de faixas de instrumentos musicais é fornecida na Parte

2 deste capítulo.
A percepção do cérebro do som
São bem conhecidas as ilusões de ótica, nas quais o cérebro sobrepõe sua própria
interpretação ao que os olhos recebem como luz. As pessoas envolvidas com o som
precisam estar cientes de que existem equivalentes auditivos.
1. Para começar, é importante perceber que a memória realmente precisa do cérebro para

sons é muito curta – cerca de 1 a 2 segundos. Parapor exemplo, se dois alto-falantes de
boa qualidade, mas ligeiramente diferentes, devem ser comparados, isso deve ser feito
alternando diretamente de um para o outro – um processo às vezes conhecido como
'fazer comparações A–B'. É impossível fazer julgamentos confiáveis ouvindo um e
depois o outro com um dia de intervalo! As comparações entre um alto-falante bom e
um medíocre podem ser feitas com um intervalo de tempo, mas aqui estamos falando de
comparações precisas entre dispositivos de qualidade semelhante. Este é um tópico tão
importante que voltaremos a ele mais tarde.
2. É muito fácil para o sistema ouvido/cérebro ouvir o que ele acha que deveria ouvir! A
maioria dos operadores de som profissionais conhece casos em que ajustaram um
controle em um equipamento e ficaram bem satisfeitos com o resultado, apenas para
descobrir mais tarde que o controle havia sido desligado do circuito e, portanto, não
estava fazendo nada!
3. Às vezes, efeitos curiosos podem ocorrer em estéreo. Por exemplo, muitas pessoas que
ouvem gravações estéreo de aeronaves, nas quais a imagem do som da aeronave vai de
um alto-falante para o outro, descobrem que a imagem do som parece elevar-se acima
do nível dos alto-falantes e pode até parecer ser a sobrecarga. A explicação é claramente
que o cérebro associa o ruído da aeronave com a altura e então imagina um efeito de
altura mesmo quando as fontes sonoras reais estão ao nível do ouvido.
4. O sistema ouvido/cérebro tem uma capacidade extraordinária de discriminar sons que
considera sem importância. Ele pode fazer isso porque, por ter dois ouvidos, o cérebro
pode localizar a direção dos sons desejados. Às vezes, esse efeito é chamado de efeito
coquetel. (Você pode adivinhar o porquê!) Os microfones, mesmo quando há dois em
estéreo, não podem fornecer essa discriminação, ou pelo menos em um pequeno grau,
de modo que o que pode parecer ser condições acústicas aceitáveis quando um ambiente
é ouvido 'ao vivo ' pode revelar-se totalmente inaceitável, por motivos de ruído de fundo
ou reverberação excessiva, quando uma gravação é reproduzida.
5. O item restante nesta lista curta é conhecido como Efeito Haas. Dito brevemente, se sons
semelhantes chegam aos ouvidos de um ouvinte, então os sons que chegam primeiro
determinam a direção aparente da fonte sonora, mesmo que o som que chega mais tarde
possa ter um nível de até 10 dB mais alto. O leitor pode verificar isso alimentando um
par de alto-falantes estéreo com uma fonte mono e, em seguida, movendo-se em direção
a um dos alto-falantes para que o som dele chegue primeiro aos ouvidos. Isso fará com
que a imagem do som mono se mova para aquele alto-falante. É improvável que o ajuste
do controle de equilíbrio para aumentar o nível no outro alto-falante mude a imagem até
que haja uma diferença de volume muito apreciável entre eles.
Uma comparação precisa de dois dispositivos de áudio semelhantes (como dois alto-
falantes) só pode ser feita alternando rapidamente de um para o outro. Isso é chamado
de 'comparação A–B '.
Audição e a natureza do som

Parte 2
Tom
Dissemos anteriormente que a relação de frequência entre dois semitons adjacentes era
de aproximadamente 6%. Em termos científicos (mas não necessariamente musicais), o
número exato é
12
2 (a décima segunda raiz de 2)
Este é o número que, multiplicado por si mesmo 12 vezes, é igual a 2 e é

1,0594631. Uma mudança de tom de um semitom é, portanto, equivalente a uma
mudança de frequência de 5,94631%. (Seis por cento é uma aproximação boa o
suficiente para a maioria dos propósitos!)
O raciocínio por trás da matemática é que existem 12 'intervalos' de semitons iguais em

uma oitava, que em si é uma relação de frequência de 2:1. Cada passo deve, portanto,
ser 12 2.
O leitor interessado com uma calculadora científica pode tentar inserir 1,0594631 na
memória da calculadora e, em seguida, usar Memory Recall 12 vezes da seguinte
maneira:
RM × 1,0594631 = 1,122462
MR × 1,122462 = ... e assim por diante, num total de 12 vezes.
O resultado final será 2, ou algo bem próximo disso, dependendo da calculadora.
Faixas de frequência na música
A Tabela 2.3 fornece as faixas aproximadas de frequências fundamentais de alguns sons

musicais. A faixa das notas mais baixas às mais altas é frequentemente chamada de
bússola do instrumento ou da voz. Em cada caso, os harmônicos estenderão a frequência
superior, em alguns casos consideravelmente.
Figura 2.3 Parte de um teclado
'falso baixo'
Este é o nome dado a um efeito interessante pelo qual o sistema ouvido/cérebro pode, de
alguma forma, parecer inserir frequências muito baixas que deveriam estar presentes,
mas que não são reproduzidas. Pode ser que o cérebro reconheça uma série de
harmônicos como baseados em uma frequência específica e compense mentalmente essa
frequência se ela não estiver presente.
Para dar um exemplo, a Tabela 2.3 mostra que as notas mais baixas de um grande
órgão de tubos podem chegar a 15 Hz. Existem muito poucos alto-falantes que podem
reproduzir frequências tão baixas e, no entanto, nossos ouvidos geralmente não
percebem essa deficiência.
Tabela 2.3 Faixas de frequência aproximadas de sons musicais
Fonte Frequência (Hz)
de para
Cantora 250 1000
Cantor masculino 100 350
Flauta 250 2500
Fagote 60 600

Saxofone alto 125 650
Trompete 200 1000
Violino 200 3500
Violoncelo 70 600
Piano 30 4000
Órgão de tubos (grande) 15 8000
Xilofone 700 4000
Questões
1. Decibéis podem ser apropriados para comparação em dois dos seguintes. Que dois?
a. Duas frequências b. Duas pressões sonoras
c. Duas sonoridades d. Dois fundamentos
e. dois poderes f. Dois alto-falantes
2. Uma nota tem uma frequência de 200 Hz. Qual é a frequência da nota uma oitava acima?
a. 212 Hz b. 300 Hz c. 400 Hz d. 2000 Hz
3. E qual seria a frequência de uma nota uma oitava abaixo?
a. 10 Hz b. 50 Hz c. 100 Hz d. 188 Hz
7 estéreo
Parte 1
A palavra 'estéreo' vem de uma palavra grega que significa 'sólido'. 'Visão

estereoscópica' significa perceber as coisas como sólidas quando vistas com os dois
olhos. Embora o termo '3D' tenha se tornado o padrão (mais fácil de soletrar!),
'estereoscopia' ainda é basicamente correto. A partir daí, foi apenas um pequeno passo
para estender a parte 'estéreo' ao som e, portanto, temos 'estereofonia', ou 'estéreo' para
abreviar.
Há uma espécie de solidez, de certo modo, quando as imagens sonoras se espalham

diante do ouvinte. Aqui vamos lidar com a forma usual onde há dois alto-falantes, duas
faixas em uma fita, e assim por diante. Na verdade, o som estéreo pode ter qualquer
número desses canais – há boas razões para dizer quanto mais, melhor – mas aspectos
práticos como a economia significam que dois é a norma, pelo menos no momento. Isto
não é para ignorar o fato de que existem várias versões comerciais que possuem três
alto-falantes, muitas vezes com o alto-falante principal de graves no centro. Isso é
justificado pelo fato de frequências muito baixas serem muitas vezes indeterminadas em
sua direção. No entanto, vamos lidar com sistemas de dois canais.
Neste capítulo, consideraremos como o estéreo funciona e examinaremos as técnicas

para produzir estéreo.
Como funciona o estéreo
Para começar, precisamos considerar como localizamos os sons na vida real. Vários

fatores entram nisso, incluindo pistas visuais. À primeira vista, pode-se pensar que as
intensidades relativas do som nos dois ouvidos seriam o principal ingrediente na
localização do som, mas embora isso possa ter significado em algumas condições, o
fator mais importante acaba sendo a diferença de tempo de chegada em as duas orelhas.
Se uma fonte de som está diretamente na frente de uma pessoa, então claramente
não há diferença no tempo que os sons dessa fonte levam para chegar aos ouvidos. No
caso de um som vindo de qualquer direção, exceto dofrente, então haverá uma diferença
de hora de chegada. (Não vamos nos preocupar aqui com sons que se originam acima ou
abaixo do nível dos ouvidos). é aproximadamente 1 ms (1 milissegundo = 1/1000
segundo). O que é bastante interessante é que, em condições de escuta razoavelmente
boas, a maioria das pessoas pode detectar quando uma fonte de som se moveu cerca de
1° a partir do eixo frontal, e isso representa uma diferença de tempo de chegada nos
ouvidos de aproximadamente 10 μs – dez milionésimos ou centésimo milésimo de
segundo! Como o cérebro faz isso não está claro.
Diferença de tempo de chegada – Em geral, o som de uma determinada fonte chegará

aos ouvidos de uma pessoa em momentos ligeiramente diferentes. Isso é importante
para detectar a direção aparente da fonte.
(A questão de como localizamos os sons que estão acima ou atrás da cabeça ainda é
um pouco obscura. Os movimentos da cabeça ajudam a localizar a origem de um som.
para cada movimento da cabeça, o cérebro pode realizar cálculos que permitem ao
ouvinte diminuir a incerteza. Além disso, há evidências de que as dobras no ouvido
externo - a parte visível - podem criar reflexões múltiplas em altas frequências e o
padrão dessas reflexões vai depender do ângulo de incidência do som.)
Segue-se que, para recriar a informação direcional para um ouvinte, pelo menos em
uma área frontal, precisamos criar diferenças de tempo de chegada nos ouvidos da
pessoa.
Assumindo que o ouvinte estará sentado em frente a um par de alto-falantes e

equidistante deles, não pode haver diferenças significativas de tempo de chegada nos
ouvidos da pessoa. Eles podem ser criados no estúdio? À primeira vista, isso pareceria a
coisa óbvia a se fazer e, de fato, era o que se fazia nos primórdios do estéreo comercial,
deixando os microfones a uma certa distância. Infelizmente, isso geralmente não
funciona bem. Com um par de microfones espaçados, digamos, alguns metros ou mais,
o ouvinte pode ouvir duas imagens sonoras separadas, uma em cada alto-falante e nada
entre elas – uma situação geralmente descrita como hole-in-the-middle ou ' pingue-
pongue'estéreo. (Um estéreo agradável pode ser produzido se os microfones não
estiverem muito espaçados – talvez não mais do que um metro).
Agora acontece que se os sinais elétricos nos dois canais – os caminhos esquerdo e
direito dos microfones aos alto-falantes – diferem um do outro apenas em
amplitude, então uma dispersão razoável de imagens sonorasentre os alto-falantes pode
ser esperado. A explicação para isso está além do escopo deste livro, mas há explicações
legíveis em alguns dos livros listados no final. No momento, vamos simplesmente
afirmar que, para a audição de alto-falantes, é necessário que haja diferenças de
amplitude entre os dois canais – diferenças entre canais – e,
paradoxalmente, nenhuma diferença de tempo entre os sinais neles contidos.
Figura 7.1 Um par coincidente de microfones cardióides
Métodos de produção de diferenças entre canais
Em geral, existem duas técnicas, embora na prática seu uso geralmente se

sobreponha. Estes são:
1. Usando um par de microfones direcionais muito próximos. Eles são inclinados
simetricamente em torno de uma linha imaginária que aponta para o centro da área de
gravação. A Figura 7.1 mostra dois microfones cardióides posicionados dessa
maneira. Um par de microfones com os diafragmas o mais próximo possível forma o
que é conhecido como par coincidente.
Se os sons chegarem diretamente na frente dos dois microfones – 0° no diagrama –

então ambos os microfones receberão os mesmos níveis de som e as saídas serão
exatamente iguais. (É muito importante que os dois microfones tenham um desempenho
próximo. O mesmo vale para os alto-falantes em estéreo.)
Um som que sai do eixo central dos microfones, digamos de X no diagrama,

resultará em uma saída maior do microfone da direita do que da esquerda e isso nos dá a
necessária diferença entre canais.
Figura 7.2 Um panpot
2. Métodos puramente elétricos. A Figura 7.2 mostra de forma simplificada o que é

chamado de panpot (de 'potenciômetro panorâmico'). Um potenciômetro é uma
resistência elétrica variável com três terminais. Dois estão nas extremidades de uma
pista resistiva, enquanto o terceiro está conectado a um controle deslizante cuja posição
ao longo da pista pode ser alterada por meio de um botão.
Par coincidente – Dois microfones direcionais com seus diafragmas montados o mais
próximo possível.
A posição do controle deslizante, que neste caso está conectado à saída de um

microfone, determina qual proporção da saída do microfone é enviada para qual
canal. Isso nos dá uma segunda maneira de produzir diferenças entre canais.
Terminologia
É mais ou menos universal no mundo profissional do Reino Unido usar as seguintes

convenções em estéreo:
O canal ESQUERDO é indicado pela letra A e, quando apropriado, a cor

VERMELHA é usada para indicar isso – por exemplo, em cabos e em diagramas.
O canal DIREITO é indicado pela letra B e a cor é VERDE.

Essa convenção profissional é facilmente lembrada: na escrita, o alfabeto A está à
ESQUERDA de B; na navegação VERMELHO indica bombordo (ESQUERDA)
enquanto VERDE significa estibordo ou DIREITA.
Observe, no entanto, que em equipamentos domésticos L e R são normalmente

usados para esquerda e direita, e também a convenção de cores é diferente: BRANCO é
comumente usado para ESQUERDA e VERMELHO para DIREITA. Para aumentar a
confusão, os fones de ouvido podem ter AMARELO para a esquerda, com
VERMELHO ainda para a direita.
CONVENÇÕES ESTÉREO PROFISSIONAIS
A – esquerda, cor vermelha
B – direita, cor Verde
Audição estéreo
Já sugerimos que o ouvinte deve estar na linha central entre os dois alto-falantes e que
estes devem ser um par 'combinado'. E não só devem ser combinados em termos de
qualidade, mas devem ser 'balanceados' de modo que, se alimentados com exatamente o
mesmo sinal (ou seja, mono), a imagem sonora resultante seja verdadeiramente
central. (Como verificar a correspondência é explicado abaixo, assim como as formas de
obter um sinal mono.)
Se o equilíbrio estiver incorreto, é uma questão de corrigir isso ajustando os

controles de ganho (volume) nos amplificadores que alimentam os alto-falantes ou
ajustando o controle de equilíbrio, se houver um, como geralmente ocorre em
equipamentos de alta fidelidade domésticos decentes .
A posição de escuta ideal, então, está no ápice de um triângulo equilátero formado

pelo ouvinte e pelos alto-falantes, mas na prática o ouvinte pode estar mais afastado
desse ponto. Quanto mais para trás depende das circunstâncias, principalmente da
forma, tamanho e simetria da sala.
A sala de audição ideal será acusticamente simétrica entre esquerda e direita. Por

exemplo, é indesejável ter uma parede nua de um lado e uma janela com cortinas
pesadas do outro lado. Se o ouvinte não estiver muito longe dos alto-falantes, alguma
falta de simetria pode não ser muito grave, pois o som direto dos alto-falantes será
muito mais forte nos ouvidos do que o som refletido nas paredes. No entanto, quanto
mais atrás o ouvinte estiver, maior será a influência dos sons refletidos. Poucas salas
podem ser verdadeiramente simétricas, de modo que há um limite para a distância dos
alto-falantes em que um bom estéreo é ouvido.
Os alto-falantes não devem ficar muito próximos das paredes. Em muitas

circunstâncias, cerca de meio metro da parede traseira pode ser aceitável, e o espaço
entre eles não deve refletir o som. Em uma situação doméstica, isso pode ser difícil de
conseguir, embora na sala de estar do autor o espaço entre os alto-falantes seja
preenchido por uma lareira projetada deliberadamente para se parecer com uma parede
de pedra tradicional de Cotswold. Isso parece ser perfeitamente satisfatório,
possivelmente porque existem irregularidades suficientes para quebrar pelo menos
algumas das ondas refletidas, e também as bordas das peças de calcário podem ser
ligeiramente absorventes das ondas sonoras.
Uma posição de audição notavelmente insatisfatória está mais próxima do que o

ápice do triângulo equilátero, pois as imagens podem se tornar um tanto irreais. Pode ser
um pouco como ouvir fones de ouvido estéreo.
Figura 7.3 Posições de escuta
Tendo dito que o ouvinte deve estar na linha central entre os alto-falantes, uma
pergunta razoável a se fazer é: a que distância dessa linha central o ouvinte pode estar
antes que as imagens estéreo se tornem excessivamente destras ou canhotas? A resposta
resumida é que, para uma audição realmente crítica, há muito pouca latitude, talvez 2 ou
3 cm, com um espaçamento de alto-falante de alguns metros. No entanto, pode haver
audição estéreo agradável, o que é uma questão diferente, quando o ouvinte está
visivelmente fora da linha central. Muito pode depender dos alto-falantes
específicos. Alguns tipos oferecem uma propagação razoável do som quando o ouvinte
está a um metro ou mais da linha central, assumindo novamente uma linha de base de 2
metros.
Algumas palavras de segurança sobre ouvir
Parte do que foi escrito acima pode facilmente parecer muito preocupante para a pessoa
comum que simplesmente gosta de ouvir estéreo razoável. A tal pessoa diríamos
simplesmente: 'Não se preocupe!' Não reorganize sua sala de estar para torná-la
acusticamente simétrica; não preencha uma janela ou cortina uma parede oposta. Se
você gostou da sua música até agora, continue a apreciá-la. (No entanto, em um
ambiente profissional, terá que haver mais cuidado ao projetar as áreas de escuta.)
Pode ser, é claro, que imagens peculiares tenham sido um problema e há dicas aqui
que podem ajudar. É mais ou menos como os casos em minha própria experiência,
quando as respostas dos alto-falantes eram medidas por pessoas com alto-falantes dos
quais elas tinham muito orgulho. Os gráficos quase inevitavelmente desiguais causaram
grande sofrimento – realmente desnecessariamente. Esses eram casos de um pouco de
conhecimento sendo, não perigoso, mas perturbador – ou talvez alguém pudesse dizer
que a leve ignorância era uma bênção!
Correspondência de alto-falante estéreo
Isso significa garantir que a qualidade de saída dos dois alto-falantes seja a mais
próxima possível. A melhor maneira de verificar isso é alimentar ambos os alto-falantes
com música mono que contenha uma ampla gama de frequências.
Supondo que os alto-falantes estejam equilibrados em volume, todas as frequências

devem parecer estar no meio do caminho entre eles. Se, no entanto, não for esse o caso
e, para dar um exemplo, as altas frequências vierem de um ponto à direita do centro,
isso significa que há saída excessiva de altas frequências do alto-falante direito ou,
muito mais provavelmente, há uma deficiência de alta frequência no alto-falante
esquerdo. Uma possibilidade nesse caso é que o tweeter desse alto-falante esteja com
defeito.
Dissemos com bastante fluência que a maneira mais fácil de verificar a

correspondência e também o equilíbrio dos alto-falantes é alimentá-los com música
mono. O problema é que nem sempre é fácil encontrar uma fonte de música
mono! Equipamentos profissionais geralmente são fornecidos com um switch que pode
converter material estéreo em mono para propósitos como este. Equipamento doméstico
muitas vezes não. O problema, porém, não é insuperável. Alguns receptores de rádio
destinados à conexão em um sistema hi-fi têm um botão mono/estéreo para ser usado
quando o estéreo da transmissão é fraco e ruidoso, mas a versão mono é aceitável. Isso
pode ser usado para fornecer música mono diretamente ou uma fita de música mono.
As coisas ficam um pouco mais difíceis se não houver um botão mono/estéreo. Uma

solução parcial, embora sem uma ampla faixa de frequência, é sintonizar o receptor para
uma transmissão de notícias quando o leitor de notícias quase certamente será central e,
portanto, mono.
Estágio
Isso significa, basicamente, que a polaridade da fiação é a mesma em ambos os canais

de um sistema estéreo. A Figura 7.4 ilustra isso.
Na Figura 7.4 (b) as conexões elétricas foram, em algum momento, invertidas em

UM dos canais. O efeito é que uma compressão de onda sonora é emitida de um alto-
falante quando uma rarefação é emitida do outro. Este é um efeito muito antinatural
para um ouvinte, sendo algo que não ocorre na vida real, ou se ocorre, apenas
brevemente e de forma incompleta.
O resultado do estéreo fora de fase é que as imagens são muito difíceis de

localizar. Eles podem aparecer por trás ou mesmo dentro da cabeça e podem se mover
se houver qualquer tentativa de localizá-los virando a cabeça. Geralmente não é uma
experiência agradável e a audição prolongada de estéreo fora de fase pode causar dor de
cabeça. Houve até casos relatados de náusea física.
Figura 7.4 (a) Fase correta (b) Fase incorreta
Quão óbvia é uma condição fora de fase pode depender muito do tipo de material do
programa. Com imagens estéreo amplas e pouco som central, um sinal fora de fase pode
não ser tão óbvio. Será mais aparente com imagens monocromáticas ou centrais. Esta,
então, é a maneira de verificar as conexões fora de fase. Reproduza um sinal mono
central (e aqui um boletim de notícias simples será bastante adequado) e verifique se há
uma imagem central clara. Se houver alguma dúvida, a fiação de um dos canais deve ser
trocada e, provavelmente, a maneira mais fácil de fazer isso será nos terminais de um
dos alto-falantes. Se o sistema estiver fora de fase e a fiação dos alto-falantes estiver
obviamente correta, será necessário verificar o restante do sistema.
Questões
1. Qual é a diferença aproximada do tempo de chegada nos dois ouvidos de uma pessoa
quando uma fonte de som está a 90° da frente?
a. 10 μs b. 0,01ms c. 0,1ms d. 1ms
2. Qual é a causa provável do estéreo 'buraco no meio'?
a. Condições fora de fase
b Microfones muito espaçados

.
c. Sinais em um canal sendo muito maiores do que no outro canal
d Alto-falantes incompatíveis
.
3. Um panpot é ajustado com seu controle totalmente no sentido horário. Onde é provável

que a imagem dele esteja na imagem estéreo final?
a. Totalmente b. totalmente à c. meia d. metade
certo esquerda direita esquerda
4. O que deveria ser uma imagem central clara em uma cena estéreo é difícil de localizar
ouvindo. Qual é a causa provável?
a. Há uma condição fora de fase em algum lugar
b Panpots estão sendo usados incorretamente

.
c. Um microfone de par coincidente é montado de cabeça para baixo
d Um dos microfones está distorcendo

.
7 estéreo
Parte 2
Técnicas de microfone para estéreo
Aqui podemos examinar um pouco mais profundamente o uso do microfone para

estéreo. Existem várias técnicas, mas aqui vamos olhar para três, e apenas brevemente
para duas delas. O leitor que desejar aprofundar o assunto deverá consultar a lista de
livros intitulada 'Leitura adicional'.
A primeira técnica, e em muitos aspectos a mais simples de entender, é a de multi-

microfonia – fazendo uso de vários microfones cujas saídas são 'posicionadas' na
imagem estéreo com panpots. Do ponto de vista do usuário não profissional, a
dificuldade com esta abordagem pode ser não ter um número suficiente de entradas e
circuitos associados no equipamento de mixagem. Além disso, é claro, pode ser
necessário um grande número de microfones - na opinião de alguns balanceadores de
som profissionais, o kit de bateria sozinho pode precisar de seis a dez ou até mais!
A principal vantagem da abordagem multimicrofone é que pode haver um bom

controle sobre o equilíbrio do som – ou seja, seções fracas de, digamos, uma banda ou
coro podem ser aumentadas de nível para corresponder às seções mais altas.
As desvantagens são:
1. A complexidade técnica pode ser considerável e, paradoxalmente, por vezes pode

dificultar a obtenção de bons resultados. Há também mais para dar errado!
2. É possível que os microfones formem pares estéreo indesejados. Isso significa que, além
das imagens panpotted, pode haver imagens adicionais espúrias causadas por mais de
um microfone captando o mesmo som. Na prática, é improvável que isso signifique que
haverá várias imagens; em vez disso, as imagens panorâmicas serão deslocadas de suas
posições pretendidas. Como um risco adicional, mover um fader para alterar a saída de
qualquer microfone pode resultar no movimento de algumas das imagens deslocadas. A
única maneira de evitar esse efeito é ter todos os instrumentos, seções da banda ou o que
quer que seja 'microfonado de perto', ou seja, ter omicrofones o mais próximo possível
de suas respectivas fontes. Às vezes, isso pode ser difícil, especialmente porque nem
sempre é fácil manter o som característico de um instrumento com microfones
posicionados próximos.
Em suma, é justo dizer que as técnicas de multi-microfone geralmente não são tentadas
a menos que haja muitos microfones disponíveis e o equipamento de mixagem seja
adequadamente abrangente.
A segunda abordagem do microfone é usar pares coincidentes, aos quais já nos

referimos. Aqui muito depende dos diagramas polares dos dois microfones. Deve-se
assumir que os diafragmas dos dois microfones estão o mais próximos possível, embora
deva-se admitir que resultados satisfatórios podem ser obtidos quando eles estão
separados por vários centímetros (consulte 'Estéreo binaural' na p. 101).
O principal efeito dos diagramas polares está no ângulo de aceitação do par de

microfones. Por 'ângulo de aceitação' entendemos o ângulo na frente dos microfones,
que corresponde a uma imagem sonora estendendo-se por toda a distância entre os alto-
falantes. Os fotógrafos perceberão que o ângulo de visão de uma lente é um conceito
muito semelhante.
O conhecimento dos ângulos de aceitação para diferentes sistemas de diagramas

polares é essencial para obter resultados satisfatórios. No entanto, não é difícil carregar
essa informação na cabeça quando se lembra que os microfones hipercardióides têm
padrões polares intermediários entre oito e cardióides. Então, para microfones que estão
a 90° um do outro, os ângulos de aceitação são aproximadamente:
Figura 7.5 'Ângulo de aceitação' para um par coincidente
algarismos de oito 90°
Hipercardióides 135°
Cardióides 180°
(135° é a metade entre 90° e 180°)
Observe que estamos assumindo que os microfones estão a 90° um do outro. Isso é

bastante normal, e é improvável que uma diferença de alguns graus em ambos os lados
de 90° tenha qualquer efeito significativo, embora o ângulo possa ser aumentado
consideravelmente com cardióides, resultando em uma imagem estéreo mais ampla.
Talvez a grande questão agora seja: qual sistema de diagrama polar usar
quando? Muitas vezes, é claro, há pouca escolha. Normalmente, os únicos microfones
disponíveis são um par de cardióides (como, por exemplo, nos microfones estéreo
integrados da maioria das filmadoras). No entanto, o posicionamento de um par de
microfones coincidentes, seja qual for o padrão polar, é em grande parte uma questão de
geometria.
Vamos supor que temos dois cardióides – e repetimos que eles devem ser o mais
parecidos possível, mesmo fabricante, mesmo número de tipo e assim por diante. A
Figura 7.6 mostra os prováveis spreads de imagem para duas posições para tal par de
microfones. Em (a), os microfones estariam próximos à frente da fonte sonora (banda,
coro, orquestra, etc.). Em (b), os microfones estão mais para trás de forma que os eixos
dos cardióides estejam apontando aproximadamente para as bordas da fonte. Lembre-se
que o ângulo de aceitação para um par de cardióides é de cerca de 180°. Em (a), a
propagação das imagens sonoras preencherá quase completamente a região entre os
alto-falantes;em (b), apenas uma parte da região será preenchida. Observe que o estado
de coisas na Figura 7.6 (b) não é necessariamente errado. Um piano solo geralmente
soará um pouco bobo se parecer ter toda a largura entre os alto-falantes! Da mesma
forma, um quarteto de cordas clássico deve normalmente preencher apenas parte do
quadro.
Figura 7.6 Provável propagação de imagem para um par de cardióides
Com uma banda de rock é difícil dizer qual deve ser a imagem reproduzida, pois
muitas vezes não há tentativa de reproduzir a realidade do som original.
Em ambos os casos, porém, o som reverberante tenderá a preencher a imagem

estéreo, aumentando assim o realismo, mesmo que a imagem básica do(s)
instrumento(s) seja estreita. Tudo depende do que parecerá razoável para o ouvinte no
replay.
Um par de microfones em forma de oito tem características bastante diferentes. Para

começar, o ângulo de aceitação é menor do que para cardióides (90°) e para uma
cobertura completa de alto-falante a alto-falante, os microfones devem estar mais para
trás – mais ou menos onde os dois cardióides estão na Figura 7.6 (b).
Em segundo lugar, há uma região de captação traseira de 90°, o que pode ou não ser
bom. Por exemplo, pode ser útil se for necessária muita reverberação; por outro lado,
pode haver ruídos indesejados vindos de trás – uma plateia tossindo, por exemplo! Um
ponto final e às vezes muito importante é que os quadrantes laterais são regiões fora de
fase e isso significa que os sons vindos dessas direções podem ser difíceis de localizar
pelo ouvinte. Os lados, portanto, devem ser considerados como 'zonas proibidas',
embora a reverberação que chega dos lados não sofra nenhum efeito peculiar porque é,
por sua natureza, tão difusa que a fase não tem significado real. Isso é ilustrado
na Figura 7.7 .
Afirmou-se que, em igualdade de condições, os pares de microfones em forma de

oito precisam estar mais afastados do que os cardióides. Existem alguns prós e contras
como resultado:
1. Quanto mais atrás estiverem os microfones, melhor (provavelmente) será o equilíbrio

relativo entre a frente e o fundo de uma orquestra ou banda. Dito de outra forma, um par
de microfones próximo, como cardióides, pode fazer com que os instrumentos ou vozes
mais próximos sejam muito altos em relação aos mais distantes. As perspectivas de som
relativo (consulte o Capítulo 5 ) serão exageradas.
2. Se a acústica da sala ou outra área de gravação for ruim, por exemplo, com reverberação
excessiva ou ruído externo, microfones mais próximos, como cardióides, podem ajudar.
3. Quanto mais próximos os microfones estiverem da banda, orquestra ou coro, mais

importante pode ser ter microfones mono adicionais para reforçar as seções mais
distantes. Em seguida, panpots devem ser usados para colocar as saídas desses
microfones em suas posições corretas na 'imagem'.
Figura 7.7 Microfones em forma de oito como um par coincidente

Pode valer a pena mencionar que, dada uma boa banda, orquestra ou coro em
acústica favorável, um par de microfones em oito pode, na opinião de muitos
balanceadores de som experientes, dar a reprodução mais natural. É também o arranjo
mais simples tecnicamente falando.
Não foi mencionado um par de hipercardióides, mas o leitor poderá rapidamente

adaptar o que foi dito sobre cardióides e oito para hipercardióides, lembrando que eles
podem ser considerados a meio caminho entre os outros dois.
Uma terceira técnica de microfone é a do estéreo binaural. Destina-se

principalmente a ouvir com fones de ouvido, mas feito com cuidado fornece resultados
aceitáveis em alto-falantes. A ideia é que os ouvidos de uma pessoa sejam substituídos
por microfones, ou pelo menos os microfones sejam colocados nos ouvidos ou mesmo
dentro deles. A teoria (bastante incorreta!) é que se esses microfones estiverem
conectados a fones de ouvido, o ouvinte é 'transportado' para a posição de usuário dos
microfones.
Cabeças falsas especiais foram projetadas e comercializadas comercialmente, mas

muito mais simples e barato é ter um disco de perspex, com cerca de 6 a 8 mm de
espessura e 200 a 250 mm de diâmetro. Dois pequenos microfones são montados em
lados opostos do disco, em seu eixo e aproximadamente 100 mma partir dele. Estes
formam o par estéreo. (Observe que os dois microfones têm um espaçamento que é
aproximadamente igual ao dos ouvidos humanos.) Resultados interessantes podem ser
obtidos, embora a maioria dos ouvintes de fones de ouvido ache que as imagens sonoras
tendem a ficar atrás deles. Há espaço para experimentação pelo leitor com dois
pequenos microfones e modestas instalações de oficina.
Fones de ouvido para monitoramento estéreo
Tendo mencionado o uso de fones de ouvido, vale a pena acrescentar um comentário

sobre seu uso em estéreo.
Para começar, o monitoramento sério do estéreo é quase impossível com fones de

ouvido, porque as posições das imagens sonoras em geral quase não têm relação com
aquelas percebidas ao ouvir o mesmo material estéreo nos alto-falantes. Alguns sons
podem parecer estar atrás ou mesmo dentro da cabeça. Certa vez, realizei alguns
experimentos para ver se havia alguma correlação entre as posições das 'imagens de
fone de ouvido' e das 'imagens de alto-falante', mas mesmo ouvintes experientes
diferiam tanto entre si na localização das imagens de fone de ouvido que a conclusão
final foi que não havia correlação significativa em tudo.
Por fim, ao planejar uma gravação estéreo, vale a pena estudar a situação com
antecedência para ter uma ideia de quais microfones usar e onde colocá-los. Então, e
isso é o mais importante, um ensaio deve ser usado para testar o mais minuciosamente
possível se as posições ideais do microfone foram alcançadas. Isso significa ouvir
criticamente, de preferência em alto-falantes. Se isso não puder ser feito no local de
gravação, significa fazer uma gravação e reproduzi-la nas melhores condições de
audição possíveis.
Muitas vezes, tudo isso é mais fácil dizer do que fazer, especialmente porque há
complicações como o fato de que a presença de uma platéia quase certamente
modificará a acústica, e os músicos tocarão mais alto e melhor quando houver alguém
para tocar! No entanto, com a experiência, é possível fazer algumas concessões para
essas coisas.
Questões
Com um par estéreo coincidente de microfones em ângulo de 90° entre si, quais são os
'ângulos de aceitação' efetivos para o seguinte?
1. Cardióides
a. 90° b. 135° c. 180°
2. Hipercardióides
a. 90° b. 135° c. 180°
3. Figura de oito
a. 90° b. 135° c. 180°
4. Omnis
a. 90° b. 135° c. 180°
5. Com qual arranjo de par coincidente é provável que haja uma região fora de fase
significativa nas laterais?
a. Cardióides b. Hipercardióides c. algarismos de oito d. Omnis
10 Áudio digital
Parte 1
Na edição anterior deste livro, publicada em 1997 – não muitos anos atrás – sugeri que
o equipamento digital naquela época provavelmente seria muito caro para o leitor
amador e semi-profissional! As coisas mudam. Gravadores digitais de boa qualidade e
dispositivos associados são agora muito acessíveis.
Histórico
No Reino Unido, a primeira aplicação generalizada de um sistema de áudio digital

ocorreu no final da década de 1960, quando os engenheiros de pesquisa da BBC
desenvolveram um sistema para combinar o sinal de som da televisão com as imagens
para distribuição às estações transmissoras. O sinal de som foi convertido de uma forma
analógica para uma consistindo de pulsos que foram "introduzidos" no sinal de visão
composto. Esse sistema, conhecido como som em sincronizações, ainda é usado, não
apenas pela BBC, mas também por empresas de televisão independentes do Reino
Unido. Ele é mencionado na Parte 2 deste capítulo.
A forma mais moderna, conhecida como NICAM, permite que o som estéreo seja

transmitido como parte do sinal de televisão. O NICAM também será explicado mais
detalhadamente na Parte 2 .
Então, no início dos anos 1970, a rádio BBC, enfrentando o problema de enviar
estéreo de alta qualidade para seus transmissores, adotou o áudio digital. Isso não
apenas permitiu que os programas de rádio fossem enviados por todo o Reino Unido
quase sem deterioração da qualidade, mas também financeiramente muito econômico. O
uso dos princípios do áudio digital, mas com padrões um pouco melhorados, apareceu
com o disco compacto – o CD – por volta de 1980, e outros sistemas digitais surgiram
desde então.
Princípios básicos
Nos sistemas analógicos, onde o sinal elétrico é uma réplica, ou deveria ser, das ondas
sonoras originais, existe um problema fundamental: qualquerdeficiência causada por
qualquer motivo é praticamente impossível de corrigir. Tais deficiências podem ser o
resultado de interferência captada durante uma transmissão de rádio, efeitos de sujeira e
poeira em uma ranhura de gravação e imperfeições no meio de gravação (manchas nuas
ou finas no óxido magnético da fita, por exemplo).
Outra causa de degradação é a cópia. A qualidade de uma gravação em fita

analógica pode ser muito boa, mas uma cópia feita a partir dela nunca terá um padrão
tão alto. As cópias da cópia, um processo que pode ser muito importante na indústria
fonográfica, serão ainda mais degradadas. Com fita e processos de redução de ruído
adequados, pode levar várias gerações de cópias antes que a degradação se torne muito
óbvia, mas, no entanto, ocorre e é irreversível.
Com o agora quase extinto disco de gramofone de vinil, a qualidade se deteriorou

muito ligeiramente a cada execução - talvez não muito obviamente. A ponta
gradualmente causava desgaste e deformação nas ranhuras e também os efeitos da
poeira eram quase impossíveis de evitar. Os entusiastas do hi-fi tinham removedores de
poeira eletrostáticos e líquidos de limpeza especiais, mas o fato era que minúsculas
partículas de poeira ainda encontravam seu caminho para as ranhuras e podiam até ser
empurradas para a superfície pela caneta. Havia vários circuitos inteligentes projetados
para remover os efeitos de cliques e arranhões sérios, mas é verdade que eles foram, na
melhor das hipóteses, apenas parcialmente bem-sucedidos. Tal circuito nunca poderia
ter certeza de que um ruído foi causado por um arranhão ou se era um instrumento de
percussão especial! Um número incrível desses problemas é evitado ao se tornar digital.
Com o áudio digital, o sinal analógico original é convertido em um código de sinais
muito mais robustos. Basicamente, estes assumem a forma de pulsos de tensão de altura
e duração padrão. Uma vez que cada parte da cadeia digital sabe qual deve ser a altura e
a duração de um pulso, então, se um ficar distorcido, é possível, dentro de certos limites,
reconstruí-lo. Há uma comparação aqui com o Código Morse (mas parece que está em
declínio!). Todas as mensagens são enviadas na forma de pontos e traços. A pessoa na
extremidade receptora geralmente pode detectá-los e decodificá-los, embora alguns
possam estar muito distorcidos e esse fato representou o uso generalizado de Morse para
comunicação em grandes distâncias quando a interferência em sinais de rádio tornava a
fala difícil de entender.
Qual é o processo de codificação com áudio digital? Aqui está uma história

ligeiramente simplificada.
Amostragem
A primeira etapa é a amostragem. O sinal analógico é dividido em pequenas amostras,

cuja 'altura' (na verdade deveríamos dizer amplitude) será medida no próximo
estágio. Uma coisa muito importante sobre este processo de amostragem é que ele deve
ser realizado em grande velocidade. Nos CDs e em muitos outros sistemas digitais
modernos, essa taxa é de pouco mais de 44.000 vezes por segundo, mas 48.000 também
é usada em alguns equipamentos. As linhas verticais na Figura 10.1 representam
amostras individuais.
Figura 10.1 Amostragem
quantizando
Em seguida, cada amostra deve ser medida. Isso é conhecido como quantização.
A Figura 10.2 ilustra um arranjo de quantização muito básico. Ele mostra seis níveis

de quantização – e pense neles como graduações em uma régua que mede a amplitude
de cada amostra. O sistema não nos permite usar frações de divisão, então as medições
do sinal vão, neste caso, ser bastante grosseiras.
Quanto mais precisa for essa medição de amplitude, melhor será a qualidade do
resultado final. Para uma precisão real, é necessário que haja um grande número de
graduações nesta régua. Cerca de 8.000 é o mínimo utilizável, mas não é suficiente para
gravações de alta qualidade (por exemplo, qualidade de CD), quando são necessárias
cerca de 65.000 graduações ou níveis de quantização!
Amostragem – O processo de examinar um sinal de som em uma taxa muito alta. Em

muitos sistemas de áudio digital, a taxa de amostragem é de pouco mais de 44.000 vezes
por segundo.
Quantização – O processo de 'medir' a amplitude de cada amostra. Áudio de boa
qualidade precisa de pelo menos 65.000 níveis de quantização.
Nesse ponto, o cérebro começa a ficar confuso com a magnitude das coisas –
medindo a música 44.000 vezes por segundo, cada medição sendo um número entre 0 e
65.000! Felizmente, a eletrônica moderna pode lidar com tudo isso com bastante
facilidade. No entanto, vamos fazer uma pausa para ver com o que estamos
comprometendo o sistema. Uma fita ou disco digital deve armazenar números que
podem ser de até 65.000 e fazer isso a uma taxa de pouco mais de 44.000 deles por
segundo!
Figura 10.2 Um sistema de quantização muito simples
aritmética binária
Felizmente, as coisas começam a ficar um pouco mais simples quando procuramos tipos
alternativos de aritmética. O áudio digital usa aritmética binária. Com nossa aritmética
diária usual, contamos de 0 a 9 e, em seguida, colocamos um 1 na frente para ir de 10 a
19, depois um 2 e assim por diante. Na aritmética binária existem apenas dois dígitos, 1
e 0, em vez de dez, e a contagem é de 0 a 1, e então um 1 é colocado na frente para fazer
10. O próximo número tem um adicionado para fazer 11 (não chame-o de 'onze' – não
é!) e então um 1 adicional é colocado na frente para que tenhamos 100, 101 e assim por
diante. A Tabela 10.1 compara nossa aritmética decimal padrão com a binária. Se o
leitor não estiver familiarizado com a aritmética binária, deve-se tentar continuar a
tabela.
A princípio, a aritmética binária pode parecer muito complicada. Na verdade, isso

ocorre apenas porque não estamos acostumados com isso – pelo menos, não a maioria
de nós. Na realidade, é muito mais simples do que a aritmética decimal. O conjunto
completo de tabelas de multiplicação é:
Tabela 10.1
Decima Binári Nº de
l o bits
0 0 1
1 1 1
2 10 2
3 11 2
4 100 3
5 101 3
6 110 3
7 111 3
8 1000 4
9 1001 4
10 1010 4
Com 16 bits podemos ir até pouco mais de 65 000.
Figura 10.3 Um sinal binário
1×0=0
1×1=1
As regras de adição e subtração na aritmética binária são as mesmas da aritmética

decimal.
Porém, vejamos onde isso nos leva – não devemos deixar que um estudo de
aritmética binária, por mais breve que seja, nos distraia do objetivo principal, que é o
áudio digital.
Após o processo de quantização, os números resultantes são convertidos em binário,
de modo que, por exemplo, o número 17 832, que representa uma amostra de cerca de
um quarto da altura máxima em um sinal de CD, quando convertido para binário torna-
se 100010110101000. Agora, se cada 1 representa um pulso de tensão temos então o
sinal mostrado na Figura 10.3 .
Este é o tipo de código que queríamos. Pulsos individuais podem ser degradados,

mas, desde que ainda sejam apenas identificáveis, podem ser reconstruídos, se
necessário.
Cada 1 ou 0 no áudio digital é chamado de bit, abreviação de dígito binário . A

Figura 10.3 ilustra um número de 15 bits: há seis 1s e nove 0s. O número de bits dá uma
indicação da qualidade do sistema. CDs usam 16 bits. A comunicação por telefone pode
ser satisfatória com menos de dez.
Regeneração de pulsos
A Figura 10.4 compara um sistema analógico com um digital, ambos sujeitos a

interferência em cada seção. Os símbolos triangulares na cadeia analógica representam
amplificadores. Os geradores de pulsos são circuitos que detectam a presença de um
pulso, desde que não tenha sido muito danificado, e criam um novo em seu lugar.
Pelo que dissemos, pode parecer que a restauração dos pulsos digitais pode
continuar indefinidamente. Isso não é bem verdade. Eventualmente, haverá pulsos que
estão muito longe de serem regenerados e, embora a maioria dos sistemas digitais faça
uso de detecção e correção de erros – que descreveremos brevemente abaixo e
explicaremos um pouco mais detalhadamente na Parte 2 –, no final, haverá uma
degradação perceptível. No entanto, os dígitos fornecem uma maneira muito mais
confiável e robusta de lidar com qualquer tipo de sinal do que o analógico é capaz. Vale
a pena mencionar que grande parte do sistema telefônico do Reino Unido usa sinais
digitais para distribuição – para melhorar a qualidade e também para economia.
Figura 10.4 Regeneração de (a) sinais analógicos, (b) pulsos em um sistema digital
Tomando um sistema de 16 bits e com uma taxa de amostragem de pouco mais de

44 kHz (na verdade, 44,1 kHz), é possível atingir uma faixa de frequência tão baixa
quanto desejamos até 20 kHz. A faixa de áudio completa é facilmente coberta. E quando
se trata de relações sinal-ruído, cerca de 100 dB podem ser cobertos. Tudo parece bom
demais para ser verdade. Não surpreendentemente, há uma penalidade e este é o número
de bits por segundo a serem manipulados. Alguma aritmética muito simples pode
mostrar isso.
taxa de bits
Com 16 bits para cada amostra e cerca de 44.000 amostras por segundo, temos
16 × 44.000 = 704.000 bits/segundo
E isso é para mono! Dobre o número para estéreo e descobrimos que precisamos de

1.408.000 por segundo ou 1,4 megabits/segundo! Veremos mais adiante que há muito
mais dados para encaixar, como a detecção de erros que mencionamos, e podemos
chegar a mais de 4 milhões de bits por segundo.
Agora, a fita analógica comum grava até 20 kHz e, embora não seja correto dizer
que a frequência em hertz é precisamente a mesma que em bits por segundo, a
discrepância entre 20 kHz e 4 MHz é claramente enorme. A gravação em fita
convencional simplesmente não consegue lidar com o áudio digital. Trataremos da fita
digital no próximo capítulo, mas é suficiente, por enquanto, mostrar que um preço deve
ser pago pela qualidade potencialmente alta que o áudio digital pode oferecer.
Tabela 10.2
Amostra original Número Adicionar bit de Nova amostra Novo

de 10 bits de 1s paridade? número de
1s
0011100101 5 Sim 0011100101 6

1
1100110011 6 Não 1100110011 6

0
0001010110 4 Não 0001010110 4

0
1000100010 3 Sim 1000100010 4

1
O bit de paridade está em negrito e itálico.
Detecção de erro
Já mencionamos que, com sistemas analógicos, não há uma maneira realmente eficaz de
detectar erros de qualquer tipo.
É um pouco diferente com os dígitos. Um método simples, mas com certas

limitações, muito eficaz e amplamente utilizado é conhecido como paridade. O que
acontece é isso. Antes de gravar ou transmitir uma amostra, o número de 1s nela é
contado e, se necessário, compensado para ser um número par. Um bit de paridade é
adicionado, um 0 se já houver um número par de uns, um 1 se houver um número ímpar
de 1s. Assim, cada amostra gravada ou transmitida contém um número par de 1s.
Suponha que ocorra um erro de modo que um 1 seja destruído ou um 1 espúrio

apareça onde deveria haver um 0. Haverá agora um número ímpar de 1s. Portanto, no
replay ou no final do recebimento, quando os 1s são contados e um número ímpar é
encontrado em uma amostra, o sistema sabe que ocorreu um erro e podem ser tomadas
medidas para reduzir o efeito. Uma dessas etapas é repetir a amostra anterior e, como
elas têm apenas 1/44.000 de segundo de diferença, é provável que o engano não seja
percebido. A Tabela 10.2 pode ajudar a esclarecer o cálculo da paridade. Para
simplificar, ele usa um sistema de 10 bits.
Claro, isso aumenta o número de bits/segundo, mas apenas em uma pequena

proporção.
Outras aplicações de áudio digital
Os leitores familiarizados com o computador sem dúvida já perceberam que há uma

grande semelhança entre os sinais de áudio digital e os pulsos elétricos usados nos
computadores. Nesse caso, os computadores não poderiam ser usados com áudio
digital? A resposta é sim. De fato, a edição digital mencionada mais adiante utiliza a
tecnologia do computador para realizar sua tarefa. No entanto, podemos ir além disso, e
pode ser suficiente aqui fazer apenas delinear alguns dos processamentos que podem ser
realizados.
atraso digital
Assim como em um computador os dados podem ser armazenados em chips de

memória, as amostras de áudio digital podem ser armazenadas em chips (enquanto a
energia estiver ligada!). Isso significa que, com memória suficiente, um sinal digital
pode ser alimentado em uma unidade de atraso e emergir da saída pouco tempo depois -
talvez de uma fração de segundo até vários segundos. Os usos para isso são
muitos. Uma pequena lista de aplicações é:
1. Para adicionar realismo na reverberação (consulte 'Reverberação artificial' abaixo).
2. Como efeito na música (geralmente não na música clássica!) e drama.
3. Para auxiliar no 'rastreamento duplo automático' (ADT), onde um único vocalista aparece
para cantar um dueto. Um pequeno atraso de alguns milissegundos, de preferência com
um elemento de mudança de tom (veja abaixo), pode ser muito eficaz.
4. Para melhorar a inteligibilidade no trabalho de PA (endereço público).
5. Para habilitar o que é chamado de 'atraso de palavrões' em alguns programas de rádio por
telefone. Tudo passa por um atraso de talvez cerca de 15 segundos. Se o chamador usar
linguagem inaceitável, o apresentador do programa pressiona um botão que exclui o
conteúdo da loja, incluindo as palavras indesejadas. A eletrônica inteligente aumenta
gradualmente o atraso, de modo que o fato de que algum material foi removido é quase
imperceptível. No entanto, requer um apresentador muito capaz e de raciocínio rápido.
reverberação artificial
'Eco', como muitas vezes é chamado de forma imprecisa, já foi criado por alto-falantes e
microfones em salas reverberantes; mais tarde, placas de aço especiais foram usadas e
podiam ser colocadas em vibração eletricamente para dar uma imitação muito aceitável
de reverberação. Ambos os métodos eram volumosos e caros.
Mais barato e mais compacto era o reverberador de mola, no qual uma ou mais
molas eram colocadas em vibração por um pequeno transdutor fixado à(s) mola(s) com
um outro transdutor para captar as reverberações. Unidades muito caras eram
razoavelmente boas, mas as baratas pareciam - bem - molas vibrantes!
O advento do áudio digital mudou tudo isso. Em um dispositivo de reverberação

digital, os dígitos de entrada são armazenados em chips de memória e, em seguida,
liberados de maneira cuidadosamente controlada, de modo que haja uma amplitude de
saída aleatória e constantemente decrescente.
Isso pode simular a reverberação natural de maneira notavelmente eficaz e

normalmente haverá controle do tempo de reverberação junto com várias outras
características. Torna-se possível, então, produzir, dentro de limites bastante amplos,
quase qualquer tipo de reverberação necessária. Unidades de reverberação digital
modernas podem ter um custo comparável a uma máquina de fita cassete decente e
ocupam menos espaço. Existem outros, com facilidades mais completas, que custam dez
vezes mais, mas para muitos fins os mais baratos podem ser adequados.
Atraso
Uma maneira de criar melhor realismo com reverberação artificial é fazer uso de
atrasos. Isso pode ser feito com uma unidade de atraso como mencionado acima, mas
muitos dispositivos de reverberação digital têm atrasos variáveis embutidos. A razão
para ter um atraso é esta. A combinação ouvido/cérebro humano é muito boa para
detectar pequenos intervalos de tempo, como aqueles que ocorrem, digamos, em uma
sala quando os ouvidos recebem primeiro o som direto da fonte e depois a primeira
reflexão, como é chamada, vindo de uma parede, piso ou teto. Se o atraso entre o som
direto e a primeira reflexão for maior do que cerca de 40 ms (=1/25 segundo), então a
pessoa está ciente de um intervalo de tempo. Essa é a definição adequada de 'eco' -
quando alguém está ciente de um intervalo de tempo entre dois sons.
Se esse intervalo de tempo – o atraso de tempo inicial (que já mencionamos

no Capítulo 3 ) – for menor que cerca de 40 ms, o cérebro não reconhece o intervalo
como tal, mas, no entanto, está subconscientemente ciente dele e usa as informações
para avaliar o tamanho da sala. (Tente vendar alguém e levá-lo para uma sala em que
nunca esteve antes. Depois de alguns momentos de conversa, quase sempre descobrirá
que a pessoa pode fazer um julgamento aproximado do tamanho da sala.) Para recriar
um artificial convincente reverberação, então, significa usar um atraso de tempo
apropriado, bem como o tempo de reverberação correto. Para dar um exemplo, um
grande salão só será totalmente simulado se um tempo de reverberação longo, talvez 2
ou 3 segundos, for usado com um atraso inicial de talvez 20 ou 30 ms.
Mudança de tom
Se alguém imaginar amostras digitais sendo alimentadas em um conjunto de lojas, mas

depois retiradas em uma taxa ligeiramente diferente, veremos, esperamos, que o efeito
será alterar o tom do original. A Figura 10.5 mostra em forma esquemática simples o
princípio da alteração digital da afinação.
Na Figura 10.5 , as caixas marcadas A, B, ..., n representam armazenamentos de

memória digital. Imagine o 'interruptor eletrônico de entrada' movendo-se ao redor do
círculo, colocando uma amostra digital em cada loja por vez. O 'interruptor eletrônico
de saída' lê o conteúdo de cada armazenamento e então o esvazia para que esteja pronto
para outra amostra. As amostras que são lidas serão finalmente convertidas de volta em
sinais analógicos.
Figura 10.5 Mudança de pitch simplificada
Suponha, porém, que a chave de saída gire mais rápido que a de entrada. O efeito
será que o tom da saída analógica será mais alto que o tom da entrada. O leitor, sem
dúvida, se perguntará como isso pode ser um processo contínuo, porque mais cedo ou
mais tarde um interruptor alcançará ou será alcançado pelo outro! Na verdade não pode,
mas com o uso de tecnologia inteligente pode-se dar a impressão de que é contínuo. O
leitor curioso e intrigado é encaminhado para a seção 'Leitura adicional'.
MIDI
Isso significa Interface Digital de Instrumento Musical. Isso realmente se relaciona com
a música eletrônica, mas uma breve menção pode não ser inapropriada aqui.
MIDI não é um dispositivo específico, mas um padrão internacionalmente aceito

para conectar dois ou mais instrumentos eletrônicos. O link MIDI carrega informações
sobre os horários de início e fim de uma nota, sua afinação e outros dados para que, por
exemplo, um órgão eletrônico ou um PC comum com o software correto possam
'acionar' outros equipamentos. Um instrumento típico, como um sintetizador, pode ser
capaz não apenas de gerar MIDIdados, mas também para receber MIDI de outra fonte e
depois passá-los para outro instrumento. A lista de livros no final sugere leitura
adicional adequada.
Compressão de dados
Isso significa reduzir o número de bits em uma amostra de áudio sem uma redução séria
na qualidade. Graças a um desenvolvimento bastante recente do áudio digital, é possível
recorrer a truques muito inteligentes, mas legítimos, aproveitando as características do
ouvido humano.
Para começar, existem muitos 'sons' que não podemos ouvir: frequências na região
de 30 Hz, a menos que sejam de nível alto, por exemplo. O ouvido normal é cerca de 70
dB menos sensível a 30 Hz do que a cerca de 3 kHz e não é particularmente sensível às
frequências de áudio mais altas acima de cerca de 3 kHz. Além disso, certos sons
podem ser 'mascarados' por outros. Já se sabe há algum tempo que um som em um
determinado nível pode tornar o ouvido bastante insensível às frequências próximas
(geralmente mais altas) em um nível mais baixo.
Fazendo uso de circuitos que, por assim dizer, imitam essas características do
ouvido humano, é possível evitar a gravação dos sons indetectáveis. Existem vários
processos. Uma delas é conhecida como Precision Adaptive Subband Coding (PASC)
ou codificação perceptual, e permite descartar até cerca de 80% dos dados
originais. Outro método, usado pelos MiniDiscs (dos quais mais tarde) é chamado
ATRAC, que significa Adaptive Transform Acoustic Coding. O MP3 também usa
compactação de dados inteligente.
Terminologia adicional
Dois termos merecem uma breve menção:
1. ADC: conversor analógico-digital. Este é o dispositivo (na forma de um chip) que

amostra o sinal analógico e fornece uma saída digital. O dispositivo complementar é o
2. DAC: conversor digital-analógico, que traduz um sinal digital de volta para analógico.
Questões
1. A taxa de amostragem usada em discos compactos é aproximadamente quantas vezes por

segundo?
a. 44 000 b. 48 000 c. 65 000 d. 704 000
2. O que representaria o número binário 1001 na aritmética ordinária?
a. 5 b. 7 c. 9 d. 11
3. O que significa MIDI?
a. Instrumento digital integrado musical
b. Inserção Direta de Instrumento Musical
c. Inserção Digital Integrada Musical
d. Interface digital de instrumentos musicais
10 Áudio digital
Parte 2
Discos compactos
O componente vital em um CD player é o laser, e sem ele seria impossível fazer CDs ou
reproduzi-los. Então, o que é um laser? É claro que é uma fonte de luz, mas a luz que
emite é particularmente pura, pois consiste em apenas um comprimento de onda. A luz
comum, como se sabe, é composta por uma ampla gama de comprimentos de onda e
isso causa dificuldades quando a luz é focalizada com uma lente. Os vários
comprimentos de onda são tratados de forma ligeiramente diferente e isso pode ser visto
nos efeitos de cor quando se olha através de uma lupa comum. O efeito é
particularmente perceptível perto das bordas da lente. As lentes para câmeras de alta
qualidade são projetadas para reduzir essa aberração cromática,como é chamado, a
níveis aceitáveis. O feixe de um laser, porém, é tão puro que pode ser focalizado com
extrema precisão com uma lente bastante simples.
Ao fazer um CD, o feixe de luz de um laser é modulado – isto é, feito para flutuar
em brilho – com o sinal de áudio digital a ser gravado e então focalizado no disco
mestre em rotação. Um material adequado na superfície do disco é gravado pelo feixe
intenso, produzindo um padrão de pontos correspondente ao sinal digital. Cópias
precisas do mestre podem ser feitas tomando moldes e, finalmente, extrudando o
plástico nos moldes. O processo não é diferente daquele usado para fazer discos de
gramofone tradicionais.
Na máquina de replay, um laser de baixa potência é focado na pista e a luz refletida

é detectada e convertida em sinais elétricos. Após uma decodificação adequada,
acabamos com um sinal de áudio de alta qualidade. A ótica de um CD player é mostrada
na Figura 10.6 .
A grade de difração mostrada no diagrama é um dispositivo que consiste em muitas

linhas gravadas estreitamente espaçadas que agem para produzir imagens separadas da
passagem de luz. (Com luz branca, uma grade desse tipo cria cores espectrais. Elas são
facilmente vistas quando um CD é mantido em ângulo reto com a luz, as faixas do disco
agindo como uma grade. A mesma coisa ocorre com a madrepérola devido à existência
de linhas finas na superfície.)
Figura 10.6 A ótica de um CD player
A razão para colocar a grade de difração é produzir feixes adicionais que terminam
nos sensores de luz do lado direito. Estes são usados para direcionar o feixe de laser
sobre a superfície do disco. Uma tendência ao desvio é mostrada por um sinal
aumentado em um dos sensores de ponto lateral e um sistema mecânico retorna o laser
ao alinhamento correto. Como os pontos laterais fazem isso é mostrado na Figura 10.7 .
Para dar uma ideia da finura das faixas de um CD, elas têm cerca de 0,5 μm de
largura (0,5 milionésimo de metro) e os centros das faixas estão separados por 1,6
μm. Em termos mais simples, existem cerca de 600 faixas por milímetro.
Para adicionar fatos e números sobre CDs, o tempo máximo de reprodução é de

cerca de 75 minutos. O tempo máximo de replay é sempre dado como 74 minutos, mas
na verdade pode ser um pouco mais do que isso. CDs com duração de 76 minutos não
são incomuns! O comprimento da pista é de aproximadamente 5,5 km, ou pouco menos
de 3,5 milhas! O disco é feito para girar de modo que a velocidade de varredura do
laser seja constante. Isso significa que os dados são lidos a uma taxa constante. Para
conseguir isso, a velocidade de rotação deve variar de cerca de 500 rpm no interior a
200 rpm no exterior. Colocamos as cifras nessa ordem porque o início é por dentro e o
fim por fora – ao contrário de um disco de vinil convencional.
Figura 10.7 Como os pontos laterais garantem o rastreamento correto
Correção de erros
Alguns métodos muito poderosos de detecção e correção de erros são incorporados aos
CD players. Estes são necessários porque é impossível garantir a perfeição na
fabricação de discos em bases comerciais. Basta segurar um CD, especialmente um
produzido há pelo menos alguns anos, em frente a uma lâmpada brilhante para ver
muitos minúsculos pontos de luz. Eles podem ser muito pequenos – talvez apenas um
centésimo de milímetro em alguns casos, mas mesmo isso representaria uma perda
significativa de dados. (Pode ser que a fabricação de CDs tenha melhorado. Tenho a
impressão de que os CDs recentes que comprei mostram menos pontos de luz do que os
comprados há alguns anos. Pode ser, é claro, que eu tenha sorte!)
A velocidade de gravação, ou seja, a velocidade da trilha sob o feixe de laser, é de

cerca de 1,2 m/s. Um orifício de apenas 1/100 mm de diâmetro é atravessado pelo feixe
em aproximadamente 1/100 de milissegundo. Agora, já apontamos que um sinal digital
estéreo requer quase 1,5 milhão de bits/segundo, portanto, mesmo esse minúsculo
pinhole representaria algo em torno de 15 bits.
A história completa da detecção e correção de erros de CD (e outros digitais) está

além deste livro, mas basta dizer que um bom reprodutor compensará 'buracos' de até 2
mm de diâmetro.
Uma experiência que pode ser tentada é pegar uma caneta hidrográfica com
tinta lavável NÃO permanente e traçar uma linha radial ao longo do disco. Quandoa
tinta secou, reproduza o disco e se a linha for fina – menos de um milímetro – não deve
haver efeitos audíveis. Em seguida, torne a linha mais larga em etapas até que o jogador
silencie ou repita uma faixa. Por fim, limpe as linhas e o disco ficará tão bom quanto
antes! Eu demonstrei isso muitas vezes na frente do público – que geralmente fica muito
impressionado. Uma explicação resumida é dada na p. 150.
IMPORTANTE: nem o autor nem os editores podem aceitar qualquer

responsabilidade se o experimento der errado.
Devemos acrescentar que essa capacidade de corrigir os dados ausentes requer

muito mais bits do que os necessários apenas para o áudio. No momento em que todos
os outros dados, alguns para temporização, alguns para correção de erros e assim por
diante, são levados em consideração, a taxa de bits final é de pouco mais de quatro
milhões por segundo.
CDs de limpeza
Existem alguns dispositivos muito atraentes no mercado para a limpeza de CDs. A regra
1, porém, é não sujar o disco em primeiro lugar! Mantenha os dedos sujos – ou mesmo
limpos – fora da superfície (sem esquecer que a superfície importante é a não etiqueta,
ou parte inferior, do disco).
Se for necessário limpar um disco, um pano úmido passado

cuidadosamente nas faixas deve resolver o problema. Manchas ao longo da linha dos
trilhos podem dificultar a leitura dos dados pelo sistema. É por isso que a caneta de tinta
lavável no experimento acima é desenhada radialmente – ou seja, ao longo dos trilhos.
Custo dos leitores de CD
Há poucas evidências que sugiram que a qualidade do som de tocadores muito caros
seja melhor do que de tocadores muito mais baratos. É provável que haja mais recursos
nos caros, mas se eles são importantes depende do comprador. Nos primórdios dos CDs,
a correção de erros pode ter sido melhor nas máquinas caras, mas isso não parece mais
ser verdade. De maior importância é a forma como o sinal analógico extraído é tratado –
a qualidade dos amplificadores, alto-falantes, etc.
NICAM
Isso significa Multiplex de Áudio Companding Quase Instantâneo, a maioria dos quais
tentaremos explicar! A forma de NICAM usada para som estéreo para televisão é fruto
de duas tecnologias separadas. O primeiro, ao qual nos referimos brevemente
anteriormente, é um método de ocultar o sinal de som da televisão (originalmente
mono) com o sinal de imagem, de modo que apenas um caminho de sinal seja
necessário dos estúdios aos transmissores.
Figura 10.8 Um sinal de linha de televisão
A Figura 10.8 mostra uma voltagem típica de sinal de linha de televisão – quanto

maior a voltagem, mais brilhante a linha vai da esquerda para a direita na tela.
No final de cada linha, o receptor deve ser informado exatamente quando voltar para
a esquerda e iniciar uma nova linha – ele precisa de um sinal de sincronização. Isso
assume a forma do pulso de sincronismo de linha no diagrama, e o sinal de som da
televisão em formato digital é encaixado onde está o pulso de sincronismo de linha, daí
o termo som em sincronismo.
O sinal completo só é enviado desta forma até os transmissores. Antes de sair para

os receptores domésticos, o sinal digital é removido e convertido em um formato
analógico para transmissão e os pulsos de sincronização são restaurados, caso contrário,
os receptores teriam problemas para tentar sincronizar as linhas.
A forma original do NICAM, a outra tecnologia pai, era um método de redução do

número de bits/segundo. Operou quase instantaneamente ('Near Instantaneous') e
trabalhou para comprimir o número de bits, depois expandindo o número quando era
apropriado fazê-lo. Esse processo de compactação com expansão subsequente é
conhecido como companding. O A em NICAM significa áudio – bem, seria, não
seria? – e multiplexação significa combinar sinais juntos. Daí o NICAM.
Stereo NICAM para televisão é um método muito engenhoso de pegar sinais de som
estéreo em formato digital, aplicando um processo de compressão para ter um número
gerenciável de bits e ajustando o resultado na forma de onda de vídeo como uma nova
forma de som em sincronia. Isso acontece até os transmissores. Lá, o sinal estéreo é
encaixado em uma seção do sinal de televisão transmitido e atinge os receptores
equipados com NICAM dessa forma. Para benefício dos receptores não NICAM, uma
versão mono analógica é produzida nos transmissores e transmitida da maneira normal.
Além de estéreo, a qualidade digital é muito melhor do que o som comum da

televisão, embora não tão boa quanto a qualidade do CD, apesar do que alguns anúncios
afirmam.
Um pouco mais sobre correção de erros

O leitor que tentou, ou ficou tentado a tentar, o experimento com uma caneta
hidrográfica à base de água e fazer marcas em um CD pode ter se perguntado como as
lacunas se tornaram inaudíveis.
Com quase todos os sistemas de gravação digital, os blocos de dados – ou seja, os 1s

e 0s que compõem uma amostra – são dispersos de acordo com um código
universalmente aceito. Isso é mostrado na Figura 10.9 . A linha superior representa os
dados originais em sua ordem correta. A linha do meio mostra o efeito da dispersão,
enquanto a linha inferior são os dados colocados de volta em sua ordem correta.
Agora suponha que houve uma grande perda de dados – talvez causada por uma
lacuna do tamanho de um orifício no disco, ou algum idiota desenhando linhas radiais
com uma caneta! Isso é mostrado pelo retângulo pontilhado e os blocos de dados D, H e
M são perdidos. No entanto, após a remontagem, esses blocos perdidos são bem
dispersos e, desde que não haja muita perda, várias verificações de paridade podem
percorrer um longo caminho para 'preencher' os dados ausentes.
Figura 10.9 Uso de um código de dispersão

Engenharia de Som Explicada, 2 Edição

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Engenharia de Som Explicada, 2 Edição

Enviado por

Direitos autorais:

Formatos disponíveis

Engenharia de som explicada, 2ª edição

Escreva o primeira revisão

O que são ondas sonoras?

1. Compressão – região onde o ar é comprimido. Nas ondas sonoras a compressão é

2. Rarefação – o oposto de uma compressão. A pressão do ar está ligeiramente abaixo do

3. ' Pressão barométrica estável ' – a pressão atmosférica normal do ar.

Há uma compressão onde as linhas estão mais próximas e uma rarefação onde estão

Apesar de as ondas sonoras serem longitudinais, sempre as desenhamos como ondas

Este é o número de ondas emitidas ou recebidas em um segundo. Até a década de 1950,

O ouvido humano normal pode detectar frequências de ondas sonoras na faixa de

Relacionado à frequência está o período – a duração de um ciclo. É igual a 1/f.

Com qualquer onda, a distância entre pontos correspondentes em ondas sucessivas é

Esta é a 'altura' da onda em quaisquer unidades que sejam mais convenientes – no

Figura 1.2 Comprimento de onda

A velocidade das ondas sonoras

As ondas sonoras viajam no ar a cerca de 340 m/s, ou seja, v = 340 m/s.

Velocidade, frequência e comprimento de onda

Frequência × Comprimento de onda = Velocidade (ou f × λ = v)

Frequência × Comprimento de onda = Velocidade (ou f × λ = v)

Escrevendo de outra forma:

Comprimento de onda = Velocidade/Frequência (ou λ = v/f)

Colocando 340 m/s como a velocidade e 1000 Hz como a frequência, temos

Comprimento de onda = 340/1000 metros

= 0,34 metros (ou 34 cm)

Ondas sonoras e obstáculos

Se as ondas sonoras com um comprimento de onda curto atingem um objeto e são

Não há divisão nítida entre reflexão e difração. Por exemplo, e tomando figuras

A curvatura das ondas sonoras (difração)

A difração é a curvatura das ondas ao redor de um obstáculo. Essa curvatura só ocorre

A gama de observações simples é quase infinita.

Figura 1.3 Ondas sonoras atingindo um obstáculo

Unidades usadas no som

Isso é relativamente fácil. Em todos os equipamentos domésticos, a potência necessária

Figura 1.4 Difração em uma abertura

Potência é a taxa na qual o trabalho é feito ou na qual a energia é produzida ou

Para muitas pessoas, essa palavra provavelmente seria considerada sinônimo de

Em termos científicos, isso é definido como a força atuando em uma unidade de

Usando essas unidades, a pressão atmosférica normal ao nível do mar é de cerca de

O newton leva um pouco de explicação. É propriamente definida como a força que

Pressão é a força que age sobre uma unidade de área.

Intensidade sonora e o efeito da distância

Para ajudar a entender isso, imagine um balão parcialmente inflado com um

I ∝ 1/d 2 ( ∝ significa 'é proporcional a')

onde d é a distância da fonte. Por exemplo, suponha que a uma distância de 1 m de uma

As ressalvas importantes que mencionamos acima são:

1. A fonte sonora é pequena comparada com as distâncias envolvidas (teoricamente deveria

2. Não há superfícies refletoras nas proximidades.

Consequentemente, a Lei do Quadrado Inverso raramente se aplica com muita precisão

O decibel é uma unidade de comparação – basicamente de duas potências, mas

Às vezes é particularmente conveniente adotar potências, tensões ou pressões

O decibel é uma unidade de comparação de duas potências, pressões, tensões, etc.

A velocidade das ondas sonoras

a –10°C a velocidade é de 325 m/s

a +10°C é 337 m/s

340 m/s é um valor razoável para usar em temperaturas ambientes normais.

Em outras substâncias além do ar, as ondas sonoras viajam em velocidades bem

A alta velocidade do som no hélio, cerca de três vezes a do ar comum, é responsável

Substância Velocidade (m/s)

dependendo do tipo de aço

Gás dióxido de carbono 259 (a 0°C)

gás hélio 965 (a 0°C)

1. A barra. Esta é outra unidade de pressão, mas é mais comumente usada em meteorologia,

1 bar = 100 000 Pa