Escolar Documentos
Profissional Documentos
Cultura Documentos
Por Michael Talbot-Smith
1 Ondas sonoras
Parte 1
Algum conhecimento inicial das ondas sonoras é essencial para que os capítulos
posteriores sejam totalmente significativos. A seguir, um breve resumo de suas
propriedades mais importantes. Fatos e números científicos são apresentados na Parte
2 , no final deste capítulo, para aqueles que possam achá-los úteis ou interessantes.
Eles são descritos como ondas de compressão e rarefação no ar. Isso significa que,
quando as ondas sonoras passam por um ponto fixo, a pressão atmosférica nesse ponto
fica ligeiramente acima e abaixo da pressão barométrica constante. Mas essas flutuações
são pequenas e rápidas demais para serem registradas por um barômetro. Um
microfone, por outro lado, pode ser pensado como uma espécie de barômetro elétrico
extra-sensível capaz de detectar essas rápidas flutuações na pressão do ar, ao contrário
de um barômetro normal, que só pode indicar mudanças de pressão relativamente
lentas. A Figura 1.1 mostra como seria uma onda sonora se pudéssemos vê-la.
DEFINIÇÕES
Frequência
Comprimento de onda
Amplitude
No ar, em condições normais, as ondas sonoras viajam a cerca de 340 metros por
segundo (m/s). Isso é próximo a 760 milhas/hora, ou cerca de 1120 pés/segundo. A
velocidade varia um pouco com a temperatura do ar, por isso os instrumentistas de
sopro precisam, literalmente, aquecer seus instrumentos, pois a afinação depende da
velocidade com que as ondas sonoras oscilam dentro do instrumento. Para a maioria dos
propósitos práticos, além do exemplo que acabamos de citar, a variação na velocidade
da onda sonora com a temperatura não é importante. Os detalhes são fornecidos na Parte
2 deste capítulo. O símbolo para a velocidade da onda sonora é, neste livro, v.
Essas três coisas estão ligadas por uma fórmula importante, mas felizmente simples. Um
momento de reflexão mostrará que, se, digamos, 1.000 ondas por segundo estão sendo
emitidas de uma fonte (ou seja, a frequência é de 1 kHz) e cada uma tem um
comprimento de onda de λ, então, após um segundo, as primeiras ondas emitidas estarão
a 1.000 × λ de distância . Ou, sua velocidade é de 1000 × λ metros por segundo.
O que fizemos foi multiplicar a frequência pelo comprimento de onda para chegar à
velocidade:
IMPORTANTE
Deve ser bastante óbvio que, se a frequência for dobrada (para 2 kHz), o
comprimento de onda será reduzido pela metade (para 17 cm) e assim por
diante. Cálculos simples nesse sentido mostrarão que a frequência mais baixa que o
ouvido normal pode detectar – 16 Hz – corresponde a um comprimento de onda de
cerca de 21 m (70 pés), enquanto na frequência mais alta, em torno de 16 kHz, o
comprimento de onda é de cerca de 2 cm, ou melhor, menos de uma polegada.
Veremos nas próximas duas seções que essa vasta gama de comprimentos de onda
apresenta problemas em muitas situações de gravação de som, pois o grau em que as
ondas sonoras são refletidas ou contornadas por obstáculos depende criticamente do
comprimento de onda.
Everyone is familiar with echoes – sounds being reflected from a large building or a
cliff. What is perhaps not so obvious is that for this reflection to occur to any significant
effect the sound wavelength must be smaller than the dimensions of the reflecting
object. For example, the side of a building might be 10 m high and 20 m long. Sounds
striking this building at right angles will be reflected if their wavelength is less than 10
m – that is, for frequencies greater than about 30 Hz. The most predominant frequencies
in the human voice range from roughly 200 Hz to around 500 Hz, so a shout near to this
building will be easily reflected.
Por outro lado, se o objeto tiver dimensões menores que o comprimento de onda,
não haverá reflexão. Em vez disso, as ondas se curvam ao redor do objeto, um processo
chamado difração, do qual trataremos na próxima seção.
Isso pode ser pensado como um efeito complementar à reflexão, pois as ondas que não
são refletidas serão contornadas por um obstáculo. Se o comprimento de onda for muito
maior que o tamanho do obstáculo, haverá uma curvatura marcada pelas ondas (há então
pouca reflexão). Se o comprimento de onda for pequeno, haverá pouca difração, mas
considerável reflexão. A Figura 1.3 (a) mostra a difração quase completa.
DEFINIÇÃO
A Figura 1.4 mostra o que acontece quando as ondas sonoras passam por uma
abertura. Possivelmente ao contrário do que se poderia esperar, se a abertura for
pequena em relação ao comprimento de onda, há um espalhamento considerável do
feixe de ondas emergentes; se for grande, há pouco espalhamento. Muitas vezes é fácil
ver efeitos como este na água quando ondulações, ou mesmo ondas grandes, encontram
obstruções ou lacunas, por exemplo, nas paredes de um cais.
Existem muitos experimentos fáceis de realizar, mas altamente instrutivos, que o
leitor pode realizar por si mesmo. Por exemplo, tente segurar algo como uma prancheta
ou qualquer outra folha rígida de formato conveniente entre o ouvido e uma fonte de
som. Ver-se-á que as altas frequências da fonte são reduzidas no ouvido.
Em seguida, incline a placa para que os sons sejam refletidos no ouvido e veja qual
faixa de frequências é afetada. Observe como o caráter do som varia quando uma
aeronave passa atrás de uma casa, árvores ou outros objetos.
Vale ressaltar que todas as ondas, e não apenas as ondas sonoras, sofrem reflexão e
difração quando as condições são adequadas. Com a luz, por exemplo, os comprimentos
de onda são tão pequenos em relação ao tamanho dos objetos do dia-a-dia que
praticamente 100% de reflexão ocorre quase o tempo todo. A difração ocorre, mas os
efeitos geralmente não são óbvios.
Poder
Como as ondas sonoras são uma forma de energia, podemos legitimamente usar
watts como unidades de sua potência. No entanto, na prática, o watt é, em termos de
ondas sonoras, inconvenientemente grande para a maioria dos propósitos. Ou talvez
devêssemos dizer que o ouvido humano é tão sensível que precisamos de unidades
menores do que watts.
DEFINIÇÃO
Neste ponto, o leitor não deve ficar confuso, ou possivelmente até alarmado, pelo
fato de que seus alto-falantes provavelmente têm rótulos citando potências muito
maiores do que as minúsculas potências, como um milionésimo de watt, que o ouvido
pode suportar. Os alto-falantes geralmente são classificados em muitos watts, 50 W ou
mais, mesmo para um sistema doméstico modesto. Esta potência refere-se à potência
elétrica máxima que pode ser alimentadano alto-falante sem causar danos ou distorção
grave. A potência sonora que sai provavelmente será de cerca de 1% ou 2% da potência
elétrica que entra no alto-falante - e apenas uma fração muito pequena disso
provavelmente entrará no ouvido do ouvinte!
Intensidade
DEFINIÇÃO
Intensidade é a energia caindo, emitida por ou passando por uma área específica.
Pressão
Assim, as pressões das ondas sonoras são normalmente dadas como tantos
newtons/metro quadrado, abreviado para N/m 2 .
Para complicar ainda mais, tornou-se prática oficial lembrar o cientista francês
Blaise Pascal (1623-1662), chamando o N/m 2 de pascal (Pa para abreviar).
Esta seção sobre unidades pode parecer pesada. O leitor não deve se preocupar
muito se for esse o caso, pois na maior parte do tempo nestelivro, usaremos essas
unidades apenas como base de comparação. A familiaridade trará, espera-se, não
desprezo, mas uma pronta aceitação deles.
DEFINIÇÃO
Dificilmente é preciso afirmar que os sons diminuem de volume quanto mais nos
afastamos da fonte do som. Aqui podemos ser um pouco mais precisos e indicar que a
intensidade (veja acima) diminui com a distância a uma taxa tal que, para
cada duplicação da distância, a intensidade (I) é dividida em quatro.
decibéis
O decibel (dB para abreviar) é uma unidade muito útil, mas infelizmente pode causar
confusão e pavor até que seja completamente compreendido. Por essa razão, vamos nos
limitar aqui a não mais sobre o dB do que o absolutamente necessário, mas mais sobre
isso é dado na Parte 2 do capítulo.
Este é o mais breve dos resumos sobre decibéis, mas eles ocorrerão muitas vezes ao
longo deste livro. No entanto, a exposição gradual e contínua a eles os tornará cada vez
mais significativos para o leitor. Provavelmente sem muito esforço também.
DEFINIÇÃO
Ondas sonoras
Parte 2
Isso varia ligeiramente com a temperatura do ar, mas não, como geralmente se supõe,
com a pressão do ar, pelo menos não em todas as faixas de temperatura e pressão
normalmente encontradas.
A 0°C, a velocidade das ondas sonoras no ar pode ser considerada como 331 m/s, e
isso aumenta em 0,6 m/s para cada aumento de 1°C na temperatura.
Por isso:
Tabela 1.1
Água 1480
Vidro 5200
Aço 5000–5900
Madeira 3000–4000
dependendo da madeira
Unidades
ou 10 μbar = 1 Pa
16 Hz 21h25
20 Hz 17,0
50 Hz 6.8
100 Hz 3.4
500 Hz 0,68
1 kHz 0,34 *
decibéis
Expresso corretamente, o número de decibéis representando uma razão de duas
potências é
o aumento dB é de 10 log(100/50)
= 10 registros(2)
= 3,010 ou aproximadamente 3 dB
Será lembrado na Parte 1 do capítulo que esse aumento de 3 dB é quase detectável! Para
obter o dobro do volume do alto-falante, assumindo que ele suportará o aumento de
potência sem ser danificado, a potência deve ser aumentada em 10 dB. Isso significa
que o amplificador de 50 W terá que ser substituído por um de 500 W:
dB = 10 log(500/50)
= 10 registros(10)
= 10 × 1
Questões
a. 160–1600 Hz b. 16–1600 Hz
3. Uma sala destinada a gravações musicais tem a sua galeria sustentada por pilares de
secção quadrada. Estes são 0,5 m por 0,5 m de seção transversal. Qual faixa de
frequência do som será refletida de cada pilar?
O mecanismo pelo qual as ondas sonoras são convertidas em percepção pelo cérebro é
extremamente complicado e partes dele ainda não são totalmente compreendidas. Este
livro não é o lugar nem mesmo para um relato limitado do assunto. É, no entanto, um
tema fascinante e o leitor que quiser saber mais deve consultar a lista de livros para
leitura complementar no final. Existem, no entanto, vários aspectos do processo
auditivo que são importantes no contexto da tecnologia de áudio e estes serão descritos
aqui.
A resposta do ouvido
Para começar, estamos lidando com uma faixa de frequência de cerca de 16 Hz a cerca
de 16 kHz. Esses números não são precisos. Na extremidade inferior, não é fácil dizer
quando o som deixa de ter um tom identificável e começa a se tornar uma espécie de
vibração. Valores de 16–20 Hz são citados por diferentes autoridades. A extremidade
superior depende do indivíduo e também da idade da pessoa. Vinte kilohertz podem ser
detectados por uma pessoa no final da adolescência; algumas pessoas de 60 anos podem
ter dificuldade em ouvir qualquer coisa acima de 8 ou 10 kHz. Os efeitos da exposição a
ruídos altos também podem ter um efeito muito significativo. Dezesseis quilohertz é, no
entanto, um número bastante bom para citar como o limite superior de audição para o
adulto médio.
Sonoridade. O dB(A)
Sugerimos no Capítulo 1 que o decibel pode ser a base de uma unidade de medida,
mas uma medição direta da pressão sonora em decibéis obviamente não é boa o
suficiente, pois não levaria em consideração a resposta de frequência desigual do ouvido
normal. Se, no entanto, o dispositivo de medição incorporar um circuito de correção
elétrica que lhe dê uma resposta de frequência semelhante à do ouvido, podem ser feitas
aproximações razoáveis ao volume.
Pode ser importante notar que os regulamentos de ruído atuais no Reino Unido
exigem que os protetores auriculares sejam disponibilizados em um local de trabalho
industrial onde os níveis de ruído atinjam 85 dB(A). Acima de 90 dB(A) seu uso é
obrigatório e também os níveis de ruído do maquinário devem ser reduzidos, se
possível.
DEFINIÇÃO
Tom musical
Com isso, queremos dizer a posição de uma nota na escala musical. O tom pode ser um
assunto muito complicado – como tantas outras coisas no som! Deve ser o suficiente
aqui para dar os contornos de alguns fatos básicos:
1. O tom está basicamente relacionado à frequência, mas o tom percebido de uma nota pode
ser afetado pelo volume.
3. Apesar do que foi dito em 1 acima é possível fazer uma tabela relacionando altura e
frequência. A nota designada C é aquela chamada 'Middle C' em um instrumento de
teclado. A Tabela 2.2 lista as frequências para diferentes notas de altura.
Fonte dB(A)
Orquestra, fortissimo a 5 m 100 *
TV doméstica, a 3 m 70
Fala a 1 m 60–65
5. Semitons adjacentes (por exemplo, de uma nota em um teclado para a adjacente acima ou
abaixo, o que pode significar ir de uma nota branca para uma preta, ou vice-versa) têm
frequências na proporção de cerca de 1,06:1. Em outras palavras, há uma diferença de
frequência de 6%. Uma nota elevada por um semitom é indicada pelo sinal de
'sustenido' #. Uma nota abaixada em um semitom é marcada como ' '.
1. Harmônicos. Estes são tons com frequências que são múltiplos exatos da frequência base
(chamada de fundamental). Um instrumento tocando a nota a = 220 Hz provavelmente
produzirá não apenas 220 Hz, mas também muitos múltiplos dessa frequência, como
440, 660, 880, 1100, 1320 e assim por diante. Geralmente, os vários harmônicos
diminuem em amplitude à medida que aumentam em frequência. Os músicos
geralmente se referem aos harmônicos como harmônicos , mas o primeiro harmônico é
o segundo harmônico e assim por diante.
2. Transientes iniciais. Por um breve período no início de uma nota – e isso pode ser tão
pouco quanto um centésimo de segundo, e raramente mais do que cerca de um quinto de
um segundo – existem frequências adicionais presentes que não são numericamente
relacionadas com a fundamental como o harmônicos são. Essas frequências
desaparecem rapidamente, daí o nome 'transitório'. Eles dependem, possivelmente entre
outras coisas, da maneira e da taxa em que as vibrações se acumulam em um
instrumento. Eles são uma espécie de impressão digital.
DEFINIÇÕES
A 440
G# 415
G 392
F# 370
F 349
D# 330
D 294
C# 277
C 262 *
b 247
a# 233
a 220
C médio = 262 Hz
São bem conhecidas as ilusões de ótica, nas quais o cérebro sobrepõe sua própria
interpretação ao que os olhos recebem como luz. As pessoas envolvidas com o som
precisam estar cientes de que existem equivalentes auditivos.
2. É muito fácil para o sistema ouvido/cérebro ouvir o que ele acha que deveria ouvir! A
maioria dos operadores de som profissionais conhece casos em que ajustaram um
controle em um equipamento e ficaram bem satisfeitos com o resultado, apenas para
descobrir mais tarde que o controle havia sido desligado do circuito e, portanto, não
estava fazendo nada!
3. Às vezes, efeitos curiosos podem ocorrer em estéreo. Por exemplo, muitas pessoas que
ouvem gravações estéreo de aeronaves, nas quais a imagem do som da aeronave vai de
um alto-falante para o outro, descobrem que a imagem do som parece elevar-se acima
do nível dos alto-falantes e pode até parecer ser a sobrecarga. A explicação é claramente
que o cérebro associa o ruído da aeronave com a altura e então imagina um efeito de
altura mesmo quando as fontes sonoras reais estão ao nível do ouvido.
4. O sistema ouvido/cérebro tem uma capacidade extraordinária de discriminar sons que
considera sem importância. Ele pode fazer isso porque, por ter dois ouvidos, o cérebro
pode localizar a direção dos sons desejados. Às vezes, esse efeito é chamado de efeito
coquetel. (Você pode adivinhar o porquê!) Os microfones, mesmo quando há dois em
estéreo, não podem fornecer essa discriminação, ou pelo menos em um pequeno grau,
de modo que o que pode parecer ser condições acústicas aceitáveis quando um ambiente
é ouvido 'ao vivo ' pode revelar-se totalmente inaceitável, por motivos de ruído de fundo
ou reverberação excessiva, quando uma gravação é reproduzida.
5. O item restante nesta lista curta é conhecido como Efeito Haas. Dito brevemente, se sons
semelhantes chegam aos ouvidos de um ouvinte, então os sons que chegam primeiro
determinam a direção aparente da fonte sonora, mesmo que o som que chega mais tarde
possa ter um nível de até 10 dB mais alto. O leitor pode verificar isso alimentando um
par de alto-falantes estéreo com uma fonte mono e, em seguida, movendo-se em direção
a um dos alto-falantes para que o som dele chegue primeiro aos ouvidos. Isso fará com
que a imagem do som mono se mova para aquele alto-falante. É improvável que o ajuste
do controle de equilíbrio para aumentar o nível no outro alto-falante mude a imagem até
que haja uma diferença de volume muito apreciável entre eles.
Uma comparação precisa de dois dispositivos de áudio semelhantes (como dois alto-
falantes) só pode ser feita alternando rapidamente de um para o outro. Isso é chamado
de 'comparação A–B '.
Tom
Dissemos anteriormente que a relação de frequência entre dois semitons adjacentes era
de aproximadamente 6%. Em termos científicos (mas não necessariamente musicais), o
número exato é
12
2 (a décima segunda raiz de 2)
O leitor interessado com uma calculadora científica pode tentar inserir 1,0594631 na
memória da calculadora e, em seguida, usar Memory Recall 12 vezes da seguinte
maneira:
RM × 1,0594631 = 1,122462
MR × 1,122462 = ... e assim por diante, num total de 12 vezes.
'falso baixo'
Este é o nome dado a um efeito interessante pelo qual o sistema ouvido/cérebro pode, de
alguma forma, parecer inserir frequências muito baixas que deveriam estar presentes,
mas que não são reproduzidas. Pode ser que o cérebro reconheça uma série de
harmônicos como baseados em uma frequência específica e compense mentalmente essa
frequência se ela não estiver presente.
Para dar um exemplo, a Tabela 2.3 mostra que as notas mais baixas de um grande
órgão de tubos podem chegar a 15 Hz. Existem muito poucos alto-falantes que podem
reproduzir frequências tão baixas e, no entanto, nossos ouvidos geralmente não
percebem essa deficiência.
de para
Questões
1. Decibéis podem ser apropriados para comparação em dois dos seguintes. Que dois?
2. Uma nota tem uma frequência de 200 Hz. Qual é a frequência da nota uma oitava acima?
7 estéreo
Parte 1
Se uma fonte de som está diretamente na frente de uma pessoa, então claramente
não há diferença no tempo que os sons dessa fonte levam para chegar aos ouvidos. No
caso de um som vindo de qualquer direção, exceto dofrente, então haverá uma diferença
de hora de chegada. (Não vamos nos preocupar aqui com sons que se originam acima ou
abaixo do nível dos ouvidos). é aproximadamente 1 ms (1 milissegundo = 1/1000
segundo). O que é bastante interessante é que, em condições de escuta razoavelmente
boas, a maioria das pessoas pode detectar quando uma fonte de som se moveu cerca de
1° a partir do eixo frontal, e isso representa uma diferença de tempo de chegada nos
ouvidos de aproximadamente 10 μs – dez milionésimos ou centésimo milésimo de
segundo! Como o cérebro faz isso não está claro.
(A questão de como localizamos os sons que estão acima ou atrás da cabeça ainda é
um pouco obscura. Os movimentos da cabeça ajudam a localizar a origem de um som.
para cada movimento da cabeça, o cérebro pode realizar cálculos que permitem ao
ouvinte diminuir a incerteza. Além disso, há evidências de que as dobras no ouvido
externo - a parte visível - podem criar reflexões múltiplas em altas frequências e o
padrão dessas reflexões vai depender do ângulo de incidência do som.)
Segue-se que, para recriar a informação direcional para um ouvinte, pelo menos em
uma área frontal, precisamos criar diferenças de tempo de chegada nos ouvidos da
pessoa.
Agora acontece que se os sinais elétricos nos dois canais – os caminhos esquerdo e
direito dos microfones aos alto-falantes – diferem um do outro apenas em
amplitude, então uma dispersão razoável de imagens sonorasentre os alto-falantes pode
ser esperado. A explicação para isso está além do escopo deste livro, mas há explicações
legíveis em alguns dos livros listados no final. No momento, vamos simplesmente
afirmar que, para a audição de alto-falantes, é necessário que haja diferenças de
amplitude entre os dois canais – diferenças entre canais – e,
paradoxalmente, nenhuma diferença de tempo entre os sinais neles contidos.
Par coincidente – Dois microfones direcionais com seus diafragmas montados o mais
próximo possível.
Terminologia
Audição estéreo
Já sugerimos que o ouvinte deve estar na linha central entre os dois alto-falantes e que
estes devem ser um par 'combinado'. E não só devem ser combinados em termos de
qualidade, mas devem ser 'balanceados' de modo que, se alimentados com exatamente o
mesmo sinal (ou seja, mono), a imagem sonora resultante seja verdadeiramente
central. (Como verificar a correspondência é explicado abaixo, assim como as formas de
obter um sinal mono.)
Tendo dito que o ouvinte deve estar na linha central entre os alto-falantes, uma
pergunta razoável a se fazer é: a que distância dessa linha central o ouvinte pode estar
antes que as imagens estéreo se tornem excessivamente destras ou canhotas? A resposta
resumida é que, para uma audição realmente crítica, há muito pouca latitude, talvez 2 ou
3 cm, com um espaçamento de alto-falante de alguns metros. No entanto, pode haver
audição estéreo agradável, o que é uma questão diferente, quando o ouvinte está
visivelmente fora da linha central. Muito pode depender dos alto-falantes
específicos. Alguns tipos oferecem uma propagação razoável do som quando o ouvinte
está a um metro ou mais da linha central, assumindo novamente uma linha de base de 2
metros.
Parte do que foi escrito acima pode facilmente parecer muito preocupante para a pessoa
comum que simplesmente gosta de ouvir estéreo razoável. A tal pessoa diríamos
simplesmente: 'Não se preocupe!' Não reorganize sua sala de estar para torná-la
acusticamente simétrica; não preencha uma janela ou cortina uma parede oposta. Se
você gostou da sua música até agora, continue a apreciá-la. (No entanto, em um
ambiente profissional, terá que haver mais cuidado ao projetar as áreas de escuta.)
Pode ser, é claro, que imagens peculiares tenham sido um problema e há dicas aqui
que podem ajudar. É mais ou menos como os casos em minha própria experiência,
quando as respostas dos alto-falantes eram medidas por pessoas com alto-falantes dos
quais elas tinham muito orgulho. Os gráficos quase inevitavelmente desiguais causaram
grande sofrimento – realmente desnecessariamente. Esses eram casos de um pouco de
conhecimento sendo, não perigoso, mas perturbador – ou talvez alguém pudesse dizer
que a leve ignorância era uma bênção!
Isso significa garantir que a qualidade de saída dos dois alto-falantes seja a mais
próxima possível. A melhor maneira de verificar isso é alimentar ambos os alto-falantes
com música mono que contenha uma ampla gama de frequências.
Estágio
Quão óbvia é uma condição fora de fase pode depender muito do tipo de material do
programa. Com imagens estéreo amplas e pouco som central, um sinal fora de fase pode
não ser tão óbvio. Será mais aparente com imagens monocromáticas ou centrais. Esta,
então, é a maneira de verificar as conexões fora de fase. Reproduza um sinal mono
central (e aqui um boletim de notícias simples será bastante adequado) e verifique se há
uma imagem central clara. Se houver alguma dúvida, a fiação de um dos canais deve ser
trocada e, provavelmente, a maneira mais fácil de fazer isso será nos terminais de um
dos alto-falantes. Se o sistema estiver fora de fase e a fiação dos alto-falantes estiver
obviamente correta, será necessário verificar o restante do sistema.
Questões
1. Qual é a diferença aproximada do tempo de chegada nos dois ouvidos de uma pessoa
quando uma fonte de som está a 90° da frente?
d Alto-falantes incompatíveis
.
4. O que deveria ser uma imagem central clara em uma cena estéreo é difícil de localizar
ouvindo. Qual é a causa provável?
7 estéreo
Parte 2
As desvantagens são:
Em suma, é justo dizer que as técnicas de multi-microfone geralmente não são tentadas
a menos que haja muitos microfones disponíveis e o equipamento de mixagem seja
adequadamente abrangente.
Hipercardióides 135°
Cardióides 180°
Talvez a grande questão agora seja: qual sistema de diagrama polar usar
quando? Muitas vezes, é claro, há pouca escolha. Normalmente, os únicos microfones
disponíveis são um par de cardióides (como, por exemplo, nos microfones estéreo
integrados da maioria das filmadoras). No entanto, o posicionamento de um par de
microfones coincidentes, seja qual for o padrão polar, é em grande parte uma questão de
geometria.
Vamos supor que temos dois cardióides – e repetimos que eles devem ser o mais
parecidos possível, mesmo fabricante, mesmo número de tipo e assim por diante. A
Figura 7.6 mostra os prováveis spreads de imagem para duas posições para tal par de
microfones. Em (a), os microfones estariam próximos à frente da fonte sonora (banda,
coro, orquestra, etc.). Em (b), os microfones estão mais para trás de forma que os eixos
dos cardióides estejam apontando aproximadamente para as bordas da fonte. Lembre-se
que o ângulo de aceitação para um par de cardióides é de cerca de 180°. Em (a), a
propagação das imagens sonoras preencherá quase completamente a região entre os
alto-falantes;em (b), apenas uma parte da região será preenchida. Observe que o estado
de coisas na Figura 7.6 (b) não é necessariamente errado. Um piano solo geralmente
soará um pouco bobo se parecer ter toda a largura entre os alto-falantes! Da mesma
forma, um quarteto de cordas clássico deve normalmente preencher apenas parte do
quadro.
Com uma banda de rock é difícil dizer qual deve ser a imagem reproduzida, pois
muitas vezes não há tentativa de reproduzir a realidade do som original.
Em segundo lugar, há uma região de captação traseira de 90°, o que pode ou não ser
bom. Por exemplo, pode ser útil se for necessária muita reverberação; por outro lado,
pode haver ruídos indesejados vindos de trás – uma plateia tossindo, por exemplo! Um
ponto final e às vezes muito importante é que os quadrantes laterais são regiões fora de
fase e isso significa que os sons vindos dessas direções podem ser difíceis de localizar
pelo ouvinte. Os lados, portanto, devem ser considerados como 'zonas proibidas',
embora a reverberação que chega dos lados não sofra nenhum efeito peculiar porque é,
por sua natureza, tão difusa que a fase não tem significado real. Isso é ilustrado
na Figura 7.7 .
2. Se a acústica da sala ou outra área de gravação for ruim, por exemplo, com reverberação
excessiva ou ruído externo, microfones mais próximos, como cardióides, podem ajudar.
Por fim, ao planejar uma gravação estéreo, vale a pena estudar a situação com
antecedência para ter uma ideia de quais microfones usar e onde colocá-los. Então, e
isso é o mais importante, um ensaio deve ser usado para testar o mais minuciosamente
possível se as posições ideais do microfone foram alcançadas. Isso significa ouvir
criticamente, de preferência em alto-falantes. Se isso não puder ser feito no local de
gravação, significa fazer uma gravação e reproduzi-la nas melhores condições de
audição possíveis.
Muitas vezes, tudo isso é mais fácil dizer do que fazer, especialmente porque há
complicações como o fato de que a presença de uma platéia quase certamente
modificará a acústica, e os músicos tocarão mais alto e melhor quando houver alguém
para tocar! No entanto, com a experiência, é possível fazer algumas concessões para
essas coisas.
Questões
Com um par estéreo coincidente de microfones em ângulo de 90° entre si, quais são os
'ângulos de aceitação' efetivos para o seguinte?
1. Cardióides
2. Hipercardióides
3. Figura de oito
4. Omnis
5. Com qual arranjo de par coincidente é provável que haja uma região fora de fase
significativa nas laterais?
10 Áudio digital
Parte 1
Na edição anterior deste livro, publicada em 1997 – não muitos anos atrás – sugeri que
o equipamento digital naquela época provavelmente seria muito caro para o leitor
amador e semi-profissional! As coisas mudam. Gravadores digitais de boa qualidade e
dispositivos associados são agora muito acessíveis.
Histórico
Então, no início dos anos 1970, a rádio BBC, enfrentando o problema de enviar
estéreo de alta qualidade para seus transmissores, adotou o áudio digital. Isso não
apenas permitiu que os programas de rádio fossem enviados por todo o Reino Unido
quase sem deterioração da qualidade, mas também financeiramente muito econômico. O
uso dos princípios do áudio digital, mas com padrões um pouco melhorados, apareceu
com o disco compacto – o CD – por volta de 1980, e outros sistemas digitais surgiram
desde então.
Princípios básicos
Nos sistemas analógicos, onde o sinal elétrico é uma réplica, ou deveria ser, das ondas
sonoras originais, existe um problema fundamental: qualquerdeficiência causada por
qualquer motivo é praticamente impossível de corrigir. Tais deficiências podem ser o
resultado de interferência captada durante uma transmissão de rádio, efeitos de sujeira e
poeira em uma ranhura de gravação e imperfeições no meio de gravação (manchas nuas
ou finas no óxido magnético da fita, por exemplo).
Amostragem
Figura 10.1 Amostragem
quantizando
Quanto mais precisa for essa medição de amplitude, melhor será a qualidade do
resultado final. Para uma precisão real, é necessário que haja um grande número de
graduações nesta régua. Cerca de 8.000 é o mínimo utilizável, mas não é suficiente para
gravações de alta qualidade (por exemplo, qualidade de CD), quando são necessárias
cerca de 65.000 graduações ou níveis de quantização!
Nesse ponto, o cérebro começa a ficar confuso com a magnitude das coisas –
medindo a música 44.000 vezes por segundo, cada medição sendo um número entre 0 e
65.000! Felizmente, a eletrônica moderna pode lidar com tudo isso com bastante
facilidade. No entanto, vamos fazer uma pausa para ver com o que estamos
comprometendo o sistema. Uma fita ou disco digital deve armazenar números que
podem ser de até 65.000 e fazer isso a uma taxa de pouco mais de 44.000 deles por
segundo!
aritmética binária
Felizmente, as coisas começam a ficar um pouco mais simples quando procuramos tipos
alternativos de aritmética. O áudio digital usa aritmética binária. Com nossa aritmética
diária usual, contamos de 0 a 9 e, em seguida, colocamos um 1 na frente para ir de 10 a
19, depois um 2 e assim por diante. Na aritmética binária existem apenas dois dígitos, 1
e 0, em vez de dez, e a contagem é de 0 a 1, e então um 1 é colocado na frente para fazer
10. O próximo número tem um adicionado para fazer 11 (não chame-o de 'onze' – não
é!) e então um 1 adicional é colocado na frente para que tenhamos 100, 101 e assim por
diante. A Tabela 10.1 compara nossa aritmética decimal padrão com a binária. Se o
leitor não estiver familiarizado com a aritmética binária, deve-se tentar continuar a
tabela.
Tabela 10.1
Decima Binári Nº de
l o bits
0 0 1
1 1 1
2 10 2
3 11 2
4 100 3
5 101 3
6 110 3
7 111 3
8 1000 4
9 1001 4
10 1010 4
1×0=0
1×1=1
Porém, vejamos onde isso nos leva – não devemos deixar que um estudo de
aritmética binária, por mais breve que seja, nos distraia do objetivo principal, que é o
áudio digital.
Após o processo de quantização, os números resultantes são convertidos em binário,
de modo que, por exemplo, o número 17 832, que representa uma amostra de cerca de
um quarto da altura máxima em um sinal de CD, quando convertido para binário torna-
se 100010110101000. Agora, se cada 1 representa um pulso de tensão temos então o
sinal mostrado na Figura 10.3 .
Regeneração de pulsos
Pelo que dissemos, pode parecer que a restauração dos pulsos digitais pode
continuar indefinidamente. Isso não é bem verdade. Eventualmente, haverá pulsos que
estão muito longe de serem regenerados e, embora a maioria dos sistemas digitais faça
uso de detecção e correção de erros – que descreveremos brevemente abaixo e
explicaremos um pouco mais detalhadamente na Parte 2 –, no final, haverá uma
degradação perceptível. No entanto, os dígitos fornecem uma maneira muito mais
confiável e robusta de lidar com qualquer tipo de sinal do que o analógico é capaz. Vale
a pena mencionar que grande parte do sistema telefônico do Reino Unido usa sinais
digitais para distribuição – para melhorar a qualidade e também para economia.
taxa de bits
Com 16 bits para cada amostra e cerca de 44.000 amostras por segundo, temos
Agora, a fita analógica comum grava até 20 kHz e, embora não seja correto dizer
que a frequência em hertz é precisamente a mesma que em bits por segundo, a
discrepância entre 20 kHz e 4 MHz é claramente enorme. A gravação em fita
convencional simplesmente não consegue lidar com o áudio digital. Trataremos da fita
digital no próximo capítulo, mas é suficiente, por enquanto, mostrar que um preço deve
ser pago pela qualidade potencialmente alta que o áudio digital pode oferecer.
Tabela 10.2
Detecção de erro
Já mencionamos que, com sistemas analógicos, não há uma maneira realmente eficaz de
detectar erros de qualquer tipo.
atraso digital
3. Para auxiliar no 'rastreamento duplo automático' (ADT), onde um único vocalista aparece
para cantar um dueto. Um pequeno atraso de alguns milissegundos, de preferência com
um elemento de mudança de tom (veja abaixo), pode ser muito eficaz.
5. Para habilitar o que é chamado de 'atraso de palavrões' em alguns programas de rádio por
telefone. Tudo passa por um atraso de talvez cerca de 15 segundos. Se o chamador usar
linguagem inaceitável, o apresentador do programa pressiona um botão que exclui o
conteúdo da loja, incluindo as palavras indesejadas. A eletrônica inteligente aumenta
gradualmente o atraso, de modo que o fato de que algum material foi removido é quase
imperceptível. No entanto, requer um apresentador muito capaz e de raciocínio rápido.
reverberação artificial
'Eco', como muitas vezes é chamado de forma imprecisa, já foi criado por alto-falantes e
microfones em salas reverberantes; mais tarde, placas de aço especiais foram usadas e
podiam ser colocadas em vibração eletricamente para dar uma imitação muito aceitável
de reverberação. Ambos os métodos eram volumosos e caros.
Mais barato e mais compacto era o reverberador de mola, no qual uma ou mais
molas eram colocadas em vibração por um pequeno transdutor fixado à(s) mola(s) com
um outro transdutor para captar as reverberações. Unidades muito caras eram
razoavelmente boas, mas as baratas pareciam - bem - molas vibrantes!
Atraso
Uma maneira de criar melhor realismo com reverberação artificial é fazer uso de
atrasos. Isso pode ser feito com uma unidade de atraso como mencionado acima, mas
muitos dispositivos de reverberação digital têm atrasos variáveis embutidos. A razão
para ter um atraso é esta. A combinação ouvido/cérebro humano é muito boa para
detectar pequenos intervalos de tempo, como aqueles que ocorrem, digamos, em uma
sala quando os ouvidos recebem primeiro o som direto da fonte e depois a primeira
reflexão, como é chamada, vindo de uma parede, piso ou teto. Se o atraso entre o som
direto e a primeira reflexão for maior do que cerca de 40 ms (=1/25 segundo), então a
pessoa está ciente de um intervalo de tempo. Essa é a definição adequada de 'eco' -
quando alguém está ciente de um intervalo de tempo entre dois sons.
Mudança de tom
Suponha, porém, que a chave de saída gire mais rápido que a de entrada. O efeito
será que o tom da saída analógica será mais alto que o tom da entrada. O leitor, sem
dúvida, se perguntará como isso pode ser um processo contínuo, porque mais cedo ou
mais tarde um interruptor alcançará ou será alcançado pelo outro! Na verdade não pode,
mas com o uso de tecnologia inteligente pode-se dar a impressão de que é contínuo. O
leitor curioso e intrigado é encaminhado para a seção 'Leitura adicional'.
MIDI
Isso significa Interface Digital de Instrumento Musical. Isso realmente se relaciona com
a música eletrônica, mas uma breve menção pode não ser inapropriada aqui.
Compressão de dados
Isso significa reduzir o número de bits em uma amostra de áudio sem uma redução séria
na qualidade. Graças a um desenvolvimento bastante recente do áudio digital, é possível
recorrer a truques muito inteligentes, mas legítimos, aproveitando as características do
ouvido humano.
Para começar, existem muitos 'sons' que não podemos ouvir: frequências na região
de 30 Hz, a menos que sejam de nível alto, por exemplo. O ouvido normal é cerca de 70
dB menos sensível a 30 Hz do que a cerca de 3 kHz e não é particularmente sensível às
frequências de áudio mais altas acima de cerca de 3 kHz. Além disso, certos sons
podem ser 'mascarados' por outros. Já se sabe há algum tempo que um som em um
determinado nível pode tornar o ouvido bastante insensível às frequências próximas
(geralmente mais altas) em um nível mais baixo.
Fazendo uso de circuitos que, por assim dizer, imitam essas características do
ouvido humano, é possível evitar a gravação dos sons indetectáveis. Existem vários
processos. Uma delas é conhecida como Precision Adaptive Subband Coding (PASC)
ou codificação perceptual, e permite descartar até cerca de 80% dos dados
originais. Outro método, usado pelos MiniDiscs (dos quais mais tarde) é chamado
ATRAC, que significa Adaptive Transform Acoustic Coding. O MP3 também usa
compactação de dados inteligente.
Terminologia adicional
2. DAC: conversor digital-analógico, que traduz um sinal digital de volta para analógico.
Questões
10 Áudio digital
Parte 2
Discos compactos
O componente vital em um CD player é o laser, e sem ele seria impossível fazer CDs ou
reproduzi-los. Então, o que é um laser? É claro que é uma fonte de luz, mas a luz que
emite é particularmente pura, pois consiste em apenas um comprimento de onda. A luz
comum, como se sabe, é composta por uma ampla gama de comprimentos de onda e
isso causa dificuldades quando a luz é focalizada com uma lente. Os vários
comprimentos de onda são tratados de forma ligeiramente diferente e isso pode ser visto
nos efeitos de cor quando se olha através de uma lupa comum. O efeito é
particularmente perceptível perto das bordas da lente. As lentes para câmeras de alta
qualidade são projetadas para reduzir essa aberração cromática,como é chamado, a
níveis aceitáveis. O feixe de um laser, porém, é tão puro que pode ser focalizado com
extrema precisão com uma lente bastante simples.
Ao fazer um CD, o feixe de luz de um laser é modulado – isto é, feito para flutuar
em brilho – com o sinal de áudio digital a ser gravado e então focalizado no disco
mestre em rotação. Um material adequado na superfície do disco é gravado pelo feixe
intenso, produzindo um padrão de pontos correspondente ao sinal digital. Cópias
precisas do mestre podem ser feitas tomando moldes e, finalmente, extrudando o
plástico nos moldes. O processo não é diferente daquele usado para fazer discos de
gramofone tradicionais.
A razão para colocar a grade de difração é produzir feixes adicionais que terminam
nos sensores de luz do lado direito. Estes são usados para direcionar o feixe de laser
sobre a superfície do disco. Uma tendência ao desvio é mostrada por um sinal
aumentado em um dos sensores de ponto lateral e um sistema mecânico retorna o laser
ao alinhamento correto. Como os pontos laterais fazem isso é mostrado na Figura 10.7 .
Para dar uma ideia da finura das faixas de um CD, elas têm cerca de 0,5 μm de
largura (0,5 milionésimo de metro) e os centros das faixas estão separados por 1,6
μm. Em termos mais simples, existem cerca de 600 faixas por milímetro.
Correção de erros
Alguns métodos muito poderosos de detecção e correção de erros são incorporados aos
CD players. Estes são necessários porque é impossível garantir a perfeição na
fabricação de discos em bases comerciais. Basta segurar um CD, especialmente um
produzido há pelo menos alguns anos, em frente a uma lâmpada brilhante para ver
muitos minúsculos pontos de luz. Eles podem ser muito pequenos – talvez apenas um
centésimo de milímetro em alguns casos, mas mesmo isso representaria uma perda
significativa de dados. (Pode ser que a fabricação de CDs tenha melhorado. Tenho a
impressão de que os CDs recentes que comprei mostram menos pontos de luz do que os
comprados há alguns anos. Pode ser, é claro, que eu tenha sorte!)
CDs de limpeza
Existem alguns dispositivos muito atraentes no mercado para a limpeza de CDs. A regra
1, porém, é não sujar o disco em primeiro lugar! Mantenha os dedos sujos – ou mesmo
limpos – fora da superfície (sem esquecer que a superfície importante é a não etiqueta,
ou parte inferior, do disco).
Há poucas evidências que sugiram que a qualidade do som de tocadores muito caros
seja melhor do que de tocadores muito mais baratos. É provável que haja mais recursos
nos caros, mas se eles são importantes depende do comprador. Nos primórdios dos CDs,
a correção de erros pode ter sido melhor nas máquinas caras, mas isso não parece mais
ser verdade. De maior importância é a forma como o sinal analógico extraído é tratado –
a qualidade dos amplificadores, alto-falantes, etc.
NICAM
Isso significa Multiplex de Áudio Companding Quase Instantâneo, a maioria dos quais
tentaremos explicar! A forma de NICAM usada para som estéreo para televisão é fruto
de duas tecnologias separadas. O primeiro, ao qual nos referimos brevemente
anteriormente, é um método de ocultar o sinal de som da televisão (originalmente
mono) com o sinal de imagem, de modo que apenas um caminho de sinal seja
necessário dos estúdios aos transmissores.
Figura 10.8 Um sinal de linha de televisão
No final de cada linha, o receptor deve ser informado exatamente quando voltar para
a esquerda e iniciar uma nova linha – ele precisa de um sinal de sincronização. Isso
assume a forma do pulso de sincronismo de linha no diagrama, e o sinal de som da
televisão em formato digital é encaixado onde está o pulso de sincronismo de linha, daí
o termo som em sincronismo.
Stereo NICAM para televisão é um método muito engenhoso de pegar sinais de som
estéreo em formato digital, aplicando um processo de compressão para ter um número
gerenciável de bits e ajustando o resultado na forma de onda de vídeo como uma nova
forma de som em sincronia. Isso acontece até os transmissores. Lá, o sinal estéreo é
encaixado em uma seção do sinal de televisão transmitido e atinge os receptores
equipados com NICAM dessa forma. Para benefício dos receptores não NICAM, uma
versão mono analógica é produzida nos transmissores e transmitida da maneira normal.
Agora suponha que houve uma grande perda de dados – talvez causada por uma
lacuna do tamanho de um orifício no disco, ou algum idiota desenhando linhas radiais
com uma caneta! Isso é mostrado pelo retângulo pontilhado e os blocos de dados D, H e
M são perdidos. No entanto, após a remontagem, esses blocos perdidos são bem
dispersos e, desde que não haja muita perda, várias verificações de paridade podem
percorrer um longo caminho para 'preencher' os dados ausentes.