Você está na página 1de 10

DO ÁUDIO ANALÓGICO AO DIGITAL E A SUA PROBLEMÁTICA

Joaquim J.P. Seixo

1 IPG ESTG Qt do Zambito, 6300 Guarda Portugal

Sumário

Neste documento apresentam-se alguns conceitos e notícias do âmbito do tratamento do som, sua captura, armazenamento, reprodução e sintetização, com vista à inserção deste artigo como trabalho sobre a matiz multimédia, alguns conceitos sobre outros elementos da matriz podem ser explicitados a fim de providenciar uma melhor compreensão.

0. Introdução

A perspectiva de estudo do som e do sistema auditivo está na génese deste artigo, mesmo que

a sua reduzida dimensão para abarcar todos os assuntos que lhe dizem respeito. É portanto

partido dessa base que podemos compreender como o som pode ser guardado, criado ou reproduzido, pelos modernos sistemas informáticos e as optimizações que tem vindo a sofrer.

1. Os Sons e o ouvido humano

O Som é produzido por vibração de um material, essa vibração é conduzida pelo ar até ao

ouvido humano que a detecta e interpreta. Podemos afirmar que segundo a ciência que estuda

os sons a Acústica, o som é o resultado de uma perturbação mecânica do meio elástico, que ao deslocar-se provoca uma sensação.

1.1 O Som como movimento periódico.

O som como fenómeno físico é um exemplo de um movimento ondulatório que apresenta

praticamente todas as propriedades deste tipo de movimento: refracção, difracção, interferência e relações entre frequência, comprimento de onda ? , e velocidade de propagação ? . que varia de condutor para condutor, no ar as ondas sonoras propagam-se à velocidade de 340 m/s.

Para analogia apresenta-se o efeito da queda de um objecto numa superfície de água em repouso, Fig.1, em que a elevação corresponde a uma zona de pressão e a depressão a uma zona neutra, à quantidade de zonas de pressão geradas por segundo chama-se frequência ?

Fig. 1 – Exemplo de uma onda. 1.2 Características de um som As principais características

Fig. 1 – Exemplo de uma onda.

1.2 Características de um som

As principais características de um som são: altura (Grave ou agudo) e a frequência, amplitude, (forte ou fraco) . Com estas características é possível descrever completamente um som, no entanto existem propriedades que podem interferir com a qualidade de um som nomeadamente: o timbre que se baseia na existência de harmónicos (sons com frequências múltiplas do portadora base), a ressonância que é uma característica do material que produz o som (capacidade de aumentar a amplitude de uma vibração sem necessitar de um grande aumento de energia), a reflexão e reverberação são também propriedades dos materiais que produzem o som ou são obstáculos à sua propagação. Na Fig. 2 apresentam-se gráficos exemplificativos das características do som.

Na Fig. 2 apresentam-se gráficos exemplificativos das características do som. Fig. 2 – Características dos sons
Na Fig. 2 apresentam-se gráficos exemplificativos das características do som. Fig. 2 – Características dos sons
Na Fig. 2 apresentam-se gráficos exemplificativos das características do som. Fig. 2 – Características dos sons

Fig. 2 – Características dos sons

1.3

Características do Ouvido Humano

O ouvido não é mais que um transdutor (Um conversor de um tipo de energia as ondas

sonoras para sinais eléctricos inteligíveis para o cérebro), adiante veremos como esta analogia

se aplica aos métodos de recepção e armazenamento dos sons.

A gama de frequências que o nosso ouvido pode detectar vai de 20 Hz a 20 kHz para um

ouvido normal sendo possível a audição de frequências fora do espectro mencionado, a nossa voz compreende frequências no intervalo de 200 Hz a 8,5 kHz, esta informação vai ser determinante nos processos de armazenamento e transporte de voz. Na fig. 3 podemos

observar as gamas de frequências produzidas pela voz e a sua depedência das características

do gerador. Fig. 3 – Gama de emissão da voz humana 1.4 Armazenamento do Som
do
gerador.
Fig. 3 – Gama de emissão da voz humana
1.4
Armazenamento do Som

O som pode ser guardado em dois formatos fundamentais: Digital e Analógico.

No formato digital o som é representado por sequências de 0 e 1 organizados de uma forma

predeterminada a fim de poder ser reproduzida e interpretada, daí que existem vários sistemas

de

armazenamento do som. No formato analógico os som são guardados por níveis diferentes

de

intensidade da gravação do material de suporte a mantém a analogia apresentada na fig. 1,

normalmente bandas magnéticas ou discos de vinil.

2.

Som Digital

Sintetizado

Capturado

Quando se fala de som digital não estamos a referirmo-nos só ao suporte de armazenamento mas também á sua reprodução e sintetização.

2.1 O Som na Matriz MM

Na génese do som está sempre a sua forma analógica de produção e transmissão em meio acústico de forma continua, portanto a captura de um som tem sempre de ser na forma analógica, portanto a sua transferência para o formato digital e o inverso é efectuada por conversores A/D e D/A (Analógico/Digital).

Podemos assim afirmar que o áudio é uma forma capturada de continuamente fig 4.

Forma

Contínua

Discreta

Modo

Áudio
Áudio

Fig. 4 – Matriz Multimédia para os sons naturais

Numa perspectiva mais avançada podemos incluir nesta matriz a possibilidade de sintetização de forma contínua de um som, e o seu reconhecimento por equipamento adequado.

Existem vários tipos de formatos de ficheiros de som, são os mais comuns o ficheiros MIDI (Musical Instrument Digital Interface) e os ficheiros WAV (do Inglês Onda).

2.1.1 MIDI

São ficheiros constituídos por declarações matemáticas capazes de serem convertidas em sons ou agrupamentos de sons, que quando enviados para um sintetizador produz sons audíveis semelhantes aos produzidos por acções mecânicas na natureza. Nestes ficheiros estão representadas matematicamente todas as características acima descritas para o som.

Por ex. A linha seguinte pode corresponder

Som(? (475),? (5),? (2,2),?(2)) Instrumento.

Naturalmente este ficheiro terá como grande vantagem a sua dimensão extremamente reduzida chegando ficheiros de musicas bastante elaboradas, e para 6 minutos de reprodução ao tamanho de 50 Kbytes. A grande desvantagem prende-se com a incapacidade de reprodução de voz.

e

o

que

pode

significar

Nota,

Altura,

Tempo

2.1.2 WAV

São por natureza o suporte dos sons, neste tipo de ficheiros os sons são armazenados em sequências de 0’s e 1’s que representam instantes de amostragem de um som, ou seja para a construção destes ficheiros exige-se a conversão de analógico para digital, através de um conversor A/D, que processa as operações de amostragem, cálculo da frequência de amostragem, e integração num processo descrito na fig. 5.

Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Amplitude
Tempo
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10 t11 t12 t13
Amplitude
5 4 3 2 1 Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9
5
4
3
2
1
Tempo
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10 t11 t12 t13
Amplitude

Fig. 5 – Conversão A/D

Existem regras para a determinação dos intervalos de tempo ti em que devem ser colhidas as amostras, assim uma onda é representada por colunas que correspondem ao valor da

amplitude da onda nesse preciso instante, t1 tem valor 2, t2 tem valor 4 assim como t3,

representação exige uma amostragem mínima para que na reprodução se tenha um som bastante aproximado do original. Na fig. podemos verificar que a onda obtida na reprodução não é igual à inicial, mas estas aproximar-se-ão se fizermos aumentar a frequência da amostragem. Fig. 6

esta

5 4 3 2 1 Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9
5
4
3
2
1
Tempo
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10 t11 t12 t13
Amplitude

Fig. 6 – Conversão D/A

Nas fig.

suas unidades de conversão. Fica-nos assim a ideia de que uma qualidade CD standard tem uma codificação de 16 Bits para uma frequência de 33 Khz e 24 bits para a frequência de 44.1 kHz.

podemos observar as características o que o fabricante Motorola está a incluir nas

2.1.2.1 Especificações do Fabricante Motorola Fig. 7 e fig. 8

TLV320AD543, 3 V SINGLE CHANNEL CODEC W/HYBRID OP AMPS & SPEAKER DRIVER

Parameter Name

TLV320AD54 3

Resolution (Bits)

16

Sampling Rate (kHz)

11.025

Bandwidth (kHz)

up to 4.96

Conversion Method

sigma-delta

Number of Channels

1

Pd (typ) (mW)

90

WL1101, VOICE-BAND AUDIO PROCESSOR

Parameter Name

TLC320AD90

Resolution (Bits)

20

SNR (typ) (dB)

90

Architecture

AC97 Codec

Supply Voltage(s) (V)

3.3, 5

Bandwidth (Hz)

20 - 20K

Pd (typ) (mW)

235

Sampling Rate (max) (kHz)

48

Fig. 7 – Características de conversores

DIGITALIZAÇÃO FREQUÊNCIA/PALAVRA

48 Fig. 7 – Características de conversores DIGITALIZAÇÃO FREQUÊNCIA/PALAVRA Fig. 8 – Processos e Frequências

Fig. 8 – Processos e Frequências

2.1.3

Outros processos

Foram experimentados e existem ainda outros processos de codificação permitindo uma redução de tamanhos dos ficheiros sem que se possa falar de compressão, é de salientar que a segurança e a portabilidade são bastante importantes quando se transmite um ficheiro deste tipo, no entanto não tem grande significado se o ficheiro se mantiver sempre no mesmo suporte físico

Podemos imaginar que uma onda só tem duas possibilidades de variação ou aumenta de amplitude ou diminui, se dividirmos o tempo em pequenas porções e em cada ponto comparando com o anterior verificarmos que a amplitude aumenta escrevemos um 1 se diminuir escrevemos um 0 conforme fig.9 . Este processo obrigaria a um reduzido número de falhas a à marcação de um tempo e valor inicial, situação facilmente resolvida no processo anterior onde existe um comprimento definido para cada registo 8,16, ou 20 bits.

Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Amplitude
Tempo
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10 t11 t12 t13
Amplitude

Registo (0,1) (1,2) (2,3) (3,4) (4,5)

1

1

0

0

0

1

Fig. 9 – Outro Processo de digitalização

3. Compressão

Compressão é a redução do tamanho de dados com a finalidade de poupar espaço e aumentar a possibilidade de transmissão desses dados numa rede de computadores, reduzindo o tempo de transmissão. A Compressão pode começar na remoção de espaço desnecessário, no seccionamento de zonas escuras (gamas de frequência inaudíveis) ou ainda pela truncagem de valores extremamente grandes de amplitude cujo valor poderia exceder a capacidade em bits do registo. A supressão de som pode também contribuir com uma boa quota percentual na compressão do som, se por uma fracção de tempo não houver emissão esse tempo não necessita de ser guardado ou transmitido mas sim e só a sua existência temporal.

Até este ponto não foi evidenciada a diferença entre ficheiros exclusivamente de voz ou de música, no entanto é na área da compressão que a diferença entre eles é mais notória.

Como anteriormente foi referido a emissão de voz está confinada à largura de banda de 200 Hz a 8,5 kHz., enquanto que os instrumentos musicais podem produzir sons em toda a gama audível, é também na compressão da voz que a supressão de som se torna mais importante, devido à falta de continuidade da voz.

O surgimento de novos métodos de compressão em que amostragem se mantém mas em vez de

termos 16 bits podemos reduzir o comprimento do registo a 4 bits, pois vamos apenas guardar

a diferença positiva ou negativa de uma amostra para outra conforme se prentende exemplificar na fig. 10.

Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Amplitude
Tempo
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10 t11 t12 t13
Amplitude

Fig. 10 – Outro Processo de digitalização

4. Conclusão

Não foi intenção de fazer deste documento um tratado sobre áudio, mas sim criar as condições para o início de um trabalho mais profundo encaminhado, através do estudo de uma ferramenta especifica de tratamento de som, e abrir caminho à compreensão dos procedimentos envolvidos, no tratamento do som e seu enquadramento numa montagem multimédia.

Referências

http://www-dse.doc.ic.ac.uk/ 23/12/1999 http://www.siemens-hearing.com/ 23/12/1999 http://www.phd.msu.edu/hearing/ 23/12/1999 http://www.digido.com/ 23/12/1999 http://dakx.com/ 23/12/1999 http://www.real.com/player/ 23/12/1999