Você está na página 1de 5

AUDIO DIGITAL

CAP 4 - SUBUNIDADE 3

As ondas sonoras propagam-se de modo contínuo no tempo e no espaço. Para que sejam
representadas digitalmente, o seu comportamento analógico (contínuo) tem que ser
convertido numa série de valores discretos (descontínuos).

Informação digital

Na gravação digital, converte-se uma onda analógica numa sequência de números e


gravam-se estes números em vez da onda. Esta conversão é feita por um dispositivo
chamado conversor analógico-digital (ADC). Para reproduzir o som digital, a sequência de
números é convertida novamente para a onda analógica por um conversor digital-
analógico (DAC).
A onda analógica criada pelo conversor será sempre igual, desde que os números não
estejam corrompidos. Ela também será muito semelhante à onda analógica original se a
conversão for feita de maneira adequada.
Vamos supor que temos uma onda sonora e queremos gravá-la utilizando um conversor.
Consideremos o exemplo de onda (cada traço no eixo horizontal representa um milésimo
de segundo) seguinte:

Ao converter a onda, consideram-se duas variáveis:


• A taxa de amostragem (sampling rate ou sampling frequency) – define o número de
amostras (samples) por segundo.
• A quantização (sampling resolution) - controla a quantidade de gradações diferentes
(níveis de quantização) de um som, medida normalmente em bits.

Na figura a seguir, vamos supor que a taxa de amostragem é de mil samples por segundo e
a quantizaçao é 10.

4.3 SISTEMAS MULTIMEDIA - AUDIO 1


Os rectângulos verdes representam o som. A cada milésimo de segundo, o conversor
analisa a onda e escolhe o número mais próximo entre 0 e 9 (abaixo do eixo das abcissas).

Estes números são a representação digital da onda original. Quando o conversor digital-
analógico recria a onda a partir destes números, temos uma nova onda, na figura seguinte
representada pela linha azul.

Percebe-se que a linha azul perdeu alguns detalhes em relação à linha vermelha original,
significando que a fidelidade da onda reproduzida foi alterada. Chama-se a isto, erro de
conversão ou erro digital. O erro digital pode ser reduzido aumentando a taxa de
amostragem e a quantização.

Na figura seguinte, tanto a taxa de amostragem como a quantização foram multiplicados


por 2 (20 gradações com uma taxa de 2 mil amostras por segundo).

Aumentando a taxa de amostragem e a quantização, a fidelidade (semelhança entre a onda


original e a informação gerada pelo conversor digital-analógico) aumenta.

No caso do CD, a fidelidade é um factor importante, por isso, a taxa de amostragem é de


44.100 Hz (samples por segundo) e o número de gradações é de 65.536 (16 bit). Com estas
taxas, a informação gerada pelo conversor é tão parecida com a onda original que o som se
torna "perfeito" para a maioria dos ouvidos humanos.

4.3 SISTEMAS MULTIMEDIA - AUDIO 2


Teorema da Amostragem (Nyquist-Shannon)

O teorema de Nyquist–Shannon afirma que a reconstrução perfeita de um sinal é possível


quando a frequência de amostragem for maior ou igual ao dobro da maior frequência que
compõe a onda.

Qualidade (resolução)

Refere-se ao número de bits usados para representar cada amostra. Uma amostra
representada por apenas um bit poderia receber apenas dois valores: "0" ou "1".
Uma representação com 3 bits poderia receber 8 valores diferentes (23 = 8).

Um CD tem uma resolução de 16 bits o que permite uma resolução binária com 65.534 (216)
valores.

Erro de quantização

Quando é feita a amostragem de um sinal, o valor medido é aproximado (quantizado) para


o valor mais próximo na escala de amplitude gerando pequenos desvios em relação ao
valor do sinal original. Esses desvios, chamados erros de quantização modificam o sinal
original introduzindo ruído nas frequências mais altas. Pode minimizar-se o erro de
quantização com o aumento da resolução.

Alguns sistemas introduzem um processo chamado dithering que é a adição de ruído


aleatório ao sinal para distribuir os erros e minimizar os efeitos auditivos causados por eles.

Tamanho dos Ficheiros

Resoluções e taxas de amostragem maiores implicam ficheiros maiores que precisam de


mais espaço para serem armazenados, mais tempo para serem transmitidos e mais poder
de processamento para que sejam processados. Para se calcular o tamanho em bytes de um
ficheiro pode-se usar a seguinte fórmula:

ܴ
‫݊ܽ݉ܽݐ‬ℎ‫× ܽܶ = ݋‬ ×‫ݐ×ܥ‬
8
Onde:
Ta = taxa de amostragem em Hz
R = resolução em bits (queremos o valor em bytes e cada byte tem 8 bits, é preciso dividir por 8)
C = número de canais de áudio
t = tempo em segundos

Compressão de áudio

A Compressão de áudio ou compressão sonora é o método utilizado para diminuir as


exigências intrínsecas à transmissão (largura de banda) ou armazenamento (espaço físico)
do som.

Até o surgimento da compressão de áudio, a informação (dados) digital de áudio de alta


qualidade consumia uma absurda quantidade de espaço em disco.

4.3 SISTEMAS MULTIMEDIA - AUDIO 3


Exemplo

Copiar uma música para o computador. Como se quer que a qualidade seja como a de um
CD, deverá guardar num formato a 44.1 kHz, estéreo (2 canais), com 16 bits por amostra.
44.100 Hz quer dizer que terá 44.100 valores (amostras) por segundo a sair da placa de som
(ou do dispositivo de entrada). Multiplicar por 2 já que queremos estéreo (2 canais).
Multiplicar novamente por 2 (bytes) já que terá 2 bytes por amostra (que significa 16 bits).
Então, a música terá:
44.100 amostras X 2 canais X 2 bytes X 60 s
A cada minuto equivale a aproximadamente a cerca de 10 MBytes de espaço usado no disco
rígido.

Taxas de Amostragem comuns

Taxa de
amostragem Estéreo Bytes por
Resolução Observações
(Sampling ou Mono minuto
Rate)

Qualidade de gravação de CD, o


44.1 kHz 16-bit Estéreo 10.5 MB
reconhecido padrão para áudio

Boa qualidade para gravações do tipo


44.1 kHz 16-bit Mono 5.25 MB
mono como voz

Apropriada para gravações de uma fonte


44.1 kHz 8-bit Mono 2.6 MB
mono

Não possui a qualidade do CD, têm dois


22.05 kHz 16-bit Estéreo 5.25MB fatores importantes: estéreo e a
resolução de 16-bit

É uma boa escolha para discursos, porém


22.05 kHz 16-bit Mono 2.5 MB pode se baixar para 8-bit e economizar
espaço em disco

É a escolha popular para gravações em


22.05 kHz 8-bit Estéreo 2.6MB estéreo quando não é possível toda a
largura de banda no playback

Muito usado porque qualquer MPC pode


22.05 kHz 8-bit Mono 1.3 MB tocar, a qualidade é tão boa como a da
televisão

Como o sampling rate é muito baixo não


11 kHz 8-bit Estéreo 1.3 MB
existe vantagem em ser estéreo

Na prática ainda se consegue alguns


11 kHz 8-bit Mono 650 K
resultados razoáveis

5.5 kHz 8-bit Estéreo 650 K O estéreo não tem sentido

Tão bom como uma péssima conexão


5.5 kHz 8-bit Mono 325 K
telefónica

4.3 SISTEMAS MULTIMEDIA - AUDIO 4


Links

http://telecom.inescn.pt/research/audio/cienciaviva/processamento_som.htm

http://informatica.hsw.uol.com.br/gravacoes-audio4.htm

Software

http://lmms.sourceforge.net/home.php

http://qtractor.sourceforge.net/qtractor-index.html

4.3 SISTEMAS MULTIMEDIA - AUDIO 5

Você também pode gostar