Você está na página 1de 11

Sumário

• Sistema de Audição Humana


Fundamentos de Áudio • Física do Som
• Gravação e Reprodução Analógica
• Sim Digital
Sistemas Telemáticos
• Compressão Áudio
Ano Lectivo 2002/2003
– Métodos de compressão simples
LESI
– MPEG
Grupo de Comunicações por Computador

Materias utilizados Audição Humana


• Dr. Ze-Nian Li’s course material at: • Mecanismo deveras complexo!
http://www.cs.sfu.ca/CourseCentral/365/li/
• Através dos ouvidos é realizada a captação
• MPEG Audio: das mais diversas formas de som
http://www.mpeg.org/MPEG/audio.html
• Os nossos ouvidos transformam o som em
sinais que são processados pelo nosso
cérebro
• Vamos fazer uma descrição ligeira do
nosso sistema de audição

A física do Som A física do Som


O ouvido externo
• O nosso sistema
• Audição Humana auditivo converte
• Audição humana
energia sonora em
energia mecânica para
um impulso nevorso que
é transmitido para o
cerébro.
• O ouvido tem três
partes: externa, média e
interna.

1
A física do som
A física do som
Audição Humana
• Audição humana
Ouvido interno
• Serve para transformar a
energia sonora em
vibrações internas do
estrutura óssea da orelha
média
• As vibrações são !
transformadas em ondas
de compressão
!

A física do som " #


• Audição Humana • Quando um som forte numa determinada
O ouvido interno
frequência estimula os pelos da cóclea
• Serve para transformar a
– As frequências próximas não são ouvidas caso
energia da onda de
compressão num fluído sejam menos significativas (de menor
interno do ouvido em amplitude)
implusos do nervo no – Apesar do nosso ouvido captar uma certa
fluído interno que
amplitude de frequências, parte delas não são
podem ser transmitido
ao cérebro processados por causa do processo de masking

Termos e Conceitos básicos A física do som


No âmbito do nosso sistema de audição

• Sensibilidade às frequências • Ondas sonoras


– Mais sensíveis de 1-3 KHz – Uma onda mecânica é uma perturbação que
• Directividade viaja através dum meio transportando energia
dum local para outro.
– De onde nos chega determinado som?
• 0.2-3kHz
• Dissimulação (masking) temporal
– Também acontece no domínio dos tempos

2
A física do som A física do som
• Ondas sonoras • Ondas sonoras
– Uma onda produz áreas de alta e baixa pressão – A amplitude é o máximo deslocamento
– Quando a onda de alta pressão atinge o timpano ele positivo.
move-se para dentro – Quanto maior a amplitude mais alto é som
– Quando a onda de baixa pressão atinge o timpano ele
move-se para fora.
– É medido em decibéis (db)

A física do som A física do som


• Ondas sonoras • Ondas sonoras
– O comprimento de onda (wavelength) é a – A frequência da onda é o número de comprimentos
de onda por ciclo (normalmente um segundo)
distância entre dois pontos adjacentes na onda
– É medida em Hertz (ondas por segundo)
– Quanto maior a frequência maior é o tom

1 wave 2 waves

t
0 secs time 1 sec

2 Hz

Representação do som A física do som


A forma como os humanos se apercebem do som
• Domínio do tempo como forte ou fraco depende não só da frequência
– Representação da variação da amplitude do mas também da amplitude (intensidade).
sinal ao longo do tempo Voz Humana
• Domínio da frequência Limiar da dor
– Representação da amplitude das diferentes
frequências do sinal num determinado Maioria dos humanos
instante (Limiar)
Limiar da audição
(1% dos humanos)

Frequência Fundamental

3
A física do som A física do som
• A gama normal de audição humana é entre 20Hz • A percepção do som inclui três aspectos:
e 20000Hz. – Intensidade (amplitude);
• Aqui estão várias frequências (0 dB) – Tom (frequência); e,
– 60 Hz
– Timbre
– 440 Hz
• Porquê que o violino e o piano a tocar a mesma
– 4000 Hz (-6dB: half power) (+6dB: double power)
nota são tão diferentes?
– 13000Hz
– 20000Hz

A física do som Timbre


• Timbre • Formas de onda complexa são construídas
– Definido vagamente como tom, cor, textura do combinando um certo número de formas de
som que permite ao cérebro distinguir um tom onda mais simples de diferentes amplitudes
de outro e frequências
– Afectado pelas propriedades acústicas do • É por esta razão que conseguimos perceber
instrumento e da sala
tons altos e baixos simultaneamente.

Timbre Timbre
• O som característico duma forma de onda • As diferentes frequências dum som,
(produzido por um piano ou um violino) é combinadas com as suas amplitudes
chamado o seu timbre. variáveis, constituem o conteúdo espectral
• O timbre, também designado como a cor dum da forma de onda.
tom, é considerado rico ou cheio se o som incluir
muitas frequências. • O conteúdo espectral (um termo mais
• Um som duma onda sinusoidal é considerado científico para timbre) varia normalmente
monótono por incluir apenas uma frequência com o tempo.

4
Timbre Gravação e Reprodução Analógica
• Um microfone converte as mudanças de
A variação das características espectrais com pressão no ar em mudanças na tensão
o tempo para uma forma de onda é a eléctrica.
assinatura dum tom que permite a sua
• Produz-se um sinal analógico.
descrição com uma string.
• Se se comparar as mudanças de pressão do
ar e as mudanças de tensão eléctrica são
bastante similares .

Gravação e Reprodução Analógica Gravação e Reprodução Analógica


• Para reproduzir a sua gravação necessita de
• Para gravar um som com um
algo que crie as diferenças de pressão no ar de
microfone, podemos enviá-lo para
forma ao nosso ouvido poder interpretá-lo
uma fita magnética que pode
como um som, isto é um altifalante áudio.
guardar uma réplica do sinal
analógico. • Os altifalantes funcionam movendo um cone
de uma posição para outra de forma
consistente..

Gravação e Reprodução Analógica Gravação e Reprodução Analógica


• Para mover o cone para frente e para trás o • Até recentemente o som era gravado em
altifalante tem que ser alimentado por uma como um sinal analógico numa cassete de
corrente eléctrica fita magnética ou num disco de vinil.
• Durante a reprodução, o gravador ou o gira-
discos geram a corrente que alimenta um
• Um problema com este tipo de gravação é
amplificador a dificuldade de gravar o sinal analógico
• Quando ligada ao altifalante a corrente permite sem adicionar ruído.
reproduzir as mudanças de pressão sentidas pelo
microfone durante a gravação.

5
Gravação e Reprodução Analógica Digitalização do Som
• Quando se copia gravações analógicas tem • Quando se trabalha com audio digital há
que se converter a gravação magnética duas questões que precisam de resposta:
num sinal eléctrico e tornar a gravar o que – Que qualidade é necessária?
adiciona ainda mais ruído. – Que débito de dados pode ser tolerado?
• A edição de som em fita é linear. • Há 3 categoriais de áudio digital :
– Alta fidelidade
– Comunicação telefónica
– Voz compactada

Digitalização do Som Amostragem


• Áudio Digital é baseado em dois aspectos: – O som natural é analógico
– Amostragem (tempo) – O som digital é digital
– Quantificação (nível) – Para conversão de analógico para digital é
necessária a amostragem

Amostragem
Amostragem
– Uma onda analógica pode ser amostrada com
– Uma gravação analógica (ie fita magnética) é baseada um número de bits pré-determinado
no registo da voltagem como padrões de magnetização – Isto é chamado a resolução em bits do sistema
nas partículas óxidas da fita.
– Quanto mais bits maior a clareza.
– Uma gravação digital converte as voltagens em
números binários • 8 bits correspondem a 256 níveis
• 16 bits correspondem a 65,536
níveis, etc..
• Ganham-se 6db por cada bit
• 8 bits 256 níveis = 48 dB, 16 bits 65,536
níveis = 96 dB. Para determinar a gama
dinâmica de um sistema, multiplique a
taxa de bits por 6.

6
Frequência de amostragem Frequência de amostragem
– Quanto maior for a frequência de amostragem
– A o ritmo de obtenção de amostras dum onda
maior é a possibilidade de capturar as altas
analógica é designada por frequência de
frequências.
amostragem
– É o número de amostras obtidas por segundo.
– A frequência de amostragem determina a
largura de banda do sistema.

Frequência de amostragem
Frequência de amostragem
– Uma onda deve ser amostrada duas vezes para se obter
versus armazenamento
uma verdadeira representação (Teoria de Nyquist) • Quando aumenta a frequência de
– A frequência de amostragem deve ser pelos menos o amostragem melhora a qualidade da
dobro da mais alta frequência do sinal
amostra .
– Como a gama de audição humana varia de 20 Hz a 20
kHz, uma frequência de amostragem de 44.1 Khz • Com o aumento da qualidade aumenta a
satisfaz teoricamente as necessidades de audio. quantidade de espaço de armazenamento
necessário.
– Uma velocidade de amostragem de 44.1 kHz com
gravação de 16 bit usa aproximadamente 5Mb por
minuto. (10Mb para stereo). NOTA: norma CD.
• A 22.05 kHz é metade.

Exemplos de amostragem Áudio de alta fidelidade


• O Áudio Digital apareceu com o CD (Compact
Música de 35 Segundos Laser Disc)
– 44.1kHz • A superfície dum CD virgem reflecte (espelhada)
– 22.05kHz • A informação digital é armazenada como buracos
– 16kHz na superfície.
– 8kHz • Os dados são armazenados com uma única pista
– 6Hz em espiral desde o interior para fora. Leitura a
1.2 m/s.
• Dados armazenados a 1 Mbit/mm2
Onda sonora gerada para estes 35 segundos.

7
Métodos Simples de
Áudio de alta fidelidade
Compressão
• Sistemas Audio com mais de um canal chamam- • Compressão de silêncios
se estereofónicos. .
• 4 canais de som em video chama-se Dolby
• Adaptative Diferential Pulse Code
Stereo. Modulation (ADPCM)
• A versão cinema em casa é Dolby Surround Pro – CTTITT G.721 --- 16 or 32 Kbits/sec.
Logic. • Linear Predictive Coding (LPC)
• Os sinais dos canais de ambiente são atrasados
15-20 millisegundos para dar a impressão ao • Code Excited Linear Predictor (CELP)
ouvinte que vêm do ecrâ e não dos altifalantes.

Limiar da Frequência
Modelo Psico-Acústico
• Audição e Voz Humana
• Sensibilidade da Audição humana
– Limiar da Audição
– Dissimulação na Frequência
– Dissimulação no Tempo
Experiência :
Uma pessoa num quarto em silêncio. Aumente a intensidade
dum tom de 1 Khz até ele se tornar audível. Varia a
frequência e vá registando

Dissimulação na Frequência Frequency Masking (Contd.)


• Repeat previous experiment for various frequencies of
masking tones

Experiência:
Coloque um tom a 1 kHz (tom para dissimulação) com uma
amplitude fixa (60 dB). Coloque o tom de teste numa
frequência (1.1 kHz) e aumente a sua intensidade até se
poder distinguir. Varia a frequência do tom de teste e
coloque o valor de limiar de audição.

8
Temporal Masking Efeito total da dissimulação:
• Se ouvirmos um som e o pararmos demora tempo
até podermos ouvir um tom próximo na frequência.
• Enuncie a experiência a realizar

MPEG Audio MPEG Audio


• As duas técnicas avançadas de codificação áudio • Camada 1
são baseadas em – usa codificação de sub-banda
– Codificação de sub-banda (SBC)
– Codificação de Transformada Adaptativa • Camada 2
• A codificação MPEG de Audio – usa codificação de sub-banda com quadros
– Tem três camadas independentes de compressão áudio
maiores e maior nível de compressão
• Cada um tem o seu codificador SBC • Camada 3
• Correspondência entre Tempo e Frequência
• Modelo Psico-Acústico
– Usa tanto codificação de sub-banda como de
• Quatificador transformada

MPEG MPEG
• MPEG-1 Audio • Com compressão 6:1
– Amostragem a 48 KHz de 16 bits stereo reduzidas a 256 Kbits/seg
– Está concebido para tomar um sinal áudio de entrada
• Sob condições ótptimas de audição, ouvintes experimentados não
em PCM e dependendo da camada conseguem distinguir o clip original e codificado
• Amostrá-lo a 32, 44.1 ou 48 kHz
• Suporta um ou dois canais de áudio num dos seguintes
• Codificá-lo de 32 a 192 Kbps por canal áudio
modos
1. Monofónico – um simples canal de áudio
• MPEG-1 2. Monofónico dual – 2 canais independentes por ex. Português e
– débito 1.5 Mbit/seg para áudio e vídeo Inglês
3. Stereo – para 2 canais stereo que partilham bits mas não usam uma
– 1.2 para vídeo e 0.3 para áudio codificação stereo conjunta
• Audio CD não compactado tem 44,100 amostras por 4. Junção stereo- tira partido da correlação entre os dois canais
segundo*16 bits/amostra * 2 canais > 1.4 Mbits/seg
– Factor de Compressão 2,7 a 24

9
Algoritmo de Codificação MPEG Exemplo de Masking e Quantificação

Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
, %
* $ - %
+ $ Nível 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
! " #

$%
& ' #
( )
&

MPEG Coding Specifics Especificidades da codificação MPEG

$% $% $% • Camada 1 do MPEG
! "
– O filtro aplicado é um quadro (12x32 = 384 amostras) de cada vez.
! " A 48 kHz, cada quadro contém 8ms de som.
*
$% – Usa a FFT com 512 pontos para obter uma informação espectral
! "
detalhada do sinal (filtro de sub-banda). Usa uma faixa de
frequência igual em cada banda.
$% $% $% – Modelo psico-acústico usa apenas o masking na frequência.
! " – Aplicações típicas
. ,
$ • Gravação digital em tapes, discos que podem suportar um débito alto.
. ,,/ ,,,
$ – Melhor qualidade conseguida com débito de 384kbps.

Especificidades da codificação MPEG Especificidades da codificação MPEG


• MPEG Layer III
• Camada 2 do MPEG – Usa melhores filtros nas bandas críticas
– Usa 3 quadros no filtro (anterior, actual e seguinte com um total – Não usa sub-bandas iguais Uses non-equal frequency bands
de 1152 amostras). A 48 kHz, cada quadro transporta 24 ms de – O modelo psico-acústico
som. • Inclui efeitos de dissimulação temporal
– Modela um pouco o masking temporal. • Tira partido da redundância steero
– Usa a FTT com 1024-pontos para uma melhor resolução na • Codificador de Huffman
frequência. Usa uma faixa de frequência idêntica em cada banda.
– Maior qualidade conseguida com um débito de 256 k bps.
– Aplicações típicas
• Difusão áudio, TV, Gravação profissional e Multimedia

10
Especificidades da codificação MPEG
MPEG Camada 3
Codificação da Redundância Stereo
– Codificação da intensidade stereo --- nos canais de frequência
superior codificar a soma dos sinais da direita e esquerda em vez
de os considerar de forma independente.
– Codificação Stereo Middle/Side – codificar a soma e a subtração
dos sinais da esquerda e da direita

11

Você também pode gostar