Escolar Documentos
Profissional Documentos
Cultura Documentos
1
A física do som
A física do som
Audição Humana
• Audição humana
Ouvido interno
• Serve para transformar a
energia sonora em
vibrações internas do
estrutura óssea da orelha
média
• As vibrações são !
transformadas em ondas
de compressão
!
2
A física do som A física do som
• Ondas sonoras • Ondas sonoras
– Uma onda produz áreas de alta e baixa pressão – A amplitude é o máximo deslocamento
– Quando a onda de alta pressão atinge o timpano ele positivo.
move-se para dentro – Quanto maior a amplitude mais alto é som
– Quando a onda de baixa pressão atinge o timpano ele
move-se para fora.
– É medido em decibéis (db)
1 wave 2 waves
t
0 secs time 1 sec
2 Hz
Frequência Fundamental
3
A física do som A física do som
• A gama normal de audição humana é entre 20Hz • A percepção do som inclui três aspectos:
e 20000Hz. – Intensidade (amplitude);
• Aqui estão várias frequências (0 dB) – Tom (frequência); e,
– 60 Hz
– Timbre
– 440 Hz
• Porquê que o violino e o piano a tocar a mesma
– 4000 Hz (-6dB: half power) (+6dB: double power)
nota são tão diferentes?
– 13000Hz
– 20000Hz
Timbre Timbre
• O som característico duma forma de onda • As diferentes frequências dum som,
(produzido por um piano ou um violino) é combinadas com as suas amplitudes
chamado o seu timbre. variáveis, constituem o conteúdo espectral
• O timbre, também designado como a cor dum da forma de onda.
tom, é considerado rico ou cheio se o som incluir
muitas frequências. • O conteúdo espectral (um termo mais
• Um som duma onda sinusoidal é considerado científico para timbre) varia normalmente
monótono por incluir apenas uma frequência com o tempo.
4
Timbre Gravação e Reprodução Analógica
• Um microfone converte as mudanças de
A variação das características espectrais com pressão no ar em mudanças na tensão
o tempo para uma forma de onda é a eléctrica.
assinatura dum tom que permite a sua
• Produz-se um sinal analógico.
descrição com uma string.
• Se se comparar as mudanças de pressão do
ar e as mudanças de tensão eléctrica são
bastante similares .
5
Gravação e Reprodução Analógica Digitalização do Som
• Quando se copia gravações analógicas tem • Quando se trabalha com audio digital há
que se converter a gravação magnética duas questões que precisam de resposta:
num sinal eléctrico e tornar a gravar o que – Que qualidade é necessária?
adiciona ainda mais ruído. – Que débito de dados pode ser tolerado?
• A edição de som em fita é linear. • Há 3 categoriais de áudio digital :
– Alta fidelidade
– Comunicação telefónica
– Voz compactada
Amostragem
Amostragem
– Uma onda analógica pode ser amostrada com
– Uma gravação analógica (ie fita magnética) é baseada um número de bits pré-determinado
no registo da voltagem como padrões de magnetização – Isto é chamado a resolução em bits do sistema
nas partículas óxidas da fita.
– Quanto mais bits maior a clareza.
– Uma gravação digital converte as voltagens em
números binários • 8 bits correspondem a 256 níveis
• 16 bits correspondem a 65,536
níveis, etc..
• Ganham-se 6db por cada bit
• 8 bits 256 níveis = 48 dB, 16 bits 65,536
níveis = 96 dB. Para determinar a gama
dinâmica de um sistema, multiplique a
taxa de bits por 6.
6
Frequência de amostragem Frequência de amostragem
– Quanto maior for a frequência de amostragem
– A o ritmo de obtenção de amostras dum onda
maior é a possibilidade de capturar as altas
analógica é designada por frequência de
frequências.
amostragem
– É o número de amostras obtidas por segundo.
– A frequência de amostragem determina a
largura de banda do sistema.
Frequência de amostragem
Frequência de amostragem
– Uma onda deve ser amostrada duas vezes para se obter
versus armazenamento
uma verdadeira representação (Teoria de Nyquist) • Quando aumenta a frequência de
– A frequência de amostragem deve ser pelos menos o amostragem melhora a qualidade da
dobro da mais alta frequência do sinal
amostra .
– Como a gama de audição humana varia de 20 Hz a 20
kHz, uma frequência de amostragem de 44.1 Khz • Com o aumento da qualidade aumenta a
satisfaz teoricamente as necessidades de audio. quantidade de espaço de armazenamento
necessário.
– Uma velocidade de amostragem de 44.1 kHz com
gravação de 16 bit usa aproximadamente 5Mb por
minuto. (10Mb para stereo). NOTA: norma CD.
• A 22.05 kHz é metade.
7
Métodos Simples de
Áudio de alta fidelidade
Compressão
• Sistemas Audio com mais de um canal chamam- • Compressão de silêncios
se estereofónicos. .
• 4 canais de som em video chama-se Dolby
• Adaptative Diferential Pulse Code
Stereo. Modulation (ADPCM)
• A versão cinema em casa é Dolby Surround Pro – CTTITT G.721 --- 16 or 32 Kbits/sec.
Logic. • Linear Predictive Coding (LPC)
• Os sinais dos canais de ambiente são atrasados
15-20 millisegundos para dar a impressão ao • Code Excited Linear Predictor (CELP)
ouvinte que vêm do ecrâ e não dos altifalantes.
Limiar da Frequência
Modelo Psico-Acústico
• Audição e Voz Humana
• Sensibilidade da Audição humana
– Limiar da Audição
– Dissimulação na Frequência
– Dissimulação no Tempo
Experiência :
Uma pessoa num quarto em silêncio. Aumente a intensidade
dum tom de 1 Khz até ele se tornar audível. Varia a
frequência e vá registando
Experiência:
Coloque um tom a 1 kHz (tom para dissimulação) com uma
amplitude fixa (60 dB). Coloque o tom de teste numa
frequência (1.1 kHz) e aumente a sua intensidade até se
poder distinguir. Varia a frequência do tom de teste e
coloque o valor de limiar de audição.
8
Temporal Masking Efeito total da dissimulação:
• Se ouvirmos um som e o pararmos demora tempo
até podermos ouvir um tom próximo na frequência.
• Enuncie a experiência a realizar
MPEG MPEG
• MPEG-1 Audio • Com compressão 6:1
– Amostragem a 48 KHz de 16 bits stereo reduzidas a 256 Kbits/seg
– Está concebido para tomar um sinal áudio de entrada
• Sob condições ótptimas de audição, ouvintes experimentados não
em PCM e dependendo da camada conseguem distinguir o clip original e codificado
• Amostrá-lo a 32, 44.1 ou 48 kHz
• Suporta um ou dois canais de áudio num dos seguintes
• Codificá-lo de 32 a 192 Kbps por canal áudio
modos
1. Monofónico – um simples canal de áudio
• MPEG-1 2. Monofónico dual – 2 canais independentes por ex. Português e
– débito 1.5 Mbit/seg para áudio e vídeo Inglês
3. Stereo – para 2 canais stereo que partilham bits mas não usam uma
– 1.2 para vídeo e 0.3 para áudio codificação stereo conjunta
• Audio CD não compactado tem 44,100 amostras por 4. Junção stereo- tira partido da correlação entre os dois canais
segundo*16 bits/amostra * 2 canais > 1.4 Mbits/seg
– Factor de Compressão 2,7 a 24
9
Algoritmo de Codificação MPEG Exemplo de Masking e Quantificação
Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
, %
* $ - %
+ $ Nível 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
! " #
$%
& ' #
( )
&
$% $% $% • Camada 1 do MPEG
! "
– O filtro aplicado é um quadro (12x32 = 384 amostras) de cada vez.
! " A 48 kHz, cada quadro contém 8ms de som.
*
$% – Usa a FFT com 512 pontos para obter uma informação espectral
! "
detalhada do sinal (filtro de sub-banda). Usa uma faixa de
frequência igual em cada banda.
$% $% $% – Modelo psico-acústico usa apenas o masking na frequência.
! " – Aplicações típicas
. ,
$ • Gravação digital em tapes, discos que podem suportar um débito alto.
. ,,/ ,,,
$ – Melhor qualidade conseguida com débito de 384kbps.
10
Especificidades da codificação MPEG
MPEG Camada 3
Codificação da Redundância Stereo
– Codificação da intensidade stereo --- nos canais de frequência
superior codificar a soma dos sinais da direita e esquerda em vez
de os considerar de forma independente.
– Codificação Stereo Middle/Side – codificar a soma e a subtração
dos sinais da esquerda e da direita
11