Aula Audio

Sumário
• Sistema de Audição Humana

Fundamentos de Áudio • Física do Som
• Gravação e Reprodução Analógica
• Sim Digital
Sistemas Telemáticos
• Compressão Áudio
Ano Lectivo 2002/2003
– Métodos de compressão simples
LESI
– MPEG
Grupo de Comunicações por Computador
Materias utilizados Audição Humana

• Dr. Ze-Nian Li’s course material at: • Mecanismo deveras complexo!
http://www.cs.sfu.ca/CourseCentral/365/li/
• Através dos ouvidos é realizada a captação
• MPEG Audio: das mais diversas formas de som
http://www.mpeg.org/MPEG/audio.html
• Os nossos ouvidos transformam o som em
sinais que são processados pelo nosso
cérebro
• Vamos fazer uma descrição ligeira do
nosso sistema de audição
A física do Som A física do Som

O ouvido externo
• O nosso sistema
• Audição Humana auditivo converte
• Audição humana
energia sonora em
energia mecânica para
um impulso nevorso que
é transmitido para o
cerébro.
• O ouvido tem três
partes: externa, média e
interna.
1
A física do som
A física do som
Audição Humana
• Audição humana
Ouvido interno
• Serve para transformar a
energia sonora em
vibrações internas do
estrutura óssea da orelha
média
• As vibrações são !
transformadas em ondas
de compressão
!
A física do som " #

• Audição Humana • Quando um som forte numa determinada
O ouvido interno
frequência estimula os pelos da cóclea
• Serve para transformar a
– As frequências próximas não são ouvidas caso
energia da onda de
compressão num fluído sejam menos significativas (de menor
interno do ouvido em amplitude)
implusos do nervo no – Apesar do nosso ouvido captar uma certa
fluído interno que
amplitude de frequências, parte delas não são
podem ser transmitido
ao cérebro processados por causa do processo de masking
Termos e Conceitos básicos A física do som

No âmbito do nosso sistema de audição
• Sensibilidade às frequências • Ondas sonoras

– Mais sensíveis de 1-3 KHz – Uma onda mecânica é uma perturbação que
• Directividade viaja através dum meio transportando energia
dum local para outro.
– De onde nos chega determinado som?
• 0.2-3kHz
• Dissimulação (masking) temporal
– Também acontece no domínio dos tempos
2
A física do som A física do som
• Ondas sonoras • Ondas sonoras
– Uma onda produz áreas de alta e baixa pressão – A amplitude é o máximo deslocamento
– Quando a onda de alta pressão atinge o timpano ele positivo.
move-se para dentro – Quanto maior a amplitude mais alto é som
– Quando a onda de baixa pressão atinge o timpano ele
move-se para fora.
– É medido em decibéis (db)

• Ondas sonoras • Ondas sonoras
– O comprimento de onda (wavelength) é a – A frequência da onda é o número de comprimentos
de onda por ciclo (normalmente um segundo)
distância entre dois pontos adjacentes na onda
– É medida em Hertz (ondas por segundo)
– Quanto maior a frequência maior é o tom
1 wave 2 waves
t
0 secs time 1 sec
2 Hz
Representação do som A física do som

A forma como os humanos se apercebem do som
• Domínio do tempo como forte ou fraco depende não só da frequência
– Representação da variação da amplitude do mas também da amplitude (intensidade).
sinal ao longo do tempo Voz Humana
• Domínio da frequência Limiar da dor
– Representação da amplitude das diferentes
frequências do sinal num determinado Maioria dos humanos
instante (Limiar)
Limiar da audição
(1% dos humanos)
Frequência Fundamental
3
• A gama normal de audição humana é entre 20Hz • A percepção do som inclui três aspectos:
e 20000Hz. – Intensidade (amplitude);
• Aqui estão várias frequências (0 dB) – Tom (frequência); e,
– 60 Hz
– Timbre
– 440 Hz
• Porquê que o violino e o piano a tocar a mesma
– 4000 Hz (-6dB: half power) (+6dB: double power)
nota são tão diferentes?
– 13000Hz
– 20000Hz
A física do som Timbre

• Timbre • Formas de onda complexa são construídas
– Definido vagamente como tom, cor, textura do combinando um certo número de formas de
som que permite ao cérebro distinguir um tom onda mais simples de diferentes amplitudes
de outro e frequências
– Afectado pelas propriedades acústicas do • É por esta razão que conseguimos perceber
instrumento e da sala
tons altos e baixos simultaneamente.
Timbre Timbre
• O som característico duma forma de onda • As diferentes frequências dum som,
(produzido por um piano ou um violino) é combinadas com as suas amplitudes
chamado o seu timbre. variáveis, constituem o conteúdo espectral
• O timbre, também designado como a cor dum da forma de onda.
tom, é considerado rico ou cheio se o som incluir
muitas frequências. • O conteúdo espectral (um termo mais
• Um som duma onda sinusoidal é considerado científico para timbre) varia normalmente
monótono por incluir apenas uma frequência com o tempo.
4
Timbre Gravação e Reprodução Analógica
• Um microfone converte as mudanças de
A variação das características espectrais com pressão no ar em mudanças na tensão
o tempo para uma forma de onda é a eléctrica.
assinatura dum tom que permite a sua
• Produz-se um sinal analógico.
descrição com uma string.
• Se se comparar as mudanças de pressão do
ar e as mudanças de tensão eléctrica são
bastante similares .
Gravação e Reprodução Analógica Gravação e Reprodução Analógica

• Para reproduzir a sua gravação necessita de
• Para gravar um som com um
algo que crie as diferenças de pressão no ar de
microfone, podemos enviá-lo para
forma ao nosso ouvido poder interpretá-lo
uma fita magnética que pode
como um som, isto é um altifalante áudio.
guardar uma réplica do sinal
analógico. • Os altifalantes funcionam movendo um cone
de uma posição para outra de forma
consistente..
Gravação e Reprodução Analógica Gravação e Reprodução Analógica

• Para mover o cone para frente e para trás o • Até recentemente o som era gravado em
altifalante tem que ser alimentado por uma como um sinal analógico numa cassete de
corrente eléctrica fita magnética ou num disco de vinil.
• Durante a reprodução, o gravador ou o gira-
discos geram a corrente que alimenta um
• Um problema com este tipo de gravação é
amplificador a dificuldade de gravar o sinal analógico
• Quando ligada ao altifalante a corrente permite sem adicionar ruído.
reproduzir as mudanças de pressão sentidas pelo
microfone durante a gravação.
5
Gravação e Reprodução Analógica Digitalização do Som
• Quando se copia gravações analógicas tem • Quando se trabalha com audio digital há
que se converter a gravação magnética duas questões que precisam de resposta:
num sinal eléctrico e tornar a gravar o que – Que qualidade é necessária?
adiciona ainda mais ruído. – Que débito de dados pode ser tolerado?
• A edição de som em fita é linear. • Há 3 categoriais de áudio digital :
– Alta fidelidade
– Comunicação telefónica
– Voz compactada
Digitalização do Som Amostragem

• Áudio Digital é baseado em dois aspectos: – O som natural é analógico
– Amostragem (tempo) – O som digital é digital
– Quantificação (nível) – Para conversão de analógico para digital é
necessária a amostragem
Amostragem
Amostragem
– Uma onda analógica pode ser amostrada com
– Uma gravação analógica (ie fita magnética) é baseada um número de bits pré-determinado
no registo da voltagem como padrões de magnetização – Isto é chamado a resolução em bits do sistema
nas partículas óxidas da fita.
– Quanto mais bits maior a clareza.
– Uma gravação digital converte as voltagens em
números binários • 8 bits correspondem a 256 níveis
• 16 bits correspondem a 65,536
níveis, etc..
• Ganham-se 6db por cada bit
• 8 bits 256 níveis = 48 dB, 16 bits 65,536
níveis = 96 dB. Para determinar a gama
dinâmica de um sistema, multiplique a
taxa de bits por 6.
6
Frequência de amostragem Frequência de amostragem
– Quanto maior for a frequência de amostragem
– A o ritmo de obtenção de amostras dum onda
maior é a possibilidade de capturar as altas
analógica é designada por frequência de
frequências.
amostragem
– É o número de amostras obtidas por segundo.
– A frequência de amostragem determina a
largura de banda do sistema.
Frequência de amostragem
Frequência de amostragem
– Uma onda deve ser amostrada duas vezes para se obter
versus armazenamento
uma verdadeira representação (Teoria de Nyquist) • Quando aumenta a frequência de
– A frequência de amostragem deve ser pelos menos o amostragem melhora a qualidade da
dobro da mais alta frequência do sinal
amostra .
– Como a gama de audição humana varia de 20 Hz a 20
kHz, uma frequência de amostragem de 44.1 Khz • Com o aumento da qualidade aumenta a
satisfaz teoricamente as necessidades de audio. quantidade de espaço de armazenamento
necessário.
– Uma velocidade de amostragem de 44.1 kHz com
gravação de 16 bit usa aproximadamente 5Mb por
minuto. (10Mb para stereo). NOTA: norma CD.
• A 22.05 kHz é metade.
Exemplos de amostragem Áudio de alta fidelidade

• O Áudio Digital apareceu com o CD (Compact
Música de 35 Segundos Laser Disc)
– 44.1kHz • A superfície dum CD virgem reflecte (espelhada)
– 22.05kHz • A informação digital é armazenada como buracos
– 16kHz na superfície.
– 8kHz • Os dados são armazenados com uma única pista
– 6Hz em espiral desde o interior para fora. Leitura a
1.2 m/s.
• Dados armazenados a 1 Mbit/mm2
Onda sonora gerada para estes 35 segundos.
7
Métodos Simples de
Áudio de alta fidelidade
Compressão
• Sistemas Audio com mais de um canal chamam- • Compressão de silêncios
se estereofónicos. .
• 4 canais de som em video chama-se Dolby
• Adaptative Diferential Pulse Code
Stereo. Modulation (ADPCM)
• A versão cinema em casa é Dolby Surround Pro – CTTITT G.721 --- 16 or 32 Kbits/sec.
Logic. • Linear Predictive Coding (LPC)
• Os sinais dos canais de ambiente são atrasados
15-20 millisegundos para dar a impressão ao • Code Excited Linear Predictor (CELP)
ouvinte que vêm do ecrâ e não dos altifalantes.
Limiar da Frequência
Modelo Psico-Acústico
• Audição e Voz Humana
• Sensibilidade da Audição humana
– Limiar da Audição
– Dissimulação na Frequência
– Dissimulação no Tempo
Experiência :
Uma pessoa num quarto em silêncio. Aumente a intensidade
dum tom de 1 Khz até ele se tornar audível. Varia a
frequência e vá registando
Dissimulação na Frequência Frequency Masking (Contd.)

• Repeat previous experiment for various frequencies of
masking tones
Experiência:
Coloque um tom a 1 kHz (tom para dissimulação) com uma
amplitude fixa (60 dB). Coloque o tom de teste numa
frequência (1.1 kHz) e aumente a sua intensidade até se
poder distinguir. Varia a frequência do tom de teste e
coloque o valor de limiar de audição.
8
Temporal Masking Efeito total da dissimulação:
• Se ouvirmos um som e o pararmos demora tempo
até podermos ouvir um tom próximo na frequência.
• Enuncie a experiência a realizar
MPEG Audio MPEG Audio

• As duas técnicas avançadas de codificação áudio • Camada 1
são baseadas em – usa codificação de sub-banda
– Codificação de sub-banda (SBC)
– Codificação de Transformada Adaptativa • Camada 2
• A codificação MPEG de Audio – usa codificação de sub-banda com quadros
– Tem três camadas independentes de compressão áudio
maiores e maior nível de compressão
• Cada um tem o seu codificador SBC • Camada 3
• Correspondência entre Tempo e Frequência
• Modelo Psico-Acústico
– Usa tanto codificação de sub-banda como de
• Quatificador transformada
MPEG MPEG
• MPEG-1 Audio • Com compressão 6:1
– Amostragem a 48 KHz de 16 bits stereo reduzidas a 256 Kbits/seg
– Está concebido para tomar um sinal áudio de entrada
• Sob condições ótptimas de audição, ouvintes experimentados não
em PCM e dependendo da camada conseguem distinguir o clip original e codificado
• Amostrá-lo a 32, 44.1 ou 48 kHz
• Suporta um ou dois canais de áudio num dos seguintes
• Codificá-lo de 32 a 192 Kbps por canal áudio
modos
1. Monofónico – um simples canal de áudio
• MPEG-1 2. Monofónico dual – 2 canais independentes por ex. Português e
– débito 1.5 Mbit/seg para áudio e vídeo Inglês
3. Stereo – para 2 canais stereo que partilham bits mas não usam uma
– 1.2 para vídeo e 0.3 para áudio codificação stereo conjunta
• Audio CD não compactado tem 44,100 amostras por 4. Junção stereo- tira partido da correlação entre os dois canais
segundo*16 bits/amostra * 2 canais > 1.4 Mbits/seg
– Factor de Compressão 2,7 a 24
9
Algoritmo de Codificação MPEG Exemplo de Masking e Quantificação
Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
, %
* $ - %
+ $ Nível 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
! " #
$%
& ' #
( )
&
MPEG Coding Specifics Especificidades da codificação MPEG
$% $% $% • Camada 1 do MPEG
! "
– O filtro aplicado é um quadro (12x32 = 384 amostras) de cada vez.
! " A 48 kHz, cada quadro contém 8ms de som.
*
$% – Usa a FFT com 512 pontos para obter uma informação espectral
! "
detalhada do sinal (filtro de sub-banda). Usa uma faixa de
frequência igual em cada banda.
$% $% $% – Modelo psico-acústico usa apenas o masking na frequência.
! " – Aplicações típicas
. ,
$ • Gravação digital em tapes, discos que podem suportar um débito alto.
. ,,/ ,,,
$ – Melhor qualidade conseguida com débito de 384kbps.
Especificidades da codificação MPEG Especificidades da codificação MPEG

• MPEG Layer III
• Camada 2 do MPEG – Usa melhores filtros nas bandas críticas
– Usa 3 quadros no filtro (anterior, actual e seguinte com um total – Não usa sub-bandas iguais Uses non-equal frequency bands
de 1152 amostras). A 48 kHz, cada quadro transporta 24 ms de – O modelo psico-acústico
som. • Inclui efeitos de dissimulação temporal
– Modela um pouco o masking temporal. • Tira partido da redundância steero
– Usa a FTT com 1024-pontos para uma melhor resolução na • Codificador de Huffman
frequência. Usa uma faixa de frequência idêntica em cada banda.
– Maior qualidade conseguida com um débito de 256 k bps.
– Aplicações típicas
• Difusão áudio, TV, Gravação profissional e Multimedia
10
Especificidades da codificação MPEG
MPEG Camada 3
Codificação da Redundância Stereo
– Codificação da intensidade stereo --- nos canais de frequência
superior codificar a soma dos sinais da direita e esquerda em vez
de os considerar de forma independente.
– Codificação Stereo Middle/Side – codificar a soma e a subtração
dos sinais da esquerda e da direita
11

Aula Audio

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula Audio

Enviado por

Direitos autorais:

Formatos disponíveis

Sumário

• Sistema de Audição Humana

Materias utilizados Audição Humana

A física do Som A física do Som

A física do som " #

Termos e Conceitos básicos A física do som

• Sensibilidade às frequências • Ondas sonoras

A física do som A física do som

Representação do som A física do som

A física do som Timbre

Gravação e Reprodução Analógica Gravação e Reprodução Analógica

Gravação e Reprodução Analógica Gravação e Reprodução Analógica

Digitalização do Som Amostragem

Exemplos de amostragem Áudio de alta fidelidade

Dissimulação na Frequência Frequency Masking (Contd.)

MPEG Audio MPEG Audio

MPEG Coding Specifics Especificidades da codificação MPEG

Especificidades da codificação MPEG Especificidades da codificação MPEG

Você também pode gostar