Você está na página 1de 26

1

F 105
Fsica da Fala e da
Audio
Prof. Dr. Marcelo Knobel Prof. Dr. Marcelo Knobel
Instituto de Fsica Gleb Wataghin (IFGW)
Universidade Estadual de Campinas (UNICAMP)
knobel@ifi.unicamp.br
http://www.ifi.unicamp.br/~knobel/f105/
Anlise
Espectrogrfica das
Vogais
2
Resumo
Como o modelo fonte-filtro explica o
espectro dos sons vogais.
Como um modelo simples de dois
tubos explica a resposta do trato
vocal.
Como vogais e outros sons simples
aparecem no espectrograma.
Sinais e Sistemas
Descrevendo Sinais
l Forma de onda, espectro, freqncia
fundamental, harmnico, amplitude,
fase
Descrevendo Sistemas
l Ressonncia, freqncia natural,
largura de banda, resposta
3
O trato vocal d forma ao espectro
que gerado na laringe.
O espectro de sada tem
caractersticas tanto da fonte quanto
do filtro.
Modelo Fonte-Filtro
F F F
A
A
R
x =
Percepo de vogais
Altura das vogais depende da freqncia
de repetio (=freqncia fundamental).
Essa uma propriedade da fonte.
F
A
Mesmo
envelope
espectral
F
A
A: pitch baixo A: pitch alto
4
Percepo de vogais
Para explicar como o ouvido
reconhece um som como uma
mesma vogal, mesmo se
falada com alturas diferentes,
a idia dos formantes deve
ser invocada. Os dados
mostrados so de Benade
mostrando uma vogal "A" que
apresenta um envelope
similar, mesmo em diferentes
alturas.
Mesma Vogal, pitch diferente
Ver Formas de onda em:
http://hyperphysics.phy-astr.gsu.edu/hbase/music/vwav1.html#c1
Percepo de vogais
O timbre das vogais depende da amplitude
relativa dos harmnicos.
Essas amplitudes so fortemente afetadas
pelo filtro: em particular, suas freqncias
ressonantes.
A
F
A
F
A: vogal i: vogal
Harmnicos
tmo mesmo
espaamento
5
Percepo de vogais
Resumo
l O espectro da fonte o mesmo para todas
as vogais com uma dada freqncia
fundamental.
l o filtro que produz mudanas no timbre,
ou qualidade vogal.
l O filtro que d forma s vogais pode ser
caracterizado por freqncias ressonantes,
ou formantes formantes do trato vocal.
Percepo de vogais
http://hyperphysics .phy-astr.gsu.edu/hbase/sound/vowel.html#c3
6
Plano F
1
-F
2
para vogais
F
1
F
2
i:
e
F
1
=F
2
A:
O:
u:
3:
{
http://www.haskins .yale.edu/haskins/HEADS/ASY/VOWELS/vowels .html
Plano F
1
-F
2
para vogais
Resumo
l A maior parte da qualidade distinguvel
das vogais pode ser atribuda a
variaes relativas das duas primeiras
freqncias formantes.
l F
1
parece estar relacionada com o
aumento gradual da abertura (open-
ness).
l F
2
parece estar relacionada com o
aumento gradual da front-ness
7
Modelos acsticos de tubos
Tubo simples (17.6cm)
F
R
/3:/ qualidade vogal
Estreito atrs, largo na frente F
R
/A:/ qualidade vogal
Largo atrs, estreito na frente F
R
/i:/ qualidade vogal
Modelos acsticos de tubos
Resumo
l Mesmo modelos estremamente simples
como dois tubos de diferentes dimtros
explicam mudanas na resposta muito
similares s mudanas observadas no
trato vocal.
l Todas as propriedades interessantes do
trato vocal aparentemente provem de
sua forma, no da natureza fsica dos
articuladores.
8
Variabilidade
A forma acstica das vogais varia
bastante por causa de:
l Acentos
l Gestos do orador
l Tamanho do trato vocal
l Contexto Prosdico
l Meio Consonantal
l Rudo e efeito de canais
Espectrografia
Adiciona um dimenso temporal
analise espectral.
A
F
A
F
A
F
tempo
tempo
F
ex. Uma nica onda senoidal aumentando em freqncia
9
Espectrograma
um grfico do contedo em freqncia
de um sinal graficado em funo do
tempo.
O eixo horizontal o tempo
O eixo vertical a freqncia
A amplitude de cada componente
presente no sinal em um dado tempo e
freqncia mostrado numa escala de
cinza (branco=pouco, preto=muito)
Espectrografia
A
F
t
100
200
300
0.1
0.2
0.3
tempo
F
100
200
300
0.1 0.2 0.3
Espectrograma
10
Analogia com um conjunto
de Filtros Passa-Banda
F
t
Regies escuras
significam
energia emum
dado tempo e
freqncia
Conjunto de
filtros passa-
banda
Sinal de entrada
alimenta cada
filtro
Espectrogramas de Sons
simples
Onda senoidal
Trem de pulsos
Trem de pulsos atravs de um
ressonador
Vogal
Ditongo
11
O que ver em um
espectrograma
Fala
l Os pulsos peridicos da vibrao das pregas
vocais aparecem como estrias verticais.
Ressonncias Formantes de Vogais
l Aparecem como regies escuras entre
pulsos.
Fricativos (ffff)
l Aparecem como regies salpicadas,
tipicamente em altas freqncias
A Acstica da Produo da Fala
12
Teoria fonte-filtro da produo
da fala
Fonte
Filtro
Fala
Produo da fala pode ser dividida emduas partes
independentes
Fontes de som (sinais) laringe
Filtros que modificam o sinal (sistemas) trato vocal
Consoantes
As trs fontes so usadas
Fricao
Aspirao
Fala
13
Consoantes
As trs fontes so usadas
Fricao
Aspirao
Fala
Articuladores mudam as ressonncias no trato vocal
Ressonncias no trato vocal so chamadas de formantes
Movendo a lingua, os lbios, e a mandbula modifica-se a forma do
trato vocal.
modificando-se a forma do trato vocal, mudam-se as freqncias
formantes .
Consoantes
As trs fontes so usadas
Fricao
Aspirao
Glote
Articuladores mudam as ressonncias no trato vocal
Ressonncias no trato vocal so chamadas de formantes
Movendo a lingua, os lbios, e a mandbula modifica-se a forma do
trato vocal.
modificando-se a forma do trato vocal, mudam-se as freqncias
formantes .
Consoantes so criadas atravs de mudanas coordenadas nas fontes de
mudanas no filtro (i.e., freqncias formantes)
14
Consoantes vs. Vogais
Consoantes
Mudanas rpidas nos
articuladores
Vogais
Mudanas lentas nos
articuladores
Consoantes vs. Vogais
Consoantes
Mudanas rpidas nos
articuladores
Produzidas ao fazer
constrices no trato
vocal.
Vogais
Mudanas lentas nos
articuladores
Produzidas com o trato
vocal relativamente
aberto.
15
Consoantes vs. Vogais
Consoantes
Mudanas rpidas nos
articuladores
Produzidas ao fazer
constrices no trato
vocal.
Coordenao das trs
fontes: friccional,
aspirao e gltica.
Vogais
Mudanas lentas nos
articuladores
Produzidas com o trato
vocal relativamente
aberto.
Apenas a produo
gltica usada.
Freqncias Formantes
O primeiro formante (F
1
)
Afetado pelo
tamanho da
constrico
Pista para modo
No relacioando com
local
/AdA/
16
Freqncias Formantes
/AdA/
O primeiro formante (F
1
)
Afetado pelo tamanho
da constrico
Pista para modo
No relacionado com
local
O segundo e terceiro
formantes(F
2
e F
3
)
Afetados pelo local
da articulao
Local de Articulao
Bilabial
Alveolar
Velar
17
Local de Articulao
/AdA/ /AgA/
Local de Articulao
Bilabiais (ex., /b/, /p/, /m/) -- Baixas Freqncias
Baixo F
2
Baixo F
3
Alveolares (ex., /d/, /n/, /s/) Altas Freqncias
Alto F
2
Alto F
3
Velares (ex., /g/, /k/) Freqncias Intermedirias
Alto F
2
Baixo F
3
18
Local de Articulao vs.
Vogais Diferentes
/AdA/ /idi/
Plosivas (ex., /b/,/p/,/d/,/t/,/k/,/g/)
Fechamento completo do trato vocal
Bloqueia o fluxo de ar atravs da cavidade oral
Carne absorve a energia de alta-freqncia
Durante as plosivas, apenas a barra de voz pode ser
produzida durante o fechamento
19
Plosivas (ex., /b/,/p/,/d/,/t/,/k/,/g/)
/idi/
Barra de Voz
Fechamento completo do trato vocal
Bloqueia o fluxo de ar atravs da cavidade oral
Carne absorve a energia de alta-freqncia
Durante as plosivas, apenas a barra de voz pode ser
produzida durante o fechamento
Exploso criada ao soltar a consoante
Criado quando o fechamento parcialmente aberto
Ruido tipo frico (fricativo) criado ao fluir o ar
atravs de uma abertura parcial
Durao muito curta
Plosivas (ex., /b/,/p/,/d/,/t/,/k/,/g/)
20
Plosivas (ex., /b/,/p/,/d/,/t/,/k/,/g/)
/idi/
exploso
Consoantes Plosivas
Sonoras e Surdas
Consoantes Sonoras
Vozcomea menos
de aproximadamente
30 ms aps soltura.
Vozpode ocorrer
durante o
fechamento.
Consoantes Surdas
Vozcomea aps
mais do que 50 ms
aps soltura.
Vozno ocorre
durante fechamento.
Durao entre a soltura (exploso) e incio da voz
chamado Voice Onset Time (VOT).
21
Consoantes Plosivas
Sonoras e Surdas
/AdA/ /AtA/
Nasais (ex., /m/, /n/)
Similares s plosivas, exceto que o ar tambmflui atravs da
cavidade nasal
Uvula controla o fluxo de ar atravs da cavidade
nasal.
O fluxo de ar permite que a voz continue durante o
fechamento.
Ressonncias das cavidadesorais e nasais interagem
Difcil de ver em espectrogramas
22
Nasais (ex., /m/, /n/)
Similar to voiced stops, except air also flows through nasal cavity
Uvula controls airflow through nasal cavity
Airflow allows voicing to continue during closure
Nasais (e.g., /m/, /n/)
/AdA/ /AnA/
23
Fricativas (ex., /s/,/z/,/f/,/v/)
Criadasao forar o ar atravsde uma pequena constrico
Rudo produzido devido a turbulncia.
Filtragem do trato vocal depende de onde a fricativa produzida.
Fricativas produzidas na boca tem uma resposta em freqncia
mais plana do que aquelas produzidas na garganta.
Fricativas produzidas na boca tem uma resposta em freqncia
central mais elevada do que aquelas produzidas na garganta.
Fricativas (ex., /s/,/z/,/f/,/v/)
/AfA/ /AsA/
24
Fricativas Sonoras (e.g., /z/,/v/)
Vocal folds can vibrate at the same time that fricative energy is produced
Creates a voice bar during the fricative
Vocal fold vibration reduces airflow
Reduces the amplitude of the fricative energy
Fricativas Sonoras vs. Surdas
/AfA/ /AvA/
25
Lquidas (e.g., /l/,/lh/,/r/)
Constrico mais aberta do que as fricativas
Fluxo livre de ar no produz turbulncias
Sonorizao continua durante a consoante
Similar s vogais
Lquidas tem F
1
menor do que as vogais.
Lquidas tendem a tem mais movimento de
formantes do que as vogais.
Lquidas
/AwA/
26
Resumo
Consoantes envolvemmudanas rpidas na fonte e no filtro.
Lugar de articulao afeta F
2
e F
3
Plosivas, Fricativas e Lquidas diferemno grau de consrico da
cavidade vocal.
Consoantes sonoras e Surdas diferemno tempo das articulaes e
na vibrao das pregas vocais.

Você também pode gostar