Você está na página 1de 6

DFis/ICEx/UFMG Prof.

Maurlio Nunes Vieira - Experimentos em Acstica Projeto PEG 2008/69

Exp 8. Acstica da Fala


1. Objetivos
Estudar o modelo fonte-filtro da produo da fala; Medir os formantes e relacionar com manobras articulatrias em vogais e ditongos; Utilizar espectrografia de banda larga e banda estreita;

2. Introduo
Os principais rgos e cavidades do corpo humano relacionados com a acstica da fala esto indicados na Fig. 1. Na produo de vogais, o ar expelido pelos pulmes interage com as pregas vocais, fazendo-as vibrar de forma quase peridica. A srie de pulsos glticos modificada pelas cavidades oral e/ou nasal, e o som irradiado na boca e/ou narinas. O grau de acoplamento do trato nasal determinado pela elevao do vu palatino. Os movimentos da lngua, maxilar, e lbios, do forma cavidade oral, dependendo do som a ser produzido.

Fig. 1. Trato Vocal.

2.1 Formantes As ressonncias do trato vocal na vogal neutra (produzida com a lngua em repouso) podem ser estimadas a partir de um tubo cilndrico uniforme, fechado na glote e aberto nos lbios, com comprimento l 17 cm e dimetro 2r 3,5 cm. Admitindo-se apenas a propagao longitudinal (f < 5kHz), 30 verifica-se que os modos normais ou Fi 20 formantes (F1, F2, F3, etc.) ocorrero aproximadamente nas freqncias: 10

Fn (2n + 1) 500 Hz, n = 1, 2, 3L

(1)

Amplitude (dB)

Perdas causadas pela viscosidade do ar e pela irradiao nos lbios aumentam com a freqncia. Isto causa maior largura de faixa e menor amplitude dos formantes (ressonncias) na parte superior do espectro (Fig. 2)

-10

-20

-30

-40

1000

2000

3000

4000

5000

Frequncia (Hz)

Fig. 2. Formantes (vogal neutra)

DFis/ICEx/UFMG Prof. Maurlio Nunes Vieira - Experimentos em Acstica Projeto PEG 2008/69

Fig. 3. Freqncias (Hz) e amplitudes (dB) dos formantes de vogais. Valores mdios para locutores masculinos e femininos. Fonte: Flanagan, J. (1972). Speech Analysis, nd Synthesis and Perception, 2 . Ed. Springer-Verlag, New York.

Os trs primeiros formantes (F1, F2, F3) esto associados vogal (/i/, /a/, /u/, etc.) enquanto os formantes de ordem superior tm maior dependncia com o locutor. Valores mdios de F1, F2, e F3 para vogais da lngua inglesa esto indicados na Fig. 3Fig.. A freqncia de F1 diminui quando a lngua se eleva, estreitando o trato vocal. Por outro lado, o avano/recuo da posio do estreitamento resulta num aumento/diminuio da freqncia de F2. A anlise de formantes, ou medidas correlatas, a base de sistemas de reconhecimento de voz. 2.2 Fonao Durante a fonao, as pregas vocais abrem e fecham de forma quase peridica. Na fala de adultos, o valor da freqncia de vibrao, F0, , em mdia, 120 Hz para homens e 220 Hz para mulheres. O pulso gltico assimtrico, pois o fechamento das pregas vocais ocorre mais rapidamente que a abertura. Como indicado na figura 4, o trem de pulsos glticos, g(t), pode ser decomposto numa srie de componentes harmnicas, mltiplas inteiras da freqncia fundamental, F0. 2.2 Modelo fonte-filtro-irradiao Combinando-se os pulsos glticos (fonte) com a resposta em freqncia do trato vocal (filtro) e ainda o efeito dos lbios (impedncia acstica de

g (t )

1/F0

F
GT ( f )

-12 dB/oitava

F0

2F0 3F0

Fig. 4. Fonte de excitao gltica. O espectro do trem de pulsos G(f) composto por uma freqncia fundamental (F0) e uma srie harmnica onde a amplitude de cada termo determinada por uma envoltria, que cai em -12 dB/oitava (fora de escala na figura).

Exp 8 Acstica da Fala

2/6

DFis/ICEx/UFMG Prof. Maurlio Nunes Vieira - Experimentos em Acstica Projeto PEG 2008/69

5 ms/div
Fig. 5. Simulao da presso sonora numa vogal /a/.

irradiao), tem-se a forma de onda da presso sonora emitida durante a fala. As formas de onda para a simulao de uma vogal /a/ so mostradas na figura 5. A interao fonte/filtro/irradiao vista de forma mais simples no domnio em freqncia (Fig. 6), onde o espectro do sinal de voz, V(f) escrito como:

V ( f ) = G ( f ) H ( f ) R( f )

(2)

sendo G ( f ) o espectro da fonao, H ( f ) a resposta em freqncia do trato vocal e R ( f ) o comportamento em freqncia da impedncia de irradiao. A irradiao por uma pequena abertura (lbios) num grande plano refletor (face) pode ser aproximada por um filtro passa-altas, como visto no seminrio 3. Fisicamente, isto significa que sons de baixa freqncia se espalham por difrao enquanto sons de alta freqncia tendem a se propagar em linha reta. O modelo fonte filtro supe uma independncia entre os ajustes articulatrios (filtro) e a vibrao fonatria. Nas freqncias da fala, isto se justifica pelo valor mximo da abertura gltica (~2 mm x 20 mm), desprezvel em relao ao dimetro do trato vocal supragltico. Em outras palavras, a impedncia acstica (inversamente proporcional rea do tubo) muito maior entre as pregas vocais que nas cavidades orofarngeas.

F0 FONTE FILTRO Pregas Vocais Cavidades Orais IRRADIAO Lbios (som)

G( f )

-12 dB/oitava

H( f )

R( f )
+6 dB/oitava

V( f )

Fig. 6 Modelo fonte-filtro. Representao no domnio da freqncia. F1--F4 so ressonncias (formantes) do trato oral, H (f); Fg relaciona-se com a forma do pulso gltico. Note, no espectro na parte inferior direita da figura, que os harmnicos localizados em torno de algum formante so amplificados pelo fenmeno da ressonncia.
Exp 8 Acstica da Fala

3/6

DFis/ICEx/UFMG Prof. Maurlio Nunes Vieira - Experimentos em Acstica Projeto PEG 2008/69

3. Exerccios
1. Obtenha a freqncia dos formantes para o tubo cilndrico uniforme (Eq. 1). 2. Os formantes so estimados a partir da anlise do espectro do sinal de voz. Qualitativamente, o que ocorre com o espectro de V(f) quando a freqncia fundamental de fonao, F0, aumentar? Ser possvel definir os formantes? Por qu? (Lembre-se: Os formantes so as freqncias de ressonncia do tubo). 3. Verifica-se que (i) a envoltria do espectro gltico decresce em -12 dB/oitava e que (ii) a impedncia de irradiao aumenta em +6 dB/oitava. Como isto afeta a amplitude dos formantes? Como isto pode ser compensado?

4. Bibliografia
1. T.D. Rossing, Speech Production (Cap. 2), in The The Science of Sound (2rd. Ed.) Addison-Wesley, New York (1990). 2. I. R. Titze, Principles of Voice Production Prentice-Hall (1994). 3. M.N. Vieira, Princpios da Produo e Anlise de Voz XV Escola de Inverno Departamento de Fsica/ICEx/UFMG (2004).

5. Anexo: Espectrograma

Espectrograma: representao do sinal no plano ft (freqncia versus tempo). Uma terceira dimenso, a amplitude das componentes espectrais, pode ser criada atravs do nvel de cinza (ou cor) das curvas. Um espectrograma , basicamente, a indicao temporal da energia na sada de um banco de filtros. Ajustando-se de alguma forma a largura de faixa (seletividade) dos filtros possvel ressaltar-se (1) os formantes ou (2) os harmnicos da excitao. Como mostrado na figura, no espectrograma de banda larga (BL), h uma melhor definio dos formantes, ao passo que no espectrograma de banda estreita (BE) h uma melhor definio dos harmnicos da freqncia fundamental
Exp 8 Acstica da Fala

4/6

DFis/ICEx/UFMG Prof. Maurlio Nunes Vieira - Experimentos em Acstica Projeto PEG 2008/69

5. Parte Prtica
5.1 Material
Computador com microfone e caixa de som Software Audacity para edio de sinais http://audacity.sourceforge.net/download/ (http://www.speech.kth.se/wavesurfer/)

Software Wavesurfer para anlise espectral da fala

5.2 Procedimentos
Observaes: Ao fazer as gravaes, utilize uma freqncia de amostragem de 11025 Hz. Durante as gravaes, certifique-se que no esteja havendo saturao, mantendo o nvel do sinal em -6 dB (Referncia: fundo de escala). Fazer um relatrio, ilustrando com formas de onda e espectros e anexando exerccios.

5.2.1 Estudo de vogais no domnio do tempo. 1. Familiarize-se com o software Audacity e grave uma seqncia de vogais (/i/, /a/, /u/) com valores recomendados de amplitude e taxa de amostragem. 2. D um zoom e observe a quasi-periodicidade do sinal. Mea a freqncia fundamental F0 (mdia de vrios ciclos) para cada vogal. Repita o procedimento com a voz de seu colega de trabalho. 3. Compare os valores de vozes masculinas e femininas, se possvel. 5.2.2 Espectro de vogais. 1. Familiarize-se com o Wavesurfer, identificando os recursos de anlise espectral (espectrograma, seo espectral e espectro mdio de longo prazo LTAS = long term average spectrum). Verifique a influncia de ajustes como o nmero de pontos da FFT e o tipo de janela na seo espectral. 2. Produza diferentes vogais (/i/, /a/, /u/). Numa seo espectral em banda estreita (voz masculina: 1024 pontos da FFT e 512 pontos para a janela), determine a freqncia fundamental e os 3 primeiros formantes. Repita para o colega de trabalho. Compare os valores medidos com os esperados. 3. Mantendo a vogal, varie a freqncia fundamental e descreva o que ocorre (use um espectrograma de banda estreita para registrar). O que ocorre com F0 e com os formantes?

Exp 8 Acstica da Fala

5/6

DFis/ICEx/UFMG Prof. Maurlio Nunes Vieira - Experimentos em Acstica Projeto PEG 2008/69

4. Visualizando o espectro num espectrograma de banda larga (voz masculina: 1024 pontos para FFT e 64 pontos para a janela), produza ditongos (/ai/, /ui/, etc.). Descreva o comportamento de F1 e F2 e relacione com os gestos de elevao e avano da lngua. 5. Fale com uma voz sussurrada. O que ocorre? Tente explicar onde est a fonte sonora. 5.2.3 Percepo 1. Visualizando o espectro num espectrograma de banda larga, grave o au a, oh!. Descreva o comportamento de F1 e F2 do a no contexto ... o au ... e no contexto ... au a .... Sugira uma hiptese para a perfeita compreenso do fonema /a/ apesar dos formantes estarem em freqncias diferentes para dois casos citados.

Exp 8 Acstica da Fala

6/6