Você está na página 1de 14

Captulo sete: a produo da fala.

Quando conversamos, usamos nossas lnguas e lbios e outros rgos


vocais para produzir os diferentes sons da fala. Neste captulo ns vamos
considerar as variaes na presso do ar que so peculiares a cada som da
fala. No est dentro do escopo deste livro dar uma explicao detalhada
acerca

de

todos

os

variados

sons

da

fala.

Ns

examinaremos

simplificadamente alguns dos principais tipos de sons que ocorrem na lngua


inglesa.
No captulo 1 eu ponteei que para cada som deve haver um movimento
correspondente de uma fonte sonora. Na maioria dos sons da fala, as
vibraes do ar nas passagens da boca, garganta e nariz (que coletivamente
so conhecidas como trato vocal) desempenham o papel dos movimentos que
iniciam as ondas sonoras. O trato vocal termina, de um lado, pelas cordas
vocais, e do outro, abertura do ar alm dos lbios e narinas; desse modo, ele
forma uma cmara de ressonncia de formato complexo. Quando o ar nessa
cmara posto em movimento por uma pancada, ele vibra de forma complexa.
essa vibrao que causa as ondas sonoras que ouvimos.
As batidas que colocam o ar na boca e garganta em vibrao so
devidas as aes das cordas vocais. As pregas vocais so pequenas fendas
musculares apoiadas em cartilagens na laringe. Na fala ou canto, elas so
trazidas vagamente para perto. Se o ar est sendo empurrado para fora dos
pulmes, a presso ir aumentar entre elas at elas se separarem. Mas, to
logo elas sejam separadas, ento haver menos presso entre elas, e ento se
juntaro novamente o que resulta na presso sendo aumentada o que as
separa novamente. Esse ciclo de eventos repetido muito rapidamente ate o
ar no ser mais empurrado para fora dos pulmes ou a posio das pregas ser
ajustada. O percurso do ar entre as pregas vocais na verdade causa a elas o
movimento de serem sugadas, por isso elas so fechadas muito bruscamente.
A mudana repentina na presso do ar que acontece quando as pregas vocais
so juntas atua como um sopro de ar no trato vocal e o coloca em vibrao.

O ar no trato vocal ir vibrar de maneiras diferentes quando os rgos


vocais estiverem em diferentes posies. Como vimos no captulo 5, o modo no
qual uma massa de ar vibra depende de seu tamanho e forma. As variaes na
forma do trato vocal so determinadas em grande parte pelos movimentos da
lngua, dos lbios e do vu palatino. Haver um tipo caracterstico de vibrao
do ar correspondente a cada posio destes rgos vocais.
Agora podemos ver como as formas de ondas dos sons das vogais que
discutimos no captulo 3 so formadas. A forma de onda da vogal [c], como em
caught, repetida aqui na figura 7.1. Como voc j deve ter notado, ela
consiste de uma srie de ondas amortecidas, recorrendo nessa ocasio a taxa
de cerca de 100 por segundo. Cada uma dessas ondas amortecidas
produzida pelas vibraes do ar no trato vocal que ocorre a cada vez que h
um pulso das cordas vocais. Assim que os rgos vocais estiverem nas
posies para essa vogal, e a as cordas vocais continuarem a produzir pulsos,
uma srie de ondas amortecidas com uma frequncia de cerca de 500 Hz ser
gerada.
Quando os rgos vocais estiverem em outra posio, como a da vocal
[i] em see, outra srie de ondas amortecidas produzida. Como podemos ver
na figura 7.2, a qual uma repetio de outra parte da figura 3.3, a forma de
onda tem no mnimo duas principais componentes que so distinguveis pelo
olhar. De fato, seria melhor considerar a forma de onda para a vogal [i] como
se fosse mais como a soma de trs ondas amortecidas; e mesmo isso uma
simplificao, como h alguns pequenos componentes adicionais.
Ondas amortecidas com frequncias apropriadas so mostradas na
figura 7.3. A cada vez que h um pulso das cordas vocais, o ar na boca e na
garganta posto em vibrao em todas as trs formas simultaneamente. A
figura mostra o que resultaria de dois desses pulsos. O som da vogal [i] a
soma de todas essas vibraes e tem componentes no seu espectro em
frequncias correspondentes.
Os picos dos espectros das vogais (e, como podemos ver, de certos
outros sons das fala) correspondem as frequncias bsicas das vibraes de ar
no trato vocal. Esses modos de vibrao do trato vocal so conhecidos como

formantes. Os formantes de um som so assim aspectos dele que so


diretamente dependentes do formato do trato vocal e so em grande parte
responsveis pela qualidade caracterstica. O autor da vogal [c] parcialmente
caracterizado por um formante perto de 500 Hz, e de sua vogal [i] pelos
formantes prximos a 250, 2.700 e 3.500 Hz. Quando essas vogais so
pronunciadas haver comparativamente muitos componentes correspondendo
as ondas amortecidas com essas frequncias bsicas. a presena destes
componentes distintos (esses formantes) que nos permite reconhecer as
diferentes vogais que so associadas com as diferentes posies dos rgos
vocais.
Cada movimento das pregas vocais coloca a massa de ar acima delas
em vibrao em sua prpria frequncia natural (as frequncias formantes). Se
as pregas vocais so separadas a cada milsimo de segundo, as vibraes
amortecidas sero iniciadas mil vezes por segundo, e a forma de onda
complexa que produzida alm dos lbios ser repetida na mesma proporo.
Esse ponto ilustrado na figura 7.4, que mostra as ondas sonoras
correspondentes a um som sintetizado que tem uma forma de onda
ligeiramente mais simples, mas quase indistinguvel daquela da vogal [c],
como vista em caught. Quatro diferentes situaes so apresentadas: (a) o
resultado de um pulso simples, (b) o resultado de pulsos ocorrendo a cada
milsimo de segundo, e (c) e (d) o resultado de pulsos em duas outras taxas.
Um sintetizador de voz foi usado para produzir estes sons para esses
diagramas de modo a garantir que a nica diferena entre os sons fosse a taxa
a qual os pulsos eram produzidos.
Vimos no captulo 4 que as formas de ondas repetitivas como as da
figura 7.4 (b) podem ser convenientemente encaradas como sendo a soma de
um numero de componentes, cada qual com uma frequncia que um mltiplo
inteiro da frequncia fundamental (isto , a frequncia de repetio da onda
complexa). Assim, a onda na figura 7.4 (b) ter componentes que so mltiplos
inteiros de 100, desde que essa onda complexa se repita 100 vezes por
segundo. De fato, o espectro deste som mostrado a direita da figura 7.4. O
componente com uma frequncia de 500 Hz tem a maior amplitude (o que no
surpresa, tanto que a onda amortecida que se repete tem uma frequncia

bsica de 500 Hz). Alm disso, h outro pico no espectro a 1.500 Hz que
corresponde as menores ondas sobrepostas a forma de onda amortecida
principal. Nos pontos (c) e (d) da figura 7.4 esto as formas de onda e
espectros do mesmo som semelhante a da vogal de maior entonao, isto ,
quando os pulsos esto sendo produzidos a 120 e 150 Hz. Como voc pode
notar, essas ondas consistem de repeties de uma onda amortecida com uma
frequncia bsica de 500 Hz e outra onda com uma frequncia bsica de cerca
de 1.500 Hz. Ademais, todos os espectros mostrados a direita da figura tem
uma certa similaridade entre si; possvel desenhar uma curva com os picos a
500 e a 1.500 Hz ao redor deles. A diferena entre esses dois ltimos
espectros que os componentes de frequncias so mltiplos de 120 em um,
e de 150 em outro; e por isso eles so representados por linhas que esto mais
afastadas.
Essa anlise est, obviamente, de acordo com o principio definido no
captulo 4: quando uma onda complexa consiste de uma forma de onda
amortecida que se repete em intervalos regulares, os componentes de
frequncias sempre tero as mesmas amplitudes relativas daquelas dos
componentes correspondentes no espectro contnuo representado pela
ocorrncia isolada da onda amortecida. Consequentemente, alterar a taxa a
qual as cordas vocais produzem pulsos afetar a frequncia fundamental da
onda complexa; porm, isso no alterar os formantes (os picos no espectro),
os quais correspondem as frequncias bsicas das vibraes amortecidas do
ar no trato vocal. Nesse sentido podemos dizer que os formantes de um som
so propriedades do formato correspondente da boca.
Uma vez que a curva contnua como a da figura 7.4 (a) o modo mais
evidente de representar os formantes que caracterizam uma certa vogal
independente da taxa em que os pulsos so produzidos pelas cordas vocais,
ns costumamos usa-la em preferencia a uma linha de espectro quando
estamos discutindo a natureza acstica da qualidade vocal. Descrevemos a
vogal em termos de espectros lineares (como na figura 7.4 [b], [c], e [d])
somente quando queremos prestar ateno nas frequncias fundamentais em
particular empregadas.

Vimos no captulo 6 que a entonao de um som depende


principalmente da frequncia fundamental. Consequentemente, quando h uma
variao na taxa em que os pulsos so produzidos pelas cordas vocais, haver
uma mudana na entonao de som (embora no haver mudana nos
formantes, e por isso, nenhuma mudana na qualidade vocal caracterstica).
Ns controlamos as mudanas de entonao ajustando os msculos que agem
acima das cordas. Quando a tenso aumentada de modo que as pregas so
bem esticadas, elas se movem mais rapidamente, e ento produzem o grande
numero de pulsos por segundo que so requeridos para um som de entonao
alta. Do outro lado, quando dizemos uma palavra em uma entonao baixa, as
pregas so mantidas juntas apenas vagamente, de modo que quando elas so
soltas elas levam um pouco mais de tempo para retornar a posio fechada.
Geralmente possvel de alterar a entonao do som de uma vogal sem
alterar sua qualidade caracterstica, por causa de que cada um desses fatores
controlado por um mecanismo fisiolgico separadamente. Como vimos, a
entonao depende da ao das cordas vocais, e a qualidade caracterstica
depende em grande parte dos formantes, que tem certos valores fixos para
cada formato em particular do trato vocal. A figura 7.5 mostra os espectros dos
autores das vogais nas partes do meio das palavras heed, hid, head, had, hod,
hawed, hood, e whod. As posies correspondentes dos rgos vocais so
mostradas tambm. Essas curvas nos do uma indicao muito boa dos
componentes de frequncia que so caractersticos de cada um desses sons.
Podemos pensar em cada pico como se mostrasse a frequncia bsica da
primeira das ondas amortecidas que so apresentadas. A vogal na parte do
meio da palavra had, por exemplo, caracterizada por ter componentes com
amplitudes relativamente grandes em trs regies principais: ao redor de 700
Hz, 1.750 Hz, e 2.600 Hz. As ondas amortecidas com essas frequncias
bsicas so geradas cada vez que h um pulso das cordas vocais.
Se voc pensar nisso em termos musicais, voc pode dizer que em
correspondncia a cada vogal h uma acorde que caracterstica daquela
vogal. Devido aos pulsos da laringe, esse acorde gerado muitas vezes por
segundo. No h nada particularmente novo nesse modo de olhar para os sons
da fala. H muito tempo atrs, em 1829, Robert Willis disse: uma certa vogal

simplesmente a repetio rpida de sua nota nica. Isso uma simplificao,


porque Willis no percebeu que as vogais so caracterizadas no por uma
frequncia cada, mas por uma combinao de frequncias; se alteramos sua
afirmao ligeiramente, contudo, e disser que uma vogal simplesmente a
repetio de seu acorde nico, faremos uma definio que se encaixa com os
dados da figura 7.5 muito bem.
A descrio da produo dos sons das vogais que tem sido dada tem o
mrito de ser razoavelmente simples, mas no completamente satisfatria,
na medida em que no leva em conta a natureza dos pulsos das cordas vocais.
Temos visto o trato vocal como se contivesse um corpo ressonador de ar que
posto em movimento por uma srie de batidas das cordas vocais. De fato, os
pulsos produzidos pelas pregas vocais no so completamente batidas. H
variaes na presso do ar com uma forma de onda como visto na figura 7.6.
Se voc fosse capaz de cortar a cabea de algum enquanto estivesse
produzindo uma vogal, e se elas fossem capazes de continuar vocalizando, o
som que elas produzissem teria a forma de onda mostrada nessa figura.
O espectro dessa forma de onda mostrado a direita da figura. A onda
mostrada na esquerda tem duas repeties dentro de 1/100 de segundo, de
modo que as pregas vocais estavam vibrando a 200 Hz. Consequentemente,
todos os componentes no espectro da direita so mltiplos de 200 Hz.
Pegaremos a frequncia fundamental o componente de 200 Hz como um
valor de referencia, e arbitrariamente atribuiremos a ele um valor de 0 dB. As
amplitudes dos outros componentes diminuem muito rapidamente enquanto a
frequncia aumenta. O componente de 400 Hz tem uma amplitude de 12 dB
menor do que o componente de 200 Hz, e o de 800 Hz tem uma amplitude 12
dB menor do que o de 400 Hz. De fato, a amplitude cai 12 dB para cada
duplicao da frequncia o componente de 2.000 Hz 12 dB abaixo do
componente de 1.000 Hz. Dissemos no captulo 2 que qualquer duplicao da
frequncia um aumento de uma oitava; a entonao L padro de um piano
440 Hz; o L acima deste 880 Hz; e o L acima deste outro 1.760 Hz.
Podemos dizer que o espectro do pulso gltico tem um declive de -12 dB por
oitava. O declive um numero negativo porque a amplitude reduz por 12 dB a
cada oitava que a frequncia aumente.

Essas consideraes nos conduzem a outra maneira bem conhecida de


descrever a produo dos sons das vogais. Essa , em termos, o que tem sido
chamado como teoria da fonte-filtro. Essa teoria considera as vibraes das
pregas vogais como fonte de uma onda que afetada ao ter que passar
atravs de um filtro formado pelas cavidades ressoantes que compem o trato
vocal. Em vez de encarar o trato vocal como se contivesse um corpo
ressonador de ar excitado por batidas das cordas vocais, o veremos como um
filtro em que passam algumas frequncias melhor do que outras. claro, as
frequncias que ele deixa passar so exatamente aquelas que iro ressoar por
si s. Consequentemente, a curva mostrando as ressonncias do trato vocal
tambm a curva que mostra a extenso para aquelas que passaro nas
frequncias que so dispostas dentro dela.
A figura 7.7 mostra uma vista da produo de fonte-filtro de uma vogal.
O espectro do pulso gltico mostrado esquerda da figura. Nesse caso,
temos levado as pregas vocais a vibrarem a 100 Hz, de modo que os
componentes esto a intervalos de 100 Hz. A direita do espectro est o
conjunto de curvas especificando a resposta do trato vocal. A sada do trato
vocal pode ser considerada como a entrada para outra caixa intitulada fator de
radiao, que devemos agora tomar nota. At agora temos considerado
somente a vibrao do ar dentro do trato vocal. Mas essas vibraes esto
dentro da boca e no so elas por si s as variaes na presso do ar que
ouvimos. O ar no trato vocal vibra de modo que as partculas de ar na
extremidade aberta entre os lbios se movem para trs e para frente. esse
movimento que iniciam a vibrao do ar para fora dos lbios. O ar entre os
lbios age como um pisto, uma fonte sonora produzindo variaes na presso
do ar que irradiam para fora dos lbios assim como as variaes na presso do
ar irradiam para fora de uma fonte sonora como um diapaso. Os movimentos
desse pisto de ar so mais efetivos em causar variaes na presso no ar
circundante em algumas frequncias do que em outras. Quanto maior a
frequncia, maior a resposta de ar circundante ao do ar que vibra no trato
vocal. Esse efeito, que denominamos fator de radiao (impedncia de
radiao o termo usado na maioria dos livros tcnicos), pode ser
considerado como um tipo de filtro que impulsiona as frequncias mais altas

em 6 dB por oitava. A curva representando o fator de radiao mostrada


acima do terceiro quadro na figura 7.7.
A sada produzida nos lbios depende da fonte da corda vocal, a ao
de filtragem do trato vocal, e de muitas modificaes produzidas pelo fator de
radiao. Normalmente a fonte da corda vocal a mesma para cada vogal,
exceto algumas variaes de entonao. As pregas vocais podem estar
vibrando a 100 Hz, ou a 200 Hz, como nos exemplos que temos considerado,
ou em qualquer outra frequncia no alcance da voz humana. Mas,
independente da frequncia fundamental, o declive espectral do pulso da corda
ser no geral aproximadamente 12 dB por oitava. A ao de filtragem do trato
vocal ser diferente para cada posio dos rgos vocais, produzindo assim
formantes (picos na curva de ressonncia) de diferentes frequncias. O
espectro da forma de onda alm dos lbios (mostrado a direita da figura 7.7)
ter picos em regies que dependem das caractersticas do filtro do trato vocal.
O declive geral do espectro das sadas ser influenciado pelo declive do
espectro do pulso gltico (-12 dB/oitava) e pelo fator de radiao (+6
dB/oitava). Tomados em conjunto, esses dois fatores de declive causam um
declive de -6 dB no espectro de sada. A principal caracterstica do espectro de
sada os picos formantes sobreposta a este declive geral. Eles so
primordialmente dependentes das caractersticas do filtro do trato vocal.
As vogais so caracterizadas de tal forma pelas frequncias de seus
formantes, frequentemente conveniente representa-las por um diagrama
(figura 7.8) que mostra somente essa informao. Esse diagrama, que
baseado nos dados apresentados na figura 7.5, utiliza a escala vertical para
indicar as frequncias dos formantes que caracterizam as vrias vogais.
Diagramas

semelhantes

esse,

chamados

espectrogramas,

so

frequentemente produzidos em anlises acsticas da fala. A escala horizontal


(abcissa) indica o tempo em que um certo som ocorre; a escala vertical indica
as frequncias componentes que esto presentes nos tempos mostrados na
escala horizontal; e a clareza ou escurido das marcas indicam as amplitudes
dos vrios componentes.

A figura 7.8 um dos diagramas bsicos no estudo da acstica da fala.


Podemos verificar alguns dos dados sem usar quaisquer instrumentos. , por
exemplo, possvel de colocar ar no trato vocal vibrante de uma forma que a
onda amortecida correspondente ao formante mais baixo seja produzido com
uma amplitude maior do que a dos outros componentes. Isso pode ser feito
agitando um dedo contra a garganta um pouco acima da laringe enquanto
segura a respirao atravs de uma glotalizao (o som que frequentemente
substitui o [t] na palavra button). Esse som composto principalmente de uma
onda amortecida com uma frequncia bsica correspondente a daquela do
primeiro formante.
Se voc olhar para a figura 7.8 voc ver que o primeiro formante (isto ,
o pico mais baixo do espectro) est em uma baixa frequncia para a palavra
heed (220 Hz), e est um pouco mais alta para cada uma das palavras hid (400
Hz), head (550 Hz) e had (750 Hz). Se voc posicionar seus rgos vocais nas
posies para produzir as vogais em cada uma dessas palavras e ento agitar
seu dedo contra sua garganta enquanto segura uma glotalizao, voc ir
produzir uma nota de baixa entonao para a palavra heed, e uma nota de
entonao ligeiramente maior para cada uma das palavras hid, head e had.
Nas palavras remanescentes dessa srie a frequncia do primeiro formante
decresce. Consequentemente, se voc repetir esse truque enquanto faz as
articulaes para as vogais nas palavras hod, hawed, hood, e whod, voc ir
produzir uma srie de notas que decrescero em entonao. As frequncias
reais das notas que voc pode produzir, obviamente, diferem daquelas citadas
acima, que so valores baseados em anlises do autor da fala. Voc pode no
ter somente uma diferena de sotaque, mas tambm um maior ou menor trato
vocal. Ambas essas caractersticas afetaro os valores absolutos das
frequncias formantes, mas elas provavelmente no afetaro o arranjo relativo
dos sons que voc produz.
Podemos fazer uma verificao grosseira na frequncia do segundo
formante para cada uma dessas vogais sussurrando as palavras. Quando voc
sussurra, as pregas vocais so separadas ligeiramente, de forma que o ar dos
pulmes acelera entre elas, causando pequenas variaes na presso do ar
que colocaro o ar no trato vocal para vibrar. Entre as diferenas bsicas que

so mais audveis nessas condies, esto aquelas do segundo e terceiro


formantes. Se voc sussurrar o conjunto de vogais das palavras heed, hid,
head, had, hod, hawed, hood, whod voc ir ouvir uma diminuio gradual da
entonao aparente. Como voc pode observar da figura 7.7, isso se d
paralelamente

pelo

modo

no

qual

segundo

formante

se

torna

progressivamente mais baixo para cada uma das vogais nessa srie. Deveria
ser notado, entretanto, que esse um mtodo muito rustico de verificar uma
das frequncias bsicas associadas a uma vogal. Quando sussurramos cada
uma das quatro primeiras palavras dessa srie, heed, hid, etc., a entonao do
som sussurrado provavelmente corresponde mais ou menos a frequncia do
segundo formante; mas para as ultimas quatro palavras, quando dois
formantes esto muito prximos, e a amplitude do mais baixo relativamente
maior, a entonao sussurrada pode corresponder mais ao primeiro formante
do que ao segundo.
No prximo captulo ns iremos fazer uma considerao mais detalhada
dos relacionamentos entre as frequncias dos formantes e os formatos do trato
vocal. Aqui iremos notar algumas tendncias gerais que podem ser vistas
comparando os diagramas do trato vocal mostrado na figura 7.5 com os
espectros correspondentes. No geral, frequncias formantes dependem de trs
fatores: a posio do ponto mximo de compresso do trato vocal (que
controlado pelo movimento de vai e vem da lngua), o tamanho ou a rea
transversal da compresso mxima (que controlada pelos movimentos de
aproximao e afastamento da lngua do cu da boca e do fundo da garganta)
e a posio dos lbios.
Para as vogais como as vistas em heed, hid, head, e had, a causa
principal da variao na frequncia do primeiro formante a variao do
tamanho da compresso mxima no trato vocal. A lngua est prxima do cu
da boca na palavra heed; e para cada uma das outras palavras, est um pouco
mais perto. Como uma regra grosseira, podemos dizer que para as vogais
desse tipo, enquanto a rea transversal da compresso mxima aumenta, a
frequncia do formante mais baixo aumenta. Para as vogais como aquelas em
hod, hawed, hood, e whod, a variao na frequncia do primeiro formante
em grande parte determinada pela posio do ponto de mxima compresso.

Nessas vogais a compresso est na faringe ou na parte anterior da boca, e


durante essa srie ela se move progressivamente para frente. Assim como o
ponto de mxima compresso se move cada vez mais da glote, o tamanho do
corpo de ar atrs da compresso se torna maior e a frequncia do primeiro
formante diminui. As variaes na frequncia do segundo formante tambm se
do devido ao arredondamento dos lbios. Contudo, alm disso, esse
movimento um decrscimo na amplitude do segundo e maior pico. Na srie de
palavras heed, hid, head, had, hod, hawed, hood, whod, os lbios se tornam
progressivamente mais arredondados. Nas quatro ultimas palavras o
movimento dos lbios mais do que o movimento da lngua que causa a
diminuio da frequncia do segundo pico de ressonncia. Perceba que o
aumento no arredondamento dos lbios tambm contribui para o decrscimo
nas amplitudes relativas do segundo e terceiro picos nas ultimas quatro
palavras nessa srie.
Muitos outros sons da fala so formados de forma semelhante a das
vogais que temos descrito. Por exemplo, os sons nasais, como aqueles nos
fins das palavras ram, ran, e rang, e laterais, como os dos princpios e finais
das palavras little e lull, tambm dependem dos pulsos das pregas vocais
colocando o ar no trato vocal em vibrao. Para cada um desses sons h
posies caractersticas dos rgos vocais, e consequentemente uma curva de
ressonncia tpica pode ser associada a cada um deles. Durante a pronuncia
do ultimo som da palavra ram, por exemplo, os rgos vocais esto dispostos
como mostrado na figura 7.9. Os lbios esto fechados, mas a passagem de ar
atravs do nariz est aberta. Esse formato em particular do trato vocal tem uma
curva de ressonncia como a mostrada na figura 7.10. As maiores ondas
amortecidas que so tpicas deste som tem frequncias bsicas de cerca de
220 Hz e 2.500 Hz. Cada um dos sons nasais caracterizado por um
componente grande de baixa frequncia.
Nas vogais do ingls, nasais, laterais, a principal fonte de energia
acstica a produo de pulsos pelas cordas vocais. Mas a corrente de ar dos
pulmes pode ser utilizada para formar sons de outras formas. Um som de fala
tpico no qual as pregas vocais no esto em ao acontece no inicio da
palavra sip. Quando dizemos essa palavra, comeamos elevando a lngua de

modo que fique prxima a parte superior traseira dos dentes frontais, formando
uma abertura estreita atravs da qual o ar dos pulmes forado. O jato de ar
formado por esse sulco na lngua rebate nas bordas dos dentes com uma
velocidade alta. Como resultado, h muitas pequenas variaes semialeatrias na presso do ar que, tomadas em conjunto, constituem o sibilo de
alta frequncia que associamos com [s]. Formas de ondas no-repetitivas
similares acontecem na pronuncia dos sons mudos em shin, thin e fin.
Alguns sons da fala so formados pela combinao de dois mecanismos
que j discutimos antes. Assim, o som no inicio da palavra zoo, por exemplo,
o resultado de colocar o ar no trato vocal em vibrao pelos pulsos das cordas
vocais e ao mesmo tempo gerar variaes adicionais na presso do ar
forando o ar atravs de um canal estreito como o que produz o som do [s]. Os
sons nos inicios da palavra vat e that tambm so formados pela combinao
desses dois mecanismos acsticos.
Outro dos sons do Ingls que interessante discutir o som que
geralmente escrito com a letra h. Nesse som, as pregas vocais no esto em
ao como quando esto quando dizemos uma vogal; nem qualquer outro tipo
de energia acstica gerada por forar o ar atravs de uma abertura estreita.
Em vez disso, o ar dos pulmes tem uma passagem relativamente livre atravs
do trato vocal. Mas onde quer que uma corrente de ar passe atravs das
cavidades vocais, algumas pequenas variaes na presso do ar sero
causadas pelas superfcies irregulares que obstruem o fluxo; e essas variaes
de presso sero suficientes para produzir ligeiras variaes da massa de ar
no trato vocal. Assim como as posies dos articuladores durante o som [h] so
semelhantes aqueles dos sons circundantes, como nas vogais adjacentes, os
componentes da frequncia do som [h] tm amplitudes relativamente
semelhantes aquelas dessas vogais; mas a onda complexa tem uma amplitude
menor e no tem frequncia fundamental, porque no gerada por pulsos
regulares das cordas vocais.
At agora no temos discutido um conjunto importante de sons, aqueles
no inicio e finais das palavras pip, bib, tit, did, kick e gig. Obviamente que as
consonantes dessas palavras deviam ser pensadas no como sons por elas

mesmas, mas como modos de comear e terminar as vogais. Cada uma delas
envolve uma mudana abrupta na forma da onda associada com a vogal.
As consonantes nas palavras pip, tit, e kick so distinguidas daquelas
em bib, did e gig pela ao das cordas vocais. No ultimo grupo as pregas
vocais comeam gerando pulsos mais cedo na articulao de cada palavra, e
continuam fazendo por mais tempo do que o das do primeiro grupo. Dentro de
cada grupo as palavras so parcialmente distintas uma da outra pelas
diferenas no formato do trato vocal. Durante a palavra gig, por exemplo, a
lngua no est em momento algum em qualquer das posies em que ela
passa durante a pronuncia da palavra did. (Se voc quiser verificar isso, tente
dizer a sentena: Did he get his gig? Voc provavelmente ver que em
nenhum momento durante a primeira palavra a ponta da lngua est atrs dos
dentes frontais mais baixos, onde ela est do comeo ao fim da ultima palavra;
e durante toda a ultima palavra a parte de trs da lngua elevada para frente
do vu palatino, onde na primeira palavra ela est relativamente plana na
boca). Essas diferenas no formato do trato vocal afetam as vogais em cada
uma dessas palavras; e o formato do trato vocal enquanto se move para ou de
uma posio para a ocluso consonantal tambm resulta nos sons
acompanhantes terem qualidades caractersticas. Ns associamos essas
diferenas com as diferentes consoantes no inicio e finais dessas palavras.

Fig. 7.1: a forma de onda produzida quando o autor pronunciou a vogal [c]
como em caught.
Fig. 7.2: a forma de onda produzida quando o autor pronunciou a vogal [i] como
em see.
Ig. 7.3: duas repeties de cada uma das ondas amortecidas. Quando essas
trs formas de onda so juntas, elas produzem uma onda sonora um pouco
parecida como aquela do [i] em see.
Fig. 7.4: formas de ondas e espectros para uma vogal sintetizada semelhante a
vogal [c] como em caught. (a) efeito de um pulso simples no sistema

ressonador. (b) pulsos ocorrendo na taxa de 100 por segundo. (c) 120 pulsos
por segundo. (d) 150 pulsos por segundo.
Fig. 7.5: a posio dos rgos vocais (baseadas em dados de fotografias de
raio-x do autor) e os espectros dos sons voclicos no meio das palavra heed,
hid, head, had, hod, hawed, hood, whod na fala do autor.
Fig. 7.6: a forma de onda e o espectro de um pulso gltico tpico com uma
frequncia fundamental de 200 Hz.
Fig. 7.7: a viso da produo fonte-filtro de uma vogal.
Fig. 7.8: um espectrograma esquemtico mostrando as frequncias do primeiro
e segundo formantes de algumas das vogais inglesas pronunciadas pelo autor.
Fig. 7.9: a posio dos rgos vocais durante o [m] de ram.
Fig. 7.10: a curva de ressonncia do trato vocal durante a pronuncia do ultimo
som na palavra ram.

Você também pode gostar