Acústica Da Voz Cantada

I Seminrio Msica Cincia Tecnologia: Acstica Musical
UMA INTRODUO ACSTICA DA VOZ

CANTADA
Maurlio Nunes Vieira
Departamento de Fsica/ICEx/UFMG
e-mail: maurilio@fisica.ufmg.br
Resumo: Este artigo dedicado queles no-familiarizados com as cincias exatas, mas que tm interesse na
acstica da voz e do canto. Ele faz uma breve introduo ao modelo Fonte-Filtro da produo de vogais e o
utiliza no estudo de alguns aspectos do canto lrico feminino, do canto lrico masculino, do canto harmnico e
do vibrato vocal. O texto foi escrito de forma sucinta, mas valendo-se de detalhamento nas figuras e em suas
legendas.
1. ACSTICA DA PRODUO DA FALA

A fala humana utiliza sons produzidos de diversas maneiras. As consoantes fricativas, como o
[f] e o [s], so articuladas com um estreitamento na passagem do ar. Este estreitamento ocorre entre
o lbio inferior e os dentes superiores, no [f], e entre a lngua e o alvolo, no [s]. Para gerar o rudo de
frico caracterstico das fricativas, h um aumento na presso expiratria, o que torna o fluxo
turbulento. J nas consoantes plosivas, ou oclusivas (e.g., [p] ou [t]), o som criado, como os nomes
sugerem, pela rpida liberao de uma massa de ar comprimida em uma cavidade intraoral. Em
vogais, por sua vez, o som produzido exclusivamente pela fonao, ou vozeamento, isto , pela
vibrao das pregas vocais. Esta vibrao, que pode ser percebida apalpando-se o pescoo, tambm
ocorre em consoantes vozeadas ([v], [z], etc.) e o trao distintivo entre pares como [s][z], [f][v], ou
[p][b]. H outras categorias de sons na fala (veja, e.g., Stevens, 1998; Kent & Read, 1992), mas o
restante deste texto aborda apenas a produo das vogais orais e sua utilizao na interpretao
acstica de alguns fenmenos da voz cantada.
O painel superior da Fig. 1 destaca as caractersticas anatmicas mais relevantes na acstica
das vogais. Sucintamente, h, durante a expirao, uma interao entre o ar proveniente da traquia
(T) e as pregas vocais, que vibram. Esta vibrao a fonte sonora que injeta pulsos de ar
periodicamente na cavidade oral. Nas vogais orais, o trato nasal est acusticamente desacoplado
devido elevao do vu palatino (P) e a forma do trato vocal determinada pela lngua, lbios,
mandbula e posio vertical da laringe. As cavidades orais interagem sobre o som da vibrao das
pregas vogais, modificando-o de uma maneira especfica para cada vogal. Por fim, o som resultante,
filtrado pelo trato vocal, propaga-se dos lbios para o ambiente externo.
O processo descrito acima est esquematizado na parte inferior da Fig. 1, que apresenta o
modelo Fonte-Filtro da produo de vogais (Fant, 1970). Este modelo separa os fenmenos acsticos
em trs partes supostamente independentes: a fonte sonora, o filtro acstico e a irradiao. A
separao entre fonte e filtro justificada porque a abertura (glote) por onde o ar flui entre as pregas
vocais muito menor que a seo transversal das cavidades supraglticas.
- 70 -
Figura 1: Aparelho Fonador e o modelo Fonte-Filtro. Acima: Estrutura anatmica do trato vocal. A elevao do
prtico velofarngeo (P) desacopla as cavidades nasais. Note a proximidade da entrada do esfago (E) com a
regio das pregas vocais, situadas acima da traquia (T). Os pulsos gerados na fonao so filtrados pelas
cavidades acsticas do trato vocal, e propagam-se pelo ar. Na irradiao, como sugere o desenho, parte do som
(baixas freqncias) espalha-se enquanto outra parte (altas freqncias) propaga-se para frente. Abaixo
(adaptado de Fant, 1970): modularizao introduzida pelo modelo Fonte-Filtro (em alguns espectros h divises
em intervalos de 6 dB, no eixo vertical, e em oitavas, no horizontal). A fonte representada por uma srie
harmnica, o filtro por formantes (F1, F2, etc.), e a irradiao pela sua caracterstica passa-altas. Comparandose o oscilograma do fluxo com o da presso sonora vm-se, de forma desordenada, as ondulaes introduzidas
pelos formantes, mas, no espectro da presso irradiada, distingue-se cada um dos formantes.
O modelo Fonte-Filtro utiliza uma descrio dos fenmenos acsticos no domnio das
freqncias. O filtro oral caracterizado por picos (F1, F2, F3 e F4, na Fig. 1) no espectro de
freqncias. Estes picos, que correspondem aos modos normais dos tubos acsticos, so
tradicionalmente chamados de formantes. Os trs primeiros formantes (F1, F2 e F3) tm menor
dependncia com o locutor e prestam-se, principalmente, para diferenciar as vogais. Os formantes
superiores (F4, F5, etc.), por outro lado, tm menor contedo lingstico e maior variao com o
locutor. Acusticamente, os formantes amplificam seletivamente os harmnicos gerados pela vibrao
larngea.
Para compreender as caractersticas do espectro da fonte sonora importante discutir a
vibrao das pregas vocais. Cada prega (Fig. 2) uma dobra de tecidos que, mecanicamente,
comporta-se como um corpo (msculo e ligamento) relativamente rgido e pesado, revestido por uma
cobertura (tecido conjuntivo e epitelial) flexvel (Hirano, 1981). O fluxo areo modulado medida
que o espao entre as pregas vocais aberto e fechado ciclicamente, de acordo com a deformao
da camada de cobertura (Fig. 3). A vibrao gltica d-se de forma aproximadamente peridica, mas
a velocidade do fechamento de cada ciclo maior que a velocidade de abertura. Assim, o fluxo
inclinado para a direita. Se os pulsos glticos fossem perfeitamente senoidais, haveria apenas uma
- 71 -

componente harmnica e no haveria excitao de mltiplos formantes, no sendo possvel a
produo de vogais diferentes. Devido assimetria do pulso, o espectro passa a possuir no apenas
a componente fundamental, F0, mas uma srie harmnica (painel inferior, esquerda, da Fig. 1)
onde a freqncia de cada termo um mltiplo inteiro de F0. Para a voz modal, esta que a quase
totalidade das pessoas utiliza na conversao normal, a amplitude dos termos da srie harmnica cai,
de forma aproximada, a uma proporo de 12 dB por oitava, isto , a amplitude do harmnico de
ordem n apenas 25% da amplitude do harmnico de ordem n/2. Ajustando-se a musculatura
larngea possvel gerar-se outras vozes (e.g., falsete, fry) com caractersticas acsticas e
perceptivas marcadamente diferentes da voz modal (Fig. 4).
Figura 2: Pregas vocais. Acima (de Sdersten & Lindestad, 1992): endoscopia oral (direita) e nasal (esquerda).
Abaixo, esquerda: viso endoscpica das pregas vocais (PV). As linhas tracejadas indicam a posio das
pregas sob a epiglote (E). Abaixo, direita: corte transversal de uma prega vocal, destacando as duas camadas
mais relevantes para a fonao: o corpo e a cobertura.
Ajustes
Prfonatrios
fechada
fluxo
abertura
fluxo
fechamento fechada
(+ rpido)
fluxo
t
1/F0
Figura 3: Ciclo fonatrio na voz modal (adaptado de Hirano, 1981). A partir da esquerda: as pregas vocais
esto inicialmente fechadas e, dependendo da freqncia e intensidade do som a ser produzido, tm ajustes prfonatrios adequados de presso subgltica, tenso longitudinal, aproximao da parte posterior das pregas
vocais e fora de compresso na parte medial. Com o esforo expiratrio e com a glote ainda fechada, a presso
intragltica aumenta enquanto as bordas inferiores afastam-se, acumulando energia potencial elstica na
camada de cobertura. Com o aumento da presso intragltica, as bordas superiores finalmente separam e o ar
flui pela glote. O fluxo de ar leva a uma queda na presso intragltica (Efeito Bernoulli) que ocorre num momento
em que as bordas inferiores esto muito comprimidas. Isto resulta numa fase de fechamento mais rpida que a
de abertura, causando uma assimetria na forma dos pulsos glticos. O ciclo repete-se na freqncia
fundamental F0. Os detalhes (a) e (b) mostram a oposio entre os sentidos dos movimentos das bordas
superiores e inferiores. Est diferena de fase est associada a uma onda (onda mucosa) que se propaga pela
cobertura das pregas vocais desde sua parte inferior at sua parte dorsal. Doenas que dificultam ou
interrompem o deslocamento deste movimento muco-ondulatrio podem levar rouquido.
- 72 -

Com relao irradiao, as baixas freqncias tendem a espalhar-se por difrao, enquanto
as altas freqncias propagam-se de forma mais direta. Em outras palavras, a presso sonora numa
regio mais distante do locutor tende a ter uma maior intensidade relativa nas altas freqncias.
Pode-se dizer, assim, que a irradiao equivalente a um filtro passa-altas. Este filtro pode ser
representado, de forma simplificada (Fig. 1), por um ganho de 6 dB/oitava, isto , a resposta dobra
(+6 dB) cada vez que a freqncia duplica (uma oitava). O estudo da irradiao sonora
relativamente complexo (e.g., Kinsler et al., 1982; Fant. 1970) e a simplificao acima, que
adequada at cerca de 6 kHz, vem da analogia com um pisto (a massa de ar entre os lbios)
vibrando frente de uma esfera refletora (a face).
Tendo apresentado as vrias facetas do modelo Fonte-Filtro para a produo de vogais, as
discusses seguintes aplicaro estes conceitos a situaes de interesse na voz cantada.
Falsete
Amplitude Relativa (dB)
Modal
Cochicho
Fry/Creak
Modal
0
-12 dB/oitava
-12
-24
-36
Falsete
0 1 2 3 4 5 6 7 8 9
(F0)
Freqncia (n.F0)
-18 dB/oitava
-12
-24
-36
0
(F0)
Fry (Crepitao)
0
subharmnico
-12 dB/oitava
-12
-24
-36
0 1 2 3 4 5 6 7 8 9
(F0)
Freqncia (n.F0)
Freqncia (n.F0)
Figura 4: Ajustes larngeos e qualidade da voz. Acima, esquerda (baseado em Beck, 1988): formato da
prega vocal em diversos ajustes larngeos. Tomando-se a voz modal como referncia e seguindo a descrio de
Laver (1981), h, no falsete, grande aumento na tenso longitudinal (LT) e, conseqentemente, em F0; uma
fenda gltica comum neste ajuste. No fry ou creak (denominado crepitao, pelos fonoaudilogos, ou voz
rangida, por alguns lingistas), h grande reduo na tenso longitudinal e na presso subgltica, mas h
aumento na compresso medial (MC), resultando num som mais grave, com aperiodicidade e subharmnicos.
No cochicho, a falta de aproximao ou aduo (AD) na parte posterior da glote resulta numa fenda onde
gerado um rudo de frico; neste ajuste, no h vibrao das pregas vocais. Demais grficos (baseados em
Klatt & Klatt, 1990): principais caractersticas acsticas de ajustes larngeos, destacando as mudanas na
freqncia fundamental e na envoltria dos termos da srie harmnica.
2. SINTONIA F1-F0 NO CANTO LRICO FEMININO

O canto lrico feminino requer sons bem mais agudos que os utilizados para a conversao.
Enquanto o valor mdio de F0 na fala feminina adulta est em torno de 220 Hz, as notas emitidas por
uma soprano podem estar prximas a 1024 Hz (d5). No canto, porm, medida que a fundamental
aumenta, aumenta tambm o espaamento entre os termos da srie harmnica gerada na laringe,
diminuindo a concentrao de harmnicos em torno dos formantes e perdendo-se os ganhos da
ressonncia com os formantes.
A Fig. 5 ilustra o problema. Hipoteticamente, uma soprano est emitindo uma nota em 500 Hz,
mas o harmnico fundamental est entre o primeiro e o segundo formantes da vogal articulada ([u]).
Desta forma, a amplitude do harmnico fundamental relativamente pequena e a voz tem pouca
audibilidade. A tcnica utilizada para aumentar a amplitude do harmnico fundamental ajustar o
- 73 -

primeiro formante (F1), fazendo-o coincidir com F0, atravs do abaixando da mandbula, gesto que
tem certa seletividade sobre F1 (Lindblom & Sundberg, 1971). Com isso, o harmnico fundamental
aumenta pela ressonncia com F1, resultando num ganho na audibilidade da voz sem que haja
aumento na energia utilizada na fonao.
Figura 5: Sintonia F1-F0. Esquerda: aumento na amplitude do harmnico fundamental, F0, pelo deslocamento
do primeiro formante, F1. Direita (adaptado de Rossing, 1990): representao de vogais no plano F1xF2; as
elipses indicam valores mdios de formantes e a rea pontilhada a regio da freqncia fundamental de
sopranos: d4 (C4) a d6 (C6), aproximadamente). As demais vogais, no representadas, ocupam regies
intermedirias do plano, com superposies de reas.
Como descrito por Fant (1986), outro benefcio da sintonia F1-F0 uma diminuio no
consumo de ar devido a um grande aumento na presso intraoral prximo ao instante de mxima
abertura gltica. Este aumento de presso supragltica reduz o fluxo, mas no afeta a velocidade de
fechamento.
O preo que se paga pela sintonia F1-F0 uma perda na inteligibilidade das vogais. Segundo
Di Carlo (1994), que estudou as vogais do Francs, somente as vogais nasais e as orais [e], [] e [o]
so nitidamente individualizadas para notas emitidas entre o f3 e o l3 (350-440 Hz), que ela
denomina zona de tolerncia; entre o l3 e o mi4 (440-659 Hz), zona de inteligibilidade eletiva,
somente [i] e [a] so diferenciados; acima do mi4, zona de no-inteligibilidade absoluta, no se pode
distinguir uma vogal das outras.
No canto lrico, no apenas de sopranos, outras distores nos valores de formantes podem
ocorrer. Os ajustes utilizados para alargar o trato vocal e diminuir a tenso da musculatura buco-facial
no s alteram as ressonncias como tambm limitam a amplitude dos gestos articulatrios,
reduzindo as excurses temporais dos formantes, particularmente F1, que so elementos importantes
da inteligibilidade (Di Carlo, 1194). Esta autora lembra ainda que consoantes mal articuladas pelo
prolongamento excessivo das vogais tambm colaboram para a reduzir a inteligibilidade.
3. FORMANTE DO CANTOR CANTO LRICO MASCULINO

No canto lrico masculino as freqncias mais agudas esto em torno do mi3 (330 Hz) para
baixos, sol3 (392 Hz) para bartonos e d4 (523 Hz) para tenores, ao passo que o F0 mdio na voz
falada masculina de 120 Hz. Assim, ao longo da tessitura dos cantores, h menor possibilidade de
o harmnico fundamental localizar-se fora da regio de ao do primeiro formante.
Os problemas no canto masculino surgem pelo ofuscamento da voz pelo som da orquestra. A
tcnica lrica vale-se, contudo, de ajustes h muito observados em cantores de pera (e.g.,
Barhlomew, 1933), cujas vozes apresentam um pico espectral intenso e largo em torno de 3 kHz (Fig.
6). Este pico eleva a amplitude relativa dos harmnicos a situados, destacando a voz sobre o som da
orquestra. A produo deste pico, denominado formante do cantor, est relacionada com o
abaixamento da laringe e o alargamento da cavidade farngea, embora esta no seja o nico
mecanismo existente (Sundberg, 1979). Como descrito por este autor, o formante do cantor uma
aglutinao dos formantes superiores (F3, F4 e F5) devido s manobras citadas. No jargo dos
cantores, esta tcnica recebe nomes como impostao ou projeo.
- 74 -
Amplitude relativa (dB)

cantor + orquestra
orquestra
fala
Freqncia (Hz)
Figura 6: Formante de cantor. Espectros mdios de longo prazo. Sem o recurso do formante do cantor (regio
escura), os sons da fala so mascarados pela orquestra. Com o abaixamento da laringe e o alargamento da
regio supragltica, o formante do cantor criado prximo a 3 kHz. Adaptado de Sundberg (1979).
Assim como na sintonia F1-F0 das sopranos, o formante do cantor propicia um aumento na
audibilidade da voz sem aumento no esforo fonatrio. Alm disso, como lembra Sundberg (1979), h
outras conseqncias favorveis. Primeiro, a regio de 3 kHz tambm coincide com a regio mais
sensvel da percepo auditiva humana (onde ocorre uma ressonncia com a cavidade do meato
acstico do ouvido), sendo amplificada ainda mais pelo processamento auditivo perifrico. Segundo,
tendo-se em mente o comportamento passa-altas da irradiao sonora, os harmnicos de alta
freqncia propagam-se mais eficientemente em linha reta, o que pode auxiliar a platia a discriminar
melhor a voz do cantor no palco.
4. CANTO HARMNICO
O recurso de destacar harmnicos utilizado com maestria numa tcnica de canto de regies
asiticas, incluindo a Monglia, o Tibet e a Sibria (Levin & Edgerton, 1999). Chamada de canto
harmnico (harmonic chant/singing), este estilo possui outras denominaes que fazem aluso a
sobretons (overtone singing) ou garganta (throat singing). A primeira sensao que se tem ao ouvir
esta manifestao artstica de certo espanto, por tratar-se de algo extico, e vrios ouvintes custam
a admitir tratar-se de um som produzido por uma nica pessoa.
Neste estilo (Fig. 7), o cantor emite um som larngeo com uma freqncia fundamental baixa
(70-100 Hz) que permanece praticamente constante. Porm, refinando os ajustes utilizados na
produo de vogais, ele consegue criar uma pequena cavidade intraoral que atua como um superformante de elevada amplitude e largura de faixa to pequena que capaz de destacar um nico
harmnico do espectro larngeo. O cantor altera com preciso a forma da cavidade, mudando a
freqncia do formante e, literalmente, pina harmnicos no espectro, criando uma seqncia
meldica aguda que evolui sobre uma base grave. Detalhes sobre alguns ajustes articulatrios,
arquivos de vdeo e udio so disponveis nos suplementos de Levin & Edgerton (1999).
A Fig. 7 mostra um exemplo de canto harmnio da regio de Tuva, na Sibria. No
espectrograma de banda estreita, as linhas horizontais paralelas representam a evoluo temporal da
srie harmnica; quanto mais escura a linha, mais intenso o harmnico. No incio do espectrograma,
o cantor utiliza uma voz sem os recursos do canto harmnico, como mostra a seo espectral A,
onde vrios formantes convencionais podem ser vistos. Assim que a tcnica do canto harmnico
introduzida, um harmnico de alta freqncia (seta) passa a destacar-se no espectro. Os harmnicos
o
o
utilizados esto entre o 6 e o 12 , mas, como a sintaxe musical da regio favorece melodias
o
o
pentatnicas, o 7 e 11 harmnicos so evitados (Levin & Edgerton, 1999).
- 75 -

dB
F1
F2
dB
Hz
Hz
B
1 kHz
12
Frequncia (Hz)
F3
10
8
6
2s
Canto normal
Canto Harmnico
tempo (s)
Figura 7: Canto harmnico. Na parte inicial, a tcnica do canto harmnico no utilizada. A seo espectral A
mostra os formantes caractersticos da fala. Com o uso do canto harmnico, um harmnico (setas) destaca-se,
o
o
como visto ao longo do espectrograma e na seo B. Os harmnicos selecionveis esto entre o 6 e o 12 ,
o
o
mas o 7 e o 11 no so utilizados devido s escalas pentatnicas. O detalhe C indica uma ocorrncia de
vibrato. Elaborado com gravaes de Levin & Edgerton (1999).
Este estilo tambm utiliza recursos fonatrios especiais e por isso tambm denominada
khoomii, palavra monglica para garganta. Os ajustes larngeos adotados tm semelhanas com o
fry (Fig. 4). Com isso, alm do baixo valor de F0, consegue-se uma maior velocidade de fechamento
(que amplifica os harmnicos superiores) e uma diminuio da fase aberta de cada ciclo gltico (que
diminui o consumo de ar e evita perda de energia pelo acoplamento com o trato vocal subgltico); as
falsas pregas tambm podem ser utilizadas vibrando numa freqncia sub-mltipla de F0 (Levin &
Edgerton, 1999).
No espectrograma da Fig. 7 v-se, no detalhe C, que as linhas horizontais no so retas, mas
ondulam ao longo do tempo. Estas ondulaes so conseqncias do vibrato, que ser discutido a
seguir.
5. VIBRATO VOCAL
O vibrato uma variao regular na freqncia de uma nota comumente utilizado na msica
(Fig. 8). Perceptivamente, sua qualidade depende de trs parmetros mensurveis: a taxa, a
profundidade e a regularidade. A taxa (F = 1/T) o nmero de ciclos por segundo; a profundidade,
amplitude ou extenso (F0), o desvio da freqncia em torno de ser valor mdio, enquanto a
regularidade carece de um parmetro para medio, mas, desejavelmente, deve ter um aspecto
senoidal. No bel canto, a taxa aceitvel do vibrato varia de 5,5 Hz a 7,5 Hz e a profundidade vai de
6% a 12%, ou seja, de aproximadamente 1 a 2 semitons (Sundberg, 1987).
- 76 -
Fs
16
14
Fi
500 Hz
12
10
8
6
Frequncia (Hz)
0,2 s
2
F0
tempo (s)
Figura 8: Vibrato. Espectrograma de banda estreita mostrando as ondulaes introduzidas em toda a srie
harmnica devido ao vibrato. Os nmeros crescentes esquerda da figura (2, 4, 6, ...) so a ordem do
o
harmnico. O perodo do vibrato T 0,19 s e a taxa F = 1/0,19 s = 5,3 Hz. O 15 utilizado para medir a
amplitude do vibrato: sua freqncia inferior Fi = 2080 Hz e a superior Fs = 2280 Hz. O valor mdio de F0
1/2 (2280 + 2080)/15 = 145,3 Hz e a amplitude do vibrato 1/2 (2280 2080)/15 = 6,67 Hz, ou seja, 4,6% de
F0, que equivale a 0,8 semitons (vide texto principal).
A taxa e a profundidade do vibrado podem ser medidas em espectrogramas de banda estreita

(Fig. 8) utilizando-se algum software que disponha de escalas e/ou cursores com resoluo
adequada. A leitura da durao do ciclo (T) imediata, mas, para estimar profundidade, difcil obterse resoluo adequada medindo-se diretamente a freqncia do harmnico fundamental. Porm,
para um harmnico de ordem elevada, podem-se obter valores de freqncia mxima e mnima com
erros menores, e a profundidade do vibrato (valor de pico) pode ser expressa, em semitons, por:
F0
2Fs
= 17,31 ln
[semitons],
Fs + Fi
onde Fs e Fi so, respectivamente, os valores superior e inferior da freqncia de um harmnico

qualquer. No exemplo da Fig. 8, Fs 2280 Hz, Fi 2080, donde F0 0,8 semitons. Tendo-se em
mente que o semitom da escala igualmente temperada equivale a uma relao entre freqncias de
12
2 = 1,059... 6%, a amplitude do vibrato pode ser calculada sem o uso de logaritmos, obtendo-se
F0 em valor percentual e obtendo-se a frao do semitom. No caso (vide legenda da Fig. 8), F0 =
6,7/145,3 = 4,6% e a amplitude do vibrato 4,6%/6% = 0,8 semitons.
No canto, o vibrato produzido modulando-se a tenso da musculatura larngea responsvel
pela tenso e enrijecimento das pregas vocais (msculos cricotireideos e tiroaritenideos,
respectivamente); tambm fisiologicamente possvel produzir o vibrato variando-se a presso
subgltica (que resulta em maior deslocamento lateral das pregas vocais e, conseqentemente, na
elevao de sua tenso mdia), mas esta parece no ser a tcnica natural de cantores experientes
(Sundberg, 1979; Titze, 1994).
O vibrato produzido por variao da presso pulmonar revela um mecanismo de
interdependncia entre a amplitude (causa) e a freqncia (efeito). Por outros motivos, ocorre uma
situao reversa no vibrato larngeo, isto , variaes em F0 causam variaes na amplitude da
presso sonora. Como ilustrado na Fig. 9, isto ocorre porque a amplitude dos harmnicos aumenta e
diminui medida que suas freqncias oscilam em torno dos formantes, particularmente de F1, que
o formante de maior amplitude (Sundberg, 1979).
A regularidade do vibrato um aspecto que tem recebido ateno nos ltimos anos (e.g., Diaz
& Rothman, 2002). A regularidade pode ser analisada fazendo-se uma anlise espectral da srie
temporal de valores de F0, como ilustrado na Fig. 9. Este mtodo pode ser adaptado para criar um
espectrograma do vibrato e avaliar a dinmica temporal dos ajustes.
- 77 -
Figura 9: Espectro da regularidade do vibrato. Esquerda: voz com vibrato regular, taxa de aproximadamente
5,5 Hz e amplitude de 0,70 semitons. Direita: vibrato irregular e de baixa amplitude, apresentando dois picos
maiores em 4,2 e 8,4 Hz. Os grficos foram obtidos rastreando-se F0 a cada 20 ms, extraindo-se a mdia da
srie temporal, passando por um filtro passa-altas com corte em 3 Hz e calculando-se a Transformada Discreta
de Fourier em 100 pontos.
6. CONCLUSO
Este artigo abordou, de forma introdutria, o modelo Fonte-Filtro da produo da voz e sua
utilizao no estudo de alguns aspectos da voz cantada. A arte do canto tem estado frente da
cincia, mas aos poucos, a acstica vem explicando fenmenos que professores de canto conhecem
h sculos. Com o avano da tecnologia, o uso no s de registros acsticos, mas de sinais
aerodinmicos (fluxo areo e presso sonora) e eletroglotogrficos, tende a tornar-se um forte aliado
compreenso e evoluo das tcnicas de canto, como tem ocorrido na fonoaudiologia e na
otorrinolaringologia (e.g., Hirano, 1981; Vieira, 1997; Vieira et al., 2002). Estas especialidades
mdicas, alis, tm tido crescente interesse no estudo da voz cantada visando o aprimoramento do
tratamento de problemas vocais em cantores profissionais. Cabe aqui uma palavra de precauo. A
facilidade atual de acesso a equipamentos de gravao e a softwares para a anlise automtica da
voz (com resultados no-necessariamente confiveis) no deve ocultar a necessidade de
conhecimentos sobre os fenmenos bsicos da acstica, as tcnicas de gravao e os mtodos de
anlise de sinais.
7. REFERNCIAS
Bartholomew, W. T. (1933). A physical definition of good voice-quality in the male voice. Journal of the Acoustical Society of
America 6, pp. 25-33.
Beck, J. M. (1988). Organic Variation and Voice Quality. Ph.D. Thesis (University of Edinburgh).
Diaz, J. A. & Rothman, H. B. (2002). Acoustical comparison between samples of good and poor vibrato in singers. Journal of
voice 17, pp. 179-184.
Di Carlo, N. S. (1994). Lintelligibilit de la voix chante. Medicine des Art 10, pp. 2-15.
Fant, G. (1970). Acoustic Theory of Speech Production. Mouton, The Haugue.
Fant, G. (1986). Glottal flow: models and interaction. Journal of Phonetics 14, pp. 393-399.
Hirano, M. (1981). Clinical Examination of Voice. Springer-Verlag, New York.
Kent, R. D. & Read, C. (1992). The Acoustic Analysis of Speech. Singular, San Diego.
Kinsler, L. E., Frey, A. R., Coppens, A. B. & Sanders, J. V. (1982). Fundamentals of Acoustics (Third Edition). John Wiley &
Sons, New York.
Klatt, D. H. & Klatt, L. C. (1990). Analysis, synthesis, and perception of voice quality variations among female and male talkers.
Journal of the Acoustical Society of America 87, pp. 820-857.
Laver, J. (1981). The Phonetic Description of Voice Quality. Cambridge University Press.
Levin, T. C & Edgerton, M. E. (1999). The throat singers of Tuva. Scientific American 281(3), pp. 80-82 + s.
Lindblom, B. E. F. & Sundberg, J. E. F. (1971). Acoustical consequences of lip, tongue, jaw, and larynx movements. Journal of
the Acoustical Society of America 50, pp. 1166-1179.
nd
Rossing, T. (1990). The Science of Sound, 2 . Edition. Addison Wesley.

Sdersten, M. & Lindestad, P. A. (1992). A comparison of vocal fold closure in rigid telescopic and flexible fiberoptic
laryngostroboscopy. Acta Otolaryngologica (Stockholm) 112, pp. 144-150.
Stevens, K. N. (1998). Acoustic Phonetics. The MIT Press, Cambridge.
- 78 -

Sundberg, J. (1979). Perception of singing. Speech Transmission Laboratory Quarterly Progress and Status Report 1 (Royal
Institute of Technology, Stockholm) pp. 1-48.
Sundberg, J. (1987). The Science of the Singing Voice. Dekalb, Illinois.
Sdersten, M. & Lindestad, P. A. (1992). A comparison of vocal fold closure in rigid telescopic and flexible fiberoptic
laryngostroboscopy. Acta Otolaryngologica (Stockholm) 112, pp. 144-150.
Titze, I. R. (1994). Principles of Voice Production. Prentice-Hall, Englewood Cliffs.
Vieira, M. N. (1997). Automated Measures of Dysphonias and the Phonatory Effects of Asymmetries in the Posterior Larynx,
Ph.D Thesis, University of Edinburgh, UK.
Vieira, M. N., McInnes, F. R., & Jack, M. (2002). On the influence of laryngeal pathologies on acoustic and electroglottographic
jitter measures. Journal of the Acoustical Society of America 111, pp. 1045-1055.
- 79 -

Acústica Da Voz Cantada

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Acústica Da Voz Cantada

Enviado por

Direitos autorais:

Formatos disponíveis

I Seminrio Msica Cincia Tecnologia: Acstica Musical

UMA INTRODUO ACSTICA DA VOZ

1. ACSTICA DA PRODUO DA FALA

I Seminrio Msica Cincia Tecnologia: Acstica Musical

I Seminrio Msica Cincia Tecnologia: Acstica Musical

I Seminrio Msica Cincia Tecnologia: Acstica Musical

Amplitude Relativa (dB)

Amplitude Relativa (dB)

2. SINTONIA F1-F0 NO CANTO LRICO FEMININO

I Seminrio Msica Cincia Tecnologia: Acstica Musical

3. FORMANTE DO CANTOR CANTO LRICO MASCULINO

Amplitude relativa (dB)

I Seminrio Msica Cincia Tecnologia: Acstica Musical

I Seminrio Msica Cincia Tecnologia: Acstica Musical

I Seminrio Msica Cincia Tecnologia: Acstica Musical

A taxa e a profundidade do vibrado podem ser medidas em espectrogramas de banda estreita

onde Fs e Fi so, respectivamente, os valores superior e inferior da freqncia de um harmnico

I Seminrio Msica Cincia Tecnologia: Acstica Musical

Rossing, T. (1990). The Science of Sound, 2 . Edition. Addison Wesley.

I Seminrio Msica Cincia Tecnologia: Acstica Musical

Você também pode gostar