Você está na página 1de 10

I Seminrio Msica Cincia Tecnologia: Acstica Musical

UMA INTRODUO ACSTICA DA VOZ CANTADA


Maurlio Nunes Vieira
Departamento de Fsica/ICEx/UFMG e-mail: maurilio@fisica.ufmg.br

Resumo: Este artigo dedicado queles no-familiarizados com as cincias exatas, mas que tm interesse na acstica da voz e do canto. Ele faz uma breve introduo ao modelo Fonte-Filtro da produo de vogais e o utiliza no estudo de alguns aspectos do canto lrico feminino, do canto lrico masculino, do canto harmnico e do vibrato vocal. O texto foi escrito de forma sucinta, mas valendo-se de detalhamento nas figuras e em suas legendas.

1. ACSTICA DA PRODUO DA FALA


A fala humana utiliza sons produzidos de diversas maneiras. As consoantes fricativas, como o [f] e o [s], so articuladas com um estreitamento na passagem do ar. Este estreitamento ocorre entre o lbio inferior e os dentes superiores, no [f], e entre a lngua e o alvolo, no [s]. Para gerar o rudo de frico caracterstico das fricativas, h um aumento na presso expiratria, o que torna o fluxo turbulento. J nas consoantes plosivas, ou oclusivas (e.g., [p] ou [t]), o som criado, como os nomes sugerem, pela rpida liberao de uma massa de ar comprimida em uma cavidade intraoral. Em vogais, por sua vez, o som produzido exclusivamente pela fonao, ou vozeamento, isto , pela vibrao das pregas vocais. Esta vibrao, que pode ser percebida apalpando-se o pescoo, tambm ocorre em consoantes vozeadas ([v], [z], etc.) e o trao distintivo entre pares como [s][z], [f][v], ou [p][b]. H outras categorias de sons na fala (veja, e.g., Stevens, 1998; Kent & Read, 1992), mas o restante deste texto aborda apenas a produo das vogais orais e sua utilizao na interpretao acstica de alguns fenmenos da voz cantada. O painel superior da Fig. 1 destaca as caractersticas anatmicas mais relevantes na acstica das vogais. Sucintamente, h, durante a expirao, uma interao entre o ar proveniente da traquia (T) e as pregas vocais, que vibram. Esta vibrao a fonte sonora que injeta pulsos de ar periodicamente na cavidade oral. Nas vogais orais, o trato nasal est acusticamente desacoplado devido elevao do vu palatino (P) e a forma do trato vocal determinada pela lngua, lbios, mandbula e posio vertical da laringe. As cavidades orais interagem sobre o som da vibrao das pregas vogais, modificando-o de uma maneira especfica para cada vogal. Por fim, o som resultante, filtrado pelo trato vocal, propaga-se dos lbios para o ambiente externo. O processo descrito acima est esquematizado na parte inferior da Fig. 1, que apresenta o modelo Fonte-Filtro da produo de vogais (Fant, 1970). Este modelo separa os fenmenos acsticos em trs partes supostamente independentes: a fonte sonora, o filtro acstico e a irradiao. A separao entre fonte e filtro justificada porque a abertura (glote) por onde o ar flui entre as pregas vocais muito menor que a seo transversal das cavidades supraglticas.

- 70 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical

Figura 1: Aparelho Fonador e o modelo Fonte-Filtro. Acima: Estrutura anatmica do trato vocal. A elevao do prtico velofarngeo (P) desacopla as cavidades nasais. Note a proximidade da entrada do esfago (E) com a regio das pregas vocais, situadas acima da traquia (T). Os pulsos gerados na fonao so filtrados pelas cavidades acsticas do trato vocal, e propagam-se pelo ar. Na irradiao, como sugere o desenho, parte do som (baixas freqncias) espalha-se enquanto outra parte (altas freqncias) propaga-se para frente. Abaixo (adaptado de Fant, 1970): modularizao introduzida pelo modelo Fonte-Filtro (em alguns espectros h divises em intervalos de 6 dB, no eixo vertical, e em oitavas, no horizontal). A fonte representada por uma srie harmnica, o filtro por formantes (F1, F2, etc.), e a irradiao pela sua caracterstica passa-altas. Comparandose o oscilograma do fluxo com o da presso sonora vm-se, de forma desordenada, as ondulaes introduzidas pelos formantes, mas, no espectro da presso irradiada, distingue-se cada um dos formantes.

O modelo Fonte-Filtro utiliza uma descrio dos fenmenos acsticos no domnio das freqncias. O filtro oral caracterizado por picos (F1, F2, F3 e F4, na Fig. 1) no espectro de freqncias. Estes picos, que correspondem aos modos normais dos tubos acsticos, so tradicionalmente chamados de formantes. Os trs primeiros formantes (F1, F2 e F3) tm menor dependncia com o locutor e prestam-se, principalmente, para diferenciar as vogais. Os formantes superiores (F4, F5, etc.), por outro lado, tm menor contedo lingstico e maior variao com o locutor. Acusticamente, os formantes amplificam seletivamente os harmnicos gerados pela vibrao larngea. Para compreender as caractersticas do espectro da fonte sonora importante discutir a vibrao das pregas vocais. Cada prega (Fig. 2) uma dobra de tecidos que, mecanicamente, comporta-se como um corpo (msculo e ligamento) relativamente rgido e pesado, revestido por uma cobertura (tecido conjuntivo e epitelial) flexvel (Hirano, 1981). O fluxo areo modulado medida que o espao entre as pregas vocais aberto e fechado ciclicamente, de acordo com a deformao da camada de cobertura (Fig. 3). A vibrao gltica d-se de forma aproximadamente peridica, mas a velocidade do fechamento de cada ciclo maior que a velocidade de abertura. Assim, o fluxo inclinado para a direita. Se os pulsos glticos fossem perfeitamente senoidais, haveria apenas uma - 71 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical


componente harmnica e no haveria excitao de mltiplos formantes, no sendo possvel a produo de vogais diferentes. Devido assimetria do pulso, o espectro passa a possuir no apenas a componente fundamental, F0, mas uma srie harmnica (painel inferior, esquerda, da Fig. 1) onde a freqncia de cada termo um mltiplo inteiro de F0. Para a voz modal, esta que a quase totalidade das pessoas utiliza na conversao normal, a amplitude dos termos da srie harmnica cai, de forma aproximada, a uma proporo de 12 dB por oitava, isto , a amplitude do harmnico de ordem n apenas 25% da amplitude do harmnico de ordem n/2. Ajustando-se a musculatura larngea possvel gerar-se outras vozes (e.g., falsete, fry) com caractersticas acsticas e perceptivas marcadamente diferentes da voz modal (Fig. 4).

Figura 2: Pregas vocais. Acima (de Sdersten & Lindestad, 1992): endoscopia oral (direita) e nasal (esquerda). Abaixo, esquerda: viso endoscpica das pregas vocais (PV). As linhas tracejadas indicam a posio das pregas sob a epiglote (E). Abaixo, direita: corte transversal de uma prega vocal, destacando as duas camadas mais relevantes para a fonao: o corpo e a cobertura.

fluxo

fluxo

Ajustes Prfonatrios

fechada
fluxo

abertura

fechamento fechada
(+ rpido)

t
1/F0
Figura 3: Ciclo fonatrio na voz modal (adaptado de Hirano, 1981). A partir da esquerda: as pregas vocais esto inicialmente fechadas e, dependendo da freqncia e intensidade do som a ser produzido, tm ajustes prfonatrios adequados de presso subgltica, tenso longitudinal, aproximao da parte posterior das pregas vocais e fora de compresso na parte medial. Com o esforo expiratrio e com a glote ainda fechada, a presso intragltica aumenta enquanto as bordas inferiores afastam-se, acumulando energia potencial elstica na camada de cobertura. Com o aumento da presso intragltica, as bordas superiores finalmente separam e o ar flui pela glote. O fluxo de ar leva a uma queda na presso intragltica (Efeito Bernoulli) que ocorre num momento em que as bordas inferiores esto muito comprimidas. Isto resulta numa fase de fechamento mais rpida que a de abertura, causando uma assimetria na forma dos pulsos glticos. O ciclo repete-se na freqncia fundamental F0. Os detalhes (a) e (b) mostram a oposio entre os sentidos dos movimentos das bordas superiores e inferiores. Est diferena de fase est associada a uma onda (onda mucosa) que se propaga pela cobertura das pregas vocais desde sua parte inferior at sua parte dorsal. Doenas que dificultam ou interrompem o deslocamento deste movimento muco-ondulatrio podem levar rouquido.

- 72 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical


Com relao irradiao, as baixas freqncias tendem a espalhar-se por difrao, enquanto as altas freqncias propagam-se de forma mais direta. Em outras palavras, a presso sonora numa regio mais distante do locutor tende a ter uma maior intensidade relativa nas altas freqncias. Pode-se dizer, assim, que a irradiao equivalente a um filtro passa-altas. Este filtro pode ser representado, de forma simplificada (Fig. 1), por um ganho de 6 dB/oitava, isto , a resposta dobra (+6 dB) cada vez que a freqncia duplica (uma oitava). O estudo da irradiao sonora relativamente complexo (e.g., Kinsler et al., 1982; Fant. 1970) e a simplificao acima, que adequada at cerca de 6 kHz, vem da analogia com um pisto (a massa de ar entre os lbios) vibrando frente de uma esfera refletora (a face). Tendo apresentado as vrias facetas do modelo Fonte-Filtro para a produo de vogais, as discusses seguintes aplicaro estes conceitos a situaes de interesse na voz cantada.
Modal Falsete
Amplitude Relativa (dB)

Modal
0 -12 -24 -36 0 1 2 3 4 5 6 7 8 9 (F0) Freqncia (n.F0) n

-12 dB/oitava

Cochicho Fry/Creak

Amplitude Relativa (dB)

0 -12 -24 -36 0 1 2 3 4 n

Amplitude Relativa (dB)

Falsete
-18 dB/oitava

Fry (Crepitao)
0 -12 -24 -36 0 1 2 3 4 5 6 7 8 9 n

subharmnico -12 dB/oitava

(F0)

Freqncia (n.F0)

(F0)

Freqncia (n.F0)

Figura 4: Ajustes larngeos e qualidade da voz. Acima, esquerda (baseado em Beck, 1988): formato da prega vocal em diversos ajustes larngeos. Tomando-se a voz modal como referncia e seguindo a descrio de Laver (1981), h, no falsete, grande aumento na tenso longitudinal (LT) e, conseqentemente, em F0; uma fenda gltica comum neste ajuste. No fry ou creak (denominado crepitao, pelos fonoaudilogos, ou voz rangida, por alguns lingistas), h grande reduo na tenso longitudinal e na presso subgltica, mas h aumento na compresso medial (MC), resultando num som mais grave, com aperiodicidade e subharmnicos. No cochicho, a falta de aproximao ou aduo (AD) na parte posterior da glote resulta numa fenda onde gerado um rudo de frico; neste ajuste, no h vibrao das pregas vocais. Demais grficos (baseados em Klatt & Klatt, 1990): principais caractersticas acsticas de ajustes larngeos, destacando as mudanas na freqncia fundamental e na envoltria dos termos da srie harmnica.

2. SINTONIA F1-F0 NO CANTO LRICO FEMININO


O canto lrico feminino requer sons bem mais agudos que os utilizados para a conversao. Enquanto o valor mdio de F0 na fala feminina adulta est em torno de 220 Hz, as notas emitidas por uma soprano podem estar prximas a 1024 Hz (d5). No canto, porm, medida que a fundamental aumenta, aumenta tambm o espaamento entre os termos da srie harmnica gerada na laringe, diminuindo a concentrao de harmnicos em torno dos formantes e perdendo-se os ganhos da ressonncia com os formantes. A Fig. 5 ilustra o problema. Hipoteticamente, uma soprano est emitindo uma nota em 500 Hz, mas o harmnico fundamental est entre o primeiro e o segundo formantes da vogal articulada ([u]). Desta forma, a amplitude do harmnico fundamental relativamente pequena e a voz tem pouca audibilidade. A tcnica utilizada para aumentar a amplitude do harmnico fundamental ajustar o - 73 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical


primeiro formante (F1), fazendo-o coincidir com F0, atravs do abaixando da mandbula, gesto que tem certa seletividade sobre F1 (Lindblom & Sundberg, 1971). Com isso, o harmnico fundamental aumenta pela ressonncia com F1, resultando num ganho na audibilidade da voz sem que haja aumento na energia utilizada na fonao.

Figura 5: Sintonia F1-F0. Esquerda: aumento na amplitude do harmnico fundamental, F0, pelo deslocamento do primeiro formante, F1. Direita (adaptado de Rossing, 1990): representao de vogais no plano F1xF2; as elipses indicam valores mdios de formantes e a rea pontilhada a regio da freqncia fundamental de sopranos: d4 (C4) a d6 (C6), aproximadamente). As demais vogais, no representadas, ocupam regies intermedirias do plano, com superposies de reas.

Como descrito por Fant (1986), outro benefcio da sintonia F1-F0 uma diminuio no consumo de ar devido a um grande aumento na presso intraoral prximo ao instante de mxima abertura gltica. Este aumento de presso supragltica reduz o fluxo, mas no afeta a velocidade de fechamento. O preo que se paga pela sintonia F1-F0 uma perda na inteligibilidade das vogais. Segundo Di Carlo (1994), que estudou as vogais do Francs, somente as vogais nasais e as orais [e], [] e [o] so nitidamente individualizadas para notas emitidas entre o f3 e o l3 (350-440 Hz), que ela denomina zona de tolerncia; entre o l3 e o mi4 (440-659 Hz), zona de inteligibilidade eletiva, somente [i] e [a] so diferenciados; acima do mi4, zona de no-inteligibilidade absoluta, no se pode distinguir uma vogal das outras. No canto lrico, no apenas de sopranos, outras distores nos valores de formantes podem ocorrer. Os ajustes utilizados para alargar o trato vocal e diminuir a tenso da musculatura buco-facial no s alteram as ressonncias como tambm limitam a amplitude dos gestos articulatrios, reduzindo as excurses temporais dos formantes, particularmente F1, que so elementos importantes da inteligibilidade (Di Carlo, 1194). Esta autora lembra ainda que consoantes mal articuladas pelo prolongamento excessivo das vogais tambm colaboram para a reduzir a inteligibilidade.

3. FORMANTE DO CANTOR CANTO LRICO MASCULINO


No canto lrico masculino as freqncias mais agudas esto em torno do mi3 (330 Hz) para baixos, sol3 (392 Hz) para bartonos e d4 (523 Hz) para tenores, ao passo que o F0 mdio na voz falada masculina de 120 Hz. Assim, ao longo da tessitura dos cantores, h menor possibilidade de o harmnico fundamental localizar-se fora da regio de ao do primeiro formante. Os problemas no canto masculino surgem pelo ofuscamento da voz pelo som da orquestra. A tcnica lrica vale-se, contudo, de ajustes h muito observados em cantores de pera (e.g., Barhlomew, 1933), cujas vozes apresentam um pico espectral intenso e largo em torno de 3 kHz (Fig. 6). Este pico eleva a amplitude relativa dos harmnicos a situados, destacando a voz sobre o som da orquestra. A produo deste pico, denominado formante do cantor, est relacionada com o abaixamento da laringe e o alargamento da cavidade farngea, embora esta no seja o nico mecanismo existente (Sundberg, 1979). Como descrito por este autor, o formante do cantor uma aglutinao dos formantes superiores (F3, F4 e F5) devido s manobras citadas. No jargo dos cantores, esta tcnica recebe nomes como impostao ou projeo.

- 74 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical


Amplitude relativa (dB)
cantor + orquestra

orquestra fala

Freqncia (Hz)
Figura 6: Formante de cantor. Espectros mdios de longo prazo. Sem o recurso do formante do cantor (regio escura), os sons da fala so mascarados pela orquestra. Com o abaixamento da laringe e o alargamento da regio supragltica, o formante do cantor criado prximo a 3 kHz. Adaptado de Sundberg (1979).

Assim como na sintonia F1-F0 das sopranos, o formante do cantor propicia um aumento na audibilidade da voz sem aumento no esforo fonatrio. Alm disso, como lembra Sundberg (1979), h outras conseqncias favorveis. Primeiro, a regio de 3 kHz tambm coincide com a regio mais sensvel da percepo auditiva humana (onde ocorre uma ressonncia com a cavidade do meato acstico do ouvido), sendo amplificada ainda mais pelo processamento auditivo perifrico. Segundo, tendo-se em mente o comportamento passa-altas da irradiao sonora, os harmnicos de alta freqncia propagam-se mais eficientemente em linha reta, o que pode auxiliar a platia a discriminar melhor a voz do cantor no palco.

4. CANTO HARMNICO
O recurso de destacar harmnicos utilizado com maestria numa tcnica de canto de regies asiticas, incluindo a Monglia, o Tibet e a Sibria (Levin & Edgerton, 1999). Chamada de canto harmnico (harmonic chant/singing), este estilo possui outras denominaes que fazem aluso a sobretons (overtone singing) ou garganta (throat singing). A primeira sensao que se tem ao ouvir esta manifestao artstica de certo espanto, por tratar-se de algo extico, e vrios ouvintes custam a admitir tratar-se de um som produzido por uma nica pessoa. Neste estilo (Fig. 7), o cantor emite um som larngeo com uma freqncia fundamental baixa (70-100 Hz) que permanece praticamente constante. Porm, refinando os ajustes utilizados na produo de vogais, ele consegue criar uma pequena cavidade intraoral que atua como um superformante de elevada amplitude e largura de faixa to pequena que capaz de destacar um nico harmnico do espectro larngeo. O cantor altera com preciso a forma da cavidade, mudando a freqncia do formante e, literalmente, pina harmnicos no espectro, criando uma seqncia meldica aguda que evolui sobre uma base grave. Detalhes sobre alguns ajustes articulatrios, arquivos de vdeo e udio so disponveis nos suplementos de Levin & Edgerton (1999). A Fig. 7 mostra um exemplo de canto harmnio da regio de Tuva, na Sibria. No espectrograma de banda estreita, as linhas horizontais paralelas representam a evoluo temporal da srie harmnica; quanto mais escura a linha, mais intenso o harmnico. No incio do espectrograma, o cantor utiliza uma voz sem os recursos do canto harmnico, como mostra a seo espectral A, onde vrios formantes convencionais podem ser vistos. Assim que a tcnica do canto harmnico introduzida, um harmnico de alta freqncia (seta) passa a destacar-se no espectro. Os harmnicos o o utilizados esto entre o 6 e o 12 , mas, como a sintaxe musical da regio favorece melodias o o pentatnicas, o 7 e 11 harmnicos so evitados (Levin & Edgerton, 1999).

- 75 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical


dB
F1 F2

A
F3

dB

Hz A B C

Hz

12 10 8 6

2s

Canto normal

Canto Harmnico

tempo (s)

Figura 7: Canto harmnico. Na parte inicial, a tcnica do canto harmnico no utilizada. A seo espectral A mostra os formantes caractersticos da fala. Com o uso do canto harmnico, um harmnico (setas) destaca-se, o o como visto ao longo do espectrograma e na seo B. Os harmnicos selecionveis esto entre o 6 e o 12 , o o mas o 7 e o 11 no so utilizados devido s escalas pentatnicas. O detalhe C indica uma ocorrncia de vibrato. Elaborado com gravaes de Levin & Edgerton (1999).

Este estilo tambm utiliza recursos fonatrios especiais e por isso tambm denominada khoomii, palavra monglica para garganta. Os ajustes larngeos adotados tm semelhanas com o fry (Fig. 4). Com isso, alm do baixo valor de F0, consegue-se uma maior velocidade de fechamento (que amplifica os harmnicos superiores) e uma diminuio da fase aberta de cada ciclo gltico (que diminui o consumo de ar e evita perda de energia pelo acoplamento com o trato vocal subgltico); as falsas pregas tambm podem ser utilizadas vibrando numa freqncia sub-mltipla de F0 (Levin & Edgerton, 1999). No espectrograma da Fig. 7 v-se, no detalhe C, que as linhas horizontais no so retas, mas ondulam ao longo do tempo. Estas ondulaes so conseqncias do vibrato, que ser discutido a seguir.

5. VIBRATO VOCAL
O vibrato uma variao regular na freqncia de uma nota comumente utilizado na msica (Fig. 8). Perceptivamente, sua qualidade depende de trs parmetros mensurveis: a taxa, a profundidade e a regularidade. A taxa (F = 1/T) o nmero de ciclos por segundo; a profundidade, amplitude ou extenso (F0), o desvio da freqncia em torno de ser valor mdio, enquanto a regularidade carece de um parmetro para medio, mas, desejavelmente, deve ter um aspecto senoidal. No bel canto, a taxa aceitvel do vibrato varia de 5,5 Hz a 7,5 Hz e a profundidade vai de 6% a 12%, ou seja, de aproximadamente 1 a 2 semitons (Sundberg, 1987).

- 76 -

Frequncia (Hz)

1 kHz

I Seminrio Msica Cincia Tecnologia: Acstica Musical

16 14 12 10 8 6 4 2 F0

Fi
500 Hz

T T
0,2 s

tempo (s)
Figura 8: Vibrato. Espectrograma de banda estreita mostrando as ondulaes introduzidas em toda a srie harmnica devido ao vibrato. Os nmeros crescentes esquerda da figura (2, 4, 6, ...) so a ordem do o harmnico. O perodo do vibrato T 0,19 s e a taxa F = 1/0,19 s = 5,3 Hz. O 15 utilizado para medir a amplitude do vibrato: sua freqncia inferior Fi = 2080 Hz e a superior Fs = 2280 Hz. O valor mdio de F0 1/2 (2280 + 2080)/15 = 145,3 Hz e a amplitude do vibrato 1/2 (2280 2080)/15 = 6,67 Hz, ou seja, 4,6% de F0, que equivale a 0,8 semitons (vide texto principal).

A taxa e a profundidade do vibrado podem ser medidas em espectrogramas de banda estreita (Fig. 8) utilizando-se algum software que disponha de escalas e/ou cursores com resoluo adequada. A leitura da durao do ciclo (T) imediata, mas, para estimar profundidade, difcil obterse resoluo adequada medindo-se diretamente a freqncia do harmnico fundamental. Porm, para um harmnico de ordem elevada, podem-se obter valores de freqncia mxima e mnima com erros menores, e a profundidade do vibrato (valor de pico) pode ser expressa, em semitons, por: F0

2Fs = 17,31 ln [semitons], Fs + Fi

onde Fs e Fi so, respectivamente, os valores superior e inferior da freqncia de um harmnico qualquer. No exemplo da Fig. 8, Fs 2280 Hz, Fi 2080, donde F0 0,8 semitons. Tendo-se em mente que o semitom da escala igualmente temperada equivale a uma relao entre freqncias de
12 2 = 1,059... 6%, a amplitude do vibrato pode ser calculada sem o uso de logaritmos, obtendo-se

F0 em valor percentual e obtendo-se a frao do semitom. No caso (vide legenda da Fig. 8), F0 = 6,7/145,3 = 4,6% e a amplitude do vibrato 4,6%/6% = 0,8 semitons. No canto, o vibrato produzido modulando-se a tenso da musculatura larngea responsvel pela tenso e enrijecimento das pregas vocais (msculos cricotireideos e tiroaritenideos, respectivamente); tambm fisiologicamente possvel produzir o vibrato variando-se a presso subgltica (que resulta em maior deslocamento lateral das pregas vocais e, conseqentemente, na elevao de sua tenso mdia), mas esta parece no ser a tcnica natural de cantores experientes (Sundberg, 1979; Titze, 1994). O vibrato produzido por variao da presso pulmonar revela um mecanismo de interdependncia entre a amplitude (causa) e a freqncia (efeito). Por outros motivos, ocorre uma situao reversa no vibrato larngeo, isto , variaes em F0 causam variaes na amplitude da presso sonora. Como ilustrado na Fig. 9, isto ocorre porque a amplitude dos harmnicos aumenta e diminui medida que suas freqncias oscilam em torno dos formantes, particularmente de F1, que o formante de maior amplitude (Sundberg, 1979). A regularidade do vibrato um aspecto que tem recebido ateno nos ltimos anos (e.g., Diaz & Rothman, 2002). A regularidade pode ser analisada fazendo-se uma anlise espectral da srie temporal de valores de F0, como ilustrado na Fig. 9. Este mtodo pode ser adaptado para criar um espectrograma do vibrato e avaliar a dinmica temporal dos ajustes.

- 77 -

Frequncia (Hz)

Fs

I Seminrio Msica Cincia Tecnologia: Acstica Musical

Figura 9: Espectro da regularidade do vibrato. Esquerda: voz com vibrato regular, taxa de aproximadamente 5,5 Hz e amplitude de 0,70 semitons. Direita: vibrato irregular e de baixa amplitude, apresentando dois picos maiores em 4,2 e 8,4 Hz. Os grficos foram obtidos rastreando-se F0 a cada 20 ms, extraindo-se a mdia da srie temporal, passando por um filtro passa-altas com corte em 3 Hz e calculando-se a Transformada Discreta de Fourier em 100 pontos.

6. CONCLUSO
Este artigo abordou, de forma introdutria, o modelo Fonte-Filtro da produo da voz e sua utilizao no estudo de alguns aspectos da voz cantada. A arte do canto tem estado frente da cincia, mas aos poucos, a acstica vem explicando fenmenos que professores de canto conhecem h sculos. Com o avano da tecnologia, o uso no s de registros acsticos, mas de sinais aerodinmicos (fluxo areo e presso sonora) e eletroglotogrficos, tende a tornar-se um forte aliado compreenso e evoluo das tcnicas de canto, como tem ocorrido na fonoaudiologia e na otorrinolaringologia (e.g., Hirano, 1981; Vieira, 1997; Vieira et al., 2002). Estas especialidades mdicas, alis, tm tido crescente interesse no estudo da voz cantada visando o aprimoramento do tratamento de problemas vocais em cantores profissionais. Cabe aqui uma palavra de precauo. A facilidade atual de acesso a equipamentos de gravao e a softwares para a anlise automtica da voz (com resultados no-necessariamente confiveis) no deve ocultar a necessidade de conhecimentos sobre os fenmenos bsicos da acstica, as tcnicas de gravao e os mtodos de anlise de sinais.

7. REFERNCIAS
Bartholomew, W. T. (1933). A physical definition of good voice-quality in the male voice. Journal of the Acoustical Society of America 6, pp. 25-33. Beck, J. M. (1988). Organic Variation and Voice Quality. Ph.D. Thesis (University of Edinburgh). Diaz, J. A. & Rothman, H. B. (2002). Acoustical comparison between samples of good and poor vibrato in singers. Journal of voice 17, pp. 179-184. Di Carlo, N. S. (1994). Lintelligibilit de la voix chante. Medicine des Art 10, pp. 2-15. Fant, G. (1970). Acoustic Theory of Speech Production. Mouton, The Haugue. Fant, G. (1986). Glottal flow: models and interaction. Journal of Phonetics 14, pp. 393-399. Hirano, M. (1981). Clinical Examination of Voice. Springer-Verlag, New York. Kent, R. D. & Read, C. (1992). The Acoustic Analysis of Speech. Singular, San Diego. Kinsler, L. E., Frey, A. R., Coppens, A. B. & Sanders, J. V. (1982). Fundamentals of Acoustics (Third Edition). John Wiley & Sons, New York. Klatt, D. H. & Klatt, L. C. (1990). Analysis, synthesis, and perception of voice quality variations among female and male talkers. Journal of the Acoustical Society of America 87, pp. 820-857. Laver, J. (1981). The Phonetic Description of Voice Quality. Cambridge University Press. Levin, T. C & Edgerton, M. E. (1999). The throat singers of Tuva. Scientific American 281(3), pp. 80-82 + s. Lindblom, B. E. F. & Sundberg, J. E. F. (1971). Acoustical consequences of lip, tongue, jaw, and larynx movements. Journal of the Acoustical Society of America 50, pp. 1166-1179. Rossing, T. (1990). The Science of Sound, 2 . Edition. Addison Wesley. Sdersten, M. & Lindestad, P. A. (1992). A comparison of vocal fold closure in rigid telescopic and flexible fiberoptic laryngostroboscopy. Acta Otolaryngologica (Stockholm) 112, pp. 144-150. Stevens, K. N. (1998). Acoustic Phonetics. The MIT Press, Cambridge.
nd

- 78 -

I Seminrio Msica Cincia Tecnologia: Acstica Musical


Sundberg, J. (1979). Perception of singing. Speech Transmission Laboratory Quarterly Progress and Status Report 1 (Royal Institute of Technology, Stockholm) pp. 1-48. Sundberg, J. (1987). The Science of the Singing Voice. Dekalb, Illinois. Sdersten, M. & Lindestad, P. A. (1992). A comparison of vocal fold closure in rigid telescopic and flexible fiberoptic laryngostroboscopy. Acta Otolaryngologica (Stockholm) 112, pp. 144-150. Titze, I. R. (1994). Principles of Voice Production. Prentice-Hall, Englewood Cliffs. Vieira, M. N. (1997). Automated Measures of Dysphonias and the Phonatory Effects of Asymmetries in the Posterior Larynx, Ph.D Thesis, University of Edinburgh, UK. Vieira, M. N., McInnes, F. R., & Jack, M. (2002). On the influence of laryngeal pathologies on acoustic and electroglottographic jitter measures. Journal of the Acoustical Society of America 111, pp. 1045-1055.

- 79 -