Você está na página 1de 50

acstica da voz

Braslia-DF.

Elaborao
Carolina Ghelli Ferreira de Melo

Produo
Equipe Tcnica de Avaliao, Reviso Lingustica e Editorao

Sumrio
APRESENTAO.................................................................................................................................. 4
ORGANIZAO DO CADERNO DE ESTUDOS E PESQUISA..................................................................... 5
INTRODUO.................................................................................................................................... 7
UNIDADE I
LABORATRIO DE VOZ........................................................................................................................... 9
CAPTULO 1
ANLISES.................................................................................................................................. 9
CAPTULO 2
CUIDADOS ESPECIAIS NA AVALIAO ACSTICA..................................................................... 15
UNIDADE II
ESPECTROGRAFIA ACSTICA................................................................................................................ 20
CAPTULO 1
CONCEITO E FUNDAMENTOS ASSOCIADOS............................................................................. 20
CAPTULO 2
TERMINOLOGIA ASSOCIADA .................................................................................................. 24
CAPTULO 3
PARMETROS ACSTICOS ....................................................................................................... 34
CAPTULO 4
PARMETROS AUDITIVOS E CORRELATOS ESPECTROGRFICOS ACSTICOS.............................. 41
UNIDADE III
SOFTWARES DISPONVEIS NO MERCADO PARA ANLISE ACSTICA....................................................... 44
CAPTULO 1
SOFTWARES DISPONVEIS NO MERCADO PARA ANLISE ACSTICA........................................... 44
PARA (NO) FINALIZAR..................................................................................................................... 47
REFERNCIAS................................................................................................................................... 48

Apresentao
Caro aluno
A proposta editorial deste Caderno de Estudos e Pesquisa rene elementos que se entendem
necessrios para o desenvolvimento do estudo com segurana e qualidade. Caracteriza-se pela
atualidade, dinmica e pertinncia de seu contedo, bem como pela interatividade e modernidade
de sua estrutura formal, adequadas metodologia da Educao a Distncia EaD.
Pretende-se, com este material, lev-lo reflexo e compreenso da pluralidade dos conhecimentos
a serem oferecidos, possibilitando-lhe ampliar conceitos especficos da rea e atuar de forma
competente e conscienciosa, como convm ao profissional que busca a formao continuada para
vencer os desafios que a evoluo cientfico-tecnolgica impe ao mundo contemporneo.
Elaborou-se a presente publicao com a inteno de torn-la subsdio valioso, de modo a facilitar
sua caminhada na trajetria a ser percorrida tanto na vida pessoal quanto na profissional. Utilize-a
como instrumento para seu sucesso na carreira.
Conselho Editorial

Organizao do Caderno
de Estudos e Pesquisa
Para facilitar seu estudo, os contedos so organizados em unidades, subdivididas em captulos, de
forma didtica, objetiva e coerente. Eles sero abordados por meio de textos bsicos, com questes
para reflexo, entre outros recursos editoriais que visam a tornar sua leitura mais agradvel. Ao
final, sero indicadas, tambm, fontes de consulta, para aprofundar os estudos com leituras e
pesquisas complementares.
A seguir, uma breve descrio dos cones utilizados na organizao dos Cadernos de Estudos
e Pesquisa.
Provocao
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes
mesmo de iniciar sua leitura ou aps algum trecho pertinente para o autor
conteudista.
Para refletir
Questes inseridas no decorrer do estudo a fim de que o aluno faa uma pausa e reflita
sobre o contedo estudado ou temas que o ajudem em seu raciocnio. importante
que ele verifique seus conhecimentos, suas experincias e seus sentimentos. As
reflexes so o ponto de partida para a construo de suas concluses.

Sugesto de estudo complementar


Sugestes de leituras adicionais, filmes e sites para aprofundamento do estudo,
discusses em fruns ou encontros presenciais quando for o caso.

Praticando
Sugesto de atividades, no decorrer das leituras, com o objetivo didtico de fortalecer
o processo de aprendizagem do aluno.

Ateno
Chamadas para alertar detalhes/tpicos importantes que contribuam para a
sntese/concluso do assunto abordado.

Saiba mais
Informaes complementares para elucidar a construo das snteses/concluses
sobre o assunto abordado.

Sintetizando
Trecho que busca resumir informaes relevantes do contedo, facilitando o
entendimento pelo aluno sobre trechos mais complexos.

Exerccio de fixao
Atividades que buscam reforar a assimilao e fixao dos perodos que o autor/
conteudista achar mais relevante em relao a aprendizagem de seu mdulo (no
h registro de meno).
Avaliao Final
Questionrio com 10 questes objetivas, baseadas nos objetivos do curso,
que visam verificar a aprendizagem do curso (h registro de meno). a nica
atividade do curso que vale nota, ou seja, a atividade que o aluno far para saber
se pode ou no receber a certificao.
Para (no) finalizar
Texto integrador, ao final do mdulo, que motiva o aluno a continuar a aprendizagem
ou estimula ponderaes complementares sobre o mdulo estudado.

Introduo
A avaliao acstica est cada vez mais presente na realidade fonoaudiolgica e tem sido utilizada
como uma importante ferramenta nas avaliaes de vozes patolgicas e profissionais, e o seu
emprego nas anlises da qualidade vocal tem crescido bastante nos ltimos anos. Pode-se dizer que
essa anlise uma tcnica no invasiva, baseada no processamento digital do sinal de voz, podendo
ser utilizada como um instrumento eficiente para a deteco precoce e auxlio ao diagnstico de
patologias vocais e, tambm, no controle e na evoluo da qualidade vocal de profissionais da
voz, tais como atores, cantores, locutores, dentre outros. Alm da utilizao dessa tcnica para
determinao objetiva de alteraes da funo vocal, pode ser aplicada tambm nas avaliaes de
cirurgias, nos tratamentos farmacolgicos e na reabilitao vocal.
Para a discriminao de vozes patolgicas, por meio de anlise acstica, essencial que o processo
de caracterizao acstica da patologia seja bem-estabelecido. Para isso, existem correlatos
espectrogrficos acsticos que diferenciam uma voz patolgica de uma voz normal e que facilitam a
visualizao dessa diferena ou mesmo a sugesto do tipo de patologia existente, o que otimiza um
treinamento da leitura acstica. Entretanto, a literatura ainda no conclusiva e insuficiente com
relao s caractersticas acsticas ou aos parmetros mais adequados para modelagem de uma
patologia em particular. Frequentemente, a maioria das pesquisas fundamenta-se na discriminao
entre vozes normais e patolgicas, sem especificar a patologia. Alguns estudos focalizam uma
determinada patologia sem, no entanto, apresentar um modelo acstico correspondente. Sendo
assim, a pesquisa para uma anlise acstica ainda um campo promissor e crescente.
A anlise acstica est inserida em um contexto de avaliao vocal e faz parte de uma srie de
procedimentos que tm por objetivo principal identificar e conhecer o comportamento vocal de um
indivduo, de maneira que contribua para o estabelecimento da melhor conduta pelo terapeuta.
importante dizer que essa anlise deve ser utilizada como tcnica complementar aos mtodos
usados para se avaliar a voz de um indivduo, tal como a avaliao perceptivo-auditiva e outros
exames e avaliaes relacionados, sendo que nenhum substitui o outro, mas, sim, integram um
conjunto de ferramentas para que se possa traar a linha de base de uma voz.
No tocante voz profissional, como dito anteriormente, a anlise em questo tem sido utilizada
crescentemente na prtica clnica como uma maneira de se acompanhar o desenvolvimento de uma
voz ao longo do tempo, de forma que a melhor conduta para reabilitao ou treinamento seja tomada.
importante tambm que seja dito e reforado que a anlise acstica no se restringe somente a fins
clnicos, ela tem sido utilizada em uma rea relativamente nova, na realidade brasileira chamada
de Fonoaudiologia Forense. Nesta anlise, busca-se, prioritariamente, identificar o falante, por meio
de critrios tcnicos de comparao, identificao e interpretao dos materiais sonoros, apoiados
por programas (softwares) especficos para tal avaliao.

Objetivos
Oferecer maior compreenso acstica.
Estreitar linhas de associao entre as anlises perceptivo-auditiva e acstica.
Incentivar o raciocnio clnico por meio de dados objetivos.
Promover o conhecimento de softwares especficos para a anlise em questo e sua
aplicao nas avaliaes vocais.
Proporcionar os conhecimentos acerca das contribuies da anlise acstica para a
avaliao e o monitoramento teraputico de pacientes nas reas de voz.
Orientar sobre os cuidados necessrios durante a coleta de dados para anlise
acstica, com vistas obteno de resultados confiveis.
Desmistificar o emprego da anlise acstica na prtica clnica e a ideia de que ela
requer recursos sofisticados e caros.
Enriquecer a prtica clnica e profissional na rea de voz.

LABORATRIO DE
VOZ

UNIDADE I

CAPTULO 1
Anlises

Anlise acstica
A mente que se abre a uma nova ideia jamais voltar ao seu
tamanho original.
(Albert Einstein Nota: Autoria no confirmada. Frase adaptada do original de Oliver Wendell
Holmes)

Ser apresentada aqui a conceituao e a contextualizao da anlise acstica, sua


importncia na avaliao de uma voz e da qualidade vocal. destacado, ainda, o
uso da anlise acstica como ferramenta auxiliar em procedimentos de diagnstico
de desordens vocais e patologias da laringe, e acompanhamento teraputico e
profissional.
A anlise acstica realiza mensuraes do sinal sonoro vocal, enquanto a avaliao
perceptivo-auditiva oferece uma descrio do sinal vocal tendo como instrumento
bsico apenas a audio.
De maneira simplificada, a avaliao acstica quantifica o sinal sonoro vocal, o que
direciona a uma anlise objetiva da voz, e a avaliao perceptivo-auditiva direciona
a uma anlise subjetiva. Entretanto, mesmo nas anlises objetivas, existe um
componente subjetivo presente. Assim, importante se reconhecer que no existe
uma anlise puramente objetiva, visto que a interpretao de dados subjetiva e
o ouvido humano participa em maior ou menor grau desse processo em questo,
em que variveis independentes e interdependentes so apresentadas para a
compreenso do resultado acstico observado.

UNIDADE I LABORATRIO DE VOZ

Conceito e contextualizao
Os laboratrios de voz apresentam mtodos e programas objetivos especficos utilizados na avaliao,
pesquisa e terapia dos distrbios da voz e no acompanhamento de vozes profissionais. De maneira
didtica e para melhor entendimento, so consideradas anlises bsicas de um laboratrio de voz
as seguintes: laringoestroboscopia, anlise acstica, eletroglotografia, eletromiografia, filtragem
inversa e fluxometria (BEHLAU et al., 2001). De forma geral, os mtodos de anlise permitem a
avaliao objetiva, traando uma linha de base da voz de um indivduo, til para medir o grau de
evoluo do padro vocal, permitindo, portanto, mensurar a evoluo da fonoterapia ou de algum
tipo de treinamento especfico. to til tambm na avaliao dos momentos pr e ps-operatrio
de cirurgias larngeas.
A anlise acstica integra um dos mtodos de anlise do laboratrio de voz e realiza mensuraes
do sinal sonoro vocal. Apesar do seu recente uso na prtica clnica e profissional, j demonstrou
utilidades inquestionveis, conforme j citados brevemente. Corroborando, apresentam-se na
presente leitura os ganhos mais imediatos na utilizao da anlise acstica, com fins essencialmente
clnicos, descritos por Behlau (1997): prover dados normativos para diferentes realidades vocais
(culturais, profissionais ou patolgicas), oferecer dados suficientes para traar a linha de base da voz
de um indivduo (uso profissional ou teraputico), monitorar a evoluo de um tratamento vocal,
comparar resultados de diferentes procedimentos teraputicos, convergir as linhas de associao
entre as anlises perceptivo-auditiva e acstica, acompanhar o desenvolvimento de uma voz
profissional ao longo do tempo e auxiliar na deteco precoce de problemas vocais e larngeos.
A espectrografia acstica, discutida adiante, um dos principais mtodos dessa anlise, a qual
fornece uma representao grfica (monitoramento visual) das caractersticas acsticas de uma
emisso.
Ao contrrio do que muitos imaginam, a anlise acstica uma tcnica de custo relativamente
baixo quando comparada aos exames mdicos usuais, utilizados em grande parte nas avaliaes
otorrinolaringolgicas, os quais precisam de fontes de luz especiais, instrumentos endoscpicos e
equipamentos de videocmera especializados (GODINO-LLORENTE et al., 2006).

Histrico
O sculo XX marcou o perodo moderno da anlise acstica de sons. Na dcada de 1920, aconteceu
a produo de oscilogramas, que so grficos que representam a variao da amplitude do som
em funo do tempo. Nessa poca, as anlises vocais eram feitas, preferencialmente, por meio de
amostras de vogais sustentadas, por serem mais fceis de analisar.
Na dcada de 1940, na Segunda Guerra Mundial, houve um grande avano dessa tecnologia, quando
se desenvolveu uma mquina chamada de espectrgrafo do som, cuja utilidade inicial era detectar
o deslocamento das tropas do eixo, por meio da anlise da voz do operador de rdio. Tecnicamente,
esse aparelho registrava o sinal a ser analisado em um tambor magntico, associado a uma fita
loop e a diversos filtros que auxiliavam a determinar as diferentes regies de frequncias do som.
Assim, a corrente do sinal eltrico era transferida para um papel termossensvel que se queimava

10

LABORATRIO DE VOZ

UNIDADE I

em diferentes graus de escurecimento, de acordo com o som analisado. O registro dessa anlise,
ou seja, o grfico final impresso, um grfico tridimensional chamado espectrograma (Figura 1)
(representado detalhadamente e discutido adiante).
Na dcada de 1970, houve um novo avano, por meio da introduo do processamento digital de
sinais, ou seja, os computadores produziam espectrogramas semelhantes aos espectrgrafos de
som, conferindo maior rapidez e confiabilidade na obteno de parmetros acsticos, e ainda outras
vantagens: eliminao do processo de queima do papel e armazenamento digital.
A avaliao acstica clnica foi introduzida na dcada de 1990 na realidade brasileira.

Figura 1: Representao de um espectrograma de uma vogal [i], sustentada por um cantor, de uma gravao
de cerca de 9.9 segundos. H uma representao das frequncias no eixo vertical (Y) e do tempo no eixo
horizontal, com aplicao de filtro de banda estreita, evidenciando os harmnicos (espectrograma gerado no
software Praat).

Legenda: Time Tempo; (s) segundos.

Aplicaes e deficincias
medida que o laboratrio vocal computadorizado torna-se habitual na prtica clnica, suas
aplicaes mostram-se mais notrias e evidentes. At o presente momento, podem-se enumerar
importantes sugestes no emprego da anlise espectrogrfica acstica (detalhada adiante) (BEHLAU
et al., 2001):

11

UNIDADE I LABORATRIO DE VOZ


a. a melhor anlise para fala encadeada;
b. evidencia os aspectos temporais da emisso e caractersticas de coarticulao dos
sons da fala;
c. demonstra a contribuio da fonte e da ressonncia do trato vocal1;
d. evidencia os formantes das vogais e as zonas de incremento de energia das
consoantes.
e. permite a identificao do formante do cantor e a verificao do ndice de brilho de
uma voz;
f. a medio dos formantes das vogais e das zonas de alta energia das consoantes
feita em Hertz (Hz), assim como suas larguras de bandas.
No que diz respeito s deficincias, a anlise acstica mostra-se to mais confivel quanto mais
prxima do padro normal de produo vocal encontra-se a voz avaliada, ou seja, quanto maior o
grau de severidade da alterao (patologia), menos confiveis apresentam-se os resultados acsticos.
Nesses casos ou, ainda, quando todos os outros mtodos de avaliao falham, confia-se no poder
do ouvido humano, isto , na audio do avaliador e em sua anlise perceptivo-auditiva. Portanto,
a anlise perceptivo-auditiva deve sempre preceder a acstica, sendo a acstica dependente da
auditiva, da qual complementar (BEHLAU et al., 2001). Outra limitao da anlise em questo
e que amplamente discutida na literatura a questo da inexistncia de protocolos especficos e
do estabelecimento de dados normativos para o portugus brasileiro (BEHLAU, 1997). Em uma
importante produo, Titze (1994) tece consideraes sobre o porqu definir os padres ou standards
e destaca quatro pontos bsicos: standards educam, simplificam, economizam e certificam. Essa
normatizao uma questo que o clnico deve ter, haja vista a formao acadmica que geralmente
no privilegiou o conhecimento acerca de medidas acsticas e sua interpretao correta. Mas,
tambm, importante ter ateno para que os standards no bloqueiem ou desestimulem os
progresso das pesquisas. A padronizao importante para se ter parmetros, mas eles precisam ser
questionados, aperfeioados e tambm descartados quando necessrio para que a cincia progrida
adequadamente.
Faa um resumo da conceituao, da contextualizao, do histrico e das aplicaes
e deficincias da anlise acstica, de forma que voc possa fixar as informaes
recebidas at aqui e seguir com clareza.

1 Entende-se por trato vocal todas as estruturas que em comprimento se estendem desde a glote at os lbios (NEMETZ, M. A.
et al., 2005)

12

LABORATRIO DE VOZ

UNIDADE I

Anlise perceptivo-auditiva x anlise acstica


Por muito tempo, a prtica fonoaudiolgica se baseou exclusivamente na anlise perceptiva da voz.
Trata-se de uma avaliao tradicional de carter impressionstico (voz rouca, soprosa, comprimida
etc.) e qualitativo, utilizada para descrever o sinal vocal (DE BODT et al., 1996; FAWCUS, 2001).
Segundo Fex (1992), a avaliao perceptivo-auditiva a avaliao clssica da qualidade vocal, ela
tradicional na prtica clnica, embora existam crticas feitas subjetividade e imprecisa terminologia
envolvida nesse procedimento. A questo da confiabilidade das avaliaes auditivas da qualidade
vocal a questo central na pesquisa de voz, j que a comparao de vozes envolve um sistema
de referncia interno (preferncias), que flutuante, e fatores como experincia e treinamento
anteriores podem interferir na avaliao em questo. Por outro lado, pesquisas comprovam que
a audio pode e deve ser treinada clinicamente, o que gera maior confiabilidade a esse tipo de
anlise (DE BODT et al., 1996). Uma vez que o assunto referente avaliao perceptivo-auditiva
tem sido discutido neste captulo, vale chamar a sua ateno sobre um protocolo para julgamento
de qualidade vocal de vozes disfnicas que tem sido frequentemente utilizado nas pesquisas
clnicas: a escala GRBASI, elaborada pela Sociedade Japonesa de Logopedia e Foniatria (HIRANO,
1981), e modificada por Dejonckere e Leback (1996). Essa escala composta por seis parmetros
perceptivo-auditivos: (G) grau geral da disfonia, (R) rudo, (B) soprosidade, (A) astenia, (S) tenso
e (I) instabilidade; e fornece informaes importantes sobre a produo vocal e o grau da alterao.
Pinho e Pontes (2008) adaptaram a escala realidade brasileira, nomeada como RASATI (leitura
complementar).
Pelo fato de a avaliao perceptivo-auditiva resultar em dado subjetivo e depender da percepo
particular de cada ouvinte, tentou-se encontrar um meio de avaliao mais preciso (BEHLAU et
al., 1995). Com a evoluo da informtica, surgiram os laboratrios de voz, conforme mencionado
anteriormente, que contam com anlises mais objetivas da voz (BAKEN; ORLIKOFF, 2000) e
que oferecem diversos tipos de mensuraes e ndices (discutidos adiante) do sinal sonoro vocal,
especialmente, por meio da emisso de uma simples vogal sustentada. Tais anlises refletem uma
mnima interferncia do avaliador nos resultados obtidos (BEHLAU et al., 2005). E, de acordo
com Behlau et al. (2005), a avaliao acstica complementar anlise perceptivo-auditiva e um
poderoso instrumento para o detalhamento da funo vocal do indivduo.

Anlise acstica e a avaliao vocal


Para que uma avaliao de voz seja completa e satisfatria, ela deve contemplar diversos
profissionais e procedimentos. Os profissionais envolvidos em uma avaliao vocal so mdicos,
especialmente, otorrinolaringologista e fonoaudilogos. Uma anamnese detalhada, realizada pelo
avaliador, faz toda a diferena na correlao dos dados encontrados adiante. A avaliao clnica do
comportamento vocal fica por conta do fonoaudilogo e a avaliao mdica e laringolgica, pelo
otorrinolaringologista; se preciso for, outros profissionais faro uma anlise nosolgica. A anlise
acstica um tipo de procedimento que deve ser inserido, sempre que possvel, nesse contexto
avaliativo, pois oferece dados importantes e objetivos sobre a funo vocal do indivduo.

13

UNIDADE I LABORATRIO DE VOZ


Detalhadamente, a anamnese vocal fonoaudiolgica tem por objetivo identificar a participao do
comportamento vocal na gnese ou manuteno de uma patologia ou disfonia e para tanto, so
pesquisados dados relacionados a: histria pregressa da queixa, situaes de uso vocal, hbitos
vocais inadequados, demanda de uso da voz, antecedentes familiares e pessoais, dentre outros.
Assim, possvel traar o perfil vocal do sujeito. Aliado a isso, a avaliao do comportamento
vocal a base da clnica fonoaudiolgica e baseia-se na observao clnica e medidas simples no
instrumentais. Incluem-se a avaliao perceptivo-auditiva para julgamento da qualidade vocal e
seus parmetros associados, assim como uma anlise das habilidades gerais e da comunicao do
indivduo e a verificao do impacto da difonia em sua qualidade de vida.
No tocante avaliao acstica computadorizada, ela complementa a avaliao clnica vocal,
e oferece vrios tipos de mensuraes do sinal sonoro e parmetros acsticos, conforme dito
anteriormente, que so objetivos e to mais confiveis o quo prximo de um padro normal a voz
em questo apresentar-se. Por sua vez, a espectrografia acstica proporciona avaliaes qualitativas
da qualidade vocal, por meio da anlise qualitativa dos espectrogramas gerados, e oferece dados
tambm sobre a fonte sonora e os filtros de ressonncia (apresentados adiante), sendo considerada
uma boa avaliao para a anlise da fala encadeada. Os protocolos e sistemas de gravao, as
condies de registro e a anlise qualitativa do sinal sonoro sero discutidos no prximo captulo,
referente aos cuidados especiais na avaliao acstica.
Lembre-se de que as avaliaes acstica e perceptivo-auditiva complementam-se
e nenhuma substitui a outra, a acstica caracteriza-se por ser objetiva e a auditiva,
subjetiva.
Sob tenso clnica, devemos confiar, prioritariamente, no nosso ouvido!
Aps a sua avaliao clnica e perceptivo-auditiva, detectado que o paciente
apresenta uma voz extremamente desviada dos padres normais. Voc considera
que ser til fazer uma avaliao acstica? Caso faa, os resultados obtidos sero
confiveis como se avaliasse uma voz normal ou levemente desviada? Pense nisso...

14

CAPTULO 2
Cuidados especiais na avaliao
acstica
Diversos textos oferecem sugestes para se obter um registro de udio de vozes, com qualidade,
como o de Behlau, 1997; Titze, 1994, dentre outros. Este captulo de fundamental importncia para
o profissional que vai atuar com avaliaes acsticas, pois a confiabilidade dos dados obtidos pelas
anlises feitas pelos softwares acsticos esto diretamente ligados qualidade do udio captado.
Por uma questo didtica e de fcil entendimento, os cuidados especiais que sero discorridos a
seguir esto apoiados nas sugestes de Behlau et al. (2001).

Condies de registro
Conforme dito anteriormente, qualquer mtodo de aquisio e armazenamento de sinais sonoros
pode afetar fortemente a qualidade do sinal.
a. As gravaes devem ser realizadas em ambientes silentes, com rudo ambiental
inferior a 50 dB, em circunstncias controladas e que sejam passveis de
reprodutibilidade.
b. O indivduo deve ficar preferencialmente de p e com o corpo livre.
c. O microfone deve ser instalado em um pedestal, de forma que a distncia permanea
fixa em relao sua boca, e posicionado em um ngulo de 45 a 90 em relao a
ela. Para as vogais sustentadas, indicada uma distncia menor que 10 cm, ao redor
de 3 a 4 cm, para que no ocorram interferncias no sinal, e que a dosagem de
rudo seja baixa e no comprometa a gravao; para a fala encadeada, necessrio
manter uma distncia de pelo menos 10 cm e menor que 20 cm, a fim de que o rudo
respiratrio no contamine a gravao. No tocante voz cantada, a distncia tanto
para a emisso de vogal sustentada como para um trecho cantado normalmente
maior do que as das indicaes acima, especialmente para cantores treinados (em
que a projeo vocal considervel), a distncia entre a boca do cantor e o microfone
precisam ser cuidadosamente recomendadas.
d. Caso a emisso tenha um excesso de ar, como nos casos de vozes soprosas e nas
vogais posteriores ([o], [u]), posicione o microfone na lateral da boca do indivduo,
podendo chegar a 90 graus de deslocamento lateral, com o intuito de reduzir o
rudo aerodinmico na gravao, o qual influencia negativamente no sinal acstico.
e. A captao direta da voz no computador ideal, para tanto, indicado que a
mquina disponha de uma boa placa de som (mnimo recomendado: 16 bit de placa
analgico-digital). Quando a tecnologia da placa apresentada pelo computador

15

UNIDADE I LABORATRIO DE VOZ


no obedecer aos pr-requisitos mnimos satisfatrios, existem placas de
som (interfaces de udio) disponveis no mercado, com preos acessveis e de fcil
conexo ao computador (USB).
f. indicado verificar parcialmente o nvel de rudo introduzido no sinal
pelo sistema de gravao ou captura de voz para se ter a certeza de
que rudos do maquinrio ou externos no influenciem negativamente
a qualidade das amostras. Primeiramente, obtm-se o sinal com o microfone
desligado e, logo em seguida, desliga-se o microfone e verifica-se o sinal obtido,
estes devem ter amplitudes semelhantes.
g. indicado verificar a impedncia do microfone para que no acontea
distores na gravao.
Uma curiosidade: um estudo feito por Yamasaki e Behlau (1997), mostrou que a frequncia
fundamental foi o nico parmetro resistente s diferentes condies de registro e que a proporo
harmnico-rudo (HNR) foi o parmetro mais sensvel.

Protocolos de gravao
No existe uma normatizao com relao aos protocolos utilizados para anlise acstica, mas
existem sugestes de tarefas fonatrias para fins clnicos, conforme sugeriu Behlau et al. (2001).
a. No registro do indivduo, alm de sua identificao, deve-se incluir pelo menos a
emisso de uma vogal sustentada e um trecho de uma sequncia automtica de fala
encadeada, a fim de se verificar o impacto da alterao de voz na inteligibilidade
de fala ou na efetividade da comunicao.
b. Sugere-se que o protocolo obedea sempre a mesma sequncia de tarefas fonatrias
para facilitar a posterior edio. Pelas sugestes do Centro de Estudos em Voz, o
protocolo inclui as vogais [e], [a], [i] e [u] na frequncia e intensidades habituais
do falante, emitidas isoladamente e sustentadas; e, ainda, incluem-se os dias da
semana, os meses do ano, a contagem de 1 a 30, uma emisso de voz cantada em
Parabns a voc e, por fim, um depoimento sobre a prpria voz.
c. Conforme dito anteriormente, deve-se selecionar o material de fala conveniente
para a anlise que se prope, especialmente, com fins cientficos.
d. Para anlise de qualidade vocal, use preferencialmente uma amostra de fala
encadeada.
e. Para a anlise de frequncia fundamental e seus ndices de perturbao (jitter,
shimmer, tremor e vibrato), devem ser registradas vogais sustentadas e no fala
encadeada; h sugestes de que sejam analisadas uma vogal aguda [i] e outra grave
[o], para melhor descrio e entendimento das perturbaes.

16

LABORATRIO DE VOZ

UNIDADE I

f. Lembre-se que quanto maior for o desvio vocal a ser analisado, mais cuidados e
maior nmero de anlises devem ser realizadas.
g. muito comum que acontea problemas tcnicos nos registros e falhas
nas gravaes, portanto, aps cada gravao, verifique se est tudo
dentro do proposto e esperado.

Sistemas de gravao
indicado que as gravaes sejam registradas no prprio computador. Quando isso no for possvel,
seguem aqui algumas sugestes de gravadores para registro do material sonoro.
a. Caso utilize algum gravador, ele deve ser profissional, condensador, mono,
unidirecional, com sensibilidade mnima de -60dB e deslocado da unidade de
gravao, para que seja evitada a captao do rudo do maquinrio.
b. Os gravadores de fita cassete, pouco utilizados atualmente, permitem apenas a
extrao da frequncia fundamental e a anlise espectrogrfica descritiva. No
utilize as fitas minicassetes nem as cassetes de longa durao (C90 ou C120), porque
sua resistncia menor.
c. Os gravadores profissionais com fita DAT (Digital Audio Tapes) apresentam boa
qualidade e durabilidade de registro, mas tm cado gradualmente no desuso por
conta da evoluo dos minidiscs.
d. Minidiscs profissionais (no os populares) so uma tendncia moderna de gravao
e oferecem os resultados qualitativos mais prximos dos resultados obtidos pelas
gravaes feitas diretamente no computador. Entretanto, deve-se ter cautela na
passagem dos arquivos para o computador ou para outras mdias, porque o sistema
de compresso pode alterar parmetros acsticos mais sensveis.
e. Os Minidiscs populares possuem boa qualidade quando comparados aos no
profissionais, mas no so indicados para gravaes cientficas.
f. O CD-R (recordable compact disc) e o CD-RW (compact disc rewritable)
so considerados excelentes mdias para o registro de vozes, tanto no quesito
durabilidade como na fidelidade da qualidade dos arquivos gravados.
g. As fitas VHS (fitas de vdeo) podem ser analisadas somente auditivamente ou
perceptualmente e no acusticamente, visto que o sinal geralmente insuficiente
para uma anlise acstica de qualidade e acontece um acrscimo de energia nas
regies agudas do espectro do som. Somente em situaes de extrema necessidade
analisa-se acusticamente os registros de uma fita VHS.

17

UNIDADE I LABORATRIO DE VOZ

Anlise qualitativa do sinal sonoro


No tocante aos sinais acsticos, ressalta-se nesta seo somente os pontos importantes para
identificao dos sinais acsticos vocais passveis de anlise e confiveis, haja vista a necessidade de
prvios conhecimentos fsicos e acsticos bastante tcnicos por parte do leitor. A quem interessar,
recomenda-se a leitura (leitura complementar) do documento Workshop on Acoustic Analysis,
elaborado por Titze (1995) e apresentado por Behlau et al. (2001), com base nele, apresenta-se
aqui, resumida e didaticamente:
a. Sinal tipo 1: um sinal quase que peridico e permite mensuraes de F0, jitter,
shimmer, harmonicidade e anlise qualitativa das perturbaes de onda. Vozes
normais ou levemente alteradas produzem sinais desse tipo.
b. Sinal tipo 2: um sinal acstico que apresenta alteraes qualitativas, como
bifurcaes, intermitncia, sub-harmnicos e modulaes. Sugere-se que seja
avaliado somente o traado espectrogrfico deste sinal, pois as mensuraes
acsticas podem se apresentar comprometidas. A maior parte das vozes patolgicas
produzem um sinal desta natureza.
c. Sinal tipo 3: um sinal aperidico ou catico, sem uma estrutura aparente, que
no permite mensurao confivel e nem a anlise visual, como nos sinais do
tipo 2. Vozes patolgicas como nos casos de disfonias neurolgicas ou disfonias
espasmdicas so caractersticas.
Figura 2: Exemplo esquemtico de sinal do tipo 1 (adaptado de BEHLAU et al., 2001).

Figura 3: Exemplo esquemtico de sinais do tipo 2 e 3, respectivamente (adaptado de BEHLAU et al., 2001).

18

LABORATRIO DE VOZ

UNIDADE I

Com relao aos sinais sonoros, pode-se dizer que a obteno de medidas acsticas
e a anlise do traado espectrogrfico confivel somente nos sinais do tipo 1. As
vozes patolgicas ou disfnicas, com poucos desvios, apresentam sinais do tipo 2 e
permitem a anlise confivel do traado espectrogrfico. Nos sinais do tipo 3, que
so caracterizadas por vozes bastante desviadas, a anlise acstica no confivel e
a anlise perceptivo-auditiva a indicada e soberana.

cuidados especiais na avaliao acstica, liste os protocolos de


gravao para que as tarefas fonatrias fiquem bem-definidas para
voc. Faa tambm uma descrio, sucinta, dos 3 tipos de sinais listados
anteriormente e sua associao com os tipos de vozes esperadas.

19

ESPECTROGRAFIA
ACSTICA

UNIDADE II

CAPTULO 1
Conceito e fundamentos associados
H, em vrios estudos, a tentativa de definio e anlise dos diferentes parmetros que se alteram
na presena de uma patologia de voz, uma preocupao com a anlise detalhada de parmetros
acsticos, tais como o pitch, jitter, shimmer e rudo.

A avaliao acstica realiza mensuraes do sinal sonoro vocal. A anlise espectrogrfica


acstica mede a distribuio espectral da onda sonora vocal, detectando sutilezas do sinal vocal
e fornecendo uma representao tridimensional, melhor detalhada a seguir. Esta representao
revela dados sobre as fontes do som da voz, friccionais ou glticas, e ainda caractersticas de
ressonncia do trato vocal. Por meio do espectrograma, possvel identificar caractersticas
temporais da onda sonora, tais como: harmnicos vocais e regularidade no traado, formantes das
vogais, regies de incremento de energia das consoantes, definio de frequncia ou intensidade
(BEHLAU et al., 2001; BEHLAU e RUSSO, 1993; ELLIOT et al., 1995; SATALLOF et al.,
1990).
Didaticamente, para melhor entendimento da espectrografia, seguem algumas consideraes
pertinentes: por meio de um mtodo nmero chamado FFT (Fast Fourrier Transform) que
as ondas sonoras complexas2 das vogais so decompostas em seus diferentes constituintes
(frequncia e amplitude), estas componentes constituem a srie harmnica do som, sendo que
existe uma frequncia fundamental (F0 primeiro harmnico) e todos os outros componentes
harmnicos so considerados mltiplos inteiros dessa F0. Duas representaes principais so
utilizadas na anlise acstica: a representao do sinal no domnio do tempo, que a sequncia
temporal de amplitudes em determinada taxa de amostragem (forma de onda), e a representao
no domnio das frequncias, que explicita a distribuio dos componentes sonoros (harmnicos
e formantes) no espectro audvel. muito comum uma representao que mostra a variao
espectral no tempo, por meio da concatenao de anlises espectrais sucessivas. o caso dos
espectrogramas (figura 5), que so uma representao grfica em dois ou trs eixos ortogonais,
dos quais um est ligado ao tempo e o outro s frequncias. A amplitude dos parciais harmnicos
pode ser representada em um terceiro eixo ou por meio da intensidade dos pontos em um grfico
bidimensional, conforme se observa na figura 4:
2 Pode ser entendida como uma sobreposio de duas ou mais ondas sinusoidais (ondas seno) <http://en.wikipedia.org/wiki/Sine_wave>.

20

ESPECTROGRAFIA ACSTICA

UNIDADE II

Figura 4 Os dois grficos referem-se a uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada
por um tenor, na nota D 3 (261.6 Hz). H uma representao da amplitude no eixo vertical e do tempo no eixo
horizontal. Em ambos ocorrem representaes no domnio do tempo, sendo o primeiro com a durao total e o
segundo com os primeiros 100 milissegundos.

Legenda: Time Tempo; (s) segundos.

21

UNIDADE II ESPECTROGRAFIA ACSTICA


Figura 5 Espectrograma. O grfico acima se refere mesma gravao, de cerca de 2.1 segundos de uma
vogal [a] sustentada por um tenor, na nota D 3 (261.6 Hz). A representao em questo est no domnio
das frequncias (eixo vertical) de todo o sinal, visualizando-se a variao do tempo (eixo horizontal) e pode-se
observar tambm a amplitude do sinal no grau de escurecimento do traado.

Legenda: Time Tempo; (s) segundos; Frequency Frequncia; (Hz) Hertz.

importante ressaltar que a representao no domnio das frequncias pode assumir formas
bastante distintas, de acordo com a escolha do intervalo temporal sobre o qual se far a anlise
espectral. H sempre uma compensao entre as resolues temporais e de frequncia: quanto mais
resoluo temporal, menos resoluo em frequncia, e vice-versa.
Encontramos as expresses wide-band (banda larga) e narrow-band (banda estreita) para as
filtragens realizadas pelas transformadas de Fourier em intervalos temporais curtos e em intervalos
mais longos, respectivamente. Na anlise vocal, deve-se sempre buscar o intervalo mais adequado
para cada caso, j que as rpidas variaes consonantais demandam um intervalo curto e a anlise
vocal um intervalo mais longo. Didaticamente, os filtros de banda estreita privilegiam a visualizao
dos harmnicos e os filtros de banda larga privilegiam a visualizao de formantes.
A figura a seguir, retirada do Handbook of Phonetic Sciences, ilustra os efeitos dessa escolha,
utilizando-se uma banda estreita de cerca de 45 Hz e uma banda larga de cerca de 300 Hz. Nesse
caso, o intervalo temporal da filtragem com banda larga 6.6 maior do que o da banda estreita.

22

ESPECTROGRAFIA ACSTICA

UNIDADE II

Figura 6 Os grficos se referem a trs gravaes da frase Thats wonderful, em entonaes distintas:
a) entonao normal; b) tom de pergunta com surpresa; c) entonao excitada, com destaque nas
palavras that e wonderful. A linha superior traz espectrogramas com banda estreita de filtragem,
evidenciando os harmnicos e a inferior com banda larga, evidenciando os formantes
(fonte: Handbook of Phonetic Sciences, p. XX).

A anlise espectrogrfica oferece dados sobre a fonte do som e o sistema de


ressonncia, evidenciando tambm aspectos temporais da onda sonora.
O espectrograma um grfico tridimensional e que apresenta a variao do tempo
no eixo horizontal, a variao da frequncia no eixo vertical e a intensidade no grau
de escurecimento do traado.
Um espectrograma de faixa estreita ou banda estreita (filtro de 45 Hz) evidencia os
harmnicos do som, enquanto que um espectrograma de faixa larga ou banda larga
(filtro de 300 Hz) evidencia os formantes do som.

23

CAPTULO 2
Terminologia associada
Para o melhor entendimento da espectrografia acstica, faz-se necessrio a definio de uma
terminologia frequentemente utilizada e que de interesse para a atuao clnica.

Frequncia, frequncia fundamental (F0) e


Pitch
A frequncia um atributo fsico do sinal: velocidade de repetio de uma onda (BAKEN e
ORLIKOFF, 2000).
A frequncia fundamental (F0) uma medida objetiva, um atributo fsico do sinal: velocidade de
repetio de uma onda (BAKEN e ORLIKOFF, 2000). a velocidade na qual uma forma de onda
se repete por unidade de tempo (ciclos por segundo), sendo determinada fisiologicamente pelo
nmero de ciclos que as pregas vocais fazem em um segundo (PINHO e CAMARGO, 2001).
tambm conhecida como frequncia da voz e fisiologicamente est relacionada frequncia de
vibrao das pregas vocais. Este parmetro o reflexo das caractersticas biodinmicas das pregas
vocais e de sua integrao com a presso subgltica. Portanto, qualquer ajuste que reduza os ciclos
glticos reduzir tambm a frequncia fundamental, e o contrrio tambm (BEHLAU et al., 2005).
De maneira didtica e para melhor elucidao, quanto menor a frequncia fundamental, mais grave
apresenta-se o som. O contrrio tambm vlido, quanto maior a F0, mais agudo apresenta-se o som.
Dentre os parmetros acsticos, a F0 tem se mostrado o mais consistente parmetro entre diferentes
sistemas de anlise acstica, assim como o parmetro menos sensvel s caractersticas de gravao
da voz (BEHLAU et al., 2001; BARROS e CARRARA-DE ANGELIS, 2002).
Ainda no que se relaciona com a frequncia de uma voz, importante que seja feita a diferenciao
entre F0 e Pitch: este a sensao psicofsica da frequncia fundamental, portanto, no deve ser
confundida com a medida da frequncia em si. O Pitch aumenta com a elevao da F0, mas essa
relao no linear, isso ocorre porque nosso sistema auditivo mais sensvel a algumas mudanas
de frequncias que outras (BEHLAU et al., 2001).
Segundo Behlau et al. (1985), as frequncias fundamentais mdias para homens, mulheres e crianas,
em uma populao de 90 sujeitos da cidade de So Paulo, so respectivamente: 113 Hz, 204 Hz e
235 Hz. No entanto, estas medidas no se apresentam estticas; na voz cantada, por exemplo, so
comuns F0 abaixo dos 100 Hz em homens; no entanto, os tenores podem conseguir alcanar os 600
Hz (BEHLAU e RUSSO, 1993). Para as mulheres, a frequncia fundamental mais baixa estar perto
dos 150 Hz, enquanto que o limite para um soprano pode ultrapassar os 1.300 Hz (TITZE, 1994).

24

ESPECTROGRAFIA ACSTICA

UNIDADE II

A figura 7 traz a representao grfica do clculo de F0 para uma vogal sustentada


cantada:
Figura 7 Curva de variao da frequncia fundamental de uma nota cantada C3 (261.6 Hz). Ressalta-se que as
representaes grficas das curvas de F0 so denominadas como Pitch (Hz), pelo programa Praat.

Legenda: Time Tempo; (s) segundos; Pitch F0; (Hz) Hertz.

Intensidade, Loudness e amplitude


A intensidade, por sua vez, est ligada diretamente presso subgltica da coluna area. Esta
depende de fatores como amplitude de vibrao e tenso das pregas vocais, mais especificamente
da resistncia gltica. As variaes de intensidade so tambm dependentes da frequncia. Vozes
agudas tendem a ser mais intensas, pois o aumento da tonicidade larngea gera maior resistncia
gltica e consequentemente maior intensidade (BEHLAU e PONTES, 1995; BEHLAU e REHDER,
1997). Ainda no que se refere intensidade, vale ressaltar que a forma como um ouvinte julga um
som como fraco, adequado ou forte uma avaliao perceptiva, portanto, refere-se sensao
psicofsica da intensidade: Loudness (BEHLAU et al., 2001).
Didaticamente, a amplitude de uma onda a medida da magnitude da mxima perturbao do meio
durante um ciclo da onda. A unidade utilizada para a medida depende do tipo da onda. Por exemplo,
a amplitude de ondas de som e sinais de udio pode ser expressa em presso sonora (Pascal Pa),
como se d na figura 8. tambm comum que se utilize uma escala de decibis (dB) e esta escala
comumente usada na prtica, conforme se v na figura 9.

25

UNIDADE II ESPECTROGRAFIA ACSTICA


Figura 8 O grfico refere-se a uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada por um tenor,
na nota D 3 (261.6 Hz). H uma representao da amplitude no eixo vertical e do tempo no eixo horizontal. Ocorre
aqui representao no domnio do tempo, nos primeiros 100 milissegundos.

Legenda: Time Tempo; (s) segundos.

A figura 9 traz a representao grfica de uma curva de intensidade:

Figura 9 O grfico refere-se a uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada e mostra
a curva de variao da intensidade (imagem gerada pelo programa Praat).

Legenda: Time Tempo; (s) segundos; Intensity: Intensidade; (dB) decibis.

Fontes e filtros do aparelho fonador


Tendo por base estudos preliminares, Gunnar Fant desenvolve e publica a sua Teoria Acstica
de Produo da Fala, em 1970. Esta teoria tem sido utilizada para explicar o modelo de produo

26

ESPECTROGRAFIA ACSTICA

UNIDADE II

da voz e relaciona trs fenmenos acsticos: fonte sonora, filtro acstico e radiao. Para melhor
entendimento da combinao desses fenmenos, hipoteticamente no dependentes, segue uma
breve explicao: para qualquer som produzido no aparelho fonador, existe uma fonte sonora (ou
de rudo) que proporciona a entrada de energia acstica no sistema e tambm um filtro que se
responsabiliza por modificar e amplificar seletivamente (filtrar) os sons provenientes desta fonte,
os quais sero irradiados (efeito de radiao) pela boca (FANT, 1970 apud KENT e READ, 1992;
TITZE, 1994).
A fonte sonora pode ter sua origem associada a trs fatores: vozeamento, rudo turbulento do ar
originado por constrio e combinao das duas fontes citadas anteriormente. No que diz respeito
ao vozeamento, o som produzido exclusivamente pela vibrao das pregas vocais e constitui a fonte
de energia sonora necessria produo das vogais (FANT, 1970 apud KENT e READ, 1992). O
rudo turbulento est relacionado produo das consoantes pelo estreitamento ou pela obstruo
dos articuladores do trato vocal passagem do ar e, neste caso, as pregas vocais no so utilizadas
como fonte. Por fim, possvel a combinao de sons vozeados pelas pregas vocais e de um rudo
turbulento gerado por constrio do trato vocal, originando as consoantes vozeadas, como, por
exemplo, [v] e [z]. importante frisar que por meio da vibrao das pregas vocais produzida uma
srie de ondas relativamente peridicas e complexas, sendo que o nmero de ciclos dessas ondas
determina, em Hz, o valor da frequncia fundamental de uma voz, F0, e uma srie harmnica.
J o filtro comparado com um tubo (Figura 10) que contm um dos lados abertos, representando
a boca, e o outro fechado, representando as pregas vocais. O tubo o ressonador e vai favorecer ou
abafar seletivamente as frequncias de acordo com sua forma e seu comprimento. Seguindo essa
analogia e exemplificando o que foi dito anteriormente, tratos vocais mais compridos favorecem
as frequncias mais baixas e os mais curtos favorecem as frequncias mais altas. As frequncias
de ressonncia so denominadas de formantes e so representadas por picos no espectro sonoro.
Tradicionalmente, o trato vocal possui quatro ou cinco formantes mais relevantes, os quais sofrero
o efeito de radiao e sero irradiados em todas as direes ao sair da boca. Nesse processo, ocorre
uma nova filtragem do tipo passa-altas, pois h uma tendncia de as altas frequncias propagaremse em linha reta, enquanto que as baixas tendem a se difratar (espalhar). Portanto, a uma longa
distncia do locutor, predominam as altas frequncias (FANT, 1970 apud KENT e READ, 1992).
A figura 11 mostra o processo de produo das vogais como um todo e ilustra o que foi dito
anteriormente.
Figura 10 Acima, um tubo uniforme com um dos lados fechados, simulando o trato vocal (adaptado de KENT;
READ, 1992).

27

UNIDADE II ESPECTROGRAFIA ACSTICA


Figura 11 Representao esquemtica do processo de produo de vogais fundamentado na teoria fontefiltro. A equao diz que a presso espectral P(s) o resultado do espectro produzido pela fonte gltica (pregas
vocais), modificada pela funo de transferncia T(s) do trato vocal e pelo efeito de radiao R(s). Pelo (s)
entende-se por diferentes frequncias amplificadas ou produzidas durante todo o processo (adaptado de KENT;
READ, 1992).

O som larngeo produzido pela vibrao das pregas vocais, considerada como
fonte ou fonte gltica (associada produo de sons vozeados vogais e/ou rudo
turbulento-consoantes vozeadas). O filtro pode ser considerado o trato vocal que
vai modificar ou modelar o som originado na fonte, abafando ou amplificando
frequncias, de acordo com sua conformao anatmica. Sendo assim, o trato
vocal (filtro) responsvel pela maior parte da informao de um sinal vocal, mas a
qualidade e o tipo de sonoridade percebidos so decorrentes da combinao desses
dois fenmenos: fonte e filtro.

Harmnicos e Formantes do som


De acordo com Behlau e Russo (1993), a vibrao das pregas vocais determina a frequncia gltica
da emisso e, por definio, a frequncia da onda complexa a frequncia do primeiro harmnico
(F0).

28

ESPECTROGRAFIA ACSTICA

UNIDADE II

bastante comum a abordagem do aparelho fonador a partir de um modelo caracterizado como


fonte-filtro (source-filter). Didaticamente, e reforando o que foi dito, de um lado, atuam como
fonte sonora principalmente as vibraes das pregas vocais, que no caso das vogais geram um som
com uma frequncia fundamental F0 e certo contedo harmnico. O trato vocal atua como um filtro,
apresentando diferentes sees ressonantes capazes de se acoplar de diversas maneiras. As variadas
formas de interao entre fonte e filtro geram a riqueza acstica que caracteriza a expresso vocal
humana. Se o espectro sonoro do som produzido pelas pregas vocais pode ser considerado o mesmo
para as diferentes vogais de uma mesma frequncia, so as caractersticas de ressonncia do trato
vocal que geram as diferenas de timbre claramente perceptveis (SHADLE, 1999).
Visto de outro modo: os harmnicos so gerados pelas vibraes das pregas vocais. A energia relativa
entre os harmnicos modificada pela forma do trato vocal, dando origem s diferentes sonoridades
vocais. Dependendo da forma assumida pelo trato vocal, certas regies de frequncia so mais
amplificadas do que outras, dando origem aos formantes, que so, dentre outras caractersticas,
responsveis pela diferenciao entre as vogais. A figura a seguir traz o espectrograma de uma
gravao de uma voz masculina, no treinada, sustentando a nota D 2 (130.8 Hz), na sequncia
das vogais [a], [e], [i], [o] e [u]. Pode-se observar que no h variao da frequncia fundamental
nem da energia mdia dos primeiros harmnicos.

Legenda: Time Tempo; (s) segundos; Frequency: Frequncia; (Hz) Hertz.


Figura 12 Espectrograma de uma gravao de voz masculina no treinada, emitindo a nota D 2 (130.8 Hz), sustentando
sucessivamente as vogais [a], [e], [i], [o], [u], com aplicao de filtro de banda estreita (imagem gerada pelo programa
Praat).

Os harmnicos aparecem no espectrograma como estrias dispostas horizontalmente com espao


regular entre si e mltiplos inteiros da frequncia fundamental, tendo maior importncia em
anlise acstica os harmnicos at 5.000 Hz. A distribuio dos harmnicos no espectro oferece
uma indicao sobre a ressonncia e projeo vocal, fatores esses de grande importncia para a
voz de um cantor. Ao alcanar as cavidades de ressonncia, alguns desses harmnicos, quando

29

UNIDADE II ESPECTROGRAFIA ACSTICA


sua frequncia tem compatibilidade com a do trato vocal, so amplificados, criando os formantes
(BEHLAU et al., 2001; CORDEIRO et al., 2007; PINHO, 2001; SUNDBERG, 1991).
Os formantes, na maioria das vezes, so expressos por meio de seu valor mdio em Hertz (Hz), ou
ciclos por segundo, e designados por F1, F2, F3... Fn, de modo progressivo (BEHLAU, 2001). De
acordo com Dinville (1993, p. 45), os formantes so frequncias que servem para determinar o
timbre. Dinville (1993) e Cordeiro et al. (2007) descrevem ainda a localizao no trato vocal de cada
formante afirmando que o primeiro formante (F1) ocorre na cavidade posterior da boca e est em
torno de 250 a 700 Hz. Dinville (1993) afirma que o segundo formante (F2) fica situado na cavidade
oral entre os valores de 700 a 2.500 Hz. Por sua vez, Cordeiro et al. (2007) concordam que o segundo
formante fica localizado na parte anterior da cavidade oral. Segundo Cukier e Camargo (2005), o
primeiro formante (F1) est relacionado abertura da boca e altura da lngua na cavidade oral, e o
segundo formante (F2) tem relao com o deslocamento anteroposterior da lngua. Para Sundberg
(1987 apud BARRICHELO 2007), o primeiro formante (F1) sensvel abertura da mandbula,
j que quanto maior a abertura da boca, mais aguda fica a frequncia do formante. Para Camargo
et al. (2007), as frequncias dos trs primeiros formantes determinam a identidade fontica da
vogal, especialmente a dos dois primeiros. Para Cordeiro et al. (2007), o quarto formante (F4)
provavelmente tem ligao com o comprimento do tubo larngeo. Em relao ao quinto formante
(F5), no h referncia quanto ao local para sua produo, mas praticamente unnime que o F4 e
F5 so responsveis pela qualidade vocal e pelo timbre da voz (formante do cantor) (CORDEIRO et
al., 2007).
Corroborando o que foi dito anteriormente e em acrscimo a essas informaes, de acordo com
Pinho (2001), para que os formantes sejam gerados, necessria a produo de harmnicos
pela mucosa das pregas vocais, dessa forma, pode-se pressupor que a produo de harmnicos
e formantes relacionam-se integridade da mucosa das pregas vocais. Quanto maior a srie de
harmnicos, mais individualizados e com traado linear, maior a estabilidade da emisso e
mais rica a qualidade vocal (BEHLAU et al., 2005; SATALLOF et al., 1990). Tal representao
tanto pior quanto maior o comprometimento vibratrio das pregas vocais, como nos casos de
rouquido ou aspereza (BEHLAU et al., 2001). Nesses casos, o espectrograma ser caracterizado
pelo espaamento irregular entre os harmnicos, pela perturbao na forma da onda, pelo traado
grfico irregular e, ainda, pela amplitude da frequncia fundamental baixa, o que caracteriza a
falta de intensidade vocal do indivduo devido insuficincia gltica (BEHLAU; RUSSO, 1993).
Veja, abaixo, dois exemplos de espectrogramas: o primeiro com uma srie harmnica deficiente, o
que sugere uma voz patolgica e o segundo com uma rica srie harmnica, o que sugere uma voz
treinada.

30

ESPECTROGRAFIA ACSTICA

UNIDADE II

Figura 13 Espectrograma de uma gravao de uma voz no treinada, emitindo a vogal sustentada [u], com aplicao de
filtro de banda estreita, evidenciando uma deficincia da srie harmnica, visvel at a faixa de 1.000Hz, aproximadamente,
sugerindo uma voz patolgica (imagem gerada pelo programa Praat).

Legenda: Time Tempo; (s) segundos; Frequency: Frequncia; (Hz) Hertz

Figura 14 Espectrograma de uma gravao de uma cantora profissional, emitindo a vogal sustentada [a], com
aplicao de filtro de banda estreita, evidenciando uma riqueza de harmnicos at a faixa de 8.000 Hz (imagem
gerada pelo programa Praat).

Legenda: Time Tempo; (s) segundos; Frequency: Frequncia; (Hz) Hertz. Ct cantor(a).

31

UNIDADE II ESPECTROGRAFIA ACSTICA


Os formantes determinam a qualidade das vogais e contribuem muito para o timbre pessoal do
cantor (CORDEIRO et al., 2007). Assim, em uma anlise acstica, observa-se que os primeiros
cinco formantes so os de maior interesse, sendo que os trs primeiros so responsveis pela
identidade das vogais e possuem caractersticas instveis, j que podem apresentar variaes de
vogal para vogal, enquanto que o quarto e o quinto formantes no tm a mesma variao, sendo
ento considerados estveis e responsveis pelo timbre pessoal, ou seja, pela qualidade e pelo brilho
da voz (BEHLAU, 2001). Sobre esta questo, Medeiros (2004) ressalta que h uma diferena entre o
padro formntico das vogais faladas em relao s vogais cantadas. O que se observa que na vogal
cantada h uma distoro do formante, tanto acusticamente quanto articulatoriamente em relao
vogal falada, ocorrendo uma sobreposio do primeiro formante das vogais [a], [e] e [o]. Dessa
forma, fica sendo responsabilidade do segundo formante a diferenciao acstica dessas vogais, j
que no se observa a sobreposio do segundo formante.

O formante do cantor
O cantor treinado tem a capacidade de sobressair-se ao som de uma orquestra sem fazer uso de
amplificao sonora como o microfone e sem prejudicar seu aparelho fonador. Na maioria das vezes,
o responsvel por esse fenmeno o formante do cantor (CORDEIRO et al., 2007; SUNDBERG,
1974).
O formante do cantor encontrado geralmente em vozes com treinamentos especficos do canto
erudito e definido pela amplificao sonora das frequncias entre 2.000 e 4.000 Hz, sendo
demonstradas no espectro acstico pela juno do terceiro, quarto e quinto formantes superiores
(F3, F4 e F5). Isso se deve sua localizao na regio aguda e ao elevado pico de amplitude, desta
forma, no se tem ocorrncia em outras vozes ou mesmo em instrumentos da orquestra (BEHLAU
et al., 2001; CORDEIRO et al., 2007; SUNDBERG, 1987). Segundo Fant (1970 apud KENT e READ,
1992), o trato vocal, por meio do controle ativo no canto, pode incrementar de 3 a 5 dB na amplitude
das frequncias agudas, alm do acrscimo natural de 10 a 15 dB j existente.
Segundo Sundberg (1987 apud BARRICHELO et al., 2005) a tcnica lrica utilizada pelos cantores
de pera, que apresentam mecanismos inteligentes para destacarem suas vozes da orquestra, por
isso suas vozes apresentam um pico espectral intenso e largo em torno de 3.000 Hz. este pico que
proporciona aos harmnicos uma maior amplitude relativa e o agrupamento dos formantes que,
conforme descrito por este autor, proporciona ao ouvinte a sensao de brilho e projeo vocal.
Ratificando, o responsvel pelo fenmeno descrito o formante do cantor e a ocorrncia desta
manifestao est relacionada ao abaixamento da laringe e ao alargamento da cavidade farngea,
embora este no seja o nico mecanismo existente.

Abaixo, seguem figuras que contribuem para o entendimento sobre o formante do cantor:

32

ESPECTROGRAFIA ACSTICA

UNIDADE II

Figura 15 Espectro do formante do cantor e sua comparao com a orquestra, note que ocorre um pico
espectral por volta da regio de 3.000 Hz (adaptado de YASUNORI et al., 2005).

33

CAPTULO 3
Parmetros acsticos

F0 e seus ndices de perturbao


Jitter e shimmer
As variaes em altura da F0 e em intensidade da amplitude de cada perodo so respectivamente
denominadas jitter e shimmer. Estes se apresentam como medidas de estabilidade fonatria
(BEHLAU, 1997; 2001).
A perturbao da frequncia em curto prazo normalmente designada por jitter, representando a
variao da frequncia fundamental de um ciclo para outro (BAKEN, ORLIKOFF, 2000; BEHLAU
et al., 2001) e indica a variabilidade da frequncia. uma medida de curto termo (ciclo a ciclo)
de variabilidade involuntria do F0, o que permite determinar o grau de estabilidade do sistema
fonatrio (BAKEN; ORLIKOFF, 2000; BEHLAU et al., 2001). Os resultados da perturbao so
apresentados em milissegundos ou microssegundos (BAKEN; ORLIKOFF, 2000). A partir do
momento em que o jitter no zero, a perturbao de frequncia um correlato acstico dos
padres vibratrios errticos, ou seja, uma medida que representa a aperiodicidade vocal (LAVER,
1981 apud BEHLAU et al., 2001). Os valores de jitter em indivduos normais podem representar
uma pequena variao na massa ou na tenso das pregas vocais, na distribuio do muco sobre
elas, na simetria das estruturas ou ainda na atividade muscular ou neural envolvida (BAKEN, 1987
apud BEHLAU et al., 2001). Entretanto, os valores de jitter encontram-se aumentados na presena
de leses que afetam as pregas vocais, devido ao aumento da aperidiodicidade nas vibraes
(BEHLAU et al., 2001) e torna-se no confivel quando a aperiodicidade aumenta (LAVER, 1981
apud BEHLAU et al., 2001).
Os softwares disponveis no mercado oferecem as medidas de jitter, cada qual ao seu critrio e
disponibilidade. Certamente, o software Praat um programa que oferece as cinco medidas de
jitter, todas relacionadas ao mesmo fenmeno e descritas por Behlau et al. (2001). O jitter local/
absoluto a mdia dos valores absolutos das diferenas entre perodos consecutivos do trecho
analisado e expresso em segundos ou em suas subdivises. O jitter local derivado do valor
calculado acima dividido pelo perodo mdio do trecho em questo, expresso em porcentagem (%).
Os demais clculos levam em conta mais perodos vizinhos, efetuando uma espcie de filtragem
que desconsidera alteraes muito rpidas. So eles: jitter (rap) relative average perturbation
jitter (ppq5) five point period perturbation quocient e jitter (ddp), cujo valor trs vezes o
valor do jitter (rap). Com exceo do jitter local/absoluto, os demais valores de jitter so relativos e
sempre expressos em %.
Os valores limites de normalidade para jitter podem variar de acordo com o software ou autor
estabelecido, por exemplo: o valor limite de normalidade para o jitter local de 0.5% (BEHLAU et

34

ESPECTROGRAFIA ACSTICA

UNIDADE II

al., 2001). Boersma traz no manual do Praat o valor de 1.04% como esse limite, mas indica que esse
valor deve ser provavelmente menor, j que as medies realizadas no clculo foram influenciadas
por rudos. O valor de referncia estabelecido por Viera et al. (1997) para vozes no disfnicas o de
0,30%. V-se que no acontece uma padronizao das medidas de jitter dentre os autores, portanto,
esta medida deve ser usada com cautela.
Com relao s sugestes na obteno das medidas de jitter, vale ressaltar que deve ser medido por
anlise de vogais sustentadas, numa nica frequncia, sem variao musical ou de intensidade, em
emisso habitual, eliminando-se o incio e o fim da produo, por suas caractersticas irregulares
(BEHLAU et al., 2001).
Outro parmetro que deve ser levado em considerao refere-se medida da variao da amplitude
da vibrao. Esta medida recebe o nome de shimmer e o seu conceito pode ser explicado por analogia
ao seu companheiro de perturbao, o jitter. Shimmer representa a variao da amplitude de ciclo
para ciclo e permite quantificar as alteraes mnimas da amplitude do sinal, com base em cada ciclo
fonatrio (COLTON; CASPER, 1998). Se, em termos de fonao, a voz humana fosse absolutamente
estvel, tal medida seria zero. No entanto, assim como o jitter, havendo uma patologia em termos
de funcionamento da laringe, por exemplo, tais valores sero sempre elevados.
Assim como acontece no jitter, existe uma diversidade de valores limites para a normalidade do
shimmer, dependendo do programa ou do autor escolhido para referncia. Pelo fato de o software
Praat oferecer com maior completude as medidas acsticas, ele citado como referncia. O respectivo
software oferece seis valores de shimmer: o shimmer local calculado de forma anloga ao jitter
local, sendo resultado da diviso da mdia dos valores absolutos das diferenas de amplitude entre
perodos vizinhos pela amplitude mdia do trecho analisado. tambm expresso em %. O shimmer
(local, dB), expresso em decibis, resultado da multiplicao por 20 do logaritmo de base 10 da
mdia dos valores absolutos das diferenas de amplitude. As outras medidas so shimmer (apq3),
shimmer (apq5), shimmer (apq11), shimmer (dpp), cujos mtodos de clculo esto detalhados no
manual do software.
Todas as medidas relativas de shimmer so oferecidas em porcentagem e o valor limite de shimmer
local de 3% (BEHLAU et al., 2001). Boersma e Weenink (2010) estabelecem 3,81% como um
limite para a patologia, no Praat.

Tremor e vibrato
Assim como o jitter e o shimmer, o tremor e o vibrato representam ndices de perturbao da
frequncia fundamental (F0) e possuem representaes espectrogrficas que podem ocasionar
dvida se no forem bem-compreendidas.
Fisiologicamente, o tremor vocal patolgico caracteriza-se pelo movimento rtmico da laringe, que
produz alteraes rtmicas de pitch e loudness durante a fonao. Estes movimentos larngeos so
muitas vezes acompanhados de tremor da cabea e de extremidades (INAMURA; TSUJI, 2006
apud ARONSON et al., 1968) e podem ser provenientes de um ou de vrios componentes da fala,

35

UNIDADE II ESPECTROGRAFIA ACSTICA


seja relacionado respirao, fonao ou articulao (BEHLAU et al., 2001). O tremor pode estar
presente apenas durante a fonao ou aparecer no repouso. Apesar de ser identificvel durante a
fala encadeada em alguns indivduos, mais facilmente reconhecido durante a emisso de vogal
sustentada. Casos graves de tremor vocal podem cursar com interrupes fonatrias similares
quelas da disfonia espasmdica de aduo. No que diz respeito ao tremor vocal fisiolgico, este
pode ocorrer em situaes de frio, estresse ou emoo, ou ainda, na presbifonia (BEHLAU et
al., 2001). Acusticamente e de maneira geral, o tremor neurolgico vocal caracteriza-se por uma
modulao de ordem de 1 a 20 Hz, sendo que o tremor lento varia de 1 a 2 Hz e uma oscilao de
10 Hz, aproximadamente, est associada ao tremor rpido, como nos casos de esclerose mltipla.
Estabelece-se o limite para normalidade, a frequncia e a amplitude do tremor ao redor de 1 a 2 Hz
(BEHLAU et al., 2001).
Ao contrrio do tremor, o vibrato caracteriza-se, acusticamente, pela modulao regular da
frequncia fundamental e utilizado pelos cantores lricos e por alguns populares como um
recurso esttico que confere expressividade ao canto. Pode ser visto como um tremor fisiolgico
ordenado e faz com que a F0 oscile para cima e para baixo, em uma amplitude pequena e algumas
vezes por segundo (DEJONCKERE et al., 1995). Normalmente, a variao do vibrato possui uma
mdia que fica entre 2 e 8 Hz em cantores lricos e a extenso da intensidade varia entre 2 e 3
dB. Ressalta-se que o vibrato pode ser de frequncia somente e/ou de amplitude (BEHLAU et al.,
2001). Fisiologicamente, o vibrato no um acontecimento bem-definido e h sugestes de que
pode ocorrer como uma oscilao da musculatura cricotireoidea, uma contrao alternada da
musculatura larngea e diafragmtica ou, tambm, como um tremor da musculatura respiratria e
do trato vocal. Mas nos cantores que possuem boa tcnica, como os eruditos, o vibrato controlado
e regular.
Abaixo, seguem dois exemplos, representados graficamente em espectrogramas, de vibratos. Em
ambos os casos, foram aplicados filtros de banda estreita.
O primeiro espectrograma (Figura 16) pode ser considerado como de um cantor com um treinamento
no to apurado quanto o cantor da figura 17, que pode ser visto como um cantor com excelente
treinamento tcnico, certamente, com tcnica lrica ou erudita.
Observe que, em ambos os grficos, ocorrem emisses de vogal sustentada cantada, em uma
nica nota, e os harmnicos encontram-se individualizados. Observa-se, ainda, um incremento de
energia (harmnicos mais escuros) ao redor de 3.000 Hz, onde est situado o formante do cantor.
Entretanto, nota-se no primeiro espectrograma, uma emisso entrecortada e pouca definio da
variao do vibrato e, j no segundo espectrograma, visvel a boa definio e regularidade do
traado espectrogrfico (harmnicos) e com considervel energia (harmnicos mais escuros).
Figura 17 Espectrograma de emisso de uma vogal sustentada, cantada, por cantor, evidenciando
um vibrato entrecortado e com intervalos irregulares (imagem gerada pelo software Gram 5.0).

36

ESPECTROGRAFIA ACSTICA

UNIDADE II

Figura 18 Espectrograma de emisso de uma vogal sustentada, cantada, por cantor erudito, evidenciando o
vibrato vocal (adaptado de BEHLAU et al., 2001) (imagem gerada pelo software Gram 5.0).

Medidas de rudo (HNR) ou harmonicidade


A harmonicidade ou Harmonic Noise Ratio (HNR) uma medida que relaciona a componente
harmnica com a componente de rudo da onda, ou seja, contrasta o sinal regular das pregas vocais
com o sinal irregular das pregas e do trato vocal (BEHLAU et al., 2001). Resumidamente, oferece
um ndice que relaciona o componente harmnico versus o componente de rudo da onda acstica.
A harmonicidade um dos parmetros acsticos que representa a medida de rudo presente no
sinal de voz. Representa o grau da periodicidade acstica (BOERSMA; WEENINK, 2003); esta
medida expressa em dB: se 99% da energia do sinal for peridica e 1% representar rudo, o HNR

37

UNIDADE II ESPECTROGRAFIA ACSTICA


10 * log10(99/1) = 20dB. A HNR de 0 dB significa que h energia igual nos harmnicos e no rudo.
Valores inferiores a 7 dB so necessariamente patolgicos (BEHLAU, 1997). Quanto mais elevada
a frequncia, maior o componente harmnico da onda acstica para indivduos normais, por isso,
geralmente, mulheres apresentam valores de harmonicidade mais elevados que homens.

Por exemplo, um falante saudvel pode produzir uma vogal sustentada [a] ou [i] com
um harmonicidade de cerca de 20 dB e um [u] em torno de 40 dB, a diferena vem das
altas frequncias em [a] e [i] versus as baixas frequncias em [u], resultando em uma
maior sensibilidade de HNR de jitter em [a] e [i] do que em [u]. Falantes roucos tero
um [a] com um harmonicidade muito menor do que 20 dB (BOERSMA, WEENINK,
2003).
Abaixo, para ilustrao, um exemplo de uma curva de harmonicidade. A harmonicidade
mdia do trecho medido de 31.2 dB, demonstrando uma voz normal e com boa HNR.
Foram eliminados os 100 milissegundos iniciais e finais do sinal gravado nos clculos
efetuados.
Figura 19 Curva de harmonicidade de uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada
por um tenor, na nota D 3 (261.6 Hz). H uma representao da harmonicidade no eixo vertical e do tempo no
eixo horizontal (imagem gerada pelo software Praat).

Legenda: Time Tempo; (s) segundos; Harm Harmonicidade; (dB) decibis.

1. A frequncia fundamental (F0) uma medida extremamente confivel,


mesmo em condies adversas de gravao.
2. A srie harmnica (infinita) produzida pela vibrao das pregas vocais,
sendo o primeiro harmnico denominado frequncia fundamental (F0).
3. Frequncia fundamental (F0) pode ser entendida como frequncia gltica
(Fg) e os harmnicos subsequentes so mltiplos inteiros da frequncia
fundamental. Como exemplo: se a F0 de uma voz 200 Hz, o segundo
harmnico possui o valor de 400 Hz e assim por diante.

38

ESPECTROGRAFIA ACSTICA

UNIDADE II

4. A srie de harmnicos to mais rica quanto melhor a coaptao gltica.


5. Formantes do som podem ser considerados como frequncias de
facilitao de ressonncia do trato vocal, que abafa ou amplifica
determinados grupos de harmnicos conforme a configurao de suas
estruturas.
6. Os formantes do som, assim como os harmnicos, apresentam uma srie
infinita e so mostrados pela frequncia mdia do grupo de harmnicos
que os integram (F1 primeiro formante, F2 segundo formante e assim
por diante).
7. As vogais utilizam apenas a fonte gltica em sua produo, o som
produzido considerado quase que peridico, somente as vogais tm
formantes.
8. As consoantes so sons aperidicos, considerados como rudos de
intensidade relativamente fraca quando comparadas com as vogais.
9. As consoantes no possuem formantes, mas, sim, regies de incrementos
de energia.
10. As perturbaes da onda acstica podem ser observadas em curto prazo,
por meio do jitter e shimmer, e em longo prazo, por meio do tremor e do
vibrato.
11. O componente de rudo pode ser gerado na glote ou em diferentes regies
do trato vocal.
12. Quanto maior o componente harmnico de uma voz, menor o ndice
de rudo que ela produz, gerando, assim, um considervel valor de
harmonicidade.
13. Quanto mais saudvel ou mais treinada uma voz, mais limpo o
espectrograma e no h o preenchimento dos espaos entre as faixas de
energia por estrias verticais, tambm conhecidas como recheio de rudo.
14. As anlises de parmetros isolados no traam o perfil vocal do indivduo.
Os dados precisam ser correlacionados com a avaliao clnica.
1. Se o quinto (5) harmnico possui um valor de 600 Hz, qual ser o valor da
frequncia fundamental desta voz?
2. Uma voz apresenta uma qualidade vocal rouca e com pitch grave,
para uma mulher, que foi diagnosticada como um quadro de Disfonia
Organofuncional, apresentando uma leso chamada de Edema de Reinke.

39

UNIDADE II ESPECTROGRAFIA ACSTICA


O que se pode esperar com relao frequncia fundamental dessa voz
que esteja rebaixada ou aumentada?
3. Um paciente apresenta um sulco vocal e com qualidade vocal julgada
como spera, qual o picth esperado (grave ou agudo)? Sua frequncia
fundamental rebaixada ou aumentada?
4. O que se esperaria de um espectrograma de uma voz dita normal? Que
seja limpo ou com recheios de rudo?
5. Os recheios de rudo so encontrados em vozes normais ou patolgicas?
6. Caso voc avalie um paciente que apresenta uma patologia vocal, por
exemplo, um ndulo, voc espera uma rica sequncia de harmnicos?
7. Se a frequncia fundamental de uma voz de 180 Hz, qual a medida do
7 harmnico vocal? Espera-se que seja um falante do gnero masculino
ou feminino?
8. Caso um paciente apresente uma leso de massa ou mesmo um edema
difuso nas pregas vocais, quais resultados voc esperaria das medidas de
jitter e shimmer? Alterados ou normais?

9. Se, aps a sua avaliao perceptivo-auditiva, julgar a voz em


questo como rouca ou soprosa, esperaria medidas de shimmer
normais ou alteradas?
10. Um valor extremamente alterado e aumentado de jitter pode ser indicativo,
fisiologicamente, de um controle adequado de vibrao das pregas vocais
ou inadequado?

40

CAPTULO 4
Parmetros auditivos e correlatos
espectrogrficos acsticos
Na realidade brasileira, no ano de 1999, Behlau publicou diversos correlatos espectrogrficos
acsticos vinculados a parmetros auditivos especficos. Os correlatos espectrogrficos podem ser
vistos como descries qualitativas do traado espectrogrfico de acordo com a qualidade associada.
Como os correlatos so diversos, sero mostrados, neste captulo, os espectrogramas relacionados
a qualidades vocais que frequentemente so encontradas na prtica clnica e seus correlatos
espectrogrficos acsticos, conforme se v abaixo.
Sugere-se a leitura do captulo 3 (Avaliao de Voz) do livro Voz I, de Mara Behlau,
para que voc tenha acesso e conhecimento das qualidades vocais listadas e de seus
correlatos espectrogrficos correspondentes, ou na prpria publicao feita pela
autora no ano de 1999.
Atente-se para os correlatos espectrogrficos descritos por Behlau (1999) e compare com os grficos
apresentados adiante, lembrando que cada correlato deve ser associado qualidade vocal em
questo, seguem:
a. qualidade vocal rouca: perturbao da forma de onda, registro dos formantes
substitudo por rudo e, dependendo da gravidade da leso que gera tal qualidade vocal,
os harmnicos podem no existir. Imagem de esburacamento no traado de faixalarga. Conforme dito, quanto maior o grau de rouquido, mais os formantes superiores
vo sendo decompostos. A marca fisiolgica da qualidade vocal rouca apresentar uma
a aperiodicidade de vibrao das pregas vocais e/ou fluxo de ar turbulento na glote,
como caracterstico nos casos de ndulos vocais ou nas fendas glticas;
b. qualidade vocal soprosa: apresenta nvel de energia reduzido no espectro, abaixo de
5.000 Hz; formantes fracos e claros (indicando rebaixamento da intensidade); o nvel
de energia que pode figurar acima de 5.000 Hz est relacionado presena de rudo
(ar no sonorizado), nota-se um preenchimento por meio de estrias verticais, no
espectrograma de faixa larga; quanto maior a soprosidade, mais escuras e definidas
apresentam-se as estrias na regio aguda do espectro e mais claras na regio mais
grave do espectro; no espectrograma de faixa estreita, os harmnicos so fracos,
com recheio de rudo entre eles, ou seja, entenda por uma imagem hachurada entre
as linhas dos harmnicos, o que configura os casos de pregas vocais com coaptao
insuficiente, como nas fendas glticas ou no sulco vocal.
c. qualidade vocal tensa: apresenta uma frequncia fundamental aguda e com alto
nvel de energia, o traado espectrogrfico bem-definido, o que caracteriza,
fisiologicamente, pouca massa em vibrao, como nos casos de sulco vocal (rigidez
de mucosa) ou na muda vocal incompleta.

41

UNIDADE II ESPECTROGRAFIA ACSTICA

Apresentao de diferentes qualidades vocais


Em todos os trechos foram utilizadas vogais sustentadas, com registros intermitentes, para facilitar
a leitura dos traados espectrogrficos. As emisses apresentam-se intermitentes, como dito e na
seguinte ordem de qualidade vocal: rouca, soprosa e spera-comprimida.
As imagens foram geradas pelo programa Dr. Speech, 4.0, Tiger DRS, mdulo Real Analysis.
importante se dizer que a figura 20, apresenta um espectrograma de banda estreita, ou seja, com
aplicao de um filtro de banda estreita de 60 Hz, para evidenciar os harmnicos do som. A figura 21
apresenta um espectrograma de banda larga, representado pelo C e apresenta um espectrograma
de banda larga, ou seja, com aplicao de um filtro de banda larga de com um filtro de 240 Hz, para
evidenciar os formantes do som.
Nas figuras abaixo, seguem os espectrogramas:
1. Com aplicao de filtro de banda estreita.
Figura 20: espectrograma de banda estreita, evidenciando os harmnicos, de vogal sustentada. No eixo vertical
(Y), acontece a variao da frequncia; no eixo horizontal (X), est representado o tempo e a intensidade no grau
de escurecimento do traado. A primeira emisso caracterizada pela qualidade vocal rouca, com uma srie
harmnica definida e F0 mais grave que nas outras emisses, note tambm os rudos entre os harmnicos (reas
hachuradas) o que demonstra a existncia de ar no sonorizado. Na segunda emisso, com qualidade vocal
soprosa, nota-se uma F0 mais aguda que na emisso rouca e tambm uma serie harmnica reduzida. Note
tambm um preenchimento de rudo entre harmnicos mais considervel que na qualidade vocal rouca e com
um diferencial: na regio mais aguda do grfico, os harmnicos so substitudos pelo recheio de rudo, tpico de
uma voz soprosa. Na terceira e ltima emisso, note que h praticamente uma substituio da srie harmnica
por rudo, com definio praticamente do traado da F0 (adaptado de BEHLAU et al., 2001).

42

ESPECTROGRAFIA ACSTICA

UNIDADE II

2. Com aplicao de filtro de banda larga.


Figura 21: espectrograma de banda larga, evidenciando os formantes, de vogal sustentada. No eixo vertical (Y),
acontece a variao da frequncia; no eixo horizontal (X), est representado o tempo e a intensidade no grau de
escurecimento do traado. Observe que nas trs emisses ocorre uma irregularidade nos formantes do som, sem
um padro formntico definido, com instabilidade global da intensidade e tambm das j descritas alteraes
de frequncia. Observe tambm que nas emisses com qualidade vocal soprosa e comprimida acontecem as
estrias verticais indicativas de rudo (adaptado de BEHLAU et al., 2001).

1. As avaliaes qualitativas da qualidade vocal podem ser realizadas por


meio da espectrogrfica acstica e da anlise detalhada do traado
espectrogrfico, conforme observado.
2. Rudo do tipo rouquido, por irregularidade nos ciclos glticos, devido
a uma leso de massa, por exemplo, configura-se como uma falta de
definio dos harmnicos, mais concentrados na regio grave do espectro.
Lembrando que o grau fisiolgico da alterao determina diretamente o
grau de alterao ouvido perceptivamente e est relacionado tambm
aos correlatos acsticos encontrados (em menor ou maior grau).
3. A soprosidade configura-se no espectro pelo aparecimento de estrias
verticais ou como uma chuva (entre harmnicos e/ou na regio mais
aguda do espectro).
4. A correlao auditivo-visual-acstica (AVA), ou seja, a integrao desses
dados, fundamental para diagnstico e direcionamentos teraputicos,
mas, nos casos de dvida, a impresso clnica soberana.

43

SOFTWARES
DISPONVEIS NO
MERCADO PARA
ANLISE ACSTICA

UNIDADE III

CAPTULO 1
Softwares disponveis no mercado para
anlise acstica
Os softwares e hardwares de anlise acstica da voz e da fala apresentam inmeras funcionalidades,
sendo que cada um foi elaborado com um propsito especco: alguns so mais indicados para o
contexto clnico, pedaggico, e outros esto associados investigao/pesquisa. No contexto clnico,
distinguem-se as fases de avaliao e interveno teraputica. Todos os softwares e hardwares
podem ser utilizados para recolher dados para a avaliao da voz e da fala, considerando-se alguns
mais indicados para o efeito.
Em um artigo interessantssimo (leitura complementar), Mendes et al. (2006) fazem um
levantamento dos softwares e hardwares mais conhecidos e disponveis no mercado e de suas
funcionalidades mais pertinentes nos quesitos relacionados anlise da voz e da fala. E, por fim,
correlacionam os dados levantados s necessidades do profissional da sade que atua nas reas de
voz e de fala. Confira na ntegra, as informaes do referido estudo no link indicado para leitura
complementar.

Nesse texto, as autoras destacaram o Praat 5.3.04, pelo fato de ser um software gratuito que
permite a obteno de vrios parmetros acsticos e seus principais grcos. um software
bastante completo, uma das dificuldades encontradas pelo fonoaudilogo est ligada concepo
dos scripts, para que se obtenha as medidas. Quanto aos softwares pagos, foram destacados os
seguintes: MDVP, Multi-Speech, Vox Metria, Real Analysis, Vocal Assessment e LingWAVES
Voice Clinic Suite Pro, que tambm fornecem variadas informaes sobre as caractersticas
vocais do avaliado. O CSL um hardware que pode ser complementado com softwares da
KayPENTAX, tais como o MDVP ou o VRP, fornecendo uma excelente variedade de parmetros
acsticos e de representaes grcas referentes anlise da voz do avaliado, embora tenha
valores de aquisio elevados. Destacaram-se ainda o LingWAVES Voice Clinic Suite Pro pelo
feedback visual que fornece ao utente quando da avaliao.

44

SOFTWARES DISPONVEIS NO MERCADO PARA ANLISE ACSTICA

UNIDADE III

Resumidamente, diante de uma variedade de softwares para utilizao na prtica clnica e ou em


voz profissional, chamo a sua ateno aqui para alguns softwares que considero com um bom
custo x benefcio, sejam eles pagos ou no, mas, especialmente, didticos. Aps alguns anos de uso
continuado, compartilho algumas sugestes dos programas que considero teis para um profissional
que busca avaliar uma voz: o Praat, pela sua completude de informaes e medidas oferecidas e
pelo fato de ser gratuito e porttil. Todas as informaes referentes a ele voc encontra no site que
leva o nome do programa e que elaborado pelos seus criadores, Paul Boersma e David Weenink,
estando l disponveis todas as informaes e tutoriais referentes ao programa, sendo que o usurio
pode fazer o download do programa, gratuitamente, no prprio site. Segue o link para visualizao:
<http://www.fon.hum.uva.nl/praat/>. Com relao aos softwares livres, o Gram vinha sendo muito
utilizado nos ltimos anos, entretanto, o mesmo no contempla todas as informaes oferecidas
pelo Praat, que tambm um software livre, conforme foi dito, e outra limitao encontrada com
relao ao Gram a questo do seu download, que no tem sido disponibilizado na internet to
facilmente. Com relao aos programas pagos, e para anlise de voz e qualidade vocal, o Voxmetria
bastante indicado, elaborado pela CTS informtica e com coordenao de Mara Behlau, o
software apresenta uma grande variedade de funes e parmetros e permite ao usurio realizar o
acompanhamento e as comparaes entre arquivos de um mesmo cliente e entre modelos de voz.
um software de fcil utilizao, bastante didtico, inclusive, de manuseio mais fcil que o Praat,
e apresenta tambm um manual impresso e ajuda on-line. Para mais informaes para adquirilo, visualize o prprio site da CTS Informtica: <http://www.ctsinformatica.com.br/#voxMetria.
html?2027{paginaProduto!9&1>, os fabricantes oferecem uma opo ao possvel comprador de
uma verso limitada do Voxmteria para sua utilizao gratuita por 7 dias, o que interessante.
Em suma, diante da diversidade de programas oferecidos, cabe a voc, leitor, pesquisar sobre os
softwares e verificar qual se enquadra melhor nas suas reais necessidades como clnico e profissional.
BAKEN, R. J.; ORLIKOFF, R. F. Clinical measurement of speech and voice. Singular
Publishing Goup, San Diego, n. 2, p. 162-164, 226-227, 2000.
Este livro bsico para o estudo da acstica tanto para atuao clnica como para
pesquisa, com vasta literatura e para aplicao de anlises de voz e de fala, sob a
viso de pesquisadores renomados na rea.
BEHLAU, M. et al. Avaliao de Voz. In: BEHLAU, M. (org.). O livro do especialista.
Rio de Janeiro: Revinter, 2001, cap. 3, vol. I.
Este captulo indicado para complemento do estudo deste caderno, j que existem
conceitos abordados aqui que so explicados de maneira bastante didtica no
referido captulo.
GUSMO, C.; MAIA, M. E.; CAMPOS, P. H. O formante do cantor e os ajustes larngeos
utilizados para realiz-lo: uma reviso descritiva. Per Musi, Belo Horizonte, n 21, p.
43-50, 2010.
O presente estudo trata-se de uma reviso de literatura, com embasamento na Fsica
Acstica e Fonoaudiologia, no qual, inicialmente, os autores diferenciam conceitos,

45

UNIDADE III SOFTWARES DISPONVEIS NO MERCADO PARA ANLISE ACSTICA


tais como: voz cantada e falada; antomo-fisiologia larngea e suas funes, em uma
escrita de fcil entendimento. Os autores desenvolvem o texto descrevendo sobre
espectrografia do som (frequncia fundamental, harmnicos e formantes), formante
do cantor e os ajustes larngeos relacionados produo deste formante.
MENDES, AP.; FERREIRA, L.; CASTRO, E. Softwares e hardwares de anlise acstica
da voz e da fala. Distrb. Comum., So Paulo, 24(3): 421-430, Dezembro, 2012.
Em um artigo bastante completo, as autoras discorrem sobre os softwares e
hardwares disponveis no mercado, e os mais utilizados. Ainda, oferecem ao leitor,
um levantamento acerca das funcionalidades de cada um. Esta leitura essencial
para melhor conhecimento das possibilidades acsticas dos programas disponveis
no mercado. Este estudo est disponvel no seguinte link: < http://revistas.pucsp.br/
index.php/dic/article/viewFile/13159/9693>.
PINHO, S.M.R.; PONTES, P. Msculos Intrnsecos da Laringe e Dinmica Vocal.
Srie: Desvendando os segredos da voz. Vol. I. Rio de Janeiro: Revinter, 2008. 83p.
Esclarecimentos acerca da adaptao da escala GRBASI para RASATI, adaptada
realidade brasileira, pelos referidos autores, e com o acrscimo do Ide Instabilidade.
TITZE, I. Workshop on acoustic voice analysis of vocie. Journal voice 8:1-17, 1994.
Leitura importante sobre os sinais acsticos e a confiabilidade nas medidas obtidas,
de acordo com o sinal encontrado.
VIEIRA,

M.N.;

fonoaudiolgica.

ROSA,
In:

LL.C.;
PINHO,

Avaliao
S.M.R.

et

acstica
al.

na

prtica

Fundamentos

em

laringologia e voz. Rio de Janeiro: Revinter, 2006. cap. 3. p. 33-52.


O captulo aborda cuidados sobre a avaliao acstica na prtica fonoaudiolgica,
conforme o nome retrata, e com ateno especial aos cuidados relacionados
captao do som e anlises de parmetros acsticos.

46

Para (no) finalizar


A anlise acstica constitui uma ferramenta complementar de avaliao da funo vocal, que
engloba tambm a endoscopia (laringoscopia, estroboscopia), eletromiograa, ltragem inversa,
dentre outros, ou seja, os procedimentos previamente citados neste caderno, que compem o
Laboratrio de Voz. Todas as avaliaes so fundamentais para uma posterior interveno e para
que ela acontea de maneira adequada, sendo assim, os softwares e hardwares so consideradas
ferramentas teis, no somente para diagnstico clnico, mas tambm para treinamento vocal com
profissionais da voz e tambm podem ser instrumentos de apoio para a reabilitao vocal.

Em suma, os softwares e hardwares de anlise acstica da voz e da fala providenciam feedback


visual e auditivo, fornecem parmetros quantitativos, objetivos, vlidos e conveis, e ainda
contribuem para melhora da percepo vocal e da fala do indivduo. Sendo assim, refora-se
aqui que podem ser utilizados na preveno, avaliao, diagnstico e interveno na patologia
da voz e da fala, assim como na otimizao das competncias vocais e da fala. Possuem ainda
um papel na e investigao. Permitem tambm vericar a eccia e a ecincia da interveno
teraputica, por meio da comparao de resultados obtidos nas vrias etapas da terapia, conforme
tambm j foi ressaltado.
Embora os programas existentes no mercado sejam mais utilizados por especialistas em voz,
suas possibilidades no se limitam aos casos de disfonia ou aprimoramento vocal, conforme
citado neste texto, mas atingem as diversas situaes na clnica fonoaudiolgica nas quais so
analisadas e abordadas questes de articulao da fala, fluncia, expressividade e linguagem.
No entanto, nada substitui a prtica continuada e faz-se importante que os fonoaudilogos
empreguem os programas rotineiramente para criar solues individuais e adaptar as opes
oferecidas ao perfil de seu trabalho.

47

Referncias
BAKEN, R. J.; ORLIKOFF, R. F. Clinical measurement of speech and voice. Singular
Publishing Goup, San Diego, n. 2, p. 162-164, 226-227, 2000.
BARRICHELO, V. Voz ressoante em alunos de teatro: correlatos perceptivo-auditivo e
acsticos da emisso treinada Y-Buzz de Lessac. Tese de mestrado apresentada a Universidade
Federal de So Paulo. Escola Paulista de Medicina. Programa de Ps-Graduao em Distrbios da
comunicao humana. 112f. So Paulo, 2007.
BARROS, A. P. B.; CARRARA DE ANGELIS, E. Anlise acstica da voz. In: DEDIVITIS, R. A.;
BARROS, A. P. B. Mtodos de avaliao e diagnstico de laringe e voz. So Paulo: Lovise, 2002.
BEHLAU, M. Alteraciones de la voz. In: Gil-CARCEDO et al. Tratado de Otorrinolaringologia y
Cirurgia de Cabeza y Cuello. Madrid Proyetos Mdicos, 1999.
______. Consideraes sobre anlise acstica em laboratrios computadorizados de
voz. In: ARAJO, R. et al. Fonoaudiologia atual. Rio de Janeiro: Revinter, 1997. p. 93-115.
BEHLAU, M. et al. Determinao da frequncia fundamental e suas variaes em altura
(jitter) e intensidade (shimmer), para falantes do portugus brasileiro. Acta
AWHO; 4(1):5-10, 1985.
______. Avaliao de voz. In: BEHLAU, M. (Org.). O livro do especialista. Rio de Janeiro:
Revinter, 2001, cap. 3, vol. I.
______. Voz profissional: aspectos gerais e atuao fonoaudiolgica. In: BEHLAU, M. (org.)
Voz: o livro do especialista. 2. ed. Rio de Janeiro: Revinter, 2005. vol. II, cap. 12.
BEHLAU, M.; RUSSO, I. Percepo da fala: anlise acstica do portugus brasileiro. So Paulo:
Lovise, 1993. p. 57.
BEHLAU, M.; REHDER, M. I. Higiene vocal para o canto coral. 1. ed. Rio de Janeiro: Revinter,
1997. vol. I.
BEHLAU, M.; PONTES, P. A avaliao da voz. In: BEHLAU, M.; PONTES, P. Avaliao e
Tratamento das disfonias. So Paulo: Lovise, 1995. cap. 3, p. 68-135.
BOERSMA, P.; WEENINK, D. (2010). Praat: doing phonetics by computer [Computer program]:
software livre. Version 5.1.32, retrieved 30 April 2010 from <http://www.praat.org/>. Disponvel
em: <www.praat.org>. Acesso em: 20 maio 2010.
COLTON, R. H.; CASPER, J. K. Mau uso e abuso vocal: efeitos sobre a fisiologia larngea. In:
COLTON, R. H.; CASPER, J. K. Compreendendo os problemas de voz: uma perspectiva fisiolgica
ao diagnstico e tratamento. Porto Alegre: Artes Mdicas, 1996. p. 81-118.

48

REFERNCIAS
CORDEIRO, G. F. et al. Formante do cantor um enfoque fisiolgico. In: PINHO, S. Temas em
voz profissional. So Paulo: Lovise, 2007. p. 23-30.
CUKIER, S.; CAMARGO, Z. A. Abordagem da qualidade vocal em um falante com
deficincia auditiva: aspectos acsticos relevantes do sinal de fala. Rev. CEFAC. 2005;
7(1):93-101.
DE BODT, M. S. et al. The perceptual evaluation of voice disorders. Acta Otohinolaryngol
Belg, v. 50, p. 283-91, 1996.
DEJONCKERE, P. et al. Vibrato. San Diego: Singular Publishing, 1995.
DINVILLE, C. A tcnica da voz cantada. 2. ed. Rio de Janeiro: Enelivros, 1993.
ELLIOT, N. et al. What happens during vocal warm-up? Journal of Voice, Philadelphia, v. 9,
p. 37-44, 1995.
FAWCUS, M. Disfonias: diagnstico e tratamento. Traduo de Mara Behlau. 2. ed. Rio de Janeiro:
Revinter, 2001. Original ingls.
FEX, S. Perceptual evaluation. Journal of Voice, Philadelphia, v. 6, n. 2, p. 55-8, 1992.
GODINO-LLORENTE, J.

I.; GMEZ-VILDA, P.; BLANCO VELASCO, M. Dimensionality

Reduction of a Patholgical Voice Quality Assessment System Based on Gaussian


Mixture Models and Short-Term Cepstral Parameters. IEEE Transactions on Biomedical
Engineering, vol. 53, n 10, October, 2006.
HARDCASTLE, WILLIAM J.; LAVER, JOHN (eds). The Handbook of Phonetic Sciences.
Blackwell Publishing, 1999.
HIRANO, M. Clinical examinations of voice. Viena: Springer-Verlag, 1981. 100 p.
INAMURA, R.; TSUJI, D. H. Disfonia espasmdica de aduo, tremor vocal e disfonia
de tenso muscular: possvel fazer o diagnstico diferencial? Revista Brasileira de
Otorrinolaringologia, 72 (4), Julho/Agosto, 2006.
KENT, R. D.; READ, C. The Acoustic Analysis of Speech. San Diego, California. Singular
Publishing Group, 1992.
NEMETZ, M. A.; PONTES, P. A. L.; VIEIRA, V. P.; YAZAKI, R. K. Configurao das pregas
vestibulares fonao em adultos com e sem disfonia. Rev. Bras. Otorrinolaringol. 2005;
71(1):6-12.
PINHO, S. M. R.; CAMARGO, Z. A. Introduo anlise acstica da voz e da fala. In: PINHO,
S. M. R. Tpicos em voz. Rio de Janeiro: Guanabara, 2001.
PINHO, S. M. R.; PONTES, P. Msculos intrnsecos da laringe e dinmica vocal. Srie:
Desvendando os segredos da voz. Vol. I. Rio de Janeiro: Revinter, 2008. 83 p.

49

REFERNCIAS
SATALOFF, R. T. et al. The clinical voice laboratory: pratical design and clinical application.
Journal of Voice, v. 4, p. 264-279, 1990.
SHADLE, C. The aerodynamics of speech. In: HARDCASTLE, WILLIAM J.; LAVER, JOHN
(eds). The Handbook of Phonetic Sciences. Blackwell Publishing, 1999.
SUNDEBERG, J. Articulatory interpretations of songing formant. Journal of Acoustical.
Society of Americana, 1974. 55:838-844.
______. Vocal tract resonance. In: SATALOFF, R. T. (Ed.). Professional voice: The science and
art of clinical care. 2. ed. New York: Raven Press, 1991. p. 49-68.
TITZE, I. Principles of voice production. Universidade de Michigan. Prentice Hall, 1994.
VIEIRA, M. N. et al. Comparative assessment of electroglottographic and acoustic
measures of jitter in pathological voices. J Speech Lang Hear Res, v. 40, p. 170-182, 1997.
YAMASAKI, R.; BEHLAU, M. Comparison of acoustical measurements of voice recorded
in three different systems. Program and Abstract Book, 24th, IALP Congress IALP. Amsterdam,
1998, p. 242.
YASUNORI, O.; MASATAKA, G.; KATUNOBU, I.; KAZUYA, T. Discrimination between singing
and speaking voices. In: INTERSPEECH 2005, p. 1.1411.144, 2005.

Sites:
<http://pt.wikiquote.org/wiki/Discuss%C3%A3o:Albert_Einstein>, acessado em 23 dez. 2013
<http://en.wikipedia.org/wiki/Sine_wave>, acessado em jan. 2013.
<http://www.fon.hum.uva.nl/praat/>, acessado em jan. 2013.
<http://revistas.pucsp.br/index.php/dic/article/viewFile/13159/9693>, acessado em dez. 2013.
<www.ctsinformatica.com.br/>, acessado em dez. 2013.

50

Você também pode gostar