Analise Acustica Da Fala PDF

Você também pode gostar

Você está na página 1de 13

5

Sumário

Prefácio à Segunda Edição.................................................................... 9

Capítulo 1 Introdução ao Estudo da Acústica da Fala.......................... 11


Capítulo 2 Teoria Acústica da Produção da Fala.................................. 37
Capítulo 3 Introdução à Análise Acústica da Fala................................ 95
Capítulo 4 As Características Acústicas de Vogais e Ditongos............ 179
Capítulo 5 As Características Acústicas das Consoantes..................... 229
Capítulo 6 Correlatos Acústicos das Características do Falante.......... 307
Capítulo 7 Propriedades Suprassegmentais da Fala............................. 361
Capítulo 8 Síntese de Fala..................................................................... 391

APÊNDICES
Apêndice A Símbolos Fonéticos para Vogais e Consoantes;
Siglas Usadas no Texto....................................................... 433
Apêndice B Física Elementar do Som.................................................... 437
Apêndice C Escalas Não Lineares de Frequência para a Análise
da Fala................................................................................. 449

Referências.............................................................................................. 451
Glossário.................................................................................................. 489
Índice....................................................................................................... 497
11

Capítulo 1

INTRODUÇÃO AO ESTUDO
DA ACÚSTICA DA FALA

O QUE É A FALA?

Raymond H. Stetson, um pioneiro no estudo da fala, escreveu que


“speech is movement made audible” (Stetson, 1928) [fala é movimento
tornado audível]. Os movimentos dos órgãos da fala — estruturas como a
língua, os lábios, a mandíbula, o véu palatino e as pregas vocais — resultam
em padrões sonoros que são percebidos pelo ouvinte. Entretanto, a fala é
mais do que sons audíveis; senão não nos importaríamos em distinguir os
sons da fala de outros processos corporais, como bater palmas ou respirar.
A fala ganha sua importância única como o meio principal pelo qual a
língua é expressa em todas as culturas humanas, exceto para as pessoas
surdas. A fala é uma modalidade da linguagem. A comunicação da fala é
comum a quase todos os humanos em qualquer cultura, em qualquer parte
da terra — exceto os surdos. O produto final da fala é um sinal acústico.
Esse sinal representa a mensagem comunicativa do falante. Sob circunstân‑
cias comuns, o sinal acaba rapidamente à medida que as vibrações sonoras
são amortecidas pelo mundo físico, mas as técnicas modernas de gravação
nos permitem preservar os sinais da fala, e essa capacidade abre novos
horizontes para o estudo da fala.
12 RAY D. KENT • CHARLES READ

O famoso linguista Charles Hockett definiu o que ele considerou serem


características de desenvolvimento da comunicação. Estas são resumidas
na Tabela 1.1 e, tomadas juntas, elas caracterizam a especificidade única
da linguagem humana. Até onde sabemos, nenhuma outra espécie tem um
sistema de comunicação com todos esses atributos. Considerando essas
características individualmente, nós ganhamos uma apreciação da fala como
uma faculdade humana e um meio de comunicação. Várias das caracterís‑
ticas desenvolvidas pertencem direta e unicamente à fala como uma moda‑
lidade da linguagem, por exemplo, os itens 1, 2, 3, 6 e 9 na Tabela 1.1.
Combinando essas características, podemos definir a fala como um canal
auditório‑vocal que tem uma transmissão que desaparece rapidamente; é
especializada para gerar significado com símbolos sonoros arbitrários; e é
composta de unidades discretas ou elementos que podem ser formados em
um número infinito de mensagens. Essa definição se refere a ambos os li‑
mites e a força da fala. O fato de que a fala desaparece rapidamente apre‑
senta desafios para sua análise. Felizmente, equipamentos modernos tornam
possível armazenar e analisar o sinal sequencial da fala. Com essa capaci‑
dade, é possível conduzir estudos da forma na qual os sons da fala se rela‑
cionam com a linguagem.
No laboratório científico, a fala tem três grandes áreas de estudo: a área
fisiológica (ou fonética fisiológica), a área acústica (ou fonética acústica) e
a área perceptual (tipicamente chamada fonética perceptiva). Uma compreen‑
são unificada da fala requer o estudo de cada uma dessas áreas na relação
com as outras. A discussão neste livro se preocupará principalmente com a
área acústica, mas referências necessariamente serão feitas às outras duas
áreas. De importância específica é a necessidade de entender como a análi‑
se acústica da fala pode ajudar o estudo dos fenômenos fisiológicos, por um
lado, e os fenômenos perceptuais, por outro. Devido ao fato de o sinal
acústico servir de intermediário entre a produção e a percepção da fala, a
análise acústica ajuda na compreensão tanto da produção quanto da percep‑
ção da fala. De diversas maneiras importantes, o sinal acústico ajuda a dar
uma compreensão unificada da fala.
ANÁLISE ACÚSTICA DA FALA 13

TABELA 1.1  As características de desenvolvimento da comunicação (as quais caracterizam


todas as línguas humanas, mas não se aplicam em seu todo aos sistemas de comunicação de
outras espécies).

Característica Definição

1. Canal auditório‑vocal O som é transmitido da boca ao ouvido.

2. Transmissão ampla e Um sinal auditório pode ser detectado por qualquer receptor
recepção direcional dentro da faixa de audição, e os ouvidos do receptor são usados
para localizar o sinal.

3. Apagamento rápido Em oposição a alguns sinais visuais e olfativos, os sinais auditó‑


rios são transitórios.

4. Intermutabilidade Usuários competentes de uma língua podem produzir um sinal


que eles possam compreender.

5. Retorno total Todos os sinais produzidos podem ser refletidos de volta.

6. Especialização A única função das formas de onda acústicas da fala é produzir


significado.

7. Semanticidade Um sinal produz significado através de sua associação com obje‑


tos e eventos do meio.

8. Arbitrariedade O sinal da fala em si não tem relação alguma com o objeto ou


evento ao qual se associa.

9. Distinção A fala é composta de um pequeno conjunto de unidades (ou


elementos) acusticamente distintas.

10. Deslocamento Os sinais da fala podem ser usados para se referir a objetos ou
eventos que são removidos do presente tanto no espaço quanto
no tempo.

11. Produtividade A fala permite a expressão de uma variedade infinita de enuncia‑


dos significativos como resultado da combinação de elementos
discretos em novas sentenças.

12. Tradicionalidade A estrutura e o uso da língua é transmissão passada de uma ge‑


ração a outra através de pedagogia ou aprendizado.

13. Dualidade de formação de Os elementos sonoros específicos da linguagem não têm signifi‑
padrões cado intrínseco, mas se combinam a partir de estruturas (ex.:
palavras, sintagmas) que possuem significado.
14 RAY D. KENT • CHARLES READ

A ÁREA FISIOLÓGICA DA FALA

A área fisiológica é identificada fisicamente com o aparato da fala,


constituído de três subsistemas anatômicos maiores: o respiratório (incluin‑
do os pulmões, a parede torácica e o diafragma), o laríngeo (laringe ou
caixa de voz) e o articulatório (língua, lábios, mandíbula e véu palatino). A
Figura 1.1 é um diagrama simplificado desses subsistemas. Essa divisão
tripartida é justificada tanto no campo anatômico quanto no fisiológico, mas
deve‑se enfatizar que os três subsistemas funcionam, juntos na fala, bem e
são frequentemente altamente interativos. A articulação da fala é um fenô‑
meno complexo do movimento, cuja compreensão foi retardada por muitos
obstáculos, sendo um desses a dificuldade de se observar as estruturas de
interesse, escondidas como são nas cavidades da boca, pescoço e tórax. Os
próximos três parágrafos apresentam um sumário altamente simplificado
desses subsistemas. O leitor que não conhece a produção da fala pode achar
útil ler esse material antes de prosseguir para o resto do livro.

O Subsistema Respiratório

O subsistema respiratório consiste da traqueia, dos pulmões, da caixa


torácica e de vários músculos (Figuras 1.1 e 1.2). Além de fornecer ventilação
para suprir a vida, esse sistema produz a maioria da energia aerodinâmica da
fala. Os parâmetros aerodinâmicos básicos são a resistência, a pressão, o
fluxo e o volume do ar. O volume é uma medida da quantidade de ar e é
medida com unidades como litros (l) ou mililitros (ml). O fluxo é a taxa de
mudança do volume e é expresso em unidades como litros/minuto ou milili‑
tros/milissegundos (ml/ms), que expressam uma mudança em volume por
unidade de tempo. A pressão é força por unidade de área e é normalmente
expressa em pascals, uma unidade que substituiu unidades anteriores como
dinas por centímetro quadrado (dyn/cm2). Nos estudos da fala, a pressão é
frequentemente gravada com uma unidade diferente, como centímetros de
água (cmH2O) ou milímetros de mercúrio (mmHg). A razão para isso é o fato
de manômetros serem uma forma conveniente de medir pressão como o
ANÁLISE ACÚSTICA DA FALA 15

Cavidade nasal
Cavidade
faríngea Cavidade oral

Lábios

Língua
Sistema articulatório
(visto de lado) Mandíbula

Sistema laríngeo
Laringe (visto de lado)

Traqueia

Sistema respiratório
(visto de frente)

Pulmão direito Pulmão esquerdo

FIGURA 1.1  O sistema de produção da fala, dividido em três subsistemas primários: respi‑
ratório, laríngeo e articulatório. Os diferentes sistemas são desenhados em escalas diferentes
e com orientações distintas (ex.: o sistema articulatório é aumentado em relação aos outros
dois e é mostrado em uma vista lateral em vez de frontal). De Kent, The speech sciences. A
volume in the speech sciences (1. ed.), 1998.
16 RAY D. KENT • CHARLES READ

Osso hioide

Cartilagem tireoide

Traqueia

Lobo superior
Lobo superior

Bifurcação
traqueal

Lobo medial

Lobo inferior
Lobo inferior

Brônquios Brônquios
segmentar e lobar para segmentar e lobar para
o pulmão direito o pulmão esquerdo

FIGURA 1.2  Os subsistemas respiratório e laríngeo da produção da fala. Esses dois subsis‑
temas combinados são chamados de trato respiratório inferior. A laringe está situada logo
acima da traqueia e abaixo da faringe. A traqueia se bifurca em brônquios que chegam aos
pulmões. De Kent, The speech sciences. A volume in the speech sciences (1. ed.), 1998.

deslocamento de uma coluna de líquido. A resistência é uma variável que


relaciona fluxo com pressão, de acordo com uma lei importante chamada lei
de Ohm. Essa lei pode ser expressa nas seguintes formas alternativas:

Pressão = Fluxo × Resistência


Fluxo = Pressão/Resistência
Resistência = Pressão/Fluxo
ANÁLISE ACÚSTICA DA FALA 17

Note, por exemplo, que o fluxo é diretamente proporcional à pressão,


mas inversamente proporcional à resistência. Se a resistência for mantida
constante, um aumento na pressão do ar resultará em um aumento no fluxo
de ar. Se a pressão do ar é mantida constante, um aumento na resistência
causará um decréscimo no fluxo de ar.
A fala é produzida com uma pressão pulmonar relativamente constan‑
te de cerca de 6‑10 cm de água ou cerca de 1 kPa (kPa = quilopascal ou
1000 pascals). Para se ter ideia de quanta pressão isso seja, afunde um ca‑
nudo a uma profundidade de 6 cm em um copo de água filtrada (Figura 1.3).
Depois, sopre o canudo até que bolhas comecem a se formar no fim do
canudo imerso na água. Essa condição corresponde a uma pressão de 6 cm
de água. Há apenas uma pequena perda de pressão do ar nos minúsculos
sacos de ar dos pulmões até a laringe no topo da traqueia, de forma que a
pressão de ar subglotal (a pressão logo abaixo das pregas vocais) seja apro‑
ximadamente igual à pressão nos pulmões. Obviamente, se não houvesse
obstruções na laringe ou no caminho superior do ar no sistema articulatório,
a pressão do ar originada pelo sistema respiratório seria imediatamente li‑
berada para a atmosfera através do trato vocal. A fala é produzida pela
valvulação ou regulagem das pressões e fluxos do ar gerados pelo subsiste‑
ma respiratório. Grosso modo, o subsistema respiratório é uma bomba de ar,
fornecendo energia aerodinâmica para os subsistemas articulatório e laríngeo.
O padrão básico de suporte respiratório para a fala é o fato de o falante
inspirar ar pelos ajustes musculares que aumentam o volume do sistema
respiratório. O ar é então liberado dos pulmões através de combinações de
dilatações passivas e atividade muscular, dependendo do volume de ar atu‑
al nos pulmões e das necessidades aerodinâmicas.
O ponto essencial é que a função respiratória para a fala é entendida
em termos de eventos aerodinâmicos — volumes de ar, pressão e fluxos.
Os eventos mecânicos da fala, pois, começam assim que o falante usa o
sistema respiratório para gerar a energia aerodinâmica. Na maioria das
línguas, a fala é produzida no ar expirado, significando que a produção da
fala deve ser interrompida sempre que um falante toma a respiração. O
padrão típico da fala é uma inspiração rápida seguida por uma expiração
muito mais lenta na qual a fala é produzida. Durante a respiração de des‑
18 RAY D. KENT • CHARLES READ

FIGURA 1.3  Simples demostração da pressão do ar necessária para a produção da fala.


Coloque um canudo em um copo d’água a uma profundidade de 6 cm. Depois, sopre‑o até
que bolhas comecem a subir através da água. Essa condição corresponde a uma pressão de
água de 6 cm, que é adequada para os propósitos da fala em uma conversação.

canso, as fases inspiratória e expiratória de um ciclo de respiração são


quase iguais em duração, mas, para a fala, a fase expiratória é prolongada
relativa à fase inspiratória. Essas diferenças no padrão inspiratório e expi‑
ratório podem ser representadas como mostrado abaixo, onde insp = inspi‑
ração, exp = expiração, e respiração de descanso é mostrada à esquerda da
linha vertical dupla. As linhas com travessão representam a fase expiratória
prolongada da respiração da fala.

insp | exp | insp | exp | insp | exp | |


insp | exp _______ | insp | exp __
_______ |
ANÁLISE ACÚSTICA DA FALA 19

A necessidade de interromper a fala para o propósito de inspiração


significa que a fala é produzida em grupos de respiração, que são grupos de
palavras ou sílabas produzidos em uma só respiração. Em geral, as unidades
produzidas em um grupo respiratório têm uma coerência total, como o en‑
caixamento em um padrão entonacional (um padrão de tom sobe e desce).

O Subsistema Laríngeo

Como mostra a Figura 1.2, a laringe está situada no topo da traqueia e


abre‑se na faringe acima. A laringe consiste de um número de cartilagens e
músculos. De importância fundamental são as pregas vocais, pequenos órgãos
musculares que se fecham (se aproximam) para fechar a corrente de ar la‑
ríngea ou se abrem (se separam) para abrir essa corrente de ar. Um desenho
de uma seção coronal da laringe é mostrado na Figura 1.4. As pregas vocais
verdadeiras são as estruturas vibrantes de interesse aqui. Elas têm uma es‑
trutura complexa em camadas mostrada na ampliação da Figura 1.4. A
abertura entre as pregas vocais é chamada de glote (Figura 1.5), e o termo
glotal tem sido usado como um termo geral para a função laríngea, espe‑
cialmente a função das pregas vocais. Se as pregas vocais estão firmemente
fechadas, o ar é impedido de escapar dos pulmões inflados. As pregas vocais
estão tipicamente fortemente fechadas durante tarefas intensas como levan‑
tamento de pesos, evacuação e nascimento de bebês, a fim de tornar o sub‑
sistema respiratório rígido como fonte para se empurrar.
O fato de pessoas geralmente gemerem durante o levantamento de um
objeto pesado é evidência de que as pregas vocais estão fechadas. A ocor‑
rência de gemidos também nos indica que o som vozeado é produzido com
as pregas vocais fechadas. O som é resultado da vibração das pregas, que
estalam alternadamente juntas e separadas, colidindo uma com a outra de
forma basicamente periódica. A taxa de vibração das pregas vocais determi‑
na essencialmente a percepção do tom vocal (vocal pitch) de um falante.
Um falante com uma voz bastante aguda tem uma frequência relativamente
alta de vibração das pregas vocais e um falante com uma voz bastante gra‑
ve tem uma frequência relativamente baixa de vibração das pregas vocais.
20 RAY D. KENT • CHARLES READ

Epiglote

Cartilagem
tireoide

Pregas vocais falsas

Pregas vocais verdadeiras

Cartilagem
cricoide

Ligamento vocal

Superficial
Lâmina
própria Intermediário

Profundo

Epitélio

Músculo vocal

FIGURA 1.4  Seção coronal da laringe, mostrando as pregas falsas e as verdadeiras. O alar‑
gamento mostra a estrutura em camadas da última, que são a fonte de energia vibratória para
a voz. De Kent, The speech sciences. A volume in the speech sciences (1. ed.), 1998.

Você também pode gostar