Você está na página 1de 8

The speech Chain (A cadeia da fala) - tradução

Normalmente consideramos natural nossa capacidade de produzir e entender a fala


e dar pouca atenção à sua natureza e função, assim como não estamos
particularmente cientes da ação de nossos corações, cérebros ou outros órgãos
essenciais. Não é surpreendente, portanto, que muitas pessoas ignoram a grande
influência da fala no desenvolvimento e funcionamento da sociedade humana.

Onde quer que os seres humanos vivam juntos, eles desenvolvem um sistema de
fala um com o outro; mesmo as pessoas nas sociedades mais isoladas usam fala. A
fala, na verdade, é uma das poucas habilidades básicas de construção de
ferramentas e é o que nos diferencia dos outros animais e estão intimamente
conectados com nossa capacidade de pensar abstratamente.

Por que a fala é tão importante? Uma razão é que o desenvolvimento da cultura
humana é possível, em grande medida, por nossa capacidade de compartilhar
experiências, trocar ideias e transmitir conhecimentos de uma geração para outra;
em outras palavras, nossa capacidade de comunicar-se com outras pessoas.
Podemos nos comunicar de várias maneiras. Os sinais de fumaça do índio Apache,
o iniciador
pistola em uma corrida de banheiro, a linguagem de sinais usada por pessoas
surdas, o código Morse e vários sistemas de escrita são apenas alguns exemplos
dos muitos sistemas diferentes de comunicação que evoluíram para atender às
necessidades especiais. Inquestionavelmente, no entanto, a fala é o sistema que as
sociedades humanas encontraram, na maioria das circunstâncias, e é de longe a
mais eficiente e conveniente do que qualquer outro sistema de comunicação.

Você pode pensar que escrever é um meio mais importante de comunicação do que
fala. Afinal, a palavra escrita e a produção das impressões parecem ser mais
eficientes e mais duráveis ​no processo de transmissão de informações. No entanto,
não importa como muitos livros e jornais são impressos, a quantidade de
informações trocada pela fala é ainda maior. O uso de livros e materiais impressos
se expandiu muito em nossa sociedade, mas também o uso de telefones, rádio e
televisão.
Em suma, a sociedade humana depende muito do fácil e gratuito intercâmbio de
ideias entre seus membros e, por diversos motivos, nós descobrimos que a fala é
nossa forma de comunicação mais conveniente. Por meio de seu uso constante
como ferramenta essencial ao cotidiano, a fala tornou-se um sistema altamente
eficiente para a troca de nossas ideias mais complexas. É um sistema
particularmente adequado para uso difundido nas condições de vida sempre
mutáveis ​e variadas. É adequado porque permanece funcionalmente não afetada
pelas diferentes vozes, hábitos de fala, dialetos e sotaques de milhões de pessoas
que usam uma linguagem comum. E é adequado para uso generalizado porque a
fala - em uma extensão surpreendente - é invulnerável ao ruído, distorção e
interferência.

A fala merece um estudo cuidadoso. Vale a pena estudá-la pois o estudo da fala
fornece insights (informações) úteis sobre a natureza e a história da civilização
humana. Vale a pena para o engenheiro de comunicações porque uma melhor
compreensão do mecanismo da fala ajuda a desenvolver sistemas de comunicação
melhores e mais eficientes. Isto é, vale a pena para todos nós porque dependemos
da fala para comunicar-se com os outros.

O estudo da fala também é importante para o desenvolvimento de comunicação


humana com máquinas. Todos nós usamos autômatos, como secretárias
eletrônicas de botão de pressão e elevadores automáticos, que recebem nossas
instruções ou nos relatam suas operações. Freqüentemente, eles fazem ambos,
como os computadores usados extensivamente em nossa sociedade; sua operação
depende cada vez mais de trocas de informações frequentes, rápidas e
convenientes com os usuários. No projeto de sistemas de comunicação ou
"linguagens" para conectar o usuário e máquina, é necessário ter um entendimento
firme de discurso, que é o sistema de comunicação pessoa-a-pessoa em que o
desenvolvimento é baseado na experiência de muitas gerações

Quando a maioria das pessoas considera a fala, elas pensam apenas em termos de
lábios e língua em movimento. Alguns outros, que descobriram sobre ondas
sonoras, talvez durante a construção ou uso de sistemas estéreos, também irá
associar certos tipos de ondas sonoras com a fala.

Na realidade, a fala é um processo muito mais complexo, envolvendo muito mais


níveis de atividade humana, do que uma abordagem tão simples poderia sugerir.
Uma maneira conveniente de examinar o que acontece durante a fala é: considere a
situação simples de duas pessoas conversando. Para, por exemplo, você, enquanto
um palestrante, deseja transmitir informações para outra pessoa, o ouvinte. A
primeira coisa que você precisa fazer é organizar seus pensamentos, decidir o que
você quer dizer e depois colocar o que quiser dizer em forma linguística. A
mensagem é colocada em forma linguística pela seleção das palavras e frases
certas para expressar seu significado, e por colocar essas palavras na ordem
exigida pelas regras gramaticais do idioma. Este processo está associado à
atividade no cérebro do orador, e é do cérebro que as instruções apropriadas, no
forma de impulsos ao longo dos nervos motores, são enviados para os músculos
que ativa os órgãos relacionado com a fala- os pulmões, as cordas vocais, a língua,
e os lábios. Os impulsos nervosos colocam os músculos vocais em movimento que,
por sua vez, produzem mudanças mínimas de pressão no ar. Chamamos essas
mudanças de pressão de onda sonora.

Ondas sonoras são muitas vezes chamadas de ondas acústicas, porque a acústica
é o ramo da física preocupado com o som. Os movimentos dos órgãos vocais
geram o som de fala em forma de onda que viaja pelo ar entre o locutor e o ouvinte.
As mudanças de pressão no ouvido ativam o mecanismo de audição do ouvinte e
produz impulsos nervosos que viajam ao longo do nervo acústico para o cérebro do
ouvinte. No cérebro do ouvinte, uma quantidade considerável de atividade nervosa
já está ocorrendo, e esta atividade é modificada pelos impulsos nervosos que
chegam do ouvido. Esta modificação atividade cerebral, de alguma maneira que
ainda não é totalmente compreendida, traz o reconhecimento da mensagem do
orador. Vemos, portanto, que a comunicação pela fala consiste em uma cadeia de
eventos ligando o cérebro do orador com o cérebro do ouvinte. Chamaremos esta
cadeia de eventos de
cadeia de fala (ver Figura 1.1).
Pode valer a pena mencionar neste momento que o discurso corrente tem um
importante elo lateral. Na simples situação ‘falante-ouvinte’ que acabamos de
descrever, existem realmente dois ouvintes, não um, porque os falantes não apenas
falam, mas também ouvem sua própria voz. No ouvindo, eles comparam
continuamente a qualidade dos sons que produzem com as qualidades de som que
pretendiam produzir e fazer os ajustes necessários para combinar os resultados
com suas intenções.

Existem muitas maneiras de mostrar que os locutores são seus próprios ouvintes.
Talvez o mais divertido seja atrasar o som "realimentado" para o alto-falante. Isso
pode ser feito simplesmente gravando a voz do palestrante em um gravador e
reproduzi-la uma fração de um segundo depois. O alto-falante escuta a versão
atrasada em fones de ouvido. Sob tais circunstâncias, o atraso inesperado no som
de retorno faz com que o locutor gagueje. esse fenômeno é chamado de efeito de
feedback atrasado da fala Outro exemplo da importância de “Feedback” é a
deterioração geral da fala das pessoas que sofreram surdez prolongada. A surdez, é
claro, priva as pessoas do link de feedback da cadeia de fala. Até certo ponto,
podemos dizer o tipo de surdez pelo tipo de deterioração da fala que ela produz.

Vamos voltar agora para a cadeia de fala principal: os links que conectam o locutor
ao ouvinte. Vimos que a transmissão de uma mensagem começa com a seleção e
ordenação de palavras adequadas e frases. Isso pode ser chamado de nível
linguístico da fala. O evento de fala continua no nível fisiológico, com atividade
neural e muscular, e termina, no lado do falante, com a geração e transmissão de
uma onda sonora, o nível físico (acústico) da cadeia da fala. No final da cadeia do
ouvinte, o processo é revertido. O evento começa no nível físico, quando a entrada
da onda sonora ativa o mecanismo de audição. o evento continua no nível
fisiológico com atividade neural nos mecanismos auditivos e perceptivos. A cadeia
da fala é concluída no nível linguístico quando o ouvinte reconhece as palavras e
frases transmitidas pelo falante. A cadeia de fala, portanto, envolve atividades em
pelo menos três níveis: linguístico, fisiológico e físico - primeiro no lado do falante e
então no final do ouvinte.
Também podemos pensar na cadeia da fala como um sistema de comunicação no
qual as ideias a serem transmitidas são representadas por um código que sofre
transformações à medida que os eventos da fala avançam de um nível para outro.
Podemos fazer uma analogia aqui entre a fala e o código Morse. No código Morse,
certos padrões de pontos e traços representam diferentes letras do alfabeto; os
pontos e travessões são um código para as letras. Este código também pode ser
transformado de um formulário para outro. Por exemplo, uma série de pontos e
travessões em um pedaço de papel podem ser convertidos em uma sequência
acústica, como "beep-hip-bip-beep". Da mesma forma, as palavras de nossa
linguagem são um código para conceitos e objetos materiais. A palavra “cachorro” é
o código para um animal de quatro patas que abana o rabo, assim como
“traço-traço-traço” é o código Morse para a letra “0”. Aprendemos as
palavras-código de uma língua - e as regras para combiná-las em sentenças -
quando aprendemos a falar. Durante a transmissão da fala, o código linguístico do
falante de palavras e frases é transformado em códigos fisiológicos e físicos - em
outras palavras, em conjuntos correspondentes de movimentos musculares e
vibrações de ar - antes de ser reconvertido em um código linguístico no final do
ouvinte. Isso é análogo a traduzir o “traço-traço-traço” escrito do código Morse em
sons, “beep-beep-beep”.

Embora possamos considerar a transmissão da fala como uma cadeia de eventos


em que um código para certas idéias é transformado de um nível ou meio para
outro, seria um grande erro pensar que os eventos correspondentes nos diferentes
níveis são iguais. Existe alguma relação, com certeza, mas os eventos estão longe
de serem idênticos. Por exemplo, não há garantia de que as pessoas produzirão
ondas sonoras idênticas ao pronunciar a mesma palavra. Na verdade, é mais
provável que produzam ondas sonoras diferentes quando pronunciam a mesma
palavra. Da mesma forma, eles podem muito bem gerar ondas sonoras semelhantes
ao pronunciar palavras diferentes. Este estado de coisas foi demonstrado
experimentalmente. Um grupo de pessoas ouviu a mesma onda sonora,
representando uma palavra, em três ocasiões quando a palavra estava inserida em
três frases diferentes. Os ouvintes concordaram que a palavra de teste foi ouvida
como “pouco” (BIT) ou “aposta” (BET) ou “morcego” (BAT), dependendo de qual das
três sentenças foi usada.

O experimento mostra claramente que as circunstâncias gerais (contexto) sob as


quais ouvimos a fala afetam profundamente as palavras específicas que
associamos a ondas sonoras particulares. Em outras palavras, a relação entre uma
palavra e uma onda sonora específica, ou entre uma palavra e um movimento
muscular específico ou padrão de impulsos nervosos, não é única. Não há rótulo na
onda sonora de uma fala que invariavelmente a associe a uma palavra específica.
Dependendo do contexto, reconhecemos uma onda sonora específica como uma
palavra ou outra. Um bom exemplo disso é relatado por pessoas que falam vários
idiomas fluentemente. Eles às vezes reconhecem as frases ouvidas indistintamente
como sendo faladas em um de seus idiomas, mas percebem mais tarde que a
conversa foi em outro de seus idiomas. O conhecimento do contexto certo pode até
fazer a diferença entre entender e não entender uma sequência de onda sonora
específica. Você pode ter ouvido os anúncios feitos por um locutor em um lugar
desconhecido e barulhento, como uma estação de ônibus ou metrô. As chances são
de que muitas das palavras eram incompreensíveis para você por causa do ruído e
distorção. No entanto, esse mesmo discurso seria claramente inteligível para
usuários regulares da estação, simplesmente porque eles têm mais conhecimento
do contexto do que você. Nesse caso, o contexto é fornecido por sua experiência
em ouvir em condições ruidosas e por seu maior conhecimento do tipo de
mensagem que espera.

A forte influência das circunstâncias sobre o que você reconhece não se limita à
fala. Quando você assiste televisão ou filmes, provavelmente considera as cenas
que vê como bastante realistas. Mas as imagens da televisão são muito menores do
que o tamanho real e as da tela de cinema são muito maiores. O contexto fará com
que a pequena imagem da televisão, o original em tamanho real e a enorme cena
do filme pareçam ter o mesmo tamanho. A televisão e os filmes em preto-e-branco
também parecem bastante realistas, apesar de sua falta de cores verdadeiras. Mais
uma vez, o contexto faz com que o original multicolorido e a tela em preto e branco
pareçam semelhantes. Na fala, como nesses exemplos, geralmente não temos
consciência de nossa forte dependência do contexto.
Podemos dizer, portanto, que os falantes geralmente não produzem ondas sonoras
idênticas quando pronunciam as mesmas palavras em ocasiões diferentes. Os
ouvintes, ao reconhecer a fala, não confiam apenas nas informações derivadas da
onda da fala que recebem. Eles também contam com seu conhecimento de um
sistema de comunicação instrinseco, sujeito às regras da linguagem e da fala, e nas
dicas fornecidas pelo assunto e pela identidade do falante.

Na comunicação pela fala, portanto, não dependemos de um conhecimento preciso


de pistas específicas. Em vez disso, relacionamos uma grande variedade de pistas
ambíguas existentes no sistema complexo que chamamos de nossa ‘linguagem
comum’. Quando você pensa sobre isso, não há outra maneira pela qual a fala
poderia funcionar com eficiência. Parece improvável que milhões de falantes, com
todas as suas diferentes qualidades de voz, hábitos de fala e sotaques, jamais
produzam algo parecido com ondas sonoras idênticas quando dizem as mesmas
palavras. As pessoas engajadas na pesquisa da fala sabem disso muito bem, para
seu pesar. Embora nossos instrumentos para medir as características das ondas
sonoras sejam mais precisos e flexíveis do que o ouvido humano, ainda não somos
capazes de construir uma máquina que possa reconhecer a fala quase tão
eficazmente quanto um ser humano. Podemos medir as características das ondas
de fala com grande precisão, mas não conhecemos a natureza e as regras do
sistema contextual com o qual os resultados de nossas medições devem ser
relacionados, visto que são relacionados com tanto sucesso no cérebro dos
ouvintes.

Nos capítulos seguintes, descreveremos a cadeia de fala do falante ao ouvinte - tão


completamente quanto o conhecimento atual e o escopo deste livro permitem. O
que dissemos até agora deve lhe dar algumas pistas de por que apenas uma parte
do que se segue diz respeito às leis que governam os eventos em qualquer nível da
cadeia da fala; em outras palavras, com a física da fala e o comportamento dos
nervos e músculos. O restante do livro, em comum com as tendências dominantes
da pesquisa moderna da fala, lida com a relação dos eventos em diferentes níveis
da cadeia da fala e como os eventos são afetados pelo contexto.
Descreve os tipos de ondas sonoras produzidas quando falamos os sons da fala e
palavras do inglês; a relação entre os movimentos articulatórios de nossos órgãos
fonatórios e a onda de fala produzida; como nosso mecanismo de audição
transforma as ondas sonoras da cadeia de fala em impulsos nervosos e sensações;
como percebemos as ondas sonoras da fala como palavras e frases. Há também
um capítulo sobre o processamento digital da fala - uma tecnologia amplamente
usada hoje para o estudo e aplicações práticas da fala e da linguagem.

Você também pode gostar