Você está na página 1de 42

Machine Translated by Google

CAPÍTULO 9
LEITURA E FALA
PERCEPÇÃO

INTRODUÇÃO que ouvir a fala pode ser mais fácil do que ler. A fala
muitas vezes contém pistas prosódicas (discutidas no
A humanidade se destaca em seu domínio da linguagem. Capítulo 11; ver Glossário). As dicas prosódicas são
De fato, a linguagem é de uma importância tão grande sugestões para a estrutura da frase e o significado
que este capítulo e os dois seguintes são dedicados a ela. pretendido por meio do tom, entonação, ênfase e tempo
Neste capítulo, consideramos os processos básicos do falante (por exemplo, as perguntas têm uma entonação
envolvidos na leitura de palavras e no reconhecimento de crescente na última palavra da frase).
palavras faladas. Muitas vezes não importa se uma Em contraste, as principais pistas para a estrutura da
mensagem é apresentada aos nossos olhos ou aos frase específica do texto são os sinais de pontuação (por
nossos ouvidos. Por exemplo, você entenderia a frase exemplo, vírgulas, ponto e vírgula). Estes são muitas
“Você se saiu excepcionalmente bem em seu exame de vezes menos informativos do que as pistas prosódicas na fala.
psicologia cognitiva” da mesma forma, quer você a tenha O fato de que ler e ouvir a fala diferem
lido ou ouvido. Assim, muitos processos de compreensão consideravelmente pode ser visto considerando crianças
são muito semelhantes, quer estejamos lendo um texto e pacientes com lesão cerebral. As crianças pequenas
ou ouvindo alguém falar. geralmente têm boa compreensão da linguagem falada,
mas lutam para ler até histórias simples. Parte da razão
No entanto, a leitura e a percepção da fala diferem pode ser que a leitura é uma invenção relativamente
de várias maneiras. Na leitura, cada palavra pode ser recente em nossa história evolutiva e, portanto, carece de
vista como um todo, enquanto uma palavra falada se um processador especializado geneticamente programado
estende no tempo e é transitória. Mais importante, é muito (McCandliss, Cohen e Dehaene, 2003). Alguns pacientes
mais difícil dizer onde uma palavra termina e a próxima adultos com lesão cerebral podem entender a linguagem
começa com a fala do que com o texto. A fala geralmente falada, mas não conseguem ler, e outros podem ler
fornece um sinal mais ambíguo do que o texto impresso. perfeitamente bem, mas não conseguem entender a
palavra falada.
Por exemplo, quando as palavras eram extraídas de Os processos básicos específicos da leitura são
sentenças faladas e apresentadas sozinhas, elas eram tratados primeiro neste capítulo. Esses processos estão
reconhecidas apenas na metade das vezes (Lieberman, envolvidos no reconhecimento e leitura de palavras
1963). individuais e na orientação de nossos movimentos
Existem outras diferenças significativas. As demandas oculares durante a leitura. Depois disso, consideramos os
de memória são maiores ao ouvir uma fala do que ao ler processos básicos específicos da fala, incluindo aqueles
um texto, porque as palavras já ditas não são mais necessários para dividir o sinal de fala em palavras
acessíveis. Até agora, indicamos maneiras pelas quais separadas e reconhecer essas palavras.
ouvir a fala é mais difícil. No entanto, há uma maneira No Capítulo 10, discutimos os processos de
importante de compreensão comuns à leitura e à audição. Em
Machine Translated by Google

334 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

em contraste com este capítulo, a ênfase será em Balota, Paul e Spieler (1999) argumentam que a
unidades maiores de linguagem que consistem em leitura envolve vários tipos de processamento: ortografia
várias sentenças. Tenha em mente, no entanto, que (a ortografia das palavras); fonologia (o som das
os processos discutidos neste capítulo desempenham palavras); semântica (significado da palavra); sintaxe;
um papel importante em nossa compreensão de textos e integração de discurso de alto nível. As várias tarefas
ou falas longas. diferem no envolvimento desses tipos de processamento:

LEITURA: INTRODUÇÃO Na nomeação, o sistema de controle atencional


aumentaria a infl uência dos cálculos entre
É importante estudar a leitura porque os adultos sem ortografia e fonologia. . . as demandas de
habilidades efetivas de leitura estão em grande desempenho de decisão lexical podem
desvantagem. Assim, precisamos entender os processos colocar uma alta prioridade nos cálculos entre os
envolvidos na leitura para ajudar leitores pobres. módulos de nível ortográfico e de significado
Além disso, a leitura requer vários processos perceptivos [processadores]. . . se o objetivo. . . é a
e outros processos cognitivos, bem como um bom compreensão da leitura, então o controle da
conhecimento da linguagem e da gramática. Assim, a atenção aumentaria a prioridade dos cálculos dos
leitura pode ser considerada como um pensamento módulos sintáticos, de significado e
guiado visualmente. de nível de discurso (p. 47).

Métodos de pesquisa Vários Assim, o desempenho em tarefas de nomeação e


métodos estão disponíveis para estudar a leitura. decisão lexical pode não refletir com precisão os
Esses métodos têm sido amplamente utilizados em processos normais de leitura.
pesquisas e, portanto, é importante entender o que eles Em seguida, há o priming, no qual uma palavra
envolvem, bem como suas limitações. primária é apresentada logo antes da palavra tar get.
Por exemplo, considere maneiras de avaliar o tempo A primeira palavra está relacionada com a palavra-alvo
necessário para a identificação ou reconhecimento de (por exemplo, na ortografia, significado ou som).
palavras (por exemplo, decidir que uma palavra é O que é interessante é ver os efeitos do prime no
familiar; acessar seu significado). A tarefa de decisão processamento (e resposta) da palavra-alvo. Por
lexical envolve decidir rapidamente se uma sequência exemplo, ao ler o
de letras forma uma palavra. A tarefa de nomeação
envolve dizer uma palavra impressa em voz alta o mais rápido possível.
Essas técnicas garantem que determinado TERMOS CHAVE
processamento foi realizado, mas possuem limitações claras.
Os tempos normais de leitura são interrompidos pela tarefa de decisão lexical: uma tarefa na qual

necessidade de responder à tarefa, e é difícil saber com os indivíduos decidem o mais rápido possível se uma
sequência de letras forma uma
precisão quais processos são refletidos na decisão
palavra. Tarefa de nomeação: uma tarefa na qual as
lexical ou nos tempos de nomeação.
palavras apresentadas visualmente são pronunciadas em
Registrar os movimentos dos olhos durante a voz alta o mais rápido possível. ortografia: informações
leitura é útil. Ele fornece um registro on-line discreto e sobre a
detalhado dos processos relacionados à atenção. A grafia das palavras. fonologia: informações sobre os
única restrição importante para os leitores cujos sons das palavras e partes das
movimentos oculares estão sendo registrados é que palavras. semântica: o significado transmitido por palavras e
frases.
eles devem manter suas cabeças bem imóveis. O
priming: influenciar o processamento de (e a resposta
principal problema é a dificuldade de decidir com
a) um alvo apresentando um estímulo relacionado a ele
precisão qual processamento ocorre durante cada de alguma forma antes.
fixação (período de tempo durante o qual o olho permanece parado).
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 335

a pronúncia de sua estrutura fonológica não é


necessária. Assim, o modelo fonológico forte
predizia que o processamento fonológico
seria obrigatório [obrigatório], talvez automático (Frost,
1998, p. 76).

Evidência A
suposição de que o processamento fonológico é importante
na identificação de palavras foi apoiada por van Orden
(1987). Algumas das palavras que ele usou eram
homófonas (palavras com uma pronúncia, mas duas
Ler é uma habilidade complexa. Envolve o processamento
grafias). Os participantes cometeram muitos erros quando
de informações sobre a ortografia das palavras, os sons
das palavras e os significados das palavras, bem como questionados como: “É uma flor? ROWS”, do que quando
os processos de compreensão de nível superior. perguntado, “É uma flor? ROBS”. O problema com “ROWS”
é que é homofônico com “ROSE”, que obviamente é uma
flor. Os participantes cometeram erros porque se envolveram
no processamento fonológico das palavras.
palavra “clip”, você acessa informações sobre sua
pronúncia? Veremos em breve que a resposta mais provável
é “Sim”. Se a palavra for precedida por uma não-palavra Passamos agora para a noção de vizinhança
com pronúncia idêntica (“klip”) apresentada abaixo do nível fonológica. Duas palavras são vizinhas fonológicas se
de percepção consciente, ela é processada mais diferem em apenas um fonema (por exemplo, “gate” tem
rapidamente (ver Rastle & Brysbaert, 2006, para uma “bait” e “get” como vizinhos). Se a fonologia for usada no
revisão). reconhecimento visual de palavras, então as palavras com
Finalmente, há imagens cerebrais. Nos últimos anos, muitos vizinhos fonológicos devem ter uma vantagem.
tem havido um interesse crescente em identificar as áreas Yates (2005) encontrou suporte para essa suposição
do cérebro associadas a vários processos de linguagem. usando várias tarefas (por exemplo, decisão lexical;
Alguns dos frutos dessa pesquisa serão discutidos neste nomeação).
capítulo e nos próximos dois. Dentro de sentenças, palavras com muitos vizinhos
fonológicos são fixadas por menos tempo do que aquelas
com poucos vizinhos (Yates, Friend, & Ploetz, 2008).

Processos fonológicos na leitura Você está lendo esta Muitos pesquisadores usaram o priming fonológico
frase. Você acessou os sons relevantes ao identificar as mascarado para avaliar o papel da fonologia no
palavras na frase anterior? A visão mais comum (por processamento de palavras (mencionado anteriormente).
exemplo, Coltheart, Rastle, Perry, Langdon e Ziegler, 2001) Uma palavra (por exemplo, “clip”) é imediatamente
é que o processamento fonológico de palavras visuais é precedida por um primo não-palavra fonologicamente idêntico (por exemplo,
relativamente lento e não essencial para a identificação de Este prime é mascarado e apresentado muito brevemente
palavras. Essa visão (o modelo fonológico fraco) difere do para que não seja percebido conscientemente. Rastle e
modelo fonológico forte, no qual a fonologia tem um papel Brysbaert (2006) realizaram uma meta-análise.
muito mais central:

TERMO-CHAVE

Homófonos: palavras que têm a mesma


Uma representação fonológica é um produto
pronúncia, mas diferem na forma como são escritas.
necessário do processamento de palavras impressas,
mesmo que o
Machine Translated by Google

336 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

As palavras foram processadas mais rapidamente em várias significados de palavras para as quais ele não poderia
tarefas (por exemplo, tarefa de decisão lexical; tarefa de fornecer a fonologia apropriada.
nomeação) quando precedidas por tais primos do que por Uma forma de descobrir quando ocorre o processamento
primos semelhantes a eles em termos de ortografia, mas não fonológico é usar potenciais relacionados a eventos (ERPs;
de fonologia (por exemplo, “plip”). Esses achados implicam ver Glossário). Quando Ashby e Martin (2008) fizeram isso,
fortemente que o processamento fonológico ocorre rápida e eles descobriram que a informação da sílaba em palavras
automaticamente, conforme previsto pelo modelo fonológico apresentadas visualmente era processada 250-350 ms após
forte. No entanto, achados com priming fonológico mascarado o início da palavra. Isso é rápido o suficiente para influenciar
não provam que o reconhecimento visual de palavras deva o reconhecimento visual de palavras.
depender de processamento fonológico prévio.

Em um estudo sobre revisão e movimentos oculares, Avaliação O


Jared, Levy e Rayner (1999) descobriram que o uso da processamento fonológico normalmente ocorre rápida e
fonologia dependia da natureza das palavras e da capacidade automaticamente durante o reconhecimento visual de
de leitura dos participantes. Os dados do movimento dos palavras. Assim, o modelo fonológico fraco pode ter
olhos sugeriram que a fonologia foi usada para acessar o subestimado a importância do processamento fonológico.
significado de palavras de baixa frequência (aquelas raramente Como Rastle e Brysbaert (2006) apontaram, o fato de
encontradas), mas não de alta frequência. Além disso, os desenvolvermos representações fonológicas anos antes de
leitores ruins eram mais propensos do que os bons a acessar aprendermos a ler pode ajudar a explicar por que a fonologia
a fonologia. é tão importante.

O processamento fonológico ocorre antes ou depois do Quais são as limitações do modelo fonológico forte?
significado de uma palavra ter sido acessado? Ainda há poucas evidências convincentes de que a informação
Em um estudo (Daneman, Reingold e Davidson, 1995), os fonológica deva ser usada no reconhecimento visual de
leitores fixaram os homófonos por mais tempo quando palavras. Em vários estudos (por exemplo, Hanley &
estavam incorretos (por exemplo, “Ele estava usando meias”) McDonnell, 1997; Jared et al., 1999), a evidência de
do que quando estavam corretos (por exemplo, “Ele estava processamento fonológico foi limitada ou ausente. Há também
usando meias ”). Isso não teria acontecido se o código dislexia fonológica (discutida em detalhes em breve). Os
fonológico tivesse sido acessado antes do significado das disléxicos fonológicos têm grandes dificuldades com o
palavras. No entanto, houve muitos movimentos oculares processamento fonológico, mas podem ler palavras familiares.
para trás (regressões) após a fixação de homófonos Isso é um tanto intrigante se o processamento fonológico for
incorretos. Esses achados sugerem que o código fonológico essencial para a leitura.
pode ser acessado após o acesso ao significado da palavra.
Mesmo quando há evidências claras de processamento
fonológico, esse processamento pode ocorrer após o acesso
Evidência razoavelmente convincente de que o ao significado da palavra (Daneman et al., 1995).
significado da palavra pode ser acessado sem acesso à Em suma, o modelo fonológico forte provavelmente é
fonologia foi relatada por Hanley e McDonnell (1997). Eles forte demais. No entanto, o processamento fonológico
estudaram um paciente, PS, que compreendia o significado geralmente desempenha um papel importante no
das palavras enquanto lia, embora não conseguisse pronunciá- reconhecimento visual de palavras, mesmo que o
las com precisão. reconhecimento de palavras possa ocorrer na sua ausência.
PS não parecia sequer ter acesso a uma representação
fonológica interna das palavras. Ele não conseguiu acessar o
outro significado de homo phones quando viu uma das RECONHECIMENTO DE PALAVRAS
grafias (por exemplo, “air”). O fato de PS poder dar definições
precisas de palavras impressas, apesar de suas deficiências, Estudantes universitários costumam ler cerca de 300 palavras
sugere fortemente que ele tinha acesso total ao por minuto, portanto, em média, apenas 200 ms para
reconhecer cada palavra. quanto tempo dura a palavra
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 337

tomada de reconhecimento? Isso é difícil de dizer, em por uma máscara padrão. Os participantes decidem qual
parte devido à imprecisão sobre o significado de das duas letras foi apresentada em uma determinada
“reconhecimento de palavras”. O termo pode se referir a posição (por exemplo, a terceira letra). O efeito de
decidir que uma palavra é familiar, acessar o nome de superioridade da palavra é definido pela descoberta de
uma palavra ou acessar seu significado. Veremos que que o desempenho é melhor quando a sequência de
várias estimativas do tempo necessário para o letras forma uma palavra do que quando não forma.
reconhecimento de palavras foram produzidas. O efeito de superioridade da palavra sugere que
informações sobre a palavra apresentada podem facilitar
a identificação das letras dessa palavra.
Processamento automático Rayner No entanto, há também um efeito de superioridade de
e Sereno (1994) argumentaram que o reconhecimento de pseudopalavras: as letras são melhor reconhecidas
palavras é geralmente bastante automático. Isso faz quando apresentadas em pseudopalavras (palavras não
sentido intuitivamente, uma vez que a maioria dos pronunciáveis como “MAVE”) do que em não palavras
estudantes universitários leu entre 20 e 70 milhões de impronunciáveis (Carr, Davidson, & Hawkins, 1978).
palavras em suas vidas. Tem sido argumentado que os
processos automáticos são inevitáveis e indisponíveis
para a consciência (ver Capítulo 5). Modelo de ativação interativa McClelland e
A evidência de que a identificação de palavras pode ser Rumelhart (1981) propuseram um modelo de ativação
inevitável em algumas circunstâncias vem do efeito Stroop interativa influente do processamento visual de palavras
(ver Glossário), no qual nomear as cores nas quais as para explicar o efeito de superioridade da palavra. Foi
palavras são impressas fica mais lento quando as próprias baseado na suposição de que os processos de baixo
palavras têm nomes de cores diferentes (por exemplo, a para cima e de cima para baixo interagem (ver Figura 9.1):
palavra VERMELHO impressa em verde ). O efeito Stroop
sugere que o significado da palavra pode ser extraído
mesmo quando as pessoas tentam não processá-lo. • Existem unidades de reconhecimento em três níveis: o
Cheesman e Merikle (1984) descobriram que o efeito nível de recurso na parte inferior; o nível da letra no
Stroop pode ser obtido mesmo quando o nome da cor é meio; e a palavra nível no topo. • Quando um recurso
apresentado abaixo do nível de percepção consciente. em uma
letra é detectado (por exemplo, linha vertical no lado
Esta última descoberta sugere que o reconhecimento ou direito de uma letra), a ativação vai para todas as
identificação de palavras não depende necessariamente unidades de letras que contêm esse recurso (por
da percepção consciente. exemplo, H, M, N) e a inibição vai para todas as
outras unidades de letras. • As letras são
identificadas no nível da letra. Quando uma letra dentro
Processamento de letras e palavras de uma palavra é identificada, a ativação é enviada
Pode-se argumentar que o reconhecimento de uma para o nível da palavra para todas as unidades de
palavra na página impressa envolve duas etapas palavras de quatro letras que contenham aquela letra
sucessivas : naquela posição dentro da palavra, e a inibição é
enviada para todas as outras unidades de palavras.
(1) Identificação das letras individuais da palavra.

(2) Identificação de palavras. TERMOS CHAVE

Na verdade, porém, a noção de que a identificação da efeito de superioridade de palavra: uma letra de destino
é mais prontamente detectada em uma sequência de letras
letra deve estar completa antes que a identificação da
quando a sequência forma uma palavra do que quando não
palavra possa começar está errada. Por exemplo,
forma. pseudopalavra: uma não-palavra pronunciável (por
considere a palavra efeito de superioridade (Reicher, exemplo, “tave”).
1969). Uma sequência de letras é apresentada muito brevemente, seguida
Machine Translated by Google

338 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

apenas uma de suas letras. Assim, por exemplo, a


NÍVEL DE PALAVRA Inh. palavra “stem” tem palavras como “seem”, “step” e
“stew” como vizinhos ortográficos. Quando uma palavra
Exc. Inh. Inh. Exc. é apresentada, esses vizinhos ortográficos são ativados
e aumentam o tempo gasto para identificá-la.
LETRA NÍVEL Inh. Teoricamente, esse efeito inibitório é especialmente
grande quando os vizinhos ortográficos de uma palavra
Exc. Inh. Exc. Inh. são mais frequentes na língua do que a própria palavra.
Isso ocorre porque as palavras de alta frequência
NÍVEL DE RECURSO Inh. (palavras encontradas com frequência em nossa vida
cotidiana) têm níveis de ativação de repouso maiores do
que as de baixa frequência. Tem se mostrado muito
difícil encontrar esse efeito inibitório previsto de vizinhos
PALAVRA ESCRITA
de frequência mais alta em estudos usando palavras em
Inh. = Processo inibitório Exc. inglês (por exemplo, Sears, Campbell e Lupker, 2006).
= Processo excitatório
Curiosamente, há evidências muito mais fortes de um
efeito inibitório em outras línguas (por exemplo, francês,
Figura 9.1 Modelo de ativação interativa de McClelland
e Rumelhart (1981) de reconhecimento visual de holandês, espanhol; ver Sears et al., 2006, para uma
palavras. Adaptado de Ellis (1984). revisão). O inglês tem muito mais palavras curtas com
vários vizinhos de frequência mais alta do que esses
• As palavras são reconhecidas no nível da palavra. outros idiomas. Como resultado, efeitos inibitórios em
Unidades de palavra ativadas aumentam o nível de inglês podem tornar extremamente difícil identificar
ativação nas unidades de nível de letra para as muitas palavras de baixa frequência.
letras que formam essa palavra. O modelo prevê que o efeito de superioridade de
palavras deve ser maior para palavras de alta frequência
De acordo com o modelo, o processamento top- do que para palavras de baixa frequência. A razão é que
down está envolvido nos processos de ativação e inibição as palavras de alta frequência têm um nível de ativação
que vão do nível da palavra ao nível da letra. O efeito de de repouso mais alto e, portanto, devem gerar mais
superioridade da palavra ocorre devido a influências de ativação de cima para baixo do nível da palavra para o
cima para baixo do nível da palavra no nível da letra. nível da letra. Na verdade, porém, o tamanho do efeito
Suponha que a palavra SEAT seja apresentada e os de superioridade da palavra não é afetado pela frequência
participantes decidam se a terceira letra é um A ou um da palavra (Gunther, Gfoerer e Weiss, 1984).
N. Se a unidade de palavra para SEAT for ativada no
nível da palavra, isso aumentará a ativação da letra A Avaliação O
no nível da letra e inibirá a ativação de a letra N, levando modelo de ativação interativa tem sido muito infl uente.
a uma ativação mais forte do SEAT. Foi um dos primeiros exemplos de como um sistema de
processamento conexionista (veja o Capítulo 1) pode
Como explicar o efeito de superioridade da ser aplicado ao processamento visual de palavras.
pseudopalavra? Quando as letras são incorporadas em Aparentemente, explica fenômenos como o efeito de
não-palavras pronunciáveis, geralmente haverá alguma superioridade de palavras e o efeito de superioridade de
sobreposição de padrões de ortografia entre a pseudopalavras.
pseudopalavra e as palavras genuínas. Essa
sobreposição pode produzir ativação adicional das letras
TERMO-CHAVE
apresentadas na pseudopalavra e levar ao efeito de
superioridade da pseudopalavra.
vizinhos ortográficos: com referência a uma
De acordo com o modelo, o tempo para identificar
determinada palavra, aquelas outras palavras que
uma palavra depende em parte de seus vizinhos
podem ser formadas pela mudança de uma de suas letras.
ortográficos, as palavras que podem ser formadas pela mudança
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 339

O modelo não foi projetado para fornecer uma


60
descrição abrangente do reconhecimento de palavras.
50
Consequentemente, não é de surpreender que tenha
pouco a dizer sobre vários fatores que desempenham um 40

papel importante no reconhecimento de palavras. Por Facilitação


(ms) 30
exemplo, vimos que o processamento fonológico está
20
frequentemente envolvido no reconhecimento de palavras,
10
mas isso não é considerado no modelo. Além disso, o
modelo não aborda o papel do significado. 0

Como veremos, o significado do contexto relevante muitas 10

vezes influencia os estágios iniciais de reconhecimento 20


de palavras (por exemplo, Lucas, 1999; Penolazzi, Hauk,
Inibição
(ms)
30
& Pulvermüller, 2007).
40

50
Efeitos de contexto A
250 400 700
identificação de palavras é influenciada pelo contexto?
Intervalo prime-to-target (ms)
Esta questão foi abordada por Meyer e Schvan eveldt
(1971) em um estudo no qual os participantes decidiram Esperado, semanticamente relacionado

se sequências de letras formavam palavras (tarefa de Esperado, semanticamente não relacionado


Inesperado, semanticamente relacionado
decisão lexical). O tempo de decisão para uma palavra Inesperado, semanticamente não relacionado
(por exemplo, MÉDICO) foi menor quando o contexto
precedente ou prime era semanticamente relacionado (por Figura 9.2 O curso temporal dos efeitos inibitórios e facilitadores
do priming em função de a palavra-alvo estar ou não
exemplo, ENFERMEIRA) do que quando não era
relacionada semanticamente com o prime e de a palavra-alvo
semanticamente relacionado (por exemplo, BIBLIOTECA)
pertencer ou não à categoria esperada. Dados de Neely (1977).
ou não havia primo. Isso é conhecido como efeito de priming semântico.
Por que ocorre o efeito de priming semântico?
Talvez o contexto ou a palavra primária ative
automaticamente as representações armazenadas de (2) O nome da categoria foi seguido por um membro da
todas as palavras relacionadas a ela devido ao aprendizado mesma (mas inesperada) categoria (por exemplo,
prévio massivo. Outra possibilidade é que processos Bird-Magpie).
controlados possam estar envolvidos, com um primo como
NURSE levando os participantes a esperar que uma Houve dois efeitos de priming ou contexto (ver Figura
palavra semanticamente relacionada se siga. 9.2). Primeiro, houve um efeito rápido e automático
Neely (1977) distinguiu entre as explicações acima. baseado apenas na relação semântica.
A palavra inicial era um nome de categoria (por exemplo, Em segundo lugar, houve um efeito de atenção de ação
“Pássaro”), seguido por uma sequência de letras em um mais lenta com base apenas nas expectativas. Pesquisas
dos três intervalos: 250, 400 ou 700 ms. Na manipulação subsequentes geralmente confirmaram as descobertas de
de chaves, os participantes esperavam que um nome de Neely (1977), exceto que processos automáticos podem
categoria particular fosse geralmente seguido por um causar efeitos inibitórios em intervalos curtos (por exemplo,
membro de uma categoria pré-especificada diferente (por Antos, 1979).
exemplo, “Pássaro” seguido pelo nome de parte de um
edifício). Havia dois tipos de julgamento com esta
TERMO-CHAVE
manipulação:

efeito de priming semântico: a descoberta de que a


(1) O nome da categoria foi seguido por um membro de identificação de palavras é facilitada quando há
uma categoria diferente (mas esperada) (por priming por uma palavra semanticamente relacionada.
exemplo, Bird–Window).
Machine Translated by Google

340 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

Os efeitos de contexto ocorrem antes ou depois No início do homófono no final da frase, os participantes
de o indivíduo ter acesso ao léxico interno (um foram apresentados a quatro figuras. No exemplo
repositório que contém diversos tipos de informações dado, uma das figuras mostrava uma flor e outra
sobre palavras)? Em outras palavras, os efeitos de mostrava um objeto parecido com uma flor.
contexto precedem ou seguem o acesso lexical?
Lucas (1999) abordou essa questão em uma meta- Os participantes mostraram uma tendência a fixar a
análise. Na maioria dos estudos, cada frase de imagem em forma de flor, embora o contexto deixasse
contexto continha uma palavra ambígua (por exemplo, muito claro que esse não era o significado pretendido
“O homem passou o dia inteiro pescando na margem”). pelo homofone.
A palavra ambígua foi imediatamente seguida por uma Em suma, o contexto geralmente tem uma
palavra-alvo na qual foi realizada uma tarefa de influência rápida no processamento de texto. No
nomeação ou decisão lexical. A palavra-alvo era entanto, essa infl uência é menor que a total. Por
adequada (por exemplo, “rio”) ou inadequada (por exemplo, significados de palavras que são inapropriados
exemplo, “dinheiro”) ao significado da palavra ambígua em um determinado contexto podem ser ativados ao
no contexto da frase. No geral, a interpretação ouvir a fala ou ler (Chen & Boland, 2008).
adequada de uma palavra produziu mais priming do
que a inadequada.
Apoio adicional à noção de que o contexto pode LENDO EM VOZ ALTA
influenciar o acesso lexical foi relatado por Penolazzi
et al. (2007) usando potenciais relacionados a eventos Leia as seguintes palavras e pseudopalavras (não-
(ERPs). A palavra-alvo (mostrada aqui em negrito) era palavras pronunciáveis):
esperada (quando “aproximadamente” estava na
frase) ou não esperada (quando “perto” estava na CAT FOG PINT PINT MANTINESS
frase): “Ele estava logo ali/perto da esquina” . FASS
Houve uma diferença nos ERPs dentro de 200 ms do
início da palavra-alvo, dependendo se a palavra era Felizmente, você achou uma tarefa simples, embora
esperada ou inesperada. envolva complexidades ocultas. Por exemplo, como
A descoberta de que o significado do contexto afetou você sabe que o “b” em “comb” é mudo e que “pint”
o processamento da palavra-alvo tão rapidamente não rima com “hint”?
sugere (mas não prova) que o contexto afeta o Presumivelmente, você tem informações específicas
acesso lexical à palavra-alvo. armazenadas na memória de longo prazo sobre como
Vimos que o contexto tem um impacto rápido no pronunciar essas palavras. No entanto, isso não pode
processamento. No entanto, isso não significa que os explicar sua capacidade de pronunciar não-palavras
significados das palavras inconsistentes com o como “man tiness” e “fass”. Talvez pseudopalavras
contexto sejam sempre rejeitados logo no início. Chen sejam pronunciadas por analogia com palavras reais
e Boland (2008) focaram no processamento de (por exemplo, “fass” é pronunciado para rimar com “mass”).
homófonos. Eles selecionaram homófonos com um Outra possibilidade é que as regras que regem a
significado dominante e um não dominante (por tradução de sequências de letras em sons sejam
exemplo, “flor” é dominante e “fl our” é não dominante). usadas para gerar uma pronúncia para não-palavras.
Os participantes ouviram frases em algumas das quais
o contexto enviesou a interpretação para o significado
não dominante dos homófonos. Aqui está um exemplo: TERMOS CHAVE

léxico: um repositório de informações detalhadas


sobre palavras, incluindo conhecimento
O padeiro havia concordado em fazer várias
ortográfico, fonológico, semântico e
tortas para um grande evento hoje, então sintático. acesso lexical: entrar no léxico com
começou tirando os ingredientes necessários seu estoque de informações detalhadas sobre as palavras.
como leite, ovos e farinha.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 341

A descrição acima da leitura de palavras individuais Esses processos são relativamente organizados e
é supersimplificada. Estudos em pacientes com danos organizados, e alguns deles são baseados em regras.
cerebrais sugerem que existem diferentes distúrbios de De acordo com a abordagem conexionista, em contraste,
leitura, dependendo de quais partes do sistema de os vários processos envolvidos na leitura são usados
linguagem estão danificadas. Voltamo-nos agora para de forma mais flexível do que se supõe no modelo de
duas grandes abordagens teóricas que consideraram a rota dupla. Em termos grosseiros, é uma questão de
leitura em voz alta em indivíduos saudáveis e com “todas as mãos à bomba”: todo o conhecimento
danos cerebrais. Estes são o modelo em cascata de relevante que possuímos sobre os sons das palavras, a
rota dupla (Coltheart et al., 2001) e a abordagem grafia das palavras e os significados das palavras é
conexionista distribuída ou modelo triangular (Plaut, usado em paralelo, quer estejamos lendo palavras ou não-palavras.
McClelland, Seidenberg e Patterson, 1996).

Correndo o risco de simplificar demais, podemos Modelo em cascata de rota dupla Coltheart
identificar várias diferenças importantes entre as duas e seus colegas apresentaram várias teorias de leitura,
abordagens como segue. De acordo com a abordagem culminando em seu modelo em cascata de rota dupla
de rota dupla, os processos envolvidos na leitura de (2001; ver Figura 9.3). Este modelo é responsável pela
palavras e não-palavras diferem entre si. leitura

Imprimir

análise ortográfica

Léxico de
Rota 1
entrada ortográfica
Rota 2

sistema Sistema de regras grafema-


Rota 3 fonema
semântico

Léxico de saída
fonológica

Buffer de
resposta

Figura 9.3
Arquitetura básica
Discurso do modelo em cascata de rota dupla.
Adaptado de Coltheart et
al. (2001).
Machine Translated by Google

342 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

em voz alta e para leitura silenciosa. Existem dois conjunto de monossílabos ingleses que contém aquele
caminhos principais entre a palavra impressa e a fala, grafema” (p. 216).
ambos a partir da análise ortográfica (usada para Se um paciente com lesão cerebral usasse apenas
identificar e agrupar letras em palavras impressas). A a Rota 1, o que encontraríamos? O uso de regras de
distinção crucial é entre uma rota de pesquisa lexical ou conversão grafema-fonema deve permitir a pronúncia
de dicionário e uma rota não lexical (Rota 1), que precisa de palavras com correspondência ortografia-
envolve a conversão de letras em sons. Na Figura 9.3, som regular, mas não de palavras irregulares que não
a rota não lexical é a Rota 1, e a rota lexical é dividida estejam em conformidade com as regras de conversão.
em duas sub-rotas (Rotas 2 e 3). Por exemplo, se uma palavra irregular como “pint” tiver
regras de conversão grafema-fonema aplicadas a ela,
ela deve ser pronunciada para rimar com “hint”. Isso é
Supõe-se que indivíduos saudáveis usem ambas conhecido como regularização. Finalmente, as regras
as rotas ao ler em voz alta e que essas duas rotas não de conversão grafema-fonema podem fornecer
sejam independentes em seu funcionamento. No pronúncias de não-palavras.
entanto, nomear palavras apresentadas visualmente
normalmente depende mais da rota lexical do que da Os pacientes que aderem mais de perto ao uso
rota não lexical, porque a primeira rota geralmente opera exclusivo da Rota 1 são os disléxicos de superfície. A
mais rápido. dislexia superficial é uma condição que envolve
É um modelo em cascata porque a ativação em problemas específicos na leitura de palavras irregulares.
um nível é passada para o próximo nível antes que o McCarthy e Warrington (1984) estudaram KT, que sofria
processamento no primeiro nível seja concluído. Os de dislexia superficial. Ele leu 100% das não-palavras
modelos em cascata podem ser contrastados com os com precisão e 81% das palavras regulares, mas foi
modelos limiarizados nos quais a ativação em um nível bem-sucedido com apenas 41% das palavras irregulares.
só é passada para outros níveis depois que um Mais de 70% dos erros cometidos por KT com palavras
determinado limiar de ativação é atingido. irregulares foram devidos à regularização.
Anteriormente, discutimos abordagens teóricas que Se os pacientes com dislexia superficial usam
diferem na importância que atribuem ao processamento exclusivamente a Rota 1, seu desempenho de leitura
fonológico na identificação visual de palavras. não deve depender de variáveis lexicais (por exemplo,
Coltheart et ai. (2001) defendeu um modelo fonológico frequência de palavras). Isso não é verdade para alguns
fraco no qual a identificação de palavras geralmente disléxicos superficiais. Bub, Cancelliere e Kertesz (1985)
não depende do processamento fonológico. estudaram MP, que leu 85% das palavras irregulares
de alta frequência com precisão, mas apenas 40% das
de baixa frequência. Sua capacidade de ler muitas
Rota 1 (conversão grafema- palavras irregulares e seu desempenho superior com
fonema) palavras de alta frequência indicam que ela poderia
A rota 1 difere das outras rotas no uso da conversão fazer algum uso da rota lexical.
grafema-fonema, que envolve a conversão da ortografia De acordo com o modelo, a principal razão pela
(grafemas) em som (fonemas). Um grafema é uma qual os pacientes com dislexia superficial têm problemas
unidade básica da linguagem escrita e um fonema é
uma unidade básica da linguagem falada. De acordo
com Coltheart et al. (2001, p. 212), “Pelo termo 'grafema', TERMOS CHAVE
queremos dizer uma letra ou sequência de letras que
modelo em cascata: um modelo no qual a informação
corresponde a um único fonema, como o i em pig, o ng
em ping e o igh em high.” Em seu modelo computacional, passa de um nível para o outro antes que o
processamento seja concluído no primeiro
“Para qualquer grafema, o fonema atribuído a ele era o
nível. dislexia de superfície: uma condição na qual
fonema mais comumente associado a esse grafema no
palavras regulares podem ser lidas, mas há uma
capacidade prejudicada de ler palavras irregulares.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 343

ao ler palavras irregulares é que eles confiam lê 100% das palavras reais, mas apenas 10% das não-
principalmente na Rota 1. Se eles também puderem palavras. Funnell (1983) estudou um paciente, WB. Sua
fazer uso razoável da Rota 3, então eles poderão ler em capacidade de usar a Rota 1 era muito limitada porque
voz alta corretamente quase todas as palavras que ele não conseguia produzir o som de nenhuma letra
conhecem na ausência de qualquer conhecimento dos isolada ou não-palavras. Ele podia ler 85% das palavras
significados dessas palavras armazenadas no sistema e parecia fazer isso usando a Rota 2. Ele tinha uma
semântico. Assim, não deve haver associação entre habilidade ruim de fazer julgamentos semânticos sobre
conhecimento semântico prejudicado e a incidência de as palavras, sugerindo que estava ignorando o sistema
dislexia superficial. semântico ao ler as palavras.
Woollams, Lambon Ralph, Plaut e Patterson (2007)
estudaram pacientes com demência semântica (ver De acordo com o modelo de rota dupla, os
Glossário). Esta é uma condição na qual o dano cerebral disléxicos fonológicos têm problemas específicos com a
prejudica o conhecimento semântico (ver Capítulo 7), conversão grafema-fonema. No entanto, Coltheart (1996)
mas normalmente tem pouco efeito nos sistemas discutiu 18 pacientes com dislexia fonológica, todos com
ortográficos ou fonológicos. Houve uma forte associação comprometimento fonológico geral . Pesquisas
entre conhecimento semântico prejudicado e dislexia subsequentes indicaram que alguns disléxicos fonológicos
superficial entre esses pacientes. A implicação é que o têm deficiências tão específicas quanto assumidas no
dano ao sistema semântico costuma ser um fator modelo de rota dupla. Caccappolo-van Vliet, Miozzo e
importante na dislexia superficial. Stern (2004) estudaram dois disléxicos fonológicos. IB
era uma mulher de 77 anos que trabalhava como
secretária e MO era um contador de 48 anos. Ambos os
Rota 2 (léxico + conhecimento pacientes apresentaram o padrão típico associado à
semântico) e Rota 3 (somente léxico) dislexia fonológica – seu desempenho na leitura de
A ideia básica por trás da Rota 2 é que as representações palavras regulares e irregulares excedeu 90% em
de milhares de palavras familiares são armazenadas em comparação com menos de 60% com não-palavras.
um léxico ortográfico de entrada. A apresentação visual
de uma palavra leva à ativação no léxico ortográfico de
entrada. Segue-se a obtenção de seu significado a partir Crucialmente, o desempenho de IB e MO em várias
do sistema semântico, após o qual seu padrão sonoro é tarefas fonológicas (por exemplo, decidir se duas
gerado pelo léxico de saída fonológica. A rota 3 também palavras rimam; encontrar uma palavra que rima) estava
envolve os léxicos de entrada ortográfica e léxicos de intacto (acima de 95%).
saída fonológica, mas ignora o sistema semântico.
Dislexia profunda
A dislexia profunda ocorre como resultado de danos
Como poderíamos identificar pacientes usando a cerebrais nas áreas cerebrais do hemisfério esquerdo
Rota 2 ou a Rota 3, mas não a Rota 1? Seu léxico de envolvidas na linguagem. Os disléxicos profundos têm
entrada ortográfico intacto significa que eles podem problemas particulares na leitura de palavras desconhecidas e uma
pronunciar palavras familiares, sejam elas regulares ou
irregulares. No entanto, sua incapacidade de usar a
conversão grafema-fonema deve significar que eles TERMOS CHAVE
acham muito difícil pronunciar palavras desconhecidas e
não-palavras. dislexia fonológica: uma condição na qual palavras
Os disléxicos fonológicos se encaixam razoavelmente familiares podem ser lidas, mas há prejuízo na
bem nesse padrão previsto. A dislexia fonológica capacidade de ler palavras desconhecidas e não-
palavras. dislexia profunda: uma condição na
envolve problemas específicos com a leitura de palavras
qual a leitura de palavras desconhecidas é
desconhecidas e não-palavras. O primeiro caso de
prejudicada e há erros de leitura semântica (por
dislexia fonológica relatado sistematicamente foi RG exemplo, ler “míssil” como “foguete”).
(Beauvois & Dérouesné, 1979). RG com sucesso
Machine Translated by Google

344 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

incapacidade de ler não-palavras. No entanto, o sintoma que 7898 (99%) foram lidos com precisão. Quando o
mais marcante são os erros de leitura semântica (por modelo foi apresentado a 7.000 pseudopalavras de uma
exemplo, “navio” lido como “barco”). A dislexia profunda sílaba, ele leu 98,9% delas corretamente.
pode resultar de danos na conversão grafema-fonema Segue-se do modelo que podemos esperar que
e nos sistemas semânticos. A dislexia profunda se diferentes regiões do cérebro sejam associadas a cada
assemelha a uma forma mais grave de dislexia rota. O que tem sido feito em vários estudos é comparar
fonológica. De fato, os disléxicos profundos que mostram a ativação cerebral quando os participantes nomeiam
alguma recuperação das habilidades de leitura palavras irregulares e pseudopalavras (não-palavras
geralmente se tornam disléxicos fonológicos (Southwood & Chatterjee,
pronunciáveis).
2001).A suposição é que a rota lexical é de
Sato, Patterson, Fushimi, Maxim e Bryan (2008) importância primária com palavras irregulares, enquanto
estudaram uma mulher japonesa, YT. Ela teve problemas a rota não lexical é usada com pseudopalavras.
com a escrita japonesa kana (cada símbolo representa
uma sílaba) e com a escrita japonesa kanji (cada Seghier, Lee, Schofi eld, Ellis e Price (2008) descobriram
símbolo representa um morfema, que é a menor unidade que a região occipito-temporal anterior esquerda estava
de significado). YT mostrou dislexia profunda para kanji, associada à leitura de palavras irregulares.
mas dislexia fonológica para kana. Sato et ai. concluíram Em contraste, a região occipitotemporal posterior
que o desempenho de leitura prejudicado de YT foi esquerda foi associada à leitura de pseudopalavras.
devido principalmente a um déficit fonológico geral. Esses achados são consistentes com a noção de rotas
separadas na leitura.
A noção de que a dislexia profunda e a dislexia Zevin e Balota (2000) argumentaram que a medida
fonológica envolvem mecanismos subjacentes em que usamos as rotas lexicais e não lexicais ao
semelhantes é atraente. Jefferies, Sage e Lambon nomear palavras depende do controle atencional. Os
Ralph (2007) descobriram que os disléxicos profundos leitores nomearam palavras irregulares de baixa
tiveram um desempenho ruim em várias tarefas frequência ou pseudopalavras antes de nomear uma
baseadas na fonologia (por exemplo, adição de fonema; palavra-alvo. Eles previram que nomear palavras
subtração de fonema). Eles concluíram que os disléxicos irregulares faria com que os leitores prestassem atenção
profundos têm um comprometimento fonológico geral, à informação lexical, enquanto nomear pseudopalavras
assim como os disléxicos fonológicos. os levaria a prestar atenção à informação não lexical.
Como previsto, os papéis relativos das rotas lexical e
Modelagem computacional Coltheart não lexical na leitura da palavra-alvo foram afetados
et al. (2001) produziram um modelo computacional pelo que foi lido anteriormente.
detalhado para testar seu modelo em cascata de rota
dupla. Eles começaram com 7.981 palavras de uma De acordo com o modelo, as palavras regulares
sílaba variando em comprimento entre uma e oito letras. (aquelas em conformidade com as regras grafema-
Eles usaram o modelo de ativação interativa de fonema da Rota 1) podem frequentemente ser nomeadas
McClelland e Rumelhart (1981) (discutido anteriormente) mais rapidamente do que as palavras irregulares. De
como base para o componente ortográfico de seu acordo com a abordagem conexionista distribuída (Plaut
modelo, e o lado de saída ou resposta do modelo deriva et al., 1996; discutido em breve), o importante é a
das teorias de Dell (1986) e Levelt et al. (1999) (ver consistência. Palavras consistentes têm padrões de
Capítulo 11). A pronúncia mais ativada pelo letras que são sempre pronunciadas da mesma forma
processamento nas rotas lexical e não lexical é a que em todas as palavras em que aparecem e são
determina a resposta de nomeação. consideradas mais rápidas de nomear do que palavras inconsistentes.
Palavras irregulares tendem a ser inconsistentes e,
portanto, precisamos decidir se regularidade ou
consistência é mais importante. Jared (2002) comparou
Evidência diretamente os efeitos da regularidade e da consistência
Coltheart et al. (2001) apresentaram seu modelo na nomeação das palavras. Suas descobertas foram
computacional com todas as 7.981 palavras e encontraram razoavelmente claras: tempos de nomeação de palavras
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 345

Quais são as limitações do modelo? Primeiro, a


610
Inconsistente suposição de que o tempo necessário para pronunciar
600
590
regular uma palavra depende de sua regularidade e não de sua
consistente
580 consistência é incorreta (por exemplo, Glushko, 1979;
570 Jared, 2002). Isso é sério porque o significado teórico
560 da regularidade da palavra decorre diretamente da
nomeação
Latência
média
(ms)
de

550
suposição central de que a rota não lexical usa um
540
sistema de regras grafema-fonema.
530
520
510 Em segundo lugar, como Perry et al. (2007, p. 276)
500 apontou: “Uma grande deficiência do DRC [modelo em
HF-EXC HF-RI LF-EXC LF-RI cascata de rota dupla] é a ausência de aprendizado. O
tipo de palavra DRC é totalmente conectado, e a rota não lexical opera
com um conjunto parcialmente codificado de regras
Figura 9.4 Latências médias de nomeação para grafema-fonema.
palavras de alta frequência (HF) e de baixa frequência (LF)
Em terceiro lugar, o modelo assume que apenas a
que eram irregulares (palavras de exceção: EXC) ou
regulares e inconsistentes (RI). As latências médias de rota não lexical está envolvida na pronúncia de não-
nomenclatura de palavras consistentes regulares combinadas palavras. Como consequência, semelhanças e diferenças
com cada um desses tipos de palavras também são entre não-palavras e palavras genuínas são irrelevantes.
mostradas. As diferenças entre palavras consistentes
Na verdade, porém, veremos em breve que a previsão é
e inconsistentes foram muito maiores do que aquelas
incorreta, porque as não-palavras consistentes são mais
entre palavras regulares e irregulares (EXC em comparação
com RI). Reimpresso de Jared (2002), Copyright rápidas de pronunciar do que as inconsistentes (Zevin &
2002, com permissão da Elsevier. Seidenberg, 2006).

foram afetados muito mais pela consistência do que pela Em quarto lugar, o modelo assume que o
regularidade (ver Figura 9.4). Esta constatação, contrária processamento fonológico de palavras visualmente
ao modelo de via dupla, foi replicada em outros estudos apresentadas ocorre bastante lentamente e tem
(Harley, 2008). relativamente pouco efeito no reconhecimento visual de
palavras. Na verdade, entretanto, tais processos
Avaliação O fonológicos geralmente ocorrem rápida e automaticamente (Rastle & Bry
modelo em cascata de rota dupla representa uma Quinto, assume-se que o sistema semântico pode
tentativa ambiciosa de explicar os processos básicos de desempenhar um papel importante na leitura em voz alta
leitura em indivíduos saudáveis e com danos cerebrais. (ou seja, via Rota 2). Na prática, porém, “o sistema
Sua explicação de distúrbios de leitura, como dislexia semântico do modelo permanece não
superficial e dislexia fonológica, tem sido muito influente. implementado” (Woollams et al., 2007, p. 317). A razão
O modelo também se mostrou útil para explicar a é que é assumido dentro do modelo que os indivíduos
nomeação e o desempenho na decisão lexical de podem ler todas as palavras que conhecem sem acessar
indivíduos saudáveis, e recebeu algum apoio de estudos os significados dessas palavras.
em neurociência cognitiva (por exemplo, Seghier et al., Sexto, como Coltheart et al. (2001, p. 236) admitiu:
2008). Perry, Ziegler e Zorzi (2007) desenvolveram um “Os sistemas de escrita chinês, japonês e coreano são
novo modelo de processo duplo conexionista (o modelo estruturalmente tão diferentes do sistema de escrita
CDP+) baseado em parte no modelo em cascata de rota inglês que um modelo como o modelo DRC [cascata de
dupla. Esse novo modelo inclui uma rota lexical e uma rota dupla] simplesmente não seria aplicável: por
sublexical e elimina alguns dos problemas com o modelo exemplo, não-palavras monossilábicas não podem nem
em cascata de rota dupla (por exemplo, sua incapacidade mesmo ser escritas na escrita chinesa ou em kanji
de aprender; sua incapacidade de explicar os efeitos de japonês, então a distinção entre uma rota lexical e não-
consistência). lexical para leitura não pode sequer surgir.”
Machine Translated by Google

346 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

Abordagem conexionista
distribuída Contexto

Dentro do modelo de rota dupla, assume-se


que a pronúncia de palavras e não-palavras
irregulares envolve rotas diferentes. Isso Significado

contrasta com a abordagem conexionista


iniciada por Seidenberg e McClelland (1989)
e desenvolvida principalmente por Plaut et al.
(1996). De acordo com Plaut et al. (p. 58), sua abordagem

evita [evita] mecanismos separados para


Ortografia Fonologia
pronunciar não-palavras e palavras de exceção
[irregulares]. Em vez disso, todo o
conhecimento do sistema sobre as
correspondências ortografia-som é empregado FAZER /mAk/

na pronúncia de todos os tipos de cadeias


de letras [palavras e não-palavras]. Os conflitos Figura 9.5 Seidenberg e McClelland (1989)
“modelo triangular” de reconhecimento de palavras.
entre possíveis pronúncias alternativas de uma
As vias implementadas são mostradas em azul.
sequência de letras são resolvidos. . . por Reproduzido com permissão de Harm e Seidenberg (2001).
interações cooperativas e competitivas com
base em como a sequência de letras se relaciona
com todas as palavras conhecidas e suas pronúncias. conformidade com essas regras). Como vimos, as
evidências favorecem a noção de consistência em
Assim, Plaut et al. (1996) assumiram que a pronúncia detrimento da regularidade (Jared, 2002).
de palavras e não-palavras é baseada em um sistema Plaut et ai. (1996) desenvolveram uma simulação
altamente interativo . bem-sucedida de desempenho de leitura. Seu
Essa abordagem geral é conhecida como trabalho em rede aprendeu a pronunciar palavras com
abordagem conexionista distribuída ou modelo precisão conforme as conexões desenvolvidas entre
triangular (ver Figura 9.5). Os três lados do triângulo as formas visuais das letras e combinações de letras
são ortografia (ortografia), fonologia (som) e semântica (unidades de grafema) e seus fonemas
(significado). Há duas rotas da ortografia ao som: (1) correspondentes (unidades de fonema). A rede
uma via direta da ortografia à fonologia; e (2) um aprendida via retropropagação, na qual as saídas ou
caminho indireto da ortografia para a fonologia que respostas reais do sistema são comparadas com as
procede através dos significados das palavras. corretas (consulte o Capítulo 1). A rede recebeu
treinamento prolongado com 2998 palavras. Ao final
Plaut et ai. (1996) argumentou que as palavras da formação, o desempenho da rede se assemelha
(e não-palavras) variam em consistência (a medida ao dos leitores adultos em vários aspectos:
em que sua pronúncia concorda com a de palavras
com grafia semelhante). Palavras e não-palavras
altamente consistentes geralmente podem ser (1) Palavras inconsistentes levaram mais tempo para nomear
pronunciadas com mais rapidez e precisão do que do que palavras consistentes.
palavras e não-palavras inconsistentes, porque mais (2) Palavras raras levaram mais tempo para nomear do que
do conhecimento disponível suporta a pronúncia comuns.
correta de tais palavras. Em contraste, o modelo em (3) Houve uma interação entre frequência de palavras
cascata de rota dupla divide as palavras em duas e consistência, sendo os efeitos da consistência
categorias: as palavras são regulares (conforme as muito maiores para palavras raras do que para
regras grafema-fonema) ou irregulares (não palavras comuns.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 347

(4) A rede pronunciou mais de 90% das não-palavras uma deficiência ortográfica além da fonológica. Howard
“corretamente”, o que é comparável a leitores e Best (1996) descobriram que sua paciente, Melanie-
adultos. Isso é impressionante, visto que a rede Jane, era melhor em ler pseudohomófonos cuja
não recebeu treinamento direto sobre não- ortografia lembrava a palavra relacionada (por exemplo,
palavras. “gerl”) do que aqueles cuja grafia não lembrava (por
exemplo, “phocks”). Finalmente, Nickels, Biedermann,
Que papel o conhecimento semântico das palavras Coltheart, Saunders e Tree (2008) usaram uma
desempenha no modelo de Plaut et al. (1996)? Supõe- combinação de modelagem de computador e dados de
se que a rota da ortografia para a fonologia via disléxicos fonológicos. Nenhum locus único de
significado é tipicamente mais lenta do que a rota direta deficiência (por exemplo, o sistema fonológico) poderia
que procede diretamente da ortografia para a fonologia. explicar as várias deficiências encontradas nos
É mais provável que o conhecimento semântico tenha pacientes.
impacto em palavras inconsistentes – elas demoram O que o modelo diz sobre a dislexia profunda?
mais para serem nomeadas e isso oferece mais Anteriormente, discutimos evidências (por exemplo,
oportunidades para que o conhecimento semântico Jefferies et al., 2007) sugerindo que um comprometimento
tenha efeito. fonológico geral é de grande importância na dislexia
profunda. Suporte para este ponto de vista foi fornecido
Evidência por Crisp e Lambon Ralph (2006). Eles estudaram
Como a abordagem conexionista distribuída explica a pacientes com dislexia profunda ou dislexia fonológica.
dislexia superficial, a dislexia fonológica e a dislexia Não havia uma linha divisória clara entre as duas
profunda? Supõe-se que a dislexia superficial condições, com os dois grupos compartilhando muitos
(envolvendo problemas na leitura de palavras irregulares sintomas. Os pacientes com ambas as condições
ou inconsistentes) ocorra principalmente por causa de tinham um comprometimento fonológico grave, mas os
danos ao sistema semântico. Vimos anteriormente que pacientes com dislexia profunda eram mais propensos
os pacientes com demência semântica (que envolve do que aqueles com dislexia fonológica a apresentar
danos extensos ao sistema semântico) geralmente comprometimentos semânticos graves também.
exibem os sintomas de dislexia superficial. Plaut et ai.
(1996) danificaram seu modelo para reduzir ou eliminar De acordo com o modelo, fatores semânticos
a contribuição da semântica. O desempenho de leitura podem ser importantes na leitura em voz alta,
da rede permaneceu muito bom em palavras regulares especialmente quando as palavras (ou não-palavras)
de alta e baixa frequência e em não palavras, pior em são irregulares ou inconsistentes e, portanto, são mais difíceis de ler.
palavras irregulares de alta frequência e pior em McKay, Davis, Savage e Castles (2008) decidiram
palavras irregulares de baixa frequência. testar essa predição diretamente treinando os
participantes para ler em voz alta não palavras (por exemplo, “bink”).
Isso corresponde ao padrão encontrado nos disléxicos Algumas das não-palavras tinham pronúncias
superficiais. consistentes (ou esperadas), enquanto outras tinham
Supõe-se que a dislexia fonológica (envolvendo pronúncias inconsistentes. A manipulação crucial foi
problemas na leitura de palavras desconhecidas e não- que os participantes aprenderam o significado de
palavras) se deva a um comprometimento geral do algumas dessas não-palavras, mas não de outras.
processamento fonológico. A evidência é mista (ver Os achados obtidos por McKay et al. (2008)
discussão anterior). Por um lado, Coltheart (1996) estavam totalmente de acordo com o modelo. Ler em
encontrou muitos casos em que a dislexia fonológica voz alta foi mais rápido para não-palavras na condição
estava associada a um comprometimento fonológico semântica (aprender pronúncias) do que na condição
geral. Por outro lado, Caccappolo-van Vliet et al. (2004) não-semântica, quando as não-palavras eram
estudaram disléxicos fonológicos cujo processamento inconsistentes (ver Figura 9.6). No entanto, a velocidade
fonológico estava quase intacto. de leitura em voz alta foi a mesma nas condições
semânticas e não semânticas quando as não-palavras
Os disléxicos fonológicos também podem sofrer de eram consistentes.
Machine Translated by Google

348 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

para o modelo triangular, no entanto, as pronúncias


1000 de não-palavras inconsistentes deveriam ser mais
não-semântico variáveis do que as consistentes, e foi isso que foi
Semântica encontrado.
900

Avaliação A
800
Latência
leitura
(ms)
de

abordagem conexionista distribuída tem vários sucessos


a seu favor. Primeiro, a suposição abrangente de que

700
os sistemas ortográfico, semântico e fonológico são
usados em paralelo de forma interativa durante a leitura
recebeu muito apoio. Em segundo lugar, muito
600 progresso foi feito na compreensão dos distúrbios de
Consistente Inconsistente leitura, assumindo que um comprometimento fonológico
Novas palavras treinadas
geral é a base da dislexia fonológica, enquanto um
comprometimento semântico é a base da dislexia
Figura 9.6 Latências médias de leitura em ms superficial. Em terceiro lugar, a suposição de que o
para novas palavras consistentes e inconsistentes (não- sistema semântico costuma ser importante na leitura
palavras) que foram aprendidas com significados em voz alta parece correta (por exemplo, McKay et al.,
(semânticos) ou sem significados (não-semânticos). De McKay et al.
2008).
(2008), Copyright © 2008 American Psychological
Association. Reproduzido com permissão. Em quarto lugar, a suposição de que a consistência é
mais importante do que a regularidade das palavras
De acordo com o modelo triangular, o tempo (enfatizada no modelo em cascata de rota dupla) na
necessário para pronunciar não-palavras deve depender determinação do tempo necessário para nomear as
de serem consistentes ou não. Por exemplo, o corpo palavras recebeu forte apoio. Em quinto lugar, a
da palavra “–ust” é muito consistente porque é sempre abordagem conexionista distribuída é mais bem-
pronunciado da mesma maneira em palavras sucedida do que o modelo de rota dupla na
monossilábicas e, portanto, a não-palavra “nust” é contabilização de efeitos de consistência com não-
consistente. Em contraste, o corpo da palavra “–ave” é palavras e diferenças individuais na nomeação de não-
inconsistente porque é pronunciado de maneiras palavras (Zevin & Seidenberg, 2006). Em sexto lugar,
diferentes em palavras diferentes (por exemplo, “salvar” a abordagem coneccionista distribuída inclui um
e “ter”) e, portanto, a não-palavra “mave” é inconsistente. mecanismo explícito para simular como aprendemos a
A previsão é que não-palavras inconsistentes levarão pronunciar palavras, enquanto o modelo de rota dupla
mais tempo para serem pronunciadas. De acordo com tem menos a dizer sobre a aprendizagem.
o modelo em cascata de rota dupla, em contraste, não- Quais são as limitações do modelo triangular?
palavras são pronunciadas usando regras de pronúncia Primeiro, como Harley (2008) apontou, os modelos
não-léxicas e, portanto, não deve haver diferença entre conexionistas tendem a se concentrar nos processos
não-palavras consistentes e inconsistentes. envolvidos na leitura de palavras relativamente simples
e de uma única sílaba.
As descobertas são claras. Não palavras Em segundo lugar, como Plaut et al. (1996, p. 108)
inconsistentes levam mais tempo para serem admitiu: “A natureza do processamento dentro do
pronunciadas do que palavras consistentes (Glushko, caminho semântico foi caracterizada apenas da maneira
1979; Zevin & Seidenberg, 2006). Tais descobertas mais grosseira”. No entanto, Harm e Seidenberg (2004)
fornecem suporte para o modelo de triângulo sobre o modelo preencheram
de rota dupla.amplamente essa lacuna dentro do
Zevin e Seidenberg obtiveram mais suporte para o modelo triangular implementando seu componente
modelo triangular sobre o modelo de rota dupla. De semântico para mapear a ortografia e a fonologia na
acordo com o modelo de rota dupla, as regras de semântica.
pronúncia devem gerar apenas uma pronúncia para Terceiro, as explicações do modelo sobre dislexia
cada não-palavra. De acordo com fonológica e dislexia superficial são
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 349

um tanto simplificado. Supõe-se que a dislexia fonológica mutilado para permitir a leitura normal apenas dentro
se deva a um comprometimento fonológico geral, mas da região da janela. Os efeitos de janelas de tamanhos
alguns disléxicos fonológicos não apresentam esse diferentes no desempenho da leitura podem ser
comprometimento geral (por exemplo, Caccappolo-van comparados.
Vliet et al., 2004; Tree & Kay, 2006). De maneira O alcance perceptivo (campo de visão efetivo) é
semelhante, supõe-se que a dislexia superficial se deva afetado pela dificuldade do texto e tamanho da
a um comprometimento semântico geral, mas nem impressão. Estende-se três ou quatro letras à esquerda
sempre é esse o caso (Woollams et al., 2007). da fixação e até 15 letras à direita.
Essa assimetria é claramente aprendida. Os leitores do
Quarto, vimos anteriormente que os processos hebraico, que é lido da direita para a esquerda, mostram
envolvidos na nomeação de palavras podem ser a assimetria oposta (Pollatsek, Bolozky, Well, & Rayner,
influenciados pelo controle atencional (Zevin & Balota, 2000). 1981). O tamanho do intervalo perceptivo significa que
No entanto, este não é um fator explicitamente a informação parafoveal (da área ao redor da região
considerado dentro do modelo triangular. central ou foveal de alta acuidade visual) é usada na
leitura.
Evidências convincentes vêm do uso da técnica de
LEITURA: MOVIMENTO DOS OLHOS limite, na qual há uma palavra de visualização logo à
PESQUISAR direita do ponto de fixação.
À medida que o leitor faz uma sacada para essa palavra,
Os movimentos oculares são de fundamental importância ela muda para a palavra-alvo, embora o leitor não
para a leitura. A maior parte das informações que perceba a mudança. A duração da fixação na palavra
processamos de um texto em determinado momento de destino é menor quando essa palavra é igual à
diz respeito à palavra que está sendo fixada no palavra de visualização. A evidência usando esta
momento, embora algumas informações possam ser técnica sugere que a informação visual e fonológica
processadas de outras palavras próximas ao ponto de fixação.pode ser extraída (ver Reichle, Pollatsek, Fisher, &
Nossos olhos parecem se mover suavemente pela Rayner, 1998) do processamento parafoveal.
página durante a leitura. Na verdade, eles realmente se
movem em movimentos rápidos (sacadas), como você Os leitores normalmente fixam cerca de 80% das
pode ver se olhar atentamente para outra pessoa lendo. palavras de conteúdo (substantivos, verbos e adjetivos),
As sacadas são balísticas (uma vez iniciadas, sua enquanto fixam apenas cerca de 20% das palavras
direção não pode ser alterada). Existem regressões funcionais (artigos como “a” e “o”; conjunções como “e”,
bastante frequentes em que os olhos se movem para “ mas” e “ou”); e pronomes como “ele”, “ela” e “eles”).
trás no texto, representando cerca de 10% de todas as Palavras não fixas tendem a ser comuns, curtas ou
sacadas. As sacadas levam de 20 a 30 ms para serem previsíveis.
concluídas e são separadas por fixações que duram de Assim, as palavras fáceis de processar têm maior probabilidade
200 a 250 ms. O comprimento de cada sacada é de de serem ignoradas. Finalmente, há o efeito de transbordamento:
aproximadamente oito letras ou espaços.
A informação é extraída do texto apenas durante cada
fixação e não durante as sacadas intermediárias TERMOS CHAVE
(Latour, 1962).
A quantidade de texto a partir da qual informações sacadas: movimentos oculares rápidos que não podem
úteis podem ser obtidas em cada fixação foi estudada ser alterados depois de iniciados.
usando a técnica de “janela móvel” (ver Rayner & amplitude perceptiva: o campo de visão efetivo na

Sereno, 1994). A maior parte do texto é mutilada, exceto leitura (letras à esquerda e à direita da fixação que
podem ser processadas).
por uma área ou janela definida pelo experimentador
efeito de transbordamento: qualquer palavra é
em torno do ponto de fixação do leitor. Cada vez que o
fixada por mais tempo durante a leitura quando precedida
leitor move os olhos, diferentes partes do texto são por uma palavra rara em vez de uma palavra comum.
Machine Translated by Google

350 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

o tempo de fixação em uma palavra é maior quando ela é então, eles poderiam decidir quais palavras pular?
precedida por uma palavra rara. O modelo EZ Reader fornece uma solução elegante
para os problemas acima. Uma suposição crucial é que o
próximo movimento do olho é programado depois que
EZ Reader modelo Reichle et apenas parte do processamento da palavra atualmente
al. (1998), Reichle, Rayner e Pollatsek (2003) e Pollatsek, fixada tiver ocorrido. Essa suposição reduz muito o tempo
Reichle e Rayner (2006) explicaram o padrão de movimentos entre a conclusão do processamento na palavra atual e o
oculares na leitura em várias versões de seu modelo EZ movimento dos olhos para a próxima palavra.
Reader. O nome é uma paródia do título do filme Easy
Rider. No entanto, isso só fica claro se você souber que Z Normalmente, há menos tempo livre disponível com
é pronunciado como “zee” no inglês americano! palavras raras do que com palavras comuns, e isso explica
o efeito de transbordamento descrito acima.
Se o processamento da próxima palavra for concluído com
Como usamos nossos olhos ao ler? O modelo mais rapidez suficiente (por exemplo, é altamente previsível no
óbvio assume que fixamos em uma palavra até que a contexto da frase), ela é ignorada.
tenhamos processado adequadamente, após o que fixamos De acordo com o modelo, os leitores podem prestar
imediatamente a próxima palavra até que ela tenha sido atenção a duas palavras (a atualmente fixada e a próxima
processada adequadamente. palavra) durante uma única fixação. No entanto, trata-se de
Infelizmente, existem dois grandes problemas com esse um modelo de processamento serial , o que significa que,
modelo. Primeiro, leva de 85 a 200 ms para executar um em determinado momento, apenas uma palavra é processada.
programa de movimento ocular. Se os leitores operassem Isso pode ser contrastado com modelos de processamento
de acordo com o modelo simples descrito acima, perderiam paralelo , como o modelo SWIFT (Saccade-generation With
tempo esperando que seus olhos se movessem para a Inhibition by Foveal Targets) apresentado por Engbert,
próxima palavra. Em segundo lugar, como vimos, os leitores Longtin e Kliegl (2002) e Engbert, Nuthmann, Richter e
às vezes pulam palavras. É difícil ver como isso poderia Kliegl (2005). Supõe-se dentro do modelo SWIFT que as
acontecer dentro do modelo, porque os leitores não durações das fixações oculares na leitura são infl uenciadas
saberiam nada sobre a próxima palavra até que a tivessem pela palavra anterior e seguinte, bem como pela atualmente
fixado. Como, fixada. Como Kliegl (2007) apontou, o alcance perceptivo
típico de cerca de 18 letras é grande o suficiente para
acomodar todas as três palavras (anterior, atual e seguinte),
desde que tenham comprimento médio.

Discutiremos evidências comparando modelos seriais e


paralelos mais tarde.
Aqui estão as principais suposições do modelo EZ
Reader:

(1) Os leitores verificam a familiaridade da palavra


atualmente fixada.
(2) A conclusão da verificação de frequência de uma
palavra (o primeiro estágio do acesso lexical) é o
sinal para iniciar um programa de movimento ocular.
De acordo com o modelo EZ Reader (uma paródia
do título do filme Easy Rider), os leitores podem (3) Os leitores então se envolvem no segundo estágio de
atender a duas palavras (a atualmente fixada e a
acesso lexical (ver Glossário), que envolve o acesso
próxima palavra) durante uma única fixação.
© John Springer Collection/CORBIS. às formas semânticas e fonológicas da palavra atual.
Esse
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 351

estágio leva mais tempo do que o primeiro. Evidências


(4) A conclusão do segundo estágio é o sinal para uma Reichle et al. (2003) comparou 11 modelos de leitura em
mudança de atenção encoberta (interna) para a termos de se cada um poderia explicar cada um dos oito
próxima palavra. fenômenos (por exemplo, efeitos de frequência; efeitos de
(5) Verificação de frequência e acesso lexical são transbordamento; custos de pular). O EZ Reader foi
concluídos mais rapidamente para palavras comuns responsável por todos os oito fenômenos, enquanto oito
do que raras (mais ainda para acesso lexical). dos outros modelos foram responsáveis por não mais do
(6) A verificação de frequência e o acesso lexical são que dois.
concluídos mais rapidamente para palavras Uma das principais suposições do modelo é que as
previsíveis do que imprevisíveis. informações sobre a frequência das palavras são
acessadas rapidamente durante o processamento de
As suposições teóricas acima levam a várias palavras. Há suporte para essa suposição. Por exemplo,
previsões (ver Figura 9.7). As suposições (2) e (5) juntas Sereno, Rayner e Posner (1998) observaram efeitos da
prevêem que o tempo gasto fixando palavras comuns será frequência de palavras em potenciais relacionados a
menor do que palavras raras: isso foi encontrado eventos (ERPs; consulte o Glossário) em 150 ms.
repetidamente. De acordo com o modelo, os leitores O modelo foi projetado para levar em conta as
gastam o tempo entre a conclusão do acesso lexical a fixações oculares de falantes nativos de inglês lendo
uma palavra e o próximo movimento ocular no textos em inglês. No entanto, o inglês é incomum em
processamento parafoveal da próxima palavra. Há menos alguns aspectos (por exemplo, a ordem das palavras é
processamento parafoveal quando a palavra fixa é rara muito importante) e é possível que as estratégias de leitura
(ver Figura 9.7). Assim, a palavra que segue uma palavra usadas pelos leitores de inglês não sejam universais. Essa
rara precisa ser fixada por mais tempo do que a palavra questão foi abordada por Rayner, Li e Pollatsek (2007),
que segue uma palavra comum (o efeito de transbordamento que estudaram os movimentos oculares em leitores
descrito anteriormente). chineses lendo textos em chinês. O chinês difere do inglês
porque é escrito sem espaços entre caracteres sucessivos
Por que palavras comuns, previsíveis ou curtas têm e consiste em palavras compostas principalmente por dois
maior probabilidade de serem ignoradas ou não corrigidas? caracteres.
Uma palavra é ignorada quando seu acesso lexical é No entanto, o padrão de movimentos oculares foi
concluído enquanto a palavra atual está sendo fixada. É semelhante ao encontrado anteriormente para leitores de
mais provável que isso aconteça com palavras comuns, inglês.
previsíveis ou curtas porque o acesso lexical é mais rápido De acordo com o modelo, a frequência de palavras e
para essas palavras (suposições 5 e 6). a previsibilidade de palavras são fatores independentes
que determinam quanto tempo fixamos em uma palavra
durante a leitura. No entanto, McDonald e

300

250

200
movimentos
oculares
(ms)
Movimento dos olhos executado
sucessivas
Tempo
entre

150

100 Conclusão do acesso lexical: início


do processamento da próxima palavra
50 Figura 9.7 Os efeitos da
Conclusão da verificação de familiaridade
frequência das palavras nos
0 0 1 2 3 4 5 6 7 8 9 10 11 movimentos oculares de acordo
Frequência de palavras com o modelo EZ Reader.
Adaptado de Reichle et al. (1998).
Machine Translated by Google

352 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

Shillcock (2003) descobriu que as palavras comuns eram (embora palavras ocasionais possam ser omitidas).
mais previsíveis do que as raras com base na palavra Se os leitores se desviarem da ordem “correta”, seria de
anterior. Quando os efeitos da frequência de palavras e se esperar que eles lutassem para entender o que estão
da previsibilidade de palavras foram separados, os lendo. Em contraste, um modelo de processamento
efeitos da frequência de palavras no tempo de fixação paralelo como o SWIFT não pressupõe que as palavras
de palavras desapareceram. devam ser lidas na ordem correta ou que o desvio dessa
Supõe-se dentro do modelo que as fixações devem ordem crie necessariamente problemas.
ser mais curtas quando estão no centro das palavras, e
não nas extremidades. A razão é porque a identificação Kennedy e Pynte (2008) descobriram que os leitores
de palavras deve ser mais fácil quando isso acontece. raramente leem os textos de maneira totalmente ordenada.
De fato, as fixações tendem a ser muito mais longas Além disso, não havia praticamente nenhuma evidência
quando estão no centro das palavras do que em uma de que a falha em ler as palavras em um texto na ordem
extremidade (Vitu, McConkie, Kerr, & O'Regan, 2001). correta causasse qualquer interrupção significativa no
Por que é isso? Algumas fixações no final de uma palavra processamento.
são curtas porque os leitores decidem fazer uma segunda
fixação mais próxima do meio da palavra para facilitar Avaliação O
sua identificação. modelo provou ser muito bem sucedido. Ele especifica
muitos dos principais fatores que determinam os
Voltamo-nos finalmente para a suposição movimentos oculares na leitura e tem um bom
controversa de que as palavras são processadas em desempenho em relação aos modelos rivais. Em um
série (uma de cada vez), que é contestada pelos nível muito geral, o modelo identificou conexões estreitas
defensores de modelos de processamento paralelo como entre fixações oculares e processos cognitivos durante a
o SWIFT (Engbert et al., 2002, 2005). Vamos nos leitura. Além disso, o modelo identificou vários fatores
concentrar nos efeitos parafoveais sobre foveais – (por exemplo, frequência de palavras; previsibilidade de
parece complicado, mas simplesmente significa que as palavras) que influenciam os tempos de fixação.
características da próxima palavra influenciam a duração Quais são as limitações do modelo?
da fixação na palavra atual . Se tais efeitos existirem, Primeiro, sua ênfase está nos processos iniciais
eles sugerem que a palavra atual e a próxima são envolvidos na leitura (por exemplo, acesso lexical).
processadas ao mesmo tempo. Em outras palavras, Como resultado, o modelo tem pouco a dizer sobre
esses efeitos sugerem a existência de processamento processos de nível superior (por exemplo, integração de
paralelo, que é previsto pelo modelo SWIFT, mas não informações entre as palavras dentro de uma frase) que
pelo modelo EZ Reader. são importantes na leitura. Reichle et ai. (2003) defendeu
Os resultados são mistos (ver Rayner et al. (2007) sua negligência de processos de nível superior da
para uma revisão). No entanto, Kennedy, Pynte e Ducrot seguinte forma: “Nós postulamos [assumimos] que os
(2002) obtiveram evidências convincentes de efeitos processos de ordem superior intervêm no controle do
parafoveais sobre foveais em um estudo movimento dos olhos apenas quando 'algo está errado'
metodologicamente sólido. White (2008) variou a e enviam uma mensagem para parar de avançar ou um
familiaridade ortográfica e a frequência da palavra sinal para executar uma regressão.”
seguinte. Não houve efeitos parafoveais sobre foveais Em segundo lugar, foram levantadas dúvidas sobre
quando a frequência das palavras foi manipulada e as suposições do modelo de que a atenção é alocada
apenas um efeito muito pequeno (6 ms) quando a de forma serial para apenas uma palavra em cada palavra.
familiaridade ortográfica foi manipulada. Essas
descobertas sugerem que pode haver uma quantidade
TERMO-CHAVE
limitada de processamento paralelo envolvendo recursos
de baixo nível (ou seja, letras) da próxima palavra, mas
efeitos parafoveal-on-foveal: a constatação de que
não recursos lexicais (ou seja, frequência da palavra). a duração da fixação na palavra atual é
De acordo com o modelo EZ Reader, os leitores
influenciado pelas características da próxima palavra.
fixam e processam palavras na ordem “correta”
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 353

uma vez e que as palavras são processadas na ordem de fixações oculares. No entanto, a frequência das palavras
“correta”. A existência de efeitos parafoveal-on foveal (por geralmente se correlaciona com a previsibilidade das
exemplo, Kennedy et al., 2002; White, 2008) sugere que o palavras, e algumas evidências (por exemplo, McDonald &
processamento paralelo pode ocorrer, mas os efeitos Shillcock, 2003) sugerem que a previsibilidade das palavras
geralmente são pequenos. A constatação de que a maioria pode ser mais importante do que a frequência das palavras.
dos leitores falha ao processar as palavras em um texto
estritamente na ordem “correta” é inconsistente com o modelo.
OUVIR A FALA
Em terceiro lugar, a ênfase do modelo talvez seja
demais na explicação dos dados do movimento ocular, em A compreensão da fala é muito menos direta do que se
vez de outras descobertas sobre a leitura. Como Sereno, poderia imaginar. Alguma ideia dos processos envolvidos na
Brewer e O'Donnell (2003, p. 331) apontaram, “O perigo é escuta da fala é fornecida na Figura 9.8. A primeira etapa
que, ao estabelecer um modelo de controle do movimento envolve a decodificação do sinal auditivo. Como Liberman,
ocular, o resultado pode ser um modelo de experimentos de Cooper, Shankweiler e Studdert-Kennedy (1967) apontaram,
movimento ocular”. a fala pode ser considerada um código, e nós, como ouvintes,
O que é necessário é integrar as descobertas dos estudos possuímos a chave para entendê-la. No entanto, antes de
dos movimentos oculares mais de perto com as teorias começar a fazer isso, muitas vezes precisamos selecionar o
gerais da leitura. sinal de fala de outra entrada auditiva completamente
Em quarto lugar, o modelo atribui grande importância à irrelevante.
frequência das palavras como determinante do comprimento

Integrar Integração no
modelo de
discurso

interpretação
de enunciado
Reconhecer – análise sintática –
Reconhecimento processamento temático
de palavras –
ativação de candidatos lexicais

– competição –
recuperação de
informação lexical
Segmento

Transformar em
representação abstrata

Decodificar

Selecione a fala do
fundo acústico Figura 9.8 Os
principais processos
envolvidos na
percepção e
entrada auditiva compreensão da fala. De
Cutler e Clifton (1999)
com permissão da Oxford University Press.
Machine Translated by Google

354 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

(por exemplo, ruído do tráfego). A própria decodificação O quarto e o quinto estágios enfatizam a compreensão
envolve a extração de elementos discretos do sinal de fala. da fala. O foco no quarto estágio está na interpretação do
Cutler e Clifton (1999, p. 126) fornecem um bom relato do enunciado.
que está envolvido: “Os linguistas descrevem a fala como Isso envolve a construção de um significado coerente para
uma série de segmentos fonéticos; um segmento fonético cada frase com base em informações sobre palavras
(fonema) é simplesmente a menor unidade em termos da individuais e sua ordem na frase. Finalmente, no quinto
qual a linguagem falada pode ser descrita sequencialmente. estágio, o foco está na integração do significado da frase
Assim, a palavra chave consiste de dois segmentos /ki/, e atual com a fala anterior para construir um modelo geral
mar dos dois segmentos /si/; eles diferem no primeiro da mensagem do locutor.
fonema.
Geralmente, assume-se que o segundo estágio da
percepção da fala envolve a identificação das sílabas
contidas no sinal de fala. Sinal de fala
No entanto, há alguma controvérsia sobre se o fonema ou Informações úteis sobre o sinal de fala foram obtidas do
a sílaba é a unidade básica (ou bloco de construção) na espectrógrafo. O som entra neste instrumento através
percepção da fala. Goldinger e Azuma (2003) de um microfone e é então convertido em um sinal elétrico.
argumentaram que não existe uma unidade básica de
percepção da fala. Em vez disso, a unidade perceptiva Este sinal é enviado para um banco de filtros que
varia fl exivelmente dependendo das circunstâncias selecionam bandas de frequência estreita. Finalmente, o
precisas. Eles apresentaram aos ouvintes listas de não- espectrógrafo produz um registro visível das frequências
palavras de duas sílabas e pediram que decidissem se componentes da fala ao longo do tempo; isso é conhecido
cada não-palavra continha um alvo. O alvo era um fonema como espectrograma (consulte a Figura 9.9). Isso fornece
ou uma sílaba. informações sobre os formantes, que são faixas de
Os voluntários que registraram as listas de não-palavras frequência enfatizadas pelo aparelho vocal ao dizer um
foram informados de que os fonemas são as unidades fonema. As vogais têm três formantes numerados primeiro,
básicas de percepção da fala ou que as sílabas são as segundo e terceiro, começando com o formante de menor
unidades básicas. Essas instruções influenciaram como frequência.
eles liam as não-palavras e isso, por sua vez, afetou o A frequência sonora das vogais é geralmente menor do
desempenho dos ouvintes. Os ouvintes detectaram alvos que a das consoantes.
de fonemas mais rapidamente do que alvos de sílabas Os espectrogramas podem parecer fornecer uma
quando o falante acreditava que os fonemas são as imagem precisa dos aspectos da onda sonora que têm
unidades fundamentais na percepção da fala. maior influência no sistema auditivo humano. No entanto,
Em contraste, eles detectaram alvos de sílabas mais isso não é necessariamente assim. Por exemplo, os
rapidamente do que alvos de fonemas quando o falante formantes parecem importantes em um espectrograma,
acreditava que as sílabas são as unidades perceptivas mas isso não prova que sejam valiosos na percepção da
básicas. Assim, fonemas ou sílabas podem formar as fala humana. A evidência de que o espectrograma é
unidades perceptivas na percepção da fala. valioso foi fornecida usando um padrão
O terceiro estágio da percepção da fala (identificação
de palavras) é de particular importância. Alguns dos
principais problemas na identificação de palavras são
discutidos brevemente. No entanto, vamos mencionar um TERMOS CHAVE
problema aqui. A maioria das pessoas conhece dezenas
de milhares de palavras, mas essas palavras (pelo menos fonemas: sons básicos da fala que transmitem
em inglês) são construídas com apenas cerca de 35
fonemas. A consequência óbvia é que a grande maioria significado. espectrógrafo: instrumento utilizado
para produzir registros visíveis das frequências
das palavras faladas se assemelha a muitas outras
sonoras da fala. formantes: picos nas
palavras no nível fonêmico e, portanto, é difícil para os frequências dos sons da fala; revelada por um espectrógrafo.
ouvintes distinguir.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 355

Figura 9.9 Espectrograma da frase “Joe tirou a sapateira do pai”. De Language Processes por Vivian
C. Tartter (1986, p. 210). Reproduzido com permissão do autor.

reprodução ou vocoder, que permite que o espectrograma começa. As maneiras pelas quais os ouvintes lidam
seja reproduzido (ou seja, reconvertido em fala). Liberman, com o problema de segmentação são discutidas
Delattre e Cooper (1952) construíram vogais “artificiais” em breve.
no espectrograma com base apenas nas duas primeiras (3) Na fala normal, há co-articulação, que é “a
formas de cada vogal. Essas vogais foram facilmente sobreposição de articulações adjacentes” (Ladefoged,
identificadas quando tocadas pelo vocoder, sugerindo 2001, p. 272).
que a informação do formante é usada para reconhecer Mais especificamente, a forma como um fonema é
as vogais. produzido depende dos fonemas que o precedem
e que o seguem. A existência de coarticulação
significa que a pronúncia de qualquer fonema não
é invariante, o que pode criar problemas para o
Problemas enfrentados pelos ouvintes ouvinte. No entanto, a co-articulação significa que
Os ouvintes são confrontados com vários problemas ao os ouvintes que ouvem um fonema recebem
compreender a fala: algumas informações sobre os fonemas
circundantes. Por exemplo, “Os fonemas /b/ em
(1) A linguagem é falada em cerca de dez fonemas (sons 'bill', 'bull' e 'bell' são ligeiramente diferentes
básicos da fala) por segundo e, portanto, requer acusticamente,
processamento rápido. Surpreendentemente,
podemos entender a fala acelerada artificialmente
até 50-60 sons ou fonemas por segundo (Werker
& Tees, 1992). TERMOS CHAVE
(2) Existe o problema da segmentação, que é a
dificuldade de separar ou distinguir as palavras problema de segmentação: o problema do
do padrão dos sons da fala. Esse problema surge ouvinte de dividir os sons quase contínuos
porque a fala geralmente consiste em um padrão da fala em fonemas e palavras separados.
de som em constante mudança com poucos co-articulação: a constatação de que a
produção de um fonema é influenciada pela
períodos de silêncio. Isso pode tornar difícil saber
produção do som anterior e preparações
quando uma palavra termina e a próxima palavra
para o próximo som; fornece uma pista útil para os ouvintes.
Machine Translated by Google

356 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

e conte-nos sobre o que está por vir”


(Harley, 2008, p. 259).
(4) Existem diferenças individuais significativas de um
falante para outro. Por exemplo, os falantes
variam consideravelmente em seu ritmo de fala.
Sussman, Hoemeke e Ahmed (1993) pediram a
vários falantes que dissessem as mesmas
palavras curtas começando com uma consoante.
Houve diferenças claras entre os palestrantes em
seus espectrogramas. Wong, Nusbaum e Small
(2004) estudaram a ativação cerebral quando os
Os ouvintes muitas vezes têm de lidar com uma fala
ouvintes foram expostos a vários alto-falantes ou
degradada; por exemplo: interferência de uma linha
a apenas um. Quando expostos a vários falantes telefônica quebrada; ruído da rua; ou outras pessoas
em momentos diferentes, os ouvintes tiveram próximas falando ao mesmo tempo. Como lidamos
aumento do processamento atencional nas com esses problemas?
principais áreas da fala (por exemplo, córtex
temporal superior posterior) e em áreas
associadas a desvios de atenção (por exemplo, uma demonstração marcante. Eles prepararam uma
córtex parietal superior). Assim, os ouvintes fita de vídeo de alguém dizendo “ba” repetidamente.
respondem ao desafio de ouvir várias vozes O canal de som então mudou para que houvesse uma
diferentes usando processos atencionais ativos e voz dizendo “ga” repetidamente em sincronia com
outros. movimentos labiais ainda indicando “ba”.
(5) Mattys e Liss (2008) apontaram que os ouvintes na Os ouvintes relataram ouvir “da”, uma mistura das
vida cotidiana têm que lidar com a fala degradada. informações visuais e auditivas. Green, Kuhl, Meltzoff
Por exemplo, muitas vezes há outras pessoas e Stevens (1991) mostraram que o chamado efeito
falando ao mesmo tempo e/ou há sons que McGurk é surpreendentemente robusto – eles o
distraem (por exemplo, barulho de tráfego ou encontraram mesmo com um rosto feminino e uma voz
aeronaves). É preocupante que os ouvintes no masculina.
laboratório raramente se deparem com esses É geralmente assumido que o efeito McGurk
problemas na pesquisa sobre a percepção da depende principalmente de processos de baixo para
fala. Isso levou Mattys e Liss (p. 1235) a cima desencadeados diretamente pelos sinais visuais
argumentar que “os fenômenos gerados em e auditivos discrepantes. Nesse caso, o efeito McGurk
laboratório refletem o que o sistema de percepção não deve ser influenciado por processos de cima para
da fala pode fazer com entradas altamente baixo com base nas expectativas dos ouvintes. No
restritas”. entanto, as expectativas são importantes. Mais ouvintes
produziram o efeito McGurk quando a palavra crucial
Identificamos vários problemas que os ouvintes (baseada na mistura das pistas visuais e auditivas
enfrentam ao tentar entender a linguagem falada. discrepantes) foi apresentada em uma sentença
Abaixo, consideramos algumas das principais maneiras semanticamente congruente do que em uma sentença
pelas quais os ouvintes lidam com esses problemas. semanticamente incongruente (Windmann, 2004).
Assim, os processos descendentes desempenham um papel importante.

Leitura labial: efeito McGurk Os ouvintes


Abordando o problema de segmentação Os
(mesmo aqueles com audição normal) costumam fazer
uso extensivo da leitura labial para fornecer informações ouvintes
adicionais. precisam dividir a fala que ouvem em suas palavras
McGurk e MacDonald (1976) forneceram constituintes (ou seja, segmentação)
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 357

Base para segmentação condições


interpretativas

Contexto sentencial
(pragmática, sintaxe,
LEXICAL semântica) NÍVEL 1
Ótimo
Lexical

conhecimento lexical

Figura 9.10 Uma abordagem


hierárquica para
Fonotática
NÍVEL 2 Informações segmentação de fala
Fonética acústica envolvendo três níveis ou
Segmento lexicais pobres
(coarticulação, alofonia)
camadas. A importância
SUBLEXICO
relativa dos diferentes tipos
NÍVEL 3
de sugestão é indicada
Informação pela largura do triângulo roxo. De Mattys et al.
Estresse de palavras prosódia segmentar ruim
(2005). Copyright © 2005
métrica
American Psychological
Association.

e decidir quais palavras estão sendo apresentadas. (Cutler & Butterfield, 1992). Por exemplo, “conduzir
Tem havido controvérsia sobre se a segmentação precede subidas colina” era muitas vezes mal interpretado como
e auxilia o reconhecimento de palavras ou se é o produto algo sem sentido, “Um pato desce uma pílula”.
do reconhecimento de palavras. Voltaremos a essa Em quarto lugar, a extensão da co-articulação
controvérsia em breve. Antes de fazer isso, vamos fornece uma pista útil para os limites das palavras. Como
considerar várias pistas não lexicais usadas pelos ouvintes mencionado acima, a co-articulação pode ajudar o ouvinte
para facilitar a segmentação. Primeiro, certas sequências a antecipar o tipo de fonema que ocorrerá a seguir. Talvez
de sons da fala (por exemplo, <m,r> em inglês) nunca mais importante, geralmente há mais co-articulação dentro
são encontradas juntas dentro de uma sílaba, e tais das palavras do que entre elas (Byrd & Saltzman, 1998).
sequências sugerem um provável limite entre as palavras
(Dumay, Frauenfelder, & Content, 2002). Mattys, White e Melhorn (2005) argumentaram
persuasivamente que precisamos ir além da simples
Em segundo lugar, Norris, McQueen, Cutler e descrição dos efeitos de pistas individuais na segmentação
Butterfield (1997) argumentaram que a segmentação é de palavras. Ele apresentou uma abordagem hierárquica,
influenciada pelas restrições de palavras possíveis (por segundo a qual existem três categorias principais de
exemplo, um trecho de fala sem vogal não é uma palavra dicas: lexical (por exemplo, sintaxe, conhecimento de
possível). Por exemplo, os ouvintes acharam difícil palavras); segmentar (por exemplo, coarticulação); e
identificar a palavra “apple” em “fapple” porque o /f/ não prosódia métrica (por exemplo, ênfase na palavra) (ver
poderia ser uma palavra em inglês. Em contraste, os Figura 9.10). Preferimos usar dicas lexicais (Nível 1)
ouvintes acharam relativamente fácil detectar a palavra quando todas as dicas estão disponíveis. Quando a
“apple” em “vuffapple”, porque “vuff” poderia ser uma informação lexical está ausente ou empobrecida, fazemos
palavra em inglês. uso de pistas segmentais como coarticulação e alofonia
(um fonema pode estar associado
Em terceiro lugar, há o estresse. Em inglês, a sílaba
inicial da maioria das palavras de conteúdo (por exemplo,
TERMO-CHAVE
substantivos, verbos) é tipicamente tônica. Quando os
ouvintes ouviam sequências de palavras sem a tônica na
alofonia: um alofone é um dos dois ou mais sons
primeira sílaba (por exemplo, “conduzir subidas para
semelhantes pertencentes ao mesmo fonema.
cima”) apresentadas fracamente, eles geralmente as ouviam mal.
Machine Translated by Google

358 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

com dois ou mais sons ou alofones semelhantes) eram idênticos do que quando não eram (Pisoni &
(Nível 2). Por exemplo, Harley (2008) dá este exemplo: Tash, 1974).
o fonema /p/ pode ser pronunciado de forma diferente Raizada e Poldrack (2007) apresentaram aos
como em “pit” e “spit”. Finalmente, se for difícil usar ouvintes estímulos auditivos que vão desde o fonema /
pistas de Nível 1 ou Nível 2, recorremos a pistas de ba/ até o fonema /da/. Dois estímulos semelhantes
prosódia métrica (por exemplo, estresse) foram apresentados ao mesmo tempo e os
(Nível 3). participantes decidiram se representavam o mesmo
Por que geralmente preferimos não usar dicas de fonema.
estresse? Como Mattys et al. (2005) apontou, a Os ouvintes foram mais sensíveis às diferenças entre
informação de ênfase é enganosa para palavras nas os estímulos quando ultrapassaram o limite da
quais a sílaba inicial não é tônica (cf., Cutler & Butterfi categoria entre /ba/ e /da/. A principal descoberta foi
eld, 1992). que as diferenças na ativação cerebral dos dois
Há suporte razoável para a abordagem hierárquica estímulos apresentados foram fortemente amplificadas
acima. Mattys (2004) descobriu que a co-articulação quando estavam em lados opostos do limite da
(Nível 2) era mais útil do que o estresse (Nível 3) para categoria. Esse efeito de amplificação sugere que as
identificar limites de palavras quando o sinal de fala categorias são importantes na percepção da fala.
estava foneticamente intacto.
No entanto, quando o sinal de fala estava empobrecido
de modo que era difícil usar pistas de Nível 1 ou Nível
Efeitos de contexto: identificação
2, o estresse era mais útil do que a coarticulação.
Mattys et ai. (2005) descobriram que pistas lexicais de som O
(isto é, contexto de palavra versus contexto de não- reconhecimento de palavras faladas envolve uma
palavra) eram mais úteis do que o estresse para mistura de processos ascendentes ou orientados por
dados acionados pelo sinal acústico e processos
facilitar a segmentação de palavras em uma condição sem ruído.
No entanto, o estresse foi mais útil do que as pistas descendentes ou orientados conceitualmente gerados
lexicais no ruído. a partir do contexto linguístico. Descobrir que a
identificação de um som ou de uma palavra é
influenciada pelo contexto em que é apresentada
Percepção categórica A percepção fornece evidências de efeitos de cima para baixo. No
da fala difere de outros tipos de percepção auditiva. entanto, tem havido muita controvérsia sobre a
Por exemplo, há uma vantagem definida do hemisfério interpretação da maioria dos efeitos de contexto.
esquerdo para a percepção da fala, mas não para Vamos considerar os efeitos de contexto na
outros estímulos auditivos. Há percepção categórica identificação de sons nesta seção, adiando a discussão
dos fonemas: estímulos de fala intermediários entre dos efeitos de contexto na identificação de palavras
dois fonemas são tipicamente categorizados como um para mais tarde. Começamos considerando o contexto
fonema ou outro, e há uma fronteira abrupta entre as na forma de um som adjacente e, em seguida,
categorias de fonemas. Por exemplo, o idioma japonês passamos a discutir o contexto sentencial (isto é, a
não faz distinção entre /l/ e /r/. Esses sons pertencem sentença dentro da qual um som é apresentado).
à mesma categoria para os ouvintes japoneses e, Veremos que os processos subjacentes a diferentes
portanto, eles acham muito difícil discriminá-los tipos de efeito de contexto provavelmente diferem.
(Massaro, 1994).

TERMO-CHAVE
A existência de percepção categórica não significa
que não possamos distinguir entre sons ligeiramente
percepção categórica: perceber os estímulos como
diferentes atribuídos à mesma categoria de fonemas.
pertencentes a categorias específicas; encontrados
Os ouvintes decidiram mais rápido que duas sílabas com fonemas.
eram iguais quando os sons
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 359

Mudança de identificação lexical a percepção foi aparentemente relatada por Warren e


Vimos que os ouvintes apresentam percepção categórica, Warren (1970). Eles estudaram o efeito de restauração
com estímulos de fala intermediários entre dois fonemas fonêmica. Os ouvintes ouviram uma frase em que uma
sendo categorizados como um fonema ou outro. Ganong pequena parte foi removida e substituída por um som
(1980) questionou se a percepção categórica dos sem sentido. As frases usadas foram as seguintes (o
fonemas seria influenciada pelo contexto. asterisco indica uma parte deletada da frase):

Assim, ele apresentou aos ouvintes vários sons variando


entre uma palavra (por exemplo, traço) e uma não-palavra • Verificou-se que a *enguia estava no
(por exemplo, tash). Houve um efeito de contexto – um eixo.
fonema inicial ambíguo era mais provável de ser atribuído • Verificou-se que a *enguia estava no
a uma determinada categoria de fonema quando produzia sapato.

uma palavra do que quando não o fazia (a mudança de • Verificou-se que a *enguia estava no
identificação lexical) . mesa.
Há pelo menos duas razões possíveis pelas quais o • Verificou-se que a *enguia estava no
contexto pode influenciar a percepção categórica. laranja.
Primeiro, o contexto pode ter uma influência direta nos
processos perceptivos. Em segundo lugar, o contexto A percepção do elemento crucial na frase (por
pode influenciar a decisão ou outros processos que exemplo, *enguia) foi influenciada pelo contexto da frase.
ocorrem depois que os processos perceptivos são Os participantes que ouviram a primeira frase ouviram
concluídos, mas antes que uma resposta seja dada. “roda”, os que ouviram a segunda frase ouviram
Tais processos podem ser influenciados pelo fornecimento “calcanhar” e os expostos à terceira e quarta frases
de recompensas para respostas corretas e penalidades ouviram “refeição” e “casca”, respectivamente. O estímulo
para respostas incorretas. Pitt (1995) descobriu que auditivo crucial (ou seja, “*enguia”) era sempre o mesmo,
recompensas e penalidades não tiveram efeito sobre a então tudo o que diferia era a informação contextual.
mudança de identificação lexical, sugerindo que ela
depende de processos perceptivos e não daqueles que
ocorrem posteriormente. O que causa o efeito de restauração fonêmica?
Connine (1990) descobriu que a identificação de Segundo Samuel (1997), existem duas possibilidades
um fonema ambíguo é infl uenciada pelo significado da principais:
frase em que é apresentado (isto é, pelo contexto
sentencial). No entanto, a forma como isso aconteceu (1) Há um efeito direto no processamento da fala (ou
difere da mudança de identificação lexical observada por seja, o fonema ausente é processado quase como
Ganong (1980). O contexto sentencial não infl uenciou a se estivesse presente).
identificação do fonema durante a percepção inicial da (2) Há um efeito indireto com os ouvintes adivinhando a
fala, mas afetou os processos ocorridos após a percepção. identidade do fonema ausente após o
processamento básico da fala.

Em suma, a mudança de identificação lexical padrão


depende de processos perceptivos relativamente
precoces. Em contraste, os efeitos do contexto da TERMOS CHAVE
sentença na identificação de fonemas ambíguos envolvem
mudança de identificação lexical: a descoberta
processos posteriores após a percepção.
de que um fonema ambíguo tende a ser percebido
de modo a formar uma palavra em vez de
uma não-palavra. efeito de restauração
Efeito de restauração fonêmica
fonêmica: uma ilusão na qual o ouvinte
Evidência de que o processamento de cima para baixo “percebe” que um fonema foi apagado de uma frase falada.
com base no contexto da frase pode estar envolvido na fala
Machine Translated by Google

360 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

As descobertas parecem um tanto inconsistentes. Iniciamos com um breve relato da teoria motora da
Samuel (por exemplo, 1981, 1987) acrescentou ruído percepção da fala originalmente proposta há mais de
ao fonema crucial ou substituiu o fonema ausente por 40 anos. No entanto, nosso foco principal será nos
ruído. Se os ouvintes processassem o fonema ausente modelos de coorte e TRACE, ambos os quais têm
como de costume, eles teriam ouvido o fonema crucial sido muito infl uentes nos últimos anos. O modelo de
mais o ruído em ambas as condições. coorte original (Marslen Wilson & Tyler, 1980)
Como resultado, eles seriam incapazes de dizer a enfatizou as interações entre os processos de baixo
diferença entre as duas condições. Na verdade, os para cima e de cima para baixo no reconhecimento de
ouvintes puderam distinguir prontamente entre as palavras faladas. No entanto, Marslen Wilson (por
condições, sugerindo que o contexto da sentença exemplo, 1990) posteriormente revisou seu modelo de
afeta o processamento que ocorre após a percepção. coorte para aumentar a ênfase nos processos de
Samuel (1997) usou um paradigma diferente em baixo para cima conduzidos pelo estímulo auditivo.
que não havia contexto sentencial. Alguns ouvintes Em contraste, o modelo TRACE argumenta que o
ouviram repetidamente palavras como “acadêmico”, reconhecimento de palavras envolve processos
“confidencial” e “psicodélico”, todas com /d/ como interativos de cima para baixo e de baixo para cima.
terceira sílaba. As múltiplas apresentações dessas Assim, uma diferença crucial é que os processos
palavras reduzem a probabilidade de categorizar os descendentes (por exemplo, efeitos baseados em
sons subseqüentes como /d/ devido a um efeito de contexto) desempenham um papel maior no modelo TRACE do que no m
adaptação. Em outra condição, os ouvintes foram
inicialmente expostos às mesmas palavras com o
fonema-chave substituído por ruído (por exemplo, Teoria motora
aca*êmico; confi*encalhado; psico*élico). Em outra Liberman, Cooper, Shankweiler e Studdert Kennedy
condição, o fonema /d/ foi substituído pelo silêncio. (1967) argumentaram que uma questão-chave na
Os ouvintes poderiam ter adivinhado o fonema ausente percepção da fala é explicar como os ouvintes
em ambas as condições. No entanto, os processos percebem as palavras com precisão, mesmo que o
perceptivos só poderiam ter sido usados para identificar sinal de fala forneça informações variáveis. Em sua
o fonema ausente na condição de ruído. teoria motora da percepção da fala, eles propuseram
que os ouvintes imitassem os movimentos articulatórios
O que Samuel (1997) encontrou? Houve um do falante. O sinal motor assim produzido forneceu
efeito de adaptação na condição de ruído, mas não informações muito menos variáveis e inconsistentes
na condição de silêncio. Essas descobertas parecem sobre o que o falante está dizendo do que o próprio
descartar a hipótese de explicação. Eles sugerem que sinal de fala. Assim, nosso recrutamento do sistema
houve um efeito direto da ativação lexical ou de motor facilita a percepção da fala.
palavras nos processos perceptivos na condição de
ruído, levando a um efeito de adaptação.
Em suma, é provável que os processos Evidências
subjacentes ao efeito de restauração fonêmica variem Achados consistentes com a teoria motora foram
dependendo das condições experimentais precisas. relatados por Dorman, Raphael e Liberman (1979).
Mais especificamente, há evidências de efeitos diretos Foi gravada uma fita com a frase “Please say shop” e
(Samuel, 1997) e indiretos (Samuel, 1981, 1987). um período de silêncio de 50 ms foi inserido entre
“say” e “shop”.
Como resultado, a frase foi mal interpretada como
"Por favor, diga chop". Nossa musculatura da fala nos
TEORIAS DA FALA obriga a fazer uma pausa entre “dizer” e “cortar”, mas
RECONHECIMENTO DE PALAVRAS não entre “dizer” e “comprar”. Assim, as evidências da
articulação interna favoreceriam a interpretação
Existem várias teorias de reconhecimento de palavras equivocada da última palavra da frase.
faladas, três das quais são discutidas aqui.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 361

Fadiga, Craighero, Buccino e Rizzolatti (2002) usar informações auditivas para imitar os movimentos
aplicaram a estimulação magnética transcraniana (EMT; articulatórios do falante. De modo mais geral, a teoria não
consulte o Glossário) na parte do córtex motor que controla tenta fornecer uma descrição abrangente da percepção
os movimentos da língua enquanto os participantes da fala.
italianos ouviam palavras em italiano. Em segundo lugar, muitos indivíduos com produção
Algumas das palavras (por exemplo, “terra”) exigiam de fala muito prejudicada, no entanto, têm percepção de
movimentos fortes da língua quando pronunciadas, fala razoável. Por exemplo, alguns pacientes com afasia
enquanto outras (por exemplo, “baffo”) não. A principal de Broca (ver Glossário) apresentam destruição efetiva do
descoberta foi que houve maior ativação dos músculos da sistema motor da fala, mas sua capacidade de perceber a
língua dos ouvintes quando eles foram apresentados a fala está essencialmente intacta (Harley, 2008). Além
palavras como “terra” do que a palavras como “baffo”. disso, alguns indivíduos mudos podem perceber palavras
faladas normalmente (Lenneberg, 1962). No entanto, a
Wilson, Saygin, Sereno e Iacoboni (2004) fizeram teoria motora poderia explicar essas descobertas
seus participantes dizerem em voz alta uma série de assumindo que os movimentos motores envolvidos na
sílabas e também ouvirem as sílabas. Conforme previsto percepção da fala são bastante abstratos e não requerem
pela teoria motora, a área motora ativada quando os o uso direto da musculatura da fala (Harley, 2008).
participantes falavam também era ativada quando eles
ouviam. Essa área ativada estava bem distante das áreas
clássicas de linguagem do lobo frontal. Em terceiro lugar, segue-se da teoria que bebês com
experiência extremamente limitada na articulação da fala
Os estudos discutidos até agora não mostram que a devem ser muito fracos na percepção da fala. Na verdade,
atividade nas áreas motoras esteja ligada causalmente à no entanto, bebês de 6 a 8 meses de idade têm um
percepção da fala. Essa questão foi abordada por Meister, desempenho razoavelmente bom em tarefas de detecção
Wilson, Deblieck, Wu e Iacobini (2007). Eles aplicaram de sílabas (Polka, Rvachew e Molnar, 2008).
estimulação magnética transcraniana repetitiva (rTMS) ao
córtex pré-motor esquerdo enquanto os participantes
realizavam uma tarefa de discriminação fonética ou de
discriminação de tom. Apenas a primeira tarefa requer Modelo de coorte O
processos de linguagem. O TMS afetou adversamente o modelo de coorte foi originalmente apresentado por
desempenho apenas na tarefa de discriminação fonética, Marslen-Wilson e Tyler (1980) e foi revisado várias vezes
que envolvia a discriminação de consoantes oclusivas no desde então. Consideraremos algumas das principais
ruído. Esses achados fornecem evidências razoáveis de revisões posteriormente, mas por enquanto nos
que a percepção da fala é facilitada pelo recrutamento do concentramos nas suposições da versão original:
sistema motor.

Avaliação Tem • No início da apresentação auditiva de uma palavra,


havido um acúmulo de evidências que apoiam a teoria palavras em conformidade com a sequência de sons
motora da percepção da fala nos últimos anos (ver ouvidos até então tornam-se ativas; esse conjunto de
revisões de Galantucci, Fowler e Turvey, 2006 e Iacoboni, palavras é a “coorte inicial da palavra”.
2008). • As palavras pertencentes a esta coorte são então
A percepção da fala é frequentemente associada à eliminadas se deixarem de corresponder a mais
ativação da área motora e os processos motores podem informações da palavra apresentada ou porque são
facilitar a percepção da fala. No entanto, devemos ter inconsistentes com a semântica ou outro contexto. Por
cuidado para não exagerar a importância dos processos exemplo, as palavras “crocodilo” e “louça” podem
motores na percepção da fala. pertencer a uma coorte de palavras iniciais, sendo a
Quais são as limitações da teoria motora? última palavra excluída quando o som /d/ é ouvido.
Primeiro, os processos subjacentes não são especificados.
Por exemplo, não está muito claro como os ouvintes
Machine Translated by Google

362 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

• O processamento da palavra apresentada continua o resto da frase são usados ao mesmo tempo. Como
até que as informações contextuais e as previsto, a análise sensorial completa não foi
informações da própria palavra sejam suficientes necessária com informações contextuais adequadas
para eliminar todas as palavras, exceto uma, na (ver Figura 9.11). Só era necessário ouvir a palavra
coorte de palavras iniciais. O ponto de unicidade inteira quando o contexto da frase não continha
é o ponto em que a parte inicial de uma palavra é nenhuma informação sintática ou semântica útil (ou
consistente com apenas uma palavra. seja, condição aleatória).
No entanto, as palavras muitas vezes podem ser
reconhecidas antes disso por causa da informação Evidências de que o ponto de unicidade é
contextual. • importante na percepção da fala foram relatadas por
Várias fontes de informação (por exemplo, lexicais, Marslen-Wilson (1984). Os ouvintes foram
sintáticas, semânticas) são processadas em paralelo. apresentados a palavras e não-palavras e decidiram
Essas fontes de informação interagem e se em uma tarefa de decisão lexical se uma palavra
combinam para produzir uma análise eficiente da havia sido apresentada. A principal descoberta
linguagem falada. relacionada a não-palavras. Quanto mais tarde a
posição do fonema na qual a sequência de sons se
Marslen-Wilson e Tyler testaram suas noções teóricas desviava de todas as palavras em inglês, mais tempo
em uma tarefa de monitoramento de palavras em que os ouvintes levavam para tomar decisões de não-palavras.
os ouvintes identificaram palavras-alvo pré- O'Rourke e Holcomb (2002) também abordaram
especificadas apresentadas em frases faladas. Havia a hipótese de que uma palavra falada é identificada
sentenças normais, sentenças sintáticas quando o ponto de unicidade é atingido (ou seja, o
(gramaticalmente corretas, mas sem sentido) e ponto em que apenas uma palavra é consistente com
sentenças aleatórias (palavras não relacionadas). O o sinal acústico). Os ouvintes ouviam palavras faladas
alvo era um membro de uma determinada categoria, e pseudopalavras e decidiam o mais rápido possível
uma palavra que rima com uma determinada palavra se cada estímulo era uma palavra. Algumas palavras
ou uma palavra idêntica a uma determinada palavra. tiveram um ponto de unicidade precoce (média de
A variável dependente foi a velocidade com que o alvo foi detectado.
427 ms após o início da palavra), enquanto outras
De acordo com a versão original do modelo de tiveram um ponto de unicidade tardio (média de 533
coorte, informações sensoriais da palavra-alvo e ms após o início da palavra).
informações contextuais de O N400 (uma onda negativa avaliada por

600 Frase aleatória

550 frase sintática

500

450 Frase normal

400
Latências
detecção
médias
alvo
de

350

300

250

200
Figura 9.11 Tempos de
detecção para alvos de
Idêntico Rima Categoria
palavras apresentados em sentenças.
Adaptado de Marslen Tipo de destino
Wilson e Tyler (1980).
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 363

ERPs; ver Glossário) foi usado como uma medida da ouvir “focabulaire” ativou a palavra “vocab ulaire”). No
velocidade do processamento de texto. entanto, os ouvintes levaram algum tempo para superar os
O'Rourke e Holcomb (2002) descobriram que o N400 efeitos da incompatibilidade no fonema inicial. Allopenna,
ocorreu cerca de 100 ms antes para palavras com um ponto Magnuson e Tanenhaus (1998) descobriram que o fonema
de unicidade inicial do que para aquelas com um ponto de inicial de uma palavra falada ativava outras palavras que
unicidade tardio. Isso é importante porque sugere que o compartilhavam aquele fonema (por exemplo, os sons iniciais
ponto de unicidade pode ser significativo. A descoberta de “béquer” causavam a ativação de “besouro”).
adicional de que o N400 ocorreu tipicamente logo após o
ponto de unicidade ter sido alcançado apóia a suposição da Um pouco mais tarde, houve uma tendência mais fraca para
teoria de coorte de que o processamento de palavras faladas os ouvintes ativarem palavras que rimam com a entrada
é altamente eficiente. auditiva (por exemplo, “copo” ativou “alto-falante”). O ponto-
chave desses estudos é que algumas palavras que não
Radeau, Morais, Mousty e Bertelson (2000) lançaram compartilham um fonema inicial com a entrada auditiva não
algumas dúvidas sobre a importância geral do ponto de foram totalmente excluídas da coorte conforme previsto pelo
unicidade. Os ouvintes foram apresentados a substantivos modelo de coorte original.
franceses com pontos de unicidade iniciais ou tardias. O
ponto de unicidade infl uenciou o desempenho quando os
substantivos foram apresentados em ritmo lento (2,2 sílabas/ Modelo revisado
segundo) ou médio (3,6 sílabas/segundo), mas não quando Marslen-Wilson (1990, 1994) revisou o modelo de coorte. Na
apresentados em ritmo rápido (5,6 sílabas/segundo). Isso é versão original, as palavras estavam dentro ou fora da
um tanto preocupante, visto que o ritmo rápido está próximo palavra coorte. Na versão revisada, as palavras candidatas
do ritmo típico de conversação da fala! variam em seu nível de ativação e, portanto, a pertença à
coorte de palavras é uma questão de grau. Marslen Wilson
(1990) assumiu que a coorte de palavras iniciais pode conter
Há uma ênfase considerável no modelo de coorte na palavras com fonemas iniciais semelhantes, em vez de ser
noção de competição entre palavras candidatas quando um limitada apenas a palavras com o fonema inicial da palavra
ouvinte ouve uma palavra. apresentada.
Weber e Cutler (2004) descobriram que tal competição pode
incluir mais palavras do que se pode imaginar. Estudantes
holandeses com um bom domínio da língua inglesa Há uma segunda grande diferença entre as versões
identificaram imagens-alvo correspondentes a uma palavra original e revisada da teoria de coorte.
falada em inglês. Embora a tarefa fosse em inglês, os alunos Na versão original, o contexto influenciou o reconhecimento
holandeses ativaram algumas palavras holandesas – eles de palavras no início do processamento. Na versão revisada,
fixaram imagens distrativas com nomes holandeses que se os efeitos do contexto no reconhecimento de palavras
assemelhavam fonemicamente ao nome inglês da imagem ocorrem apenas em um estágio bastante tardio do processamento.
alvo. No geral, as descobertas de Weber e Cutler revelaram Mais especificamente, o contexto influencia apenas o estágio
que a competição lexical era maior na audição não nativa do de integração no qual uma palavra selecionada é integrada
que na nativa. na representação evolutiva da sentença. Assim, o modelo de
coorte revisado coloca mais ênfase no processamento de
Significado indevido foi dado à parte inicial da palavra baixo para cima do que a versão original. No entanto, outras
no modelo de coorte original. versões do modelo (por exemplo, Gaskell & Marslen-Wilson,
Assumiu-se que uma palavra falada geralmente não será 2002) são menos explícitas sobre o envolvimento tardio do
reconhecida se seu fonema inicial for pouco claro ou contexto no reconhecimento de palavras.
ambíguo. Evidências contra essa suposição foram relatadas.
Frauen felder, Scholten e Content (2001) descobriram que
os ouvintes de língua francesa ativavam palavras mesmo Evidência
quando o fonema inicial das palavras faladas era distorcido A suposição de que a associação da palavra coorte é
(por exemplo, graduada em vez de tudo ou nada é
Machine Translated by Google

364 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

claramente superior à suposição anterior de que a Eles apresentaram frases que terminavam com palavras
adesão é tudo ou nada. Algumas pesquisas que causam incompletas (por exemplo, "Para iluminar o escuro, ela
problemas para a versão original do modelo (por precisava dela pode ___". Imediatamente depois, os
exemplo, Allopenna et al., 1998; Frauen felder et al., ouvintes viram uma palavra visual correspondente à
2001) são muito mais consistentes com a suposição palavra incompleta em forma e significado (por exemplo,
revisada. "vela"), em significado apenas (por exemplo, "lanterna"),
Alguns dos suportes mais fortes para a suposição apenas na forma (por exemplo, "doce"), ou em nenhum
de que o contexto influencia apenas os estágios dos dois ("número"). Potenciais relacionados a eventos
posteriores do reconhecimento de palavras foram (ERPs; consulte o Glossário) foram registrados para
relatados por Zwitserlood (1989). Os ouvintes realizaram avaliar os estágios iniciais do processamento de texto .
uma tarefa de decisão lexical (decidindo se sequências Houve evidência de uma coorte baseada em forma
de letras apresentadas visualmente eram palavras) 250 ms após a apresentação da palavra visual, e de
imediatamente após ouvir parte de uma palavra falada. uma coorte baseada em significado 220 ms após a
Por exemplo, quando apenas “cap___” foi apresentado, apresentação. A existência de uma coorte baseada em
ele foi consistente com várias palavras possíveis (por forma significa que "doce" foi ativado mesmo que o
exemplo, “capitão”, “capital”). O desempenho na tarefa contexto indicaram fortemente que não era a palavra
de decisão lexical foi mais rápido quando a palavra correta.Assim, o contexto não restringiu as palavras
nessa tarefa estava relacionada em significado a inicialmente processadas como previsto pelo modelo de
qualquer uma das palavras possíveis (por exemplo, coorte revisado.
“navio” para “capitão” e “dinheiro” para “capital”). De Apesar dos achados acima, o contexto da frase
maior importância foi o que aconteceu quando a palavra pode influenciar o processamento de palavras faladas
parcial foi precedida por um contexto tendencioso (por algum tempo antes que o ponto de unicidade de uma
exemplo, “Com o espírito abatido, os homens ficaram palavra seja alcançado. Van Petten, Coulson, Rubin,
em volta do túmulo. Eles lamentaram a perda de seu Plante e Parks (1999) apresentaram aos ouvintes uma
capitão”. Tal contexto não impediu a ativação de estrutura de frase falada (por exemplo, “Sir Lancelot
palavras concorrentes (por exemplo, “capital”). poupou a vida do homem quando ele implorou por
_____”), seguido após 500 ms por uma palavra final
Até agora discutimos os achados de Zwitserlood congruente ( por exemplo, “misericórdia”) ou
(1989) quando apenas parte da palavra falada foi incongruente (por exemplo, “sereia”) com o quadro da
apresentada. O que aconteceu quando uma quantidade frase. Van Petten e outros. utilizaram ERPs para avaliar o processamento
suficiente da palavra foi apresentada para que os Houve diferenças significativas no N400 (uma onda
ouvintes pudessem adivinhar sua identidade corretamente? negativa que ocorre cerca de 400 ms após a
De acordo com o modelo de coorte revisado, devemos apresentação do estímulo) para as palavras
encontrar efeitos de contexto neste estágio avançado contextualmente congruentes e incongruentes 200 ms
do processamento de texto. Isso é precisamente o que antes do ponto de unicidade ser atingido. Assim, um
Zwitserlood descobriu. contexto muito forte influenciou o processamento da
Friedrich e Kotz (2007) realizaram um estudo palavra falada mais cedo do que o esperado no modelo
semelhante ao de Zwitserlood (1989). de coorte revisado.

Efeitos imediatos do contexto no processamento de palavras faladas Uma das


tentativas mais impressionantes de mostrar texturas. Depois disso, eles apresentaram o contexto visual
que pode ter um efeito muito rápido durante exibições compostas por quatro objetos, e a percepção da
fala dos participantes foi relatada por Magnuson, foram instruídos a clicar em um dos objetos Tanenhaus
e Aslin (2008). Inicialmente, eles ensinavam (identificados como “o (adjetivo)” ou como “o (substantivo)”).
participantes um léxico artificial composto por substantivos A variável dependente de interesse foi o olho
referente a formas e adjetivos referentes a fixações dos participantes.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 365

Em algumas tentativas, a exibição consistia em quatro 1,0

formas diferentes e, portanto, apenas um substantivo era


necessário para especificar exclusivamente o objeto alvo. 0,8

Em outras palavras, o contexto visual permitiu aos


Deslocamento
participantes prever que o alvo seria descrito com precisão 0,6
substantivo médio
Substantivo alvo
apenas por um substantivo. Em todas as tentativas, havia Proporção
fixação
de

uma palavra concorrente incorreta começando com o 0,4


mesmo som da palavra correta. este com
Substantivo concorrente
petitor era um substantivo ou um adjetivo. De acordo com 0,2

o modelo de coorte, esse competidor deveria ter sido


incluído na coorte inicial independentemente de ser um 0
0 400 800 1200 1600
substantivo ou um adjetivo.
Tempo desde o deslocamento do substantivo (ms)

Em contraste, se os ouvintes pudessem usar o contexto 1,0

muito rapidamente, eles só teriam incluído o concorrente


quando fosse um substantivo. 0,8

O competidor foi considerado até 800 ms após o início


Deslocamento
da palavra (200 ms após o deslocamento da palavra) 0,6 substantivo médio

quando era um substantivo (ver Figura 9.12). Proporção


fixação
de
Substantivo alvo

Dramaticamente, no entanto, o competidor foi eliminado 0,4

200 ms após o início da palavra (ou nunca foi considerado)


quando era um adjetivo. 0,2
Adjetivo concorrente
O que essas descobertas significam? Eles lançam
dúvidas consideráveis sobre a suposição de que os efeitos 0
0 400 800 1200 1600
de contexto ocorrem apenas depois que uma coorte inicial
Tempo desde o deslocamento do substantivo (ms)
de palavras possíveis foi estabelecida. Se o contexto
Figura 9.12 Proporções de fixação ocular para
permite que os ouvintes prevejam com precisão quais substantivos alvos e substantivos concorrentes (figura
palavras são relevantes e quais são irrelevantes, então os superior) e substantivos alvos e adjetivos
efeitos do contexto podem ocorrer mais concorrentes (figura inferior) ao longo do tempo após o início do substantivo.
rapidamente do que é assumido pelo modelo de coorte. O tempo após o início do substantivo em que o alvo
atraiu significativamente mais fixações do que o
De acordo com Magnuson et al. (2008), os efeitos atrasados
competidor ocorreu muito mais tarde com um
do contexto são encontrados quando o contexto
substantivo do que com um adjetivo. Com base nos
prevê apenas fracamente qual palavra provavelmente será dados de Magnuson et al. (2008).
apresentada.

Avaliação geral A abordagem quais palavras faladas são geralmente identificadas e a

teórica representada pelo modelo de coorte possui vários importância do ponto de unicidade indicam a importância do

pontos fortes. Primeiro, a suposição de que a percepção processamento sequencial.

precisa de uma palavra falada envolve o processamento e a Em terceiro lugar, a versão revisada do modelo tem duas

rejeição de várias palavras concorrentes é geralmente correta. vantagens sobre a versão original:

No entanto, as teorias anteriores normalmente prestavam (1) A suposição de que a participação na palavra coorte é
pouca ou nenhuma atenção à existência de efeitos de uma questão de grau, em vez de ser tudo ou nada,
concorrência substanciais. Em segundo lugar, existe a está mais de acordo com as evidências.
suposição de que o processamento das palavras faladas é
sequencial e muda consideravelmente durante sua (2) Há mais espaço para corrigir erros na versão revisada do
apresentação. A velocidade com modelo
Machine Translated by Google

366 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

porque as palavras são menos propensas a • Existem unidades ou nós de processamento


serem eliminadas da coorte em um estágio inicial. individuais em três níveis diferentes: características
(por exemplo, vocalização; modo de produção),
Quais são as limitações do modelo de coorte? fonemas e
Primeiro, há a questão controversa do envolvimento palavras. • Os nós de recursos são conectados aos
do contexto no reconhecimento auditivo de palavras. nós de fonemas e os nós de fonemas são
De acordo com a versão revisada do modelo de coorte, conectados aos
os fatores contextuais só exercem influência nós de palavras. • As conexões entre os níveis operam
tardiamente no processamento no estágio de em ambas as direções e são apenas
integração. Esta não é de forma alguma toda a história. facilitadoras. • Existem conexões entre unidades ou
Pode estar correto quando o contexto restringe apenas nós no mesmo nível; essas conexões são
moderadamente a identidade da palavra, mas o inibitórias. •
contexto fortemente restritivo parece ter um impacto Os nós influenciam uns aos outros na proporção de
muito mais cedo no processamento (por exemplo, seus níveis de ativação e da força de suas
Magnuson et al., 2008; Van Petten et al., 1999). No interconexões. • À medida
entanto, Gaskell e Marslen-Wilson (2002) enfatizaram que a excitação e a inibição se espalham entre os nós,
a noção de “integração contínua” e, portanto, podem desenvolve-se um padrão de ativação ou traço. •
acomodar a descoberta de que o contexto forte tem A palavra
efeitos iniciais. reconhecida ou identificada pelo ouvinte é determinada
Em segundo lugar, as modificações feitas na pelo nível de ativação das possíveis palavras
versão original do modelo o tornaram menos preciso e candidatas.
mais difícil de testar. Como Massaro (1994, p. 244)
apontou, “Essas modificações . . . tornam mais difícil O modelo TRACE assume que os processos
testar contra modelos alternativos.” bottom-up e top-down interagem ao longo da percepção
da fala. Em contraste, a maioria das versões do modelo
Em terceiro lugar, os processos supostamente de coorte assume que os processos de cima para
envolvidos no processamento da fala dependem baixo (por exemplo, efeitos baseados no contexto)
fortemente da identificação dos pontos de partida de ocorrem relativamente tarde na percepção da fala. A
palavras individuais. No entanto, não está claro dentro ativação de baixo para cima prossegue para cima do
da teoria como isso é feito. nível de recurso para o nível de fonema e para o nível
de palavra, enquanto a ativação de cima para baixo
procede na direção oposta do nível de palavra para o
Modelo TRACE nível de fonema e para o nível de recurso.
McClelland e Elman (1986) e McClelland (1991)
produziram um modelo de rede de percepção de fala Evidência
baseado em princípios conexionistas (ver Capítulo 1). Suponha que pedimos aos ouvintes para detectar
Seu modelo TRACE de percepção de fala se fonemas-alvo apresentados em palavras e não-palavras.
assemelha ao modelo de ativação interativa de De acordo com o modelo TRACE, o desempenho deve
reconhecimento visual de palavras apresentado por ser melhor na condição de palavra. Por que é que?
McClelland e Rumelhart (1981; discutido anteriormente Nessa condição, haveria uma ativação do nível da
neste capítulo). O modelo TRACE assume que os palavra seguindo para o nível do fonema, o que
processos bottom-up e top-down interagem de forma facilitaria a detecção do fonema. Mirman, McClelland,
flexível no reconhecimento de palavras faladas. Assim, Holt e Magnuson (2008) pediram aos ouvintes que
todas as fontes de informação são usadas ao mesmo detectassem um fonema alvo (/t/ ou /k/) em palavras e
tempo no reconhecimento de palavras faladas. não palavras. Palavras foram apresentadas em 80%
ou 20% das tentativas. O argumento era que a atenção
O modelo TRACE é baseado nos seguintes (e a ativação) no nível da palavra seria
pressupostos teóricos:
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 367

ativado enquanto outros fonemas são inibidos.


Palavras não-palavras
A simulação de computador de McClelland et al. baseada
Doença no modelo produziu com sucesso a percepção categórica
600 da fala.
Norris, McQueen e Cutler (2003) obtiveram
500
evidências convincentes de que a identificação do
400
fonema pode ser diretamente influenciada pelo
(ms)
TR

300 processamento de cima para baixo. Os ouvintes foram


200 inicialmente apresentados com palavras terminadas no fonema /f/ ou /s/.
Para diferentes grupos, um fonema ambíguo igualmente
100
semelhante a /f/ e /s/ substituiu o /f/ ou /s/ final nessas
0
/t/-alta /t/-baixa /k/-alta /k/-baixa
palavras. Em seguida, os ouvintes categorizaram os
Doença fonemas apresentados isoladamente como /f/ ou /s/. Os
ouvintes que ouviram os fonemas ambíguos no contexto
Figura 9.13 Tempos médios de reação (em ms) de palavras que terminam em /s/ favoreceram fortemente
para o reconhecimento dos fonemas /t/ e /k/ em
a categorização /s/. Em contraste, aqueles que ouviram
palavras e não-palavras quando as palavras foram
apresentadas em uma proporção alta (80%) ou
o mesmo fonema no contexto de palavras que terminam
baixa (20%) de tentativas. De Mirman et al. (2008). em /f/ preferiram a categorização em /f/. Assim, o
Reimpresso com permissão da Cognitive Science Society Inc. aprendizado de cima para baixo no nível da palavra
afetou a categorização de fonemas conforme previsto
maior quando a maioria dos estímulos auditivos eram pelo modelo TRACE.
palavras, e que isso aumentaria o efeito de superioridade De acordo com o modelo TRACE, as palavras de
da palavra. alta frequência (aquelas frequentemente encontradas)
O que Mirman et al. (2008) encontrar? Primeiro, o são processadas mais rapidamente do que as de baixa
efeito de superioridade de palavras previsto foi encontrado frequência, em parte porque têm níveis de ativação de
na maioria das condições (ver Figura 9.13). Em segundo repouso mais altos. A frequência das palavras é vista
lugar, a magnitude do efeito foi maior quando 80% dos como tendo um papel importante no processo de
estímulos auditivos eram palavras do que quando apenas reconhecimento de palavras e deve influenciar até
20% eram. Esses achados fornecem fortes evidências mesmo os estágios iniciais do processamento de
para o envolvimento de processos de cima para baixo palavras. O suporte para essas previsões foi relatado por
na percepção da fala. Dahan, Magnuson e Tanenhaus (2001) em experimentos
O modelo TRACE pode facilmente explicar a usando fixações oculares como uma medida do foco
mudança de identificação lexical (Ganong, 1980). Nesse atencional. Os participantes receberam quatro figuras
efeito (discutido anteriormente), há um viés em perceber (por exemplo, banco, cama, sino, lagosta), três das quais
um fonema ambíguo para que uma palavra seja formada. tinham nomes começando com o mesmo fonema. Eles
De acordo com o modelo TRACE, a ativação top-down a clicaram na imagem correspondente a uma palavra
partir do nível da palavra é responsável pela mudança falada (por exemplo, “banco”) enquanto ignoravam os
de identificação lexical. distratores relacionados (cama, sino) e o distrator não relacionado (lagos
McClelland, Rumelhart e o Grupo de Pesquisa PDP De acordo com o modelo, mais fixações devem ser
(Processamento Distribuído Paralelo) (1986) aplicaram direcionadas para o distrator relacionado com um nome
o modelo TRACE ao fenômeno da percepção de fala de alta frequência (ou seja, cama) do que para aquele
categórica discutido anteriormente. De acordo com o que tem um nome de baixa frequência (ou seja,
modelo, o limite de discriminação entre os fonemas torna- campainha). Isso foi o que Dahan et al. encontrado. Além
se mais nítido por causa da inibição mútua entre unidades disso, a frequência influenciou as fixações oculares muito
de fonemas no nível do fonema. Esses processos cedo no processamento, o que também é previsto pelo modelo TRACE.
inibitórios produzem uma situação de “o vencedor leva Voltamo-nos agora para pesquisas que revelam
tudo”, na qual um fonema se torna cada vez mais problemas com o modelo TRACE. Uma limitação séria é
que ele atribui muita importância ao
Machine Translated by Google

368 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

infl uência de processos top-down no reconhecimento Finalmente, consideramos um estudo de Davis,


de palavras faladas. Frauenfelder, Segui e Dijkstra Marslen Wilson e Gaskell (2002). Eles desafiaram a
(1990) deram aos participantes a tarefa de detectar suposição do modelo TRACE de que o reconhecimento
um determinado fonema. A condição-chave era de uma palavra falada é baseado na identificação de
aquela em que uma não-palavra muito parecida com seus fonemas. Os ouvintes ouviam apenas a primeira
uma palavra real era apresentada (por exemplo, sílaba de uma palavra e decidiam se era a única
“vocabutaire” em vez de “vocabulaire”). De acordo sílaba de uma palavra curta (por exemplo, “cap” ou a
com o modelo, efeitos top-down do nó da palavra primeira sílaba de uma palavra mais longa (por
correspondente a “vocabulaire” deveriam ter inibido a exemplo, “capitão”). As duas palavras entre que os
tarefa de identificar o “t” em “vocabutaire”. Eles não. ouvintes deveriam escolher foram habilmente
selecionados para que o primeiro fonema fosse o
A existência de efeitos top-down depende mais mesmo para ambas as palavras. Como os ouvintes
da degradação do estímulo do que o previsto pelo não podiam usar informações fonêmicas para tomar
modelo. McQueen (1991) apresentou fonemas a decisão correta, a tarefa deveria ter sido muito difícil
ambíguos ao final dos estímulos, e os participantes de acordo com o modelo TRACE. De fato , no entanto, o desempenho f
os categorizaram. Cada fonema ambíguo pode ser Os ouvintes usaram informações não fonêmicas (por
percebido como completando uma palavra ou não- exemplo, pequenas diferenças na duração da sílaba)
palavra. De acordo com o modelo, os efeitos de cima ignoradas pelo modelo TRACE para discriminar entre
para baixo do nível da palavra deveriam ter produzido palavras curtas e longas.
uma preferência por perceber os fonemas como
palavras completas. Essa predição foi confirmada Avaliação O
apenas quando o estímulo foi degradado. Segue-se modelo TRACE tem vários sucessos a seu favor. Em
do modelo TRACE que os efeitos devem ser maiores primeiro lugar, fornece explicações razoáveis de
quando o estímulo é degradado. No entanto, a fenômenos como o reconhecimento de fala
ausência de efeitos quando o estímulo não foi categórica, a mudança de identificação lexical e o
degradado é inconsistente com o modelo. efeito de superioridade de palavras no monitoramento de fonemas.
Em segundo lugar, uma força geral significativa do
Imagine que você está ouvindo palavras ditas modelo é sua suposição de que os processos de
por outra pessoa. Você acha que ativaria a grafia baixo para cima e de cima para baixo contribuem
dessas palavras? Parece improvável que a ortografia para o reconhecimento da palavra falada, combinados
(informações sobre a ortografia das palavras) esteja com suposições explícitas sobre os processos envolvidos.
envolvida na percepção da fala, e não há permissão Em terceiro lugar, o modelo prevê com precisão
para seu envolvimento no modelo TRACE. No entanto, alguns dos efeitos da frequência das palavras no
a ortografia desempenha um papel na percepção da processamento auditivo de palavras (por exemplo,
fala. Perre e Ziegler (2008) deram aos ouvintes uma Dahan et al., 2001). Quarto, “RASTREAR . . . lida
tarefa de decisão lexical (decidir se os estímulos extremamente bem com entrada ruidosa – o que é
auditivos eram palavras ou não-palavras). As palavras uma vantagem considerável dado o ruído presente
variaram quanto à consistência entre sua fonologia e na linguagem natural.” (Harley, 2008, p. 274). Por que
sua ortografia ou ortografia. Isso deveria ser irrelevante o TRACE lida bem com fala ruidosa e degradada? O
se a ortografia não estiver envolvida na percepção da TRACE enfatiza o papel dos processos de cima para
fala. Na verdade, no entanto, os ouvintes realizaram baixo, e tais processos se tornam mais importantes
a tarefa de decisão lexical mais lentamente quando quando os processos de baixo para cima precisam
as palavras eram inconsistentes do que quando eram lidar com informações de estímulo limitadas.
consistentes. Os potenciais relacionados a eventos Quais são as limitações do modelo TRACE?
(ERPs; consulte o Glossário) indicaram que a Primeiro, e mais importante, o modelo exagera a
inconsistência entre fonologia e ortografia foi detectada importância dos efeitos de cima para baixo na
rapidamente (menos de 200 ms). percepção da fala (por exemplo, Frauenfelder et al.,
1990; McQueen, 1991). Suponha que os ouvintes ouçam
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 369

uma pronúncia errada. De acordo com o modelo, a ativação testes audiométricos revelam que eles não são surdos.
de cima para baixo a partir do nível da palavra geralmente A análise detalhada desses pacientes sugere que vários
leva os ouvintes a perceber a palavra que melhor se ajusta processos podem ser usados para permitir a repetição de
aos fonemas apresentados, em vez da própria pronúncia uma palavra falada. Como veremos, o estudo desses
incorreta. Na verdade, porém, erros de pronúncia têm um pacientes esclareceu questões como as seguintes: os
forte efeito adverso na percepção da fala (Gaskell & Marslen- processos envolvidos na repetição de palavras faladas são
Wilson, 1998). os mesmos para palavras familiares e desconhecidas? As
Em segundo lugar, o modelo TRACE incorpora muitos palavras faladas podem ser repetidas sem acessar seu
pressupostos teóricos diferentes, o que pode ser considerado significado?
uma vantagem, pois permite que o modelo dê conta de Informações de pacientes com danos cerebrais foram
muitos achados. usadas por Ellis e Young (1988) para propor uma descrição
No entanto, suspeita-se que torne o modelo tão fl exível teórica do processamento de palavras faladas (ver Figura
que “pode acomodar qualquer resultado” (Harley, 2008, p. 9.14; uma figura mais completa de todo o sistema de
274). linguagem é fornecida por Harley, 2008, p. 467). Esta
Em terceiro lugar, os testes do modelo basearam-se explicação teórica (uma estrutura em vez de uma teoria
fortemente em simulações de computador envolvendo um completa) tem cinco componentes:
pequeno número de palavras de uma sílaba. Não está
totalmente claro se o modelo funcionaria satisfatoriamente
se aplicado aos vocabulários muito maiores possuídos pela • O sistema de análise auditiva extrai fonemas ou outros
maioria das pessoas. sons da fala
Quarto, o modelo ignora alguns fatores que influenciam aceno.
o reconhecimento auditivo de palavras. Como vimos, a • O léxico de entrada auditiva contém informações sobre
informação ortográfica desempenha um papel significativo palavras faladas conhecidas pelo ouvinte, mas não
na percepção da fala (Perre & Ziegler, 2008). sobre seu significado. • Os significados das
Além disso, a formação não fonêmica, como a duração da palavras são armazenados no sistema semântico (cf.,
sílaba, também ajuda a determinar a percepção auditiva da memória semântica discutida no Capítulo 7). • O léxico
palavra (Davis et al., 2002). de saída de
fala fornece o
forma falada das palavras.
COGNITIVO • O buffer de resposta do fonema fornece sons de fala
NEUROPSICOLOGIA distintos. • Esses componentes
podem ser usados em várias combinações, portanto, há
Temos nos concentrado principalmente nos processos que várias rotas entre ouvir uma palavra falada e pronunciá-
permitem a identificação de palavras faladas, ou seja, o la.
reconhecimento de palavras. Isso é significativo porque o
reconhecimento de palavras é de vital importância à medida A característica mais marcante da estrutura é a
que nos esforçamos para entender o que o falante está dizendo. suposição de que dizer uma palavra falada pode ser
Nesta seção, consideramos os processos envolvidos na alcançado usando três rotas diferentes, variando em termos
tarefa de repetir uma palavra falada imediatamente após de quais informações armazenadas sobre palavras faladas
ouvi-la. Um dos principais objetivos da pesquisa que usa ouvidas são acessadas. Consideraremos essas três rotas
essa tarefa é identificar alguns dos principais processos após discutir o papel do sistema de análise auditiva na
envolvidos na percepção da fala. percepção da fala.
No entanto, a tarefa também fornece informações úteis
sobre a produção da fala (discutida no Capítulo 11).

Apesar da aparente simplicidade da tarefa de repetição, Sistema de análise auditiva


muitos pacientes com lesão cerebral têm dificuldades com Suponha que um paciente tenha danos apenas no sistema
ela, embora de análise auditiva, produzindo assim um
Machine Translated by Google

370 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

PALAVRA OUVIDA

ANÁLISE AUDITIVA
SISTEMA
(extrai fonemas ou outros
sons)
ENTRADA AUDITIVA
LEXICON
(reconhece palavras
faladas familiares) ROTA 1

ROTA 3 SISTEMA SEMÂNTICO


(conversão ROTA 2 (contém significados
acústica para
de palavras)
fonológica)

SAÍDA DE FALA ROTA 1


LEXICON
(armazena formas
faladas de palavras)
RESPOSTA TELEFÔNICA
BUFFER
(fornece sons de fala
distintos)

DISCURSO

Figura 9.14 Processamento e repetição de palavras faladas. Adaptado de Ellis e Young (1988).

defi cit no processamento fonêmico. Esse paciente são altamente seletivos para fala e não se aplicam a
teria uma percepção de fala prejudicada para palavras sons não falados. Muitos pacientes parecem exibir a
e não-palavras, especialmente aquelas contendo seletividade necessária. No entanto, Pinard, Chertkow,
fonemas difíceis de discriminar. Black e Peretz (2002) identificaram prejuízos na
No entanto, tal paciente teria produção de fala, leitura percepção da música e/ou percepção do som
e escrita geralmente intactas, teria percepção normal ambiente em 58 dos 63 pacientes que revisaram.
de sons ambientais não-verbais sem fonemas (por
exemplo, tosses, assobios) e sua audição estaria A percepção da fala difere da percepção da
intacta. O termo surdez de palavras puras descreve maioria dos sons não falados, pois lidar com mudanças
pacientes com esses sintomas. Haveria evidência rápidas nos estímulos auditivos é muito mais
para uma dupla dissociação se pudéssemos importante no primeiro caso. Jörgens et al.
encontrar pacientes com percepção prejudicada de
sons não-verbais, mas com percepção de fala intacta.
Peretz et ai. (1994) relataram o caso de um paciente
com comprometimento funcional limitado à percepção TERMO-CHAVE
de música e prosódia.
surdez pura para palavras: uma condição
na qual a percepção de fala gravemente prejudicada
é combinada com boa produção de fala, leitura,
Uma parte crucial da definição de surdez pura
escrita e percepção de sons não falados.
para palavras é que os problemas de percepção auditiva
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 371

(2008) estudaram uma mulher de 71 anos com surdez versão da informação acústica contida nas palavras
para palavras pura, que aparentemente não tinha ouvidas nas formas faladas apropriadas dessas
problemas em identificar sons ambientais em sua palavras. Supõe-se que tais processos de conversão
vida cotidiana. No entanto, quando solicitada a contar devem estar envolvidos para permitir que os ouvintes
cliques rápidos, ela errou a maioria deles. Isso sugere repitam palavras desconhecidas e não-palavras.
que ela teve problemas em lidar com mudanças
rápidas na entrada auditiva. Outros pacientes com
surdez pura para palavras têm problemas em perceber Evidência
mudanças rápidas em sons não verbais com padrões Se os pacientes pudessem usar a Rota 2, mas as
de tom complexos (ver Martin, 2003). Assim, a Rotas 1 e 3 estivessem gravemente prejudicadas,
capacidade prejudicada de processar estímulos eles seriam capazes de entender palavras familiares,
auditivos que mudam rapidamente pode ajudar a mas não entenderiam seu significado (consulte a Figura 9.14).
explicar a má percepção da fala de pacientes com Além disso, eles devem ter problemas com palavras
surdez pura para palavras. desconhecidas e não-palavras, porque as não-
palavras não podem ser tratadas pela Rota 2.
Finalmente, como esses pacientes fariam uso do
Estrutura de três rotas Sem surpresa, léxico de entrada, eles deveriam ser capazes de
a suposição mais importante da estrutura de três distinguir entre palavras e não-palavras.
rotas é que existem três maneiras (ou rotas) diferentes Os pacientes que sofrem de palavra que
que podem ser usadas quando os indivíduos significa surdez se encaixam na descrição acima. A
processam e repetem palavras que acabaram de noção da palavra que significa surdez provou ser
ouvir. Como você pode ver na Figura 9.14, essas três controversa e relativamente poucos pacientes com a
rotas diferem em termos de número e natureza dos condição foram identificados. No entanto, alguns
processos usados pelos ouvintes. Todas as três rotas casos bastante claros foram identificados. Por
envolvem o sistema de análise auditiva e o buffer de exemplo, Jacquemot, Dupoux e Bachoud-Lévi (2007)
resposta fonêmica. A Rota 1 envolve três componentes afirmaram que uma paciente do sexo feminino, GGM,
adicionais do sistema de linguagem (o léxico de apresentava todos os principais sintomas da palavra
entrada auditiva, o sistema semântico e o léxico de que significa surdez.
saída de fala), a Rota 2 envolve dois componentes Franklin, Turner, Ralph, Morris e Bailey (1996)
adicionais (o léxico de entrada auditiva e o léxico de estudaram o Dr. O, que foi outro caso claro de palavra
saída de fala) e a Rota 3 envolve um léxico adicional que significa surdez. Ele tinha compreensão auditiva
sistema baseado em regras que converte informações prejudicada, mas compreensão de palavras escritas
acústicas em palavras que podem ser faladas. intacta. Sua capacidade de repetir palavras foi
Passamos agora a uma discussão mais detalhada de dramaticamente melhor do que sua capacidade de
cada rota. repetir não-palavras (80% versus 7%, respectivamente).
De acordo com a estrutura de três rotas, as Finalmente, o Dr. O teve uma taxa de sucesso de
Rotas 1 e 2 são projetadas para serem usadas com 94% na distinção entre palavras e não-palavras.
palavras familiares, enquanto a Rota 3 é projetada O Dr. O parecia ter acesso razoável ao léxico de
para ser usada com palavras desconhecidas e não entrada, conforme demonstrado por sua maior
palavras. Quando a Rota 1 é usada, uma palavra capacidade de repetir palavras do que não-palavras
ouvida ativa informações relevantes armazenadas e por sua capacidade quase perfeita de distinguir entre
sobre ela, incluindo seu significado e sua forma falada.
A Rota 2 é muito parecida com a Rota 1, exceto que
as informações sobre o significado das palavras TERMO-CHAVE

ouvidas não são acessadas. Como resultado, alguém


palavra que significa surdez: uma condição na
usando a Rota 2 diria palavras familiares com
qual há um comprometimento seletivo da
precisão, mas não saberia seu significado. Por fim, a capacidade de entender a linguagem falada (mas não escrita).
Rota 3 envolve o uso de regras sobre o
Machine Translated by Google

372 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

palavras e não-palavras. Ele claramente tem algum Jefferies et ai. (2007) descobriram que pacientes
problema relacionado ao sistema semântico. No entanto, com disfasia profunda sofriam de produção fonológica
o próprio sistema semântico não parece estar danificado, pobre na repetição de palavras, leitura em voz alta e
pois sua capacidade de compreender palavras escritas nomeação de imagens faladas. Conforme previsto, eles
está intacta. Ele provavelmente tem danos em partes da também tiveram um desempenho muito ruim em tarefas
Rota 1. Tyler e Moss (1997) argumentaram que o Dr. O envolvendo a manipulação da fonologia, como a tarefa
também pode ter problemas no início do processamento de subtração de fonemas (por exemplo, remover o
(por exemplo, na extração de características fonêmicas fonema inicial de “gato”). Além disso, eles tinham
da fala). Por exemplo, quando lhe pediram para repetir problemas com a percepção da fala, como revelado por
palavras faladas o mais rápido possível, ele cometeu seu fraco desempenho em decidir se duas palavras
25% de erros. rimavam uma com a outra. Em suma, Jefferies et al.
De acordo com o referencial teórico, esperaríamos forneceram um bom suporte para sua hipótese de
encontrar alguns pacientes que fizessem uso principal comprometimento fonológico.
ou exclusivamente da Rota 3, que envolve a conversão
da informação acústica das palavras ouvidas nas formas
faladas dessas palavras. Avaliação A
Esses pacientes seriam razoavelmente bons em repetir estrutura de três vias está no caminho certo. Os pacientes
palavras faladas e não-palavras, mas teriam uma variam nos problemas precisos que têm com a percepção
compreensão muito pobre dessas palavras. da fala (e produção da fala), e existem algumas
Alguns pacientes com afasia sensorial transcortical evidências para cada uma das três vias. No mínimo, está
exibem precisamente esse padrão de sintomas (Coslett, claro que a repetição de palavras faladas pode ser
Roeltgen, Rothi e Heilman, 1987; Raymer, 2001). Esses alcançada de várias maneiras diferentes. Além disso,
pacientes geralmente têm compreensão de leitura ruim, condições como surdez pura para palavras, surdez para
além de compreensão auditiva prejudicada, sugerindo palavras e afasia transcortical podem ser prontamente
que eles têm danos no sistema semântico. relacionadas à estrutura.

Alguns pacientes com danos cerebrais têm Quais são as limitações da estrutura?
problemas extensos com a percepção e produção da fala. Primeiro, muitas vezes é difícil decidir com precisão como
Por exemplo, pacientes com disfasia profunda cometem os sintomas dos pacientes se relacionam com o quadro.
erros semânticos quando solicitados a repetir palavras Por exemplo, a disfasia profunda pode ser vista como
faladas, dizendo palavras relacionadas ao significado envolvendo deficiências em todas as três vias ou,
daquelas faladas (por exemplo, dizer “céu” quando alternativamente, refletindo principalmente uma
ouvem “nuvem”). Além disso, eles acham mais difícil deficiência fonológica geral. Em segundo lugar, algumas
repetir palavras abstratas do que palavras concretas e condições (por exemplo, palavra que significa surdez;
têm uma capacidade muito fraca de repetir não-palavras. agnosia fonológica auditiva) raramente foram relatadas
Como podemos explicar a disfasia profunda? Com e, portanto, seu status é questionável.
referência à Figura 9.14, pode-se argumentar que
nenhuma das rotas entre as palavras ouvidas e a fala
está intacta. Talvez haja um prejuízo grave na rota não
lexical (Rota 3) combinado com um prejuízo adicional no TERMOS CHAVE
(ou próximo) do sistema semântico. Outros teóricos (por
exemplo, Jefferies et al., 2007) argumentaram que o afasia sensorial transcortical: um distúrbio no
problema central na disfasia profunda é um qual as palavras podem ser repetidas, mas há
comprometimento fonológico geral (ou seja, problemas muitos problemas com a
no processamento dos sons das palavras). Isso leva a linguagem. disfasia profunda: uma condição na
qual há pouca capacidade de repetir
erros semânticos porque aumenta a confiança dos
palavras faladas e especialmente não-palavras,
pacientes no significado das palavras ao repetir palavras
e há erros semânticos na repetição de palavras faladas.
faladas.
Machine Translated by Google

9 LEITURA E PERCEPÇÃO DA FALA 373

RESUMO DO CAPÍTULO

• Leitura: introdução Vários


métodos estão disponíveis para estudar a leitura. Tarefas de decisão lexical, nomeação e priming foram usadas
para avaliar a identificação de palavras. A gravação dos movimentos oculares fornece informações on-line
detalhadas e é discreta. Estudos de priming fonológico mascarado sugerem que o processamento fonológico
ocorre rápida e automaticamente na leitura. No entanto, a ativação fonológica provavelmente não é essencial
para o reconhecimento de palavras.

• Reconhecimento de palavras
De acordo com o modelo de ativação interativa, os processos de baixo para cima e de cima para baixo
interagem durante o reconhecimento de palavras. Parece explicar o efeito de superioridade de palavras, mas
ignora os papéis do processamento fonológico e do significado no reconhecimento de palavras. O contexto da
frase geralmente tem uma influência rápida no processamento de texto, mas essa influência é menor do que total.

• Leitura em voz alta


De acordo com o modelo em cascata de rota dupla, as rotas lexicais e não lexicais são usadas na leitura de
palavras e não-palavras. Os disléxicos de superfície dependem principalmente da rota não lexical, enquanto
os disléxicos fonológicos usam principalmente a rota lexical. O modelo de rota dupla enfatiza a importância da
regularidade da palavra, mas a consistência é mais importante. O modelo também ignora efeitos de consistência
com não-palavras e minimiza o papel do processamento fonológico. O modelo triangular consiste em sistemas
ortográficos, fonológicos e semânticos. A dislexia superficial é atribuída a danos no sistema semântico,
enquanto a dislexia fonológica decorre de um comprometimento fonológico geral. A dislexia profunda envolve
prejuízos fonológicos e semânticos. O modelo triangular só recentemente considerou o sistema semântico em
detalhes, e suas explicações sobre a dislexia fonológica e superficial são simplificadas demais.

• Leitura: pesquisa do movimento ocular De


acordo com o modelo EZ Reader, o próximo movimento ocular é planejado quando apenas parte do
processamento da palavra atualmente fixada tiver ocorrido. A conclusão da verificação de frequência de uma
palavra é o sinal para iniciar um programa de movimento dos olhos, e a conclusão do acesso lexical é o sinal
para uma mudança de atenção encoberta para a próxima palavra. O modelo fornece uma explicação razoável
de muitos achados. No entanto, exagera a extensão do processamento serial e prevê erroneamente que os
leitores lerão as palavras na ordem “correta” ou sofrerão interrupções se não o fizerem.

• Ouvir a fala
Os ouvintes fazem uso de pistas prosódicas e leitura labial. Entre os problemas enfrentados pelos ouvintes
estão a velocidade da linguagem falada, o problema de segmentação, coarticulação, diferenças individuais nos
padrões de fala e fala degradada. Os ouvintes preferem usar informações lexicais para alcançar a segmentação
de palavras, mas também podem usar co-articulação, alofonia e acento silábico. Há percepção categórica de
fonemas, mas podemos discriminar inconscientemente entre sons categorizados como o mesmo fonema. A
mudança de identificação lexical e o efeito de restauração fonêmica mostram os efeitos do contexto na
percepção da fala.
Machine Translated by Google

374 PSICOLOGIA COGNITIVA: MANUAL DO ALUNO

• Teorias de reconhecimento de palavras faladas


De acordo com a teoria motora, os ouvintes imitam os movimentos articulatórios do falante.
Há evidências razoáveis de que os processos motores podem facilitar a percepção da fala. No entanto,
alguns pacientes com produção de fala gravemente prejudicada têm percepção de fala razoável.
A teoria da coorte é baseada na suposição de que perceber uma palavra falada envolve rejeitar
concorrentes em um processo sequencial. No entanto, fatores contextuais podem influenciar a percepção
de fala mais cedo no processamento do que o assumido pelo modelo. O modelo TRACE é altamente
interativo e responde por vários fenômenos (por exemplo, efeito de superioridade de palavras no
monitoramento de fonemas). No entanto, exagera a importância dos efeitos de cima para baixo.

• Neuropsicologia cognitiva
Tem sido afirmado que existem três rotas entre o som e a fala. Pacientes com surdez pura para palavras
têm problemas com a percepção da fala que podem ser devidos ao processamento fonêmico prejudicado.
Pacientes com surdez de significado de palavras têm problemas na conversão acústico-fonológica e no
uso do sistema semântico. Pacientes com afasia sensorial transcraniana parecem ter danos no sistema
semântico, mas podem usar a conversão acústico-fonológica.
O problema central na disfasia profunda é um comprometimento fonológico geral.

LEITURA ADICIONAL

• Diehl, RL, Lotto, AJ e Holt, LL (2004). Percepção da fala. Revisão Anual de Psicologia, 55, 149-179. Os
autores discutem as principais perspectivas teóricas em termos de sua capacidade de explicar fenômenos-
chave na percepção da fala. • Gaskell, G. (ed.) (2007). Manual Oxford de
Psicolinguística. Oxford: Oxford University Press. Este grande volume editado contém vários capítulos que
tratam dos processos básicos de leitura e percepção da fala. Este é especialmente o caso da Parte 1,
dedicada ao reconhecimento de palavras. • Harley, TA (2008). A psicologia da linguagem: dos dados à
teoria (3ª ed.). Vários
capítulos (por exemplo, 6, 7 e 9) deste excelente livro contêm informações detalhadas sobre os processos
envolvidos no reconhecimento de palavras visuais e auditivas. • Pisoni, DB, & Remez, RE (eds.) (2004). O
manual da percepção da fala. Oxford: Blackwell. Este livro editado contém
numerosos artigos importantes em todo o campo da percepção da fala. • Rayner, K., Shen, D., Bai, X., & Yan,
G. (eds.) (2009). Infl uências cognitivas e culturais nos movimentos oculares. Hove, Reino Unido:
Psychology Press. A
seção 2 deste livro editado é dedicada às principais teorias contemporâneas dos movimentos oculares na
leitura.

• Smith, F. (2004). Compreendendo a leitura: uma análise psicolinguística da leitura e da aprendizagem da


leitura. Mahwah, NJ: Lawrence Erlbaum Associates, Inc. Este livro fornece um relato completo da teoria e
pesquisa sobre leitura.

Você também pode gostar