CohenDunbarMcC90 en PT

Traduzido do Inglês para o Português - www.onlinedoctranslator.
com
Revisão Psicológica
1990, vol. 97, nº 3, 332-361
hológico
Copyright 1990 da American Psychl Association, Inc.

0033-295X/90/$00,75
Sobre o controle de processos automáticos: uma distribuição paralela

Processamento de conta do efeito Stroop
Jonathan D. Cohen
Universidade Carnegie Mellon
Universidade de Pittsburgh
Universidade de Stanford
Kevin Dunbar
Universidade McGill
James L. McClelland
Universidade Carnegie Mellon
As visões tradicionais de automaticidade precisam de revisão. Por exemplo, a automaticidade

tem sido muitas vezes
tratado como um fenômeno de tudo ou nada, e as teorias tradicionais sustentam que os
processos automáticos
são independentes da atenção. No entanto, dados empíricos recentes sugerem que os processos
automáticos são contínuos.
e, além disso, estão sujeitos ao controle atencional. Um modelo de atenção é apresentado para
abordar
estas questões. Dentro de uma estrutura de processamento paralelo distribuído, propõe-se que
os atributos de
A automaticidade depende da força de uma via de processamento e essa força aumenta com o
treinamento.
ing. Com o efeito Stroop como exemplo, os processos automáticos mostram-se contínuos e
emergem gradualmente com a prática. Especificamente, um modelo computacional da tarefa
Stroop simula o
curso de tempo de processamento, bem como os efeitos da aprendizagem. Isto foi conseguido
combinando o
mecanismo em cascata descrito por McClelland (1979) com o algoritmo de aprendizagem
backpropagation
(Rumetart, Hinton e Williams, 1986). O modelo pode simular desempenho no padrão
Tarefa Stroop, bem como aspectos de desempenho em variantes desta tarefa que manipulam o
início do estímulo
assincronia, conjunto de respostas e grau de prática. O modelo apresentado é contrastado com
outros
modelos e sua relação com muitas das questões centrais da literatura sobre atenção,
automaticidade e
interferência é discutida.
Introdução
A natureza da atenção tem sido uma das preocupações centrais

da psicologia experimental desde o seu início (por exemplo, Cattell,
1886; Pillsbury, 1908). James (1890) enfatizou a seletiva
aspectos da atenção e considerava a atenção como um processo de
“tomar posse pela mente, de forma clara e vívida, de um
do que parecem vários objetos ou objetos simultaneamente possíveis
linhas de pensamento” (p. 403). Outros, como Moray (1969) e
Posner (1975), notaram que a atenção também é um fator intensificado
estado de excitação e que parece haver um conjunto limitado de
Agradecemos com gratidão os comentários e sugestões úteis

feito por David Galin, Gordon Logan, Colin MacLeod, David Rumel-
hart, Walter Schneider e David Servan-Schreiber.
Este trabalho foi apoiado por uma bolsa de pesquisa do Rito Escocês
Programa de Pesquisa sobre Esquizofrenia e um Instituto Nacional de Mental
Prêmio Médico Cientista da Saúde (NIMH) (MH00673) para Jonathan D.
Cohen; com financiamento do Conselho de Ciências Naturais e Engenharia
Canadá (OGP0037356) e o Departamento de Psicologia da Carnegie
Universidade Mellon para Kevin Dunbar; e pelo Escritório de Pesquisa Naval
Contrato N0O0014-82-C-0374, NR442a-483 e uma Pesquisa NIMH
Prêmio de Desenvolvimento de Carreira de Cientista (MHO00385) para James L. McClel-
terra. Uma versão preliminar deste trabalho foi apresentada na edição anual
reunião da Sociedade de Psiconomia em Seattle, Washington, novembro
1987.
A correspondência relativa a este artigo deve ser endereçada a Jona-

do que D. Cohen, Departamento de Psicologia, Carnegie Mellon University,
Pittsburgh, Pensilvânia 15213.
332
atenção disponível para processos cognitivos. Posner e Snyder

(1975) e Shiffrin e Schneider (1977) forneceram dados
contagens de atenção que integram esses aspectos de atenção e
enfatizam que a atenção está intimamente ligada à aprendizagem. Esses
relatos se concentram em dois tipos de processos cognitivos, controlados
e automático. Os processos controlados são voluntários, exigem atenção
atenção e são relativamente lentos, enquanto os processos automáticos são
rápidos e não requerem atenção para sua execução. Desempenho
normalmente considera-se que o desempenho de novas tarefas depende da con-
processamento controlado; no entanto, com prática extensiva,
A execução de algumas tarefas pode se tornar automática (por exemplo, LaBerge &
Samuels, 1974; Logan, 1979; Posner e Snyder, 1975; Schneider
& Shiffrin, 1977; Shiffrin & Schneider, 1977).!
Muitas tarefas têm sido usadas para examinar a natureza da atenção.

ção e automaticidade. Talvez o mais estudado
tarefas foram as tarefas de busca de Shifrin e Schneider (1977;
Schneider & Shiffrin, 1977), tarefas de preparação (por exemplo, Neely, 1977),
e a tarefa Stroop (Stroop, 1935). A interpretação de tal
estudos muitas vezes se basearam na suposição de que a automaticidade é
um fenômeno de tudo ou nada. No entanto, pesquisas recentes têm sido
arma para questionar esta suposição (por exemplo, Kahneman & Henik,
1981; MacLeod e Dunbar, 1988). Uma concepção alternativa é
essa automaticidade é uma questão de grau. Por exemplo, Kahne-
! Alguns autores argumentaram que certos processos automáticos são

Nato. Por exemplo, Hasher e Zacks (1979) argumentaram que a codificação
da frequência dos eventos é um processo automático e inato. Nisso
artigo, no entanto, nosso foco está em processos que se tornam automáticos após
prática extensiva em uma tarefa.
CONTROLE DE PROCESSOS AUTOMÁTICOS 333
man e Treisman (1984) sugeriram que os processos podem

diferem na medida em que dependem da atenção, e Mac-
Leod e Dunbar (1988) apresentaram dados que indicam que
os atributos da automaticidade desenvolvem-se gradualmente com a prática.
Até o momento, no entanto, não há uma descrição explícita dos mecanismos
automaticidade subjacente que pode explicar tanto o seu desenvolvimento gradual
desenvolvimento com a prática e sua relação com a atenção seletiva, O
o objetivo deste artigo é fornecer tal conta.
Começamos ilustrando a relação entre atenção

e automaticidade - como é comumente interpretada - no contexto
texto da tarefa de interferência Stroop. Mostramos como as ações anteriores
tentativas de explicar o efeito Stroop apontam para lacunas significativas na
compreender esse fenômeno básico. Em seguida, descrevemos uma teoria
quadro teórico em que a automaticidade pode ser vista como uma
fenômeno contínuo que varia com a prática; o quadro
especifica a relação entre automaticidade e atenção
controle em termos de mecanismos específicos de processamento de informações
ismos. O corpo principal do artigo descreve uma simulação
modelo que aplica esta estrutura teórica ao desempenho
na tarefa Stroop.
A tarefa Stroop
Os efeitos observados na tarefa Stroop fornecem uma ilustração clara

da capacidade das pessoas para atenção seletiva e a habilidade
de alguns estímulos para escapar do controle atencional. Nesta tarefa, sub-
os sujeitos são solicitados a responder a estímulos que variam em duas dimensões.
situações, uma das quais eles devem ignorar. Na versão clássica de
tarefa, são mostradas aos sujeitos palavras escritas em cores diferentes
tintas. Quando a tarefa é ler a palavra, os sujeitos são eficazes em
ignorando a cor da tinta, como evidenciado pelo fato de que a tinta
a cor não tem influência no tempo de leitura. Porém, quando a tarefa
1s para nomear a cor da tinta, eles são incapazes de suprimir os efeitos
da forma da palavra. Se a palavra entrar em conflito com a cor da tinta (por exemplo,
VERDE em tinta vermelha?), eles são consistentemente mais lentos para responder (ou seja,
dizer “vermelho”) do que para estímulos de controle (por exemplo, uma linha de Xs impressos
em
tinta vermelha), e são mais rápidos se a palavra concordar com a cor da tinta
(por exemplo, VERMELHO em tinta vermelha). Os assuntos também são mais lentos em geral
em cores
nomeação do que na leitura de palavras, sugerindo que a nomeação de cores é um
tarefa menos praticada. Esses efeitos são altamente robustos e semelhantes
descobertas foram observadas em uma diversidade de paradigmas usando
vários estímulos (para revisões, ver Dyer, 1973; MacLeod, 1989).
O efeito Stroop ilustra um aspecto fundamental da atenção:
As pessoas são capazes de ignorar algumas características do ambiente, mas
não outros.
A explicação mais simples para o efeito Stroop é que o impacto

A principal diferença entre a nomenclatura de cores e a leitura de palavras é a velocidade
de processamento. Na verdade, os sujeitos são consistentemente mais rápidos na leitura
palavras do que nomear cores. Devido a esse fato, muitas vezes
assumiu que a palavra chega ao estágio de resposta do processo
antes das informações de cor. Se a palavra concorda com a cor,
isso facilitará a resposta de nomeação de cores; se o
conflitos de palavras, sua influência deve ser superada para gerar o
resposta correta, levando a um tempo de resposta mais longo para (ou seja,
interferência com) o processo de nomenclatura de cores. Porque as informações de cor
a informação chega ao estágio de resposta após a palavra informação,
não tem efeito no processo de leitura de palavras.
Contudo, se a velocidade de processamento for a única variável relevante,

então deve haver uma maneira de criar conflito de informações de cores
com leitura de palavras apresentando informações de cores antecipadamente

o suficiente antes do início da palavra. Na verdade, porém, isso faz
não funciona. MO Glaser e Glaser (1982) variaram o estímulo-
assincronia de início (SOA) de um patch de cor e uma palavra de cor,® e
não encontrou interferência da mancha colorida na leitura de palavras, mesmo
quando a cor precedeu a palavra em até 400 ms. Esse
resultado indica que o tempo relativo de término dos dois processos
processos não é o único determinante dos efeitos de interferência.
Uma abordagem mais geral para explicar os efeitos do tipo Stroop tem
foi considerar o papel da atenção no processamento. Este aplicativo
abordagem baseia-se na distinção entre automático e con-
processos controlados (Cattell, 1886; Posner & Snyder, 1975; Shiffrin
& Schneider, 1977). Os processos automáticos são rápidos, não re-
requerem atenção para sua execução e, portanto, podem ocorrer em
voluntariamente. Em contraste, os processos controlados são relativamente lentos,
requerem atenção e, portanto, estão sob controle voluntário.
Deste ponto de vista, os resultados de um processo automático são
mais propensos a escapar das tentativas de atenção seletiva do que
aqueles de um processo controlado.
Posner e Snyder (1975) aplicaram a distinção entre

processos controlados e automáticos diretamente para a tarefa Stroop
fazendo as seguintes três suposições: (a) A leitura de palavras é
automático, (b) a nomeação de cores é controlada e (c) se as saídas
de qualquer conflito entre dois processos, um dos dois processos será
desacelerou. Nesta visão, a descoberta de que a leitura de palavras é mais rápida do que
a nomenclatura de cores decorre da velocidade relativamente maior de auto-
processos automáticos. A descoberta de que a cor da tinta não tem efeito na palavra
O processamento segue da suposição de que a nomeação de cores é
controlado e, portanto, voluntário; então, o programa de nomenclatura de cores
O processo não ocorrerá quando a tarefa for ignorar a cor e ler
a palavra. A constatação de que uma palavra conflitante interfere
a nomenclatura de cores decorre da automaticidade (ou seja, involuntária
natureza) da leitura de palavras e a suposição de que
produz resposta lenta.
Esta interpretação da tarefa Stroop exemplifica uma visão geral

método que tem sido usado para avaliar a automaticidade de dois
processos arbitrários, A e C, com base em sua velocidade de processamento
processo e o padrão de efeitos de interferência que eles exibem. Se um
é mais rápido que C, e se A interfere com C, mas C não inter-
com A, então A é automático e C é controlado. Claro,
este raciocínio requer que os Processos A e C sejam, em certo sentido,
comparável em dificuldade intrínseca e número de processamento
estágios.
Este método para identificar processos como automáticos ou controlados

trolled ganhou ampla aceitação. No entanto, evidências de um
recente série de experimentos conduzidos por MacLeod e Dun-
bar (1988) sugere que esta pode não ser uma caracterização adequada
ização dos processos envolvidos na tarefa Stroop. Eles ensinaram
sujeitos a usar palavras coloridas como nomes para formas arbitrárias que
na verdade apareceu em uma cor neutra. Após 288 tentativas (72 tentativas
por estímulo), os sujeitos poderiam realizar esta tarefa de nomeação de formas
sem dificuldade. Neste ponto, o efeito que a cor da tinta teve sobre
2 Ao longo deste artigo, referências a estímulos de palavras aparecem em caracteres

maiúsculos.
letras maiúsculas (VERMELHO), referências a estímulos coloridos aparecem em letras
minúsculas
(vermelho) e as referências a possíveis respostas aparecem entre aspas
("vermelho").
3 Como discutiremos mais tarde, o efeito Stroop ainda pode ser observado mesmo quando
as duas dimensões do estímulo são fisicamente disjuntas.
334 J. COHEN, K. DUNBAR, E J, McCLELLAND
a nomeação de formas foi testada apresentando assuntos com conflitos

e estímulos congruentes (ic, formas coloridas para entrar em conflito ou concordar
com seus nomes atribuídos). A cor da tinta produziu grandes interferências
efeitos de influência e facilitação. No entanto, quando a tarefa foi re-
versados, e os sujeitos foram solicitados a indicar a cor da tinta em
onde as formas apareceram (a tarefa de nomeação de cores), congruência
do nome da forma não teve efeito. Eles também notaram que a reação
os tempos para a tarefa de nomeação de formas (condição de controle) foram mais lentos
do que aqueles para a tarefa padrão de nomeação de cores (controle
doença).
Os resultados de MacLeod e Dunbar (1988) são incompatíveis com

a explicação da tarefa Stroop em termos de controle versus
processamento automático. Ou seja, de acordo com o raciocínio padrão,
visto que (a) a nomeação de cores é mais lenta do que a leitura de palavras, (b) a nomeação de
cores
a nomenclatura é influenciada pelas informações da palavra e (c) pela cor da tinta
não influencia a leitura de palavras, a nomeação de cores deve ser
trollado. No entanto, na experiência de MacLeod e Dunbar, os nomes das cores
invertendo papéis. Ou seja, (a) a nomeação de cores foi mais rápida do que
nomenclatura de formas, (b) a nomenclatura de cores não foi afetada pela forma
nomes e (c¢) a cor da tinta interferiu (e facilitou) a forma
nomenclatura. Se tratarmos a automaticidade como dicotômica, devemos considerar
Conclui-se a partir dessas descobertas que a nomeação de cores é automática.
Uma maneira de contabilizar esses dados – em vez de tentar

dicotomizar processos como controlados ou automáticos - é apoiar
representam que tarefas como leitura de palavras, nomeação de cores e formas
a nomenclatura está ao longo de um continuum. Isto é sugerido por seu parente
velocidades de desempenho e pelo padrão de efeitos de interferência
que existem entre essas tarefas. Assim, a leitura de palavras é mais rápida do que
e é capaz de interferir na nomeação de cores, enquanto a nomeação de cores
é mais rápido e é capaz de interferir na nomeação de formas (pelo menos
pelo menos no início). Tal continuum sugere que a velocidade do processo
efeitos de interferência e interferência são variáveis contínuas que determinam
dependem do grau de automatização de cada tarefa. Isto é sup-
portado pelas seguintes evidências.
Natureza Contínua da Velocidade de Processamento
Numerosos estudos demonstraram que a prática produz graduações

aumentos usuais e contínuos na velocidade de processamento (por exemplo, Blackburn,
1936; Bryan e Harter, 1899; Logan, 1979; Shiffrin & Schnei-
der, 1977) que seguem uma lei de potência (Anderson, 1982; Kolers,
1976; Logan, 1988; Newell & Rosenbloom, 1981). MacLeod
e Dunbar (1988) também examinaram esta variável em seu estudo.
Eles continuaram a treinar os sujeitos na tarefa de nomear formas com
144 tentativas por estímulo diariamente durante 20 dias. Os tempos de reação mostraram
melhoria gradual e progressiva com a prática.
Natureza Contínua dos Efeitos de Interferência
O padrão de efeitos de interferência observados no MacLeod

e o estudo de Dunbar (1988) também mudaram ao longo do treinamento.
na tarefa de nomear formas. Conforme mencionado anteriormente, depois | dia
Na prática, não houve efeito dos nomes das formas na nomeação das cores.
Após 5 dias de treinamento, no entanto, as formas produziram algumas inter-
referência, e após 20 dias, houve um grande efeito. Ou seja, pré-
enviar uma forma com um nome que conflita com a cor da tinta
produziu forte interferência com a resposta de nomenclatura de cores.
O padrão inverso de resultados ocorreu para a nomeação de formas
tarefa. Após 1 sessão de prática, cores de tinta conflitantes interferiram
com a nomeação da forma, enquanto após 20 sessões isso não é mais

ocorreu.
Esses dados sugerem que a velocidade de processamento e a interferência

efeitos são de natureza contínua e que estão intimamente relacionados
praticar. Além disso, eles indicam que nem a velocidade de
processamento nem efeitos de interferência, por si só, podem ser usados de forma confiável
para identificar processos como controlados ou automáticos. Estas observa-
ções levantam diversas questões importantes. Qual é a relação
entre processos como leitura de palavras, nomeação de cores e
nomeação de formas e como suas interações resultam no padrão
período de efeitos observados? Em particular, que tipos de mecanismos
podem ser responsáveis por mudanças contínuas tanto na velocidade de pro-
efeitos de processamento e interferência em função da prática? Fi-
Finalmente, e talvez o mais importante, como a atenção se relaciona com
esses fenômenos?
O objetivo deste artigo é fornecer um referencial teórico

trabalho dentro do qual abordar essas questões. Usando o princípio
exemplos de processamento paralelo distribuído (PDP), descrevemos um
modelo do efeito Stroop em que tanto a velocidade de processamento
e os efeitos de interferência estão relacionados a um problema comum e subjacente
variável que chamamos de força de processamento. O modelo fornece
um mecanismo para três atributos de automaticidade. Primeiro, mostra
como a força varia continuamente em função da prática; segundo
Em segundo lugar, mostra como a força relativa de dois programas concorrentes
processos determina o padrão de efeitos de interferência observados;
e terceiro, mostra como a força de um processo determina a
até que ponto é governado pela atenção.
O modelo tem implicações diretas para o método padrão

pelos quais os processos controlados e automáticos são diferenciados.
O modelo mostra que dois processos que utilizam
mecanismos práticos e diferem apenas em sua força podem exibir
diferenças na velocidade de processamento e um padrão de interferência
efeitos que fazem com que os processos pareçam automáticos
e o outro é controlado. Esse achado sugere que esses cri-
critérios – velocidade de processamento, capacidade de produzir interferência e
suscetibilidade à interferência - pode ser inadequada para
oscilando entre o processamento controlado e o automático. Esse
não significa que a distinção entre controle e auto-
processos automáticos são inúteis ou inválidos. Em vez disso, o modelo mostra
que diferenças de velocidade de processamento e interferências do tipo Stroop
efeitos de influência podem surgir simplesmente de diferenças na força de
processamento, de modo que esses fenômenos podem não fornecer uma resposta confiável
base para distinguir processos controlados de processos automáticos.
A Estrutura de Processamento
O modelo de processamento de informações que descrevemos foi desenvolvido

operado dentro da estrutura mais geral do PDP descrita por
Rumelhart, Hinton e McClelland (1986). Aqui, delineamos
algumas das características gerais deste quadro. Nós então
voltemos aos detalhes de nossa implementação de um modelo do
Tarefa Stroop.
Características arquitetônicas. Processamento dentro do PDP

supõe-se que a estrutura ocorra em um sistema de conexões
módulos. Cada módulo consiste em um conjunto de elementos elementares
unidades de processamento. Cada unidade é um simples processador de informações
dispositivo que acumula entradas de outras unidades e ajusta seu
saída continuamente em resposta a essas entradas.
Representação de informações. A informação é representada como

um padrão de ativação nas unidades de um módulo. A ativação

de cada unidade é um número real com valor variando entre um maxi-
valor mãe e mínimo. Assim, a informação é representada em
de forma gradual e pode acumular-se e dissipar-se com o tempo.
Em processamento. O processamento ocorre pela propagação de sinais

(disseminação da ativação) de um módulo para outro. Isto ocorre
através das conexões que existem entre as unidades em diferentes
módulos. Em geral, pode haver conexões dentro, bem como
entre módulos e as conexões podem ser bidirecionais. Como-
sempre, para os presentes propósitos, adotamos a simplificação que existe
é um fluxo unidirecional de processamento, começando nos módulos usados
para representar a entrada sensorial e prosseguir para frente ou a partir do
de baixo para cima até os módulos dos quais a saída governa a execução
de respostas abertas.
Caminhos e seus pontos fortes. Um processo específico é como-

presume-se que ocorra através de uma sequência de módulos conectados que formam
um caminho. O desempenho de uma tarefa requer que um processamento
existe uma via que permite o padrão de ativação no papel
módulos sensoriais interessantes para gerar - através da propagação de
ativação em módulos intermediários - um padrão apropriado
de ativação nos módulos de saída relevantes. A velocidade e
a precisão com que uma tarefa é executada depende da velocidade
e precisão com que a informação flui ao longo do apropriado
comeu caminho de processamento. Isto, por sua vez, depende da conexão
entre as unidades que compõem os módulos nesse caminho-
caminho. Demonstramos isso na seção Simulações. Nos referimos
a este parâmetro como a força de um caminho. Assim, a velocidade
e a precisão da execução de uma tarefa dependem da força do
caminho usado nessa tarefa.
Interações entre processos. Módulos individuais podem ser re-

receber informações e enviar informações para vários outros módulos
regras. Como tal, cada um pode participar em vários processos diferentes.
caminhos. Interações entre processos surgem neste sistema
tema quando dois caminhos diferentes dependem de um módulo comum,
isto é, quando os caminhos se cruzam. Se ambos os processos estiverem ativos,
e os padrões de ativação que cada um gera no ponto
de interseção são diferentes, então a interferência ocorrerá dentro
nesse módulo, e o processamento será prejudicado em um ou ambos
caminhos. Se os padrões de ativação forem muito semelhantes, isso
levar à facilitação.
A interseção entre dois caminhos pode ocorrer em qualquer
ponto no processamento após a fase sensorial. Por exemplo, inter-
A referência em um estágio intermediário é consistente com os dados relatados
por Shaffer (1975) e por Allport, Antonis e Reynolds
(1972). A interferência no estágio de saída daria origem a
competição de resposta, como a observada na tarefa Stroop
(cf. Dyer, 1973). A visão geral de que surgem efeitos de interferência
sempre que dois processos dependem de um recurso comum ou conjunto de
recursos foi chamada de visão de recursos múltiplos
(por exemplo, Allport, 1982; Hirst & Kalmar, 1987; Navon & Gopher,
1979; Wickens, 1984). Logan (1985) resumiu esta posição
sucintamente:
Tarefas diferentes podem depender de recursos diferentes e tarefas duplas

a interferência ocorre apenas quando as tarefas compartilham recursos comuns.
Assim, a interferência que uma determinada tarefa produz não será um
característica invariante dessa tarefa; em vez disso, dependerá do

natureza das tarefas com as quais está combinado.” (pág. 376)
Este ponto ficará explícito nas simulações que apresentamos

mais tarde.
Controle atencional. Uma maneira de evitar as interações que

ocorrer na intersecção entre duas vias é modular
a informação que chega por um deles. Este é um dos
funções primárias de atenção dentro desta estrutura e é
consistente com as opiniões sobre a atenção expressas por vários
outros autores (Kahneman & Treisman, 1984; Logan, 1980;
Treisman, 1960). Em nosso sistema, a modulação ocorre alterando
a capacidade de resposta das unidades de processamento em um caminho. Nisso
Dessa forma, a atenção pode ser usada para controlar processos individuais. Como-
sempre, isso não implica necessariamente que a atenção exija um
componente único ou mesmo distinto de processamento. Atenção pode
ser pensado como uma fonte adicional de informações que fornece informações
suporte textual para o processamento de sinais dentro de um determinado
caminho.
Esta estrutura pode ser usada para explicar muitas das questões
fenômenos pirográficos associados à aprendizagem e à automaticidade.
Schneider (1985) usou uma abordagem semelhante para explicar como
o desempenho em uma tarefa de pesquisa de categoria muda em função de
prática. Aqui, nos concentramos na importância que essa abordagem
tem para atenção seletiva, usando a tarefa Stroop como exemplo.
Na próxima seção, descrevemos um modelo de simulação do
Tarefa Stroop baseada nos princípios de processamento discutidos
mais cedo. Apresentamos então uma série de seis simulações para demonstrar
estrato que este modelo é capaz de dar conta de muitos dos aspectos empíricos
fenômenos calóricos associados à automaticidade e por sua gradação
emergência ual em função da prática. Os primeiros quatro simula-
ções são usadas para examinar os atributos de automaticidade
evidenciado na tarefa Stroop (ou seja, velocidade de processamento e
efeitos de interferência). As simulações restantes mostram diretamente
explorar a relação entre processamento e atenção.
O modelo
Nesta seção, descrevemos os mecanismos PDP para processamento

treinamento, prática e controle de atenção que usamos para simular
a tarefa Stroop.
Arquitetura, Processamento e o
Representação de Informação
A arquitetura deste modelo está representada na Figura i. O

O modelo consiste em dois caminhos de processamento - um para processamento
informações de cores, a outra para processar informações de palavras -
ambos convergem para um mecanismo de resposta comum.
Cada caminho consiste em um conjunto de unidades de entrada, um conjunto de intermediários
unidades de consumo e um conjunto de unidades de saída. Cada uma das unidades de entrada
em um
dados projetos de caminhos para todas as unidades intermediárias naquele
caminho. As unidades intermediárias de ambos os caminhos se projetam para
todas as unidades de saída do modelo. Além disso, cada unidade é
associado a um termo de polarização, que é um valor constante que é
adicionado à sua entrada líquida (discutido mais tarde).
O processamento neste sistema é estritamente feed forward. Um estímulo

é fornecido pela ativação de unidades no nível de entrada da rede.
A ativação então se propaga para as unidades intermediárias e gradativamente.
geralmente para as unidades de saída. Uma resposta ocorre quando atividade suficiente
a valorização acumulou-se de uma das unidades de produção para exceder
um limite de resposta. O tempo de reação é assumido como linear
relacionado ao número de ciclos de processamento necessários para este
limite a ser excedido (o mecanismo de resposta é discutido
336 J. COHEN, K. DUNBAR E J. McCLELLAND
RESPOSTA
"haste"
"verde"
Cor
Nomeação
COR DA TINTA
Palavra
Leitura
DEMANDA DE TAREFA
Figura 1. Arquitetura de rede. (As unidades na parte inferior são unidades de entrada e as
unidades
no topo estão as unidades de saída [resposta].)
mais detalhadamente posteriormente). Além das unidades que acabamos de descrever,

existem duas unidades de demanda de tarefa (ou atenção) – uma para a coleta
ou tarefa de nomeação, a outra para a tarefa de leitura de palavras. Estes são
conectado às unidades intermediárias nos dois caminhos de processamento
maneiras e são usados para alocar atenção a um ou outro dos
eles. A ativação de uma determinada unidade de demanda de tarefa sensibiliza
processamento na via correspondente, conforme explicado posteriormente.
Estímulos e respostas individuais têm representações discretas

neste modelo. Cada cor é representada por uma única entrada
unidade no caminho de cores, e cada palavra é representada por um
unidade de entrada única no caminho da palavra. Da mesma forma, cada saída
unidade representa uma resposta potencial. Escolhemos representantes locais
deste tipo para manter o modelo tão simples e interpretável
possível. No entanto, nada impede, em princípio, a
possibilidade de que entradas ou saídas possam ser distribuídas
em muitas unidades, e investigações preliminares indicam que
nossas descobertas usando representações locais são generalizadas para sistemas
usando representações distribuídas.
Mecanismos de Aprendizagem e o
Curso de Tempo de Processamento
O modelo pretende fornecer uma explicação da relação

relação entre a aprendizagem e o curso temporal da psicologia
processos icos envolvidos na tarefa Stroop. Modelos PDP que
abordaram o curso temporal dos processos psicológicos
em grande parte distintos daqueles que abordam a aprendizagem e a memorização.
oi. Por exemplo, McClelland (1979) apresentou uma abordagem multinível
Sistema PDP que forneceu um relato do curso temporal da psicologia

processos psicológicos; no entanto, este sistema não incluía um
algoritmo de aprendizagem. O algoritmo de retropropagação descrito
por Rumelhart, Hinton e Williams (1986) foi apresentado como
um mecanismo geral de aprendizagem que pode ser usado em vários níveis
redes. No entanto, os sistemas PDP que usaram este algoritmo
geralmente não simularam fenômenos temporais, como
tempos de ação. Aqui descrevemos cada um desses mecanismos e
suas limitações com mais detalhes. Em seguida, mostramos como eles podem
ser reunidos para fornecer um sistema único no qual ambos
a dinâmica de aprendizagem e processamento pode ser examinada.
O modelo em cascata de McClelland (1979) fornece um mecanismo

para simular o curso temporal de processos psicológicos. Nisso
sistema, a informação é representada como a ativação de unidades em
uma rede multinível feed-forward. A entrada é apresentada como um padrão
período de ativação sobre unidades no nível mais baixo. Informação
propaga gradualmente para cima, à medida que as unidades em cada nível atualizam seus
ativações na entrada que estão recebendo dos níveis inferiores.
Eventualmente, um padrão de ativação se desenvolve nas unidades no
nível mais alto, onde uma resposta é gerada. Unidades nesta rede
trabalham atualizam suas ativações com base em uma soma ponderada de
a entrada que recebem de unidades no nível anterior no
rede. Especificamente, a entrada líquida no momento ¢ por unidade; (no nível,)
é calculado como
líquido;(f) = 3a; (Rodovia, (1)
onde a;(t) é a ativação de cada unidade; (no nível, _,) do qual

unidade; entrada recebida e wy é o peso (ou força) do

conexão de cada unidade; para unidade;. A ativação de uma unidade é
simplesmente uma média móvel de sua entrada líquida ao longo do tempo:
a(t) = Det(7) = líquido, (1) + (1 — r)líquido;(z — 1), @)
onde líquido?) é a média temporal da entrada líquida para a unidade;, líquido;(t)

é a entrada líquida da unidade; no tempo #, e 7 é uma constante de taxa. Esse
A função de cálculo da média do tempo é o que estabelece o curso do tempo de
processamento neste modelo. Quando 7 é pequeno, a ativação da unidade
mudará lentamente; com um 7 maior, mudará mais rapidamente.
Uma característica da Equação 2 é que se a entrada líquida para uma unidade for
rede fixa, a ativação da unidade se aproximará de um valor assintótico
valor que é igual a esta entrada líquida. Como resultado, McClelland
(1979) demonstraram que com uma entrada constante na primeira camada
em tal rede, todas as unidades se aproximarão de um estado assintótico
valor de ativação. Além disso, este valor é determinado estritamente por
a entrada para a rede e as conexões que existem entre
as unidades. Assim, dado um padrão de entrada específico e suficiente
tempo para se estabelecer, a rede sempre alcançará um estado estável em
qual cada unidade atingiu um valor de ativação característico.
Um problema com o tipo de rede usada na cascata

modelo é que ele é baseado em uma função de ativação linear. Aquilo é,
a ativação de uma unidade é simplesmente uma soma ponderada das entradas
ele recebe. Redes que dependem de regras de atualização linear, como
estes, mesmo que sejam compostos por múltiplas camadas, sofrem
limitações computacionais fundamentais (ver Rumelhart, Hin-
ton, & McClelland, 1986, para uma discussão). Para superar isso
problema, uma rede deve ter pelo menos uma camada de unidades entre
entre as unidades de entrada e saída que fazem uso de um método não linear
relação entre entrada e saída. Outro problema com o
modelo em cascata, especialmente no contexto atual, é que ele
carece de qualquer mecanismo de aprendizagem. Ambos os problemas podem
ser superado se forem incluídos mecanismos que têm sido utilizados em
modelos recentes de aprendizagem do PDP.
O primeiro passo é introduzir a não linearidade no processamento.

Normalmente, isso tem sido feito usando a função logística para
calcular a ativação de uma unidade, com base em seu valor líquido instantâneo
entrada:
1
Trem 2
a(t) = logística[líquido,(1)] =
onde net,(£) é dado pela Equação 1. A função logística introduz
reduz a não linearidade, restringindo a ativação de unidades a serem
entre os valores de 0 e 1 (ver Figura 2). Esta não linearidade
fornece comportamentos importantes, que discutiremos mais tarde (ver At-
seção de seleção intencional). No entanto, tal como está, a Equação 3
não exibe um acúmulo gradual de ativação ao longo do tempo. O
a resposta completa a uma nova entrada ocorre em uma única etapa de processamento
em cada nível, então os efeitos de uma nova entrada são propagados
através da rede em uma única varredura por todos os seus níveis.
As propriedades dinâmicas do modelo em cascata podem ser introduzidas
no entanto, se assumirmos, como fez o modelo em cascata, que o
a entrada líquida para uma unidade é calculada ao longo do tempo antes da ativação
o valor é calculado. Isso nos dá a seguinte regra de ativação:
a() = logísticafnet,(1)], @
onde net,(f) é definido como na Equação 2. A única diferença

entre esta regra de ativação e aquela usada na cascata
modelo é que a entrada líquida média no tempo para uma unidade é passada
através da função logística para chegar à sua ativação. Nós somos
ainda tenho certeza de que o valor de ativação se aproximará de um valor assintomático
bolsa que depende apenas do padrão de entrada e da conexão
pontos fortes na rede. Na verdade, esta assíntota é igual a
a ativação que a unidade assumiria sem o uso de
média de tempo (para ver isso, considere o caso limite em que
7=1).
Várias regras de aprendizagem foram descritas para

redes de nível de tempo usando unidades não lineares. No modelo atual,
usou a regra delta generalizada (também conhecida como backpropaga-
algoritmo de aprendizagem de ção) descrito por Rumelhart, Hinton e
Willians (1986). O aprendizado ocorre ajustando a conexão
pontos fortes para reduzir a diferença entre o padrão de saída
produzido pela rede e aquele desejado em resposta ao
entrada atual. Esta diferença é essencialmente uma medida da
erro no desempenho da rede. A redução de erros ocorre
percorrendo repetidamente as seguintes etapas: (a) apresentar
um padrão de entrada a ser aprendido, (b) permitindo que a rede gere
calcular seu padrão de saída assintótico, (c) calcular a diferença
diferença entre este padrão de saída e o desejado, (d) propa-
transmitir informações derivadas dessa diferença de volta a todos
as unidades intermediárias na rede, e (e) permitir que cada
unidade para ajustar suas forças de conexão com base neste erro
Informação. Ao aplicar repetidamente esta sequência de passos para
cada membro de um conjunto de padrões de entrada, a rede pode ser
treinado para aproximar o padrão de saída desejado para cada
entrada.
A não linearidade da regra de atualização de ativação discutida anteriormente

lier é compatível com o algoritmo de retropropagação, que
requer apenas que a função de ativação seja monotônica e
contínuo (ou seja, diferenciável). A função logística satisfaz
esta restrição. Além disso, enquanto as unidades puderem
atingir seus valores de ativação assintótica antes da informação de erro
ção é calculada no nível de saída, então o aprendizado neste sistema
não é diferente de sistemas que não incluem uma média de tempo
componente de entrada.
Variabilidade e o mecanismo de seleção de respostas

Variabilidade de processamento
Mesmo quando os sujeitos humanos parecem ter dominado uma tarefa,

eles ainda exibem variabilidade em suas respostas. Isto pode ser visto,
por exemplo, na distribuição dos tempos de reação para um determinado
tarefa, capturar essa variabilidade e ser capaz de modelar o
variabilidade dos dados de tempo de reação, introduzimos aleatoriedade em
o modelo adicionando ruído normalmente distribuído à entrada líquida
de cada unidade (exceto as unidades de entrada).
Mecanismo de Resposta
Além da variabilidade no processo de ativação, o

O modelo também incorpora variabilidade no mecanismo de resposta.
Uma maneira bem-sucedida de modelar a variabilidade da resposta tem sido
assumir que a escolha de uma resposta é baseada em uma escolha aleatória
caminhada (Link, 1975) ou um processo de difusão (Ratcliff, 1978). Na nossa
adaptação dessas ideias, associamos cada resposta possível
com um acumulador de evidências que recebe informações do exterior
338 J. COHEN, K. DUNBAR E J. MCCLELLAND
coloque unidades da rede. No início de cada tentativa, todos

os acumuladores de evidências são definidos como 0. Em cada intervalo de tempo de
processamento, cada acumulador de evidências adiciona uma pequena quantidade de
evidência ao seu total acumulado. O valor adicionado é aleatório
e normalmente distribuído, com média x baseada na saída de
da rede, e com desvio padrão fixo ¢. O significativo
é proporcional à diferença entre a ativação do
unidade correspondente e a ativação da alternância mais ativa
ativo:
#; = editar; — max_actys,), (&)]
onde a determina a taxa de acumulação de evidências. São-

A resposta é gerada quando um dos acumuladores atinge um
limite fixo. Ao longo de todas as nossas simulações, o valor de
a era 0,1, o valor de « era 0,1 e o valor do limite
foi 1,0.
Este mecanismo de seleção de respostas pode parecer diferente do

o resto da rede. Por exemplo, as evidências são acumuladas
aditivamente no mecanismo de seleção de resposta, enquanto run-
médias de dados são usadas em outras partes da rede. Adicionalmente,
o mecanismo de seleção de resposta é linear, enquanto o resto
a rede é não linear e depende dessa não linearidade. Na verdade, nós
pode facilmente mostrar que o processo de difusão aditiva pode ser mimetizado
com médias lineares, assumindo que o resultado
O critério de resposta fica menor à medida que o processamento prossegue dentro de um teste.
O impacto da introdução da não linearidade na evidência
emulador é menos óbvio. No entanto, não precisa exercer um forte dis-
efeito ilícito, desde que o limite esteja dentro do meio linear
parte da função de acumulação.
Seleção Atenção
O papel da atenção no modelo é selecionar um dos dois componentes

processos de petição com base nas instruções de tarefa. Por esta
para ocorrer, uma das duas especificações de demanda de tarefa deve ser pro-
fornecidos como entrada para o modelo: “responder à cor” ou “responder à
palavra." Assumimos que esta informação está disponível como resultado
colocado de algum outro módulo e resulta da codificação e
interpretar as instruções da tarefa. Claramente, este é um método altamente flexível
processo flexível e pode se adaptar à ampla variedade de informações
tarefas de processamento que os humanos podem realizar. Nosso foco neste
artigo, no entanto, não é sobre como ocorre a interpretação da tarefa ou sobre
como as decisões relativas à alocação de atenção são tomadas.
Em vez disso, estamos preocupados em como as informações sobre a tarefa
e a correspondente alocação de atenção influencia os processos
acesso aos caminhos diretamente envolvidos na execução da tarefa
em si. Ao focar nas influências que a atenção tem sobre os processos
processando e especificando os mecanismos pelos quais isso ocorre, nós
espero mostrar como a atenção interage com a força do processamento
para determinar o padrão de efeitos que são observados no
Tarefa Stroop.
As informações da tarefa são representadas no modelo da mesma maneira

como qualquer outra informação: como um padrão de ativação em um conjunto
de unidades de processamento. Para este efeito, duas unidades adicionais são
incluído na rede: aquele que representa a intenção de
nomear cores, outro para ler palavras. Uma tarefa específica é
especificado ativando uma dessas unidades de demanda de tarefa. Tarefa de-
unidades de comando modulam o processamento ajustando os níveis de repouso
de unidades nos dois caminhos principais, colocando tarefas apropriadas
1,0
fe]
0,6
a4
Ativação
0,2
Entrada Líquida
Figura 2. A função de ativação logística. (Observe que a inclinação deste

função é maior quando a entrada líquida é 0,0 e diminui quando a
a entrada líquida é grande tanto na direção positiva quanto na negativa.)
unidades no meio de sua faixa dinâmica e aquelas para inap-

unidades apropriadas perto da parte inferior, onde estarão relativamente
insensível. Não sabemos se a atenção é principalmente ex-
citatório (sensibilizando unidades apropriadas à tarefa), inibitório (desenvolvendo
sitiar unidades inadequadas) ou (como suspeitamos) alguns de ambos.
Em qualquer caso, assumimos que as forças de ligação do
unidades de demanda de tarefa para unidades intermediárias em cada caminho são
tal que quando a unidade para uma tarefa específica está ativa, ela define o
nível de repouso de unidades no caminho apropriado para o meio
do seu alcance, enquanto as unidades no caminho inadequado as-
assumir um valor mais negativo. A influência moduladora que
essas mudanças no nível de repouso têm no processamento é devido ao
não linearidade da função de ativação logística. Para mostrar como
isso ocorrer, examinaremos essa função com mais detalhes.
Conforme descrito pela Equação 4, a ativação de uma unidade é determinada

extraído pela logística de seu insumo líquido. A função logística tem
aproximadamente três regiões (Figura 2). Na região intermediária, quando
a entrada líquida é próxima de 0, a relação entre a entrada líquida e
a ativação é mais ou menos linear, com uma inclinação de aproximadamente
1. Nesta região, a ativação de uma unidade responde muito bem a
mudanças em sua entrada líquida, ou seja, mudanças na entrada líquida irão
levar a mudanças significativas na ativação da unidade. Em contraste,
em cada extremidade da função logística, a inclinação é dramaticamente
reduzido. Nessas regiões – quando a magnitude do insumo líquido
é grande, seja na direção positiva ou negativa – mudanças na
a entrada para uma unidade tem um pequeno efeito em sua ativação. Esse
recurso foi um fator importante em nossa escolha de um método não linear
função de ativação, permitindo que a capacidade de resposta das unidades seja
modulados ajustando seus níveis básicos de ativação. Este anúncio-
O ajuste é realizado pela ativação da demanda de tarefa
unidades.
Em princípio, presume-se que as unidades de demanda de tarefa tenham conexões

ções para as unidades intermediárias em cada caminho, de modo que as ações
a vação de uma unidade de demanda de tarefa impulsiona a entrada líquida restante de unidades
no caminho apropriado em direção a zero, e unidades em concorrentes
caminhos em direção a valores mais negativos. Conduzindo a entrada líquida
de unidades apropriadas para a tarefa em direção a zero as coloca na posição mais
região responsiva de sua faixa dinâmica, enquanto torna o
a entrada líquida de unidades inadequadas para a tarefa os coloca mais negativos
tabela 1
Estímulos de treinamento
Demanda de tarefa Entrada de cor Entrada de palavra Saída

Cor vermelha —_— “vermelho”
Cor verde – “verde”
Palavra - VERMELHO “vermelho”
Palavra —_ VERDE “verde”
Observação. Traços indicam que não houve entrada.
em uma região mais plana da função de ativação. No atual

modelo, implementamos uma versão mais simples deste modelo geral
esquema, todas as unidades intermediárias foram assumidas como tendo um valor negativo
preconceito, de modo que eles eram relativamente insensíveis em repouso. Demanda de tarefa
unidades forneceram uma quantidade de ativação para unidades intermediárias em
o caminho correspondente que compensa esse viés negativo, levando
sua entrada líquida para zero. Assim, as unidades de demanda de tarefa tiveram o efeito
de unidades sensibilizantes na via correspondente e unidades em
o caminho inadequado permaneceu em um ambiente relativamente insensível
estado.
Finalmente, notamos que as conexões entre cada tarefa de-

unidade de comando e todas as unidades intermediárias dentro de um determinado caminho-
são considerados uniformes em força, de modo que a ativação

de uma unidade de demanda de tarefa não fornece, por si só, qualquer informação
para um determinado caminho. Seu efeito é estritamente modulatório.
Simulações
Implementamos os mecanismos descritos no item anterior

seção em um modelo específico da tarefa Stroop. Na sequência
seções, descrevemos como o modelo foi usado para simular humanos
desempenho do homem nesta tarefa. Começamos descrevendo alguns
os métodos gerais utilizados nas simulações. Descrevemos então
quatro simulações que fornecem um relato explícito dos atributos
butes de automaticidade e como eles se relacionam com a prática. Estes são
seguido por duas simulações que abordam questões relativas ao
relação entre atenção e automaticidade.
Métodos de Simulação
Todas as simulações envolveram duas fases, uma fase de treinamento e uma fase de teste.
Fase de Treinamento
A rede foi treinada para produzir a resposta correta quando informações

A informação foi apresentada em cada uma das duas vias de processamento. Treinamento
padrões eram compostos de uma especificação de tarefa e entrada para o
RESPOSTA
"vermelho"
"verde"
COR DA TINTA Cor
Nomeação
Palavra
Leitura
DEMANDA DE TAREFA
Figura 3. Diagrama da rede mostrando as forças de conexão após o treinamento de leitura de

palavras e
tarefas de nomeação de cores. (As resistências são mostradas ao lado das conexões; as
tendências nas unidades intermediárias são mostradas
dentro das unidades. Os pontos fortes de atenção – desde unidades de demanda de tarefa até
unidades intermediárias – foram fixos, assim como
vieses para as unidades intermediárias. Os valores foram escolhidos para que quando a unidade
de demanda da tarefa estivesse ligada, o
a entrada base para unidades no caminho correspondente foi 0,0, enquanto a entrada base para
unidades no outro caminho
caminho estava na faixa de -4,0 a -4,9, dependendo do experimento.)
via correspondente (ver Tabela 1). Por exemplo, um padrão de entrada foi
“red—color-NULL”, que ativou a unidade de entrada vermelha no caminho de cores
maneira e a unidade de demanda de tarefa “responder à cor”, mas não ativou
quaisquer unidades de entrada de palavras. A rede foi treinada para ativar o sinal vermelho
coloque a unidade como sua resposta a esse estímulo. Conflito e estímulos congruentes
foram omitidos do conjunto de treinamento, refletindo a suposição de que, em
experiência comum, os sujeitos raramente encontram esses tipos de estímulos.
No início do treinamento, os pontos fortes de conexão entre os intermediá-

as unidades de consumo e de saída eram valores pequenos e aleatórios. As conexões são
entre unidades de entrada e unidades intermediárias foram atribuídos valores moderados
(+2 e -2) que geraram uma representação distinta de cada entrada em
o nível intermediário. Este conjunto de pontos fortes reflete a suposição de que,
no início de sua experiência, os sujeitos são capazes de codificar sensações com sucesso
informações sociais (por exemplo, cores e formas de palavras) em um nível intermediário
de representação, mas são incapazes de mapeá-los em termos verbais apropriados.
respostas. Essa habilidade só vem com treinamento. Este estado inicial de
a rede também nos permitiu capturar a lei de potência associada a
treinamento, que discutiremos mais tarde (ver Simulação 3).
A influência da atenção foi implementada da maneira mais simples possível

possível. Parâmetros de polarização para unidades intermediárias e intensidades de conexão
das unidades de demanda de tarefa foram escolhidas para que quando uma tarefa específica
unidade de demanda estava ativada, as unidades intermediárias na via atendida
tinham uma entrada líquida básica de 0,0 e, portanto, respondiam ao máximo à entrada
(veja a discussão anterior).* As unidades no caminho não supervisionado tiveram um
ativação de base inferior. O valor da ativação básica das unidades no
caminho autônomo (determinado por seu viés negativo) refletiu o
eficácia da filtragem em uma determinada tarefa e pode variar de
experimento para experimentar (ver texto posterior).
Em cada tentativa de treinamento um padrão de entrada foi apresentado à rede

e foi permitido que todas as unidades atingissem seus valores assintóticos.'
Os termos de diferença foram então calculados comparando a ativação real
ção com o valor de ativação desejado para cada unidade de saída. Estas diferenças
termos de referência foram tratados como sinais de erro que foram então usados para calcular
mudanças nas forças de conexão após a retropropagação
procedimento de aprendizagem (Rumethart, Hinton, & Williams, 1986).5 Todos os
conexões ao longo dos caminhos de processamento de palavras e cores foram modificadas
fiáveis, e seus valores foram definidos pelo procedimento de aprendizagem que acabamos de
descrever.
No entanto, as conexões das unidades de demanda de tarefas com os intermediários
comeu unidades em cada caminho e os termos de polarização que estabeleceram o repouso
as ativações dessas unidades foram consideradas inalteráveis. Treinamento
prosseguiu até que a rede fosse capaz de processar corretamente todos os
os estímulos de teste (veja a seção Fase de Teste).
Um dos objetivos do modelo é explicar a relação entre

efeitos práticos e automaticidade. No contexto da tarefa Stroop,
investigadores propuseram que a leitura de palavras é mais praticada
do que a nomenclatura de cores (Brown, 1915; MacLeod & Dunbar, 1988; Posner &
Snyder, 1975). Para modelar essa diferença na prática, demos à rede
quantidades diferenciadas de treinamento na palavra e nos padrões de cores. Todo
padrão de palavras foi apresentado em todas as épocas, enquanto a probabilidade de um
o padrão de cores apresentado em uma determinada época era de 0,1. Assim, em média,
padrões de palavras foram vistos 10 vezes mais frequentemente que padrões de cores, e em
qualquer
determinado ponto durante o treinamento, a rede recebeu uma quantidade maior
de prática com leitura de palavras do que com nomeação de cores,'
A Figura 3 mostra os pontos fortes de todas as conexões da rede

no final do treinamento. Como esperado, eles foram mais fortes na palavra path-
maneira do que no caminho da cor, devido à maior frequência de palavras
treinamento.
Fase de Teste
A rede foi testada nos [2 padrões de entrada correspondentes a alt

possíveis estímulos em uma tarefa Stroop em que existem dois possíveis
respostas (por exemplo, “vermelho” e “verde”). Esses padrões representavam o
estímulo de controle, o estímulo congruente e o estímulo de conflito para cada
das duas entradas (vermelho ou verde) em cada uma das duas tarefas (leitura de palavras
e nomenclatura de cores; ver Tabela 2). Apresentação de um padrão específico
consistiu em ativar a unidade ou unidades de entrada apropriadas e a tarefa de-
unidade de mando. Por exemplo, um dos estímulos de conflito na nomeação de cores
tarefa (a palavra VERDE em tinta vermelha) foi apresentada ativando o vermelho
unidade de entrada de cores, a unidade de demanda de tarefa “atender à cor” e o VERDE
unidade de entrada de palavras.
Cada tentativa de teste começou ativando a unidade de demanda de tarefa apropriada

e permitindo que a ativação de todas as unidades atinja a assíntota. Isso colocou o
rede em um estado pronto correspondente à tarefa apropriada. Neste
ponto, as unidades intermediárias no caminho selecionado e todos os out-
as unidades put tiveram níveis de ativação em repouso de 0,5, enquanto as unidades
intermediárias
unidades na via concorrente eram relativamente inativas (ativações de
aproximadamente 0,01). O padrão de teste foi então apresentado e o sistema
O sistema foi autorizado a circular até que a ativação acumulada de um dos
as unidades de saída excederam o limite de resposta. Um valor de 1,0 foi
usado para o limite de resposta em todas as simulações. O número de ciclos
necessário para exceder esse limite foi registrado como o tempo de reação para
essa entrada. O sistema foi então reiniciado e o próximo teste começou. Dados
os valores relatados posteriormente representam o valor médio de 100 tentativas executadas
para cada
doença. Uma amostra representativa das distribuições de tempo de reação
obtido desta forma é mostrado na Figura 4. Isso mostra a distribuição distorcida
mas típica de dados humanos e modelos padrão de passeio aleatório (por exemplo
Ratcliff, 1978).
Para simplificar a comparação entre os tempos de reação empíricos e o

desempenho do modelo, relatamos os tempos de reação da simulação como trans-
valores formados. Para cada simulação, realizamos uma regressão linear
dos dados de simulação sobre os dados empíricos. Os dados de simulação são re-
portado como o número de ciclos transformados por esta equação de regressão.®
* Este artigo não aborda a questão geral de saber se o con-

os pontos fortes das conexões das unidades de demanda de tarefa para as unidades
intermediárias são
aprendido. Nas simulações que relatamos, os pontos fortes dessas conexões
foram corrigidos. Em outras simulações, descobrimos que podem ser aprendidas;
no entanto, as implicações disto precisam ser exploradas mais detalhadamente.
3 O processamento foi determinístico durante o treinamento; isto é, as unidades não eram

sujeito a ruído. Simulações individuais usando ruído durante o treinamento indi-
observou que isso não alterou significativamente os resultados, e a eliminação
de ruído nesta fase reduziu substancialmente a duração e o número de
simulações necessárias para chegar a um conjunto normativo de resultados,
® As forças de conexão foram atualizadas após cada varredura no conjunto

de padrões de treinamento, a taxa de aprendizagem foi de 0,1 e o impulso foi de 0,0.
7 Nós nos concentramos na frequência do treinamento como a principal diferença entre

leitura de palavras e nomeação de cores porque esta tem sido a ênfase em
a literatura. No entanto, outras diferenças entre essas tarefas também podem
ser importante. Por exemplo, parece provável que a leitura de palavras também seja uma
tarefa mapeada de forma mais consistente do que a nomeação de cores: uma
A frequência das letras está quase invariavelmente associada à palavra que representam.
ressentir-se (mesmo que a própria palavra tenha um significado ambíguo); no entanto, col-
ors são frequentemente associados a outras palavras além do nome (por exemplo, vermelho é
associado a calor, constrangimento e “stop™). Embora este ponto
não foi enfatizado no que diz respeito à tarefa Stroop, é uma tarefa bem
constatação estabelecida de que o mapeamento consistente leva ao desenvolvimento de
automaticidade, enquanto o mapeamento de variáveis a impede (por exemplo, Logan, 1979;
Shiffrin & Schneider, 1977). Nosso modelo captura este fato: quanto mais
consistentemente um estímulo está relacionado a uma resposta específica, mais forte
serão as conexões para processar esse estímulo. Embora nos concentremos
na frequência (ou seja, quantidade de prática) como um determinante do caminho
força, tenha em mente que a consistência da prática é um fator igualmente importante
variável importante que pode ser um fator significativo subjacente ao Stroop
efeito.
% Em todos os casos, o intercepto da equação de regressão foi positivo,

refletindo componentes de processamento (por exemplo, processamento visual inicial e
execução de resposta) não simulado pelo modelo. O valor de interceptação
para todas as simulações ficou na faixa de 200-500 ms.
mesa 2
Estímulos de teste
Tipo de estímulo Entrada de cor Entrada de palavra
Demanda de tarefa: cor
Nomenclatura de cores
Especificação da tarefa — —
Controle vermelho —
Conflito vermelho VERDE
Vermelho congruente VERMELHO
Demanda de tarefa: palavra
'Leitura de palavras
Especificação da tarefa —_ —
Controle - VERMELHO
Conflito verde VERMELHO
Vermelho congruente VERMELHO
Observação. Somente aqueles estímulos para os quais “vermelho” foi a resposta correta são
mostrando. A rede também foi testada com os estímulos correspondentes para
qual “verde” era a resposta correta. Traços indicam que não houve
entrada.
As equações de regressão são fornecidas nas figuras que acompanham cada

simulação.
Parâmetros Gratuitos
Realizamos um grande número de experimentos de simulação, variando

diferentes parâmetros do modelo e examinando como eles afetaram o
capacidade do modelo de explicar a forma básica do fenômeno empírico
ena. No Apêndice, descrevemos os valores dos parâmetros usados no re-
simulações portadas, bem como diversas compensações e interações entre
parâmetros que encontramos. Em geral, nos esforçamos para usar um conjunto de
parâmetros para todas as simulações. No entanto, ao comparar os resultados de
diferentes estudos empíricos, descobrimos que experiências nominalmente idênticas
condições mentais às vezes produzem interferências bastante diferentes e
efeitos de facilitação. Em particular, em experimentos onde os sujeitos tiveram que
dizer a cor da tinta em que as palavras foram realmente escritas, interferindo
os efeitos da experiência eram às vezes duas vezes maiores do que nos experimentos
onde as informações de cores e palavras ocorreram em locais fisicamente diferentes
ções. Esta diferença provavelmente refletiu diferenças na capacidade dos sujeitos
para modular seletivamente o processamento de tarefas relevantes e irrelevantes
Informação. Para capturar isso, permitimos que a força da atenção
efeito a ser ajustado separadamente para cada simulação. Isto foi feito por
variar o nível de ativação de repouso das unidades no canal não assistido,
colocando-os assim em um estado mais ou menos responsivo.
Força do Processamento
Simulação 1: O Efeito Stroop Básico
_O objetivo da primeira simulação foi fornecer uma conta

para o conjunto de descobertas empíricas que compõem o Stroop básico
efeito. Eles são exibidos na Figura 54 e são descritos
abaixo.
A leitura de palavras é mais rápida do que a nomeação de cores. A hora de ler
uma palavra colorida é de aproximadamente 350-450 ms, enquanto o tempo para
nomear uma mancha colorida ou uma linha de Xs coloridos é 550-650 ms. Por isso,
a leitura de palavras é aproximadamente 200 ms mais rápida que a nomeação de cores
(cf. Cattell, 1886; Dyer, 1973; MO Glaser & Glaser, 1982).
A leitura de palavras não é afetada pela cor da tinta. A cor da tinta tem virtualmente
aliado nenhum efeito na quantidade de tempo necessária para ler a palavra.

Ou seja, tempos de reação para ler a palavra no conflito e con-
condições gruentes são as mesmas que na condição de controle. Esse
fenômeno foi originalmente descoberto por Stroop (1935) e
pode ser visto na forma plana do gráfico para leitura de palavras em
Figura 54. Esta descoberta é extremamente robusta e muito difícil
perturbar. Mesmo quando a cor da tinta aparece antes da palavra, ela
não interfere na leitura de palavras (MO Glaser & Glaser,
1982). Somente quando a tarefa for alterada radicalmente a cor da tinta
interferir na leitura de palavras (Dunbar & MacLeod, 1984; Gu-
menik & Glass, 1970).
As palavras podem influenciar a nomenclatura das cores. Uma palavra conflitante pro-
produz um aumento substancial no tempo de reação para nomear a tinta
cor em relação à condição de controle. A quantidade de interferência
A frequência é variável, mas geralmente é de aproximadamente 100 ms (por exemplo, Dun-
bar & MacLeod, 1984; MO Glaser & Glaser, 1982; Kahneman
& Chajczyk, 1983). Esta descoberta também é extremamente robusta e
quase todos os assuntos mostram o efeito. Mesmo quando a palavra e o
a cor da tinta é apresentada em diferentes localizações espaciais (por exemplo, o
palavra é colocada acima de uma mancha colorida), a palavra ainda interfere
com a nomeação da cor da tinta (Gatti & Egeth, 1978; Kahneman &
Henik, 1981). Na condição congruente, a palavra facilita
nomeação de tinta, produzindo uma diminuição no tempo de reação em relação a
a condição de controle (Hintzman et al., 1972). A quantidade de
a facilitação pode variar de aproximadamente 20 ms (Regan, 1978)
para aproximadamente 50 ms (Kahneman & Chajczyk, 1983).
Há menos facilitação do que interferência. Estímulos congruentes
não têm sido usados tão extensivamente como estímulos de conflito, mas o
A conclusão geral é que a quantidade de facilitação obtida é
muito menos do que a quantidade de interferência (Dunbar & Mac-
Leodo, 1984).
A Figura 54 mostra as descobertas em um experimento Stroop padrão

(Dunbar e MacLeod, 1984). A Figura 5B apresenta os resultados de
nossa simulação, que reproduz todos os efeitos empíricos.
Eles são explicados a seguir.
A leitura de palavras foi mais rápida do que a nomeação de cores na simulação

porque quantidades diferenciadas de treinamento levaram ao desenvolvimento
20
Número de testes
610 624 638 651 665 678 692 705 719 733
Tempo de reação
(ms = 12 * ciclos + 206)
Figura 4. Distribuição dos tempos de reação para 100 tentativas de cores

nomeação (condição de controle) da Simulação 1.
Dados empíricos
850A
H 750 1
g
= 8509
§
5501
2 -—
450
Conflito Congruente
Doença
Controle
Dados de simulação
g 850 B
2 2 7504
£5
ga sol
3 [1
['4
é de
E-—_
450 TTT
Controle de conflito congruente
Doença
[J Nomenclatura de cores
@ Leitura de palavras
Figura 5. Dados de desempenho para a tarefa Stroop padrão. (4: Dados de um estudo empírico
[após Dunbar
& MacLeod, 1984, pág. 62]. B: Resultados da simulação do modelo destes dados.)
de um caminho mais forte para o processamento de informações de palavras

do que informações de cor. O fato de a rede ter sido treinada
mais extensivamente com estímulos de palavras do que com cores significava que
unidades na palavra caminho tiveram um maior número de tentativas em
para aumentar suas forças de conexão (veja a Figura 3).
Conexões mais fortes resultaram em mudanças maiores no insumo líquido,
e, portanto, à ativação de unidades de palavras em cada processamento
ciclo (ver Equações 1 e 2). Isso permitiu a ativação para
mular no nível de saída mais rapidamente no caminho da palavra
do que no caminho de nomenclatura de cores. Quanto mais rápido for o re-
unidade de resposta acumula ativação (e unidades concorrentes
será inibido), mais rápido o limite de resposta será excedido.
cedeu. Assim, a força de um caminho determina sua velocidade de
em processamento.
A diferença na força dos dois caminhos também ex-

esclarece a diferença nos efeitos de interferência entre os dois
tarefas. Primeiro, considere a falha da informação de cor em afetar
a tarefa de leitura de palavras. Aqui, ativação da unidade de demanda de tarefa
coloca unidades intermediárias no caminho da leitura de palavras em uma re-
estado responsivo, para que a informação flua efetivamente ao longo deste
caminho. Em contrapartida, porque nenhuma atenção é dada ao
caminho da cor, as unidades neste caminho permanecem sem resposta
estado e acumulação de informações no nível inter-
unidades intermediárias é severamente atenuada. Além disso, porque o
conexões de unidades intermediárias para unidades de saída são mais fracas em
o caminho da cor, informação que se acumula em intermediários
unidades comestíveis são transmitidas ao nível de saída de forma mais fraca do que
informações fluindo ao longo do caminho da palavra. Ambas estas facções
diminuem o impacto das informações de cores na rede
resposta a uma palavra. Como tal, o tempo de reação na leitura de palavras
tarefa é apenas ligeiramente afetada pela presença de congruentes
ou entrada de cores conflitantes.
Resultados diferentes ocorrem quando a tarefa é nomear cores. Às dez-

ção é alocada para esta via, de modo que as unidades intermediárias
são colocados em uma parte responsiva de sua faixa dinâmica e
fluxos de formação não atenuados para o nível de saída. Agora é o
unidades no caminho da palavra que são relativamente indiferentes.
No entanto, devido às conexões mais fortes na palavra path-
Dessa forma, mais ativação pode ocorrer no nível da unidade intermediária.
A quantidade desse acúmulo é maior do que era para a cor
unidades na tarefa de leitura de palavras.' Além disso, as conexões
das unidades intermediárias para unidades de saída neste caminho são
também mais forte do que no caminho da cor, então as informações que
acumulado nas unidades intermediárias tem uma influência maior em
o nível de saída. Assim, algumas informações fluem ao longo da palavra
caminho mesmo na ausência de alocação de atenção. Al-
embora esse fluxo de informações seja apenas parcial e não seja suficiente
suficiente para determinar qual resposta é dada, é suficiente afetar
a velocidade com que uma resposta é dada, produzindo assim inter-
referência e facilitação na tarefa de nomeação de cores. Este processo-
inserção de informações no caminho da palavra sem a alocação
de atenção captura a involuntária leitura de palavras e
leva em conta os efeitos de interferência e facilitação que são ob-
servido. Todos estes efeitos são atribuíveis ao facto de a
caminho de leitura de palavras é mais forte (ou seja, tem conexões mais fortes
ções) do que o caminho de nomenclatura de cores.
A quarta conclusão é que a quantidade de interferência é determinada

consistentemente maior do que a quantidade de facilitação. No modelo,
há dois fatores que contribuem para esse resultado. Um é o
não linearidade da função de ativação. Isto impõe um teto
na ativação da unidade de resposta correta, o que leva a um
Como exemplo, considere o caso em que a unidade de entrada de palavras RED

está ativado. Isto tem uma conexão excitatória com o intermediário mais à esquerda.
unidade diata na palavra caminho, com força de 2,63. Na falta de
de entrada da unidade de demanda de tarefa (e ignorando os efeitos do ruído),
esta unidade intermediária recebe uma entrada líquida de 2,63 + (—4;,,,) = —1,37.
Depois de passar pela função de ativação logística, chegamos a
uma ativação assintótica de 0,2 para esta unidade. Este é o valor que contribui
conectado à entrada líquida da unidade de saída “vermelha”. Agora considere a situação
para o caminho de nomenclatura de cores. Aí, a força da conexão
da unidade de entrada vermelha para a unidade intermediária correspondente é apenas
2.20. Na ausência de ativação por demanda de tarefa, a unidade intermediária
terá uma entrada líquida de 2,20 + (—d4,,,) = —1,8, que quando passada
através da função logística, resulta em uma ativação de 0,14. Assim, em
a ausência de atenção, a ativação de uma unidade de cor intermediária é menor
do que a de uma unidade de caminho de palavra correspondente.
CONTROLE DE PROCESSOS AUTOMÁTICOS
343
>
:
:
|.
Fs
Ativação
becca ccme—
eu
Entrada Líquida
Ciclos
Figura 6. Mecanismos subjacentes à assimetria entre efeitos de interferência e facilitação. (4:

Efeitos
de quantidades iguais de excitação [E] e inibição [I] de uma via concorrente na ativação
assintótica
de uma unidade de saída. B: Os efeitos desses diferentes níveis assintóticos de ativação no
tempo para atingir um
determinado nível de ativação. F = facilitação; I = interferência.)
assimetria entre os efeitos da excitação que recebe de

o caminho irrelevante na condição congruente e o inibidor
bição que recebe na condição de conflito. Para ver isso mais
claramente, considere a situação idealizada representada na Figura 64.
Nesta figura, a função de ativação para a resposta correta
unidade é mostrada. Sua ativação assintótica é plotada para cada um dos
as três condições experimentais em um teste de nomeação de cores. Observação
que a ativação é maior na condição congruente e menor
na condição de conflito. Isso ocorre porque na congruência
condição, a via irrelevante contribui com entrada excitatória
para a unidade de resposta, aumentando sua entrada líquida, enquanto na
condição de conflito, contribui para a inibição, diminuindo a re-
entrada líquida da unidade de resposta. Note-se que embora o aumento do valor líquido
entrada na condição congruente é igual em magnitude à
diminuição da condição de conflito, o efeito na ativação de
a unidade de resposta não é simétrica: a inibição tem maior
efeito do que a excitação. Essa diferença ocorre porque o
unidade está em uma região não linear da função de ativação logística.
Nesta região, o aumento do insumo líquido tem menos efeito sobre
ativação do que diminuí-la.'®
A Figura 64 mostra os valores de ativação assintótica para o re-

unidade resposta em cada uma das três condições. A Figura 68 é um gráfico
do aumento na ativação da unidade de resposta, ao longo do tempo, em direção a cada
desses valores assintóticos. Observe que em qualquer ponto a diferença
na ativação entre as condições de controle e conflito é
maior que a diferença entre o controle e o congruente
condições. Portanto, ao longo do processamento,
A inibição tem uma influência maior do que a excitação no acúmulo
produção. Assim, a não-linearidade de
a função logística e sua interação com a dinâmica de
processamento ajuda a produzir a assimetria entre o tamanho do
efeitos de interferência e facilitação observados na simulação.
Um segundo fator também contribui para a assimetria no

magnitudes de interferência e facilitação. Este é o basicamente
forma de aceleração negativa da curva relativa à ativação
ciclos de processamento. Esta curva de aceleração negativa é uma
propriedade inerente do mecanismo em cascata (média temporal de
insumos líquidos) e tenderia a causar uma ligeira assimetria no
efeitos de interferência e facilitação, mesmo que interferência e fa-
cilitação teve efeitos exatamente iguais e opostos na assintótica
ativação. No entanto, este é um efeito relativamente fraco e não é
suficiente por si só para explicar a proporção superior a 2:1

de interferência na facilitação que normalmente é observada.
Nem a função logística nem o mecanismo em cascata foram

incluído no modelo especificamente para produzir uma assimetria
entre interferência e facilitação. A função logística foi
incluído para introduzir não linearidade no processamento para o propósito
pose de generalidade computacional (ver Mecanismos de Aprendizagem
e a seção Time Course of Processing, apresentada anteriormente)
e permitir que a atenção module a capacidade de resposta das unidades
nas vias de processamento. O mecanismo em cascata foi introduzido
produzido para modelar a dinâmica do processamento. O fato de que estes
mecanismos levaram a uma assimetria entre interferência e fa-
a cilitação é um subproduto dessas motivações computacionais
características do modelo.
A maioria das teorias não foi capaz de explicar esta assimetria.

tente em termos de um único mecanismo de processamento. Na verdade, vários
autores argumentaram que mecanismos de processamento separados são
responsável pelos efeitos de interferência e facilitação (por exemplo, MO
Glaser & Glaser, 1982; MacLeod e Dunbar, 1988). Embora
esta continua a ser uma possibilidade lógica, o nosso modelo demonstra que
Este não é necessariamente o caso. Acreditamos que o fracasso
teorias anteriores para explicar esta assimetria em termos de um
único mecanismo tem sido devido à sua confiança, seja explicitamente
direta ou implicitamente, em mecanismos de processamento linear.
Simulação 2: Efeitos SOA – Velocidade de Processamento e

Força do caminho
Os resultados da simulação anterior demonstram que o

a força de um caminho determina a velocidade de processamento e
'* A razão pela qual as ativações de saída caem nesta região tem a ver com
a natureza da função de ativação e treinamento neste sistema. Cedo
no treinamento, as conexões com uma unidade de saída são pequenas, de modo que o valor
líquido
entrada que recebe, independentemente do padrão de entrada apresentado, está próximo
0,0, e sua ativação é de aproximadamente 0,5. Se a resposta correta a uma
determinado padrão de entrada requer que a unidade de saída tenha uma ativação
valor de 1,0, então o aprendizado ajustará progressivamente suas conexões para
que sua ativação muda de 0,5 para um valor mais próximo de 1,0 quando essa entrada
padrão está presente. A região entre 0,5 e 1,0 (para unidades que devem
tem uma saída de 1,0) é precisamente a região da função logística que
344
Dados empíricos
J. COHEN, K. DUNBAR E J. MCCLELLAND
800
Z? °
E 7004 £2. 7007
0
g Fy
F600 58 então
cz%
8, 8:
°2
3 então E = 500
[+4
400 TT —r T 400 IE 2 + r T
-400 -200 0 200 400 -400 -200 ° 200 400
SOA SOA
Leitura de palavras com nomenclatura de cores
0 Conflito B® Conflito
© Controle ® Controle
4 Congruente A Congruente
Figura 7. Efeitos da variação da assincronia de início de estímulo (SOA) entre estímulos de

palavra e cor na cor
tarefas de nomeação e leitura de palavras. (4: Dados de um estudo empírico [após MO Glaser &
Glaser, 1982]. B:
Resultados da simulação do modelo destes efeitos. Observação. Os dados no painel 4 são de
“Análise do Curso de Tempo
do Fenômeno Stroop” por MO Glaser e WR Glaser, 1982, Journal of Experimental Psychology:
Percepção e Desempenho Humano, 8, p. 880. Copyright 1982 da American Psychological
Association.)
se um processo irá influenciar (interferir ou facilitar)

outro. Nesta simulação, demonstramos que o caminho
força, e não apenas a velocidade de processamento, é responsável pela
efeitos de interferência e facilitação.
A conta de velocidade de processamento do efeito Stroop assume
que o tempo de finalização mais rápido do processo de leitura é responsável
ble para a assimetria nos efeitos de interferência entre palavras
leitura e nomeação de cores. Se nenhum outro fator for assumido, então
esta conta prevê que o efeito Stroop pode ser revertido por
apresentando informações de cores antes da palavra.!!
MO Glaser e Glaser (1982) testaram esta previsão e

não encontrou suporte para isso: as informações de cores não interferiram
com leitura de palavras mesmo quando as informações de cores precederam as
palavra em 400 ms. Na verdade, eles não encontraram nenhum efeito das cores nas palavras
sobre SOAs variando de -400 ms (palavra anterior à cor) a 400
ms (palavra precedendo a cor). Dados das condições de leitura de palavras
ção de um de seus experimentos são mostrados na parte inferior do
Figura 74.
Simulamos o experimento MO Glaser e Glaser (1982)

ativando a unidade de entrada de cores antes e depois da palavra inserida
colocar unidade. Isso foi feito no número de ciclos correspondente
aos SOAs usados no experimento real.' Para simular o
redução dos efeitos de interferência e facilitação observados no 0-
ms SOA neste experimento, em comparação com o padrão
experimento usando estímulos integrais, aumentamos o tamanho do
efeito de atenção para ambas as vias, diminuindo o repouso
entrada líquida para unidades não atendidas de -4,0 a -4,9. O
os resultados desta simulação são apresentados na Figura 75.
O modelo apresenta pouca interferência da cor na palavra,

menos SOA, assim como é visto em MO Glaser e Glaser (1982)
produz a assimetria entre interferência e facilitação observada

em nossas simulações.
dados. Quando a cor precede a palavra, o modelo mostra um leve efeito

de cor na palavra, mas o efeito é muito menor que o efeito
de palavra sobre cor (o máximo, e o que parece ser o
quantidade assintótica de interferência produzida pelas cores em
palavras, é substancialmente menor do que a quantidade de interferência pro-
(reduzido por palavras em cores no SOA de 0 ms). Desta forma, o
modelo concorda com os dados empíricos, sugerindo que diferentes
a velocidade essencial de processamento não é a única fonte de interferência
observado na tarefa Stroop. O modelo mostra que a interferência
é substancialmente influenciado por diferenças na força do processo
ing: Quando a atenção é desviada do caminho mais fraco,
é capaz de produzir menos ativação no nível de saída do que o
caminho mais forte é capaz de produzir quando a atenção é retirada
extraído dele. Como resultado, caminhos mais fracos produzem menos inter-
referência, independente do seu tempo de finalização.
No entanto, há uma discrepância entre o modelo e o

os dados empíricos na Figura 7. A simulação mostra algumas informações
influência da cor na leitura de palavras quando a cor é apresentada
suficientemente adiantado da palavra, enquanto os sujeitos não.
Na verdade, os dados empíricos de Neumann (citado em Phaff, 1986) indicam
observar que, sob algumas condições, as cores que aparecem precocemente podem
produzir uma pequena interferência na leitura de palavras, assim como
o modelo implica. Não está claro, portanto, se este erro
correspondência entre a simulação e o M., O. Glaser e Glaser
'! Isso requer separação espacial de estímulos de cores e palavras. Este re-
reduz, mas não elimina, o conjunto padrão de efeitos (ver Gatti &
Eget, 1978).
2 O número de ciclos correspondentes ao cache SOA foi determinado

da seguinte maneira: A simulação foi testada no SOA de 0 ms
(cor e palavra apresentadas simultaneamente, como na Simulação 1). Um regresso
A versão desses dados foi realizada no MO Glaser e Glaser (1982)
dados no SOA de 0 ms. Outros SOAs foram então divididos pela regressão
coeficiente para chegar ao número de ciclos a serem usados para cada SOA em
a simulação.
(1982) os dados representam uma limitação do modelo ou do envolvimento

desenvolvimento, em seu experimento, de processos adicionais que não são
central para o efeito Stroop. Esta última possibilidade é sugerida por
outra discrepância entre nossa simulação e o empírico
resultados.
No experimento de MO Glaser e Glaser (1982), os sujeitos

mostrou muito pouca interferência na nomeação de cores quando a palavra
apareceu mais de 200 ms antes da cor (veja a parte superior
parte da Figura 74). Em sua análise original, esse resultado foi
atribuído a efeitos estratégicos. Mais recentemente, os Glasers sugeriram
sugeriu que um processo de habituação pode estar envolvido (W. Glaser,
comunicação pessoal, 16 de setembro de 1988). Nosso modelo
não inclui tal processo, e pode ser por isso que a simulação
lação mostra maiores quantidades de interferência em vez de menores
nos SOAs negativos mais longos. Observe, entretanto, que se a habituação
se aplica aos estímulos coloridos assim como às palavras, então também seria
tendem a reduzir qualquer efeito que as cores tenham na leitura de palavras em
quanto mais SOAs. Se este efeito fosse pequeno para começar, poderia
ser totalmente eliminado pela habituação. Isto pode explicar por que
Glaser e Glaser não conseguiram observar qualquer efeito das cores nas palavras
em SOAs longos, mas devido à falta de um processo de habituação em nossos
modelo, um pequeno efeito foi observado na simulação.
Em resumo, embora o modelo não capture todos os aspectos

dos dados empíricos, demonstra claramente o nosso ponto central,
essa força diferencial de processamento pode explicar por que o presente
um estímulo mais fraco antes que um estímulo mais forte não consiga compensar
para diferenças na velocidade de processamento em relação à interferência
e efeitos de facilitação.
Efeitos de prática
O objetivo principal deste modelo é mostrar como as mudanças

na força que ocorre com a prática pode levar aos tipos de
mudanças na velocidade de processamento e efeitos de interferência observados
para seres humanos. Esses fenômenos são abordados pelos seguintes
realizando duas simulações.
Simulação 3: A Lei da Potência
Numerosos estudos demonstraram que o aumento da

velocidade de processamento que ocorre com a prática segue uma lei de potência
(Anderson, 1982; Kolers, 1976; Logan, 1988; Newell & Rosen-
florescer, 1981). Esse achado é tão comum que alguns autores
sugeriram que, para ser levado a sério, qualquer modelo de automação
a cidade deve demonstrar esse comportamento (por exemplo, Logan, 1988). O
lei de potência para o tempo de reação (RT) em função do número de
ensaios de treinamento (V) tem a seguinte forma:
TR=a+bN", 5)
onde a é o valor assintótico do tempo de reação, b é o

diferença entre desempenho inicial e assintótico, e cis
a taxa de aprendizagem associada ao processo. Quando esta função
Se a ação for plotada em coordenadas log-log, o tempo de reação deve ser
pêra como função linear do número de tentativas, com inclinação ¢. Tipicamente
Normalmente, RT é a média da distribuição dos tempos de reação para um
processo em um determinado ponto do treinamento. Recentemente, Logan (1988)
mostraram que, pelo menos para algumas tarefas, o desvio padrão de
esta distribuição também diminui com o treinamento de acordo com uma
lei de potência e que isso ocorre na mesma taxa que a diminuição
1000
<O Tempo de Reação

y = 1304,6 * x"-0,67 R"2=0,99
100 9
Ciclos de Processamento
© Desvio Padrão
13 anos = 366,8% x"-0,74 R'2=0,98
O01 ano TT
10 100 1000
TT
10.000 100.000
Época
Figura 8. Gráfico log-log da média e desvio padrão para reação

tempo em vários pontos durante o treinamento na tarefa de nomeação de cores. (Ré-
equações de regressão são para tempos médios de reação e desvios padrão
separadamente e são plotados como linhas sólidas. Correlações quadradas entre
valores observados e previstos também são fornecidos. As linhas tracejadas mostram
regressão que melhor se ajusta aos dois conjuntos de dados simultaneamente.)
no tempo médio de reação (ou seja, o coeficiente c é o mesmo para ambos
funções). Isso significa que em coordenadas log-log, o gráfico de
os tempos de reação devem ser paralelos ao gráfico do desvio padrão
ções.
Para avaliar o modelo atual para essas propriedades, treinamos

a rede na tarefa de nomeação de cores por 100.000 épocas. No
intervalos regulares, a rede recebeu 100 tentativas de teste (controle
condição) nesta tarefa. A Figura 8 mostra o log da reação média
tempo de operação menos sua assíntota estimada e o logaritmo da norma
desvio padrão menos sua assíntota estimada, cada um plotado
contra o log do número de tentativas de treinamento. Ambos significam reação
o tempo de operação e o desvio padrão são aproximados
funções de poder do treinamento. Além disso, os expoentes da
duas funções são muito semelhantes e estão dentro da faixa de variação
exposição exibida pelos dados empíricos de Logan (1988).
A aprendizagem segue uma lei de potência por duas razões. Primeiro, aprendendo
na rede é orientado por erros. Ou seja, o valor que cada
O peso da conexão é alterado é baseado em quanto cada saída
a ativação da unidade put difere de seu valor desejado (alvo). Cedo
no treinamento, essa diferença provavelmente será grande (caso contrário, o
problema já estaria resolvido), então grandes mudanças serão
feitas às forças de conexão. Como o conjunto apropriado de
pontos fortes se desenvolve, o erro diminuirá e o mesmo acontecerá com o
alterações feitas nas conexões em cada tentativa de treinamento. Como-
nunca, embora as mudanças de peso diminuam com a prática, elas
continuará a ocorrer enquanto houver treinamento. Isto é porque
os valores alvo são considerados 1,0 para unidades ativas e 0,0 para todas
outros. Estes valores-alvo nunca poderão ser alcançados com
entrada finita para unidades usando a função de ativação logística (ver
Figura 2). Assim, há sempre algum erro e, portanto, sempre
algum fortalecimento adicional de conexões que seja possível.
Contudo, esse fortalecimento será progressivamente menor com
treinamento; portanto, melhorias no tempo de reação se tornarão
menos também.
Uma segunda razão para a desaceleração das melhorias na re-

O tempo de ação com a prática é que, à medida que as conexões ficam mais fortes, sub-
aumentos subsequentes na força têm menos influência na ativação
(e, portanto, tempo de reação). Isso se deve à não linearidade
qualidade da função de ativação: Uma vez que uma conexão (ou conjunto de
conexões) é forte o suficiente para produzir uma ativação próxima de 0,0
ou 1.0, alterações adicionais terão pouco efeito nessa unidade. Por isso,
mudanças menores na força combinadas com o menor
os efeitos de tais mudanças se combinam para produzir o padrão de dupla
retornos nitidamente decrescentes que são capturados pela relação log-log
entre tempo de reação e prática.
Os argumentos que acabamos de fornecer aplicam-se apenas quando representa-

As posições na penúltima camada já foram razoavelmente bem estabelecidas
estabelecido, e o treinamento envolve principalmente as conexões entre
esta camada e a camada de saída. No treinamento de uma rede multicamadas
do zero, usando retropropagação, há um longo período inicial
fase de aprendizagem lenta, seguida por um ou mais períodos de aprendizagem rápida
aceleração e, finalmente, uma fase que segue uma lei de potência.
Conseqüentemente, quando ambas as camadas de entrada e saída da conexão
ções em nossa rede tiveram que ser aprendidas, melhorias nas reações
o tempo de ação não seguiu uma lei de potência desde o início do treinamento.
A adesão à lei de potência ocorreu apenas quando significativa
e conexões moderadamente fortes das unidades de entrada para o
unidades intermediárias já existiam no início de
treinamento. Embora essas conexões de entrada fossem modificáveis e
foram aumentados durante o treinamento, seus valores iniciais tiveram que ser
tal que a rede pudesse realizar a tarefa modificando apenas o
conexões de saída.
Embora alguns possam considerar essas descobertas como uma acusação de

o algoritmo de aprendizagem de retropropagação, sugerimos que eles
pode refletir restrições à aplicabilidade da lei de potência:
podem aplicar-se apenas a determinados tipos de aprendizagem. Especificamente, pode
não se aplica a situações em que uma representação intermediária
deve ser construído para executar uma tarefa. Estes podem envolver mais
mais de uma fase de aprendizagem, como é observado na retropropagação
redes quando mais de uma camada de pesos deve ser aprendida.
Nessa linha, usamos um modelo de retropropagação para
capturar o caráter de estágio da aprendizagem relatado em um conjunto de
tarefas de desenvolvimento (McClelland, 1989), e Schneider e Ol-
iver (no prelo) começaram a explorar como as redes de retropropagação
pode capturar o aprendizado multifásico observado para certas tarefas em
adultos.
Simulação 4: Efeitos da Prática e o Desenvolvimento de
Automaticidade
Tendo demonstrado que o modelo atual está em conformidade com

leis padrão de aprendizagem, agora aplicamos isso a dados empíricos
sobre a aprendizagem e a influência que a aprendizagem tem sobre a
efeitos de interferência. MacLeod e Dunbar (1988) mostraram
que tanto a velocidade de processamento quanto a capacidade de um processo de
interferir (ou facilitar) outro são afetados pelo parente
quantidade de treinamento que os sujeitos receberam em cada um. Em seu
experimentos, os sujeitos foram ensinados a associar uma cor diferente
nomeie cada uma das quatro formas diferentes. Durante o treinamento
fase, as formas foram todas apresentadas em cor neutra (branco),
e os sujeitos praticaram nomeá-los por 20 dias. Reação média
os tempos foram calculados para cada dia de treinamento (ver Figura 9A).
Após 1, 5 e 20 dias de prática, os sujeitos foram testados com
estímulos neutros, conflitantes e congruentes tanto no nome da forma

tarefas de nomeação e nomeação de cores.'? Os resultados desta experiência podem
ser resumido da seguinte forma (estes também aparecem no topo da Figura
12, apresentado posteriormente):
« Após 1 dia (72 tentativas por estímulo) de prática de nomeação de formas,

isso ainda era mais de 100 ms mais lento que a nomeação de cores. O
as formas não tiveram efeito na hora de nomear as cores da tinta. No entanto,
as cores das tintas produziram interferência e facilitação na forma
tarefa de nomeação. A quantidade de interferência foi maior que a
quantidade de facilitação.
Após 5 dias (504 tentativas por estímulo) de prática, nomeação de formas

foi significativamente mais rápido do que no primeiro dia. Além disso, o
formas agora interferiam na nomenclatura das cores, embora não
produzir facilitação. As cores continuaram a produzir inter-
referência e facilitação na nomenclatura de formas.
Após 20 dias (2.520 tentativas por estímulo) de prática, forme nomes

A nomeação foi um pouco mais rápida do que a nomeação de tinta. As formas produziram um
grande quantidade de interferência e uma pequena quantidade de facilitação
na nomeação de cores. As cores agora produziam muito menores
quantidades de facilitação e interferência na nomenclatura de formas.
MacLeod e Dunbar (1988) argumentaram que estes dados contradizem
a ideia de que os atributos da automaticidade são tudo ou nada. Eles
sugeriu, em vez disso, que existe um continuum de automaticidade, em
qual é a quantidade relativa de treinamento em duas tarefas que
determina a natureza das interações entre eles. O
o modelo atual fornece um mecanismo para isso.
Para simular os experimentos de MacLeod e Dunbar (1988),

usamos a rede das simulações anteriores (que tinham
já foi treinado em nomeação de cores e leitura de palavras),
criando um novo caminho que foi usado para nomear formas, este caminho
caminho era idêntico em todos os aspectos aos dois caminhos preexistentes,
exceto que não recebeu qualquer formação (ver Figura 10). Como
com os caminhos de cores e palavras, foi dado um conjunto de iniciais
forças de conexão da entrada para as unidades intermediárias
que lhe permitiu gerar uma representação útil ao nível da
as unidades intermediárias, enquanto pequenas forças aleatórias foram
atribuído às conexões entre o intermediário e o externo
coloque unidades.
Usando esta rede expandida, examinamos como a prática em

uma nova tarefa (nomeação de forma) afeta sua interação com outra
tarefa que já recebeu uma quantidade moderada de treinamento
(nomeação de cores). A palavra caminho não foi usada nesta simulação
ção.
A simulação envolveu uma série de fases alternadas de

treinamento e teste, como no estudo empírico. Durante cada
fase de treinamento, a rede foi apresentada apenas com os dois
controlar padrões de forma. Ambos os padrões foram apresentados
em cada época de treinamento. Embora apenas dois estímulos de forma tenham sido
usado na simulação, a rede recebeu exatamente o mesmo
número de exposições de treinamento por estímulo que os sujeitos re-
recebido no experimento. Durante os testes, a rede foi pré-
enviado com o conflito e estímulos congruentes, bem como o
controlar estímulos em cada condição de tarefa (nomeação de cores e formas
'
13 Para a tarefa de nomeação de formas, estas eram (a) formas em cor neutra
(condição de controle), (b) formas em uma cor que era inconsistente com o
nome da forma (condição de conflito) e (c) formas em uma cor que foi
consistente com o nome da forma (condição congruente). Os mesmos estímulos
foram usados para a tarefa de nomeação de cores, exceto que a condição de controle
usou uma forma neutra (quadrada).
& 1000
2*
E 2 W Dados empíricos
c ES A Simulação
Qs 800 (sem processo indireto)
ai O Simulação
FS Ji (com processo indireto)
“t
£00 1
400 toneladas
1000 2000
Testes/estímulo
3.000
347
1000
B
. Tm,
Dados empíricos
y= 1047,2 x*-0,11086 R*2 = 0,958
Simulação CG (qual processo indireto)
¥y=1020,1 * x*-0,10704 R*2 = 0,986
100
1000 10000
Figura 9. Dados de treinamento para a tarefa de nomeação de formas no Experimento 3 de

MacLeod e Dunbar (1988, p. 133),
e os resultados de duas simulações desses dados. (4: Dados empíricos e resultados de
simulações com e
sem o caminho indireto para nomeação de formas [ver texto]. B: Gráfico log-log dos dados
empíricos e do
resultados da simulação usando o caminho indireto para nomeação de formas, com linhas de
regressão calculadas
independentemente para cada conjunto de dados.)
nomenclatura). Os tempos de reação para cada tipo de estímulo foram registrados

e calculada a média de cada condição.
No estudo empírico, as sessões de teste deram aos sujeitos

prática com os itens de estímulo, incluindo conflito e congruência
estímulos. Para simular com precisão essas circunstâncias, também
baixou a rede para continuar a ajustar a força de sua conexão
(tanto nas vias de cor quanto de forma) durante cada fase de teste.
A rede recebeu exatamente o mesmo número de exposições a
cada estímulo de teste como fizeram os sujeitos humanos. Além disso, estes
foram bloqueados por tarefa e apresentados na mesma sequência que em
o estudo empírico. A rede foi testada depois de ter recebido
o mesmo número de exposições de treinamento por estímulo recebido
por sujeitos nos Dias 1 (72), 5 (504) e 20 (2.520).
Simulamos dois componentes do MacLeod e Dunbar

(1988) dados: mudanças na velocidade de nomeação de formas com a prática
e mudanças nos efeitos de interferência entre a nomenclatura da forma e
nomenclatura de cores. Consideramos cada uma delas por vez.
Pratique efeitos. De acordo com as descobertas para outras tarefas em

cuja prática leva à automaticidade, melhorias na reação
o tempo para nomear formas deveria ter seguido uma lei de potência. Significar
o tempo de reação para nomeação de formas em cada dia de treinamento é
mostrado na Figura 94 (quadrados sólidos). Esses dados são razoavelmente
bem ajustado por uma função de potência (ver Figura 9B). Figura 94 também
mostra o desempenho do modelo conforme o descrevemos
longe (triângulos abertos). A rede exibiu significativamente mais tempo
tempos de reação do que os indivíduos no início do treinamento. Este resultado
sugeriu que, desde o início, os sujeitos poderiam estar realizando a tarefa
de uma maneira diferente do que fizeram mais tarde. Esta interpretação concorda
com a ideia geral de que recursos flexíveis e de uso geral
são obrigados a realizar novas tarefas, e somente com a prática é que
mecanismos automáticos entram em ação. Estratégico (por exemplo, Posner
& Snyder, 1975), controlada (Shiffrin & Schneider, 1977) e
processos baseados em algoritmos (Logan, 1988) se encaixariam neste
categoria. Este modelo não se destinava a abordar a mecânica
detalhadamente os nismos subjacentes a tais processos. No entanto, para explorar
a influência que eles poderiam ter, adicionamos um caminho auxiliar-
caminho para o modelo (veja discussão posterior). Não pretendemos sugerir
gest, ao adicionar este caminho, que algo tão simples

uma vez que a nossa implementação está subjacente a processos estratégicos; em vez disso, nós
incluímos isso como uma forma de aproximar a influência que consideramos
alguns processos estratégicos teriam no decorrer do tempo de informação
processamento de informações.
O novo caminho foi composto por conexões do interior

unidades intermediárias no caminho da forma para um novo conjunto de unidades
intermediárias
unidades combinadas em um módulo separado e as conexões deste mod-
ule para as unidades de saída do modelo (veja a Figura 11). Chamamos isso de novo
caminho o caminho indireto para distingui-lo do habitual
caminhos diretos usados pela rede. A via indireta foi
pretende representar o envolvimento de um modelo de uso geral
ule (ou mesmo conjunto de módulos) que foi comprometido com o
processo de nomenclatura de formas para a tarefa atual. As conexões em
à via indireta foi atribuído um conjunto de pontos fortes que permitem
baixá-lo para ser usado para nomeação de formas, antes dos efeitos do treinamento
havia acumulado na via direta. Isso capturou o
suposição de que tal mecanismo pode ser rapidamente programado
para executar uma determinada tarefa. Como a via indireta dependia de
um conjunto extra de unidades, o processamento foi mais lento do que no direto
caminho, isso está de acordo com a suposição comum de que pro-
depender de mecanismos de uso geral é mais lento do que
processamento automático (por exemplo, Posner & Snyder, 1975).
Os resultados da adição do caminho indireto à rede são

mostrado na Figura 94 (círculos abertos): O desempenho da simulação
agora está muito mais próxima da dos sujeitos. Figura 98
mostra que as funções de potência mais adequadas para os dados empíricos
e a simulação são quase idênticas. Ao comparar o
desempenho do modelo com e sem a via indireta,
pode-se ver que à medida que o treinamento avança, o desempenho depende
cada vez mais no caminho direto. Esta maior dependência ocorre
ocorre porque, à medida que a conexão se fortalece no caminho direto
aumenta com o treinamento, o processamento nesta via torna-se
mais rápido. Nossa conclusão de que tal transição de um processamento
mecanismo para outro segue uma lei de potência é semelhante a um
descrito por Logan (1988), em que a transição de um al-
348
verde VERMELHO
Cor
Nomenclatura da COR da TINTA
PALAVRA
J. COHEN, K. DUNBAR E J. MCCLELLAND
X wa
Nomenclatura de FORMA
Figura 10. A arquitetura de rede usada para simular os experimentos de nomenclatura de formas
conduzido por MacLeod e Dunbar (1988).
baseado em algoritmo para um processo baseado em memória também produziu um

Poder da lei.
Efeitos de interferência. A Figura 12 mostra a interferência e fa-

efeitos de estimulação que foram observados para as duas tarefas após 1, 5,
e 20 dias de prática em nomenclatura de formas. A parte superior mostra o
dados empíricos de MacLeod e Dunbar (1988, Experiment
RESPOSTA
"vermelho verde"
Nomeando FORMA
DEMANDA DE TAREFA
Figura 11. Detalhe dos caminhos utilizados para nomeação de formas. (Destacado
elementos constituem o caminho indireto.)
4), e a parte inferior mostra o desempenho do modelo. A maioria im-

importante, observamos que o modelo captura a inversão de papéis
de nomenclatura de formas e nomenclatura de cores. Para os sujeitos e para o
simulação, a nomeação de formas era inicialmente muito mais lenta que a de cores
nomenclatura. A nomeação de formas também mostrou interferência e facilitação.
desde o início, enquanto a nomenclatura das cores não foi
afetado pelas formas. No ponto final do treinamento, o relacionamento
a relação entre os dois processos foi invertida: a nomenclatura da forma tornou-se
o processo mais rápido, enquanto sua sensibilidade à interferência foi
induzida e sua capacidade de produzir interferência (com nome de cor
ing) aumentou. No ponto intermediário, os dois processos
eram mais comparáveis em sua velocidade geral e foram capazes de
influenciar uns aos outros.
No modelo, a nomeação de formas começou como o processo mais lento

porque no início do treinamento a força das conexões neste
caminho ainda eram muito menores do que aqueles no caminho da cor.
A relação entre os dois processos neste ponto foi
diretamente análogo à relação entre leitura de palavras
e nomenclatura de cores na Simulação 1. Observe, entretanto, que neste
simulação, a nomeação de cores começou com o papel oposto: Inicial
essencialmente, a nomenclatura de cores era o processo insensível à inter-
referência ou facilitação e que foi capaz de produzir esses efeitos.
A nomenclatura das cores assumiu esse papel oposto sem qualquer alteração
a força das conexões em seu caminho. Isso deixa claro
que a força absoluta de um caminho (ou seja, a magnitude de
forças de conexão) não é a única variável relevante. Relativo
força, em comparação com um caminho concorrente, também é importante
importante para determinar se um processo produzirá ou estará sujeito
à interferência em uma tarefa do tipo Stroop. Esta descoberta é ainda mais sub-
comprovado pelos padrões de desempenho no final do treinamento.
Dados empíricos
3 2001 700. 200 |
£==~NN”
pa 4
3 500 {o—0— 500+ 500 4
°!
ot cu ome berço Coat Gorgunn ws Comat Congrne

Dia 1 Dia § Dia 20
2) 700 4 700 + 700 4

gs
$ 8.00 + 800.000 4
§%
FE wi] © 0 500 J tg 00 4 NG
eu —e—3
LJ LJ LJ
Controle o Conflito Congruente
72 épocas
504 Épocas
2520 Épocas
Figura 12. Interferência e facilitação na nomeação de formas (círculos sólidos) e nomeação de

cores (quadrados abertos)
tarefas após vários níveis de treinamento em nomenclatura de formas. (O painel superior mostra
os resultados obtidos em
MacLeod e Dunbar [1988, p. 133] Experimento 3 depois que os sujeitos receberam 1, 5 e 20
sessões de
prática. O painel inferior mostra os resultados da simulação nos pontos correspondentes do
treinamento.)
Neste ponto, a força do caminho da forma excedeu aquele

do caminho da cor. Conseqüentemente, a nomeação de formas tornou-se mais rápida
do que a nomenclatura de cores, insensível às cores e capaz de facilitar
e interferir na nomenclatura das cores.
Com base em seus dados, MacLeod e Dunbar (1988) sugerem

sugeriu que o efeito Stroop pode ser entendido em termos do
posição relativa de tarefas concorrentes ao longo de um continuum de auto-
funcionalidade e que a posição das tarefas ao longo deste continuum
pode ser influenciado pelo treinamento. Os resultados desta simulação são
consistente com tal visão e demonstrar que o observado
efeitos podem ser explicados por aumentos na força da via que
acompanhar o treinamento. Esta é uma descoberta importante, pois sugere
que o mesmo processo pode parecer automático (mais rápido e
capaz de influenciar um processo concorrente) ou controlado (mais lento e
influenciado por um processo concorrente), dependendo do contexto
em que ocorre.
Há, no entanto, um aspecto em que o comportamento do
modelo difere qualitativamente daquele dos sujeitos em MacLeod

e estudo de Dunbar (1988). Isto diz respeito ao grau de interacção
ção entre processos que são de força comparável. No
ponto intermediário no treinamento, os dados empíricos mostram que
cada tarefa interferia substancialmente na outra. Na simulação
ção, embora tenha havido alguma interferência mútua, o montante
era bastante pequeno. Esta foi uma propriedade robusta do modelo: Pro-
processos de força comparável mostraram menos influência em um
diferente do que os processos mais fortes fizeram com os mais fracos. Assim,
fatores nacionais fora do escopo do nosso modelo podem estar envolvidos
quando os processos concorrentes são de força comparável. Na verdade,
é difícil explicar essas descobertas, mesmo em outros aspectos mais
motivos tradicionais. Sob esta luz, a interferência mútua
4 Por exemplo, pode-se pensar que a interferência mútua reflecte uma

mistura de probabilidade subjacente de ensaios envolvendo inter-
referência em cada uma das duas direções. Assim, num ponto intermediário
efeito continua sendo um desafio geral para modelos de fenômenos de interferência

nomena e merece mais pesquisas.
Alocação de atenção
Simulação 5: Atenção e Processamento
A principal razão para estudar os efeitos de interferência é que eles

pode indicar algo sobre os requisitos de diferentes programas
processos de atenção. Assim, na tarefa Stroop, assume-se que
as informações do canal irrelevante não são atendidas. Para o
medida em que esta informação não supervisionada pode produzir interferência
experiência, não deve depender da atenção para ser processado. O
a falta de necessidade de atenção é um dos principais critérios
para a automaticidade (Posner & Snyder, 1975; Shiffrin & Schneider,
1977). Tem sido frequentemente assumido que os processos automáticos não
apenas não requerem atenção, mas também não são influenciados por
atenção (por exemplo, Posner & Snyder, 1975). Kahneman e Treis-
man (1984) referiu-se a isso como a afirmação da “forte automaticidade”.
Eles e outros (por exemplo, Logan, 1980) desafiaram esta visão,
fornecendo um grande conjunto de evidências que sugerem que poucos programas
processos, se houver, ocorrem inteiramente independentes da atenção (por exemplo, Kah-
neman & Chajczyk, 1983; Kahneman e Henik, 1981; Treis-
homem, 1960). Por exemplo, Kahneman e Henik (1981) e
Kahneman e Chajczyk (1983) mostraram que na tarefa Stroop,
a alocação de atenção pode influenciar o grau em que
a leitura de palavras interfere na nomenclatura das cores.
Com base nessas descobertas e em outras relacionadas, Kahneman e

Treisman (1984) argumentou que os processos automáticos são sub-
sujeito ao controle pela atenção, embora processos individuais possam
diferem em seu grau de suscetibilidade a tal controle. Nosso
modelo apresenta uma visão de automaticidade que concorda tanto com
destes pontos. Na Simulação 1, mostramos que embora os programas
O processo pode ocorrer na ausência de atenção, captando o envolvimento
Na inutilidade dos processos automáticos, essa autonomia era limitada:
Mesmo que as palavras tenham sido processadas sem a alocação de
atenção, interferindo assim na nomenclatura das cores, eles não
determinar a resposta. Assim, mesmo os processos mais fortes foram
controlado pela atenção. Além disso, o modelo mostra que
o controle pela atenção é uma questão de grau: isso foi visto no
desenvolvimento gradual de efeitos de interferência que ocorreram como
a força do processamento aumentou com o treinamento na Simulação 4.
Nas simulações a seguir, examinamos a relação

entre requisitos de atenção e força de processamento
mais diretamente. Primeiro, analisamos os efeitos da redução da atenção
ção sobre o desempenho da nomeação de cores e leitura de palavras
treinamento, o caminho da forma pode interferir no caminho da cor para

alguns estímulos (ou sujeitos), enquanto o inverso é verdadeiro para outros. O
efeito da média sobre itens (ou assuntos) seria que a interferência
pareceria ser bidirecional. No entanto, o tamanho desta média
deve ser menor que a quantidade de interferência produzida pelas cores no início
no treinamento ou por formas no final do treinamento, porque no nível intermediário
ponto, apenas um subconjunto de estímulos (ou assuntos) estaria contribuindo para
interferência em cada direção, enquanto o desempenho deve ser mais
homogêneo no início e no final do treinamento. Na verdade, os dados
indicam que a interferência mútua foi aproximadamente da mesma magnitude que
os efeitos de interferência nos extremos do treinamento. Uma mistura de probabilidade
A cultura não pode explicar esta descoberta.
tarefas. A quantidade de atenção alocada a uma tarefa foi representada

enviado como o valor de ativação da unidade de demanda de tarefa associada
com essa tarefa. A Figura 134 mostra os tempos de reação para controlar os estímulos
uli nas tarefas de leitura de palavras e nomeação de cores como uma função
de ativação da unidade de demanda de tarefa para cada um dos correspondentes
processos. Dois fenômenos são aparentes. Para um determinado nível de
desempenho, a nomeação de cores exigia mais atenção do que
leitura de palavras. No entanto, ambas as tarefas foram influenciadas pela alocação
cação de atenção. Até o processo de leitura de palavras mostrou-se
radiação com atenção reduzida. Na verdade, o facto de ser mais forte
caminhos são controlados pela atenção é o que permite ao modelo
para executar uma tarefa usando o mais fraco de dois caminhos concorrentes.
Embora caminhos mais fortes dependam menos de atenção,

Os pedidos de atenção são influenciados por mais do que apenas o abso-
força alaúde de um caminho; eles também são afetados pelas circunstâncias
situações sob as quais um processo ocorre. A Figura 138 mostra o
requisitos que a nomenclatura de cores exigia atenção em três
condições diferentes: (a) nenhuma informação concorrente, e con-
fornecer informações de (b) um processo mais fraco (nomeação de formas,
no início do treinamento) e (c) um processo mais forte (leitura de palavras). Em
nas duas condições de conflito, a nomenclatura de cores mostrou-se muito diferente
requisitos de atenção, dependendo da força do
caminho concorrente. Para um determinado nível de desempenho, maior
a ativação da unidade de demanda de tarefa foi necessária para competição
com o processo mais forte do que com o processo mais fraco.
O desempenho do modelo nestas condições demonstra

demonstra que embora o processamento possa ocorrer na ausência de
atenção, todos os processos são afetados pela atenção. Como o outro
atributos de automaticidade, os requisitos de atenção variam de acordo
de acordo com a força da via subjacente e a con-
texto em que o processo ocorre. Quanto mais forte for um processo, mais
menores são suas necessidades de atenção e menos suscetível
é controlar pela atenção, aumentando a probabilidade de que isso aconteça
produzir interferência.
Simulação 6: Efeitos do Conjunto de Respostas - Alocação de

Atenção no nível de resposta
Nas simulações anteriores, exploramos o papel que a atenção

A ação desempenha na seleção de informações de um dos dois concorrentes
caminhos. A seleção atencional ocorreu no nível do in-
unidades intermediárias, onde as informações nos dois caminhos eram
ainda separados. No entanto, o mecanismo de alocação de atenção
usado neste modelo é geral e pode ser aplicado a outros
níveis de processamento também. Na simulação a seguir, isso
mecanismo foi usado para selecionar um conjunto específico de respostas em
o nível de saída da rede. Esta simulação fornece uma
levar em conta os efeitos do conjunto de respostas que foram observados em
estudos científicos (por exemplo, Dunbar, 1985; Klein, 1964; Proctor, 1978).
Os efeitos do conjunto de respostas refletem o fato de que as informações relacionadas

resposta potencial leva a mais interferência (e facilita
ção) do que informações não relacionadas à tarefa. No padrão
Experimento Stroop, a informação na dimensão irrelevante é
sempre relacionado a uma resposta potencial. As respostas potenciais são
disse que 10 constituem um conjunto de respostas. Por exemplo, no nome da cor
tarefa, quando a palavra VERMELHO está escrita em tinta verde, embora
“vermelho” for uma resposta incorreta naquele teste específico, será
uma resposta correta em outras tentativas. Assim, tanto “vermelho” quanto “verde”
estão no conjunto de resposta. No entanto, se a cor azul nunca aparecer,
© 2000
8A
QO + 1
E 4 1500 03 Nomenclatura de cores
FS® Leitura de palavras
&°
=a 10004
Pergunta
sobre ]
oC o
2 500-
0,4 0,6 0,8 1,0
351
Nomenclatura de cores 20001:

© Palavra conflitante
Uma forma conflitante
1500 | 8 Condição de Controle
1000 1
500 ¥ T v T tT TT Ls TTT
0,0 0,2 0,4 0,8 0,8 1,0
Ativação da Unidade de Demanda de Tarefa
Figura 13. Influência da atenção no processamento. (4: Diferenças nos requisitos de atenção
entre
nomeação de cores e leitura de palavras, e o efeito nesses dois processos de redução da ativação
da tarefa
unidade de demanda. B; Requisitos de atenção do processo de nomenclatura de cores quando
este deve competir com um
processo mais forte [leitura de palavras) e outro mais fraco [nomeação de formas, carly no
treinamento).)
então a palavra AZUL não está no conjunto de respostas, porque nunca é

uma resposta na tarefa. Vários estudos, usando tanto o nome de cores
tarefa de nomeação (por exemplo, Proctor, 1978) e uma tarefa de nomeação de imagens (Dun-
bar, 1985), mostraram que palavras que não são potenciais re-
respostas produzem significativamente menos interferência do que palavras
que estão no conjunto de resposta.
Uma explicação comumente oferecida para esse efeito é que

membros do conjunto de respostas são preparados, seja por instruções
para a tarefa (ou seja, informando os sujeitos sobre os estímulos para
que eles terão que responder) ou através da experiência com
os estímulos no decorrer da tarefa em si (por exemplo, Kahneman &
Treisman, 1984). O modelo atual fornece uma conta relacionada
dos efeitos do conjunto de respostas, em termos da alocação seletiva de recursos
atenção aos membros do conjunto de respostas. O mesmo mecanismo
que usamos para alocar atenção a um caminho específico em
simulações anteriores podem ser usadas para alocar atenção a uma parte
resposta específica ou conjunto de respostas no nível de saída. No
simulações anteriores, alocação de atenção a um processamento
caminho colocou as unidades intermediárias nesse caminho em um
parte mais responsiva de sua curva de ativação. Este canal
ocorreu através da ativação de uma unidade de demanda de tarefa que off-
definir o viés negativo em unidades intermediárias nesse caminho. O
mesmo mecanismo pode ser implementado no nível de resposta por
adicionando um viés negativo a cada uma das unidades de produção e tendo
a alocação de atenção a uma resposta compensou o viés negativo
nas unidades de saída apropriadas.'*
Simulamos os efeitos do conjunto de respostas observados para uma imagem

tarefa de nomeação usada em um experimento de Dunbar (1985). Nisso
tarefa, uma palavra foi colocada no centro de uma imagem e os sujeitos
foram obrigados a nomear a imagem e ignorar a palavra. Sub-
O desempenho dos sujeitos nesta tarefa foi quase idêntico ao
a tarefa padrão de nomeação de cores: a nomeação de imagens foi mais lenta do que
era a leitura de palavras, a palavra interferia e facilitava
nomeação de imagens, e a imagem não teve efeito na leitura de palavras
(para estudos semelhantes, cf. Fraisse, 1969; WR Glaser & Diingel-
hoff, 1984; e Lupker & Katz, 1981). No experimento de Dunbar,

havia cinco fotos de animais (cavalo, urso, coelho, ovelha,
e cat'®) e, portanto, cinco respostas possíveis. Algumas das palavras
os estímulos utilizados foram respostas potenciais (por exemplo, HORSE e REAR),
enquanto outras eram palavras de animais que não estavam na resposta
conjunto (por exemplo, GOAT e DONKEY). Dunbar descobriu que as palavras no
conjunto de respostas produziu significativamente mais interferência do que
palavras que não eram (ver Tabela 3).
Para simular este experimento, o modelo utilizado para Simulação

1 foi estendido das seguintes maneiras. Primeiro, aumentamos o
número de unidades em cada nível de processamento em cada um dos dois
caminhos para 10 (ver Figura 14). Um caminho foi usado para representar
enviou a nomenclatura da imagem, e a outra foi usada para representar a palavra
leitura. Cinco unidades de saída foram usadas para representar o potencial re-
patrocinadores e foram rotulados como “cavalo”, “urso”, “coelho”, “ovelha”,
e “gato”. Os 5 restantes foram usados para representar palavras que
não faziam parte do conjunto de respostas e foram rotulados como “cabra”,
“burro”, “cachorro”, “rato” e “foca” As 10 unidades de entrada em
cada caminho correspondia a essas unidades de saída e eram la-
beled em conformidade.” :
A nova rede foi treinada de forma análoga à
!5 Este mecanismo estava implícito no nível de saída no anterior

simulações. Para ver isso, imagine que um viés negativo estivesse associado a
cada uma das unidades de saída, assim como aconteceu com as unidades intermediárias. Como-
sempre, porque ambas as unidades de saída estavam no conjunto de resposta, a atenção foi
alocado ao máximo para cada um. Isto compensaria o viés negativo de ambos
deles. Ou seja, os termos de polarização nas unidades de produção seriam sempre
igual a 0.
16 Para refletir a analogia entre estímulos de imagem nesta tarefa e cores

estímulos na tarefa Stroop clássica, nos referimos a estímulos de imagem em letras minúsculas
letras, como fazemos para estímulos de cores,
'7 A rede foi treinada na entrada para a imagem sem conjunto de resposta
unidades, mas porque os estímulos correspondentes não estavam na resposta
definido, eles nunca foram usados em testes. Essas unidades foram incluídas estritamente
para manter a simetria entre os dois caminhos na rede, então
RESPOSTA
Resposta sel membros
Membros do conjunto sem resposta.
T
“cavalo” “urso”
1
“cabra” “burro”
Foto
Nomeação
Figura 14. A rede usada para simular efeitos de conjunto de respostas. (Números que aparecem
dentro de cada saída
unit são os termos de polarização que foram atribuídos a essas unidades durante o teste.)
treinamento na Simulação 1. Ambos os caminhos foram treinados em todos os 10

de suas entradas, com estímulos no caminho da imagem recebendo
10% do valor do treinamento recebido por quem está no mundo
caminho. Durante o treinamento, a atenção foi alocada ao máximo para
todas as unidades em ambos os caminhos, como foi o caso em anteriores
simulações. Durante os testes, no entanto, vários ajustes foram
feito na alocação de atenção. Primeiro, para simular o
quais os menores efeitos das palavras na nomeação de imagens (Dunbar, 1985)
do que na nomeação de cores (Dunbar & MacLeod, 1984), nós in-
aumentou o tamanho do efeito de atenção no nível do inter-
unidades intermediárias, assim como fizemos na Simulação 2 (repouso negativo
viés em todas as unidades intermediárias de -4,5; pontos fortes da tarefa
unidades de demanda para unidades intermediárias de 4,5).'® Além disso, atente-
A divisão foi alocada de forma diferenciada entre as unidades de produção: Não-
unidades de conjunto de respostas (por exemplo, “cabra” e “burro”) receberam uma parte
viés negativo parcial (-0,1). Esta alocação diferencial corresponde
respondeu à hipótese de que, durante o teste, os sujeitos alocam
atenção ao máximo para respostas relevantes e desatender a ir-
respostas relevantes, embora não completamente (cf. Deutsch, 1977,
Kahneman e Treisman, 1984). A quantidade de viés negativo
aplicado a itens sem resposta foi escolhido para capturar a empiri-
dados cal com a maior precisão possível. Contudo, o fato de o tamanho
que as diferenças no processamento entre eles não poderiam ser atribuídas a

assimetrias arquitetônicas.
do viés (-0,1) foi menor que o viés negativo para intermediários
unidades diatas na via não atendida (-4,0) é consistente com
dados empíricos demonstrando que a seleção por conjunto de estímulos é
mais fácil do que a seleção por conjunto de respostas (cf. Broadbent, 1970; Kah-
neman & Treisman, 1984; Keren, 1976). A diferença de preconceito
entre unidades intermediárias e de saída também é consistente com
a visão de que os sujeitos são menos capazes de alocar seleção de atenção
tivamente a diferentes representações dentro de um módulo do que a representações
ressentimentos em diferentes módulos (por exemplo, Navon & Miller, 1987;
Wickens, 1984).
A Tabela 3 também mostra dados do experimento de Dunbar (1985)

como os resultados da simulação. Em ambos os casos, os estímulos que foram
não no conjunto de respostas produziu menos interferência do que re-
estímulos de conjunto de respostas. No modelo, essa diferença deveu-se ao
viés negativo parcial nas unidades de produção sem conjunto de resposta,
que simulou a falha em atender ao máximo aos correspondentes
respostas. Este viés negativo levou à inibição parcial destes
unidades, reduzindo o grau em que foram ativadas por entrada
estímulos. Como resultado, contribuíram menos para a concorrência dentro
o mecanismo de resposta do que as unidades de saída que estavam no
'8 Esta diferença não parece ser devida a uma diferença de força
entre nomenclatura de imagens e nomenclatura de cores, porque ambos têm comparações
tempos de reação ajustáveis na condição de controle (aproximadamente 650 ms). O
a comparabilidade dos tempos de nomenclatura para cores e imagens foi observada pela
primeira vez
por Cattell (1886).
Tabela 3
Efeitos do conjunto de respostas
Condição Dunbar (1985) Simulação

Conflito de conjunto de respostas 781 177
Conflito sem resposta definida 748 750
Controle 657 664
Congruente 634 628
Observação. Os dados empíricos são tempos de reação em milissegundos. Simulação

os dados são ciclos X 4,5 + 488,
conjunto de resposta. A simulação demonstrou que a atenção pode

ser alocado às unidades de resposta com exatamente o mesmo mecanismo
nismo que foi usado para alocar atenção a um caminho. Quando
atenção é alocada com este mecanismo, resposta padrão-
efeitos definidos são obtidos.
Discussão geral
Mostramos que os mecanismos em uma rede simples

modelo baseado pode explicar muitos dos fenômenos associados
com atenção e automaticidade. Em relação ao Stroop
efeito, o modelo mostra que esses mecanismos podem capturar um
grande variedade de efeitos empíricos. Entre estes estão as assimetrias
tentativa de efeitos de interferência entre a leitura de palavras e a nomenclatura de cores
ing, o fato de que os efeitos de interferência são normalmente maiores do que
efeitos de facilitação (Dunbar & MacLeod, 1984), que apresentar
a cor antes da palavra produz substancialmente menos interferência
do que seria esperado simplesmente pelas diferenças no
velocidade de processamento (MO Glaser & Glaser, 1982), e que
palavras que não estão no conjunto de respostas produzem menos interferência
com nomenclatura de cores do que palavras que o são (Dunbar, 1985; Klein,
1964). Além disso, o modelo exibiu muitos dos fenômenos
ena associada ao desenvolvimento da automaticidade, incluindo
reduções no tempo de reação e na variância que seguem um poder
lei (Logan, 1988; Newell & Rosenbloom, 1981), desenvolvimento gradual
desenvolvimento da capacidade de produzir interferência acompanhada por um
redução na suscetibilidade a interferências (MacLeod & Dunbar,
1988), e uma redução dos requisitos de atenção como
ocorre a aprendizagem (Logan, 1978; Shiffrin & Schneider, 1977).
O modelo fornece uma explicação comum para essas descobertas

em termos da força das vias de processamento. Esta conta
vai além de muitas outras teorias de automaticidade ao descrever
um conjunto explícito de mecanismos de processamento a partir dos quais o empirismo
fenômenos físicos surgem. Esses mecanismos fornecem
uma base para a aprendizagem, o curso do tempo de processamento e a informação
fluência da atenção. Várias características importantes da automaticidade
emergem deste relato, incluindo os fatos de que as propriedades
da automaticidade são contínuos e que seu surgimento determina
depende em grande parte da força de um processo em relação ao
pontos fortes dos processos concorrentes.
O modelo não é perfeito na sua forma actual. Por exemplo, é

não leva em conta o fato de que apresentar uma palavra suficientemente
antes da cor reduz a interferência (MO Glaser &
Glazer, 1982). Também mostra menos interação entre processos
de força comparável ao que os dados disponíveis parecem indicar
(MacLeod e Dunbar, 1988). Algumas destas deficiências podem
ser devido ao fato de o modelo não incluir mecanismos

para o processamento de componentes estratégicos em uma tarefa (por exemplo, inter-
interpretação das demandas da tarefa, avaliação do conjunto de respostas e
compensação por um estímulo conflitante anterior). Re-
pesquisa e desenvolvimento são necessários para capturar esses e outros
aspectos de desempenho. No entanto, os sucessos do
modelo até à data indicam a utilidade da abordagem geral.
No restante desta discussão, consideramos as implicações
ções da abordagem para questões além daquelas diretamente abordadas
em nossas simulações.
Reconsiderando o processamento controlado e automático
O modelo demonstra que diferenças na interferência

efeitos não são suficientes para fazer uma distinção entre diferentes
tipos de processos. Uma suposição comum é que se um processo
interfere com outro, o processo que produz interferência
é automático e o outro é controlado. No entanto, o modelo
mostra que esta disparidade pode ser explicada por diferenças no
força de dois processos que usam mecanismos qualitativamente idênticos
ismos. Além disso, tanto o modelo como as evidências empíricas recentes
evidência demonstra que o mesmo processo pode, de acordo com
critérios de referência, parecem ser controlados em um contexto e
automático em outro.
A este respeito, nosso modelo fornece uma explicação muito diferente

do efeito Stroop de outros modelos, como o descrito
por Hunt e Lansman (1986; também ver Reed & Hunt, 1986).
Seu modelo é baseado em uma arquitetura de sistema de produção que
é uma versão modificada daquela usada no ACT* (Anderson, 1983).
Seu modelo distingue entre controle controlado e automático
processamento com base na maneira como uma produção
influencia a demissão de outros. No processamento controlado, um
produção ativa uma representação na memória de trabalho que
corresponde aos critérios de outro, aumentando o valor de ativação
para essa produção e, portanto, sua probabilidade de disparar, em auto-
processamento automático, no entanto, as produções podem influenciar cada
outro sem depender da memória de trabalho através do direto
propagação da ativação de uma produção para outra. No
Modelo de Hunt e Lansman, a nomenclatura de cores é considerada um
processo controlado, que depende da memória de trabalho. Como tal,
é altamente influenciado pelo conteúdo da memória de trabalho. Em
particular, na condição de conflito, quando há conflitos
informações de palavras na memória de trabalho, o processamento é lento, re-
resultando em interferência do tipo Stroop. Em contrapartida, a leitura de palavras é
assumido como automático e, portanto, ocorrendo em grande parte através do
propagação direta da ativação entre regras de produção. Esse
torna-o menos suscetível à influência do conteúdo do trabalho
memória.
O modelo de Hunt e Lansman (1986) fornece uma explicação explícita

conta a natureza do processamento controlado (em termos de
memória de trabalho e produções), o que nosso modelo não faz.
No entanto, o seu modelo enfrenta sérias limitações. Primeiro, não consegue
capturar alguns dos recursos básicos da tarefa Stroop: No
condições de controle, nomeação de cores e leitura de palavras são
formado na mesma velocidade. Além disso, a cor pode interferir
com e facilitar a leitura de palavras, nenhum dos quais ocorre em
estudos piricos. Não está claro se essas falhas em se adequar ao
dados empíricos resultam de limitações fundamentais em sua
abordagem global ou a implementação específica que reportam.
O mais importante, porém, é que o seu modelo leva em conta

diferenças nos efeitos de interferência entre a nomenclatura de cores e
leitura de palavras, assumindo que essas tarefas representam diferentes
tipos de processos: um é controlado, o outro é automático. Por
fazendo tais distinções qualitativas, parece que esta aplicação
abordagem não pode, em princípio, explicar os problemas de Macleod e Dun-
descobertas de bar (1988), que mostram que a nomeação de cores pode aparecer
ser controlado em um contexto, mas automático em outro (ou seja,
quando está em competição com uma tarefa menos praticada). Em contraste,
nosso modelo leva em conta essas descobertas em termos de diferenças em
os pontos fortes relativos de dois caminhos concorrentes, ambos os quais
pode ser considerado automático.
Embora nosso modelo indique que há um continuum de

automaticidade, não rejeita a existência de processos controlados
cessando. No extremo inferior do continuum da automaticidade,
onde não existe um caminho pré-existente para executar uma tarefa,
O processamento deve ocorrer de uma maneira muito diferente. Considere, por exemplo
ple, um sujeito a quem é dito para dizer “vermelho” quando um determinado aleatório
figura é apresentada e dizer “verde”, “azul”. e assim por diante para
cada uma de várias outras formas. Inicialmente, o sujeito não terá a
conexões relevantes para executar a tarefa. Neste ponto, o
tarefa pode ser realizada com a ajuda do experiente
mentor (por exemplo, o sujeito pode ser lembrado da palavra colorida que
corresponde à forma na tela). O sujeito pode tentar
aprender cada correspondência, usando associações verbais para o
formas (¢.g., laranja é o nome da forma que se parece com Flor-
ida) ou outros mnemônicos. Assumimos que tais processos dependem
em caminhos indiretos que podem ser usados para estabelecer pelo menos alguns
associações arbitrárias de forma relativamente rápida, mas também assumimos que
o processamento nessas vias é lento e requer esforço para manter
manchar. Ao mesmo tempo, à medida que a prática avança e o assunto
recebe feedback sobre as respostas, as conexões seriam
começando a construir um caminho que acabará por permitir a
forma para ativar diretamente a resposta correta, sem recurso
à mediação verbal indireta, à mediação mnemônica ou a ambas. Al-
embora a aprendizagem ocorra de forma mais gradual nesses caminhos diretos,
leva a um processamento mais rápido e mais forte do que é possível
usando vias indiretas.
Assim, embora os sujeitos possam responder corretamente sem

ajuda final depois de apenas algumas tentativas, assumimos que o caminho direto
maneira geralmente não seria suficiente neste ponto para produzir
a resposta. A ativação de uma resposta seria baseada na
combinação de informações diretas e indiretas
mecanismos, com a importância relativa da via direta
crescendo continuamente ao longo dos testes e a contribuição dada pelo
diminuição da via indireta. Em resumo, o que vemos durante
as fases iniciais da prática podem refletir uma transição gradual
de uma dependência de caminhos indiretos para caminhos diretos.
Há uma correspondência parcial entre o nosso indi-

distinção correta e a distinção tradicional entre con-
controlado e automático. Como já foi observado, um processo baseado em
caminhos indiretos teriam todas as características do que é típico
chamado de processo controlado: seria lento, poderia
consiste em uma série de etapas que podem ser interrompidas ou interferidas,
e pode depender da memória declarativa (verbal) (por exemplo
“Flórida é laranja”) ou outros mnemônicos explícitos que exijam
esforço e a alocação de atenção. Por outro lado, em alta
extremos da prática, o desempenho direto corresponderia
muito próximo do que normalmente tem sido chamado de automático: Processamento
Tarefas Novas Tarefas Altamente Praticadas

"direto com.
Indireto ——a ke direc) —= Fraco Direto —am- Forte direto
Controlado a» Controlado ——m= Automático
Figura 15. Tipos de processamento: A relação dos dis-

distinção entre processamento direto e indireto até a distinção tradicional
distinção entre processamento controlado e automático no que diz respeito a
grau de prática.
seria muito mais rápido, menos suscetível a interferências, mais ca-

capaz de produzir interferência e menos influenciado pela alocação
cação de atenção. No meio, porém, a correspondência
entre essas distinções se desfaz. Como as simulações pré-
enviados neste artigo demonstram, um processo que é completamente
direto pode, em algumas circunstâncias, exibir todas as propriedades
vínculos geralmente atribuídos a um processo controlado. Assim, propomos
que os processos que foram anteriormente classificados como controlados
poderiam ser mais lucrativamente segregados naqueles que são diretos
e aqueles que são indiretos. Dentro da gama de processos diretos,
haveria um espectro contínuo de forças de caminho que
abrangem a gama de diferentes graus de automaticidade. Figura 15
ilustra a correspondência entre o uso tradicional e
os termos aqui propostos.
O modelo fornece uma conta explícita de processos diretos
e mostra como as mudanças na força desses processos, que
resultado da prática, pode levar a mudanças aparentemente qualitativas
no desempenho. O modelo é menos explícito sobre programas indiretos
cessações. Porque nosso foco estava na natureza e na interação de
processos diretos, os processos indiretos foram incluídos em apenas um
simulação (Simulação 4) para capturar o desempenho do shape-
tarefa de nomeação no início do treinamento.
Os aspectos significativos da nossa implementação de uma abordagem indireta

processo (ver Simulação 4) era que dependia de um módulo extra
no caminho de processamento e que as conexões neste caminho
estavam disponíveis no início do treinamento, antes que as conexões fossem estabelecidas.
desenvolvido na via direta. Esta implementação capturou
a dinâmica mais lenta dos processos indiretos que comumente têm
sido observado. No entanto, não capturou outras características do
processos indiretos, como sua flexibilidade e o propósito geral
natureza dos mecanismos envolvidos. No entanto, há
são extensões do nosso modelo que podem capturar alguns desses
características. Por exemplo, o único módulo adicional usado em
A Simulação 4 poderia ser substituída por uma série de módulos – por
talvez participando de vários caminhos de processamento diferentes -
que tinham conexões altamente adaptativas, mas rapidamente decadentes.
Essas propriedades capturariam o caráter flexível, de uso geral,
mas mais lento e menos estável, natureza do processamento indireto. Al-
embora a pesquisa do PDP nesta área esteja apenas começando, vários projetos de PDP
modelos que utilizam tais mecanismos já começaram a aparecer
(por exemplo, Hinton & Plaut, 1987; Schneider, 1985; Schneider & Det-
Weiler, 1987).
Atenção e controle do processamento
'Argumentamos que uma diferença importante entre o nosso di-

distinção reto-indireto e a dicotomia tradicional entre
entre processamento controlado e automático é que em nosso

Além disso, processos de qualquer tipo podem exibir características de desempenho
características tradicionalmente associadas ao processamento controlado,
como velocidade mais lenta e suscetibilidade a interferências. O
a mesma diferença pode ser encontrada entre essas duas abordagens
em relação ao controle atencional do processamento.
No cerne da distinção teórica entre controle

e processamento automático são duas suposições básicas: Con-
o processamento controlado depende da alocação de atenção; auto-
o processamento automático ocorre independentemente da atenção. À medida que dis-
discutido na Simulação 5, há razões para acreditar que poucos, se houver,
os processos são inteiramente imunes aos efeitos da atenção. No
simulações que apresentamos, mesmo os caminhos mais fortes, nos quais
o processamento exibia todos os outros atributos de automaticidade,
o processamento foi afetado pela alocação de atenção. Para a prova-
ple, na Simulação 1, embora o processamento no caminho da palavra
ocorreu sem a alocação de atenção, levando a interferências
Com a nomeação de cores, esse processamento foi apenas parcial e
foi insuficiente para determinar qual resposta foi dada. Simu-
A comparação 5 mostrou que o processo de leitura de palavras foi diretamente influenciado
influenciado por mudanças na alocação de atenção.
A proposta de que os processos diretos estão sujeitos a atenção

controle é bem diferente da proposta de que uma tarefa específica
está sujeito ao controle da atenção. Assim, outros (por exemplo, Shiffrin,
1988) tentaram explicar o fato de que a programação automática
tarefas de processamento, como leitura de palavras, estão sujeitas a atenção
controle, argumentando que o comportamento depende de numerosos processos,
alguns dos quais são automáticos e alguns dos quais podem ser con-
trollado. Nesta visão, o controle sobre o desempenho de uma tarefa
poderia ser explicado pela alocação ou retirada de atenção
dos processos controlados envolvidos, preservando a independência
dependência dos processos automáticos dos efeitos da atenção.
Embora não contestemos a afirmação de que o comportamento é
composto por muitos processos componentes, nosso modelo afirma que todos
desses processos podem estar sujeitos, em vários graus, ao controle
pela atenção.
Atenção como modulação do processamento
Dado que todos os processos cognitivos estão sujeitos, em algum grau,

ao controle da atenção, surge a questão sobre como esse controle
é alcançado. A atenção é implementada no modelo como o mod-
ulação de processamento em um caminho. Isso ocorre pela entrada de
unidades de atenção (demanda de tarefa), que causam uma mudança na resposta
capacidade de unidades em uma via de processamento.
A atenção usa exatamente os mesmos mecanismos de processamento que

os outros componentes do modelo. As conexões do
unidades de atenção para as unidades em uma via de processamento são do tipo
mesmo tipo que as conexões dentro do próprio caminho, e at-
informação intencional é representada da mesma maneira que qualquer
outras informações na rede: como um padrão de ativação sobre
um conjunto de unidades. Como tal, a entrada que um caminho recebe de
as unidades de atenção são qualitativamente iguais às informações recebidas
de qualquer outra fonte de informação na rede. Atenção
pode ser visto simplesmente como uma fonte adicional de informação
que fornece um contexto sustentado para o processamento de sinais
dentro de um caminho específico. Assim, os mecanismos de atenção são
não recebeu status especial no modelo e, em geral, uma atenção
módulo adicional pode ser pensado como qualquer módulo que tenha um conjunto
de conexões que permitem modular o processamento em outro

caminho. Pode haver muitos desses módulos dentro de um sistema, um
determinado módulo pode modular um ou mais caminhos, e
pode até participar diretamente de um conjunto de caminhos de processamento
maneiras enquanto serve para modular outras. Essa visão da atenção
O controle é semelhante à visão de recursos múltiplos que foi
expresso por outros (por exemplo, Allport, 1982; Hirst & Kalmar, 1987,
Navon & Gopher, 1979; Wickens, 1984).
Nossa implementação de modulação atencional é diferente

de vários outros relatos recentes de atenção. Em Anderson
(1983) teoria ACT*, a atenção está relacionada com a competição por
representação na memória de trabalho em vez da modulação
de processamento em caminhos que de outra forma seriam automáticos. Schneider
(1985) forneceram um relato da atenção como a modulação da
informações em uma rede PDP. No entanto, seu modelo usa uma
mecanismo de modulação atencional (conexão multiplicativa
ções) que é qualitativamente distinto de outros tipos de processos
na rede, ao contrário do modelo que apresentamos.
A noção de atenção como modulador, juntamente com a ideia

que o processamento é contínuo e que as ativações resultantes
são classificados em força, tem uma longa história na literatura de atenção
cultura; a ideia é essencialmente a mesma sugerida por Treis-
homem (1960). Treisman reivindicou mensagens tailandesas fora do fo-
os pedidos de atenção não foram completamente excluídos; em vez disso, o fluxo de
a informação foi simplesmente atenuada no canal autônomo.
Isso é exatamente o que acontece em nosso modelo. Na verdade, o próprio
mesmos mecanismos de modulação da via que usamos para
implementar a seleção de tarefas na tarefa Stroop (cor ou palavra)
poderia ser usado para implementar a seleção de canais em escuta dicótica
(por exemplo, Treisman, 1960), alocação espacial de atenção (por exemplo,
Kahneman & Henik, 1981), pesquisa por categoria (por exemplo, Schneider &
Shiffrin, 1977; Shiffrin & Schneider, 1977), ou outras tarefas
envolvendo atenção seletiva.
Muitos desses fenômenos começaram a ser explorados produzindo

ativamente dentro da estrutura do PDP (por exemplo, Mozer, 1988; Phaff, 1986;
Schneider & Detweiler, 1987). Por exemplo, Mozer (1988) ad-
vestiu a alocação espacial de atenção usando mecanismos PDP
semelhantes aos que descrevemos. Ao introduzir uma rede
de unidades correspondentes às localizações da retina (em vez de di-
menções) e tendo unidades de viés de atenção representando
locais, a atenção pode ser alocada para locais específicos. Como em nosso
modelo, as informações que estão no foco de atenção são processadas para
um grau maior do que informações que não estão no foco da atenção
ção. A extensão do nosso modelo neste sentido proporcionaria uma
meios para simular a alocação espacial de atenção no Stroop
tarefa (por exemplo, Kahneman & Henik, 1981).
Finalmente, no que diz respeito aos mecanismos de módulo atencional

lação, uma questão geral importante é se a facilidade de atenção
controla o processamento dentro da via atendida, suprime-o em
o caminho autônomo, ou ambos. Nossa estrutura é, em princípio
ple, agnóstico nesta questão; atenção poderia ser implementada também
pode ser um efeito facilitador ou inibitório, ou uma combinação. de
ambos. Nas simulações que apresentamos, no entanto, a atenção
principalmente um efeito facilitador: as especificações da tarefa colocam as unidades em
o caminho frequentado em uma parte mais responsiva de seu dy-
faixa nâmica. Isso conseguiu capturar o fenômeno central
ena do efeito Stroop e a relação entre a prática,
automaticidade e atenção que nos propusemos a explicar. No entanto,
há razões para suspeitar que também é necessário um esforço para filtrar
mensagens potencialmente interferentes. Por exemplo, o processamento é

normalmente mais lento em ensaios de controle se estes forem misturados com interferentes.
em testes. Uma maneira de explicar isso é assumir que a atenção
é necessário tanto para suprimir o canal não atendido quanto para ativar
melhorar o processamento no atendido e aquele suprimindo
requer recursos que diminuem a capacidade de facilitar
o outro. A estrutura de modelagem que descrevemos poderia ser
usado para explorar, em simulações, quais dessas explicações podem
melhor levar em conta os dados empíricos relevantes.
Natureza Contínua do Processamento
A suposição de que a informação é classificada e propagada

continuamente de um nível para o próximo distingue nosso modelo
partir de modelos de estágios discretos, nos quais o processamento deve ser completo
completa em um estágio antes que a informação esteja disponível em outro
er. No modelo aqui apresentado, a informação em um nível é
continuamente disponível em níveis subsequentes. Como tal, um processo
não precisa ser concluído para afetar o desempenho. É pré-
precisamente o processamento parcial de informações no mais forte dos
duas vias que produzem efeitos de interferência e facilitação.
Neste aspecto, nosso modelo é semelhante ao proposto por Logan

(1980). Ambos os modelos utilizam mecanismos de processamento contínuo.
nismos e explicar os efeitos de interferência (e facilitação) em termos
da força relativa dos caminhos usados por programas concorrentes
cessações. De acordo com o modelo de Logan (1980), “a evidência é tão-
presume-se que se acumula ao longo do tempo em alguma decisão composta
processo até que um limite seja excedido e uma resposta seja emitida”
(pág. 528). Diferentes fontes de evidência (por exemplo, diferentes estímulos
ou diferentes dimensões de estímulo) são ponderados para que as evidências
acumula de cada um em taxas diferentes. Este modelo contabiliza
para o efeito Stroop, atribuindo pesos mais fortes à leitura de palavras
do que nomear cores. A força das conexões em um
caminho em nosso modelo são análogos aos pesos atribuídos a
um processo no modelo de Logan (1980). Em ambos os modelos, atenção
atua modulando a eficácia com que a informação é
acumula de cada processo de uma maneira que responde a
as exigências da situação actual.
Contudo, nosso modelo difere do de Logan (1980) em vários aspectos.

aspectos importantes, alguns dos quais levam a diferenças significativas
influências no desempenho. Primeiro, o modelo de Logan (1980) é linear
modelo, no que diz respeito à forma como a informação é acumulada
ocorre tanto em função do tempo quanto em função do caminho
força. Os mecanismos de processamento em nosso modelo são não lin-
ouvido em ambos os aspectos. Isso permite que o modelo leve em conta
para a assimetria entre interferência e facilitação. Lo-
o modelo de Gan (1980) não pode explicar esta descoberta. No entanto,
talvez a diferença mais importante entre os dois modelos
é que o modelo de Logan (1980) não inclui nenhum mecanismo
para aprendizado. Os pesos associados aos processos automáticos
são fixos. Um dos principais pontos fortes do nosso modelo é que ele
pode abordar diretamente a relação entre treinamento e auto-
funcionalidade em termos de um conjunto integrado de aprendizagem e processamento
mecanismos.
Força e contas de automaticidade baseadas em instâncias
O modelo apresentado neste artigo baseia-se no pressuposto

que os processos diretos se desenvolvam através do fortalecimento da
conexões entre unidades de processamento. Neste aspecto, é um

de uma classe geral de modelos que explicam a aprendizagem em termos de
processo de fortalecimento. Uma abordagem alternativa para aprender e
a automaticidade é baseada em instâncias (por exemplo, Hintzman, 1986; Logan,
1988). De acordo com a teoria da instância, cada exposição a um estímulo
lus é codificado separadamente na memória. No modelo de Logan (1988),
tanto a codificação quanto a recuperação de informações relacionadas ao estímulo
posturas é obrigatória. Tempos de recuperação para instâncias individuais
são normalmente distribuídos, com a primeira instância recuperada con-
trollando a resposta. Logan (1988) demonstrou que
a teoria da postura prevê com precisão os efeitos da prática em situações de não conflito
tarefas, levando em conta o fato de que tanto a média quanto o padrão
desvio padrão dos tempos de reação diminui de acordo com uma potência
lei com o número de julgamentos (ou seja, instâncias codificadas). O-
tory também prevê que o expoente para ambas as funções deve ser
o mesmo.
Vários relatos baseados em força forneceram ajustes para o

lei de potência para tempo médio de reação (por exemplo, Anderson, 1983;
Schneider, 1985), e o modelo que apresentamos satisfaz os requisitos adicionais
restrição nacional de que o desvio padrão diminua ao mesmo tempo
taxa como tempo médio de reação. No entanto, Logan (1988) ex-
pressionou outras preocupações sobre teorias de aprendizagem baseadas na força
ing. Por exemplo, ele afirmou que as contas baseadas na força devem
contar com protótipos fixos: É o fortalecimento da conexão
entre “estímulos genéricos” e “respostas genéricas” que
constituem aprendizagem em tais sistemas (Logan, 1988). Esta crítica
O cismo se aplica principalmente a teorias que usam representações discretas ou locais.
sensações de estímulos. Em outro lugar (McClelland & Rumelhart,
1985), foi demonstrado que esta limitação da força
abordagem baseada pode ser superada com o uso de
representações. Nesses sistemas, a memória para um evento não é
codificado em uma única conexão entre um estímulo genérico e
uma resposta genérica, mas nos pontos fortes de um conjunto de conexões
envolvendo diversas unidades diferentes que são usadas para fornecer
lapidando, mas ainda assim representações distintas de indivíduos
estímulos e respostas. No modelo atual, a representação local
foram usadas. No entanto, em investigações preliminares usando
representações distribuídas, não tivemos dificuldade em reproduzir
duzindo os fenômenos básicos de interferência (resultantes de
quantidades iguais de treinamento) relatados neste artigo. Esses efeitos
parecem ser gerais para redes PDP em cascata compostas por
unidades de processamento não linear contínuas.
No momento, as teorias baseadas em instâncias e forças parecem

igualmente capazes de explicar comportamentos de aprendizagem. No entanto, não é
claro como uma conta baseada em instância explicará alguns dos
fenômenos de interferência que abordamos. Como uma suposição
de sua teoria, Logan (1988) afirmou que “atender a um estímulo
é suficiente para recuperar da memória tudo o que foi associado
com ele no passado” (p. 493), ou seja, a recuperação é obrigatória
e, por implicação, não modulado. A interferência é produzida em
este sistema quando recuperada informação associada a um estímulo
lus entra em conflito com a resposta desejada, e esta informação é
recuperado antes da informação relevante. Tal como acontece com o simples
conta de velocidade de processamento, esta suposição sugere que
dado tempo suficiente para recuperação, as cores devem interferir
leitura de palavras tanto quanto as palavras fazem com a nomeação de cores. No entanto,
sabemos pelos dados de MO Glaser e Glaser (1982) que este
está incorreto. Assim, a teoria das instâncias enfrenta as mesmas dificuldades
que as contas simples de velocidade de processamento enfrentam para explicar

Efeitos de interferência Stroop.
De modo mais geral, à medida que a teoria das instâncias é desenvolvida atualmente,
não especifica mecanismos para influências atencionais sobre o ser-
comportamento. Logan (1988) sugeriu que “o processo de recuperação pode
ser controlado pela manipulação de dicas de recuperação ou entrada de estímulo,
ou ambos, e o processo de decisão subsequente pode ser inibido
antes que resulte em uma resposta aberta” (p. 513). No entanto, não
mecanismo é fornecido para esses processos, nem foi
comprovado se esses processos podem explicar a interação
relações entre interferência e efeitos práticos que temos ad-
vestido neste artigo. Embora não tenhamos fornecido um mecanismo
nismo que determina como e onde a atenção será alocada,
especificamos um mecanismo pelo qual a alocação de atenção
pode influenciar o processamento, e mostramos como isso
mecanismo interage com a aprendizagem.
Recursos e Capacidade
Uma questão final diz respeito às noções de recursos de processamento e

limitações de capacidade. O modelo instancia processos semelhantes
à visão de recursos múltiplos que foi expressa por outros
(por exemplo, Allport, 1982; Logan, 1985; Navon & Gopher, 1979;
Wickens, 1984) e à noção de doença cerebral funcional
resistência descrita por Kinsbourne e Hicks (1978). Esses teo-
ries compartilham a visão de que o desempenho de uma tarefa normalmente envolve
muitos processos, que por sua vez dependem de uma multiplicidade de processos
fontes. Eles prevêem que dois comportamentos competirão por
capacidade e podem interferir uns com os outros até o limite
que dependem dos mesmos recursos para finalidades diferentes.
Nossa abordagem sugere maneiras pelas quais podemos começar a pensar, em
termos mais específicos, sobre a natureza desses recursos e
como as limitações em sua capacidade podem afetar o desempenho. Por isso,
os módulos que compõem as vias de processamento podem ser pensados
como um conjunto de recursos dentro do sistema. Esses recursos são
compartilhada por dois ou mais processos na medida em que seu caminho
formas se cruzam – isto é, elas dependem de um conjunto comum de módulos.
No modelo, quando dois sinais a serem processados por um determinado
módulo são díspares (ou seja, envolvem diferentes padrões de atuação).
tivação), eles competirão por representação dentro dessa modalidade
ule. Nesse sentido, a capacidade de processamento desse módulo, ou
recurso, pode ser considerado limitado; isto é, não pode
apoiar totalmente o processamento de ambos os sinais ao mesmo tempo. Schneider
(1985; Schneider & Detweiler, 1987) apresentou um resultado semelhante
visão das limitações de capacidade em termos de conversa cruzada dentro da moda
regras (ver também Navon & Miller, 1987).
Embora não tenhamos buscado uma análise quantitativa de ca-

pacidade neste artigo (ver Rosenfeld & Touretzky, 1988, para uma
exemplo de como isso pode ser feito em sistemas PDP), o modelo
mostrou que quando informações de duas fontes convergiam
um módulo comum (o módulo de resposta da rede), inter-
ocorreu uma referência. Obtivemos resultados semelhantes em outros sim-
ulações, nas quais dois estímulos (por exemplo, duas palavras) processavam
atualmente no mesmo caminho também levou à interferência.
Tal como na visão de recursos múltiplos, a nossa explicação da interferência

efeitos concentra-se nas limitações de capacidade dos módulos diretamente
envolvidos em uma via de processamento, ou seja, módulos que ficam no
caminho ao longo do qual a informação flui da entrada para a saída.
No entanto, o modelo também sugere formas de pensar sobre
outros tipos de limitações de capacidade. Por exemplo, a atenção

módulo não estava diretamente ao longo de um dos caminhos de processamento
na rede. No entanto, desempenhou um papel importante na promoção
processamento: A Simulação 5 mostrou que todos os processos dependiam de algum
medida na alocação de atenção. Para um determinado processo, isso
exigia que um padrão específico de ativação estivesse presente em
o módulo de atenção. Esse padrão era diferente para diferentes
processos, de modo que qualquer tentativa de especificar mais de um processo
levaria à competição de representações dentro do
módulo de configuração. Nessa perspectiva, a capacidade de atenção
módulo de integração pode ser visto como limitado, nem sempre é possível
capaz de alocar atenção ao máximo a todos os processos ao mesmo tempo. Ser-
porque processos mais fortes têm requisitos mais fracos para
atenção (ver Simulação 5), tais processos podem ser menos suscetíveis
suscetível a limitações de capacidade na atenção correspondente
módulo. Isto é consistente com a noção tradicional de que o auto-
A funcionalidade está associada a uma maior independência da capacidade
limitações de recursos atencionais. No entanto, a nossa abordagem al-
baixa que pode haver mais de um recurso de atenção
(módulo) dentro do sistema e que diferentes processos podem
dependem de módulos diferentes. Como tal, até que ponto as limitações
alterações na capacidade de atenção afetarão o desempenho dependerão
sobre os processos específicos envolvidos no desempenho da tarefa
(ou conjunto de tarefas), até que ponto esses processos dependem de at-
recursos tencionais e se os recursos atencionais são
iguais ou diferentes para os vários processos envolvidos.
A importância das diferentes fontes de limitações de capacidade
(por exemplo, aqueles que surgem diretamente dentro de um caminho ou dentro de associações
módulos de atenção) precisam de mais esclarecimentos,
tanto teórica como empiricamente. No entanto, voltamos a enfatizar,
neste contexto, que a informação atencional não é qualitativamente
diferente de outras informações em nossa estrutura. A competição
transição entre padrões de ativação dentro de um modo de atenção
A regra é análoga à competição que pode ocorrer entre padrões
termos de ativação em qualquer outro módulo. Isto sugere que mod-
recursos regulamentares, como o módulo atencional em nosso modelo,
pode ser governado pelos mesmos tipos de princípios e restrições
que governam mais recursos locais dentro do sistema.
Conclusão
O modelo que apresentamos fornece não apenas uma

contagem dos dados empíricos sobre o efeito Stroop, mas também uma análise mais
modelo geral de processamento em tarefas altamente praticadas e sua
relação à atenção. Como outros teóricos (por exemplo, Kahneman &
Treisman, 1984; Logan, 1980; Schneider, 1985), notamos
que há muitos problemas com uma visão de tudo ou nada do auto-
maticidade. Nosso modelo sugere que uma abordagem mais útil é
considerar a automaticidade em termos de um continuum baseado em
força do processamento. Descrevemos um conjunto de mecanismos
que pode produzir fortalecimento gradual e contínuo, e
mostramos como esses mecanismos podem explicar vários
fenômenos empíricos relativos à automaticidade. Em particular,
esses mecanismos capturam o continuum que parece existir
nos atributos de automaticidade e relacionar esse continuum di-
diretamente aos efeitos da prática. As diferenças na prática levam a
diferenças na força do processamento, e isso torna possível
capaz de capturar assimetrias de desempenho, como aquelas ob-
serviu na tarefa Stroop. O modelo também indica que Stroop-
efeitos semelhantes podem surgir da competição entre duas qualidades

processos praticamente semelhantes – que diferem apenas em sua força –
levando-nos a questionar a visão tradicional de que a interferência
efeitos podem ser usados de forma confiável para distinguir entre efeitos controlados
e processos automáticos. Finalmente, o modelo sugere maneiras de
caracterizar a noção de capacidade com mais detalhes.
Os mecanismos utilizados neste modelo mostram como os princípios

de processamento contínuo, expresso em termos do quadro PDP
trabalho, pode ser aplicado ao estudo da atenção e ao controle da
o que chamamos de processos diretos. Um desafio para o nosso modelo,
no entanto, e para a abordagem do PDP em geral, é caracterizar
os mecanismos subjacentes ao processamento indireto. Vemos isso como
uma direção importante para pesquisas futuras.
Referências
Allport, DA (1982). Atenção e desempenho. Em GI Claxton

(Ed.), Novos rumos na psicologia cognitiva (pp. 112-153). Londres:
Routledge e Kegan Paul.
Allport, DA, Antonis, B., & Reynolds, P. (1972). Sobre a divisão de

atenção: Uma refutação da hipótese do canal único. Trimestral
Jornal de Psicologia Experimental, 24, 225-235.
Anderson, Jr (1982). Aquisição de habilidade cognitiva. Re-

ver, 89, 369-406.
Anderson, Jr (1983). A arquitetura da cognição. Cambridge, Massachusetts:

Imprensa da Universidade de Harvard.
Blackburn, JM (1936). Aquisição de competências: Uma análise da aprendizagem

curvas (Relatório HRB nº 73). Washington, DC: Governo dos EUA
Escritório de impressão.
Broadbent, DE (1970). Conjunto de estímulos e conjunto de respostas: Dois tipos de

atenção seletiva. Em D. 1. Mostofsky (Ed.), Atenção: Contemporâneo
teorias e análises (pp. 51-60). Nova York: Appleton-Century-
Croft.
Marrom, W. (1915). Pratique associar nomes de cores a cores. Psic-

Revisão psicológica 22, 45-55.
Bryan, WL e Harter, N. (1899). Estudos sobre a linguagem telegráfica.

A aquisição de uma hierarquia de hábitos. Revisão Psicológica, 6,
345-375.
Cattell, JM (1886). O tempo que leva para ver e nomear objetos. Mente,
11, 63-65.
Deutsch, JA (1977). Sobre o efeito de categoria na pesquisa visual. Percepção

& Psicofísica, 21, 590-592.
Dunbar, K. (1985). O papel de múltiplas fontes de interferência em uma imagem

análogo de palavra-chave da tarefa Stroop. Dissertação de doutorado não publicada
tação, Universidade de Toronto.
Dunbar, K. e MacLeod, CM (1984). Uma corrida de cavalos de cor diferente:

Padrões de interferência Stroop com palavras transformadas. Diário de Ex-
Psicologia perimental: Percepção e Desempenho Humano, 10,
622-639.
Dyer, FN (1973). O fenômeno Stroop e sua utilização no estudo de

processos perceptivos, cognitivos e de resposta. Memória e Cognição,
1, 106-120.
Fraisse, P. (1969). Por que nomear é mais demorado do que ler? Acta Psicologia-
ica, 30, 96-103.
Gatti, SV e Egeth, HE (1978). Falha na seletividade espacial na visão.

Boletim da Sociedade Psiconômica, 11, 181-184.
Glaser, MO e Glaser, W, R. (1982). Análise do curso temporal do Stroop

fenômeno. Journal of Experimental Psychology: Human Percep-
ção e Desempenho, 8, 875-894.
Glaser, WR e Diingelhoff, F.-J. (1984). O curso do tempo da imagem

interferência de palavras. Journal of Experimental Psychology: Human Per-
recepção e desempenho, 10, 640-654,
Gumenik, NÓS e Glass, R. (1970). Efeitos da redução da legibilidade
das palavras no teste Stroop de palavras coloridas. Ciência Psiconômica, 20,

247-248.
Hasher, L. e Zacks, RT (1979). Processos automáticos e trabalhosos

em memória. Jornal de Psicologia Experimental: Geral, 106, 356 ~
388.
Hinton, GE e Plaut, DC (1987). Usando pesos rápidos para desfocar o antigo

recordações. No Programa da Nona Conferência Anual do Cogni-
Sociedade Científica tiva (pp. 177-186). Hillsdale, NJ: Erlbaum.
Hintzman, DL (1986). “Abstração de esquema” em um traço múltiplo

modelo. Revisão Psicológica, 93, 411-428.
Hintzman, DL, Carre, A, Eskridge, VL, Owens, AM, Shaff, §. §.,

& Sparks, ME (1972). Efeito “Stroop”: Fenômeno de entrada ou saída
não? Jornal de Psicologia Experimental, 95, 458-459.
Hirst, W. e Kalmar, D. (1987). Caracterizando recursos atencionais.

Jornal de Psicologia Experimental: Geral, 116, 68-81.
Hunt, E. e Lansman, M. (1986). Modelo unificado de atenção e problemas

resolução do problema. Revisão Psicológica, 93, 446-461,
James, W. (1890). Princípios de psicologia. Nova York: Holt.
Kahneman, D. e Chajczyk, D. (1983). Testes de automaticidade de

leitura: Diluição dos efeitos Stroop por estímulos irrelevantes para a cor. Diário
de Psicologia Experimental: Percepção e Desempenho Humano, 9,
497-509.
Kahneman, D. e Henik, A. (1981). Organização perceptiva e atenção

ção. Em M. Kubovy & JR Pomerantz (Eds.), Organização perceptual
(pp. 181-211). Hillsdale, NJ: Erlbaum.
Kahneman, D. e Treisman, A. (1984). Mudando as visões de atenção e

automaticidade. Em R. Parasuraman, DR Davies e J. Beatty (Eds.),
Variedades de atenção (pp. 29-61). Nova York: Academic Press.
Keren, G. (1976). Algumas considerações sobre dois tipos de atenção seletiva

ção. Jornal de Psicologia Experimental: Geral, 105, 349-374.
Kinsbourne, M. e Hicks, RE (1978). Espaço cerebral funcional: A
modelo para efeitos de overflow, transferência e interferência no desempenho humano
mance: Uma revisão tutorial. Em J. Requin (Ed.), Atenção e desempenho
mance VII (pp. 345-362). Hillsdale, NJ: Erlbaum.
Klein, GS (1964). Poder semântico medido através da interferência

de palavras com nomenclatura de cores. Jornal Americano de Psicologia, 77.
576-588.
Kolers, PA (1976). Lendo um ano depois. Jornal de Psicologia Experimental

psicologia: Aprendizagem e Memória Humana, 2, 554-565.
LaBerge, D. e Samuels, SJ (1974). Em direção a uma teoria do automático
processamento de informações na leitura. Psicologia Cognitiva, 6, 293-323.
Ligação, SW (1975). A teoria do julgamento relativo de duas opções de escolha

tempo de resposta. Jornal de Psicologia Matemática, 12, 114-135.
Logan, GD (1978). Atenção na classificação dos personagens; Evidência para

a automaticidade dos estágios componentes. Jornal de Psicologia Experimental
psicologia: Geral, 107, 32-63.
Logan, GD (1979). Sobre o uso de uma carga de memória simultânea para medir
atenção segura e automaticidade. Jornal de Psicologia Experimental:
Percepção e Desempenho Humano, 5, 189-207.
Logan, GD (1980). Atenção e automaticidade em Stroop e priming

tarefas: Teoria e dados. Psicologia Cognitiva, 12, 523-553.
Logan, GD (1985). Habilidade e automaticidade: relações, implicações,

e direções futuras. Jornal Canadense de Psicologia, 39, 367-386.
Logan, GD (1988). Rumo a uma teoria de instância de automatização. Psic-

Revisão Chológica, 95, 492-527,
Lupker, SJ e Katz, AN (1981). Fatores de entrada, decisão e resposta

na interferência de imagem ~ palavra. Jornal de Psicologia Experimental:
Aprendizagem e Memória Humana, 7, 269-282.
MacLeod, CM (1989). Meio século de pesquisa sobre o efeito Stroop:

Uma revisão crítica. Manuscrito submetido para publicação.
MacLeod, CM e Dunbar, K. (1988). Treinamento e interação tipo Stroop

referência: Evidência de um continuum de automaticidade. Jornal de Experiência
Psicologia mental: Aprendizagem, Memória e Cognição, 14, 126-135.
McClelland, JL (1979). Sobre as relações temporais dos processos mentais: uma

exame de sistemas de processos em cascata. Re-

ver, 86, 287-330.
McClelland, JL (1989). Processamento distribuído paralelo: implicações

para cognição e desenvolvimento. Em RGM Morris (Ed.), Paralelo
processamento distribuído: implicações para psicologia e neurobiologia
(págs. 8-45). Oxford, Inglaterra: Oxford University Press.
McClelland, JI. L., & Rumelhart, DE (1985). Memória distribuída

e a representação de informações gerais e específicas. Jornal de
Psicologia Experimental: Geral, 114, 159-188.
Moray, N. (1969). Atenção: Processos seletivos na visão e na audição.

Londres: Hutchinson.
Mozer, M. (1988). Um modelo conexionista de atenção seletiva no visual

percepção. Nos Anais da Décima Conferência Anual da
Sociedade de Ciências Cognitivas (pp. 195-201). Hillsdale, NJ: Erlbaum.
Navon, D. e Gopher, D. (1979). Sobre a economia do pro-humano

sistema de acesso. Revisão Psicológica, 86, 214-255.
Navon, D. e Miller, J. (1987). Papel do conflito de resultados na tarefa dupla

interferência. Jornal de Psicologia Experimental: Percepção Humana
e Desempenho, 13, 435-438.
Neely, JH (1977). Preparação semântica e recuperação de membros lexicais

ory: Papéis de ativação de propagação sem inibição e capacidade limitada
atenção. Jornal de Psicologia Experimental: Geral, 106, 226
254.
Newell, A. e Rosenbloom, PS (1981). Mecanismos de aquisição de habilidades

e a lei da prática. Em JR Anderson (Ed.), Habilidades cognitivas e
sua aquisição (pp. 1-55). Hillsdale, NJ: Erlbaum.
Phaff, RH (1986). Um modelo conexionista para a atenção: restringindo a par-

processamento de alelos através da modularidade. Dissertação de doutorado não publicada
ção, Unidade de Psicologia Experimental, Universidade de Leiden, The
Holanda.
Pillsbury, WB (1908). Atenção. Nova York: Macmillan.
Posner, M. 1. (1975). Psicobiologia da atenção. Em MS Gazzaniga &

C. Blakemore (Eds.), Manual de psicobiologia (pp. 441-480). Novo
Iorque: Academic Press.
Posner, M. 1 e Snyder, CR (1975). Atenção e controle cognitivo.

Em RL Solso (Ed.}, processamento de informação e cognição (pp. 55-
85). Hillsdale, NJ: Erlbaum,
Proctor, RW (1978). Fontes de interferência de palavras coloridas no Stroop

tarefa de nomeação de cores. Percepção e Psicofísica, 23, 413-419.
Ratcliff, R. (1978). Uma teoria de recuperação de memória. Revisão Psicológica,

85, 59-108.
Reed, P. e Hunt, E. (1986). Um modelo de resposta do sistema de produção

seleção no paradigma Stroop. Manuscrito não publicado.
Regan, J. (1978). Processamento automático involuntário na nomenclatura de cores

tarefas. Percepção e Psicofísica, 24, 130-136.
Rosenfeld, R. e Touretzky, DS (1988). Memorando de símbolos com código grosseiro

rias e suas propriedades. Sistemas Complexos, 2, 463-484,
Rumelhart, DE, Hinton, GE e McClelland, JL (1986). Um general

estrutura para processamento distribuído paralelo. Em DE Rumelhart,
JL McClelland, & the PDP Research Group (Eds.), Distribuição paralela
processamento utilizado: Explorações na microestrutura da cognição (Vol.
eu, pp. 45-76). Cambridge, MA: MIT Press,
Rumelhart, DE, Hinton, GE e Williams, RJ (1986). Aprendizado

representações internas por propagação de erros. Em DE Rumelhart,
JL McClelland, & the PDP Research Group (Eds.), Distribuição paralela
processamento utilizado: Explorações na microestrutura da cognição (Vol.
1, pp. 318-362). Cambridge, MA: MIT Press.
Schneider, W. (1985). Rumo a um modelo de atenção e desenvolvimento

de processamento automático. Em M. 1. Posner & OSM Marin (Eds.),
Atenção e desempenho XI (pp. 475-492). Hillsdale, NJ: Eribaum,
Schneider, W. e Detweiler, MH (1987). Uma arma conexionista/controladora

arquitetura para memória de trabalho. Em G. Bower (Ed.), A psicologia de
aprendizagem e motivação (Vol. 21, pp. 54-119). Nova York: Acadêmico
Imprensa.
Schneider, W. e Oliver, WL (no prelo). Um conexionista instrutível/

arquitetura de controle: Usando instruções baseadas em regras para realizar
aprendizagem conexionista em uma escala de tempo humana. Em K. Van Lehn (Ed.),
Arquiteturas para inteligência. Hillsdale, NJ: Erlbaum.
Schneider, W, e Shiffrin, RM (1977). Hu-
processamento de informações humanas: 1. Detecção, pesquisa e atenção. Psic-
Revisão Chológica. 84, 1-66,
Shaffer, LH (1975). Atenção múltipla em tarefas verbais contínuas. Em

PMA Rabbitt & S. Dornic (Eds.), Atenção e desempenho (pp.
157-167). Nova York: Academic Press.
Shiffrin, RM (1988). Atenção. Em RC Atkinson, RJ Herrnstein,

G. Lindzey, & RD Luce (Eds.), Manual de Steven de experimentação
psicologia: vol. 2. Aprendizagem e cognição (2ª ed., pp. 739-811).
Nova York: Wiley.
Shiffrin, RM e Schneider, W. (1977). Hu-

processamento de informações humanas: II. Aprendizagem perceptiva, at-
tendendo, e uma teoria geral. Revisão Psicológica, 84, 127-190.
Stroop, Jr (1935). Estudos de interferência em reações verbais seriadas.

Jornal de Psicologia Experimental, 18, 643-662.
Treisman, AM (1960). Dicas contextuais na escuta seletiva. Quar-

recentemente Journal of Experimental Psychology, 12, 242-248.
Wickens, DD (1984). Processando recursos em atenção. Em R. Para-

suraman, DR Davies, & J. Beatty (Eds.), Variedades de atenção (pp.
63-102). Nova York: Academic Press.
(O apêndice segue na próxima página)

Apêndice
Parâmetros do Modelo
O desempenho do modelo dependia de muitos parâmetros diferentes.

Vários deles foram fortemente limitados pelos dados, enquanto os valores
outros pareciam ser menos críticos. Aqui, revisamos todos os parâmetros
que foram relevantes para as simulações relatadas e fornecem uma justificativa
para saber como o valor de cada um foi escolhido, quão crítico era esse valor e,
se for caso disso, outros parâmetros com os quais interagiu.
Número de Unidades por Módulo
Este era essencialmente um parâmetro livre. Para manter as redes tão simples
possível, escolhemos o menor número de unidades necessárias para simular
cada tarefa.
Proporção de frequências de treinamento
A rede utilizada nas 2 primeiras simulações foi treinada em palavras e

cores em uma proporção de 10:1. Este valor foi escolhido para capturar tanto as diferenças
influência na velocidade de processamento entre leitura de palavras e nomeação de cores
e o tamanho dos efeitos de interferência e facilitação observados para cores
nomenclatura (ver Figura 54). Este parâmetro interagiu principalmente com o
magnitude da influência atencional no modelo, os parâmetros de
o mecanismo de resposta e o tempo máximo de resposta (veja mais adiante
descrições). O valor real deste parâmetro não parece ser
crítico, e valores variando de 5:1 a 20:1 deram resultados comparáveis,
desde que o tamanho dos parâmetros que acabamos de mencionar foram ajustados para
compensar. O valor real não foi considerado crucial, mas o
a assimetria no treinamento que representou é teoricamente importante:
São quantidades diferenciadas de treinamento que levam a caminhos diferenciados
forças. Isto é consistente com a suposição comum de que a palavra
a leitura é mais praticada do que a nomeação de cores.
Taxa de Aprendizagem
Este parâmetro dimensionou o tamanho das alterações feitas na conexão

pesos em cada tentativa de aprendizagem. O seu valor foi fortemente limitado pela
Dados de MacLeod e Dunbar (1988). Exatamente o mesmo número de treinamento
ensaios por estímulo foram usados na simulação, assim como foram usados no experimento.
estudo ico. Escolhemos uma taxa de aprendizagem que, dado esse número de tentativas,
produziu o ajuste mais próximo dos dados de interferência em cada ponto de teste. Esse
parâmetro era o mesmo para todas as conexões em cada caminho direto
na rede (incluindo as conexões de entrada) em cada simulação.
Entretanto, as conexões na via indireta usada na Simulação 4
foram consertados; isto é, eles tiveram uma taxa de aprendizagem de 0.
Tempo máximo de resposta
Este parâmetro funcionou como nosso critério de treinamento para a Simulação 1.

Depois de especificar uma taxa de aprendizagem (veja a descrição anterior), precisávamos de
alguns
maneira de decidir quando parar de treinar cores e palavras. Treinamento
terminou quando a rede pôde responder com precisão a todos os estímulos de teste.
uli (controle, conflito e estímulos congruentes em cada tarefa) dentro de um determinado
número especificado de ciclos, que chamamos de tempo máximo de resposta. A
valor mais baixo (resposta mais rápida) significava mais treinamento e um valor mais alto
significava menos treinamento. O valor que usamos foi de 50 ciclos. Haviam dois
restrições primárias neste valor: (a) Desempenho do teste após o treinamento
teve que simular o efeito Stroop básico (ver Figura 5), e (b) regressão
de ciclos de simulação em dados empíricos de tempo de reação tiveram que produzir uma
posição
valor de interceptação ativo de magnitude razoável. Um valor pequeno ou zero
interceptar sugeriria, sem razão, que nosso modelo simula todos

os processos envolvidos no desempenho humano; uma interceptação negativa
indicaria que os efeitos dos juros eram apenas uma pequena parte do
desempenho geral do modelo. Os valores de interceptação para todas as simulações
relatados estavam na faixa de 200 a 400 ms. Ambas estas restrições
no tempo máximo de reação foram relativamente fracos e razoáveis
o desempenho foi alcançável com uma ampla gama de valores. Este parâmetro
ter interagido com a proporção de frequência de treinamento (ver descrição anterior)
e os parâmetros de ruído na rede (ver descrições posteriores).
Pesos de entrada predefinidos
Os pesos da entrada para as unidades intermediárias em cada caminho

receberam valores pré-atribuídos no início do treinamento. Isto foi re-
necessário para mudanças no tempo de reação com treinamento para seguir uma lei de potência.
Esta descoberta é teoricamente importante, pois sugere que a lei de potência
só pode se aplicar à aprendizagem de mapeamentos simples e que a aprendizagem em
os estágios iniciais de processamento (por exemplo, codificação de estímulo) não estão
envolvidos
nas tarefas que simulamos. Os valores reais pré-atribuídos ao
os pesos de entrada foram escolhidos com base nos pesos que são alcançados quando
a rede pode aprender esse conjunto de pesos por conta própria,
Caminho Indireto
Este foi o módulo e o conjunto correspondente de pesos que foi adicionado
à rede básica para a Simulação 4. O número de unidades neste mod-
A regra era igual a todas as outras (duas). Os pontos fortes atribuídos ao
conexões neste caminho foram escolhidas para melhor se ajustarem aos dados empíricos
sobre tempos de reação e efeitos de interferência no início do treinamento em
nomenclatura de forma.
Taxa em cascata
Este parâmetro determinou a taxa na qual cada unidade acumulou

ativação. Seu valor era o mesmo para todas as unidades da rede (exceto
unidades de entrada, que sempre foram excitadas ou inibidas ao máximo). O
taxa de cascata interagiu com a taxa de resposta e limite de resposta
para determinar o tempo de reação e o padrão de efeitos de interferência
entre processos. Os valores para esses parâmetros foram escolhidos para fornecer
o melhor ajuste ao efeito Stroop básico, dadas as restrições impostas por
os outros parâmetros dos modelos (ou seja, taxa de aprendizagem, rendimento máximo
tempo de resposta e influência atencional).
Barulho
Isso escalou a magnitude do ruído distribuído gaussiano adicionado ao

entrada líquida de cada unidade (exceto as unidades de entrada). Valores deste parâmetro
e o ruído no mecanismo de resposta (ver descrição posterior) foram
escolhido para fornecer variância máxima sem sacrificar a precisão do
desempenho. Esses parâmetros interagiram com a resposta máxima
tempo para determinar a quantidade de treinamento recebido pelas redes utilizadas
nas Simulações 1, 2, 5 e 6. Eles também influenciaram a relação
navio entre o tempo médio de reação e a variância em função do treinamento.
Os valores foram escolhidos para fornecer a correspondência mais próxima entre os expoentes
das funções de potência que descrevem as mudanças no tempo médio de reação
e desvio padrão com a prática.
Magnitude da influência atencional
Dois parâmetros determinaram a magnitude dos efeitos de atenção em

o modelo. Estes eram o tamanho do viés negativo remanescente nos intermediários.
comeu unidades nas duas vias de processamento e o tamanho dos pesos de

as unidades de demanda de tarefa para essas unidades intermediárias. As grandezas de
esses dois parâmetros foram forçados a serem iguais, de modo que com total
ativação de uma determinada unidade de demanda de tarefa, unidades intermediárias no
a via correspondente teve uma entrada líquida de repouso de 0 e uma ativação de 0,5
(a justificativa para isso é explicada na subseção Seleção Atencional
seção na seção Modelo). O principal efeito de variar esses parâmetros,
portanto, era alterar o nível de ativação de repouso das unidades intermediárias
no caminho autônomo (porque sua unidade de demanda de tarefa não estava
ativo e, portanto, seu viés negativo não foi compensado). A magnitude
da influência atencional afetou o tamanho da interferência e facilitou
efeitos de itação observados. Foi escolhido um conjunto de valores que proporcionasse a
melhor
ajuste aos dados empíricos em cada experimento (veja os Parâmetros Livres
subseção de Métodos de Simulação).
Parâmetros do Mecanismo de Resposta
Três parâmetros foram associados ao mecanismo de resposta: o

taxa em que as evidências se acumularam, o ruído associado a este programa
processo e o limite para uma resposta. Os parâmetros de taxa e limite

termos estavam inversamente relacionados entre si: duplicando a acumulação
taxa foi equivalente a reduzir pela metade o limite de resposta. Juntos, esses
valores interagiram com o tempo máximo de resposta (ver descrição anterior
ção) para determinar o desempenho da rede para uma determinada quantidade de
treinamento. Eles também mostraram uma interação complexa com a taxa em cascata
(ver descrição anterior), o que afetou a magnitude relativa da inter-
efeitos de referência versus diferenças de velocidade de processamento entre o caminho
caminhos. Foram escolhidos valores para esses parâmetros que forneceram o melhor ajuste
ao efeito Stroop básico, dadas as restrições impostas pelos outros
parâmetros dos modelos (ou seja, taxa de aprendizagem, tempo máximo de resposta,
e influência atencional). A quantidade de ruído associada ao re-
mecanismo de resposta interagiu com a quantidade de ruído adicionado ao
entrada líquida de unidades de processamento. As restrições em ambos os parâmetros de ruído
são discutidos na subseção Ruído.
Recebido em 4 de abril de 1988

Revisão recebida em 29 de novembro de 1989
Aceito em 13 de dezembro de 1989 a

CohenDunbarMcC90 en PT

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

CohenDunbarMcC90 en PT

Enviado por

Direitos autorais:

Formatos disponíveis

Traduzido do Inglês para o Português - www.onlinedoctranslator.

Copyright 1990 da American Psychl Association, Inc.

Sobre o controle de processos automáticos: uma distribuição paralela

As visões tradicionais de automaticidade precisam de revisão. Por exemplo, a automaticidade

A natureza da atenção tem sido uma das preocupações centrais

Agradecemos com gratidão os comentários e sugestões úteis

A correspondência relativa a este artigo deve ser endereçada a Jona-

atenção disponível para processos cognitivos. Posner e Snyder

Muitas tarefas têm sido usadas para examinar a natureza da atenção.

! Alguns autores argumentaram que certos processos automáticos são

man e Treisman (1984) sugeriram que os processos podem

Começamos ilustrando a relação entre atenção

Os efeitos observados na tarefa Stroop fornecem uma ilustração clara

A explicação mais simples para o efeito Stroop é que o impacto

Contudo, se a velocidade de processamento for a única variável relevante,

com leitura de palavras apresentando informações de cores antecipadamente

Posner e Snyder (1975) aplicaram a distinção entre

Esta interpretação da tarefa Stroop exemplifica uma visão geral

Este método para identificar processos como automáticos ou controlados

2 Ao longo deste artigo, referências a estímulos de palavras aparecem em caracteres

a nomeação de formas foi testada apresentando assuntos com conflitos

Os resultados de MacLeod e Dunbar (1988) são incompatíveis com

Uma maneira de contabilizar esses dados – em vez de tentar

Natureza Contínua da Velocidade de Processamento

Numerosos estudos demonstraram que a prática produz graduações

Natureza Contínua dos Efeitos de Interferência

O padrão de efeitos de interferência observados no MacLeod

com a nomeação da forma, enquanto após 20 sessões isso não é mais

Esses dados sugerem que a velocidade de processamento e a interferência

O objetivo deste artigo é fornecer um referencial teórico

O modelo tem implicações diretas para o método padrão

O modelo de processamento de informações que descrevemos foi desenvolvido

Características arquitetônicas. Processamento dentro do PDP

Representação de informações. A informação é representada como

um padrão de ativação nas unidades de um módulo. A ativação

Em processamento. O processamento ocorre pela propagação de sinais

Caminhos e seus pontos fortes. Um processo específico é como-

Interações entre processos. Módulos individuais podem ser re-

Tarefas diferentes podem depender de recursos diferentes e tarefas duplas

característica invariante dessa tarefa; em vez disso, dependerá do

Este ponto ficará explícito nas simulações que apresentamos

Controle atencional. Uma maneira de evitar as interações que

Nesta seção, descrevemos os mecanismos PDP para processamento

A arquitetura deste modelo está representada na Figura i. O

O processamento neste sistema é estritamente feed forward. Um estímulo

mais detalhadamente posteriormente). Além das unidades que acabamos de descrever,

Estímulos e respostas individuais têm representações discretas

O modelo pretende fornecer uma explicação da relação

Sistema PDP que forneceu um relato do curso temporal da psicologia

O modelo em cascata de McClelland (1979) fornece um mecanismo

líquido;(f) = 3a; (Rodovia, (1)

onde a;(t) é a ativação de cada unidade; (no nível, _,) do qual

unidade; entrada recebida e wy é o peso (ou força) do

a(t) = Det(7) = líquido, (1) + (1 — r)líquido;(z — 1), @)

onde líquido?) é a média temporal da entrada líquida para a unidade;, líquido;(t)

Um problema com o tipo de rede usada na cascata

O primeiro passo é introduzir a não linearidade no processamento.

onde net,(f) é definido como na Equação 2. A única diferença

Várias regras de aprendizagem foram descritas para

A não linearidade da regra de atualização de ativação discutida anteriormente

Variabilidade e o mecanismo de seleção de respostas

Mesmo quando os sujeitos humanos parecem ter dominado uma tarefa,

Além da variabilidade no processo de ativação, o