Você está na página 1de 460

' ■

www.facebook.com/groups/livrosparadownload

www.slideshare.net/jsfernandes/documents
A p r e n d iz a g e m
T radutores:
Andreia Schmidt (Programa de Pós-Graduação em Educação Especial - UFSCar)
Deisy das Graças de Souza (Universidade Federal de São Carlos)
Fernando Cesar Capovilla (Universidade de São Paulo)
Julio Cesar Coelho de Rose (Universidade Federal de São Carlos)
Maria de Jesus Dutra dos Reis (Universidade Federal de São Carlos)
Aline Acetuno da Costa (Programa de Pós-Graduação em Educação Especial - UFSCar)
t Ligia Maria de Castro Marcondes Machado (Universidade de São Paulo)
t Alcides Gadotti (Universidade Federal do Pará)

C357a Catania, A. Charles


Aprendizagem: comportamento, linguagem e cog­
nição / A. Charles Catania; trad. Deisy das Graças de
Souza... [et al.]. 4.ed. - Porto Alegre : Artes Médicas
Sul, 1999.

1. Educação - Aprendizagem cognitiva. I. Título.

CDU 371.13:159.922

Catalogação na publicação: Mônica Ballejo Canto - CRB 10/1023

ISBN 85-7307-553-8
A. Charles Catania
U niversity o f M aryland B altim ore County

A p r e n d iz a g e m :
Comportamento, Linguagem e Cognição

4- Edição

Coordenação geral e supervisão técnica da tradução:


D EISY D A S G R A Ç A S D E SOUZA
Universidade Federal de São Carlos.

ARÜVED
E D I T O R A

PORTO ALEGRE, 1999


Obra originalmente publicada sob o título
Learning

© Prentice-Hall, Inc., 1998.


Simon & Schuster / A Viacom Company
ISBN 0-13-235250-8

Capa: Joaquim da Fonseca


Preparação do original: Zita Souza, Cláudia Bressan
Supervisão editorial: Leticia Bispo de Lima
Editoração eletrônica: AGE - Assessoria Gráfica e Editorial Ltda.

Reservados todos os direitos de publicação, em língua portuguesa, à


ARTMED® EDITORA S.A.
Av. Jerônimo de Ornelas, 670 - Santana
90040-340 Porto Alegre RS
Fone (51) 3330-3444 Fax (51) 3330-2378

É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer


formas ou por quaisquer meios (eletrônico, mecânico, gravação, fotocópia, distribuição
na Web e outros), sem permissão expressa da Editora.

SÃO PAULO
Av. Rebouças, 1073 - Jardins
05401-150 São Paulo SP
Fone (11) 3062-3757 Fax (11) 3062-2487

SAC 0800 703-3444

IMPRESSO NO BRASIL
PRINTED IN BRAZIL
P ara Connie, B ill e Ken.
Prefácio

A little learning is a dang'rous thing; vantes para a aprendizagem em humanos. Ain­


Drink deep, or taste not... da que apenas mostremos que alguns tipos de
Alexander Pope aprendizagem humana não sejam redutíveis a ti­
pos de aprendizagem que se sabe ocorrerem com
outros organismos, teremos pelo menos come­
çado a definir o que é peculiarmente humano.
A aprendizagem é uma questão central em Aqui, são examinadas as principais áreas na
Psicologia. Perguntar-se o que um organismo Psicologia da Aprendizagem, sob um ponto de
pode aprender é o mesmo que perguntar-se o vista consistentemente comportamental. Não vou
quanto seu comportamento depende de sua his­ tentar descrever a natureza de uma orientação
tória de evolução e o quanto depende do que ele comportamental. Tal visão evoluiu consideravel­
experimentou durante sua vida. Os estudos so­ mente, desde sua origem paroquial, e é melhor
bre aprendizagem têm abrangido tanto os proce­ tratada no contexto de temas psicológicos espe­
dimentos relativamente simples com animais cíficos, alguns dos quais serão discutidos mais
quanto as complexidades da linguagem humana tarde. Saliento apenas que adotar uma posição
e da resolução de problemas. A pesquisa nessas comportamental não implica excluir aspectos do
áreas é tão diferente, e a literatura tão extensa, comportamento humano, como o pensar, o sen­
que é grande a tentação de restringirmos nossa tir e o imaginar. Para os que gostam de pensar
atenção apenas aos tópicos da aprendizagem e em termos de paradigmas científicos e de mu­
do comportamento animal ou apenas aos tópi­ danças de paradigma, este texto ilustra um para­
cos da aprendizagem e da memória humana. Mui­ digma comportamental que emergiu entre os ana­
tos textos de aprendizagem cederam a essa ten­ listas do comportamento em anos recentes; ten­
tação. Por sua vez, o estudo da aprendizagem do a seleção como mecanismo central, ele en­
tem-se especializado cada vez mais, a ponto de globa todos os fenômenos do comportamento.
cada abordagem desenvolver sua própria termi­ Assim, tópicos muitas vezes considerados do
nologia e metodologia de pesquisa. âmbito exclusivo da Psicologia Cognitiva con­
Neste livro, parte do meu propósito consis­ temporânea serão tratados juntamente com ou­
tiu em articular essas literaturas e explorar algu­ tros mais tradicionalmente considerados como
mas das continuidades entre a aprendizagem hu­ comportamentais.
mana e a aprendizagem de outros organismos. Em sua estrutura geral, este livro contém três
Os seres humanos são, sem dúvida, únicos, mas seções principais (II a IV), referenciadas por uma
eles compartilham uma herança evolutiva com introdução (I) e uma conclusão (V). A Parte II
as outras espécies. Então, as propriedades da lida com o comportamento sem aprendizagem,
aprendizagem animal provavelmente são rele­ tomando por base um contexto evolucionário. A
Parte III (Capítulos 5 a 13) focaliza a aprendiza­ dia das respostas foi praticamente a) ou b); os
gem sem palavras, cobrindo tópicos básicos do alunos que contestavam o d) como resposta cor­
comportamento e da aprendizagem em não-hu- reta às vezes achavam instrutivo conferir o nú­
manos. A Parte IV (Capítulos 14 a 20) focaliza a mero de exemplos de comportamento humano.
aprendizagem com palavras, examinando a Informações adicionais sobre as respostas dos
aprendizagem humana e a memória. Essas se­ alunos a questões do texto estão disponíveis no
ções são claramente independentes em algumas Instructor’s Test-Item File, que inclui uma va­
partes, mas, na maioria das vezes, os conceitos riedade de itens sob a forma de questões objeti­
desenvolvidos anteriormente constituem pré-re­ vas e itens dissertativos para cada capítulo. Có­
quisitos para o tratamento de temas mais com­ pias do Test-Item File podem ser obtidas com o
plexos nas seções subseqüentes. A nova organi­ organizador. Um outro suplemento do texto con­
zação dos capítulos cria a possibilidade de que siste em uma série de programas de computa­
se empregue os Capítulos 1 a 13, acrescidos da dor, Behavior on a Disk (ISBN 0-922077-23-1),
conclusão apresentada no Capítulo 21, em um que inclui simulações de modelagem e outros
curso de 14 semanas, que compreende apenas processos comportamentais, experimentos sobre
os tópicos básicos de aprendizagem animal. memória e aprendizagem verbal e exercícios de
Fiz um grande esforço para incluir exemplos revisão de terminologia (os programas estão dis­
de comportamento humano ao discutir a relevân­ poníveis em disquetes de 3,5 polegadas, em for­
cia de estudos do comportamento animal; do mato MS-DOS para computadores IBM e com­
mesmo modo, procurei mencionar os conceitos patíveis, pela CMS Software, P.O. Box 5777,
apropriados do comportamento animal ao dis­ Santa Fe, NM 87502-5777, EUA).
cutir a aprendizagem humana e a memória. Uma Como nas edições anteriores, esta quarta edi­
diferença importante entre esta edição e a última ção de Aprendizagem inclui algumas notas eti­
é que foram introduzidos, ao longo do texto, mui­ mológicas no início de cada capítulo. Essas pe­
tos exemplos de importantes aplicações de pro­ quenas histórias condensadas das palavras são
cessos básicos ao comportamento humano. Eles lembretes importantes de que nossa linguagem
mostram, com freqüência, como a análise do muda facilmente. Consistências terminológicas
comportamento pode contribuir significativa­ são essenciais para abordagens técnicas, mas a
mente para a educação. Seria de surpreender se linguagem também deve progredir e se adaptar
o tópico aprendizagem não ocasionasse tais im­ a novos achados e novas perspectivas. Temos que
plicações. As escolhas de exemplos particulares usar a linguagem do comportamento com cuida­
foram, até certo ponto, ditadas pela lógica do do, mas talvez houvesse menor risco de nos tor­
assunto em questão e pela disponibilidade de narmos rígidos a esse respeito, se conhecêsse­
casos apropriados na literatura de pesquisa rele­ mos algo de suas origens.
vante. Esta edição, como a última, também inclui
Muitas vezes, os alunos não percebem o em­ um glossário, que resume a terminologia essen­
prego de comportamento humano para ilustrar o cial na área e que pode constituir uma organiza­
significado de descobertas a partir da pesquisa ção conveniente para estudo e revisão. A prepa­
animal. Em vários semestres, tenho apresenta­ ração de um glossário força o autor a atentar para
do, em verificações de leitura, uma questão de contradições e ambigüidades potenciais em con­
múltipla escolha que pergunta quantos exemplos ceitos básicos e também para o leitor pode ser­
de comportamento humano são mencionados ao vir a essa mesma função. O glossário inclui uma
longo dos capítulos, que correspondem ao atual introdução com alguns comentários sobre seu es­
Capítulo 6. As quatro alternativas são: a) ne­ copo e suas características especiais. Na seção
nhum, b) menos que 10, c) mais ou menos 20 e de referência, as entradas incluem as páginas em
d) mais que 40. Havia mais de 50 exemplos de que elas são citadas no texto; elas foram selecio­
comportamento humano ao longo daqueles ca­ nadas como pontos de partida úteis para explo­
pítulos, na primeira e na segunda edições (e o rar a literatura sobre aprendizagem e também
número é ainda maior nesta edição), mas a mé­ para documentar pontos específicos.

V III P refácio
Para estudar a aprendizagem é necessário sa­ O capítulo final consiste em uma revisão e inte­
ber o que é a aprendizagem. O Capítulo 1 come­ gração de questões centrais na Psicologia da
ça, portanto, com o problema da definição de Aprendizagem.
aprendizagem (mas não o resolve). O Capítulo 2 Vários destes tópicos foram revistos ou am­
trata basicamente da organização do livro e apre­ pliados. Alguns deles são: nomeação como uma
senta uma perspectiva dos tópicos examinados, classe verbal; classes de comportamento de or­
em detalhes, nos Capítulos 4 a 12, no contexto dem superior; desenvolvimento de linguagem e
da história deste campo de estudos. O Capítulo o argumento da pobreza do estímulo; classes de
3 lida com a seleção, como um conceito central equivalência; discriminação do próprio compor­
para o que se segue, e fornece informações bási­ tamento; processos autoclíticos; comportamen­
cas sobre a evolução. O Capítulo 4 examina o to governado verbalmente e controle instrucio-
reflexo e outras relações decorrentes da apresen­ nal; a distinção entre seleção natural e seleção
tação de estímulos aos organismos. Em outros artificial; a modelagem do comportamento ver­
textos, é prática comun introduzir o condiciona­ bal; linguagem animal; memória distorcida e re­
mento neste ponto, mas dentro da presente orga­ primida: e metáfora e outros fenômenos de lin­
nização, este tópico será efetivamente adiado guagem. A homogeneidade entre os capítulos so­
para mais tarde. bre aprendizagem não-humana e condicionamen­
Os Capítulos 5 e 6. sobre reforço e controle to e os capítulos sobre aprendizagem humana e
aversivo, mostram como as conseqüências do memória também foi melhorada.
responder podem afetar o comportamento. Es­ Ao longo de sua história, a Psicologia da
tes tópicos levantam a questão sobre classes de Aprendizagem tem-se preocupado com teorias.
respostas e classes de estímulos como unidades Teorias particulares de aprendizagem foram de­
comportamentais. Eles levam, portanto, ao con­ senvolvidas, elaboradas e, então, substituídas por
ceito de operante, no Capítulo 7, e ao conceito outras. Muitas permanecem conosco, tipicamente
de operante discriminado, nos Capítulos 8 e 9. mais circunscritas em seu escopo do que quan­
O Capítulo 9 também considera as implicações do introduzidas. Seja qual for a posição atual
de unidades comportamentais de ordem superior dessas teorias, os achados empíricos que susten­
ou de segunda ordem. Esses conceitos continuam taram sua proposição ainda requerem que se lide
sendo ilustrados nos Capítulos 10 e 11, que exa­ com eles. Por essa razão, o presente texto enfati­
minam como o comportamento complexo pode za descobertas empíricas em detrimento de teo­
ser sintetizado no contexto de esquemas de rias de aprendizagem. Ele é teórico apenas, e
reforço. O Capítulo 12 retoma o condiciona­ principalmente, na medida em que adere a uma
mento e mostra como ele pode estar relacio­ linguagem comportamental consistente e na me­
nado aos processos discutidos em capítulos dida em que busca uma organização sistemáti­
anteriores. ca, capaz de acomodar os vários procedimentos
Ao abordar o tema da linguagem, os Capítu­ e processos de aprendizagem. Embora a teoria
los 14 e 15 tratam das complexidades do com­ não seja enfatizada, tentei incluir informação su­
portamento verbal humano. Algumas caracterís­ ficiente a respeito de procedimentos experimen­
ticas das abordagens comportamental e cogniti­ tais, terminologia e dados, para fornecer um pon­
va são explicitamente comparadas no Capítulo to de partida efetivo ao aluno, ao instrutor ou ao
16. que versa sobre Psicolingiiística. Estes três leitor em geral que queira adotar teorias especí­
capítulos estabelecem o cenário para o exame ficas. A ênfase do livro não reside tanto na inter­
da aprendizagem verbal e da transferência, no pretação de descobertas específicas, mas nas re­
Capítulo 17, e da memória, nos Capítulos 18 e lações entre os vários fenômenos incluídos na
19. Cognição e resolução de problemas (pro- Psicologia da Aprendizagem. Meu intento foi
hlem-solving). que são o foco do Capítulo 20, tornar o livro útil não apenas para pessoas com
apresentam uma oportunidade para síntese, por­ inclinações comportamentais. mas também para
que colocam juntos tópicos considerados sepa­ aquelas que decididamente não adotam uma po­
radamente em vários pontos ao longo do texto. sição comportamental.

P refácio IX
O conteúdo deste livro foi desenvolvido ao taria também de registrar meu apreço pela ajuda
longo de um curso introdutório de Psicologia da incalculável de Madelon Kellough, Tem Harold
Aprendizagem, primeiro no University College e Mary Johnston, pelo encorajamento de Jack
o f Arts and Science da New York University e, a Burton e pela tramitação do livro ao longo das
seguir, na University o f Maryland Baltimore sucessivas etapas de publicação, conduzida por
County. Sou grato a meus alunos e colegas em Ilene Kalish e Karen Trost.
ambos os campi e, especialmente, a Eliot H. Shi- Gostaria também de agradecer aos seguintes
moff. Como meus professores e colegas, muitos revisores do manuscrito para esta quarta edição:
outros colaboraram com comentários, discussões Rebecca M. Chesire, da University ofH aw aii;
e encorajamento. Como nas edições anteriores, Robert H. I. Dale, da Butler University, Lewis
cito apenas alguns deles, sobretudo porque ain­ R. Gollub, da University o f Maryland College
da sou capaz de identificar contribuições parti­ Park\ e David K. Hogberg, do Albion College.
culares de cada um: Abraham Amsel, Kenneth Acima de tudo, e como nas edições anterio­
C. Catania, William J. Catania, Joseph Cautelli, res, falta ainda um reconhecimento. Desta vez,
Daniel Cerutti, Leonard Cook, Willard F. Day, infelizmente, eles já não estão conosco para re­
Israel Goldiamond, Lewis R. Gollub, Ernest S. cebê-lo. Devo mais do que sou capaz de dizer ao
Graham, Stevan Harnad, Eliot Hearst, Ralph F. Nat e ao Fred: W. N. Schoenfeld e Fred S. Kel­
Hefferline, Philip N. Hineline, Per Holth, Koji ler. Seus cursos e seu Princípios de Psicologia
Hori, Pauline Horne, Herbert M. Jenkins, Victor introduziram-me à análise do comportamento e
G. Laties, Kennon A. Lattal, Richard A. Littman, me comprometeram, irrevogavelmente, com a
C. Fergus Lowe, Ernest L. Moerk, J. A. Nevin, exploração de suas preocupações. Espero que
Koichi Ono, Michael J. Owren, Robert R. Pro­ este livro seja suficientemente fiel aos seus en­
vine, Robert Remington, George S. Reynolds, sinamentos e que os leitores que os conheceram
Marc Richelle, Terje Sagvolden, B. F. Skinner, e os que aprenderam com eles possam reconhe­
Deisy de Souza, William C. Stebbins, S. S. Ste­ cer algo deles nestas páginas.
vens, Mark Sundberg e Vicci Tucci. Em uma lista
assim, omissões são inevitáveis; felizmente, a
contribuição de muitos outros profissinais é re­ A. Charles Catania
conhecida por sua inclusão nas referências. Gos­ Columbia, Maryland

X P refácio
Sumário Reduzido

PARTE I In tro d u ç ã o ......................................................................................................................................................... ^


Capítulo 1 Aprendizagem e Comportamento................................................................................................................... 21
Capítulo 2 Uma Taxonomia do Comportamento............................................................................................................ 32

PARTE II Com portam ento Sem A prendizagem ........................................................................................................47


Capítulo 3 Evolução e Comportamento........................................................................................................................... 49
Capítulo 4 Comportamento Eliciado e Comportamento Em itido................................................................................. 60

PARTE III Aprendizagem Sem P a la v ra s.....................................................................................................................79


Capítulo 5 As Conseqüências do Responder: R eforço...................................................................................................81
Capítulo 6 As Conseqüências do Responder: Controle Aversivo............................................................................. 108
Capítulo 7 Operantes: A Seleção do Comportamento................................................................................................129
Capítulo 8 Operantes Discriminados: Controle de Estím ulo.......................................................................................145
Capítulo 9 Discriminação Condicional e Classes de Ordem Superior.......................................................................163
Capítulo 10 Esquemas de Reforço..................................................................................................................................177
Capítulo 11 Combinações de Esquemas: Síntese Comportamental............................................................................ 193
Capítulo 12 Comportamento Respondente: Condicionamento...................................................................................210
Capítulo 13 Aprendizagem S o cial................................................................................................................................. 235

PARTE IV Aprendizagem Com P a la v ra s ................................................................................................................ 249


Capítulo 14 Comportamento Verbal: A Função da Linguagem.................................................................................. 251
Capítulo 15 Comportamento Verbal e Comportamento Não-Verbal..........................................................................271
Capítulo 16 Psicolinguística: A Estrutura da Linguagem........................................................................................... 289
Capítulo 17 Aprendizagem Verbal e Transferência..................................................................................................... 306
Capítulo 18 As Funções do Lem brar.............................................................................................................................327
Capítulo 19 A Estrutura do Lembrar..............................................................................................................................342
Capítulo 20 Cognição e Resolução de Problem as....................................................................................................... 354

PARTE V C onclusão...................................................................................................................................................369
Capítulo 21 Estrutura e Função na Aprendizagem...................................................................................................... 371

Glossário............................................................................................................................................................................ 383
Créditos das Ilustrações................................................................................................................................................... 427
Referências Bibliográficas..............................................................................................................................................429
ín d ice................................................................................................................................................................................. 455
Sumário

PAR TE I Introdução...........................................................................19
C a p ítu lo 1 A p r e n d i z a g e m e C o m p o r t a m e n t o ....................................................................................... 21
A. A Linguagem da Aprendizagem e do C om portam ento.................................................................................22
Linguagem Comportamental e Linguagem Cognitiva........................................................................................ 24
O Mundo e o Laboratório...................................................................................................................................... 26
B. Antecedentes, Com portam ento, C onseqüências............................................................................................ 27
Estímulos e Respostas............................................................................................................................................. 28
Hierarquias Comportamentais...............................................................................................................................30

C a p ítu lo 2 U m a T a x o n o m ia d o C o m p o r t a m e n t o ................................................................................32
A. A Observação do C om portam ento.................................................................................................................... 33
B. A Apresentação de E stím u lo s............................................................................................................................. 35
C. Operações Conseqüenciais.................................................................................................................................. 37
D. Operações de Sinalização ou de Controle de E stím u lo .................................................................................38
Sinalização de Apresentações de Estímulo.......................................................................................................... 39
Sinalização de Conseqüências...............................................................................................................................39
E. Estabelecendo a Efetividade das C onseqüências........................................................................................... 43
F. R esu m o .................................................................................................................................................................... 44

PARTE II Comportamento Sem Aprendizagem .................................................... 47


C a p ítu lo 3 E v o lu ç ã o e C o m p o r t a m e n t o ...................................................................................................49
A. A N atureza da E volução...................................................................................................................................... 50
Receitas e Fotocópias.............................................................................................................................................. 51
Variação e Seleção................................................................................................................................................ 52
Tipos de S eleção..................................................................................................................................................... 57
Resum o......................................................................................................................................................................58
B. Filogenia, O ntogenia e C om portam ento.......................................................................................................... 58

C a p ítu lo 4 C o m p o r t a m e n t o E lic ia d o e C o m p o r t a m e n t o E m i t i d o ............................................60


A. O Reflexo: E liciação..............................................................................................................................................61
Propriedades do Comportamento E liciado..........................................................................................................62
Estímulos Eliciadores e Probabilidades de Resposta.......................................................................................... 63
Tipos de Relações Estímulo-resposta ................................................................................................................... 66
Efeitos de Eliciações Sucessivas........................................................................................................................... 68
B. Do C om portam ento Eliciado ao C om portam ento E m itid o ...........................................................................71
O Padrão Temporal do Comportamento............................................................................................................... 71
O Papel do Exercício.............................................................................................................................................. 72
As Apresentações de Estímulo em Estampagem (Imprinting) .......................................................................... 75
As Operações Estabelecedoras e a Importância de Estím ulos.......................................................................... 76

PA R T E III A p re n d iz a g e m S e m P a l a v r a s ...................................................................... 79

C a p ítu lo 5 A s C o n s e q ü ê n c ia s d o R e s p o n d e r : R e f o r ç o ......................................................................81
A. Reforço e E xtin ção ................................................................................................................................................ 82
Labirintos e Curvas de Aprendizagem .................................................................................................................82
Câmaras Experimentais e Registros Cumulativos...............................................................................................85
Reforço..................................................................................................................................................................... 90
E xtinção................................................................................................................................................................... 92
B. Os Reforçadores como O portunidades p ara o C om portam ento.................................................................97
Relatividade do R eforço.........................................................................................................................................98
Aquisição do Comportamento...........................................................................................................................101

C a p ítu lo 6 A s C o n s e q ü ê n c ia s d o R e s p o n d e r : C o n t r o le A v e r s i v o ........................................... 108


A. P u n ição ................................................................................................................................................................ 109
Comparando Reforço e Punição....................................................................................................................... 109
A Relatividade da Punição................................................................................................................................. 112
Efeitos Colaterais da Punição............................................................................................................................113
B. Reforço Negativo: Fuga e E sq u iv a................................................................................................................117
Fuga...................................................................................................................................................................... 117
Esquiva................................................................................................................................................................. 120
E xtinção...............................................................................................................................................................125
Punição Positiva e Punição N egativa...............................................................................................................125
A Linguagem do Controle Aversivo.................................................................................................................126

C a p ítu lo 7 O p e r a n t e s : A S e le ç ã o d o C o m p o r t a m e n t o ............................................................... 129


A. Modelagem: Reforço Diferencial de Aproximações Sucessivas...............................................................130
Seleção Natural e Seleção Artificial na Modelagem......................................................................................130
B. Diferenciação e In d u ç ã o ..................................................................................................................................132
Classes de Respostas.......................................................................................................................................... 132
Alguns Exemplos de Reforço Diferencial....................................................................................................... 133
Classes Operantes: Função Versus Topografia................................................................................................137
C. A E stru tu ra O p eran te....................................................... .............................................................................. 138
Reforço Diferencial da Organização Tem poral.............................................................................................. 138
Comportamento Complexo: A Aprendizagem em Labirinto........................................................................140
Seqüências de Respostas: Encadeamento Versus Unidades
Temporalmente Estendidas.......................................................................................................................... 142
Classes Operantes e Comportamento Novo.....................................................................................................143

C a p ítu lo 8 O p e r a n t e s D is c r im in a d o s : C o n t r o l e d e E s t í m u l o ................................ ..................145


A. A N atureza dos Operantes D iscrim inados...................................................................................................146
Atentar para as Propriedades dos Estímulos....................................................................................................149
Gradientes de Controle de Estím ulo.................................................................................................................152
Esvanecimento (Fading): Controle de Estímulo porAproximações Sucessivas.........................................156
A Terminologia do Reforço D iferencial.......................................................................................................... 157
B. Cognição A n im al...............................................................................................................................................159
Mapas Cognitivos...............................................................................................................................................160
Conceitos Naturais e Classes de Estímulos Probabilísticas........................................................................... 161
Definição de Classes de Estím ulos...................................................................................................................162

14 S um ário
C a p ítu lo 9 D is c r im in a ç ã o C o n d i c io n a l e C la s s e s d e O r d e m S u p e r i o r .............................. 163
A. Dimensões Relacionais de E stím ulos............................................................................................................... 164
Emparelhamento com o Modelo e Emparelhamento por Singularidade........................................................ 164
Comportamento Simbólico: Classes de Equivalência.......................................................................................166
B. Classes de Com portam ento de O rdem S u p e rio r..........................................................................................169
Aprender a Aprender (Leaming S e t)...................................................................................................................170
Propriedades das Classes de Ordem S uperior................................................................................................... 172
Origens da E strutura..............................................................................................................................................173
C. Fontes do Com portam ento N ovo......................................................................................................................174

C a p ítu lo 10 E s q u e m a s d e R e f o r ç o .............................................................................................................. 177


A. Esquem as de Razão Variável e de Intervalo V ariável................................................................................. 178
Esquemas Acoplados............................................................................................................................................ 183
Esquemas de Reforço e C ausação.......................................................................................................................184
B. Esquemas de Razão Fixa e de Intervalo F ix o ................................................................................................ 187
Atraso de R eforço..................................................................................................................................................189
C. A Terminologia dos Esquemas de R efo rço .....................................................................................................191

C a p ítu lo 11 C o m b in a ç õ e s d e E s q u e m a s : S ín te s e C o m p o r t a m e n t a l ........................................... 193


A. Esquem as Múltiplos e M istos............................................................................................................................ 194
Respostas de Observação.......................................................................... ........................................................... 194
Interações entre Esquemas: Contraste Comportamental.................................................................................. 196
B. Esquem as Encadeados, Tandem e de Segunda O rd em ................................................................................ 197
Reforço Condicionado.......................................................................................................................................... 197
C. Esquem as C oncorrentes.................................................................................................................................... 200
Igualação, Maximização e Escolha.....................................................................................................................200
Esquemas Encadeados Concorrentes..................................................................................................................202
D. Combinações de Esquemas e Síntese C om portam ental............................................................................. 207

C a p ítu lo 12 C o m p o r t a m e n t o R e s p o n d e n t e : C o n d i c i o n a m e n t o .................................................. 210


A. Reflexos Condicionais.........................................................................................................................................211
Tipos de Condicionamento..................................................................................................................................214
Condicionamento e Contigiiidade....................................................................................................................... 216
Combinações de Estímulo no Condicionamento.............................................................................. ................217
Contigiiidade e Conseqüências............................................................................................................................221
Automodelagem e Automanutenção...................................................................................................................223
B. Interações Operante-Respondente: E m oção................................................................................................ 225
Condicionamento e Em oção................................................................................................................................225
Estímulos Pré-aversivos e Pré-apetitivos........................................................................................................... 227
C. Limites Biológicos da A prendizagem ............................................................................................................. 229
Limites Sensoriais.................................................................................................................................................230
Limites M otores.................................................................................................................................................... 230
Limites Sobre as Conseqüências......................................................................................................................... 231
Preparação........................................................................................................................................................... 232

C a p ítu lo 13 A p r e n d iz a g e m S o c i a l .............................................................................................................. 235


A. Tipos de Contingências S ociais........................................................................................................................236
Aprender sobre os O utros.................................................................................................................................... 237
Aprender com os O utros...................................................................................................................................... 238
Aprender sobre si Próprio.................................................................................................................................... 241
B. R e v isã o ..................................................................................................................................................................244
Tipos de Contingências e Estímulos Contingentes........................................................................................... 245

S um ário 15
P A R T E IV Aprendizagem Com P a la v ra s .......................................... 249

Capítulo 14 Comportamento Verbal: A Função da L inguagem ..............................................251


A. Correspondências entre as Classes Vocais e as Classes E sc rita s.............................................................. 252
Comportamento E cóico........................................................................................................................................ 253
Transcrição............................................................................................................................................................. 255
Comportamento Textual.............................................. .........................................................................................256
D itado......................................................................................................................................................................256
Relações entre as Classes......................................................................................................................................257
B. C om portam ento I n tra v e rb a l............................................................................................................................ 258
C. O Contato do Com portam ento Verbal com o A m biente.............................................................................259
A bstração................................................................................................................................................................261
A Extensão das Classes Verbais........................................................................................................................... 263
A Linguagem dos Eventos Privados................................................................................................................... 264
Classes Verbais e Nomeação................................................................................................................................ 266
D. C om portam ento Verbal Condicional sobre Com portam ento V erb al......................................................267
Autoclíticos Relacionais: A Conjunção das Unidades Verbais....................................................................... 267
Autoclíticos Descritivos: Discriminando nosso Próprio
Comportamento Verbal....................................................................................................................................269

Capítulo 15 Comportamento Verbal e Comportamento N ão-V erbal ..................................271


A. Conseqüências dos O perantes V erbais............................................................................................................272
Causação M últipla................................................................................................................................................ 274
B. Com portam ento Governado Verbalmente e Com portam ento Modelado por C ontin g ên cias.........274
Controle Instrucional............................................................................................................................................ 275
Insensibilidade às Contingências.........................................................................................................................277
Conseqüências Intrínsecas Versus Conseqüências Extrínsecas....................................................................... 279
C. Correspondências entre Dizer e F a z e r ............................................................................................................280
Modelagem do Comportamento Verbal..............................................................................................................280
D. O Com portam ento do Ouvinte ou do L e ito r................................................................................................. 283
Significados como Equivalências........................................................................................................................284
E. Com portam ento Verbal e Linguagem In fra -H u m a n a ................................................................................285

Capítulo 16 Psicolinguística: A Estrutura da Linguagem ......................................................... 289


A. Sintaxe: A E stru tu ra G ram atical da L in g u a g em ........................................................................................ 290
Constituintes e Estrutura da F ra se ....................................................................................................................... 291
Transformações......................................................................................................................................................294
B. Semântica: O Significado das Unidades V e rb a is......................................................................................... 296
A Mensuração do Significado............................................................................................................................. 298
M etáfora................................................................................................................................................................. 300
C. Algumas Propriedades da L inguagem ............................................................................................................ 301
Desenvolvimento da Linguagem .........................................................................................................................302

Capítulo 17 Aprendizagem Verbal e Transferência ....................................................................... 306


A. Procedim entos da Aprendizagem V e rb a l...................................................................................................... 306
Aprendizagem Serial............................................................................................................................................. 309
Aprendizagem de Pares A ssociados................................................................................................................... 312
Recordação L ivre...................................................................................................................................................315
Discriminação Verbal............................................................................................................................................ 317
Reconhecimento Verbal: Um Caso Especial de DiscriminaçãoVerbal............................................................319
Resumo....................................................................................................................................................................320
B. T ransferência........................................................................................................................................................ 321
Transferência Positiva e N egativa.......................................................................................................................322

16 S um ário
Proação e Retroação.............................................................................................................................................. 324
Extensões a Procedimentos não Verbais............................................................................................................. 325
Resumo....................................................................................................................................................................326

C a p ítu lo 18 A s F u n ç õ e s d o L e m b r a r ...................................................................................................... 327


A. M n e m ó n ic a........................................................................................................................................................... 329
B. A M etáfora do A rm azenam ento, da Retenção e da R ecu p eração ............................................................331
Armazenamento: Codificação e Níveis de Processamento..............................................................................332
Retenção: A Questão da Reorganização da M em ória...................................................................................... 335
Recuperação: Dependência de Pistas e Acessibilidade.................................................................................... 337
C. M e tam em ó ria.......................................................................................................................................................340
Memória Corrente ou Memória de Trabalho..................................................................................................... 340
O Lembrar Discrim inado......................................................................................................................................340

C a p ítu lo 19 A E s t r u t u r a d o L e m b r a r .....................................................................................................342
A. M em ória Icônica: Os Efeitos Persistentes dos Estímulos ......................................................................... 343
B. M em ória de C urto Prazo: O Papel do E nsaio...............................................................................................344
C. M emória de Longo Prazo: Interferência e E squecim ento......................................................................... 347
D. A E stru tu ra da M emória: O que é L em b ra d o ?........................................................................................... 350
Memória de Procedimento e Memória Declarativa.......................................................................................... 350
Memória Implícita e Memória Explícita.............................................................................................................351
Memória Autobiográfica e Memória Semântica ............................................................................................... 351
Outròs Tipos de Lem brar..................................................................................................................................... 352
Resumo....................................................................................................................................................................352

C a p ítu lo 20 C o g n iç ã o e R e s o lu ç ã o d e P r o b l e m a .............................................................................. 354


A. Processos Cognitivos...........................................................................................................................................355
Imaginação Visual................................................................................................................................................. 356
Sim ulações............................................................................................................................................................. 358
Estágios de Processamento.................................................................................................................................. 359
Representações M entais........................................................................................................................................360
B. Resolução de P roblem as.....................................................................................................................................363
Fixação Funcional.............................. ...................................................................................................................366
A Construção de Soluções................................................................................................................................... 367

PA R T E V C o n c l u s ã o ..............................................................................................................................369

C a p ítu l o 21 E s t r u t u r a e F u n ç ã o n a A p r e n d i z a g e m ........................................................................ 371


A. Duas Psicologias da Aprendizagem : Uma H istória C o n d en sad a............................................................. 373
B. E stru tu ra e F u n ç ã o ............................................................................................................................................. 375
C. Aprendizagem e E volução................................................................................................................................. 378
D. Análise do Com portam ento e Síntese do C om portam ento........................................................................ 381

G l o s s á r i o .........................................................................................................................................................................383

C ré d ito s d as I l u s tr a ç õ e s ...........................................................................................................................................427

R e fe rê n c ia s B i b lio g r á f ic a s ..................................................................................................................................... 429

í n d i c e ................................................................................................................................................................................ 455

S um ário 1 7
PARTE I
INTRODUÇÃO
Aprendizagem e Comportamento

A. A Linguagem da Aprendizagem e do tar um dicionário, que talvez a defina como um


Com portam ento evento que pode ser observado; um segundo re­
Linguagem Comportamental e Linguagem Cognitiva gistro poderia definir a palavra fenômeno como
O Mundo e o Laboratório uma pessoa ou coisa surpreendente ou pouco co­
mum. O dicionário mostraria que a palavra é um
B. Antecedentes, Com portam ento, Conseqüências
Estímulos e Respostas substantivo comum e que seu plural é fenôme­
Hierarquias Comportamentais nos (phenomenon e phenomena, em latim). Mes­
mo depois de ler a definição, ainda poderia ser
difícil para essa pessoa empregar a palavra. Mes­
mo assim, ela teria aprendido alguma coisa so­
A palavra inglesa leamiag (aprendizagem), prova­ bre a palavra e isso poderia ser útil à próxima
velmente. deriva do radical indo-europeu, leis-, que vez que se deparasse com ela.
significava pista ou pegada. Antes de atingir sua Mas o que dizer da definição do objeto de
forma atual, sofreu muitas transformações: laestan, estudo deste livro? O que é este fenômeno que
leornian, lemen. Em diferentes períodos da evolu­
denominamos aprendizagem? A palavra não nos
ção da língua inglesa, ela pode ter sido entendida
como seguir uma pista, continuar, vir a saber ou, causa problema na conversa cotidiana, mas uma
talvez mesmo, entrar nos trilhos. Do mesmo radical definição de dicionário que afirme que ela sig­
veio o verbo last (durar). nifica vir a saber alguma coisa ou adquirir co­
A palavra behavior (comportamento), como nhecimento e habilidade não é muito útil. A pa­
habit (hábito), inhibit (inibir) e ability (habilidade),
está relacionada com a palavra latina habere (man­
lavra aprendizagem é bem mais familiar que f e ­
ter ou ter). O prefixo be foi agregado em palavras nômeno e, contudo, muito mais difícil de defi­
como behabban, do inglês antigo. Como uma pala­ nir. Normalmente podemos dizer se aprendemos
vra que designava a forma com que alguém se con­ alguma coisa e somos capazes de concordar a
duz a si mesmo, ela estava mais próxima do sentido respeito daquilo que conta como aprendizagem.
de conduta ou comportamento do que do sentido
mais contemporâneo de atividade, do mesmo modo
Mesmo assim, enfrentamos problemas quando
que habit costumava ser mais comumente o que era tentamos formular uma definição.
vestido do que o que era habitualmente feito. Um livro-texto pode definir aprendizagem,
por exemplo, como uma mudança relativamente
Suponhamos que uma pessoa não estivesse permanente no comportamento, resultante da
familiarizada com a palavra fenômeno e se de­ experiência (cf. Kimble, 1961, pp.1-13). Mas o
parasse com ela, em algumas sentenças. Ela po­ que significa comportamento, experiência,- e
deria decidir, com base no contexto, que a pala­ quanto o relativamente permanente é permanen­
vra significa alguma coisa que acontece ou um te? Encarar um eclipse solar é uma experiência
evento notável. Neste ponto, se poderia consul­ e certamente irá alterar o comportamento futuro
do observador, se resultar em dano permanente Se a aprendizagem pudesse ser definida em
dos olhos. Mas, se alguém afirmasse que essa uma ou duas frases, não teríamos qualquer pro­
alteração é um caso de aprendizagem, provavel­ blema. Definiríamos a palavra e, então, discuti­
mente discordaríamos. ríamos as condições sob as quais a aprendiza­
gem ocorre, os tipos de coisas que são aprendi­
das, as maneiras pelas quais diferentes instânci­
as de aprendizagem podem ser combinadas, as
Seção A A Linguagem da Aprendizagem e limitações da aprendizagem, e assim por diante.
do Comportamento Mas, aprendizagem significa coisas diferentes,
em diferentes momentos, para diferentes pessoas.
Este é um livro sobre a aprendizagem, mas Consideremos alguns exemplos. Um pombo
devemos, de início, encarar o fato de que não descobre alimento ao longo de sua jornada e re­
seremos capazes de definir aprendizagem. Não toma àquele lugar, mais tarde, quando está no­
há definições satisfatórias. Ainda assim, pode­ vamente faminto. Uma criança se toma capaz
mos estudar a aprendizagem. Fazemos isso sem­ de ler uma história ou de soletrar algumas pala­
pre que observamos como os organismos vêm a vras simples. Um cachorro é ensinado a sentar
se comportar de maneiras novas. Em nosso es­ ou a deitar, sob comando. Um paciente que certa
tudo da aprendizagem, vamos examinar dois ti­ vez teve uma experiência ruim no consultório
pos de questão: (1) qual a natureza dos eventos de um dentista sente-se desconfortável na sala
a que nos referimos como aprendizagem e (2) de espera. Um filhote de gato, após suas primei­
qual a melhor forma de falar deles? ras expedições de caçada, passa a evitar gambás
Consideremos as palavras aprendizagem e e porcos-espinho. Um consumidor vê um anún­
conhecijnento. Elas parecem obviamente impor­ cio de uma liquidação que ainda não começou e,
tantes. Mas, quando funcionam de diferentes alguns dias depois, volta à loja e aproveita os
maneiras em diferentes contextos, geralmente preços baixos. Um autor que encontra uma pala­
não notamos, o que pode gerar confusão. Por vra pouco familiar, mais tarde vem a empregá-la
exemplo, algumas vezes falamos em aprender em um pequeno conto. Um estudante, depois de
sobre algo; outras vezes falamos em aprender ler um capítulo de um livro de matemática, en­
como fazer algo. Alguém que tenha aprendido contra a solução de um problema que, até então,
como um automóvel funciona pode não saber parecia insolúvel.
como dirigir um; por outro lado, alguém que te­ O que esses exemplos têm em comum? Eles
nha aprendido a dirigir um carro pode não ser envolvem cachorros e gatos, crianças e adultos,
capaz de dizer como ele funciona. e provavelmente concordaríamos que todos são
Alguns tipos de aprendizagem envolvem instâncias de aprendizagem. Mas é razoável agru­
ações e outros envolvem palavras. Devemos tra­ par um pombo que aprende uma rota para a fon­
tar esses dois tipos de aprendizagem em conjun­ te de alimento com um estudante que descobre a
to ou em separado? Os filósofos estão preocu­ solução para um problema matemático?
pados com esse tipo de distinção quando deba­ Alguém poderia sugerir que nossos proble­
tem sobre as diferenças entre “saber como” e “sa­ mas de definição seriam resolvidos se acrescen­
ber que “ (p. ex., Ryle, 1949). Os psicolingüis- tássemos que a aprendizagem tem que ocorrer
tas, às vezes, estabelecem a distinção, contras­ por meio de alguma mudança no cérebro. Mas
tando conhecimento ou memória àtprocedimen­ alguma vez olhamos para o cérebro de um orga­
to e conhecimento ou memória declarativa. A nismo para decidir se ele aprendeu alguma coi­
distinção é tão fundamental que, como mostra o sa? Todos aprendemos a dizer quando aprende­
sumário, este livro está dividido em duas par­ mos ou quando outros aprenderam alguma coi­
tes principais. Uma está voltada para a apren­ sa, mas quantos de nós já viram um cérebro fa­
dizagem que não envolve palavras, e a outra zendo alguma coisa?
é dedicada à aprendizagem que envolve pala­ Isso não significa dizer que a aprendizagem
vras. não tenha qualquer base fisiológica. Naturalmen­

22 A . C h a r l e s C a ta n i a
te que tem e seria fascinante saber que mudan­ feridas. Contudo, esse tipo de vocabulário não é
ças neurológicas acompanham a aprendizagem. apropriado para discutir como interesses ou tra­
Mas teríamos problemas em decidir o que pro­ ços particulares se desenvolveram em um indi­
curar no sistema nervoso, se não soubéssemos o víduo.
bastante sobre a aprendizagem. De fato, não po­ Consideremos um outro exemplo. Há uma di­
demos ter uma adequada neurociência da apren­ ferença importante entre mentir e dizer a verda­
dizagem, a menos que compreendamos suas pro­ de. Mas, se uma criança aprende a evitar proble­
priedades comportamentais. Tais propriedades mas dizendo mentiras, e outra aprende a evitá-
determinam que tipo de coisas o neurocientista los dizendo a verdade não deveríamos nos sur­
interessado em aprendizagem deve procurar no preender se a primeira criança vier a se tornar
sistema nervoso. Essa é a razão pela qual nossa menos confiável do que a segunda. Contudo, o
principal preocupação será com as propriedades comportamento de cada criança foi modelado por
comportamentais da aprendizagem, mais do que suas conseqüências, cada criança se comporta
com suas bases fisiológicas. de modo a evitar problemas. Essa modelagem
Até aqui, estivemos pouco preocupados com do comportamento deveria ser de nosso interes­
os fatos da aprendizagem; estivemos mais preo­ se, mas o vocabulário cotidiano não nos equipa
cupados sobre como falar a respeito deles. As bem para discuti-la.
linguagens mudam; suas terminologias refletem Problemas desse tipo também ocorrem em
o que é importante, no momento presente, para outros campos, além da Psicologia. Quando ob­
os que falam uma dada linguagem. Um proble­ servam eventos no mundo, os físicos não consi­
ma é que a linguagem que evoluiu em nossa in­ deram adequado o vocabulário do cotidiano. Eles
teração cotidiana com os outros não é, necessa­ cunham novos termos ou apoderam-se de outros
riamente, a mais apropriada para uma linguagem já existentes. O último recurso pode criar difi­
da aprendizagem (essa é uma das razões para a culdades. Palavras como trabalho, força e ener­
inclusão da seção etimológica, ou história das gia, por exemplo, significam para os físicos, na
palavras, no início de cada capítulo). linguagem técnica, coisas diferentes do que sig­
Normalmente, estamos mais interessados no nificam para a maioria das pessoas em sua con­
que as outras pessoas sabem e no que tendem a versação rotineira. Felizmente, para os físicos,
fazer do que em como elas vieram a se tomar o muitos fenômenos que eles estudam atualmente
que são. Um pai ou uma professora, por exem­ estão tão distantes de nossa experiência comum,
plo, poderiam preocupar-se com uma criança que que não confundimos sua linguagem técnica com
briga, freqüentemente, com outras crianças e que o discurso leigo.
nunca brinca cooperativamente. Mas, se a crian­ Esse não é o caso da Psicologia. Todos esta­
ça começa a brincar cooperativamente, o pai mos, inexoravelmente, envolvidos com o com­
pode não se importar se isso ocorreu devido às portamento. Falamos sobre como as pessoas cres­
recompensas naturais da cooperação, se a coo­ cem e mudam, especulamos sobre as razões que
peração foi explicitamente ensinada ou se brigar elas têm para fazer certas coisas e nós próprios
ou outras alternativas para o brincar foram puni­ aprendemos novos fatos e adquirimos novas ha­
das. bilidades. Se desejarmos criar novas formas de
A linguagem que geralmente empregamos falar sobre esses eventos, temos que cuidar para
para descrever o que as pessoas fazem é útil. E que a nova linguagem não venha a se confundir
importante saber o que esperar dos outros, e deve com a antiga. Temos passado a maior parte de
ser por isso que descrevemos as pessoas pela nossas vidas falando de maneiras específicas
maneira como elas tendem a se comportar. Re­ sobre o que fazemos, e esses modos familiares
ferimo-nos uns aos outros como expansivos ou de falar podem interferir com quaisquer novas
reservados, relaxados ou compulsivos, confiá- formas que tentemos estabelecer. Algumas se­
>eis ou imprevisíveis. Descrever pessoas com ções deste livro serão dedicadas ao estabeleci­
r ilivras como artístico, atlético, social, intelec- mento de uma linguagem comportamental, e essa
3kj1 ou musical especifica suas atividades pre­ linguagem não será simplesmente uma paráfra­

A pr en d iza g em 2 3
se dos usos cotidianos; ela irá exigir algumas no­ Por exemplo, às vezes, dizemos, casualmen­
vas formas de lidar com fenômenos ou eventos te, que uma idéia, um sentimento ou um palpite
familiares. levou alguém a fazer algo. O comportamentalis-
ta não questiona a existência de idéias, sentimen­
tos e intuições, mas critica sua invocação como
LINGUAGEM COMPORTAMENTAL causa do comportamento. E fácil demais con­
E LINGUAGEM COGNITIVA tentar-se com uma explicação assim; para um
comportamentalista não basta dizer que alguém
Algumas vezes, falamos sobre o que as pes­ fez algo por causa de uma idéia, de um senti­
soas fazem, outras sobre o que elas sabem. Por mento ou de uma intuição. As idéias, os senti­
um lado, o que alguém faz é a única coisa que mentos e os palpites dizem respeito ao mundo e,
está acessível a nós. Não há outra coisa a ser portanto, devem ter sua origem em nossas expe­
estudada, senão o comportamento. Em um ex­ riências com o mundo. Para explicar o que faze­
perimento de aprendizagem, por exemplo, uma mos, devemos estender a busca a essas experiên­
pessoa pode descrever pensamentos ou sentimen­ cias passadas ou, em outras palavras, ao com­
tos, mas tais descrições ainda são comportamen­ portamento passado. Se tivermos êxito, teremos
tos (o comportamento verbal pode ser especial, também algo útil a dizer acerca das origens de nos­
mas ainda assim é um comportamento). Indepen­ sas idéias, de nossos sentimentos e de intuições.
dentemente de quais sejam os fenômenos que es­ O cognitivista sustenta que essa visão é des­
tudamos em Psicologia, nossas terminologias e necessariamente estreita. Quando lidamos com
teorias devem ser, em última instância, deriva­ o mundo, devem ocorrer processos que não são
das de um comportamento, daquilo que os orga­ observáveis em nosso comportamento. Quando
nismos fazem. tentamos lembrar de uma palavra que está na
Por outro lado, um organismo é mais do que “ponta da língua” ou tentamos resolver um pro­
aquilo que pode ser visto em seu comportamento. blema “dormindo sobre ele”, acontecem algu­
Dois alunos podem permanecer quietos durante mas coisas que não transparecem em nosso com­
uma aula, e ainda assim pode ficar claro para o portamento, e pode ser que nem mesmo sejamos
professor que um deles é capaz de responder a cer­ capazes de relatá-las. Se pudéssemos descobrir
tas questões e resolver certos problemas, enquan­ algo acerca de tais processos„isso certamente se­
to o outro não. Embora eles possam ser distingui­ ria relevante para o estudo da aprendizagem.
dos com base no desempenho passado, no presen­ Contudo, a disputa entre comportamentalis­
te momento eles não se comportam de forma dife­ tas e cognitivistas pode ter origem tanto nas di­
rente. A diferença está naquilo que cada um é vir­ ferentes maneiras de se falar sobre o comporta­
tualmente capaz de fazer. Poder-se-ia dizer sim­ mento quanto em diferenças nas descobertas de
plesmente que um dos estudantes sabe mais que o pesquisa. Algumas dificuldades surgem porque
outro. Quando estudamos esse conhecimento, é esses dois tipos de psicólogos geralmente estão
tentador dizer que estudamos a mente. interessados em tipos diferentes de questões. Os
O debate entre psicólogos que se denominam comportamentalistas tendem a lidar com ques­
comportamentalistas e os que se intitulam men- tões relativas à função, e os cognitivistas ten­
talistas ou cognitivistas tem sido consideravel­ dem a lidar com questões de estrutura.
mente duradouro. Trata-se, até certo ponto, de Suponhamos que estejamos interessados em
um debate sobre os modos apropriados de se fa­ ensinar uma criança a ler. Por um lado, podería­
lar de eventos psicológicos. O comportamenta- mos cogitar sobre o que teríamos que fazer para
lista afirma que se o comportamento é tudo o envolver a criança na leitura. Pensaríamos no que
que está disponível para ser medido, a lingua­ poderia manter a criança alerta, no que a ajuda­
gem de eventos mentais pode ser enganadora, ria a prestar atenção às palavras apresentadas e
especialmente quando uma afirmação mentalis- no que poderia ajudá-la a lembrar quais são as
ta é aceita como explicação, e por isso desenco­ várias palavras. Seríamos melhor sucedidos se
raja a continuidade da pesquisa. recompensássemos seus acertos ou se penalizás­

24 A . C h a rle s C atania
semos os erros? Quando planejamos conseqüên­ ções entre palavras e figuras e as respostas da
cias diferentes para as diferentes respostas que a criança, sua efetividade poderia ser prejudicada
criança pode apresentar, estamos determinando se tentássemos ensinar as palavras difíceis antes
as funções dessas várias respostas ou, mais pre­ das palavras fáceis ou as palavras com grafia ir­
cisamente, as relações funcionais entre o com­ regular antes das palavras com grafia regular. Um
portamento e suas conseqüências. programa de leitura para ensinar uma língua al­
Por outro lado, por mais preocupados que fabética, como o inglês, provavelmente seria bem
estejamos com os efeitos da recompensa e da diferente de um programa para ensinar uma lín­
punição no domínio da leitura pela criança, isso gua ideográfica, como o chinês. Cada programa
não nos dirá qual o modo mais eficiente de lhe teria que levar em consideração a estrutura fala­
apresentar materiais de leitura. Como a leitura é da e escrita da língua a ser ensinada.
estruturada? Qual é a melhor forma de seqüen- Historicamente, certas controvérsias surgiram
ciar os materiais? Deveríamos ensinar a criança na Psicologia, porque os psicólogos interessa­
a ler, começando por letras individuais, por síla­ dos em problemas funcionais tendiam a falar uma
bas ou por palavras inteiras? Quando programa­ linguagem comportamental, enquanto os interes­
mos diferentes ordens de apresentação dos ma­ sados em problemas estruturais tendiam a falar
teriais a serem aprendidos, estamos interessados uma linguagem cognitiva ou mental. Embora os
nas relações estruturais efetivas dentro do mate­ comportamentalistas pudessem ter estudado os
rial a ser ensinado. As palavras seriam melhor problemas estruturais, do mesmo modo que os
ensinadas como estruturas unitárias ou como cognitivistas poderiam ter estudado os proble­
estruturas complexas construídas a partir de uni­ mas funcionais, os problemas nos quais os com­
dades mais simples, como letras ou sílabas? Pro­ portamentalistas e os cognitivistas estavam in­
blemas de estrutura dizem respeito a como o teressados tendiam a ser correlacionados com a
comportamento e o ambiente estão organizados. linguagem que eles empregavam.
Os dois tipos de problemas são importantes. E fácil ver como tal correlação pode ter sur­
Qualquer tentativa de melhorar a forma como as gido. Se o experimentador está preocupado com
crianças aprendem a ler será deficiente se for ig­ a função, ele estuda as conseqüências de rela­
norado qualquer um deles. Considere um outro ções particulares entre os eventos ambientais es­
exemplo. Suponhamos que descobrimos que as pecíficos e as ações específicas; essas relações
crianças que aprendem a ler a partir de textos podem ser convenientemente expressas na lin­
acompanhados por figuras apresentem maior guagem comportamental de estímulos e respos­
probabilidade de atentar para as figuras do que tas. Se a preocupação do experimentador é com
para as palavras. Um de nossos problemas seria a estrutura, ele estuda as propriedades de capa­
funcional e poderia nos levar a perguntar se po­ cidades ou as habilidades particulares; essas pro­
deríamos melhorar o ensino de leitura colocan­ priedades são convenientemente expressas na
do as palavras em uma página e a figura rele­ linguagem cognitiva de conhecimento e mente.
vante na página seguinte. Isso também poderia (Uma distinção paralela entre estrutura e função,
ajudar o professor, que tem que julgar se a crian­ a separação entre anatomia e fisiologia, ocorreu
ça de fato leu a palavra ou se apenas adivinhou a na história da Biologia; ver Capítulo 21.)
palavra a partir da figura. Poderíamos, até mesmo, Mas não temos que nos desviar de nosso pro­
criar um sistema de instrução por computador, em pósito por causa dessa controvérsia. Vamos con­
que a criança somente pudesse ver a figura como siderar tanto os problemas funcionais quanto os
conseqüência da leitura correta da palavra. estruturais em aprendizagem e, portanto, exami­
Mas outro de nossos problemas seria estru­ naremos os dois tipos de pesquisa. Em ambos os
tural, porque ainda seria importante saber quais casos, será útil descrever as situações em termos
figuras deveriam acompanhar quais palavras e a de antecedentes, ou as circunstâncias que esta­
ordem em que os diferentes materiais de leitura belecem a ocasião para o comportamento, o com­
deveriam ser apresentados. Por melhor que seja portamento que ocorre nessas circunstâncias e
a instrução informatizada para manejar as rela­ as conseqüências do comportamento (esses três

A prend iza gem 2 5


termos são abreviados, por conveniência, como tos simples nos ajudará a desenvolver técnicas e
ABC). Podemos considerar tanto a função, as terminologias que possam ser aplicadas aos e . ere­
relações entre os termos (p. ex., dados certos an­ tos complexos.
tecedentes, que conseqüências são produzidas O ambiente controlado do laboratório facili­
pelo comportamento?), como a estrutura, as pro­ ta o exame de uma coisa por vez. Podemos pro­
priedades de termos particulares (p. ex., quais gramar as circunstâncias, de modo a saber o que
são as propriedades críticas daqueles anteceden­ entra na situação experimental; se formos cui­
tes?). dadosos, conseguiremos excluir algumas das dis­
A orientação que este livro segue lida tanto trações que poderiam, de outro modo, obscure­
com a estrutura quanto com a função, e engloba, cer os processos que desejamos estudar. A sim­
assim, tanto os conceitos comportamentais como plicidade de nosso ambiente de laboratório tam­
os conceitos cognitivos. Essas duas orientações bém pode nos ajudar a ver os variados aspectos
psicológicas diferem em suas linguagens e nos da aprendizagem e, portanto, a desenvolver um
problemas de pesquisa que enfatizam, mas am­ vocabulário apropriado ao nosso objeto de estu­
bas têm em comum a confiança no método ex­ do. Temos que ser capazes de identificar os even­
perimental, a ancoragem de conceitos em obser­ tos, antes que possamos estudar suas proprieda­
vações experimentais e a premissa de que nosso des. Um dos pontos de partida será estudar os
objeto de estudo, embora complexo, é ordenado comportamentos que não envolvem a linguagem,
e não casual. Nosso interesse reside naquilo que porque provavelmente serão mais simples do que
determina o comportamento. Se estivermos preo­ os comportamentos que envolvem a linguagem.
cupados com os possíveis maus usos do conhe­ O que eles nos dizem sobre o comportamento
cimento sobre o comportamento, devemos reco­ sem a linguagem poderá nos ajudar, mais tarde,
nhecer que não podemos eliminar um determi­ a apreciar o que é especial no comportamento
nante do comportamento humano escolhendo, com a linguagem.
simplesmente, não estudá-lo; de fato, podemos Mesmo depois de termos estudado o com­
nos defender melhor contra os maus usos de téc­ portamento no laboratório, não podemos espe­
nicas de controle do comportamento humano se rar que sejamos capazes de interpretar qualquer
entendermos como elas funcionam. ocorrência de comportamento fora do laborató­
rio. Há limites para o que podemos saber. E ten­
tador pedir a um psicólogo que explique por que
O MUNDO E O LABORATÓRIO alguém se comportou de um modo particular, o
que levou a um certo incidente ou como alguém
Então, como fazer descobertas sobre o com­ veio a adquirir interesses, medos ou apegos par­
portamento? Os problemas de linguagem tor­ ticulares. Mas o psicólogo geralmente tem tão
nam-se ainda mais difíceis, porque vivemos em pouca informação disponível, que pode ofere­
um mundo complexo. Os eventos que influenci­ cer apenas uma interpretação plausível.
am nosso comportamento não ocorrem isolada­ Essa situação difere apenas em grau daquela
mente. Assim, para entendermos uma situação, em outras ciências. Assim como os princípios
devemos nos desvencilhar dos detalhes não-es- da aerodinâmica não são invalidados se não con­
senciais e analisá-la. Analisar uma coisa é sim­ seguimos explicar cada volta e guinada no traje­
plesmente dividi-la em suas partes-componen- to da queda de uma folha em particular, os prin­
tes. Para isso, voltamo-nos para o laboratório. cípios de comportamento não são invalidados se
Começamos com o estudo de organismos mais não pudermos explicar cada detalhe do desem­
simples do que nós próprios, em ambientes sim­ penho de um organismo em uma ocasião parti­
plificados. Logicamente, devemos encarar a ob­ cular. No estudo da aprendizagem, é importante
jeção de que um experimento de laboratório é reconhecer o que permanece fora de nosso al­
artificial e, portanto, não apropriado ao estabe­ cance. No que se segue, veremos que o caminho
lecimento de generalizações sobre a aprendiza­ mais promissor é o que permanece próximo dos
gem fora do laboratório. Mas começar com even­ dados; vamos nos ater menos à teoria psicológi-

26 A . C harles C atania
ca e mais à descrição apropriada das descober­ Imagine um pombo em uma câmara experi­
tas. Geralmente será mais útil descrever o que mental. Em uma das paredes há uma abertura
um organismo aprendeu ou lembrou do que ten­ para um comedouro, no qual pode-se colocar o
tar explicar sua aprendizagem ou sua memória. alimento. Acima da abertura do comedouro, há
um disco transparente embutido na parede que
pode ser iluminado por trás. O pombo está sen­
do treinado para bicar o disco (e obter alimento)
Seção B Antecedentes, Comportamento, sempre que estiver iluminado. Agora suponha­
Conseqüências mos que o disco esteja iluminado, que o pombo
esteja sem comer por algum tempo e que sua bi­
Voltemos agora ao comportamento como cada no disco produza, imediatamente, uma pe­
objeto de estudo. Estudar a aprendizagem é es­ quena quantidade de alimento. Nessa situação,
tudar como o comportamento pode ser modifi­ se a alternativa de não bicar nunca for seguida
cado; então devemos considerar primeiro o que por comida, será muito diferente se a mesma al­
é comportamento, como ele pode ser investiga­ ternativa for seguida por uma quantidade de co­
do e que vocabulário pode descrevê-lo melhor. mida muito maior, mas que só é apresentada de­
O comportamento não é mais fácil de definir do pois de um certo tempo (com atraso). Em cada
que a aprendizagem. Podemos dizer, superficial­ caso, uma resposta, como bicar o disco, é segui­
mente, que comportamento é qualquer coisa que da por um estímulo, por um alimento. Mas os
um organismo faça, mas essa definição seria contextos são muito diferentes. Esperaríamos que
muito abrangente. Deveríamos incluir a respira­ o pombo bicasse no disco no primeiro caso, mas
ção ou o metabolismo juntamente com os movi­ não no segundo? Se o pombo não bica, pode­
mentos musculares e as secreções glandulares? mos ficar tentados a dizer que ele demonstra
Os comportamentos são descritos com verbos: as autocontrole, rejeitando a pequena quantidade de
pessoas andam, falam, pensam, fazem coisas. Mas alimento imediato pela quantidade maior que
também fazemos distinção entre ações ativas e pas­ recebe mais tarde. Esse tipo de situação será dis­
sivas. Embora possamos dizer que alguém respi­ cutida mais detalhadamente no Capítulo 11. Por
ra, não diríamos que alguém “bate o coração”. As ora, o ponto importante é que devemos conside­
pessoas sangram quando se cortam, mas não fala­ rar não apenas os detalhes dos eventos momen­
mos de seu sangramento como comportamento. to a momento, mas também o contexto em que
Vamos tentar resolver esse problema. Nosso eles ocorrem, ao longo de extensos períodos de
objetivo é examinar algumas propriedades do tempo.
comportamento. Embora os fenômenos do com­ Examinemos melhor a relação entre compor­
portamento, às vezes, compartilhem nomes em tamento e ambiente, observando um bebê huma­
comum, eles são variados, de modo que pode no. Poderíamos começar perguntando o que o
ser melhor considerar alguns exemplos do que bebê sente, mas isso traria muitas complicações.
tentar elaborar definições. Podemos lidar com O bebê ainda não fala e não poderia nos dizer.
exemplos específicos sem grandes riscos de mal­ Mesmo que fosse uma criança mais velha, que
entendidos. Quando observamos um organismo, pudesse nos contar o que sente, teríamos que nos
vemos propriedades de seu ambiente e proprie­ preocupar sobre como a criança aprendeu as pa­
dades de seu comportamento. Essas proprieda­ lavras apropriadas e se elas significam, para nós
des são chamadas de estímulos e respostas, mas a mesma coisa que significam para quem ensi­
nem o estímulo nem a resposta têm interesses nou a criança. Quando tratarmos da linguagem,
por si só. Uma análise experimental determina no Capítulo 14, vamos examinar o papel que ela
que existem alguns tipos de relações entre os desempenha em moldar nosso conhecimento e o
estímulos e as respostas e como surgem essas dos outros, mas isso não vai nos ajudar.
relações. Ela deve considerar também contextos Sabemos que o bebê é ativo, aprendendo do
mais amplos, as situações nas quais essas relações ambiente e interagindo com ele. Mas como des­
entre os estímulos e as respostas estão inseridas. cobrirmos o que está acontecendo? Podemos co­

A prend iza gem 2 7


meçar simplesmente pela observação. Observa­ o sugar produzido por uma chupeta na boca; o
mos por um tempo e notamos os movimentos piscar disparado por um lampejo de luz. Esses
das mãos, dos braços ou das pernas. Talvez em não são, porém, os únicos tipos de relações pos­
algum momento, o bebê comece a chorar. Se o síveis. O ambiente age sobre o bebê quando os
choro cessa sem nossa intervenção, o bebê pode estímulos produzem respostas, mas o bebê tam­
dormir ou deitar quietinho com os olhos aber­ bém pode agir sobre o ambiente. Chorar, por
tos. Se observarmos de perto, podemos ver os exemplo, freqüentemente chama a atenção da
olhos se movendo, embora seja difícil julgar exa­ mãe. Chorar, então, é uma resposta que pode
tamente o que o bebê está olhando, ou mesmo se produzir uma conseqüência: a presença da mãe.
ele está olhando para alguma coisa. Poderíamos Essa relação envolve estímulos e respostas, mas
começar a catalogar as várias coisas que o bebê não podemos denominá-la reflexo. Por um lado,
faz e descobrir que certos movimentos particu­ aqui as respostas ocorrem primeiro, não os estí­
lares, geralmente, ocorrem em certas seqüênci­ mulos; por outro, aqui o comportamento tem
as. Mas se apenas observamos, podemos dizer conseqüências.
pouco mais do que isso: que certos movimentos As relações podem se tornar ainda mais com­
ocorrem mais ou menos freqüentemente e mais plicadas. Se os olhos da criança se movem en­
ou menos em certa ordem. quanto a luz está acesa, os movimentos dos olhos
mudam o que ela vê. Os movimentos dos olhos
não podem ter tais efeitos quando não há luz.
ESTÍMULOS E RESPOSTAS Assim, a criança pode vir a olhar em volta quan­
do há luz, mas não quando está escuro. Na pre­
Não temos que nos restringir a observar. Po­ sença de um estímulo, a luz, mover os olhos tem
demos tocar ou balançar o bebê, mover objetos conseqüências; produz outros estímulos, coisas
diante de seus olhos ou escondê-los, fazer sons novas são vistas. Os movimentos oculares não
ou colocar uma chupeta em sua boca. Seria de podem ter essas conseqüências no escuro. A re­
esperar que o bebê respondesse a cada evento lação envolve três termos: um estímulo antece­
de um modo característico. Se o toque fosse na dente, a luz; uma resposta, o movimento ocular,
palma da mão, por exemplo, ele provavelmente na presença deste estímulo; e uma conseqüência,
fecharia a mão, agarrando o objeto que a tocou. o que é visto de diferente, dada esta resposta em
O vocabulário para esses eventos já é familiar: presença do estímulo. Essa relação de três ter­
chamamos o toque na palma de estímulo e o agar­ mos, estímulo-resposta-conseqüência, é chama­
rar, de resposta. da de contingência de três termos e é importante
Nesse caso, não estamos interessados apenas porque o comportamento de um organismo de­
no estímulo ou apenas na resposta; estamos in­ pende tanto dos antecedentes quanto das conse­
teressados na relação mútua de um com o outro. qüências.
Denominamos essa relação, a produção fidedig­ Um antecedente é simplesmente algo que
na de uma resposta específica por um estímulo vem antes e uma conseqüência é simplesmente
específico, de reflexo. O reflexo será abordado o que é causado por algum evento ou o que acon­
no Capítulo 4. O importante aqui é que o termo tece como resultado dele. Assim, o uso coloquial
reflexo é simplesmente um nome para uma rela­ corresponde razoavelmente bem ao sentido téc­
ção comportamental: uma correlação observada nico do termo em análise do comportamento. E
entre um estímulo específico e uma resposta es­ importante notar que as conseqüências não de­
pecífica (Skinner, 1931). O reflexo não é nem veriam ser identificadas com os estímulos. As
uma teoria, nem uma explicacão e é apenas uma respostas podem ter muitos tipos de conseqüên­
entre as muitas relações possíveis entre o com­ cias. Às vezes elas produzem certos estímulos
portamento e o ambiente. que, de outra forma, estariam ausentes, mas elas
Além da produção do agarrar pelo toque na também podem impedir que algo aconteça ou
palma, poderíamos catalogar outros exemplos de mudar as conseqüências de outras respostas. O
reflexos: o choro causado por um ruído intenso; alimento produzido por uma resposta, por exem-

28 A . C harles C atania
pio, é tanto um estímulo como uma conseqüên­ sença elas ocorrem. Levando em conta tais re­
cia, mas o alimento apresentado, independente­ servas, consideremos agora algumas outras pro­
mente do comportamento, é somente um estímu­ priedades dos estímulos e das respostas.
lo; o choque evitado por uma resposta é um estí­ Um estímulo é um evento ambiental, mas tais
mulo, mas a conseqüência da resposta é a au­ eventos têm graus variados de complexidade. No
sência do choque, o que não é um estímulo. exemplo em que o choro do bebê produzia a aten­
No que diz respeito a estímulo e resposta, a ção da mãe, consideramos a mãe como um estí­
relação entre os usos técnico e coloquial não é mulo. O ambiente do bebê certamente é diferen­
tão simples. Os estímulos são eventos no mundo te, quando sua mãe está presente e quando ela
e as respostas são instâncias do comportamento. está ausente. Porém, que tipo de estímulo é a
O termo estímulo é freqüentemente restrito aos mãe? Não sabemos que aspectos de sua aparên­
eventos físicos específicos, tais como luzes, sons cia, de sua voz ou de seu toque são importantes
ou toques. Mas os organismos podem responder para a criança, nos primórdios de sua vida. Po­
a características variadas do ambiente, incluin­ demos especular que o bebê não reagiria à mãe
do as relações (p. ex., à esquerda de, acima de), da maneira usual se ela se aproximasse dele usan­
o comportamento complexo (p. ex., expressões do uma máscara cirúrgica, mas não poderíamos
faciais, tons de voz), as propriedades funcionais estar certos, a menos que fizéssemos o experi­
(p. ex., comestível, confortável) e assim por di­ mento. A despeito de nossa ignorância em rela­
ante (cf. Gibson, 1979). Freqüentemente tais ca­ ção a essas questões, não temos dúvida de que a
racterísticas ambientais serão tratadas como es­ mãe é uma parte importante do ambiente do bebê
tímulos, mesmo que não sejamos capazes de es­ e podemos ainda considerar útil falar dos efeitos
pecificar as dimensões físicas que as caracteri­ que a mãe tem, à medida que entra e sai do mun­
zam. do do bebê.
A linha entre os estímulos e as respostas é Esse exemplo ilustra, novamente, os diferen­
raramente ambígua. Ainda assim, às vezes os ca­ tes problemas de estrutura e de função. Quando
sos especiais complicam nossas definições. O tentamos analisar que características visuais, au­
que dizer, por exemplo, dos estímulos que se ori­ ditivas e táteis da mãe são importantes para o
ginam no organismo? Consideremos a diferen­ bebê, estamos lidando com a estrutura deste es­
ça entre um ruído intenso e o incômodo de uma tímulo complexo, a mãe. Poderíamos nos per­
dor de dente (a dor de dente pode ser vista como guntar como o bebê aprende a responder a um
uma ocasião para ir ao dentista). Eles diferem indivíduo particular como a mãe, apesar das mu­
no sentido de que o ruído é público, e a dor é danças em seu vestuário ou penteado, em sua
privada; em outras palavras, o ruído pode ser expressão facial ou em sua postura. Se, por ou­
ouvido por mais de uma pessoa, enquanto a dor tro lado, nos concentrarmos em como a mãe in­
de dentes pode ser sentida apenas pela pessoa que terage com as respostas do bebê, estaremos pre­
tem o dente afetado. Isso seria um problema se ocupados com o significado funcional da mãe
insistíssemos em que todos os estímulos tivessem no ambiente da criança. Se ela está chorando,
que estar fora do organismo, mas se existissem re­ por exemplo, pode não ser relevante se ela reco­
ceptores apropriados, não teríamos razão para ex­ nhece a mãe por sua face, pelos cabelos ou pela
cluir, como estímulos, partes importantes do mun­ voz, contanto que sua presença faça alguma di­
do que estariam dentro da pele do organismo. ferença; seria suficiente notar que quando a mãe
Quanto ao termo resposta, o uso coloquial se aproxima da criança, o choro pára.
freqüentemente implica que a resposta seja uma Mais adiante, falaremos em estímulos ainda
“resposta a algo” (tipicamente um estímulo). mais simples: luzes, sons, alimento na boca. Mas,
Contudo, o termo não funcionará dessa forma mesmo com os estímulos mais simples, teremos
aqui, porque uma explicação do que causa as que distinguir entre os problemas estruturais,
respostas inclui, tipicamente, outros fatores (p. como ao analisar as propriedades dos estímulos,
ex., suas conseqüências passadas, características e os problemas funcionais, ao analisar as intera­
do organismo) além dos estímulos em cuja pre­ ções entre os estímulos e as respostas.

A pr en d iza g em 2 9
E quanto às respostas? Como devemos lidar rado em pé, nosso julgamento de que ele está se
com elas? Ao descrevê-las, encontramos pelo comportando provém, parcialmente, de nosso co­
menos duas dificuldades. A primeira é que o nhecimento de que ele cairia se estivesse incons­
comportamento não se repete exatamente da ciente ou morto. Poderíamos argumentar que o
mesma forma de uma ocorrência para outra. Se adulto em pé está, de fato, apresentando movi­
a criança agarra um objeto em duas ocasiões di­ mentos pequenos, imperceptíveis, mas, mesmo
ferentes, o agarrar não será o mesmo a cada vez. que ocorram ligeiros ajustes posturais da pessoa
A diferença pode ser pequena, na força do agar­ que está de pé, não precisamos observá-los para
rar, por exemplo, ou na posição exata dos dedos. concluir que a pessoa está se comportando. A
Mas, se houver qualquer diferença que seja, de­ característica crítica do agarrar da criança e do
vemos nos perguntar se deveríamos considerar ficar de pé do adulto é, simplesmente, que essas
as duas ocorrências do agarrar como duas ins­ respostas têm um efeito; nenhum dos dois cai.
tâncias da mesma resposta ou como duas res­ Assim, nem todos os movimentos precisam
postas diferentes. Devemos falar não de respos­ ser instâncias do comportamento, e nem todas
tas individuais, mas de classes de respostas com as instâncias do comportamento precisam ser mo­
propriedades em comum. vimentos. Fazemos muitas coisas que não en­
A segunda dificuldade é que as respostas, às volvem qualquer movimento óbvio. Quando
vezes, são adequadamente descritas em termos ouvimos música, por exemplo, podemos mudar
de movimentos, mas, outras vezes, a descrição nossa atenção de um instrumento para outro. A
deve incluir o ambiente em que as respostas ocor­ mudança de atenção é comportamento, mesmo
rem. Suponhamos que desejemos comparar, por que não seja medida como um movimento. Mui­
exemplo, as instâncias em que o bebê sustenta tos aspectos do pensar e do imaginar não envol­
um objeto com a mão fechada. Em termos dos vem qualquer movimento, mas, como as coisas
músculos que se movem, segurar ou agarrar um que fazemos, elas são variedades de comporta­
objeto com a mão direita tem mais em comum mento.
do que segurar um objeto com a mão direita e Quer o comportamento envolva ou não os
com a mão esquerda. Contudo, às vezes, pode movimentos, ele tipicamente tem conseqüências,
ser mais importante falar de segurar um objeto, e uma das conseqüências mais relevantes do
não importa com que' mão, do que falar do mo­ comportamento é que ele cria oportunidades para
vimento de uma mão em particular. outros comportamentos. Se uma criança recebe
Uma análise do comportamento deve fazer um biscoito, por exemplo, o biscoito lhe dá a
uma distinção entre os movimentos, respostas de­ oportunidade de comer. A importância do bis­
finidas por sua forma ou pela musculatura em­ coito é baseada no comportamento de comer da
pregada, e as ações, respostas definidas por suas criança, seu comportamento com relação àquele
relações com o ambiente. Para nossos propósi­ estímulo. Como teremos reiteradas oportunida­
tos, vamos verificar que ações são mais impor­ des de ver, não podemos caracterizar os estímu­
tantes. Consideremos com que freqüência fala­ los independentemente do comportamento do
mos em fazer coisas, ir a lugares ou manipular organismo, nem podemos caracterizar as respos­
objetos, sem levar em conta os detalhes de como tas independentemente do ambiente do organis­
ïssas ações são executadas. mo. •
Mesmo na ausência de movimento, podemos
:oncluir, às vezes, que ocorreu um comportamen­
to. Por exemplo, normalmente um bebê agarra HIERARQUIAS COMPORTAMENTAIS
as dedos de um adulto tão fortemente que pode
ser levantado no ar. Uma vez levantado, o bebê Uma maneira de se classificar o comporta­
pode não se mover enquanto segura pelo dedo e mento de um organismo é ordenar as respostas
linda assim, o simples fato de que ele não cai de acordo com as freqüências relativas com que
leva-nos a concluir que a resposta de agarrar con­ o organismo as realiza. Por exemplo, se damos a
tinua. Do mesmo modo, se vemos um adulto pa­ uma criança a oportunidade de comer, brincar

3 0 A . C ha rle s C atania
ou tomar banho, podemos verificar que a crian­ Em geral, é conveniente falar de estímulos,
ça brinca bastante, come de vez em quando, e em vez de oportunidades para responder. Assim,
dificilmente toma a iniciativa para tomar banho. para a criança do exemplo podemos descrever a
Brincar, como o comportamento mais provável, comida como um estímulo ou evento apetitivo e
vem primeiro na ordem, seguida pelo comer e, tomar banho como um evento aversivo, enquan­
então, pelo tomar banho. Essa ordenação tem to os eventos que não são nem apetitivos nem
sido chamada de hierarquia de comportamento aversivos seriam categorizados como neutros.
(cf. a hierarquia de famílias de hábitos de Hull, Infelizmente, mesmo que sejamos capazes de
1943). Uma maneira equivalente de se descre­ empregar esses termos em situações específicas,
ver essa ordenação é a linguagem da preferên­ os estímulos em geral não podem ser agrupados
cia: poderíamos dizer que a criança prefere jo­ tão facilmente. Os contextos fazem muita dife­
gar a comer e que prefere qualquer destes dois a rença. Não podemos simplesmente dividir o
tomar banho. ambiente em três classes de eventos, chamados
As hierarquias de comportamento são mutá­ apetitivos, neutros e aversivos. Pelo contrário,
veis. Se esperássemos até o momento da refei­ devemos avaliar cada estímulo em relação a ou­
ção e déssemos a escolha entre comer e brincar, tras variáveis.
poderíamos descobrir que o comer tornou-se Com mudanças na hierarquia de comporta­
mais provável do que o brincar ou, em outras mentos, surgem mudanças na importância dos
palavras, que o comer deslocou-se para o alto da estímulos. Consideremos, por exemplo, como a
hierarquia em relação ao brincar. Enquanto está comida pode mudar de apetitiva para aversiva
comendo, a criança não está brincando nem durante um jantar de feriado excessivamente lon­
tomando banho, mas poderíamos verificar as go. Na banheira, por exemplo, se os pais mane­
posições relativas dessas duas respostas, dan­ jarem a situação com cuidado, a criança pode
do à criança a escolha entre os brinquedos e a começar a tolerar os banhos e, eventualmente,
banheira. Talvez descobríssemos que esta cri­ vir a preferir os brinquedos na banheira do que
ança quase sempre prefere os brinquedos. os brinquedos em outros lugares. De qualquer
Assim podemos concluir que, agora, brincar modo, à medida que o comportamento da criança
com os brinquedos está acima do tomar ba­ muda, podemos dizer que a criança está aprenden­
nho na hierarquia de comportamentos desta do alguma coisa sobre brinquedos e banheiras.
criança. Revimos, até aqui, algumas das proprie­
Podemos mesmo verificar que a criança sem­ dades gerais dos estímulos e das respostas à
pre deixa a área de banho, mesmo quando não medida que eles entram nas relações entre os
há muito mais o que fazer, em outro lugar. Pode antecendentes, o comportamento e as conse­
ser que a criança tenha tido uma má experiência qüências. Com esses preliminares como base,
ali, recentemente. Para qualquer tipo de compor­ estamos prontos para avançar para alguns ex­
tamento, devemos considerar quando ele come­ perimentos e descobertas clássicas na Psico­
ça e quando termina. logia da Aprendizagem.

A pr en d iza g em 3 1
Uma Taxonomia do Comportamento

(cair), relaciona-se a case (caso), accident (acidente),


A. A Observação do Comportamento
chance (chance) e coincidence (coincidência).
B. A Apresentação de Estímulos
Este capítulo oferece um esboço de uma ta­
C. Operações Conseqiienciais xonomia comportamental ou, em outras palavras,
um vocabulário que permite organizar os vários
D. Operações de Sinalização ou de Controle de
procedimentos e fenômenos do comportamen­
Estímulo
Sinalização de Apresentações de Estímulo to. Em vez de tentar explicar as instâncias do
Sinalização de Conseqüências comportamento como leis formais, vamos bus­
car uma classificação sistemática do comporta­
E. Estabelecendo a Efetividade das Conseqüências mento em termos de suas origens. A taxonomia
não será exaustiva, porque não podemos anteci­
F. Resumo
par tudo o que vai ocorrer à medida que estuda­
mos o comportamento. A ciência do comporta­
mento é complexa, está em progresso e prova­
Uma taxonomia é um sistema de classificação. A velmente continuará progredindo. Mas podemos,
palavra deriva do grego tassein, to arrange (arran­
ao menos, almejar um sistema descritivo, que or­
jar), mais a raiz grega nomia, method (método). Par­
tilha sua primeira raiz com o termo gramatical syn­ ganize os fenômenos sobre os quais sabemos
tax (sintaxe), com tactic (tática) e com taxis (taxia), alguma coisa, sem excluir aqueles que ainda es­
um tipo de movimento; a segunda raiz é partilhada tão por investigar.
com disciplinas sistemáticas como a astronomia e a Os procedimentos utilizados no estudo do
economia, com metrônomo e autonomia, e prova­
comportamento podem ser chamados de opera­
velmente mesmo com número.
As respostas, dependendo de suas relações com ções experimentais, e as mudanças que produ­
os estímulos eliciadores, as conseqüências, as ope­ zem no comportamento são denominadas de pro­
rações estabelecedoras e os estímulos discriminati­ cessos comportamentais. Estudamos a relação
vos são ditos eliciados, emitidos, evocados ou oca­ entre os eventos ambientais e o comportamento
sionados. Todos os quatro termos têm raízes latinas.
As três primeiras partilham um prefixo abreviado de
do organismo manipulando o ambiente e obser­
ex-, out(fora): eliciar, derivada âelaqueus, noose(nó) vando como isso afeta o que o organismo faz.
ou snare ( laço), está relacionada a delight (deleite) e Operamos sobre o ambiente do organismo ou,
latch (amarra); emitir, derivada de mittere, to send em outras palavras, efetuamos certas operações
(mandar) ou let go (deixar ir), está relacionada a to experimentais. Na análise do comportamento, as
omit (omitir) e intermitent (intermitente); evocar, de­
rivada de vocare, to call (chamar), está relacionada a
operações são o que o experimentador faz, ar­
vocal e invocar. A palavra occasion (ocasião), deri­ ranja ou programa, e os processos são as mu­
vada do prefixo ob-, against (contra), ecadere, to fali danças que resultam no comportamento. (Uma
analogia conveniente vem da Medicina, onde a sinalizar conseqüências e (6) esbabelecer a efe­
operação cirúrgica é o que o médico faz ao pa­ tividade de conseqüências. A seguir, vamos exa­
ciente, e os processos que se seguem são os efei­ minar vários experimentos clássicos para ilus­
tos da operação, como mudanças na circulação, trar essas operações e introduzir alguns dos prin­
na respiração, etc.) Os procedimentos para apren­ cipais pesquisadores da história da Psicologia da
dizagem podem ser descritos em termos destas Aprendizagem.
operações, isoladas ou em combinação.
A operação mais simples, logicamente, con­
siste meramente em (1) observar o comporta­
mento. O comportamento que observamos nos Seção A A Observação do
diz o que um organismo é capaz de fazer. Mas Comportamento
não temos nenhum controle sobre os eventos
quando apenas observamos, assim pode ser que O que devemos fazer para observar o com­
não sejamos capazes de tirar conclusões sobre portamento? Na seção anterior, argumentamos
as causas do comportamento. Devemos, então, que comportamento interessante depende de
intervir, e a intervenção mais simples consiste ambientes interessantes. O que aconteceria se
em (2) apresentar estímulos. Uma outra inter­ tentássemos outra direção, evitando a contami­
venção, mais complicada, consiste em (3) pro­ nação do comportamento pelo ambiente? Ima­
gramar o ambiente de modo que o comportamen­ gine, por exemplo, pegar um rato e fazê-lo usar
to do organismo tenha determinadas conseqü­ vendas, para diferenciar os estímulos visuais, e
ências. Uma vez que as respostas apresentam tampões nos ouvidos, para diferenciar os sons.
conseqüências, elas podem ocorrer mais ou me­ Então, removemos os odores com um sistema
nos freqüentemente e, assim, as operações con- de ventilação. Considerando que o rato ainda
seqüenciais levam aos processos denominados pode tocar coisas, incluindo seu próprio corpo,
de reforço e punição. desenvolvemos um traje feito de tubos ocos que
Ainda não esgotamos as possibilidades: po­ mantenha suas pemas presas, reduzindo o con­
demos programar as coisas de modo que (4) os tato tátil, pelo menos, para as patas. Isso ainda
estímulos sinalizem a apresentação de outros es­ pode ser insatisfatório, porque o peso do rato
tímulos ou que (5) os estímulos sinalizem a opor­ produz pressão nos pontos em que o traje toca
tunidade de produzir conseqüências. Falamos, partes de seus corpo e assim possibilita que ele
então, de operações de controle de estímulos', se oriente no espaço. O próximo passo é enviar
essas operações podem ocorrer apenas em com­ o rato equipado para uma estação orbital, onde a
binação com uma das operações mais simples, gravidade é eliminada. Contudo, depois que ti­
apresentar estímulos ou programar conseqüên­ véssemos realizado tudo isso, o que poderíamos
cias. O comportamento pode, então, depender da dizer acerca de seu comportamento? O que po­
presença ou da ausência do estímulo sinaliza­ deríamos observar o rato fazendo?
dor. Devemos considerar também as operações que O exemplo do rato é hipotético, mas alguns
(6) podem mudar os efeitos das conseqüências experimentos sobre a privação sensorial coloca­
do comportamento, como quando o alimento se ram pessoas em ambientes que se aproximam das
toma um reforçador mais potente depois de um condições de estimulação mínima que imagina­
período de privação de alimento. Tais operações mos para o rato. O problema é que, em ambien­
são chamadas de operações estabelecedoras, no tes como esse, tanto para uma pessoa como para
sentido de que estabelecem as condições sob as um roedor, não há muito o que fazer; não há qual­
quais as conseqüências podem tomar-se efeti­ quer lugar para ir e ninguém com quem falar.
vas como reforçadoras ou como punidoras. Embora as pessoas em tais ambientes relatem
Assim, as operações básicas que iremos con­ uma gama de atividades durante o tempo em que
siderar são: (1) observar o comportamento, (2) passam acordadas, do pensar ao alucinar, não é
apresentar estímulos, (3) programar conseqüên­ surpreendente que elas passem a maior de seu
cias para as respostas, (4) sinalizar estímulos, (5) tempo dormindo.

A prend iza gem 3 3


Estávamos certos de início. Para observar te, um posto avançado para a espionagem alemã
comportamento interessante, temos que obser­ envolvendo operações navais da Primeira Guer­
var o organismo em um ambiente interessante. ra Mundial: Ley, 1990). Em alguns dos experi­
Vamos considerar alguns exemplos. Nos primór­ mentos de Köhler, bananas ou laranjas eram co­
dios do estudo da Psicologia da Aprendizagem, locadas em locais visíveis, mas inacessíveis, e
especulações sobra a natureza da aprendizagem os chimpanzés usavam materiais dentro da área
baseavam-se, freqüentemente, em evidência ane­ como ferramentas para obter a fruta. A seguinte
dótica derivada da simples observação, como a passagem descreve o comportamento do chim­
seguinte: panzé macho, Sultão:

Os seis animais jovens da colônia da estação esta­


A maneira pela qual meu cachorro aprendeu a le­
vam dentro de uma sala com paredes perfeitamente
vantar o trinco do portão do jardim e passar para o
lisas e cujo teto - cerca de dois metros de altura -
lado de fora é um bom exemplo de comportamento
não podiam alcançar. Uma caixa de madeira..., aberta
inteligente. O portão de ferro na entrada de minha
em um dos lados, estava situada no meio da sala, o
casa é preso por um trinco, mas desloca-se e abre
lado aberto na vertical, e em plena vista. O objetivo
com seu próprio peso, se o trinco estiver levantado.
estava pregado em um canto no teto, cerca de dois
Sempre que queria sair ofo x terrier levantava o trin­
co com o dorso de sua cabeça, e assim soltava o metros e meio da caixa. Todos os seis macacos ten­
taram, em vão, alcançar a fruta saltando do solo.
portão que ficava escancarado...Como ele aprendeu
Sultão logo abandonou essas tentativas, andou in­
o truque? Nesse caso particular, a questão pode ser
respondida, porque ele foi cuidadosamente obser­ quieto de um lado para outro, subitamente parou
em frente à caixa, estimou seu tamanho, pegou-a,
vado. Quando era colocado para fora da porta, ele
virou-a apressada e diretamente rumo ao objetivo,
naturalmente queria sair para a rua, onde havia muita
mas começou a subir nela a uma distância (horizon­
atração - a oportunidade de correr, outros cachor­
tal) de meio metro, e, saltando para cima com toda
ros para provocar, possivelmente gatos com que se
sua força, desgrudou a banana. Cerca de cinco mi­
preocupar. Ele olhava impaciente através da cerca...
nutos haviam se passado desde que a banana fora presa
e no devido tempo teve a oportunidade de olhar de­
baixo do trinco, levantando-o com sua cabeça. Ele no teto; da pausa momentânea diante da caixa até a
primeira mordida na banana, apenas alguns segundos
retirou a cabeça e olhou em outra direção, mas o
se passaram, uma ação perfeitamente contínua após a
portão se abriu... Depois de umas dez ou doze expe­
primeira hesitação (Köhler, 1972, pp. 39-40).
riências, em cada uma das quais a saída foi efetuada
mais rapidamente, e com menos olhares para luga­
res errados, o fo x terrier tinha aprendido a ir direto Em muitos casos, claro, os chimpanzés fize­
e sem hesitação ao lugar exato. Neste caso, levantar ram tentativas mal sucedidas de resolver proble­
o trinco aconteceu inquestionavelmente por acidente mas como esses.
e o truque apenas tomou-se habitual pela associa­ Köhler discutiu essas observações e outras
ção repetida com a mesma situação da ação casual e
da fuga feliz. Uma vez firmemente estabelecido, no relacionadas, em termos de insight e inteligên­
entanto, o comportamento permaneceu constante cia dos chimpanzés. Mais importante, talvez, ele
pelo resto da vida do cachorro, uns 5 ou 6 anos. demonstrou o quanto os chimpanzés eram capa­
(Morgan, 1920, p. 144) zes de fazer. Os chimpanzés eram muito menos
familiares naqueles dias do que atualmente, e os
Observar esse comportamento, talvez, tenha leitores de seu tempo estavam impressionados
sido um acidente feliz, como o do cachorro le­ por suas descrições do desempenho do chimpan­
vantando o trinco. Mas pode-se aprender mais zé. O problema é que não era possível dizer, com
sobre a aprendizagem pelo arranjo dos ambien­ base apenas na observação, de onde provinha o
tes nos quais o comportamento é observado. Um comportamento. Seria Sultão capaz de resolver
pesquisador que fez isso foi Wolfgang Köhler, um problema particular por causa de alguma dis­
um dos fundadores da Psicologia da Gestalt. posição cognitiva herdada? Por que o problema
Köhler estudou o comportamento de chimpan­ tinha características em comum com alguma si­
zés mantidos, de 1913 a 1917, na Estação An- tuação que ele já tivesse encontrado? Por que
tropóide de Tenerife, uma ilha ao noroeste da ele tinha visto outros chimpanzés cujo compor­
África (Köhler, 1927; os chimpanzés não são na­ tamento podia imitar? Ou por causa de alguma
tivos de Tenerife, e a estação era, provavelmen­ combinação desses e de outros fatores?

34 A . C harles C atania
Köhler achava o termo insight (descoberta seu pescoço e, logo, uma intumescência aparece em
súbita) apropriado, devido ao aspecto súbito com sua base. A intumescência desloca-se para cima, cau­
sando as deformações mais assustadoras e as voltas
que a solução do problema freqüentemente emer­ e contorções mais peculiares do pescoço. Subita­
gia. Essa solução de problemas que parecia ba­ mente, ela abaixa a cabeça e regurgita um enorme
seada em insights levou a outras questões: se a monte de alimento meio digerido. Isto cai e um pe­
aprendizagem tinha lugar gradual ou abrupta­ queno pedaço é agora pego e apresentado aos filho­
mente, e se este tipo de resolução de problema tes. Eles redobram seus esforços e, logo, apoderam-
se do alimento, ao que ela lhes apresenta um novo
poderia ser explicitamente ensinado. Debates bocado. Uma vez ou outra, os filhotes bicam o ali­
acerca do quanto os primatas não-humanos po­ mento no chão, mas, mais freqüentemente, o alvo é
dem aprender continuam até os dias de hoje. Mas o bico do progenitor e, embora sua pontaria não seja
a observação por si só raramente identifica as sempre certeira, raramente, eles precisam mais que
fontes do comportamento e, assim, raramente re­ três ou quatro tentativas até que acertem (Tinber­
gen, 1960, p. 178).
solve tais questões.
A rigor, Köhler fez mais do que simplesmente Por enquanto, temos aqui apenas algumas
observar o comportamento. Ele arranjou os am­ observações do comportamento dos filhotes. Mas
bientes dentro dos quais suas observações eram elas envolvem os efeitos dos estímulos e, por­
feitas. Observação sem intervenção é algo difí­ tanto, provocam algumas questões. Quais são,
cil de se conseguir. Para ser bem-sucedido na exatamente, as “características críticas” desses
observação dos organismos na situação natural, estímulos especiais apresentados pela gaivota-
é preciso saber os possíveis efeitos de uma pre­ mãe? Algumas são mais importantes que outras?
sença humana sobre seu comportamento. Mes­ Seriam elas as mais efetivas?
mo levar um organismo para o cativeiro é, em si Tinbergen dispôs-se a responder a essas ques­
mesmo, uma intervenção. Para estudar tais efei­ tões preparando estímulos que se assemelhassem,
tos, deve-se apresentar os estímulos apropriados. de várias formas, à gaivota-mãe. Então, ele me­
Em qualquer estudo do comportamento, então, diu o bicar quando esses estímulos eram apre­
apresentar estímulos é praticamente inevitável. sentados a filhotes de gaivota arenque recém-
saídos da casca do ovo. A gaivota arenque tem
uma cabeça branca e um bico amarelo com uma
mancha vermelha próxima da extremidade. Um
Seção B A Apresentação de Estímulos
bico com uma mancha negra, azul ou branca
gerou menos bicadas do que um com uma man­
Kõhler, de fato, apresentou estímulos quan­ cha vermelha, mas um bico com uma mancha de
do programou o ambiente para os chimpanzés qualquer cor produziu mais bicadas do que um
que observou. Então, vamos considerar um con­ bico sem qualquer mancha. Comparadas à man­
junto de exemplos em que o papel dos estímulos cha vermelha, as cores do bico e da cabeça
é examinado mais diretamente. A seguinte pas­ foram relativamente irrelevantes na geração
sagem, pelo etólogo Niko Tinbergen, descreve de bicadas. De fato, desde que o modelo ti­
o primeiro episódio de alimentação do filhote da vesse um bico com uma mancha vermelha, a
gaivota arenque: presença ou a ausência de uma cabeça fazia
pouca diferença.
As vezes o pássaro adulto levanta-se e olha para o
Tinbergen variou também a forma do bico,
ninho abaixo e, então, podemos ver o primeiro com­
portamento de solicitação dos filhotes. Eles não per­ como ilustrado na Figura 2.1. Ao lado de cada
dem tempo contemplando ou estudando o progeni­ estímulo, o bicar é mostrado como uma porcen­
tor, cuja cabeça eles vêem pela primeira vez, mas tagem do número de bicadas gerado pela forma
começam a bicar imediatamente na ponta do bico normal do bico, o primeiro, em cima. A mancha
dele, com arremessos relativamente certeiros, repe­
vermelha e outras diferenças de cor foram eli­
tidos e rápidos de seus pequenos bicos. Eles nor­
malmente abrem as asas e soltam uns fracos piados. minadas, de modo que as mudanças no bicar po­
A velha ave não pode resistir a isso e, se os filhotes deriam ser atribuídas apenas a mudanças na for­
persistirem, ela os alimentará. Primeiro ela estica ma. A maior parte dos modelos produziu menos

A prend iza gem 3 5


que. Mais importante, ele foi capaz de especifi­
car as características da cabeça da gaivota adul­
ta que eram importantes para gerar bicadas e de
distingui-las das características sem importân­
cia. Em outras palavras, ao apresentar estímulos
e observar seus efeitos, Tinbergen foi capaz de
identificar a estrutura crítica dos estímulos que
geravam bicadas nos filhotes recém-nascidos de
gaivota arenque.
As apresentações de estímulo são uma carac­
terística comum da pesquisa conduzida por etó-
logos, cuja preocupação é a evolução de padrões
específicos da espécie e comportamentos nos
ambientes naturais (habitats) de um organismo.
Um dos efeitos de apresentações de estímulo,
como acabamos de ver, é a produção de respos­
tas. Esse processo, um resultado da apresenta­
ção de estímulos, é chamado de eliciação\ diz-
se que o estímulo elicia uma resposta. Na lin­
guagem da etologia, os estímulos críticos ou as
FIGURA 2.1 Uma série de modelos empregados na aná­
características críticas do estímulo são chama­
lise de quais propriedades do bico da gaivota-mãe pro­
duzem bicadas de solicitação no filhote recém-saído da dos de liberadores (releasers), e o comportamen­
casca. Ai bicadas em cada um dos outros modelos são to que eles produzem é chamado de padrão fixo
expressas como porcentagem do nível de referência de ação. Mas as variações na terminologia não
(100%) dado pelas bicadas no modelo superior. (Adap­ deveriam obscurecer a simplicidade da opera­
tado de Tinbergen & Perdeck, 1950, Figura 15.)
ção básica de apresentar estímulos.
Os efeitos eliciadores ou liberadores de estí­
mulos podem mudar ao longo do tempo. Dados
bicadas do que o modelo com a forma normal de dos filhotes da gaivota risonha (laughing gull)
bico. O modelo com um bico alongado (embai­ mostram um exemplo. A alimentação no filhote
xo) produziu consideravelmente mais bicadas do da gaivota risonha difere em detalhes daquela
que quaisquer outros, incluindo aquele com a da gaivota arenque, mas inclui o bicar de solici­
forma normal de bico. Devido à sua efetividade tação no bico da ave adulta, seguido pela regur­
em relação à forma normal, Tinbergen referiu- gitação do alimento parcialmente digerido por
se a este modelo como um estímulo supernor­ ela, que o filhote, então, come. A precisão das
mal, mas ele especulou que a forma deste mode­ bicadas de solicitação foi testada pela apresen­
lo particular poderia ser mais parecida com aque­ tação de modelos a filhotes de idades variadas.
la que o fdhote vê primeiro, no bico de seu pro­ Apenas um terço das bicadas de filhotes recém-
genitor, quando olha para cima, por baixo da nascidos atingia o modelo, ao contrário dos fi­
cabeça do pássaro adulto, do que a vista de per­ lhotes de dois dias, para os quais mais de três
fil, usada para a maior parte dos outros modelos. quartos das bicadas eram precisas (Hailman, 1969).
Tinbergen variou também outras proprieda­ A melhora na precisão terá sido em função de mu­
des do bico da gaivota, como o movimento, a danças na coordenação ou na experiência visual,
inclinação e a altura do solo. Sua análise permi­ ou em outros fatores? Alguns tipos de comporta­
tiu que construísse um estímulo verdadeiramen­ mento podem estar “embutidos” ou ser pré-pro-
te supernormal, um bastão vermelho na forma gramados no organismo, enquanto outros podem
de um lápis com três faixas brancas estreitas, que ser aprendidos. Como podemos dizer qual é qual?
gerou mais bicadas do que um modelo acurado As conseqüências de bicadas certeiras dife­
tridimensional da cabeça de uma gaivota aren­ rem das de bicadas não-certeiras. No habitat na­

36 A . C harles C atania
tural da gaivota risonha, é mais provável que uma Quase no final do século XIX, Thorndike des­
bicada certeira seja seguida do regurgitar de co­ crevia seus procedimentos do seguinte modo:
mida pelo progenitor do que uma não-certeira.
As bicadas precisas podem aumentar, em rela­ Escolhi, como meu método geral, um que, simples
ção às bicadas fora do alvo, devido às diferen­ como é, possui várias outras vantagens notáveis,
além daquelas que acompanham um experimento de
ças em suas conseqüências. As observações de qualquer tipo. O método consistiu meramente em
Hailman são consistentes com essa idéia: colocar animais, quando famintos, em espaços fe­
chados, dos quais eles poderiam escapar por meio
Se um filhote inexperiente está inicialmente próxi­ de algum ato simples, como puxar um laço de cor­
mo demais do alvo, o impacto de sua bicada contra da, pressionar uma barra ou pisar sobre uma plata­
o bico ou modelo é tão grande que o filhote é joga­ forma... O animal era colocado no espaço fechado,
do para trás, cerca de uma polegada (2,4cm). Se o o alimento era deixado à vista, do lado de fora, e
filhote começa longe demais do alvo, o ímpeto da suas ações eram observadas. Além de resgistrar seu
bicada perde o alvo, e o filhote cai para a frente, comportamento geral, atenção especial era diri­
cerca de duas polegadas. Os filhotes mais velhos gida a como ele fazia para desempenhar o ato
raramente cometem tais erros grosseiros, o que su­ necessário (caso ele fosse bem-sucedido), e fazia-
gere que a experiência de bicar de muito longe e de se o registro do tempo que ele levava dentro da cai­
muito perto ajudou o filhote a aprender a ajustar sua xa, até desempenhar a puxada, a unhada ou a mor­
distância (Hailman, 1969, p. 100). dida bem-sucedida... Se, por outro lado, após um
certo tempo, o animal não tivesse sido bem-sucedi­
Para estudar tais casos, não é suficiente a sim­ do, ele era retirado, mas não alimentado (Thorndi­
ke, 1898, pp. 5-6).
ples apresentação de estímulos. Uma operação
mais complexa deve ser programada: os estímu­
Uma das caixas-problema de Thorndike é
los devem ser apresentados como conseqüências
ilustrada na Figura 2.2. Em tais aparatos, Thorn­
do comportamento do organismo.
dike estudou gatos, cachorros e pintinhos. Ele
apresentou a seguinte descrição como típica do
comportamento da maioria dos gatos:
Seção C Operações Conseqüenciais
Quando colocado dentro da caixa, o gato mostrava
sinais evidentes de desconforto e de um impulso a
Novamente recorremos a um novo conjunto
de exemplos, desta vez baseados na pesquisa
sobre inteligência animal, desenvolvida pelo psi­
cólogo norte-americano Edward L. Thorndike.
A diferença crítica entre a pesquisa de Thorndi­
ke e a de Köhler é que Thorndike observou, sis­
tematicamente, certas mudanças no comporta­
mento, ao longo de muitas repetições do com­
portamento de um organismo em uma dada si­
tuação, em vez de restringir sua atenção a ins­
tâncias unitárias de resolução de um problema.
Thorndike notou, tipicamente, as mudanças gra­
duais no comportamento, ao longo de muitas re­
FIGURA 2.2 Na maioria das caixas que Thomdike
petições, ao contrário das mudanças súbitas ou (1898) empregou, o animal tinha um única maneira de
abruptas tipicamente relatadas por Köhler, tal­ abrir a porta. Na caixa mostrada, são ilustrados três
vez porque os problemas que ele estudou não métodos diferentes para abrir a porta: um pedal dentro
levassem a soluções súbitas ou baseadas em da caixa (A); um arame ou corrente que podia ser al­
nsights. O mais importante é que os experi­ cançado de dentro da caixa (B); e duas tramelas, que
podiam ser alcançadas de dentro para destrancar a
mentos de Thorndike demonstraram o quanto porta (C). A porta (D) geralmente tinha um contrapeso,
o responder geralmente depende de suas con­ de modo que ela se abria por si mesma quando o ani­
seqüências passadas. mal executava a resposta apropriada.

A prend iza gem 3 7


escapar do confínamento. Ele tenta se espremer por respostas podem alterar os estímulos, quando,
qualquer abertura: arranha e morde as barras ou o por exemplo, a rotação de um redutor de inten­
arame; empurra suas patas para fora, através de qual­
quer abertura, e agarra tudo o que alcança; continua
sidade muda o brilho de uma lâmpada; elas po­
seus esforços quando alcança alguma coisa solta ou dem remover os estímulos, como quando a ope­
instável; pode unhar coisas dentro da caixa... O gato ração de um interruptor desliga uma lâmpada;
que está unhando por todos os lados da caixa, em elas podem prevenir os estímulos, como quando
sua luta impulsiva, provavelmente agarrará o bar­ tirar o fio da tomada, antes de consertar a lâm­
bante, laço ou botão que abre a porta. E gradual­
mente, todos os outros impulsos mal sucedidos se­
pada, elimina a possibilidade de choque; elas po­
rão apagados (stamped out), e o impulso particular dem, até mesmo, mudar as conseqüências de
que levou ao ato bem-sucedido será impresso (stam­ outras respostas, como quando a substituição de
ped in) pelo prazer resultante até que, após muitas uma lâmpada queimada faz com que a resposta
tentativas, o gato, quando colocado na caixa, agar­ de operar o interruptor de luz volte a ser nova­
rará imediatamente o botão ou o laço, de uma forma
mente eficaz. Qualquer mudança ambiental pode
bem-definida (Thomdike, 1898, p. 13).
ser uma mudança produzida por uma resposta.
Como conseqüência de suas respotas, o gato Duas classes de conseqüências podem ser
escapava do confinamento e também ganhava distinguidas com base em seus efeitos sobre o
acesso ao alimento. Podemos supor que tanto a comportamento. As conseqüências reforçadoras
fuga como o alimento eram importantes para fa­ são as que aumentam ou mantém o responder;
zer com que a resposta bem-sucedida gradual­ as conseqüências punitivas são as que diminu­
mente dominasse as outras, mal sucedidas. De em ou suprimem o responder. (E útil, também,
qualquer modo, o procedimento não pode ser dispor de um termo que não prejulgue se as con­
simplesmente reduzido à apresentação de estí­ seqüências serão reforçadoras ou punitivas. O
mulos. Uma nova parte do ambiente não era ape­ termo conseqüenciação foi introduzido com este
nas apresentada ao gato; ela se tornava disponí­ propósito. Por exemplo, se não sabemos se es­
vel como uma conseqüência do que ele havia trelinhas douradas reforçarão o comportamento
feito. O comportamento do gato mudava como de uma criança de jardim de infância em sala de
resultado dessa operação de conseqüenciação. aula, ainda assim seria apropriado falar em con-
Experimentos contemporâneos, freqüentemente, seqüenciar o comportamento com estrelinhas
examinam respostas mais simples em situações douradas; p. ex., Powers & Osbome, 1976.)
mais simples, mas estão igualmente interessa­
dos nas relações entre as respostas e suas conse­
qüências.
Programamos conseqüências para as respos­ Seção D Operações de Sinalização ou de
tas, construindo ambientes. Se colocamos ali­ Controle de Estímulo
mento no compartimento-alvo de um labirinto,
por exemplo, criamos um ambiente em que a con- Quando os estímulos se tomam efetivos como
seqüênica para a locomoção de um rato, do com­ sinais geralmente os chamamos d&estímulos dis­
partimento de partida ao compartimento-alvo, criminativos, e as operações que envolvem si­
será encontrar o alimento. Depois que o rato al­ nais são chamadas de operações sinalizadoras
cança o alimento uma vez, podemos descobrir ou de operações de controle de estímulos. A
como essa conseqüência afeta seu comportamen­ apresentação de estímulos e a programação de
to, examinando o que ele faz da próxima vez que conseqüências raramente ocorrem isoladamen­
o colocamos no compartimento de partida. te: geralmente elas são sinalizadas por outros
As conseqüências que programamos podem eventos. Um lampejo de relâmpago precede, ti­
variar de eventos de significação biológica ób­ picamente, o estampido de um trovão. Um se­
via, como apresentar alimento ou água, até mu­ máforo alerta o motorista sobre as possíveis con­
danças relativamente pequenas em coisas vistas, seqüências de ir em frente ou de parar em um
ouvidas ou tocadas. Mas nem todas as conse­ cruzamento. Esses dois exemplos ilustram que
qüências envolvem a produção de estímulos: as os efeitos sinalizadores ou discriminativos dos

38 A . C h a rle s C atania
estímulos podem ser combinados com apresen­ lo previamente neutro com algum estímulo incon­
tações de estímulo ou com operações conseqüen- dicional definido. Além disso, não é suficiente que
haja superposição entre os dois estímulos; é tam­
ciais. Retomaremos a eles mais tarde. Ambos bém igualmente necessário que o estímulo condici­
demonstram as funções sinalizadoras de estímu­ onado comece a operar antes que o estímulo incon-
los, embora, como veremos, os dois tipos de sina­ dicionado entre em ação. Se essa ordem for inverti­
lização possam ter propriedades muito diferentes. da, o estímulo incondicionado sendo aplicado pri­
meiro e o estímulo neutro em seguida, o reflexo con­
dicionado pode não ser estabelecido de modo al­
gum. (Pavlov, 1927, pp. 26-27)
SINALIZAÇÃO DE APRESENTAÇÕES
DE ESTÍMULO Os experimentos de condicionamento de Pa­
vlov demonstraram como uma operação sinali­
Os estímulos que sinalizavam a apresentação zadora pode ser superposta à operação mais sim­
de outros estímulos eram a base dos experimen­ ples de apresentação de estímulo.
tos sobre reflexos condicionais ou condiciona­
dos, conduzidos pelo fisiólogo russo Ivan P.
Pavio v. Pavlov (1927) estudou como os estímu­ SINALIZAÇÃO DE CONSEQÜÊNCIAS
los adquiriam propriedades sinalizadoras, de­
monstrando que respostas a estímulos como o Em vez de sinalizar a apresentação de estí­
alimento, às vezes, eram produzidas por outros mulos, um estímulo pode sinalizar as ocasiões
estímulos que tinham precedido o alimento de em que as respostas terão conseqüências. A si­
modo regular e previsível. Pavlov falava dos efei­ nalização de conseqüências desempenhou um
tos de alimento na boca de um cachorro em ter­ importante papel na história da Psicologia da
mos de reflexo alimentar (para Pavlov, os com­ Aprendizagem, bem antes que começasse a ser
ponentes de tal reflexo incluíam tanto a resposta estudada experimentalmente. Ela esteve envol­
glandular de salivar, como as respostas motoras vida, por exemplo, na análise do caso de Clever
como mastigar e engolir). Ele se concentrou na Hans, um cavalo que parecia ter sido ensinado a
salivação, porque a tecnologia disponível torna­ resolver problemas aritméticos (Pfungst, 1911).
va o salivar mais fácil de medir do que as res­ O cavalo aparentemente resolvia, com suas pa­
postas motoras. O duto de uma das glândulas sa­ tas, não apenas adição e multiplicação, mas tam­
livares do cachorro era exposto, por meio de ci­ bém raiz quadrada.
rurgia, para fora de seu queixo e era conectado a
um sistema hidráulico que permitia contar as O visitante podia andar livremente e, se quisesse,
gotas de saliva. podia aproximar-se do cavalo e de seu mestre, um
Para um cachorro, o som de um metrônomo homem entre 60 e 70 anos de idade. Sua cabeça bran­
ca era coberta por um chapéu preto de abas largas.
precedia consistentemente a apresentação de ali­
A sua esquerda, o animal majestoso, um cavalo rus­
mento. Pavlov apresentou a seguinte descrição so de trote, permanecia como um aluno dócil, ma­
das condições necessárias para fazer um estímu­ nejado não por meio de chicote, mas por encoraja­
lo funcionar como sinal: mento gentil e recompensas freqüentes com pão ou
cenouras... Nosso cavalo inteligente era certamente
incapaz de falar. Seu principal modo de expressão
Em várias ocasiões, esse animal tinha sido estimu­
consistia em batidas com a pata dianteira direita.
lado pelo som do metrônomo, seguido imediatamen­
(Pfungst, 1911, pp.18-19)
te pelo alimento - isto é, um estímulo que, em si
mesmo, era neutro, tinha sido superposto à ação do
reflexo alimentar inato. Observamos que, após vá­ Clever Hans dava suas respostas pelo núme­
rias repetições da estimulação combinada, os sons ro de vezes que batia com a pata. Seu desempe­
do metrônomo tinham adquirido a propriedade de nho foi investigado por Oskar Pfungst, que des­
estimular a secreção salivar e de evocar as reações cobriu que o cavalo acertava com precisão ape­
motoras características do reflexo alimentar... As­
sim, o requisito primeiro e mais essencial para a for­
nas na presença do treinador. Além disso, Cle­
mação de um novo reflexo condicionado reside na ver Hans somente sabia as respostas se seu mes­
coincidência temporal da ação de qualquer estímu­ tre também as soubesse. Assim, Pfungst mudou

A pr end iza gem 3 9


sua atenção do cavalo para o treinador e deter­ algumas logo pareciam produzir complexas men­
minou que o cavalo estava respondendo a pistas sagens datilografadas. No entanto, quando se
sutis fornecidas pelo comportamento do treinador. descobriu que as crianças podiam responder cor­
retamente a questões somente quando os facili­
... pensamos descobrir com que movimentos fazer o tadores conheciam as questões, tornou-se claro
cavalo parar de bater a pata. Descobrimos que mo­ que a comunicação facilitada era uma espécie
vimentos para cima serviam como sinais para parar.
Levantar a cabeça era o mais efetivo, embora le­
de fenômeno moderno de Clever Hans (Montee,
vantar as sobrancelhas ou a dilatação das narinas - Miltenberger, & Wittrock, 1995). Os facilitado­
como no riso zombeteiro - também parecessem ser res vinham guiando ativamente a datilografia,
efetivas.... Por outro lado, movimentos da cabeça embora em muitos casos não estivessem cien­
para a direita e a esquerda ou para a frente e para tes, como o treinador de Clever Hans, de que
trás...eram inefetivos. Também descobrimos que to­
dos os movimentos de mão, inclusive o “maravilho­
estavam fazendo isso.
samente efetivo enfiar a mão no bolso com cenou­ Os efeitos sinalizadores, como os apresenta­
ras” não resultavam em qualquer resposta. (Pfun­ dos por Clever Hans, foram, eventualmente, exa­
gst, 1911, p. 63) minados de modo mais sistemático. Eles passa­
ram a ser chamados de funções discriminativas
O treinador tinha cooperado com a investi­ dos estímulos e diferiam, de muitas maneiras, dos
gação e não havia qualquer evidência de que ele tipos de funções sinalizadoras que haviam sido
estivesse ciente dos sinais que fornecia. Pfungst estudadas por Pavlov. A pesquisa que mais decisi­
notou que vamente estabeleceu a distinção foi conduzida pelo
psicólogo norte-americano B. F. Skinner, que
as realizações de Hans são fundadas... em um de­ programou um ambiente em que as pressões à barra
senvolvimento unilateral do poder de perceber os
mais leves movimentos do questionador... assim,
por um rato produziam alimento quando uma luz
temos justificativas para concluir, a partir do com­ estava acesa, mas não quando estava apagada,
portamento do cavalo, que o desejo pelo alimento é como ilustrado na seguinte passagem:
a única mola efetiva para a ação... A formação gra­
dual das associações mencionadas acima, entre a per­ O aparato consiste de uma câmara escura, bem ven­
cepção do movimento e os movimentos do próprio tilada e à prova de som... contendo... uma barra ho­
cavalo é, com toda a probabilidade, não o resultado rizontal, feita de arame pesado, que pode ser pres­
de um processo de treino, mas um subproduto não- sionada, aproximadamente, l,5cm para baixo, con­
intecional de uma tentativa mal sucedida de uma tra uma tensão de 10 gramas. Quando a barra se
educação real. (Pfungst, 1911, pp. 240-241) move para baixo, um interruptor de mercúrio, dire­
tamente atrás da parede, é fechado. Estamos inte­
Nesse caso, os movimentos do treinador for­ ressados na resposta do rato de pressionar esta bar­
neciam os estímulos na presença dos quais as ra, que podemos definir como qualquer movimento
do rato que resulte no fechamento do interruptor. O
batidas da pata eram seguidas por alimento. O
interruptor opera um comedouro, que deposita uma
caso de Clever Hans demonstra que mesmo as pelota de alimento, de tamanho padrão, dentro da
propriedades mais sutis dos estímulos podem si­ bandeja, onde ela fica acessível ao rato. O experi­
nalizar as conseqüências do responder, e ele é mentador pode quebrar à vontade a conexão entre a
freqüentemente citado quando os críticos consi­ barra e o comedouro... O único requisito adicional
para a investigação de uma discriminação é uma
deram se um comportamento sofisticado depen­
fonte extra de energia estimulante... uma pequena
de de dicas que possam ter sido não-intencio- lâmpada elétrica (3 c.p.)... O experimentador con­
nalmente fornecidas pelos participantes. trola a corrente para a lâmpada e a conexão entre a
A comunicação facilitada, por exemplo, foi barra e o comedouro, de tal modo que a resposta à
uma tentativa de fornecer uma terapia para crian­ barra, mais luz, é sempre seguida pelo depósito de
uma pelota de alimento na bandeja, enquanto que a
ças autistas não-verbais. As mãos das crianças
resposta à barra, sozinha, nunca é reforçada desta
eram guiadas sobre o teclado de uma máquina forma. O animal finalmente aprende a responder à
de escrever por facilitadores, indivíduos que su­ barra quando a luz está acesa, mas a não responder
postamente forneceriam suporte emocional e aju­ quando a luz está apagada. (Skinner, 1933, pp. 304­
da motora. Mesmo que as crianças não falassem, 305)

40 A . C harles C atania
Nesse exemplo, a luz sinaliza as conseqüên­ nem sempre é reforçado, pois o lápis nem sempre
cias do pressionar a barra: a pressão à barra é está ali. Em virtude da estimulação visual do lápis
(SD), faço o movimento requerido apenas quando
reforçada na presença, mas não na ausência de ele será reforçado. O papel desempenhado pelo es­
luz. A luz é um estímulo discriminativo, e o rato tímulo visual é mostrado, considerando-se o mes­
passa a pressionar a barra mais freqüentemente mo caso em um quarto escuro. Em uma ocasião, es­
quando a luz está acesa do que quando está apa­ tendo a mão e encontro um lápis, em outra estendo
gada. À medida que o rato começa a responder a mão e não o encontro... Nem no claro nem no es­
curo o lápis elicia minha resposta (como um cho­
diferentemente na presença e na ausência da luz, que elicia flexão), mas, no claro, ele estabelece a
seu comportamento entra sob controle da luz ocasião em que a resposta será reforçada. (Skinner,
como um estímulo discriminativo; pode-se di­ 1938, p. 178)
zer, também, que a luz ocasiona o comportamen­
to. O desenvolvimento desse responder diferen­ A relação de três termos, estímulo discrimi-
cial tem sido denominado aprendizagem discri­ nativo-resposta-conseqüência, será um tema re­
minativa. corrente. Cada um dos termos é crítico. Sua com­
As relações entre um estímulo discriminati­ binação distingue este caso de outras relações
vo e as conseqüências do responder são elabora­ comportamentais mais simples. Na situação pa-
das por Skinner na seguinte passagem (o termo vloviana, por exemplo, em que um estímulo é
operante refere-se a uma classe de respostas que sinalizado, o comportamento do organismo não
têm certas conseqüências particulares, e o termo tem qualquer efeito sobre a seqüência de even­
reforço refere-se a essas conseqüências): tos; nenhuma conseqüência é programada para
as respostas.
... o operante deve operar sobre a natureza para pro­ Consideremos novamente os exemplos do re­
duzir seu reforço. Embora a resposta seja livre para lâmpago que precede o trovão e das luzes do se­
ocorrer em um grande número de situações estimu­
ladoras, ela será eficaz para produzir o reforço ape­ máforo. Nossas piscadas ou o susto com o cla­
nas em uma pequena parcela delas. A situação fa­ rão do relâmpago não impedirão o estampido
vorável geralmente é marcada de algum modo e o subseqüente do trovão. Mas, se o semáforo está
organismo... passa a responder sempre que estiver vermelho quando nos aproximamos do cruza­
presente um estímulo que esteve presente em uma
mento, freiar é ocasionado por esse estímulo ape­
situação prévia de reforço, e a não responder, se este
não for o caso. O estímulo precedente não elicia a nas porque aprendemos as conseqüências poten­
resposta, ele meramente estabelece a ocasião em que ciais de fazer ou não fazer isso. Apenas o segun­
a resposta será reforçada... Portanto, três termos de­ do destes dois exemplos envolve todos os ter­
vem ser considerados: um estímulo discriminativo mos da contingência de três termos de Skinner.
prévio (SD), a resposta (R°) e o estímulo reforçador Uma diferença terminológica importante acom­
(S1). A relação entre eles pode ser formulada como
segue: apenas em presença de SD é que uma R ° é panha estas distinções, (i) quando um estímulo é
seguida de S*. (Skinner, 1938, p. 178) a causa fundamental de uma resposta, dizemos
que o estímulo elicia a resposta ou que a res­
Skinner explorou experimentalmente essa re­ posta é eliciada; mas, (ii) quando uma resposta
lação de três termos com as luzes como estímu­ ocorre em presença de um estímulo, porque o
los discriminativos, as pressões à barra por ratos estímulo sinaliza alguma conseqüência do res­
como respostas e as pelotas de alimento como ponder, dizemos que o estímulo ocasiona a res­
conseqüências reforçadoras, mas seu exemplo se­ posta e que a resposta é emitida.
guinte, de alcançar e tocar objetos no ambiente Os primeiros experimentos com animais fre­
visual, ilustra a ampla gama de situações a que o qüentemente estavam interessados não tanto no
conceito se aplica. estudo da natureza da aprendizagem de discri­
minação, mas nas capacidades sensoriais dos
Um exemplo conveniente é o comportamento ele­
organismos. A visão de roedores, por exemplo,
mentar de fazer contato com partes específicas do
ambiente estimulante. Certo movimento de meu bra­ foi estudada pelo arranjo de duas trilhas, uma
ço (R°) é reforçado pela estimulação tátil de um lá­ das quais levava ao alimento (Yerkes & Watson,
pis em minha mesa de trabalho (S1). O movimento 1911). No ponto em que o rato teria que esco-

A prend iza gem 4 1


lher a trilha da esquerda ou a da direita, eram cais e achar alimento e saltar em direção às li­
apresentados dois estímulos (p. ex., um cartão nhas horizontais e cair na rede. Mas direita e es­
preto ou um cartão branco). A trilha do alimento querda não são irrelevantes para o rato. A situa­
variava entre a esquerda e a direita, mas era sem­ ção envolve, pelo menos, quatro respostas, cada
pre indicada pelo mesmo cartão (p. ex., preto). uma com sua conseqüência particular: saltar
Quando o rato aprendia a tomar a trilha indicada rumo às linhas verticais à esquerda, saltar rumo
pelo estímulo correlacionado com o alimento, os às linhas verticais à direita, saltar rumo às linhas
limites de sua visão podiam ser estudados pela horizontais à esquerda e saltar rumo às linhas
substituição do par original de cartões-estímulo horizontais à direita. Pode ser mais provável que
por outros (p. ex., cinza-claro e cinza-escuro). os ratos respondam com base na posição, direita
Tais experimentos eram trabalhosos; demonstrar e esquerda, do que com base nos cartões de estí­
a aprendizagem de discriminação podia levar mulo. Por exemplo, se as três primeiras tentati­
centenas de tentativas, se é que o rato aprendia. vas do treino vertical-horizontal fossem imple­
Esse tipo de estudo envolvia vários problemas, mentadas com as linhas verticais à direita, como
e o menor deles não era o de assegurar que o na Figura 2.3, não deveríamos nos surpreender
rato estivesse olhando para os estímulos ao atin­ se, na quarta tentativa, com as linhas verticais
gir o ponto de escolha. pela primeira vez à esquerda, o rato saltasse para
Os equipamentos evoluíram com o passar do a direita, em direção às linhas horizontais. Até a
tempo. A Figura 2.3, por exemplo, mostra a plata­
forma de salto, desenvolvida por Karl S. Lashley
(1930). Lashley descreveu suas vantagens:

... ela requer que o animal salte, de uma certa dis­


tância, sobre padrões de estímulo, em vez de passar
correndo por eles... Geralmente tenho treinado os
animais colocando-os na plataforma, junto à tela, e
permitindo que eles caminhem, passando pelas por­
tas abertas até o estrado de alimento e, então, gra­
dualmente, afastando a plataform a até que em 10
ou 15 tentativas a distância de 25cm seja alcan­
çada. Os cartões são colocados em posição e o
treino de discriminação começa. (Lashley, 1930,
pp. 454-457)

No equipamento de Lashley, os ratos normal­


mente aprendiam a discriminar entre o preto e o
branco com perfeita precisão dentro de 4 ou 5
tentativas e, mesmo discriminações mais difíceis,
como vertical versus horizontal, podiam ser
aprendidas em menos de 50 tentativas.
Esses casos em que os estímulos discrimina­
tivos sinalizam as conseqüências do responder
são mais complexos do que o exemplo em que FIGURA 2.3 A plataforma de saltos de Lashley (Lash­
ley, 1930, Figura 1). Um rato era treinado a saltar da
as pressões à barra por um rato produziam ali­ plataforma (S) para uma das duas portas (L e R). Se
mento na presença, mas não na ausência de luz. saltasse para a porta correta, a porta se abria e o rato
Ali, nossa preocupação era apenas com quão fre­ alcançava o estrado de alimento (FP). Se saltasse para
qüentemente as pressões à barra ocorriam quan­ a porta incorreta, ela permanecia fechada e o rato caía
do a luz estava acesa e quando estava apagada. na rede abaixo (N). A prancha metálica (M), projetada
acima das portas, impedia que o rato saltasse alto de­
Consideremos, contudo, a plataforma de saltos. mais. Na ilustração, a porta da direita (R) seria a cor­
Ela parece envolver apenas duas respostas e suas reta para um rato que estivesse sendo treinado a saltar
conseqüências: saltar em direção às linhas verti­ em direção às linhas verticais.

42 A . C harles C atania
tentativa quatro, saltar rumo à direita era tão efi­ mo. Quando esse intercâmbio é perturbado - quan­
caz em levar ao alimento quanto saltar rumo às do o organismo é privado da oportunidade de beber
—toma-se evidente que o beber teria maior probabi­
linhas verticais. lidade de ocorrer na primeira oportunidade. Em sen­
O tipo de discriminação em que um único tido evolucionário, isso “explica” por que a priva­
estímulo está presente ou ausente, como no ção fortalece todos os comportamentos condiciona­
exemplo de pressionar a barra, é denominado dos e incondicionados relacionados com a ingestão
discriminação sucessiva ou vai-não-vai. Aquela em de água. (Skinner, 1953, pp. 141-142)
que dois ou mais estímulos estão presentes ao
Skinner falou desses fenômenos em termos
mesmo tempo e em que cada um deles está corre­
de impulsos:
lacionado a uma resposta diferente, como no exem­
plo da plataforma de saltos, é denominada discri­ O termo é simplesmente uma maneira conveniente
minação simultânea. Ambas ilustram operações si­ de se referir aos efeitos da privação e da saciação e
nalizadoras superpostas às conseqüências do res­ de outras operações que alteram a probabilidade do
ponder. A comparação entre discriminações suces­ comportamento mais ou menos da mesma maneira.
Ele é conveniente porque nos permite lidar com
siva e simultânea mostra que essas operações ocor­ muitos casos de uma vez. Há muitas maneiras de se
rem em graus variados de complexidade. mudar a probabilidade de que um organismo venha
a comer; ao mesmo tempo, um único tipo de priva­
ção fortalece muitos tipos de comportamento. (Skin­
ner, 1953, p. 144)
Seção E Estabelecendo a Efetividade das
Conseqüências O comportamento decorrente de operações
estabelecedoras é chamado de evocado. Skinner,
Algumas conseqüências do comportamento no entanto, apontou que os efeitos de operações
são mais importantes do que outras e sua efeti­ estabelecedoras não devem ser igualados aos de
vidade pode variar ao longo do tempo. Por exem­ estímulos:
plo, a água pode ser um reforçador efetivo se Uma crença comum é a de que a privação afeta o
alguém estiver privado de água por algum tem­ organismo pela criação de um estímulo. O exemplo
po, mas terá menor probabilidade de funcionar clássico são as pontadas de fome. Quando um orga­
como reforçador se uma grande quantidade de nismo fica sem comida por um tempo suficiente, as
água tiver sido consumida. As coisas que podem contrações do estômago estimulam-no de modo ca­
racterístico. Geralmente essa estimulação é identi­
ser feitas para mudar a efetividade dos reforça-
ficada com o impulso da fome. Mas tal estimulação
dores são chamadas de operações estabelecedo- não está estreitamente relacionada com a probabili­
ras. A privação e a saciação são dois exemplos, dade do comer. As pontadas de fome são caracterís­
mas não são as únicas possibilidades. O exercí­ ticas apenas de uma parcela pequena de toda a gama
cio vigoroso no calor e em clima seco, por exem­ ao longo da qual essa probabilidade varia continua­
mente. Geralmente fazemos nossas refeições sem
plo, ou a boca cheia de uma comida bem salga­
atingir a condição em que as dores são percebidas e
da podem ter o mesmo efeito que um período de continuamos a comer por muito tempo depois que
privação de água. As operações estabelecedoras as primeiras garfadas interromperam quaisquer do­
mudam a efetividade das conseqüências, mudan­ res que pudessem ter ocorrido. (Skinner, 1953,
do a probabilidade do comportamento, como ilus­ p. 144-145)
trado por B. F. Skinner na seguinte passagem:
Como o exemplo de Skinner indica, deve-se
... a probabilidade de beber toma-se muito alta sob distinguir os efeitos discriminativos dos estímu­
severa privação de água e muito baixa sob saciação los dos efeitos de operações estabelecedoras.
excessiva... O significado biológico da mudança na Considere um outro exemplo (Michael, 1982).
probabilidade é óbvio. A água está sendo constan­ Uma pessoa está propensa a tomar um refrige­
temente perdida pela excreção e pela evaporação, e
rante e, ao localizar uma máquina de venda au­
uma quantidade igual deve ser ingerida para com­
pensar essa perda. Sob circunstâncias normais, um tomática, procura na bolsa por uma moeda. A
organismo bebe intermitentemente e mantém um máquina é um estímulo discriminativo, porque
estado razoavelmente constante e supostamente óti­ estabelece a ocasião na qual é possível obter o

A pr en d iza g em 4 3
refrigerante. Mas com relação à moeda, a má­ bientais, os estímulos, e as ações do organismo,
quina é um evento estabelecedor: ela torna a as respostas. Podemos examinar essas relações
moeda importante. Ela não é um estímulo dis­ analisando como as manipulações do ambiente
criminativo para olhar na carteira ou no porta- produzem mudanças no responder. Um primei­
moedas e encontrar uma moeda, porque a moe­ ro passo crítico é a observação do comportamen­
da seria encontrada ali sempre que fosse procu­ to, mas não basta simplesmente observar. Para
rada, quer a pessoa tivesse ou não visto a máqui­ compreender o comportamento devemos inter­
na de refrigerante. Em outras palavras, a máqui­ vir, mudando o ambiente. Podemos descrever as
na de refrigerante não é um estímulo em cuja mudanças ambientais em termos de classes de
presença alguém tem maior probabilidade de operações experimentais: operações deapresen-
encontrar moeda na carteira; mas ela toma a tação de estímulo, operações conseqüenciais e
moeda uma conseqüência reforçadora significa­ operações sinalizadoras ou de controle de estí­
tiva para checar a carteira. mulo e operações estabelecedoras. Ao longo
Em contraste com a linguagem de controle deste livro, retomaremos freqüentemente a es­
de estímulos, em que se diz que as mudanças sas operações e elas ajudar-nos-ão a organizar,
nos estímulos discriminativos ocasionam respos­ especialmente, o tópico sobre aprendizagem sem
tas, na linguagem das operações estabelecedo­ palavras da Parte III. A Tabela 2.1 sumariza as
ras diz-se que o responder evocado por tais ope­ operações.
rações ocorre em um ambiente relativamente Exceto pela observação, a apresentação de
constante. Por exemplo, se há maior probabili­ estímulos é a operação mais simples. Quando
dade de que alguém abra a geladeira muito tem­ apresentamos estímulos, podemos observar as
po depois das refeições, é o comportamento da respostas produzidas. Um toque na bochecha de
pessoa que muda de tempos em tempos e não o um bebê recém-nascido, por exemplo, pode fazê-
refrigerador. Nesse caso, diz-se que abrir a gela­ lo voltar-se e começar a sugar. As apresentações
deira foi evocado pela operação estabelecedora, de estímulo são relevantes para a aprendizagem,
privação de alimento. Mas ainda assim tal com­ porque as respostas produzidas pelos estímulos
portamento é ocasionado pelo refrigerador, por­ podem variar, dependendo das condições sob as
que abri-lo pode ocorrer em sua presença, mas quais os estímulos são apresentados.
não em sua ausência. E quando queremos falar Às vezes, o organismo muda seu ambiente: o
desse comportamento sem mencionar as opera­ comportamento pode ter conseqüências. Progra­
ções estabelecedoras nem os estímulos discrimi­ mar o ambiente de modo que ele seja afetado
nativos, é apropriado falar que o comportamen­ pelas respostas de um organismo é uma opera­
to foi emitido. Em outras palavras, as operações ção conseqüencial. As conseqüências podem in­
estabelecedoras evocam, os estímulos discrimi­ cluir a apresentação, a remoção ou a prevenção
nativos ocasionam e as respostas que eles evo­ de estímulos, ou eventos mais complexos, como
cam e/ou ocasionam são emitidas. mudanças nas conseqüências de outras respos­
Nosso tratamento sobre as operações estabe­ tas. Por exemplo, uma criança pode aprender a
lecedoras foi rápido, porque, em si mesmas, elas pedir um copo de leite ou ela pode descobrir que
não fornecem exemplos de aprendizagem. Como o que tem na xícara de café do pai é algo geral­
teremos oportunidade de verificar, no entanto, mente quente e amargo, ou ela pode ainda apren­
elas fornecem os contextos nos quais normal­ der que aceitar um copo de suco só é permitido
mente ocorre a aprendizagem e, portanto, é difí­ depois que ela tiver dito obrigada. Algumas res­
cil estudar a aprendizagem sem elas. postas que têm conseqüências podem ocorrer
mais freqüentemente e outras, menos freqüente­
mente. Se um organismo responde mais freqüen­
temente porque seu comportamento mudou o
Seção F Resumo ambiente, dizemos que o comportamento foi re­
compensado ou reforçado', se um organismo res­
Como vimos, o estudo do comportamento ponde menos freqüentemente pela mesma razão,
está interessado nas relações entre os eventos am­ dizemos que a resposta foi suprimida ou punida.

44 A. C h a r l e s C a ta n i a
TABELA 2-1 Operações Comportamentais Básicas

Operação Descrição Exemplos Terminologia


1. Observação Nenhuma intervenção. Observamos um animal se
comportando.
2. Operação de apresenta­ O estímulo A é apresen­ O ruído alto (A) assusta a O estímulo elicia a respos­
ção de estímulo tado. criança. O médico pro­ ta; a resposta é eliciada
jeta luz (A) dentro do pelo estímulo.
olho do paciente.
3. Operação conseqüen- A resposta B tem a conse­ Introduzir uma moeda em A resposta é emitida.
cial qüência C (p. ex., um uma máquina automá­
estímulo é produzido ou tica (B) resulta num re­
é terminado). frigerante (C).
Tocar num fogão quente
(B) produz queimadura
(C).
A luz se apaga (C) quan­
do o interruptor é acio­
nado (B).
4. Operação sinalizadora O estímulo D sinaliza a O relâmpago (D) precede O estímulo elicia a respos­
ou de controle de estí­ apresentação do estí­ o trovão (E). ta; a resposta é eliciada
m ulo: su p e rp o sta à mulo E. pelo estímulo.
apresentação de estímu­
lo
5. Operação sinalizadora O estímulo F sinaliza que O semáforo vermelho (F) O estímulo ocasiona a res­
ou de controle de estí­ a resposta B terá a con­ sinaliza que ultrapassar posta; a resposta é emi­
mulo: seqüência H. o cruzamento (G) pode tida em presença do es­
superposta às conse­ levar à multa (H). tímulo.
qüências A campainha do telefone
(F) sinaliza que atender
(G) pode oportunizar
uma conversa com al­
guém (H).
6. Operação estabelecedo- É estabelecidada a efetivi­ O alimento (I) toma-se um Um evento é estabelecido
ra dade de um a conse­ reforçador efetivo de­ como um reforçador ou
qüência I como um re­ pois da privação de co­ punidor.
forçador ou como um mida.
punidor. A apresentação de choque O comportamento é evo­
toma reforçadora a re­ cado pela operação es-
moção do choque (I). tabelecedora.
Quando é importante des­
trancar uma porta, a
chave da porta (I) tor­
na-se reforçadora.

Podemos sinalizar as apresentações de estí­ precede, de modo previsível, o retorno, do tra­


mulos ou as operações conseqüenciais, progra­ balho, de um dos pais, ou que um relâmpago
mando-as somente quando alguns estímulos es­ geralmente é seguido por um trovão. Nesses ca­
tão presentes. Os organismos não se comportam sos a sinalização é superposta a apresentações
indiscriminadamente. Eles fazem algumas coi­ de estímulo: o som da chave precede o apareci­
sas em algumas circunstâncias e outras coisas mento do pai, e o relâmpago precede o trovão.
em outras circunstâncias. Por outro lado, um estímulo pode sinalizar as
Um estímulo pode sinalizar a ocorrência imi­ condições sob as quais uma resposta tem conse­
nente de um outro. Por exemplo, a criança pode­ qüências. Por exemplo, uma criança pode apren­
ria aprender que o som de uma chave na porta der que suas solicitações têm maior probabilida-

A pr end iza gem 4 5


de de serem atendidas na presença de um dos ança pede ou não um copo de água, por exem­
pais, do que na presença dos dois pais juntos, ou plo, pode depender, em grande parte, de quanto
que o comportamento inapropriado tem maior tempo se passou desde a última vez que ela tomou
probabilidade de ser seguido por repreensão na água. Essas operações podem evocar o comporta­
presença de um dos pais do que na presença do mento e elas funcionam mudando a efetividade de
outro. Nesses casos, o controle de estímulo está eventos como reforçadores ou punidores.
superposto a uma operação conseqiiencial: a pre­ O comportamento pode ser complicado. Es­
sença dos pais sinaliza várias conseqüências para tímulos diferentes podem ter efeitos diferentes
as solicitações ou para o comportamento inade­ sobre respostas diferentes e diferentes respostas
quado. podem ter conseqüências diferentes. No entan­
As mudanças no comportamento, decorren­ to, uma variedade de procedimentos de aprendi­
tes das operações de apresentação de estímulo zagem pode ser tratada como combinações des­
ou das operações conseqüenciais, podem come­ tes tipos básicos de intervenções experimentais:
çar a ocorrer somente na presença de estímulos as apresentações de estímulo; as operações con­
sinalizadores. Quando um estímulo sinaliza que seqüenciais, como o reforço e a.punição, em que
um evento está para ocorrer ou que o comporta­ as respostas agem sobre o ambiente; as opera­
mento de um organismo pode ter certas conse­ ções sinalizadoras ou de controle de estímulo,
qüências, o organismo pode começar a respon­ em que essas outras operações são sinalizadas
der diferentemente quando o estímulo está pre­ por estímulos discriminativos; e as operações es­
sente e quando ele está ausente. Esse processo é tabelecedoras, que alteram o significado das con­
chamado de discriminação, e diz-se que o com­ seqüências do comportamento. Como nossa ta-
portamento do organismo é ocasionado pelo es­ xonomia do comportamento, essas categorias
tímulo discriminativo. irão nos levar por um longo caminho, mas mais
Finalmente, o significado de eventos como tarde, especialmente quando considerarmos a
resultado de conseqüências do comportamento transição da aprendizagem sem palavras para a
pode ser alterado por operações estabelecedo­ aprendizagem com palavras, verificaremos que
ras, como a privação e a saciação. Se uma cri­ elas não esgotam as possibilidades.

46 A . C ha rle s C atania
PARTE II
COMPORTAMENTO
SEM APRENDIZAGEM
Evolução e Comportamento
3
A. A Natureza da Evolução gundo. Se parar para dormir, você vai levar muito
Receitas e Fotocópias mais tempo. (A estimativa de um por segundo é
Variação e Seleção muito generosa; é fácil contar rápido quando os
Tipos de Seleção números são pequenos, mas os números maio­
Resumo res, como 374.516.982, certamente vão tornar a
contagem mais lenta, principalmente, se você es­
B. Filogenia, Ontogenia e Comportamento
tiver preocupado em não perder a conta).
Durante a maior parte desse período, existiu
vida na Terra (ver Gould, 1989, para uma expla­
As palavras evolução e revolução derivam do latim nação detalhada). Evidências químicas e fósseis
volvere, to roll (rolar); a diferença é que evolução
implica unrolling (desenrolar), ou rolling out (rolar
indicam que ela começou, aproximadamente, no
para fora), e revolução implica rolling over (rolar primeiro bilhão de anos, e, ao longo da maior
sobre) ou tuming around (voltar ao redor de si). A parte dos três bilhões de anos seguintes, a vida
seleção pode estar relacionada a legere, em latim, consistiu de organismos unicelulares. Os orga­
to gather (conseguir) ou to choose (escolher) (cf. a nismos multicelulares apareceram há apenas 600
etimologia de logos, no Capítulo 14). O prefixo se-
milhões de anos atrás, mais ou menos no perío­
acrescenta a implicação de weeding outfrom a lar­
ge tiumber (eliminação ou exclusão de um grande do geológico chamado de Cambriano. Durante
número), em contraste com bringing together (agru­ esse período ocorreu uma explosão na diversi­
par ou juntar), implicado pelo con-, o prefixo radi­ dade de vida multicelular que foi seguida por uma
cal para collection (coleção). ampla exterminação; os sobreviventes consisti­
As palavras filogenia, a história evolutiva, e on­
togenia, a história de vida de um organismo indivi­
ram nos principais grupos a partir dos quais as
dual, partilham o radical grego gen-, no sentido de espécies contemporâneas evoluiram. Um desses
kind (tipo) ou sort (espécie de) (cf. etimologia de grupos era o de vertebrados. A evolução de an­
generalização, no Capítulo 8). Phylo- tem uma raiz fíbios para répteis incluiu muitos eventos signi­
grega que implica uma tribo ou clã ou uma linhagem ficativos, como a colonização da terra. Os di­
racial. Onto- tem um radical que implica being (ser)
ou reality (realidade). Em combinação com gen-,
nossauros foram uma parte espetacular da histó­
ambos implicam origem: a origem de um filo ou uma ria, mas eles desapareceram há mais ou menos
população, ou a origem de um ser vivo. 65 milhões de anos. Seu desaparecimento abriu
espaço para a evolução dos mamíferos, e, pro­
Nosso planeta tem aproximadamente 4,6 bi­ vavelmente, há 4 milhões de anos haviam evo­
lhões de anos. E um tempo muito longo. Se você luído os primatas que andam de pé. Posterior­
tentar contar até um milhão, vai levar mais de mente, nós, humanos, surgimos desta linha, há
trinta anos para terminar, mesmo que mantenha pouco mais de 100.000 anos. Todos somos apa­
um ritmo ininterrupto de uma contagem por se­ rentados e todos descendemos de uma linha
muito longa de sobreviventes. A evolução con­ pessoas sabiam como cultivar, seletivamente,
tinua em progresso e é rápida o bastante para ser plantas ou rebanhos para conseguir maior resis­
observada no período de vida de uma pessoa tência ou para manter uma ou outra característi­
(Weiner, 1994). Ela ocorre em habitats naturais, ca. Esse cultivo seletivo era denominado sele­
como as Ilhas Galápagos, onde diferentes espé­ ção artificial e criava novas variedades de vege­
cies de tentilhões evoluem com mudanças nos tais, flores, etc. Os cavalos para trabalho eram
habitats locais de cada ilha, mas acontece tam­ selecionados pela sua força e os cavalos de corri­
bém como resultado de intervenções humanas, da eram selecionados pela velocidade. Uma parte
quando, por exemplo, os organismos que cau­ do insight de Darwin foi que um tipo semelhante
sam doenças tomam-se resistentes a antibióti­ de seleção podia ocorrer na natureza, sem a inter­
cos, ou pragas de insetos tomam-se resistentes venção humana; esta era a seleção natural.
aos inseticidas. Esses são, apenas alguns dos mui­ Os principais argumentos de Darwin foram
tos fatos sobre a evolução. O registro fóssil é publicados pela primeira vez em seu livro A ori­
incompleto, e há muitos detalhes que desconhe­ gem das espécies (Darwin, 1859). Os argumen­
cemos, mas as evidências da biologia, da geolo­ tos foram calorosamente recebidos em alguns
gia e de outras disciplinas mostram que a evolu­ setores, mas sofreram fortes resistências por parte
ção aconteceu e continua a ocorrer. Em outras de outros. A resistência cresceu e lá pelo final
palavras, a evolução não é uma teoria; é um nome do século XIX espalhou-se a crença de que o
para certos tipos de mudanças que ocorrem com Darwinismo estava morto. Ele se recuperou bem
as populações biológicas a que denominamos es­ mais tarde no século XX. O período de mais ou
pécies. As teorias da evolução não são teorias menos meio século que precedeu sua recupera­
sobre se espécies contemporâneas são descenden­ ção passou a ser chamado de o eclipse do Da­
tes dos ancestrais tão diferentes que encontramos rwinismo (Bowler, 1983; cf. Catania, 1987).
nos registros geológicos. Todas as teorias da evo­ A razão para o eclipse não foi o de que a evo­
lução tomam isso como certo. Elas diferem no que lução em si tivesse sido desacreditada, mas sim
dizem sobre como a evolução surgiu. A Teoria que que outras teorias que não a de Darwin torna­
tem sido melhor sucedida em acomodar os fatos ram-se dominantes. As principais alternativas à
da evolução é a teoria de Charles Darwin sobre a (1) seleção natural foram (2) o Lamarckismo,
evolução em termos de seleção natural. (3) a ortogênese e (4) a combinação da genética
Mendeliana com a teoria da mutação. O Lamar­
ckismo baseava-se no trabalho do cientista fran­
cês do século XVIII, que, em sua época, havia
Seção A A Natureza da Evolução trabalhado muito para demonstrar o fato da evo­
lução. A teoria de Lamarck era a de que as ca­
A seleção natural se refere à explicação de racterísticas adquiridas durante a vida de um or­
Darwin sobre a evolução com base no diferen­ ganismo podiam ser passadas para seus descen­
cial de sobrevivência e de reprodução dos mem­ dentes, por meio de mudanças em seu próprio
bros de uma população; o ambiente seleciona os material genético. Um problema com essa teoria
indivíduos que transmitem suas características é que ela não conseguia mostrar por que as ca­
de uma geração para a outra e, assim, modela as racterísticas adquiridas que apresentavam van­
características dos membros das populações se­ tagens deveriam ter maior probabilidade de serem
guintes (para discussões sobre os detalhes da passadas adiante do que as características desvan­
seleção natural, ver Dawkins, 1976, 1986). A tajosas, como uma mutilação, por exemplo.
evolução por seleção natural requer variação De acordo com a teoria da ortogênese, a evo­
dentro de populações; essas variações são o ma­ lução era ditada por forças internas dos organis­
terial sobre o qual a seleção trabalha. mos, sem referência às demandas do ambiente;
A seleção era bem conhecida mesmo antes ela poderia estar ligada ao desenrolar do desen­
de Darwin, mas era do tipo empregado pelo ho­ volvimento. Supunha-se que uma manifestação
mem na horticultura e na criação de animais. As desse desenrolar era a recapitulação da filoge-

50 A . C harles C atania
nia pela ontogenia. A ontogenia é o desenvolvi­ teradas nas gerações seguintes. Em qualquer dos
mento do organismo individual e a filogenia é casos, o plasma germinativo podia ser conside­
sua história evolutiva. Pensava-se que durante a rado como uma representação ou cópia do orga­
ontogenia o embrião passasse por estágios que nismo.
correspondiam à sua filogenia. Essa idéia de re­ Uma receita é uma seqüência de procedimen­
capitulação, porém, tem sérias limitações e já não tos ou instruções. Ela descreve como criar um
é central na teoria da evolução (Gould, 1977). produto, mas não incorpora, necessariamente,
O problema com a genética Mendeliana era uma descrição do produto (a receita de um bolo
que, em si mesma, ela não fornecia um mecanis­ não se parece com um bolo). Uma receita pode
mo para a variação. Em uma descendência estri­ ser informativa, mas é pouco provável que con­
tamente Mendeliana, os gens dominantes e os tenha informações sobre suas origens, como o
recessivos em uma geração determinavam suas número de tentativas feitas até que ela funcio­
proporções na geração seguinte. Sem variação, nasse bem. Uma fotocópia, por outro lado, ge­
a seleção natural não tinha sobre o que agir. Para ralmente não diz como construir a estrutura que
explicar o aparecimento de formas novas, expli­ ela mostra. Como uma receita, ela pode ser in­
cações Mendelianas acrescentaram a teoria da formativa, mas é provável que ela também omi­
mutação, a qual sustentava que a evolução se pro­ ta informações sobre suas origens, tais como a
cessava por meio de mudanças genéticas espon­ ordem em que as diferentes partes foram desen­
tâneas e geralmente grandes. Naquela época, volvidas. Uma fotocópia é uma representação ou
porém, sabia-se muito pouco sobre a mutação, cópia, mas uma receita não é. As explicações
para que ela pudesse ser a base de uma explica­ Lamarckistas e da ortogênese preformacionista
ção convincente. tratavam o material genético como fotocópias,
mais do que como receitas.
Uma das principais realizações da Biologia
RECEITAS E FOTOCÓPIAS contemporânea consistiu em reinterpretar o ma­
terial genético não como uma fotocópia da es­
No século XIX, os gens eram entidades teó­ trutura do organismo, mas como uma receita para
ricas. As técnicas da biologia celular ainda não seu desenvolvimento (ver Dawkins, 1986, Ca­
haviam atingido o ponto em que os gens foram pítulo 11, sobre as metáforas de receita e fotocó­
localizados em células reais. Contudo, todas es­ pia). A formulação moderna exigiu que se re­
sas teorias evolucionárias supunham que algum pensasse em que sentido se pode dizer que o
tipo de material hereditário era transmitido de material genético contém informação, se sobre a
uma geração para a outra e que a evolução era história evolucionária ou sobre a estrutura do
determinada pelas propriedades desse material. organismo (cf. Dawkins, 1982, Capítulo 9). Os
A principal falha em algumas teorias era a supo­ materiais genéticos fornecem informação limi­
sição de que o material genético constituía uma tada sobre os ambientes passados em que eles
representação ou cópia do organismo. Na ver­ foram selecionados, em parte porque não incluem
são inicial da ortogênese, chamada preformaci- o material genético de todos os outros organis­
onista, o embrião era literalmente um homún- mos que não sobreviveram. E fornecem infor­
culo, um pequeno indivíduo, completo em todas mação limitada sobre a eventual estrutura de um
as partes; em variações posteriores da teoria, o organismo, porque são receitas para a produção
embrião era visto como tomando formas ances­ de proteínas, mais do que fotocópias de partes
trais, à medida que a ontogenia, como se dizia, do corpo. Uma implicação disso é a de que o
recapitulava a filogenia. Para o Lamarckismo, a Lamarckismo e pelo menos algumas variedades
transmissão de características adquiridas reque­ da ortogênese não tem sustentação como uma
ria que elas fossem, de algum modo, preserva­ alteranativa à seleção Darwiniana, porque suas
das no plasma genético; assim, o plasma germi- teorias implícitas da cópia são inconsistentes com
nativo tinha que conter algum tipo de plano da­ o que aprendemos sobre como o material gené­
quelas partes do organismo que deveriam ser al­ tico funciona.

A prend iza gem 5 1


É irônico que, ao lado do Lamarckismo e da ocorrer ao longo de extensos períodos de tem­
ortogênese, a genética Mendeliana também te­ po. Suponhamos, por exemplo, que alguma mo­
nha-se constituído em forte desafio à seleção lécula orgânica seja um pré-requisito crucial para
Darwiniana. A integração da genética Mendeli­ a vida, que ela ocorra na natureza com a proba­
ana com a seleção Darwiniana, por volta de 1920 bilidade de um em um milhão, apenas quando
a 1930, conhecida como a moderna síntese, tor­ uma corrente elétrica proveniente de um raio crie
nou-se a essência da Biologia contemporânea. a molécula, ao passar por uma mistura de gases
O problema é que a genética Mendeliana não que estavam presentes na atmofesra dos primór­
contemplava um mecanismo para variações. Foi dios da Terra. A criação de tal molécula pode
então que experimentos genéticos com moscas parecer muito remota. Mas as muitas tempesta­
de frutas permitiram não apenas a elaboração dos des ao longo de muitos milhões de anos durante
mecanismos genéticos, mas também trouxeram a história primitiva de nosso planeta teriam re­
as mutações para o laboratório. Com as moscas petido aquelas condições muitos milhões de ve­
de frutas, muitas gerações podiam ser estudadas zes, tomando uma certeza virtual de que a molé­
em um período de tempo relativamente curto. A cula seria criada não apenas uma, mas muitas
pesquisa forneceu evidências experimentais so­ vezes, muito embora o momento particular de
bre as taxas naturais de mutação e sobre a mag­ sua criação fosse imprevisível (cf. Dawkins,
nitude dos efeitos de mutação, que eram relati­ 1986; Gleick, 1987).
vamente pequenos, comparados com as mudan­
ças hipotetizadas em teorias anteriores sobre a
mutação. A combinação da genética Mendelia­ VARIAÇÃO E SELEÇÃO
na com os dados sobre mutações fornecia a va­
riabilidade necessária para a atuação da seleção Consideremos, agora, um exemplo de sele­
natural. ção natural. Começamos com uma população de
A perspectiva Darwiniana teve que enfren­ animais de caça (antílopes, por exemplo), cujos
tar e superar outras barreiras, além das teorias membros variam quanto à velocidade com que
competidoras (cf. Mayr, 1982). Comentamos, podem fugir de predadores; as razões para a di­
anteriormente, sobre as falhas no registro fóssil. ferença podem residir na anatomia (p. ex., a ex­
Nossa compreensão da vida pré-histórica depen­ tensão dos ossos, o tamanho dos músculos), em
de da descoberta de membros ocasionais de es­ diferenças sensoriais que permitem a alguns ini­
pécies primitivas, preservadas nesses registros, ciar a fuga mais rapidamente do que outros, a
mas os acidentes tanto em sua preservação quan­ diferenças metabólicas que afetem a resistência,
to em sua descoberta deixam lacunas inevitáveis. etc. Se esses animais são atacados por predado­
Além disso, as partes duras, como os ossos e as res, tudo o mais sendo igual, os mais lentos se­
conchas, têm maior probabilidade de serem pre­ rão os que terão maior probabilidade de serem
servadas do que as partes moles. E mesmo que capturados.
encontrássemos todas as partes intactas, nossa A condição de que tudo o mais seja igual é
informação sobre como essas criaturas se com­ importante. Falar apenas de velocidade é uma
portavam seria limitada. Temos sempre que re­ supersimplifícação. Por exemplo, um indivíduo
correr à evidência indireta (p. ex., analogias com que seja rápido às custas de ter que comer muito
espécies vivas, registros fósseis do comporta­ mais pode levá-lo a ter que procurar alimento
mento, tais como o de pegadas). (forragear) por muito mais tempo e, assim, cor­
A idade da Terra foi um outro problema. No re um risco maior de ser visto pelos predadores
século XIX a estimativa era muito curta para tor­ durante a pastagem. Esse risco maior pode con­
nar plausível a evolução pela seleção natural, mas trabalançar sua vantagem em velocidade, por­
essa idade foi revisada e muito ampliada duran­ que esse animal provavelmente ficará mais can­
te este século. Uma outra incompreensão se re­ sado do que outros, se ele for caçado mais
feria à probabilidade de eventos improváveis freqüentemente do que eles. Ou, como um outro
quando eles podem ter muitas oportunidades de exemplo, um organismo pode correr mais rapi-

52 A . C h a rle s C atania
damente do que outro, mas este pode ser mais sido os mais competentes fugitivos do seu tipo,
difícil de capturar, porque pode mudar de dire­ no seu tempo, mas eles já não estão vivos. Quan­
ção mais rapidamente ou de maneira mais im­ do a seleção opera sobre alguma propriedade
previsível. Contanto que os membros de uma po­ relativa, como a velocidade relativa à média de
pulação variem, nosso argumento pode ser uma população, a média da população muda. Por
reelaborado em termos dos efeitos de tais fato­ exemplo, depois que a captura pelos predadores
res sobre a probabilidade de ser capturado. Va­ selecionou repetidamente uma fuga mais rápida
mos falar sobre velocidade, porque é conveniente em uma população, poucos descendentes dos que
para nossa finalidade, mas devemos notar que as eram originalmente mais lentos terão sobrevivi­
dimensões efetivas de fuga de predadores são, pro­ do, mesmo que sua velocidade de corrida tenha
vavelmente, muito mais complexas do que isso. tido uma vantagem seletiva em uma época em
Em algum momento ao longo da história, nos­ que ela era uma velocidade muito rápida em re­
sa população de presas tem uma certa velocida­ lação à média da população. Em outras palavras,
de média, com alguns membros da população como demonstra o oehippus, não devemos es­
estando acima da média e outros abaixo. Os que perar encontrar, nas populações atuais, exempla­
estão abaixo da média são os que mais prova­ res de formas ancestrais.
velmente serão capturados e, portanto, terão De acordo com esses argumentos, a fonte de
menor probabilidade de passar seus gens para a seleção está no ambiente (os ambientes dos pre­
geração seguinte. Então, a geração seguinte de­ dadores incluem suas presas e os ambientes das
verá apresentar mais descendentes dos que esta­ presas incluem os predadores). A seleção cria as
vam acima da média, ou, em outras palavras, ven­ características dos organismos, mas a seleção é
cerão os corredores mais rápidos. Assim, a ve­ tão necessária para mantê-las como para criá-las.
locidade média nesta geração será mais alta do Por exemplo, os ancestrais das baleias eram, em
que na geração anterior. Mas o mesmo tipo de certa época, mamíferos terrestres. Depois que
seleção continua operando: novamente, os mais voltaram para o mar, as contingências que fa­
lentos terão maior probabilidade de serem cap­ ziam com que as pernas representassem uma
turados do que os mais rápidos. Ao longo de vantagem não mais mantiveram a seleção de per­
muitas gerações, portanto, a velocidade média nas bem-formadas. Pelo contrário, a seleção co­
vai se tomando cada vez maior. (Um tipo seme­ meçou a favorecer pernas que eram efetivas para
lhante de seleção também opera sobre os preda­ movimentos na água. As pernas dos ancestrais
dores, porque sua eficiência em capturar as pre­ da baleia desapareceram gradualmente; em certo
sas também vai variar entre os indivíduos.) sentido, é apropriado dizer que as pemas foram
A evolução do cavalo fornece fortes evidên­ extintas ou que se tomaram extintas (Skinner, 1988,
cias para esse tipo de seleção (Simpson, 1951; p. 73; cf. Provine, 1984). A seleção opera sobre as
Gould, 1996). Ao longo dos 50 milhões de anos espécies, mas o faz pela ação sobre os órgãos, os
ou mais desde o eohippus, o assim chamado ca­ sistemas e as partes particulares do corpo.
valo da aurora (tecnicamente seu nome é Hyra- Consideremos um outro exemplo. Os ambi­
cotherium), os indivíduos das populações das entes que possuem árvores altas, cujas folhas são
quais descendem os cavalos modernos aumen­ comestíveis, são ambientes em que pescoços lon­
taram gradualmente em tamanho. Essas mudan­ gos podem ser vantajosos, especialmente se ár­
ças no tamanho foram acompanhadas por outras vores mais curtas são raras ou se suas folhas são
mudanças (p. ex., os dedos tomaram-se patas), freqüentemente consumidas por competidores.
incluindo, supostamente, mudanças no compor­ As girafas passaram pela seleção natural de pes­
tamento. O eohippus foi o antecessor dos cava­ coços relativamente longos; tal seleção não po­
los modernos, mas é improvável que uma popu­ deria ter ocorrido em ambientes sem árvores al­
lação de eohippus pudesse sobreviver nos habi­ tas (as árvores altas estabeleceram a ocasião para
tais dos cavalos contemporâneos. O fato de que pescoços longos). Mas a seleção também depen­
o eohippus está extinto é relevante para nossa deu do que estava disponível como ponto de par­
história. Muitos de seus descendentes devem ter tida. Em uma espécie, as variações entre os indi­

A pr end iza gem 5 3


víduos podem favorecer a seleção daqueles com engenharia aeronáutica, Dawldns (1982) apre­
pescoços longos, mas, em outra, elas podem senta o problema assim:
favorecer a seleção dos que sobem em árvo­
res mais eficientemente. O ambiente selecio­ Os projetistas da primeira máquina a jato começa­
na a partir de populações de organismos, mas ram com um papel em branco. Imagine o que eles
teriam produzido, se tivessem sido obrigados a “de­
a seleção pode operar somente sobre a faixa senvolver” o primeiro jato a partir de uma máquina
de variações disponíveis naquelas populações. a gás, mudando um componente por vez, parafuso
Os fatores estruturais devem ser incluídos en­ por parafuso, fivela por fivela, botão por botão. Um
tre os limites sobre as variações possíveis. Na avião a jato montado dessa maneira seria, de fato,
espécie humana, por exemplo, nossos ances­ uma máquina bem estranha. E difícil imaginar que
um aeroplano planejado por esse meio “evolucio­
trais mamíferos de quatro patas impediram a nário” pudesse sequer sair do chão. Ainda assim,
evolução de um par de asas emergindo de nos­ para completar a analogia biológica, temos que
sos ombros. acrescentar mais uma restrição. Não é apenas o pro­
O tipo de seleção filogenética que discutimos duto final que deve sair do chão, mas todos os exem­
até aqui envolve mudanças graduais que ocorre­ plares intermediários ao longo do processo e cada
intermediário deve ser superior ao seu predecessor.
ram ao longo de extensos períodos de tempo (ve­ (Dawkins, 1982, p. 38)
remos, mais tarde, que ela tem muito em comum
com um tipo de seleção que ocorre ao longo da Se o olho é um produto da seleção natural,
vida de um indivíduo; ver Capítulo 7, sobre mo­ ele não poderia ter emergido de uma só vez. Mas
delagem). Algumas controvérsias sobre a evo­ que benefício é parte de um olho? Que vanta­
lução se referem a se ela ocorreu gradualmente, gem seletiva ele confere? A resposta é que mes­
como no exemplo do cavalo, ou se em saltos mo 1% de um olho seria uma vantagem substan­
(evolução pontual ou saltação). Por exemplo, o cial, se todos os contemporâneos do organismo
registro fóssil apresenta evidências de grandes que o possui tivessem menos que 1%. Qualquer
mudanças nas espécies, ao longo de períodos de sensibilidade à luz é melhor do que nenhuma,
tempo relativamente curtos, para padrões evolu­ 2% é melhor do que 1%, 3% é melhor do que
tivos (p. ex., a explosão de vida multicelular no 2%, e assim por diante. Dawkins descreve as van­
período Cambriano; no final do período Cretá­ tagens de um olho sem lentes sobre a inexistên­
ceo, a extinção dos dinosssauros, talvez como cia de um olho:
resultado do impacto de um cometa ou de algu­
ma outra catástrofe planetária, e a subseqüente Você pode dizer se está próximo a encontrar uma
proliferação dos grandes mamíferos). Dadas as parede ou uma pessoa. Se fosse uma criatura selva­
fortes evidências para ambos os tipos de mudança gem, você certamente poderia usar seu olho sem len­
te para detectar a sombra crescente de um predador
evolutiva, talvez fosse mais razoável concluir que e a direção de onde ele estaria se aproximando. Em
a evolução pode ocorrer de uma maneira ou de um mundo primitivo, onde algumas criaturas não
outra, com algumas características selecionadas têm olhos e outras têm olhos sem lentes, aquelas
gradualmente e continuamente em relação a uma com olhos sem lentes teriam todo tipo de vantagens...
certa média da população, e outras selecionadas é muito plausível que cada pequena melhora na pre­
cisão da imagem, do borrão embaçado à perfeita vi­
depois de eventos pontuais que produziram ex­ são humana, aumente as chances de sobrevivência
pressivas mudanças ambientais (incluindo, tal­ de um organismo. (Dawkins, 1986, p.81).
vez, as extinções em larga escala).
Como indicado em nosso tratamento da ve­ Quando um sistema complexo como um olho
locidade de corrida, a evolução por seleção na­ evolui em uma dada espécie, toma-se extrema­
tural envolve mais do que mudanças ao longo mente improvável que outro sistema com a mes­
de dimensões únicas. Ela resulta em uma com­ ma função venha a substituí-lo algum dia. Por
plexidade organizada, tal como a intrincada es­ exemplo, o 1% de visão que pode ter sido um
trutura do olho humano. E razoável acreditar que precursor evolutivo de um olho humano com­
a seleção natural pudesse ter produzido tal com­ pleto fornece uma vantagem consideravelmente
plexidade organizada? Usando uma analogia da menor, se um olho completo já existir, do que se

54 A . C harles C atania
a alternativa for não ver nada. A seleção não Cada sprandel contém um desenho admiravelmen­
substitui mecanismos existentes com outros que te adaptado em seu espaço decrescente. Um evan­
gelista está sentado na parte superior, ladeado pelas
realizariam a mesma função; assim, não deve­ cidades celestes. Abaixo, um homem representan­
ríamos esperar que um terceiro olho se desen­ do um dos quatro rios bíblicos (o Tigre, o Eufrates,
volvesse no meio da testa dos homens. o Indu e o Nilo) derrama água de um ajarra no espa­
O que dizer de outros casos, como o disfarce ço que se estreita entre seus pés. O desenho é
ou o mimetismo nos animais? Um inseto bastão tão elaborado, harmonioso e proposital, que so­
mos tentados a vê-lo como o ponto de partida de
pode se parecer tanto com um bastão que um qualquer análise (Gould & Lewontin, 1979, pp.
pássaro que come tais insetos passaria por ele 581-582).
sem comê-lo. Mas qual seria a vantagem de se
parecer apenas 5% com um bastão? Em respos­ A questão é que a Catedral de São Marcos
ta a essa questão, Dawkins (1986, pp. 83-84) as­ não foi construída para criar os sprandels. Os
segura que mesmo 5% de semelhança pode ser sprandels foram um subproduto arquitetônico
o suficiente para fazer diferença ao entardecer, inevitável, mas incidental, da construção de um
sob neblina ou se o pássaro estiver distante. Se domo no topo de arcos arredondados. De modo
os indivíduos de uma população variam em sua análogo, algumas características de populações
similaridade a ramos e gravetos, a seleção natu­ contemporâneas podem não ser produtos dire­
ral baseada em diferenças ainda que pequenas tos da seleção natural; em vez disso, elas podem
pode direcionar a população para disfarces mais ter sido subprodutos incidentais de outras carac­
e mais convincentes. terísticas não-relacionadas, que tenham surgido
A semelhança com um bastão é uma proprie­ por meio da seleção. Quando a fonte de uma ca­
dade pouco usual e é, certamente, apenas uma racterística herdada é incerta, a questão, às ve­
das muitas direções possíveis para a seleção. Já zes, é apresentada nos termos da analogia de São
salientamos que a seleção pode operar sobre di­ Marcos: ela é um produto da seleção natural ou
ferentes características em diferentes populações, é um sprandel?
e nem toda característica que pareça adaptativa Até aqui estivemos concentrados nas proprie­
é, necessariamente, um produto da seleção natu­ dades da seleção, mas o que podemos dizer, ago­
ral. Darwin considerava a seleção natural como ra, sobre a evolução do comportamento (cf. Skin­
o mais importante mecanismo da evolução, mas ner, 1984)? Já notamos que o comportamento
ele tomou o cuidado de apontar que a seleção deixa apenas evidência indireta no registro fós­
natural não era o único mecanismo possível: sil. Apesar disso, é seguro supor que os sistemas
“Estou convencido de que a Seleção Natural tem de respostas evoluiram antes dos sistemas sen-
sido o meio principal, mas não exclusivo, de soriais. Para um organismo que nada pode fazer
modificação” (Darwin, 1859, p. 6, itálicos acres­ sobre o que vê, não há vantagem em ver. Alguns
centados). As explicações selecionistas das ca­ organismos permaneceram imóveis, mas outros
racterísticas de uma população requerem mais começaram a se contrair e a se contorcer. Al­
do que uma história plausível sobre como tais guns organismos foram passivamente arrastados
características podem ser vantajosas. pelas correntes oceânicas e outros se fixaram em
Algumas características podem surgir como lugares particulares. Os organismos dos quais
produtos incidentais da seleção. Gould e Lewon- descendemos desenvolveram maneiras de se des­
tin (1979) utilizaram a construção de São Mar­ locar de um lugar para outro.
cos como uma analogia. São Marcos é uma ca­ À medida que os sistemas motores se desen­
tedral em Veneza, com um domo sustentado por volveram, as vantagens de responder diferenci-
arcos. Quaisquer dois arcos adjacentes se encon­ almente aos eventos ambientais foram, possivel­
tram no topo de um pilar comum e na constru­ mente, a base para a seleção dos sistemas senso-
ção da catedral o espaço triangular acima do pi­ riais. Afastar-se ao ser tocado pode ser o bastan­
lar e entre os dois arcos foi preenchido, e sua te para evitar um predador e certamente seria
superfície usada como um mosaico. O espaço é mais vantajoso do que se afastar ao acaso. Inge­
denominado um sprandel: rir coisas com base em suas propriedades quí­

A pr end iza gem 5 5


micas certamente seria mais vantajoso que inge­ puxa a pata para longe do espinho. A preguiça,
rir coisas ao acaso. Essas propriedades do com­ porém, vive em um ambiente muito diferente.
portamento são tão importantes, que é difícil ima­ Ela se dependura nas árvores e seus reflexos
ginar um mundo em que todas as criaturas fos­ comparáveis envolvem uma extensão, em vez de
sem desprovidas delas. Mas novamente devemos flexão da perna. Se o estímulo agudo é um espi­
lembrar que não deveríamos esperar encontrar nho, a preguiça, dependurada, vai apenas fazer
exemplares de formas ancestrais nas populações o estímulo penetrar mais fundo, caso puxe sua
atuais. perna em direção ao corpo, em vez de estendê-la
Os padrões mais primitivos de comportamen­ (cf.Hart, 1973, p. 176).
to foram, provavelmente, direcionados principal­ Mas nem todos os ambientes são estáveis.
mente por estímulos eliciadores. Suponhamos, Deve ter sido um passo evolutivo importante
por exemplo, que a luz brilhante elicie um mo­ quando tais padrões de comportamento toma­
vimento ao acaso. Uma larva de inseto na pre­ ram-se modificáveis ou, em outras palavras,
sença de luz começa a se mover e continua a quando alguns organismos tomaram-se capazes
fazê-lo até que, por acaso, encontre um lugar de aprender. A aprendizagem deve ter sido, de
escuro; uma vez ali, ela pára. Não encontramos início, selecionada dentro de domínios restritos.
muitas dessas larvas na luz, mas podemos en­ Por exemplo, ao deixar seu ninho, a vespa esca­
contrar uma grande quantidade em lugares es­ vadeira voa em círculos cada vez maiores; seu
curos (p. ex., debaixo do tronco podre de uma retomo ao ninho, mais tarde, é baseado em mar­
árvore caída). Quando as expomos à luz, todas cos espaciais, tais como pedras ou plantas sobre
elas começam a se movimentar. Mas seu com­ as quais ela voou antes da partida (Tinbergen,
portamento não é direcionado para lugares es­ 1972). Sua capacidade de aprender marcos de
curos; elas chegam ali por acaso, umas antes das referência é parte de sua herança filogenética e,
outras, e acabam se congregando ali, apenas por­ provavelmente, é muito específica para encon­
que é onde elas param. A orientação que ocorre trar o ninho.
dessa maneira é denominada uma cinesia\ ela se A própria capacidade de aprender deve ter
distingue de uma orientação em direção a ou para sido selecionada. A seleção dessa capacidade
longe de algum estímulo, que é denominada ta- ocorreu, possivelmente, de muitas maneiras di­
xia. Exemplos de taxias incluem movimentos em ferentes, em espécies diferentes e em tempos di­
direção à luz (fototaxia positiva) e movimentos ferentes. Os aspectos do ambiente que, geralmen­
para cima, contra a gravidade, como quando se te, permanecem constantes ao longo de toda a
sobe em uma árvore (geotaxia negativa). Os de­ vida têm que ser aprendidos apenas uma vez, en­
talhes desses e de outros tipos de orientação va­ quanto coisas sobre ambientes mutáveis têm que
riam (por exemplo, em um organismo com dois ser aprendidas e então descartadas e aprendidas
olhos a fototaxia pode ocorrer porque o organis­ de novo (em nossas próprias vidas, os nomes das
mo se move consistentemente, de modo a igua­ pessoas que conhecemos não mudam muito, en­
lar a quantidade de luz recebida em cada olho). quanto os itens em nossas listas de supermerca­
Esses exemplos, como as relações reflexas, do, geralmente, mudam de uma compra para ou­
partilham a propriedade de que cada uma envol­ tra). Por isso devemos esperar que alguns tipos
ve um padrão fixo de responder a eventos am­ de aprendizagem sejam difíceis de reverter, en­
bientais. De início, não havia qualquer movimen­ quanto outros permanecem transitórios e facil­
to; então o movimento passou a ocorrer sob con­ mente modificáveis. A sobrevivência de um be-
trole de estímulos. Tais padrões foram particu­ zerrinho recém-nascido, por exemplo, pode de­
larmente vantajosos em ambientes estáveis. Por pender de quão bem e rapidamente ele aprende
exemplo, dado um estímulo pontiagudo em sua sobre as características que distinguem sua mãe
pata, um cachorro flexiona a perna, puxando a das outras vacas; em um ambiente estável, tal
pata em direção ao corpo. Para um animal que aprendizagem (às vezes denominada imprinting)
caminha sobre o solo, esta resposta é vantajosa. pode ser efetivamente permanente. Sob tais con­
Se o cachorro pisa em um espinho, sua flexão dições, o período de vida durante o qual a apren­

56 A . C harles C atania
dizagem ocorre também pode ser limitado. Mas postas que produzem comida continuam a ocor­
à medida que o bezerro cresce e toma-se mais rer; outras respostas não. A comida é a conse­
independente, ele também aprende sobre muitas qüência que seleciona algumas respostas e não
coisas que mudam dia após dia, como a passa­ outras. Essa é uma maneira de dizer que o res­
gem de predadores ou os lugares onde o alimen­ ponder é selecionado por seu ambiente (é im­
to e a água são encontrados. portante notar o quanto isso é diferente de dizer
Os que buscam por mecanismos de aprendi­ que o próprio organismo selecionou alguma
zagem no sistema nervoso devem esperar que maneira de responder). Poderíamos dizer que as
contingências evolucionárias tenham seleciona­ respostas que produzem comida sobrevivem e
do diferentes tipos, com alguns produzindo mu­ que as outras se extinguem. Paralelos entre es­
danças relativamente permanentes no compor­ tas duas variedades de seleção, seleção filoge­
tamento, enquanto outros produzem mudanças nética ou Darwiniana e seleção ontogenética ou
facilmente reversíveis, com alguns restritos a si­ seleção do comportamento por suas conseqüên­
tuações relativamente específicas e outros a si­ cias, têm sido exploradas com um detalhamento
tuações geralmente amplas, com alguns operan­ considerável (p. ex., Catania, 1978; Skinner,
do em momentos da vida do organismo diferen­ 1981; T. L. Smith, 1986); alguns paralelos serão
tes de outros. Em outras palavras, a seleção de salientados à medida que os fenômenos da apren­
diferentes tipos de sistemas nervosos depende dizagem forem sendo explorados.
dos diferentes tipos de comportamento que eles O comportamento adquirido por meio de
produzem. Vamos retomar a este tópico no Ca­ aprendizagem, durante a vida de um organismo
pítulo 12, quando considerarmos os limites bio­ particular, desaparecerá, a menos que seja, de
lógicos para a aprendizagem. alguma maneira, passado para outros. Uma ter­
ceira variedade de seleção ocorre quando o com­
portamento pode ser passado de um organismo
TIPOS DE SELEÇÃO para outro, como na imitação, ou, mais impor­
tante, na linguagem. O que alguém disse ou es­
A seleção que consideramos até agora, a se­ creveu, por exemplo, pode sobreviver à morte
leção de populações de organismos ao longo do da pessoa, se for passado e repetido por outros.
tempo evolucionário, pode ser chamada de sele­ O comportamento verbal que sobrevive entre os
ção filogenética. Mas esse não é o único tipo de membros de um grupo e é partilhado por eles é
seleção que nos interessa. Dos vários tipos de parte da cultura daquele grupo. Vamos dar uma
aprendizagem que serão explorados nos capítu­ atenção especial a este terceiro tipo de sele­
los que se seguem, um é o caso em que as res­ ção, que tem sido chamado de seleção cultu­
postas são afetadas por suas conseqüências. Por ral, nos capítulos sobre aprendizagem social
exemplo, se um organismo está privado de ali­ e sobre o comportamento verbal (Capítulos 13
mento e alguma resposta produz comida, aquela a 15).
resposta provavelmente irá ocorrer mais freqüen­ Vimos considerando três tipos de seleção: (1)
temente. Já discutimos casos como esse, como a seleção filogenética, a evolução, ao longo do
instâncias de reforçamento. O reforçamento tam­ tempo biológico, de populações de organismos
bém pode ocorrer em situações ou ambientes par­ e suas características, tais como o comportamen­
ticulares, quando, então, dizemos que a situação to; (2) a seleção ontogenética, a modelagem do
estabelece a ocasião em que as respostas são re­ comportamento por suas conseqüências, duran­
forçadas. Tais casos envolvem um dpo de sele­ te a vida de um organismo individual; e (3) a
ção que opera ao longo da vida do indivíduo, em seleção cultural, a sobrevivência de padrões de
vez de ao longo de sucessivas gerações. comportamento à medida que são passados de
Esse tipo de seleção pode ser chamado de se­ um indivíduo para outros. Esses tipos de sele­
leção ontogenética-, ele envolve seleção pelas ção dependem de comportamentos que mudam
conseqüências (cf. Skinner, 1981). Para o orga­ tanto durante a ontogenia quanto durante a filo­
nismo privado de alimento, por exemplo, as res­ genia.

A pr en d iza g em 5 7
RESUMO recapitula a filogenia, assim, não podemos es
perar traçar a evolução do comportamento se­
Começamos esta seção com uma breve revi­ guindo o desenvolvimento do comportamento
são da evolução da vida na Terra. A concepção em um indivíduo (ou vice-versa). Se apesar des­
de Darwin sobre essa evolução, a seleção natu­ sas limitações ou se devido a elas, uma questão
ral, sofreu desafios de outras abordagens, tais recorrente tem sido a das contribuições relativas
como a ortogênese e o Lamarckismo. Ela supe­ da filogenia e da ontogenia para o comportamen­
rou esses desafios quando foi integrada à gené­ to, em que medida o comportamento depende da
tica Mendeliana e à teoria da mutação e quando história evolutiva e em que medida depende da
começou a ser reconhecido que o material gené­ aprendizagem? Quando tais perguntas são for­
tico era mais do tipo de uma receita do que uma muladas em relação a questões socialmente sig­
cópia de um organismo. As mudanças acumula­ nificativas, como a herança da inteligência, isso
das produzidas ao longo do tempo pela seleção geralmente resulta em acaloradas controvérsias,
natural criaram a complexidade organizada, mas especialmente quando as alternativas são apre­
também significaram, freqüentemente, que as sentadas como dicotomias ou oposições (p. ex.,
formas ancestrais não sobreviveram nas popula­ natureza versus criação, hereditariedade versus
ções contemporâneas. Alguns sistemas biológi­ ambiente).
cos foram modelados diretamente pela seleção e A pesquisa de Spalding, um naturalista bri­
outros foram subprodutos incidentais (spran- tânico do século XIX, fornece um argumento elo­
deis). O advento da aprendizagem foi um even­ qüente para o papel da filogenia no comporta­
to importante na evolução do comportamento; mento.
ele permitiu um segundo tipo de seleção, a sele­
ção ontogenética ou a seleção de classes de com­ ... temos apenas que olhar para os filhotes de ani­
portamento no período de vida de um organis­ mais inferiores para verificar que, de fato, eles não
têm que passar pelo processo de aprender o signifi­
mo, como quando o responder persiste porque cado de suas sensações em relação às coisas exter­
tem certas conseqüências. Um terceiro tipo de nas; que pintinhos, por exemplo, correm, bicam e
seleção tomou-se possível quando o comporta­ pegam pedaços de alimento e seguem imediatamente
mento pode ser passado de um indivíduo para o chamado da mãe, depois de deixar a casca do ôvo...
outro, na seleção cultural. A análise do compor­ Tenho observado e experimentado com mais de 50
pintinhos, retirando-os debaixo da galinha quando
tamento deve considerar o comportamento como ainda estão no ovo. Mas destes, nenhum dos que
um produto da seleção filogenética, ontogenéti­ emergiram da casca estava em condições de mani­
ca e cultural; devemos entender cada tipo de se­ festar familiaridade com as qualidades do mundo
leção para entender de onde vem o comporta­ externo. Ao deixar a casca eles estavam molhados e
mento. Vamos tratar brevemente, a seguir, da desamparados.... (Spalding, 1873/1954, pp. 2-3)
relação entre a filogenia do comportamento e sua
ontogenia. Spalding notou que os pintinhos desenvolvi­
am-se rapidamente. Dentro de quatro ou cinco
horas depois de sair do ovo, eles estavam bican­
do objetos e alisando as penas de suas asas. Mas
ele também reconheceu que muito podia ser
Seção B Filogenia, Ontogenia e
aprendido em quatro ou cinco horas
Comportamento
Para tomar óbvia essa objeção em relação ao olho,
O comportamento é uma função conjunta de vou recorrer ao seguinte expediente. Tomando os
contingências filo genéticas, aquelas que opera­ ovos justamente quando os pequenos prisioneiros
ram nos ambientes ancestrais durante a evolu­ começavam a abrir seu caminho de saída, eu remo­
via um pedaço da casca e, antes que eles abrissem o
ção de uma espécie, e de contingências ontoge-
olho, colocava em suas cabeças um pequeno capuz
néticas, as que operaram durante as interações que, tendo uma tira de elástico na parte inferior, fe­
de um organismo com seu ambiente, durante sua chava-se ao redor de seu pescoço. (Spalding, 1897/
própria vida (cf. Skinner, 1966). A ontogenia não 1954, p. 3)

58 A . C ha rles C atania
Spalding mantinha os pintinhos cegos durante após o nascimento. As criaturas podem estar pre­
um a três dias e, então, removia seus capuzes. paradas pela filogenia para fazer todo o tipo de
coisas que seus ancestrais faziam, mas eles tam­
Quase invariavelmente, eles pareciam um pouco bém podem estar preparados para começar a
atordoados pela luz, permaneciam imóveis por vá­ aprender imediatamente. O comportamento co­
rios minutos e continuavam, por algum tempo, me­
nos ativos do que antes de terem sido desencapuza-
meça no embrião (p. ex., Hall & Oppenheim,
dos. Seu comportamento, no entanto, foi, em todos 1987). Tanto no período pré-natal como no perí­
os casos, conclusivo contra a teoria de que as per­ odo pós-natal, alguns desses comportamentos são
cepções de distância e direção pelo olho sejam re­ independentes da estimulação sensorial e das
sultado de experiência, de associações formadas na conseqüências. Outros comportamentos são mo­
história de cada vida individual. Geralmente, ao fi­
nal de um ou dois minutos, eles seguiam com os
dificáveis, talvez até mesmo no período pré-na­
olhos os movimentos de insetos rastejantes, viran­ tal: o comportamento muda mesmo com as pri­
do suas cabeças com a precisão de uma velha ave. meiras interações do organismo com seu ambi­
(Spalding, 1873/1954, p. 3) ente (p. ex., Johanson & Hall, 1979; Rudy, Vogt,
& Hyson, 1984). De acordo com esse ponto de
Nosso principal interesse neste texto é o com­ vista, deveria ficar evidente que a resposta à ques­
portamento que é aprendido, mas devemos sem­ tão de ser o comportamento um produto da filo­
pre considerar a possibilidade de que o compor­ genia ou da ontogenia é que ele é um produto de
tamento que estudamos tenha fontes filogenéti- ambas (quanto às questões sobre as magnitudes
cas. Podemos tentar criar ambientes arbitrários relativas de suas contribuições, naturalmente, a
para minimizar o papel da filogenia. A caixa resposta geralmente é: “depende...”).
experimental padrão para pombos, por exemplo, Antes de tratar do comportamento que é
é um ambiente arbitrário, porque os ambientes aprendido, devemos notar a variedade de com­
naturais não apresentam os discos nos quais os portamento que está disponível antes que a apren­
pombos bicam para produzir alimento, quando dizagem ocorra. O comportamento que não é
o disco está iluminado. Mas os ambientes arbi­ aprendido aparece em muitas variedades (Gallis-
trários nem sempre são suficientemente arbitrá­ tel, 1980; von Holst, 1973). Alguns tipos têm
rios; eles não necessariamente tornam arbitrário características de osciladores (p. ex., os batimen­
o comportamento que ocorre neles. Considere­ tos cardíacos). Outros têm características de ser-
mos as respostas de bicar de um pombo: vo-mecanismos (p. ex., a manutenção do equilí­
brio, durante a qual pequenos deslocamentos
Tais respostas não são totalmente arbitrárias. Elas produzem ajustes compensatórios). Outros ain­
são escolhidas porque podem ser facilmente execu­
tadas e porque podem ser repetidas rapidamente, e
da são produzidos, de diversas maneiras, por
por longos períodos de tempo, sem fadiga. Em um estímulos ( p. ex., como nas relações reflexas ou
pássaro como o pombo, o bicar tem uma certa uni­ nas cinesias e taxias ou na mudança contínua no
dade genética; ele é uma partícula característica de tamanho da pupila com mudanças na intensida­
comportamento que aparece com uma topografia de da luz). As várias fontes do comportamento
bem-definida (Ferster & Skinner, 1957, p. 7)
fornecem nossa taxonomia, nosso sistema para
a classificação do comportamento. Nos capí­
O comportamento deve começar muito cedo
tulos seguintes, iremos examinar os respon-
na vida de um organismo, mas isso, por si só,
dentes, os operantes, os operantes discrimi­
não é uma evidência de que as fontes são filoge-
nados, os significados e as lembranças como
néticas, e não ontogenéticas. Lembre-se de que
classes de comportamentos que emergem des­
Spalding estava incerto sobre o quanto um pin-
sa taxonomia.
tinho podia aprender em apenas algumas horas

A prend iza gem 5 9


Comportamento Eliciado e
Comportamento Emitido
4
moderna agora relacionada ao comportamento, eti­
A. O Reflexo: Eliciação
queta.
Propriedades do Comportamento Eliciado
A raiz indo-européia, spend-, to pour a libation
Estímulos Eliciadores e Probabilidades de Resposta
(fazer libação) ou to make a treaty (fechar um con­
Probabilidades ou Freqüências Relativas
trato), levou ao termo grego sponde, a drink offe­
Probabilidades Condicionais
ring (uma oferenda de bebida), e ao termo latino
Tipos de Relações Estímulo-Resposta
spondere, to promise (prometer). Por meio destas
Efeitos de Eliciações Sucessivas
palavras, a palavra resposta, originalmente an un­
Habituação
dertaking in retum (comprometer em troca), está vin­
Potenciação
culada a sponsor (esposo, patrocinador) e, talvez
Efeitos do Tempo desde o Último Estímulo
mesmo, a espontaneous (espontâneo). Esta última
Eliciador
relação é interessante porque a palavra resposta,
atualmente, refere-se a uma unidade de comporta­
B. Do Comportamento Eliciado ao Comportamento
mento não necessariamente produzida por um estí­
Emitido
mulo; as respostas podem ser eliciadas por estímu­
O Padrão Temporal do Comportamento
los, mas podem ocorrer também espontaneamente,
O Papel do Exercício
quando, então, se diz que são emitidas.
As Apresentações de Estímulo em Estampagem
{Imprinting)
As Operações Estabelecedoras e a Importância de Na Psicologia da Aprendizagem, o conceito
Estímulos de reflexo tem desempenhado um papel histori­
camente importante. A primeira seção deste ca­
pítulo apresenta o vocabulário dos reflexos e lida
A palavra reflexo é derivada do latim re-, back (vol­ com alguns efeitos da apresentação de estímu­
tar), adicionada de flectere, to betid (curvar). Com los. O capítulo começa com algumas situações
efeito, uma resposta reflexa era concebida como a relativamente simples, nas quais um estímulo
reflexão do estímulo. E discutível seflectere e o ter­
mo latinoplicare, tofold (dobrar), compartilham uma
produz ou elicia uma resposta e mostra que não
raiz indo-européia comum. Se isso acontece, a pa­ se pode julgar o efeito de um estímulo se não
lavra reflexo está muito proximamente relacionada conhecermos também o responder que ocorre em
a reply (replicar), complex (complexo) e multiple sua ausência. Os conceitos de probabilidade e pro­
(múltiplo). As origens de estímulo e resposta são babilidade condicional fornecem uma maneira de
melhor estabelecidas.
A raiz indo-européia steig-, to stick (espetar), é
lidar com este problema; esses conceitos estão
um ancestral de estímulo. A mesma raiz gerou tam­ envolvidos no tratamento de uma série de diferen­
bém distinguish (distinguir), instinct (instinto) e, via tes fenômenos, descritos ao longo deste livro.
stylos (estilo), um instrumento de escrever, style (es­ Em seguida, serão examinadas as relações re­
tilete; mas provavelmente não está intimamente re­ flexas simples, em termos de probabilidades con­
lacionado a extinção). Do francês antigo estiquet,
to impale (espetar) e, posteriormente, to labe (rotu­
dicionais, e algumas das circunstâncias sob as
lar), a raiz produziu também uma palavra francesa quais o comportamento eliciado muda ao longo
de sucessivas apresentações de estímulo. Esses um estímulo dispara uma resposta. Para Descar­
casos estabelecem o cenário para a segunda se­ tes, o papel dos tubos e da água nesse sistema de
ção do capítulo, que explora como o comporta­ estátuas era desempenhado, em organismos vi­
mento pode emergir quando não é produzido por vos, por nervos e espíritos animais.
um estímulo eliciador; tal comportamento é cha­ Para nossos propósitos, a parte mais impor­
mado de emitido. O capítulo termina com uma tante do conceito de reflexo, como formulado
discussão das maneiras pelas quais a importân­ por Descartes, é que o termo incorporava a no­
cia comportamental de um estímulo pode mudar ção de que o comportamento, às vezes, é causa­
ao longo do tempo; a estampagem (imprinting) do por eventos ambientais, como quando retira­
é um exemplo usado para relacionar tais efeitos mos rapidamente a mão ao tocar uma chama.
ao conceito de motivação. Eventualmente, os fisiologistas voltaram sua'
atenção para o mecanismo de tais relações com-
portamentais e começaram a explorar os com­
ponentes do arco reflexo, a rota desde o impacto
Seção A O Reflexo: Eliciação sensorial original do estímulo através do siste­
ma nervoso central e a volta ao sistema muscu­
Uma maneira simples de mudar o comporta­ lar ou glandular, em cujo interior a resposta ocor­
mento de um organismo consiste em apresentar ria. As análises do reflexo tomaram-se mais e
um estímulo. Por exemplo, se alguém está en­ mais sofisticadas (p. ex., Sherrington, 1906) e
volvido em uma conversa em voz baixa, um ruí­ tomaram-se a unidade básica do comportamen­
do alto súbito provavelmente interromperá a con­ to nos conceitos de reflexo condicionado de Pa­
versa e produzirá a mudança de postura conhe­ vlov (1927) e no behaviorismo de Watson (1919).
cida como reação de sobressalto. Essa relação Mencionamos acima duas ilustrações de re­
fidedigna entre um evento ambiental, um estímu­ flexos: a reação de sobressalto e a retirada da
lo e uma mudança resultante no comportamento, mão de uma chama. Muitos outros são familia­
uma resposta, tem sido denominada de reflexo. A res: a extensão do joelho produzida por uma ba­
aplicação da terminologia do reflexo para o com­ tida no tendão patelar; salivação produzida por
portamento tem uma história que começa com alimento na boca; ajustes posturais produzidos
René Descartes, um filósofo francês do século por perda brusca de apoio. Tais exemplos têm
XVII (Fearing, 1930). Descartes estava familiari­ em comum a característica de que algum estí­
zado com os aparelhos hidráulicos construídos para mulo produz seguramente alguma resposta. Essa
entreter os visitantes nos jardins reais da França. é a propriedade que define um reflexo. Nessas
Quando alguém pisava em uma alavanca escondi­ circunstâncias, dizemos que o estímulo elicia a
da, disparava um fluxo de água que movimentava resposta ou que a resposta é eliciada pelo estí­
as estátuas. Descartes viu uma similaridade entre mulo; o estímulo é um estímulo eliciador, e a
tais dispositivos e o comportamento. Segundo ele, resposta é uma resposta eliciada (o termo elici-
os estímulos eram comparáveis a visitantes que, ado nunca é usado no sentido inverso, para nos
referirmos ao efeito de uma resposta sobre a ocor­
entrando em uma das grutas que contêm muitas fon­ rência de um estímulo).
tes, causem, eles próprios, sem saber, os movimen­
tos que eles mesmos testemunham. Porque, ao en­
O reflexo não é o estímulo nem a resposta, é
trar, necessariamente pisam em certos ladrilhos ou a relação entre ambos (Skinner, 1931). Por exem­
placas, dispostos de tal modo que, se eles se aproxi­ plo, não poderíamos falar de reflexo se dispa­
mam de uma Diana no banho, fazem com que ela se rássemos fogos de artifício, mas não observás­
esconda nas roseiras e, se tentam segui-la, fazem semos a resposta de sobressalto; o ruído sozinho
com que um Netuno surja à sua frente, ameaçando-
os com seu tridente. (Descartes, traduzido em Fea­
é insuficiente para justificar o uso do termo. Nem
ring, 1930, pp. 20-21) falaríamos de reflexo se observássemos uma res­
posta sem um estímulo identificável; em si mes­
Do mesmo modo que pisar na alavanca es­ ma, a reação de sobressalto não é um reflexo. E
condida dispara o movimento de uma estátua, não deveríamos confundir as reações de sobres-

A pr end iza gem 61


salto produzidas por ruídos intensos com aque­ ordenações mais complexas (p. ex., coordenações
las produzidas de outras maneiras. Muitos refle­ rítmicas na locomoção: Gallistel, 1980). Alguns
xos receberam o nome a partir de suas respostas exemplos serão examinados no Capítulo 7.
características; são exemplos o reflexo patelar e
a reação de sobressalto. Mas é útil lembrar que
eles não são nomes para as respostas; se obser­ PROPRIEDADES DO
vássemos a salivação ou a extensão do joelho na COMPORTAMENTO ELICIADO
ausência de estímulos eliciadores, a terminolo­
gia do reflexo não seria apropriada. Uma vez identificada uma relação reflexa
Consideremos outro exemplo. A produção de entre um estímulo e uma resposta, podemos exa­
contração da pupila por luz intensa no olho tem minar as propriedades dos reflexos (cf. as Leis
sido, às vezes, chamada de reflexo pupilar. Mas, do Reflexo, Skinner, 1938). Consideremos um
a rigor, essa relação envolve uma resposta que estímulo eliciador, como uma solução ácida ou
se ajusta continuamente aos níveis do estímulo: azeda na língua (p. ex., vinagre) e uma resposta
à medida que o brilho aumenta, a pupila se con­ eliciada, como a salivação. Acima de um valor
trai; e à medida que diminui, a pupila se dilata. mínimo, denominado limiar, o ácido na língua
Sob luz muito intensa, a pupila humana pode elicia fidedignamente a salivação, mas com uma
reduzir-se a aproximadamente um vigésimo do concentração muito baixa ou uma quantidade
tamanho de quando está relaxada e em total es­ muito pequena ela pode não ocorrer. Quando a
curidão. Nesse caso, não é apropriado usar a ter­ intensidade de um estímulo é muito pequena para
minologia dos reflexos, porque esta linguagem eliciar uma resposta, diz-se que o estímulo está
tira a atenção da relação funcional inversa entre abaixo do limiar.
o tamanho da pupila e o brilho, enfatizando ape­ O limiar não tem um valor fixo, é um resumo
nas a mudança particular no tamanho da pupila estatístico extraído de nossas mensurações. À
que faz parte de um contínuo de possibilidades. medida que concentramos a solução ou aumen­
Para outros casos, ainda que superficialmen­ tamos sua quantidade, ou ambas, a probabilida­
te pareçam envolver as relações reflexas, a lin­ de de se alcançar valores que produzam a sali­
guagem do reflexo pode ser equivocada. Na con­ vação é cada vez maior. A uma dada concentra­
versa cotidiana, por exemplo, por vezes falamos ção, podemos determinar quantas gotas devem
de pessoas que têm reflexos rápidos ou lentos, ser colocadas na língua para eliciar a salivação
freqüentemente nos referindo ao comportamen­ de maneira confiável; de maneira inversa, para
to habilidoso de atletas em esportes competiti­ um dado número de gotas, podemos determinar
vos. No entanto, essas referências geralmente são a concentração necessária. Algumas concentra­
tecnicamente imprecisas. Uma reação rápida ao ções e quantidades terão um efeito apenas mar­
disparo inicial em uma corrida, por exemplo, é ginal, algumas vezes eliciando a salivação, ou­
um comportamento operante ou um comporta­ tras vezes não.
mento que depende tanto de seus antecedentes Note que um estímulo, em si mesmo, não tem
quanto de suas conseqüências, ainda que ocorra um limiar. Pelo contrário, os valores de limiar
muito rapidamente. são determinados para certas características par­
Tais qualificações deixam claro que os refle­ ticulares de estímulos, enquanto as outras carac­
xos são apenas um subconjunto dos muitos ti­ terísticas do estímulo são mantidas constantes.
pos de relações que podem existir no comporta­ Por exemplo, na eliciação de salivação, o núme­
mento. Além disso, nossa atenção restringir-se- ro limiar de gotas seria tipicamente menor para
á às relações reflexas que envolvem os estímu­ uma solução ácida forte do que para uma solução
los externos. Não nos preocuparemos com as ácida fraca; então não teria sentido especificar o
coordenações reflexas entre as respostas como limiar para o número de gotas sem também espe­
quando, na flexão ou na extensão de membros, a cificar a acidez da concentração ou vice-versa.
contração de um músculo é acompanhada pelo re­ Algum tempo sempre transcorre entre o estí­
laxamento do músculo oposto, nem com outras co­ mulo e a resposta; esse período de tempo é cha-

62 A . C harles C atania
mado de latência da resposta. Além disso, a res­ xos. O conceito de reflexo tinha uma simplici­
posta deve ocorrer com alguma magnitude e ter dade tentadora e, à medida que passou a ser mais
alguma duração. Uma vez que essas proprieda­ amplamente aceito como uma unidade compor-
des podem covariar, elas têm recebido, às vezes, tamental, parecia razoável concluir que as rela­
um nome comum, a.força do reflexo. Assim, a ções reflexas poderiam constituir uma base para
força do reflexo seria fraca se o responder ocor­ a compreensão de uma variedade de processos
resse com a latência longa, a magnitude peque­ comportamentais. Alguns estímulos haviam sido
na e a duração curta, mas seria forte se o respon­ identificados como causa de algumas respostas
der ocorresse com a latência curta, grande mag­ e, indevidamente, passou-se a supor que para
nitude e longa duração. (A taxa da resposta eli- toda resposta deveria existir um estímulo elicia­
ciada não é relevante para a força do reflexo, dor correspondente.
porque ela é determinada pela taxa de apresen­ O sistema de reflexo condicionado de Pavlov
tação do estímulo eliciador). e o behaviorismo de Watson, nas décadas de 1920
Sechenov (1863), um fisiólogo russo, notou e 1930, desenvolveram-se a partir de tal suposi­
que o gasto de energia do organismo em muitas ção. Com reflexos servindo como unidades de
respostas (p. ex., espirros e tosses) excede de lon­ comportamento, o comportamento complexo era,
ge a energia fornecida por um estímulo elicia­ então, tratado como nada mais que a combina­
dor. O efeito eliciador de um estímulo não de­ ção de tais unidades. Quando uma resposta ocor­
pende de qualquer transferência direta de ener­ ria sem que um estímulo eliciador fosse obser­
gia do ambiente para o organismo; pelo contrá­ vado, eram hipotetizados alguns estímulos com
rio, observou Sechenov, o estímulo deveria ser propriedades apropriadas. Além disso, supunha-
considerado como um tipo de gatilho, liberando se que as respostas de um reflexo tinham propri­
a energia que o organismo já tem disponível em edades de estímulo que as tomavam capazes, por
músculos, glândulas ou outras estruturas. Essa sua vez, de eliciar outras respostas. Assim, o
noção era, naturalmente, consistente com a con­ comportamento que se estendia por longos perí­
cepção de reflexo de Descartes. odos de tempo podia ser interpretado como uma
Embora o estímulo eliciador seja mais preci­ seqüência ou cadeia de reflexos, em que cada
samente considerado um gatilho que libera ener­ resposta funcionaria simultaneamente como a
gia já disponível no organismo, a intensidade do resposta eliciada de um reflexo e 0 estímulo eli­
estímulo eliciador pode afetar a resposta elicia- ciador do próximo. Tais sistemas de reflexo fo­
da. A latência da resposta, de modo típico, varia ram elaborados de várias maneiras mas, apesar
inversamente à intensidade do estímulo; em ou­ da engenhosidade de seus proponentes, eles não
tras palavras, a latência da resposta diminui à mais provocam atenção substancial na psicolo­
medida que a intensidade do estímulo aumenta. gia da aprendizagem. O conceito de reflexo tem
E a magnitude e a duração da resposta, tipica­ seu lugar na análise do comportamento, mas seu
mente, variam diretamente com a intensidade do alcance é limitado, e ele não se sustenta por si
estímulo; em outras palavras, essas medidas au­ mesmo.
mentam à medida que a intensidade do estímulo
aumenta. Dizer que a força do reflexo aumenta
com a intensidade do estímulo é uma maneira de ESTÍMULOS ELICIADORES E
resumir essas relações. PROBABILIDADES DE RESPOSTA
Uma vez que se tomou comum falar de rela­
ções reflexas em termos de força, mais do que O reflexo é apenas uma relação, entre as
em termos de medidas específicas, também se muitas relações possíveis entre os estímulos e as
tomou mais fácil considerar a relação reflexa respostas. No reflexo, a apresentação de algum
como uma unidade fundamental de comporta­ estímulo produz fidedignamente alguma respos­
mento, e os reflexos começaram a ser tratados ta. Mas, o estímulo desse reflexo pode afetar
como componentes básicos, a partir dos quais outras respostas de maneira diferente, e a res­
eram construídos comportamentos mais comple­ posta desse reflexo pode ser diretamente afetada

A p re n d iz a g e m 63
por outros estímulos. Para qualquer estímulo par­ Probabilidades ou Freqüências Relativas
ticular, sua apresentação pode aumentar a pro­
babilidade de algumas respostas, diminuir a pro­ Essas várias relações entre os estímulos e as
babilidade de outras e ainda não ter qualquer efei­ respostas podem ser melhor descritas quantitati­
to sobre outras. Do mesmo modo, para uma res­ vamente em termos de probabilidades ou fre­
posta particular, sua probabilidade pode ser au­ qüências relativas. Então seremos capazes de
mentada por alguns estímulos, diminuída por definir os efeitos de estímulos comparando a pro­
outros e, ainda, pode não ser afetada por outros. babilidade de uma resposta quando um estímulo
Além disso, não basta simplesmente notar que está presente com sua probabilidade quando o
uma resposta segue regularmente um estímulo estímulo está ausente. Uma probabilidade ou fre­
para concluir que a linguagem do reflexo seja qüência relativa é uma proporção ou razão: o
apropriada. Precisamos também saber o quanto número de vezes em que o evento ocorre, com­
a resposta é provável sem o estímulo. Por exem­ parado com o número de vezes em que ele pode­
plo, se um rato, em uma roda de atividade, gasta ria ter ocorrido.
a maior parte de seu tempo correndo e corre tan­ Por exemplo, no reflexo de Babinski, um leve
to na presença quanto na ausência de ruído, não toque na sola do pé de um bebê recém-nascido
poderíamos dizer que o ruído elicia o correr, sim­ elicia, tipicamente, o espalhamento ou distensão
plesmente porque observamos que o rato corre dos dedos. Calculamos a probabilidade de res­
quando apresentamos o ruído. Para falar de rela­ posta contando quantas vezes uma resposta é
ções reflexas, devemos saber qual a probabili­ produzida ao longo de um dado número de apre­
dade da resposta tanto na ausência quanto na sentações de estímulo. No bebê recém-nascido,
presença do estímulo. a distensão dos dedos pode ser produzida por
Considere um cachorro que esteja se coçan­ cada um dos vinte toques na sola do pé; a pro­
do. Se aparece um gato, ele para de se coçar, porção de respostas é, portanto, de 20 respostas
rosna e assume uma postura agressiva. Se o gato em 20 oportunidades, ou uma probabilidade de
vai embora e o dono do cachorro chega, ele late, 1,0. O reflexo de Babinski geralmente diminui
pula e abana o rabo. Mas, se o dono ralha, o ca­ com a idade e, se testarmos este reflexo de novo
chorro pode choramingar e esconder o rabo en­ algum tempo depois, pode ser que somente 6 dos
tre as pernas. Não podemos dizer sequer se as 20 toques possam, então, produzir uma respos­
respostas do cachorro ao dono são estritamente ta; a probabilidade agora é de 0,3. Mais tarde
eliciadas ou se dependem, em alguma medida, ainda na vida da criança, provavelmente, verifi­
de conseqüências de respostas passadas na pre­ caremos que o reflexo terá desaparecido com­
sença do dono. pletamente: nenhum dos 20 toques produz uma
O gato, o dono e a repreensão do dono, cada resposta, e a probabilidade, então, é 0,0.
um desses eventos toma algumas respostas mais Na notação matemática de probabilidades,
prováveis, enquanto toma outras menos prová­ esses exemplos podem ser escritos, respectiva­
veis. Algumas das respostas podem ser observa­ mente, como:
das de tempos em tempos, mesmo na ausência
desses estímulos e nenhuma delas ocorrerá ne­ p(Rj) = 1,0; píR j) = 0,3; e, p(R3) = 0,0.
cessariamente toda vez que um estímulo especí­
fico for apresentado. Em uma relação reflexa, Aqui p representa probabilidade e os termos
uma resposta pouco freqüente na ausência de entre parêntesis são abreviações dos eventos
algum estímulo ocorre regularmente quando tal cujas probabilidades são especificadas na equa­
estímulo é apresentado, mas essa é apenas uma ção (neste caso, R para respostas, onde os índi­
entre muitas possibilidades. A resposta de latir, ces 1,2 e 3 correspondem às três medidas suces­
por exemplo, é afetada por vários estímulos di­ sivas do reflexo de Babinski). Esses exemplos
ferentes, e podemos estar interessados em estí­ também ilustram que as probabilidades são de­
mulos que a tornem menos provável, bem como finidas de tal modo que elas podem ter valo­
naqueles que a tomem mais provável. res somente na faixa entre 0,0, quando o even-

64 A . C h a r le s C a ta n ia
to nunca ocorre, e 1,0, quando o evento sem­ estímulo e comparamos o responder, nesses pe­
pre ocorre. ríodos de tempo, com o responder em períodos
de tempo equivalentes na ausência de um estí­
mulo.
Probabilidades Condicionais As probabilidades, neste exemplo, são ex­
pressas com a seguinte notação:
O reflexo de Babinski é um exemplo apro­
priado a nossos propósitos, porque a resposta de p(RJS) = 1,0 ; p(R/não S) = 0,6.
distensão dos dedos não ocorre freqüentemente
na ausência de seu estímulo eliciador. Mas o que Nessa notação, o R é uma resposta e o S é
ocorre com o piscar eliciado por um sopro de ar um estímulo. A primeira equação pode ser lida
no olho? Se estudamos esse reflexo com uma como: a probabilidade de uma resposta, dada a
criança cujas piscadas já ocorrem a uma taxa de apresentação de um estímulo (piscar o olho, dado
uma resposta a cada um ou dois segundos, como o sopro de ar), é 1,0. A segunda equação pode
podemos distinguir piscadas eliciadas daquelas ser lida como: a probabilidade de uma resposta,
que teriam ocorrido mesmo na ausência do so­ dada a ausência de um estímulo (piscar o olho,
pro do ar (Spence & Ross, 1959)? De fato, po­ sem sopro de ar), é 0,6. Este tipo de probabilida­
demos ser incapazes de dizer se uma piscada de, em que a probabilidade de um evento é espe­
específica é ou não eliciada. Mas, comparando a cificada em termos da presença ou ausência de
probabilidade de uma piscada depois do sopro um outro evento, é uma probabilidade condici­
de ar com a probabilidade na ausência de sopro, onal (a terminologia não deveria ser confundida
podemos, pelo menos, avaliar o efeito do estí­ com a de reflexos condicionados ou condicio­
mulo. nais de Pavlov, embora ambas tenham a caracte­
Nosso procedimento é ilustrado na Figura 4.1. rística de que um evento é uma condição para
Observamos a pálpebra, registramos as piscadas algum outro evento). Em outras palavras, p(AJ
dentro de um período de tempo depois de cada B) pode ser lida como: a probabilidade de A,

J _I_I_I I l I_I_I__!_l__í I I__ l__1__ 1__ 1__ 1__ I__ L I I J i i

Tempo (Secundos) ♦

FIGURA 4.1 Estimativa da probabilidade de piscadas com e sem o sopro eliciador. Cada Unha vertical sólida
representa uma piscada. Na linha A nenhum sopro fo i apresentado. As linhas tracejadas separam 5 períodos de 1
segundo durante os quais as piscadas foram registradas (S=segundos). Ocorreram piscadas em três destes cinco
períodos e a probabilidade de piscadas na ausência do estímulo é, portanto, 0,6. Na linha B, cada seta representa
um sopro no olho. Ocorreu uma piscada em cada um dos cinco períodos de um segundo que se seguiu a esses
estímulos. Assim, a probabilidade de uma piscada dado um sopro de ar é, portanto, 1,0. Somente a primeira das
duas piscadas que se seguiram ao estímulo X contaram para esta probabilidade. Contamos um período de tempo
como não contendo piscadas ou contendo ao menos uma piscada e, então, calculamos a probabilidade, dividindo
os períodos de tempo, com ao menos uma piscada, pelo total dos períodos de tempo. O sopro de ar aumentou de 0,6
para 1,0. (Um experimento real usaria uma amostra muito mais ampla de observações para efeito de cálculo de
probabilidades.)

A p re n d iz a g e m 65
dado B; ou a probabilidade de A na condição de Para essa finalidade, usaremos o sistema de co­
que B esteja presente. De maneira semelhante, ordenadas da Figura 4.2. O eixo y representa a
/?(X/não Y) pode ser lida como: a probabilidade probabilidade de resposta considerando que um
de X, dado não-Y; ou, a probabilidade de X sob estímulo tenha sido apresentado; o eixo x repre­
a condição de que Y esteja ausente. senta a probabilidade de resposta considerando
As análises subseqüentes favorecerão a lin­ que o estímulo não tenha sido apresentado (cf.
guagem de probabilidades em detrimento de coordenada no glossário). Em outras palavras,
outras maneiras de se descrever o comportamen­ qualquer ponto neste gráfico representa duas pro­
to. Não há muita diferença entre dizer que um babilidades condicionais: a probabilidade de res­
estímulo causou uma resposta e que um estímu­ posta dado um estímulo, p{R/S), e a probabili­
lo eliciou uma resposta. Qualquer uma das duas dade de resposta dado um não-estímulo,/?(R/não
formas poderia ser aplicada a casos particulares S). Por exemplo, o ponto A, na Figura 4.2 repre­
de uma relação reflexa (como quando a apresen­ senta uma relação estímulo-resposta em que a
tação de um estímulo específico, M, é seguida probabilidade de resposta é 0,75 quando o estí­
por uma instância particular de resposta, N). Tam­ mulo está presente e somente 0,50 quando o es­
bém não há muita diferença entre dizer que um tímulo está ausente; neste caso, o estímulo au­
estímulo aumentou a tendência a responder e que menta a probabilidade da resposta.
um estímulo elevou a probabilidade da resposta. A diagonal, na Figura 4.2 apresenta um inte­
Esses usos podem ser aplicados aos efeitos médi­ resse especial. Uma resposta que ocorra sem ser
os ao longo de muitas ocorrências (p. ex., quando eliciada por um estímulo é considerada emitida.
o estímulo O geralmente produz a resposta P). A diagonal representa as relações estímulo-res­
posta em que a probabilidade de resposta é inde­
pendente do estímulo ou não é afetada por ele.
TIPOS DE RELAÇÕES
ESTÍMULO-RESPOSTA

Discutimos, principalmente, aqueles casos


que envolvem uma classe de estímulo e uma clas­
se de resposta. Mas o comportamento geralmente
é mais complicado: os ambientes incluem uma
variedade de estímulos, e os organismos produ­
zem uma variedade de respostas. Por exemplo,
podemos notar dois tipos de pios produzidos por
patinhos recém-saídos da casca. Aqueles produ­
zidos quando a mãe está presente são, geralmen­
te, referidos como pios de contentamento; aque­
les que ocorrem quando um pássaro estranho apa­
rece são, geralmente, referidos como pios de
desconforto (p. ex., Hoffman, 1996). Poderíamos p(R/nãoS) - Probabilidade de Resposta
reduzir a probabilidade de pios de contentamen­ Dado um Não-Estímulo
to e elevar a probabilidade de pios de descon­
FIGURA 4.2 Relações estímulo-resposta representadas
forto removendo a mãe ou apresentando um pás­ como probabilidades condicionais de resposta dada à
saro estranho. Nossa nomenclatura deve-nos per­ presença de um estímulo, p(R/S), e sua ausência, p(R/
mitir descrever os efeitos de cada estímulo sobre não S). São mostrados exemplos de relações estímulo-
cada resposta. Devemos lidar não com os estí­ resposta em que o estímulo aumenta a probabilidade
da resposta (A), não tem efeito sobre a probabilidade
mulos apenas ou com as respostas apenas, mas
da resposta (B) ou reduz a probabilidade da resposta
com as relações estímulo-resposta. (C); o aumento na probabilidade da resposta chamado
Podemos agora resumir algumas dessas rela­ reflexo, em que o estímulo produz confiavelmente a res­
ções em termos de probabilidades condicionais. posta, é ilustrado em D.

66 A . C h a r le s C a ta n ia
Assim, no ponto B, a probabilidade de resposta fosse aumentada pelo estímulo para uma proba­
é 0,25, quer o estímulo seja apresentado ou não. bilidade de 0,32 ? Certamente não.
Por exemplo, os pios de contentamento ou os Todos os pontos acima e à esquerda da dia­
pios de desconforto do patinho podem não ser gonal na fi gura representam excitação, casos nos
afetados pela presença ou ausência de algum de quais um estímulo aumenta a probabilidade de
seus irmãos. Para dizer que uma resposta foi eli- resposta; enquanto aqueles abaixo e à direita re­
ciada, não basta saber que a resposta seguiu um presentam inibição, casos em que um estímu­
estímulo. Pode acontecer que uma resposta seja lo reduz a probabilidade de resposta. Qualquer
emitida assim que um estímulo é apresentado. limite que pudéssemos estabelecer para separar
Então, quando uma resposta segue um estímulo, essas relações estímulo-resposta que chamamos
não podemos dizer que a resposta foi eliciada, a de reflexos daquelas que não chamamos, seria
menos que saibamos que o estímulo, de fato, arbitrário. Essa conclusão é importante. Vimos
causou a resposta. que alguns dos sistemas comportamentais ini­
Uma terceira classe de relações estímulo-res- ciais, como os de Watson e Pavlov, basearam seus
posta é ilustrada pelo ponto C, para o qual uma desenvolvimentos no reflexo como unidades fun­
probabilidade de resposta de 0,90, quando o es­ damentais de comportamento. Sem dúvida, era
tímulo está ausente, é reduzida para 0,10 pela mais fácil lidar com as relações reflexas, alta­
presença do estímulo; neste caso, o estímulo re­ mente regulares, do que com outras relações es­
duz a probabilidade de resposta. Tais reduções tímulo-resposta, menos fidedignas. Mas, se a
de probabilidade de resposta por um estímulo Figura 4.2 é apropriada para descrever as rela­
são, algumas vezes, chamadas de inibição do ções estímulo-resposta e, se o reflexo é apenas
reflexo. Por exemplo, se os pios de contentamen­ um caso especial entre elas, então, qualquer sis­
to do patinho cessassem quando um pássaro tema de comportamento construído somente com
estranho aparecesse, poderíamos dizer que o base no reflexo, como uma unidade comporta-
pássaro estranho inibiu os pios de contenta­ mental, estava destinado a ser incompleto.
mento. Uma das propriedades do comportamento
O ponto D representa um caso onde um estí­ deixadas de fora das primeiras explanações era
mulo aumenta a probabilidade de resposta de, a emissão de respostas, a ocorrência de respos­
aproximadamente, 0,1 para cerca de 1,0. Esse é tas na ausência de estímulos eliciadores. As res­
o tipo de relação estímulo-resposta que denomi­ postas emitidas recebiam nomes como compor­
namos de reflexo. Enquanto inibe os pios de con­ tamento instrumental ou operante, porque eram
tentamento, o pássaro estranho pode produzir um estudadas em termos do quanto eram instrumen­
efeito também sobre os pios de desconforto do tais para mudar o ambiente ou como operavam
patinho. no ambiente. Elas derivavam sua importância não
O gráfico mostra que esta é apenas uma den­ de sua relação com os estímulos eliciadores, mas
tre as inúmeras possibilidades existentes. Em al­ de suas conseqüências. Por contraste, o compor­
gum ponto, entre o extremo superior do gráfico tamento eliciado era denominado reflexo ou res-
ondep(R/S) é próxima de 1,0 e a diagonal, onde pondente.
S não tem qualquer efeito sobre R, temos que Quando essa distinção foi feita, outras carac­
decidir se o efeito eliciador do estímulo não é terísticas foram adicionadas a ela. Especifica­
mais fidedigno o suficiente para justificar que mente, argumentou-se que o comportamento ins­
chamemos a relação de reflexo. Mas onde deve trumental ou operante consistia de respostas es­
estar o limite? Provavelmente não excluiríamos queléticas, como os movimentos dos membros,
os casos em que p(RJS) é apenas um pouco me­ enquanto o comportamento reflexo ou respon-
nor que 1,0 (p. ex., 0,95 ou mesmo 0,90). Mas dente consistia de respostas autônomas, como as
também não tenderíamos a incluir efeitos muito secreções glandulares. Essa distinção também foi
leves dos estímulos. Por exemplo, falaríamos de vista como paralela à distinção tradicional entre
uma relação estímulo-resposta como sendo re­ ação voluntária e involuntária. Tais distinções,
flexa, se uma resposta com probabilidade de 0,26 desde então, têm sido seriamente questionadas.

A p re n d iz a g e m 67
Por exemplo, o comportamento de curvar a qualquer localização no gráfico; sua localização
postura, eliciado por um barulho forte e súbito depende da resposta que estamos medindo. Si­
no reflexo de sobressalto, é uma resposta moto­ milarmente, o pio de desconforto do patinho,
ra melhor descrita como involuntária. Mas a res­ como resposta, não tem qualquer localização no
posta de engolir parece voluntária e também en­ gráfico; sua localização depende do estímulo que
volve uma relação reflexa. Essa resposta é elici­ estamos apresentando.
ada pela estimulação proveniente do fundo da
garganta, gerada por qualquer coisa sólida ou lí­
quida que esteja na boca, já que é impossível EFEITOS DE ELICIAÇÕES
engolir se a boca está seca ou se não houver algo SUCESSIVAS
a ser engolido para estimular essa área. Por ou­
tro lado, dirigir certamente parece ser uma ação Descrevemos alguns efeitos de apresentações
voluntária e operante. Contudo, um motorista de estímulos sobre o comportamento. Uma com­
experiente que se sente no banco do passageiro plicação é que duas apresentações diferentes de
de um carro pode, involuntariamente, pisar forte um mesmo estímulo podem ter efeitos diferen­
no assoalho do carro sem que haja ali um pedal tes. Por exemplo, podemos nos assustar muito
de freio, quando um obstáculo se aproxima re­ mais com o primeiro relâmpago em uma tem­
pentinamente à sua frente na estrada. Temos aqui pestade do que com os outros relâmpagos que se
todas as possibilidades: quer o comportamento seguem. Além disso, os efeitos dos estímulos
seja operante ou respondente, podemos identifi­ podem depender de quão rapidamente eles se
car exemplos que pareçam ser tanto voluntários seguem uns aos outros. Por exemplo, se estamos
quanto involuntários. Em outras palavras, a dis­ descascando cebolas, as lágrimas eliciadas pela
tinção leiga entre as ações voluntárias e aquelas cebola que está sendo descascada no momento
involuntárias nada tem a ver com a nossa distin­ podem depender de se começamos a trabalhar
ção entre comportamento operante e responden­ com ela imediatamente depois de terminar a úl­
te. (Como será visto quando tratarmos do com­ tima ou se acabamos de retomar de um interva­
portamento verbal, no Capítulo 14, o mais im­ lo. E, em um outro efeito denominado somação,
portante para determinar se um comportamento um estímulo abaixo do limiar para eliciar uma
pode ser chamado de voluntário ou de involun­ resposta se for apresentado uma só vez, pode
tário deve ser se a pessoa que agiu pode identifi­ tornar-se um eliciador efetivo, se for apresen­
car a origem do controle de suas ações.) tado repetidamente, com uma taxa suficiente­
As respostas esqueléticas podem ser elicia- mente alta. Em outras palavras, o responder
das e as respostas autônomas podem ser emiti­ eliciado freqüentemente depende do número de
das. É importante manter a distinção entre o res­ apresentações do estímulo e de seu espaçamen­
ponder emitido e o eliciado. Mas, a mesma res­ to no tempo.
posta pode ser, algumas vezes, eliciada e, algu­
mas vezes, emitida. Assim, não podemos classi­
ficar o responder efetivamente nestas duas cate­ Habituação
gorias, com base em propriedades fisiológicas
do comportamento, tais como a diferença entre Já mencionamos a reação de sobressalto pro­
as respostas esqueléticas e as autônomas. duzida por um evento inesperado, como um re­
A Figura 4.2 apóia um outro ponto mencio­ lâmpago ou um ruído intenso súbito. Mesmo sem
nado anteriormente. Quando definimos reflexo, outros eventos que sinalizem sua ocorrência, a
argumentamos que o reflexo não é nem o estí­ repetição de um ruído intenso produzirá suces­
mulo nem a resposta, mas sim a relação entre sivamente menores reações de sobressalto, até
eles. O gráfico representa as relações estímulo- que, eventualmente, nenhum comportamento
resposta; ele não pode representar os estímulos será observado quando o ruído ocorrer. Muitos
sozinhos, nem as respostas sozinhas. Assim, o estímulos eliciam as respostas chamadas de
pássaro estranho como um estímulo não tem orientação ou de observação; por exemplo, um

68 A . C h a r le s C a ta n ia
cachorro levanta suas orelhas em resposta a um os estímulos considerados aversivos ou puniti­
som novo ou começa a farejar em resposta a um vos do que com os estímulos considerados neu­
odor não-usual. Com as repetições desses estí­ tros, apetitivos ou reforçadores.
mulos, entretanto, o responder do cachorro dimi­ A potenciação não deve ser confundida com
nui; o responder ocorre com magnitude menor e outro fenômeno chamado de sensibilização (cf.
latência mais longa, até que, eventualmente, desa­ Ison & Hoffman, 1983). Na sensibilização, os
parece completamente (no entanto, veremos mais efeitos eliciadores de um estímulo aumentam
tarde que as respostas de orientação e de observa­ como resultado de apresentações de algum ou­
ção podem depender não apenas de estímulos eli- tro estímulo; um estímulo amplifica o efeito eli­
ciadores, mas também de suas conseqüências). ciador de outro estímulo. Por exemplo, um cho­
Esse decréscimo no responder com estímu­ que elétrico pode tomar mais provável que um
los repetidos tem recebido o nome de habitua­ ruído intenso subseqüente produza uma reação
ção. (Outro termo possível, adaptação, algumas de sobressalto; diz-se que o choque sensibiliza o
vezes se refere a mudanças ocorridas no com­ organismo para o ruído.
portamento, devido à exposição contínua a al­ O método de apresentação do estímulo pode
guns estímulos ou situações, como quando se diz determinar se o efeito observado é o da habitua­
que um organismo se adapta ao ambiente do la­ ção ou da potenciação. Kimble e Ray (1965) es­
boratório; algumas características da terminolo­ tudaram o reflexo de limpeza no sapo: o toque
gia da habituação e de termos relacionados de­ de uma cerda no dorso do sapo elicia um movi­
pendem de se as mudanças no responder podem mento da pata traseira sobre as costas. Em um
ser atribuídas a tipos específicos de mudanças no grupo, toques sucessivos eram feitos em uma
sistema nervoso; cf. Groves & Thompson, 1970). região específica do dorso do sapo, mas dentro
A habituação é uma característica do respon­ dessa região a localização exata da estimulação
der eliciado, produzida por uma variedade de es­ podia variar de um toque para o outro; em um
tímulos. Ela ocorre com respostas tão diferentes segundo grupo, os toques sucessivos eram fei­
como a mudança na resistência elétrica da pele tos exatamente na mesma localização do dorso,
produzida por choque (a reação galvânica da pele a cada vez. Em ambos os grupos eram apresen­
ou GSR), pios de desconforto de pássaros à si­ tados, por dia, 100 toques a intervalos de 10 se­
lhueta de um predador passando por sobre sua gundos, ao longo de 12 dias consecutivos. Os
cabeça e contrações em minhocas, produzidas grupos começaram com aproximadamente a
por exposição à luz, para não mencionar as rea­ mesma probabilidade de movimentos de limpe­
ções de sobressalto e as respostas de orientação, za eliciados, mas essa probabilidade aumentou
já mencionadas antes (p. ex., Ratner, 1970). A ao longo dos dias para o primeiro grupo e dimi­
adaptação também pode ser um componente im­ nuiu para o segundo grupo. Em outras palavras,
portante da dinâmica das emoções (Solomon & ocorreu a potenciação quando a localização do
Corbit, 1974). toque eliciador variava ligeiramente de apresen­
tação para apresentação, mas quando a localiza­
ção era constante, ocorreu a habituação.
Potenciação

Mas os estímulos, às vezes, podem ter efei­ Efeitos do Tempo desde o Último
tos opostos. Por exemplo, os choques elétricos Estímulo Eliciador
eliciam guinchos em ratos; se vários choques são
apresentados, apresentações subseqüentes pro­ Se o estímulo deixa de ser apresentado por
duzem mais o responder do que as primeiras (p. algum tempo depois da habituação ou da poten­
ex., Badia, Suter & Lewis, 1966). Esse efeito tem ciação, a probabilidade de o responder ser elici­
sido chamado de potenciação (outro termo tam­ ado poderá retomar a valores prévios. Por exem­
bém utilizado éfacilitação', p. ex., Wilson, 1959). plo, a reação de sobressalto ao ruído alto pode
O processo de potenciação é mais provável com diminuir ou mesmo desaparecer depois de vári­

A p re n d iz a g e m 69
os ruídos em sucessão, mas pode aparecer de Essas relações estão resumidas na Figura 4.3.
novo, com toda a força, se, mais tarde, um ruído Cada linha mostra os efeitos hipotéticos de dez
intenso se seguir a várias horas de silêncio. Se o estímulos sucessivos sobre a probabilidade de
responder eliciado diminui ao longo de estímu­ resposta ou força do reflexo. A parte superior da
los sucessivos, é provável que ele retome aos Figura 4.3 (A, B e C) ilustra a habituação; a par­
níveis anteriores mais elevados, depois que os te inferior (D, E e F) ilustra a potenciação. Em
estímulos forem descontinuados. De maneira ambos os casos, são dados três exemplos que di­
inversa, se o responder eliciado aumenta ao lon­ ferem somente no tempo que separa os primei­
go de estímulos sucessivos, ele geralmente re­ ros cinco estímulos dos últimos cinco. À medi­
torna a seus níveis anteriores mais baixos, de­ da que esse tempo se toma mais longo (de A a C
pois que os estímulos são descontinuados. As e de D a F), o responder produzido pelos cinco
mudanças no responder, chamadas de adaptação últimos estímulos fica mais similar ao respon­
e de facilitação, não são permanentes e, à medi­ der produzido pelos primeiros cinco estímulos.
da que o tempo passa, ocorre um retomo aos ní­ Em outras palavras, com a passagem do tempo,
veis prévios. o responder retorna a seus níveis prévios. Por

HABITUAÇAO

hi
W
m
X
-

h -
POTENCIAÇÃO

CD
cc
Q)
Aff: FIGURA 4.3 Habituação e potenciação.
As setas indicam os estímulos; as linhas
verticais indicam as probabilidades com
as quais estes estímulos eliciam as res­

ffí«
— li postas. A habituação é ilustrada em A, B
e C; a probabilidade diminui com os estí­
mulos sucessivos. A potenciação é ilus­
trada em D, E e F; a probabilidade au­
menta com os estímulos sucessivos. Em
ambos os casos, as probabilidades de res­
posta retomam a níveis prévios à medida
que aumenta o tempo desde o último estí­
Tempo mulo.

70 A . C h a r le s C a ta n ia
exemplo, em A o responder é eliciado pelo últi­ estímulo serão explorados quando tratarmos da
mo estímulo x com uma probabilidade menor do lei do exercício. Considerados em conjunto, es­
que pelo primeiro estímulo w. Mas quando o es­ ses tópicos identificam as possíveis origens do
tímulo x é apresentado depois de períodos su­ responder, quando ele é considerado emitido, e
cessivamente mais longos sem estímulos, como não eliciado. O capítulo termina com uma dis­
em B e C, a probabilidade com a qual o estímulo cussão das maneiras pelas quais a importância
x elicia o responder se aproxima daquela com comportamental de estímulos pode mudar ao
que o estímulo w eliciou o responder. Relações longo do tempo; a estampagem (imprinting) é
análogas existem para os estímulos y e z em D, um exemplo usado para relacionar tais efeitos
E, e F. ao conceito de motivação.
Se a habituação fosse irreversível, podería­
mos observar a adaptação apenas uma vez ao lon­
go da vida de um indivíduo ou, do contrário, as O PADRÃO TEMPORAL DO
adaptações sucessivas levariam o responder a ní­ COMPORTAMENTO
veis cada vez mais baixos, até que, finalmente,
desaparecesse por completo. Um caso paralelo A apresentação de um estímulo pode deter­
para a potenciação levaria, de modo semelhan­ minar a seqüência de respostas que ocorrem ao
te, ou a uma única ocorrência de potenciação ao longo de um período extenso de tempo. Por
longo da vida do organismo, ou a aumentos con­ exemplo, se um rato está privado e damos-lhe
tinuados e ilimitados no responder eliciado. Tais uma pelota de alimento, ele come a pelota. Quan­
coisas, às vezes, podem acontecer. Por exemplo, do termina de comer, se houver água disponível,
reações do sistema imunológico, que podem ser ele bebe. Esta relação entre comer e beber sub­
consideradas como instâncias de comportamen­ seqüente é tão forte que, apresentando alimento
to eliciado, algumas vezes parecem mostrar uma em pequenas quantidades, ao longo de um perí­
potenciação irreversível (p. ex., para algumas odo extenso, podemos fazer o rato beber muitas
pessoas que tenham desenvolvido uma reação vezes sua ração diária normal de água (Falk,
alérgica a picadas de abelha após serem picadas 1977; Wetherington, 1982). Esse aumento no be­
várias vezes, a reação pode diminuir pouco, se é ber é chamado de polidipsia, e o responder que
que diminui, à medida que o tempo passa). depende de um outro responder, dessa maneira,
é chamado de comportamento adjuntivo. O com­
portamento adjuntivo, então, é o comportamen­
to em que uma resposta acompanha de modo
Seção B Do Comportamento Eliciado ao regular alguma outra resposta.
Comportamento Emitido A polidipsia, como um tipo de comportamen­
to adjuntivo, decorre, ao menos parcialmente, da
Vimos que o reflexo é apenas uma das várias maneira pela qual o comer e o beber estão rela­
relações possíveis entre os estímulos e as res­ cionados no padrão alimentar do rato. Se o ali­
postas. Examinaremos, a seguir, como as apre­ mento e a água estão livremente disponíveis, o
sentações do estímulo afetam o modo como o rato, geralmente, faz poucas e grandes refeições
reponder se distribui ao longo do tempo. Quan­ diariamente e bebe depois de cada refeição. Se,
do os estímulos ocorrem repetidamente, eles po­ então, forçamos o rato a fazer muitas refeições
dem produzir padrões temporais de comporta­ pequenas, apresentando alimento em muitas por­
mento. Os tópicos desta seção incluem a ordem ções pequenas a curtos intervalos de tempo, o
e o padrão temporal das respostas que ocorrem rato ainda bebe depois de cada refeição, mas não
quando duas ou mais respostas diferentes são reduz suficientemente a quantidade de cada in­
produzidas por um estímulo. O comportamento gestão de água para compensar o beber mais fre­
adjuntivo, em que uma resposta segue regular­ qüente. Assim, um rato que tenha passado de
mente alguma outra resposta, é um exemplo. cinco grandes refeições para cinqüenta peque­
Outros exemplos da apresentação repetida de um nas refeições diárias, beberia, agora, dez vezes

A p re n d iz a g e m 71
mais. Mas, se a ingestão, depois de cada uma as apresentações do comedouro, variou de um
das cinqüenta pequenas refeições, fosse de ape­ pombo para outro, enquanto o responder no fi­
nas metade, em vez de um décimo da quantida­ nal do período era relativamente constante entre
de das ingestões depois de cada uma das cinco pombos e, geralmente, incluía alguma forma de
grandes refeições, o rato beberia cinco vezes mais bicar. Bicar também é o comportamento ocasio­
do que antes. Tais aumentos na ingestão diária nado por apresentações de alimento; o pássaro
de água são tão regulares em ratos que apolidip- obtém comida em sua boca por meio do bicar.
sia tem sido empregada para fazer com que eles Ao menos neste caso, o comportamento termi­
ingiram substâncias que geralmente rejeitam (p. nal parece ter algo em comum com as respostas
ex., álcool; Meisch & Thompson, 1971). produzidas pelas apresentações de estímulo (cf.
O comportamento adjuntivo pode incluir ou­ condicionamento temporal, no Capítulo 12). As
tras respostas além de comer e beber. Por exem­ apresentações repetidas de estímulo parecem não
plo, se, em vez de água, há uma roda de ativida­ apenas eliciar as respostas, mas também produ­
de disponível para o rato, correr na roda seguirá zir um comportamento, em outros momentos, que
o comer, da mesma maneira que o beber segue o é estreitamente relacionado ao responder elicia­
comer no procedimento de polidipsia (Levitsky do. O problema é que é difícil demonstrar que
& Collier, 1968). seqüências de comportamento geradas por apre­
A apresentação de estímulos pode impor uma sentações sucessivas de estímulo não são afeta­
estrutura temporal sobre o comportamento de ou­ das por outras variáveis como, por exemplo, por
tras maneiras. Um experimento examinou os suas conseqüências ou pelos efeitos discrimina­
padrões de comportamento gerados em pombos tivos dos estímulos (p. ex., Reid & Staddon,
por apresentações repetidas de alimento (Staddon 1982).
&Simmelhag, 1971). Cada pombo era colocado
em uma câmara, em cuja parede havia uma aber­
tura para o comedouro. O comedouro consistia O PAPEL DO EXERCÍCIO
de uma bandeja com grãos ordinariamente fora
do alcance do pombo; o alimento era apresenta­ “A prática faz a perfeição” é um ditado fami­
do iluminando-se a bandeja e levantando-a para liar sobre o papel da repetição no comportamen­
uma posição em que o pombo poderia comer. to. Antes que os efeitos das conseqüências do
Os pombos eram observados por uma janela na responder fossem reconhecidos, acreditava-se
câmara e o seu responder era classificado em que a mera repetição do responder, sem a consi­
várias categorias, tais como bicadas dirigidas à deração de suas conseqüências, era suficiente
parede do comedouro ou ao piso, posturas e para manter o comportamento. Consideremos o
orientação para a parede do comedouro. seguinte trecho de Sechenov:
No início do intervalo entre as apresentações
... um bebê é capaz de tossir, espirrar e engolir, ime­
de alimento, um pombo, geralmente, fazia uma diatamente após o nascimento. O ato de sugar tam­
volta de 90 graus e, então, menos freqüentemen­ bém pertence a essa categoria de movimentos com­
te, introduzia sua cabeça na abertura do come­ plexos... De fato, todo mundo sabe que uma criança
douro ou bicava em direção ao piso. Outros pom­ recém-nascida é capaz de sugar... Além disso, é um
bos mostraram padrões que incluíam respostas fato bem conhecido que a atividade desse comple­
xo mecanismo no bebê é provocado pela irritação
diferentes, tais como limpar as penas ou andar dos lábios; ponha, por exemplo, seus dedos ou uma
de um lado para outro. Essas respostas se torna­ vela, ou um palito de madeira entre os lábios de um
vam menos prováveis e o bicar se tornava a res­ bebê e ele começará a sugar. Tente a mesma coisa
posta dominante ou mais provável, à medida que com uma criança, três meses depois que foi desma­
se aproximava o momento da próxima opera­ mada, e ela não mais sugará; entretanto, a habilida­
de de produzir movimentos de sucção à vontade é
ção do comedouro. retida pelo homem por toda a vida. Esses são fatos
As apresentações repetidas do estímulo im­ altamente notáveis: por um lado mostram que a con­
puseram uma estrutura temporal ao comporta­ dução da sensação dos lábios para os mecanismos
.j.-HIu. O responder inicial, nos intervalos entre nervosos centrais que produzem os movimentos de

2 - C- a r l e s C a ta n ia
sugar cessam, aparentemente, depois do desmame; (Zebra danio), a um estímulo planejado para as­
por outro lado, indicam que a integridade dessa con­ semelhar-se à rápida aproximação do seu maior
dução é mantida pela repetição freqüente do refle­
xo. (Sechenov, 1863, pp. 28-29)
predador (Dill, 1974). À medida que o estímulo
se aproxima, o peixe começa a nadar para longe
Sechenov enfatiza aqui a complexidade da do local (apesar de estar em um meio aquático,
resposta no reflexo de sucção, mas o mais im­ essa resposta do peixe de nadar em fuga pode
portante é sua observação sobre o papel da repe­ ser adequadamente chamada de reação de vôo).
tição. De acordo com Sechenov, não apenas a A latência da resposta de nadar começa a dimi­
repetição é importante para a manutenção da res­ nuir com as repetidas exposições ao estímulo;
posta, mas a resposta também se toma indepen­ em outras palavras, o estímulo passa a eliciar a
dente dos efeitos de estímulos eliciadores. No resposta de fuga mais e mais fortemente. Após
bebê, o sugar é eliciado por estímulos (“irrita­ dez dias sem a ocorrência de eliciações, a res­
ção nos lábios”) mais tarde, esses estímulos não posta não havia retomado aos seus níveis ini­
mais eliciam a resposta, mas o organismo per­ ciais: a mudança produzida pelo estímulo não
manece capaz, até a vida adulta, de produzir a foi revertida (cf. a seção sobre potenciação; ver,
resposta, mesmo na ausência desses estímulos também, o Capítulo 6 sobre as reações defensi­
(cf. Schoenfeld, 1966; ver, também, Hall & vas específicas da espécie).
Oppenheim, 1987, p. 113: “Para a maior parte Mas nem todas as respostas começam com a
das espécies em que o filhote suga o alimento na eliciação. Algumas das primeiras respostas na
mãe, essa habilidade é reduzida se o sugar não vida de um organismo ocorrem espontaneamen­
for praticado... pode-se m ostrar que, para a te, na ausência de estímulos identificáveis. Por
maioria dos filhotes de animais, virtualmente exemplo, dentro do ovo, o embrião do pintinho
todos os comportamentos organizados orien­ faz movimentos não coordenados de seus mem­
tados para a mãe são fortemente influencia­ bros e corpo. Esses movimentos podem evitar
dos pelos eventos experienciados”). que os ossos, em desenvolvimento, fixem-se em
Com base em tais fenômenos, podemos con­ suas articulações ou podem modificar a forma
cluir que a eliciação repetida de uma resposta dos ossos em crescimento e do tecido conjunti­
aumenta a probabilidade de que a resposta seja vo. Mais tarde, no desenvolvimento do embrião,
emitida. As primeiras explicações sobre a apren­ aparecem efeitos de estímulos eliciadores, tal­
dizagem (p. ex., Thorndike, 1921; Verhave, vez simplesmente à medida que o aparato sen­
1967) trataram dos efeitos da repetição da res­ sorial do embrião amadurece. Essa progressão
posta como componentes básicos da aprendiza­ do responder espontâneo para o responder elici­
gem, descritos em termos de leis do exercício e ado pode ser resumida, dizendo-se que os em­
leis da prática. Essas leis eram freqüentemente briões de pintinhos “agem” antes de “reagir”
ambíguas em relação a questões como se era ou (Provine, 1976, p. 210). Os estímulos tomam-se
não importante que a resposta repetida fosse eli­ importantes mais tarde, como quando os movi­
ciada ou emitida. De qualquer modo, elas foram mentos rotatórios do pintinho, ao romper a cas­
logo superadas por outras preocupações. A me­ ca, são afetados, dependendo de se ele continua
dida que a Psicologia da Aprendizagem se vol­ ou não a encontrar porções intactas da casca.
tou para outros fenômenos, tais como o reforço A evidência sugere que o bicar, em pintinhos
e o controle de estímulos, a possibilidade de um recém-nascidos, depende não somente das con­
papel para o exercício ou a prática ficou negli­ dições que eliciam o bicar e das conseqüências
genciada. A evidência é muito escassa para per­ das primeiras bicadas, mas também de quanto o
mitir conclusões seguras sobre se o exercício ou pintinho já se engajou em bicar (Hogan, 1971).
a prática podem ser um componente básico de Uma vez que o responder ocorra, qualquer que
aprendizagem, mas existem alguns dados pro­ tenha sido sua origem, ele pode ter conseqüên­
vocativos. cias, e a sobrevivência do pintinho pode depen­
Um exemplo é fornecido por uma pesquisa der, por sua vez, das conseqüências que afeta­
sobre as respostas de fuga de um peixe tropical rem ou não seu comportamento. Entre as gaivo­

A p re n d iz a g e m 73
tas, por exemplo, bicar o bico do progenitor, mas temunha, uma vez mais, a grande importância
não atingir o alvo tem conseqüências diferentes da repetição freqüente para a atividade nervosa”
de atingir o bico; somente no último caso é que (Sechenov, 1863, p. 29).
a gaivota-mãe alimenta o filhote. Essas conse­ Já não podemos estar tão certos acerca da
qüências diferenciais afetarão a precisão das bi­ evidência sobre a qual Sechenov baseou sua con­
cadas subseqüentes do filhote, somente, à medi­ clusão (p. ex., ele observou uma criança ou mui­
da que a resposta se toma independente de seus tas crianças?), mas podemos considerar um
estímulos eliciadores. Esse desenvolvimento cor­ exemplo contemporâneo em Zelazo, Zelazo &
responde a uma formulação possível da lei do Kolb (1972). Esta pesquisa envolveu o reflexo
exercício: uma vez que uma resposta tenha sido de andar, que aparece em bebês recém-nascidos
eliciada por um estímulo, a resposta pode tor­ e desaparece em, aproximadamente, 8 semanas
nar-se mais provável, mesmo na ausência do es­ (McGraw, 1945). A resposta do reflexo de an­
tímulo. dar tem muito em comum com o comportamen­
Em experimentos sobre salivação, os cães sa­ to em que a criança se engaja mais tarde, quan­
livam, inicialmente, somente quando o alimento do está aprendendo a andar. Os movimentos co­
é apresentado, mas, depois de várias apresenta­ ordenados de andar, assemelhando-se àqueles de
ções de alimento, eles começam, também, a sa­ um adulto, podem ser eliciados segurando o bebê
livar ocasionalmente quando o alimento está au­ sob os braços e deixando seus pés tocarem uma
sente (p. ex., Zener & McCurdy, 1939). Tal res­ superfície horizontal. Quando os pais exercita­
posta, denominada salivação espontânea, tem ram o reflexo de andar de seus bebês, seguran­
sido atribuída ao condicionamento da resposta do-os de maneira a eliciar a resposta de andar,
salivar a características da situação experimen­ este reflexo tinha menor probabilidade de desa­
tal (p. ex., pode ser argumentado que o estímulo parecer e o andar, em média, iniciava mais cedo
eliciador era uma mancha na parede, que o ca­ do que em outros grupos de bebês, para os quais
chorro viu casualmente, justamente quando co­ o andar não foi exercitado. Assim, o exercício
meçou a apresentação de alimento). Nenhum desse reflexo durante as oito primeiras semanas
outro estímulo eliciador era identificável, assim de vida não somente aumentou o responder eli­
a única maneira de resguardar o tratamento de ciado, que ordinariamente diminui durante esse
respostas salivares como parte de uma relação período de tempo, mas parece ter encurtado o
reflexa seria supor que a salivação poderia ser tempo para o posterior aparecimento dessa res­
eliciada por tais características arbitrárias da si­ posta como um componente do comportamento
tuação experimental. Contudo, o problema de emitido, o andar.
identificar estímulos simplesmente desaparece se Mas os autores reconheceram que os movi­
admitirmos a possibilidade da ocorrência de res­ mentos de andar produzem outras mudanças no
postas sem estímulos eliciadores; de fato, não mundo do bebê (visuais, cinestésicas ou táteis),
poderíamos, de outra maneira, conceber o res­ que podem reforçar tais respostas. Mesmo du­
ponder emitido. O conceito de responder emiti­ rante as 8 semanas de exercício, o andar era al­
do será essencial para a abordagem das opera­ gumas vezes emitido, em vez de eliciado, e algo
ções conseqüenciais, como o reforçamento e a mais do que uma simples eliciação estava ocor­
punição. rendo: “O andar...parecia progredir de uma res­
As primeiras teorias do comportamento sus­ posta reflexa para uma instrumental. Há pouca
tentavam que a simples repetição do comporta­ dúvida de que tenha ocorrido alguma aprendi­
mento era importante, em si mesma, para o de­ zagem... Não apenas havia mais respostas... mas
senvolvimento e a manutenção daquele compor­ elas eram melhor executadas” (Zelazo, Zelazo
tamento. Consideremos a seguinte afirmação de & Kolb, 1972, p. 315). A situação complica-se
Sechenov “...Se uma criança que acabou de ainda mais como um exemplo de eliciação, da­
aprender a andar fica doente e permanece na das as mudanças no peso do bebê e nas capaci­
cama por um longo tempo, ela esquece a arte dades de suporte de suas pemas ao longo de tais
previamente adquirida de andar... Esse fato tes­ estudos (Thelen e col., 1982).

74 A. C h a r le s C a ta n ia
Especulamos que uma resposta, uma vez pro­ ele veja seja sua mãe e, mesmo neste primeiro
duzida por um estímulo, pode tornar-se mais pro­ dia de vida fora do ovo, o patinho, provavelmen­
vável, mesmo na ausência do estímulo. Em ou­ te, começará a ficar perto dela. Mas, se a mãe
tras palavras, eliciar uma resposta pode elevar não está presente e o patinho vê, de início, algu­
sua probabilidade de emissão. Essa formulação ma outra coisa em movimento, tal como uma
difere das leis clássicas do exercício ou da práti­ pessoa, ele comportar-se-á, em relação a esse
ca às quais a relacionamos. Ela depende apenas estímulo, como teria feito em relação à sua
da mais simples das operações experimentais, a mãe. Considera-se que tais estímulos são es­
apresentação de estímulos. Mas não precisamos tampados, isto é, em sentido figurado, grava­
tentar estabelecer tais leis. É possível que algu­ dos no patinho.
mas respostas emitidas tenham sua origem por­ A estampagem tem sido demonstrada, tanto
que são primeiro eliciadas, enquanto outras são no laboratório como no campo, com uma varie­
emitidas desde o início. A questão, então, não é dade de estímulos, indo de pássaros reais e pás-
a universalidade das leis do exercício ou alter­ saros-modelos a trens elétricos (alguns estímu­
nativas, tais como emissão espontânea; antes, tra­ los, certamente, funcionam melhor que outros).
ta-se da questão experimental de qual é a fonte Tem sido dito, algumas vezes, que o desenvolvi­
do responder em casos particulares. Outros pro­ mento da estampagem tem um período crítico
blemas na análise do comportamento terão esse de um ou uns poucos dias: se a estampagem não
mesmo enfoque nos capítulos seguintes. Em vez ocorre durante esse período crítico, ela pode não
de tentar explicar os casos de comportamento ocorrer mais. De fato, as coisas parecem ser mais
em termos de leis formais exaustivas, vamos ten­ complicadas (Hoffman, 1996). Por exemplo, o
tar melhorar nossa taxonomia do comportamen­ medo de estímulos novos se desenvolve ao final
to, fazendo uma classificação do comportamen­ do período crítico. À medida que os pássaros se
to em termos de suas origens. tomam mais velhos, eles apresentam piados de
desconforto característicos na presença de estí­
mulos novos e movem-se para longe de tais estí­
AS APRESENTAÇÕES DE ESTÍMULO EM mulos. Assim, os pássaros mais velhos, geral­
ESTAMPAGEM (IMPRINT1NG) mente, não ficam perto de tais estímulos por tem­
po suficiente para que a estampagem ocorra, mas
Até este ponto, estivemos concentrados em isso pode ocorrer se esse efeito dos estímulos
como os estímulos afetam o responder. Virtual­ novos for prevenido ou revertido.
mente todos os fenômenos considerados neste Em quaisquer dos casos, o patinho começa a
capítulo podem ser descritos em termos de pro­ responder de maneira significativa a um estímu­
babilidades de resposta. Por exemplo, em uma lo, seja a mãe-pata, seja uma pessoa ou algum
relação reflexa, um estímulo aumenta a probabi­ objeto arbitrário em movimento, se o estímulo é
lidade de uma resposta para perto de 1,0; na ha­ apresentado sob condições apropriadas e sufi­
bituação, a probabilidade da resposta diminui ao cientemente cedo em sua vida. Uma dessas res­
longo de apresentações sucessivas do estímulo, postas é seguir o estímulo estampado à medida
e no comportamento adjuntivo a eliciação de uma que ele se move; tem sido dito, algumas vezes,
resposta muda a probabilidade de alguma outra que esse seguir é eliciado pelo estímulo estam­
resposta. Vamos examinar agora um resultado pado, mas esse uso da linguagem de eliciação é
de apresentações de estímulo, a estampagem (Lo­ enganador.
renz, 1937), que deve ser discutida em outros Se o estímulo estampado é a mãe-pata, o
termos que não o dos efeitos sobre a probabili­ patinho a seguirá e emitirá piados de descon­
dade de resposta. A estampagem oferece uma forto em sua ausência. Mas, que tipo de con­
ponte para o tratamento das conseqüências das trole o estímulo estampado exerce sobre a res­
respostas no próximo capítulo. posta de seguir? Sempre que o patinho anda
Quando um patinho sai da casca do ovo, é em direção à mãe, ele se encontra mais próxi­
provável que a primeira coisa em movimento que mo dela; sempre que se afasta, ele se encon-

A p re n d iz a g e m 75
tra mais longe dela. Em outras palavras, a con­ AS OPERAÇÕES ESTABELECEDORAS E
seqüência natural de caminhar em diferentes A IMPORTANCIA DE ESTÍMULOS
direções é mudar a distância entre o patinho e
a mãe. Se a proximidade da mãe é uma conse­ Há outras maneiras de mudar a importância
qüência importante para o patinho, não deve­ dos estímulos. Algumas delas foram tratadas no
ria causar surpresa que ele caminhe em dire­ Capítulo 2, como os casos de operações estabe­
ção a ela e não para longe dela. Segue-se tam­ lecedoras. Por exemplo, se for mais provável que
bém que, se o ambiente do patinho for altera­ um rato coma do que corra na roda de atividade,
do de tal modo que a proximidade com a mãe esperaremos que o rato pressione a barra mais
requeira uma outra resposta que não o andar, freqüentemente, e que suas pressões à barra pro­
essa outra resposta deveria substituí-lo. duzam mais alimento do que se suas pressões
Tal experimento foi planejado por Peterson produzissem apenas acesso à roda de atividade.
(1960). De um dos lados de uma janela havia Mas suponhamos que o rato continue a ter livre
um compartimento escuro, contendo um estímu­ acesso ao alimento, enquanto a roda é trancada,
lo estampado em movimento. Um patinho, do impedindo assim o rato de correr. Depois de um
outro lado da janela, podia iluminar o lado com período de privação do correr na roda de ativi­
o estímulo estampado, apresentando um resposta dade, poderíamos, então, descobrir que o rato
apropriada. Ele fez isso, mesmo quando a res­ estaria mais propenso a correr do que a comer,
posta requerida era incompatível com o seguir, se a oportunidade de correr na roda ficasse no­
tal como bicar um disco localizado na parede vamente disponível, e que o rato pressionaria a
ou ficar parado sobre uma plataforma perto da barra mais freqüentemente se as pressões à bar­
janela. Em outras palavras, a propriedade críti­ ra produzissem mais acesso à roda de atividade
ca do estímulo estampado não era que ele podia do que se elas produzissem alimento. Em outras
eliciar respostas particulares, tais como seguir, palavras, ao privar o rato de um ou outro desses
bicar ou ficar parado, mas, antes, que tornou-se estímulos, podemos mudar a importância de um
uma conseqüência importante para o patinho e, em relação ao outro; podemos fazer o correr na
assim, podia reforçar ou aumentar a freqüência roda mais provável do que o comer ou o comer
de tais respostas como seguir, bicar ou ficar pa­ mais provável do que o correr, dependendo da
rado. Em ambientes naturais, seguir geralmente privação prévia, de cada um deles, a que o rato
mantém o patinho próximo do estímulo estam­ tenha sido submetido.
pado (geralmente sua mãe), mas um ambiente As mudanças na importância dos estímulos
de laboratório mostra que o patinho pode apren­ que ocorrem com as operações estabelecedoras
der a apresentar outras respostas, se são elas ou são discutidas em termos de impulso ou motiva­
não que têm a importante conseqüência de man­ ção (p. ex., Bolles, 1975). Os estímulos tomam-
ter próximo o estímulo estampado. se mais ou menos reforçadores ou mais ou me­
Na estampagem, os efeitos de apresentação nos aversivos, dependendo dos fatores como o tem­
inicial do estímulo a ser estampado não são as po desde sua última apresentação. O alimento, por
mudanças nas probabilidades do responder. An­ exemplo, toma-se mais reforçador à medida que o
tes, são as operações estabelecedoras. Elas tempo passa sem comer e pode, até mesmo, tor­
mudam a importância do estímulo. O estímu­ nar-se aversivo depois do comer, se for consumi­
lo estampado adquire sua importância para o da uma quantidade muito maior do que a usual.
organismo simplesmente por ter sido apresen­ A importância dos estímulos também pode
tado sob circunstâncias apropriadas. Ele co­ ser mudada por outros meios que não a priva­
meça como um estímulo em relação ao qual o ção; como veremos nos capítulos seguintes, os
organismo é relativamente indiferente, mas reforçadores condicionados e os estímulos aver­
termina como um estímulo que funciona como sivos condicionados, por exemplo, são estímu­
reforçador e, portanto, modela o comporta­ los que adquiriram suas propriedades reforçado-
mento do patinho. ras ou aversivas por meio de sua relação com
outros estímulos. (Para uma discussão da intera­

76 A . C h a r le s C a ta n ia
ção entre a motivação e os efeitos da adaptação, cessivas de um estímulo, a probabilidade de eli­
ver Solomon & Corbit, 1974). ciação da resposta pode decrescer (habituação)
Os estudos fisiológicos de motivação normal­ ou aumentar (potenciação); no comportamento
mente estão interessados nas relações entre os adjuntivo, a eliciação de uma resposta muda a
fatores orgânicos e a importância dos estímulos probabilidade de uma outra resposta; as apresen­
(p. ex., os efeitos dos níveis de açúcar no sangue tações repetidas de um estímulo podem produ­
sobre o comportamento relacionado ao alimen­ zir padrões temporais de comportamento; elicia-
to, os efeitos de níveis hormonais sobre o com­ ções sucessivas podem aumentar a probabilida­
portamento sexual, etc.). A motivação, então, não de da resposta na ausência do estímulo, como
é uma força ou um impulso especial a ser locali­ no fenômeno do exercício. O exemplo da estam­
zado em algum lugar dentro do organismo; an­ pagem envolve os efeitos adicionais da apresen­
tes, é um termo aplicado a muitas variáveis or­ tação do estímulo e estabelece a ocasião para a
gânicas e ambientais, que tomam vários estímu­ discussão de operações estabelecedoras.
los importantes para um organismo. Estamos prontos para passar para as opera­
Este capítulo se concentrou em como os estí­ ções de reforçamento e punição. Toda vez que
mulos afetam o responder. Muitos fenômenos as respostas têm conseqüências, essas conse­
considerados aqui podem ser descritos em ter­ qüências também terão seus efeitos como estí­
mos de probabilidades de resposta: em uma re­ mulos. Dadas as muitas mudanças no responder
lação reflexa, um estímulo aumenta a probabili­ que podem ser produzidas pela apresentação de
dade da resposta para cerca de 1,0; em uma ini­ estímulos, não deveríamos esperar compreender
bição reflexa, um estímulo reduz a probabilida­ o responder conseqüencial sem levá-las em con­
de da resposta; ao longo de apresentações su­ sideração.

A p re n d iz a g e m 77
PARTE III
APRENDIZAGEM
SEM PALAVRAS
As Conseqüências do Responder:
Reforço

güidade são, geralmente, contrapostas: contingên­


A. Reforço e Extinção
cia, no sentido técnico, ressalta como a probabili­
Labirintos e Curvas de Aprendizagem
dade de um evento pode ser afetada ou causada por
Câmaras Experimentais e Registros Cumulativos
outros eventos, enquanto contigüidade simplesmente
Reforço
implica a justaposição de eventos no espaço ou no
Extinção
Extinção versus Inibição tempo, sem levar em conta a causação.
Contingências Resposta-Reforçador e Apresentações
do Reforçador O comportamento tem conseqüências, e uma
Extinção e Superstição propriedade importante do comportamento é que
ele pode ser afetado por suas conseqüências.
B. Os Reforçadores como Oportunidades para o
Comportamento Podemos estudar este fenômeno programando
A Relatividade do Reforço conseqüências para o comportamento, mas pro­
A Aquisição do Comportamento gramar conseqüências envolve mais do que sim­
Aprendizagem Latente plesmente apresentar estímulos. Os estímulos
Aprendizagem Sensório-Motora
devem ocorrer em alguma relação com o com­
portamento. O ambiente deve ser programado de
tal forma que as respostas farão com que algo
aconteça.
A raiz indo-européia, sekw-, seguir, liga a palavra
conseqüência a sinalizar e designar (do latim sig­ As conseqüências para o comportamento já
num, alguma coisa que a gente segue) e a social e estão presentes no ambiente natural. Mesmo an­
associação (do latim socius, companheiro ou segui­ tes de intervirmos, os organismos podem mudar
dor). O termo compartilha o prefixo con-, com as seus ambientes fazendo coisas ou locomoven­
palavras condicionamento, contingência e contigui­ do-se de um lugar para outro. Mas, podemos es­
dade. A palavra condicionamento, através da raiz
indo-européiade/À:-, mostrar ou pronunciar, tem mui­ tudar melhor como as conseqüências afetam o
tos parentes: como ditado, do latim dicere, dizer; comportamento, programando as operações con-
teach (ensinar em inglês), que se originou do velho seqüenciais no laboratório. Por exemplo, pode­
inglês, taecan, mostrar ou instruir; julgamento, do mos construir um labirinto de modo que um rato
latim judex, aquele que proclama a lei; e paradig­ privado de água encontre água depois de fazer
ma, do grego para, além de, e deiknunai, mostrar. A
palavra contingência, do latim contingere, tocar de uma seqüência apropriada de viradas ou pode­
todos os lados, acontecer, tem vários sentidos: uma mos construir uma câmara dentro da qual um
possibilidade, uma condição de depender do acaso; pombo privado de alimento possa produzir ali­
alguma coisa incidental a uma outra coisa. Como mento ao bicar um disco localizado na parede.
contato, combina a raiz com-, junto, e tangere, to­
Então poderemos observar como a água afeta as
car. Também a palavra contigüidade, condição de
tocar ou estar em contato, tem as mesmas origens. viradas que o rato faz ao percorrer o labirinto ou
Curiosamente, em psicologia, contingências conti­ como o alimento afeta a taxa com que o pombo
bica o disco. Então, podemos ver como a água de, ele repudiou a segunda metade da lei, man­
afeta as escolhas de entradas que o rato faz, à tendo o aumento na probabilidade ou gravação,
medida que percorre o labirinto ou como o alimento mas descartando o decréscimo na probabilidade
afeta a taxa com que o pombo bica o disco. ou desgravação. O que permaneceu foi então
Este capítulo começa explorando o desenvol­ denominado Lei do Efeito fraca. Esse aspecto
vimento histórico de experimentos sobre as con­ histórico será relevante para o Capítulo 6, quan­
seqüências do comportamento. A seguir, trata de do for abordada a punição.)
algumas propriedades do conceito contemporâ­ A Figura 5.1 mostra os dados de um dos ga­
neo de reforço, tais como o significado de des­ tos de Thomdike. Para fugir da caixa, o gato ti­
continuar o reforço (extinção), a relatividade do nha que puxar um fio que ia de uma argola de
reforço, os tipos de conseqüências que podem arame na porta dianteira da caixa até um ferro­
ser reforçadoras e a gama de respostas que po­ lho que mantinha a porta fechada. Na primeira
dem ser reforçadas. Termina mostrando que o vez em que foi colocado na caixa, o gato levou
reforço não é relevante apenas para os compor­ 160 s para escapar. Esse tempo diminuiu gra­
tamentos mantidos por conseqüências fisiológi­ dual e irregularmente ao longo de tentativas su­
cas importantes, como o alimento e a água, mas cessivas, até que nas últimas tentativas, o gato
também para as interações sensório-motoras sim­ começou a escapar regularmente em menos de
ples, por exemplo quando os movimentos ocu­ 10 segundos. Esse decréscimo gradual do tem­
lares afetam o que se vê. po gasto para completar uma tarefa veio a cha­
mar-se de aprendizagem por tentativa e erro
(Köhler, mais tarde, estabeleceu um contraste
entre essa mudança gradual e as soluções súbi­
Seção A Reforço e Extinção tas ou insights que observou em chimpanzés).

O Capítulo 2 introduziu os experimentos de


Thomdike, nos quais os animais aprendiam a LABIRINTOS E CURVAS DE
fugir de caixas-problema, operando um disposi­ APRENDIZAGEM
tivo que abria a porta. Normalmente, um animal
privado de alimento era colocado dentro da cai­ Nos anos que se seguiram, a aprendizagem
xa, com a comida disponível do lado de fora. por ensaio e erro foi estudada com muitos orga­
Entre sua atividade variada, o animal, mais cedo nismos diferentes, em muitos tipos de situações.
ou mais tarde, operava o dispositivo e ficava li­ Os experimentadores acreditavam que a inteli­
vre para sair da caixa. De início, essa era uma gência das diferentes espécies poderia ser com­
resposta de baixa probabilidade, mas, porque parada observando-se a velocidade da aprendi­
abria a porta, sua probabilidade aumentava ao zagem em caixas-problema, labirintos, pistas e
longo de tentativas repetidas. em outros aparatos (p. ex., Hilgard, 1951). O pla­
Thomdike descreveu como as conseqüências nejamento de equipamentos começou a ser ditado
do responder afetavam o responder subseqüente por questões teóricas: se a aprendizagem se dava
em termos de um princípio que ele denominou por saltos discretos, na base do tudo-ou-nada, ou
de Lei do Efeito. A lei passou por várias revi­ se, em vez disso, ela ocorria gradual e continua­
sões, mas sua essência era que a probabilidade mente; se os organismos aprendiam os movimen­
de resposta pode ser aumentada por algumas tos (aprendizagem de resposta) ou as proprieda­
conseqüências e reduzida por outras. Em uma des do ambiente (aprendizagem de estímulo); se
linguagem mais próxima da de Thomdike, as as conseqüências do responder levavam diretamen­
respostas com efeitos satisfatórios seriam gra­ te à aprendizagem ou apenas levavam o organis­
vadas (stamped-in), enquanto que aquelas com mo a apresentar um desempenho tal que demons­
efeitos desagradáveis seriam desgravadas (stam- trasse o que havia aprendido de outros modos.
ped-out). (A primeira versão da lei de Thomdi­ Uma característica comum desses experimen­
ke foi chamada de Lei do Efeito forte. Mais tar­ tos era que o responder tomava-se mais prová­

82 A . C h a r le s C a ta n ia
Tentativas

FIGURA 5.1 Uma curva de aprendizagem. Tempo gasto por um gato para escapar de uma caixa problema, em
função das tentativas. (Thorndike, 1898, Figura 1)

vel quando tinha certas conseqüências. Essa O problema era que esses experimentos pro­
mudança na probabilidade era medida de maneira duziam desempenhos complexos. Por exemplo,
diferente, dependendo do equipamento empre­ medir o tempo que o rato levava para deixar de
gado e dos objetivos experimentais. Os gráficos entrar nos becos sem saída à medida que ia apren­
que mostravam como o comportamento mudava dendo a percorrer o labirinto não mostrava como
durante o experimento eram chamados de cur­ a aprendizagem se dava num único ponto de es­
vas de aprendizagem: o tempo gasto para com­ colha. Essa consideração levou a uma gradual
pletar uma resposta em função do número de ten­ simplificação dos labirintos, como ilustrado na
tativas (p. ex., Figura 5.1); a percentagem de res­ Figura 5.2.
postas corretas; a proporção de animais que atin­ O diagrama A mostra o plano de um dos pri­
giam algum critério de desempenho bem-suce­ meiros labirintos empregados no estudo da apren­
dido. Algumas vezes, essas medidas eram trans­ dizagem animal (Small, 1899-1900), uma ver­
formadas para facilitar a comparação entre elas. são de 1,80 m por 2,40 m do labirinto de sebes
Quando ratos percorriam um labirinto, por exem­ de Hampton Court na Inglaterra. (Curiosamen­
plo, o tempo de corrida da caixa de partida para te, esses labirintos podem também ter criado o
a chegada geralmente diminuía, enquanto a por­ contexto para as estátuas operadas hidraulica­
centagem de escolhas corretas e a proporção de mente, que contribuíram para o conceito de re­
animais que não cometiam erros aumentava. flexo de Descartes; cf. Capítulo 4). Quando a
Converter o tempo, para percorrer o labirinto, porta da caixa de saída era levantada, os ratos
em velocidade (definida como a recíproca do podiam entrar no labirinto; o alimento era colo­
tempo gasto) fazia com que as três medidas au­ cado na área alvo, no centro. Com o aumento da
mentassem com a aprendizagem. Mas as formas experiência no labirinto, os ratos atingiam a área
das curvas de aprendizagem dependiam tanto dos alvo com maior rapidez e com menos viradas
equipamentos usados e das medidas tomadas que incorretas ao longo do caminho. Mas era difícil
o progresso da aprendizagem não podia ser des­ examinar a aprendizagem em qualquer ponto par­
crito de uma única maneira. ticular de escolha. O ponto de escolha em 1, no

A p re n d iz a g e m 83
Saída

Saída Alvo

FIGURA 5.2 Etapas na evolução dos labirintos no estudo da aprendizagem animal. A. o labirinto de Hampton-
Court, conforme adaptação de Small (1899-1900); B. um labirinto em U, com seis pontos de escolha; C. o labirinto
em T, com um único ponto de escolha; e D, a pista reta.

diagrama A, podia ser aprendido mais rapida­ especificar a seqüência correta (em B, direita-
mente do que o 7, porque o ponto 1 aparecia mais esquerda-direita-esquerda-esquerda-direita) e
cedo do que o 7 ou porque os planos do piso computar os erros. Mesmo aqui, contudo, as in­
eram diferentes; a escolha no ponto 4 poderia terações entre as posições e as seqüências com­
ser aprendida mais rapidamente que a escolha plicam a análise. Por exemplo, seria a escolha
no ponto 5, devido às diferentes possibilidades da esquerda, no ponto 4, afetada pelo fato de ela
de abordar o ponto 4 (vindo do 3 ou do 5) ou ter sido precedida por outra virada à direita no
devido ao menor número de ocasiões em que o ponto 3 ou seguida por uma virada à esquerda
ponto 5 seria encontrado, se o rato fosse direta­ no ponto 5? Seria importante se o rato chegasse
mente do ponto 3 ao 4 com maior freqüência do ao ponto 4, após retomar de um beco sem saída
que do 3 ao 5. no ponto 3, tendo feito um erro ali, em vez de
Gradualmente, as estruturas do labirinto evo­ após uma virada correta à direita? Seria impor­
luíram para formas mais sistemáticas, como no tante que o ponto 4 estivesse no meio do labirin­
diagrama B. Neste labirinto, algumas vezes cha­ to, em vez de próximo a seu início ou fim?
mado de labirinto em U devido à forma das uni­ Era talvez inevitável que o labirinto fosse
dades sucessivas, os pontos de escolha eram es­ reduzido a um ponto de escolha única, como no
sencialmente os mesmos quando o rato chegava labirinto em T, com uma área alvo à direita em C
a cada um deles; eles diferiam apenas em suas na Figura 5.2. Aqui, quando o rato deixava a área
localizações na seqüência e em se virar à esquer­ de saída, ele tinha que fazer uma única escolha,
da ou à direita seriam as respostas corretas. Esse à direita ou à esquerda. Mas algumas complica­
tipo de procedimento sistemático tomava fácil ções possíveis ainda não estavam eliminadas.

84 A . C h a r le s C a ta n ia
Suponhamos, por exemplo, que um rato em sua do ponto de chegada permitisse ao rato diminuir
primeira tentativa no labirinto em T virasse à a velocidade sem bater a cabeça contra a parede
direita enquanto que um segundo rato virasse à (Killeen & Amsel, 1987).
esquerda. Deveríamos permitir que o segundo Tanto com os labirintos como com as pistas,
rato refizesse o percurso depois de ter alcançado o experimentador tinha que retornar o organis­
a área vazia no fim do braço esquerdo? Se, em mo da área de chegada para a de saída, toda vez
vez disso, ele fosse recolocado na área de parti­ que iniciava uma nova tentativa. Assim, era o
da, deveria ele ser forçado a alcançar a área alvo experimentador, e não o organismo, quem de­
(p. ex., bloqueando-se o braço esquerdo da pis­ terminava quando o comportamento ocorria.
ta), para garantir que sua experiência na área alvo Além disso, medir quanto o rato demorava não
fosse comparável à do primeiro rato? O próxi­ especificava o que ele estava realmente fazendo
mo passo lógico era eliminar completamente os durante aquele tempo. Duas inovações experi­
pontos de escolha, deixando nada mais do que mentais ajudaram a resolver esses problemas. A
um simples corredor, como em D, na Figura 5.2. primeira consistiu em um aparelho construído
Agora, nenhum erro era possível, e as medidas de tal modo que o organismo podia emitir repe­
de comportamento ficaram reduzidas simples­ tidamente, sem a intervenção do experimenta­
mente à velocidade com que o rato se locomo­ dor, uma resposta facilmente especificada; a se­
via do ponto de saída para o ponto de chegada. gunda foi um método de registro, baseado dire­
Havia outros problemas. As medidas médias tamente na taxa ou freqüência de respostas, em
do desempenho de um grupo de animais não re­ contraposição às medidas indiretas derivadas de
presentavam necessariamente o desempenho dos seqüências de respostas ou de grupos de orga­
indivíduos do grupo. Suponhamos, por exemplo, nismos. Essas inovações, inspiradas parcialmente
que, para ratos sozinhos em um labirinto em T pelo interesse em reduzir a manipulação do or­
simples, os erros freqüentes mudem abruptamen­ ganismo, simplificando assim o trabalho do ex­
te para viradas consistentemente corretas, mas perimentador, foram características importantes
que essa mudança ocorra em diferentes tentati­ de uma linha de pesquisa iniciada por Skinner
vas para os diferentes ratos. Em um grupo gran­ (1930, 1938,1950; ver, especialmente, Skinner,
de de ratos, 65% podem passar a virar correta­ 1956, para uma história dessa evolução).
mente em tomo da quinta tentativa, 72% em tor­
no da sexta, 79% em tomo da sétima, 83% por
volta da oitava, e assim por diante, até que o de­ CÂMARAS EXPERIMENTAIS E
sempenho se tome estável entre 98 e 100% na REGISTROS CUMULATIVOS
vigésima tentativa. Esse desempenho do grupo,
dada a aparência de um aumento gradativo de Dois aparatos representativos são ilustra­
viradas corretas, obscureceria completamente a dos na Figura 5.3: uma câmara padrão para
mudança abrupta no desempenho individual dos ratos com uma única barra, à esquerda, e uma
ratos (Sidman, 1952). câmara para pombos com três discos, à direi­
Mesmo a pista simples não foi a solução de­ ta. Ambas compartilham de dispositivos de
finitiva, porque a velocidade para percorrer a ala resposta; de mecanismos para apresentar re-
reta era afetada por muitos fatores triviais. Se as forçadores como alimento ou água e de fon­
tentativas começassem com a abertura da porta tes de estímulos.
do ponto de saída, a velocidade dependeria da Em um procedimento típico, um rato é colo­
direção para a qual o animal estaria voltado no cado na câmara após ter sido privado de alimen­
momento em que a porta fosse aberta. A veloci­ to. Uma barra ressalta da parede. Próximo à bar­
dade seria também afetada pela manipulação do ra, encontra-se um comedouro para receber as
animal quando o experimentador o transportas­ pelotas de alimento, depositadas por um meca­
se, a cada tentativa, do ponto de chegada para o nismo do outro lado da parede; um ruído carac­
de partida ou pelos rastros de cheiro deixados terístico acompanha cada apresentação da pelo­
pelos outros animais, ou até mesmo se o espaço ta. Uma lâmpada piloto ilumina a câmara, e um

A p re n d iz a g e m 85
FIGURA 5.3 Uma câmara para ratos (à esquerda) e uma câmara com três discos para pombos (à direita). A
câmara do rato inclui uma barra (A), um comedouro e um tubo para fornecimento de pelotas (B), um alto-falante
(C) e uma lâmpada ou luz da caixa (D); algumas câmaras para ratos incluem um piso de grades, por meio do qual
pode ser aplicado um choque elétrico (E). A câmara do pombo inclui três discos (F, G e H) e a abertura para um
comedouro (I). As lâmpadas ou os projetores localizados atrás de cada disco permitem projetar cores ou figuras
sobre os discos.

ruído do alto-falante pode mascarar os sons de bos, fica a seu alcance por alguns poucos segun­
fora da câmara. dos. A abertura do comedouro se localiza no
O primeiro passo é o treino ao comedouro. centro e abaixo dos discos. O comedouro fica
As pelotas vão sendo depositadas no comedou­ centralizado abaixo dos discos. E prática comum
ro. Cedo ou tarde, o rato acaba encontrando-as e iluminar o comedouro e apagar todas as outras
comendo-as. Uma vez que isso ocorra, as pelo­ luzes, sempre que o comedouro é operado. A
tas continuam caindo até que, após cada apre­ câmara comumente apresenta outras caracterís­
sentação, o rato se aproxime rapidamente do co­ ticas, como uma lâmpada para iluminação geral
medouro a partir de qualquer ponto da caixa. tênue, fontes de ruído mascarador e outros estí­
Normalmente 10 pelotas são suficientes. Uma mulos audidvos, etc.
vez completado o treino ao comedouro, muda- O disco é uma peça de plástico, montado atrás
se o procedimento de maneira que a apresenta­ de um orifício redondo aberto na parede da câ­
ção do alimento passe a depender das pressões à mara. Ele é conectado a um micro-interruptor,
barra. Eventualmente o rato pressiona a barra, a que registra as bicadas do pombo se elas forem
pressão produz a queda da pelota e a pelota oca­ suficientemente fortes (os discos são, normal­
siona o comer. O rato então, provavelmente, vol­ mente, sensíveis a bicadas de menos de 0,1
tará à barra e a pressionará de novo. (As alterna­ Newton, que corresponde a aproximadamente 10
tivas para a demora em pressionar a barra são gramas ou um terço de uma onça). O plástico
consideradas no Capítulo 7). O resultado de in­ geralmente é translúcido, de modo que cores ou
teresse aqui é a freqüência com que o rato pres­ padrões podem ser projetados nele por meio de
siona a barra. Se a freqüência aumenta, chama­ lâmpadas ou projetores miniaturizados localiza­
mos a pelota de alimento de reforçador. No tipo dos atrás dos discos. A câmara na Figura 5.3 con­
de câmara mostrado na Figura 5.3, podemos em­ tém 3 discos, dispostos horizontalmente, a uma
pregar outros tipos de reforçadores. Por exem­ distância de 23 centímetros acima do piso da
plo, o dispensador de pelotas pode ser substituí­ câmara. Qualquer experimento em particular
do por uma pequena concha para apresentar go­ pode usar apenas um dos discos, dois deles ou
tas de água ou de leite. todos os três. Quando em uso, os discos geral­
A câmara do pombo difere da do rato, por­ mente são iluminados. Como ocorre com os ra­
que as barras são substituídas por discos e o ali- tos, se as bicadas de um pombo privado de ali­
mentador, que contém a dieta padrão para pom­ mento em um disco produzem alimento, pode-

86 A . C h a r le s C a ta n ia
se esperar um aumento na taxa com que o pom­ novamente); e operante, porque a resposta ope­
bo bica o disco. ra sobre o meio ambiente.
O rato e o pombo são organismos comuns de O operante livre se presta ao emprego dos
laboratório. Cada um deles tem padrões idios­ métodos de registro, como o registro cumulati­
sincráticos específicos da espécie, que devem ser vo, que fornece um quadro pormenorizado e con­
levados em conta, e não devemos supor que qual­ veniente de como o responder se altera ao longo
quer coisa observada com ratos ou pombos pos­ do tempo. A maioria dos registros cumulativos
sa ser generalizada para outros organismos. Con­ modernos são computadorizados, mas em um
tudo, sua dieta, manutenção em cativeiro, sus- registrador cumulativo original, ilustrado na Fi­
cetibilidade a doenças e outras características são gura 5.4, uma fita de papel é enrolada em torno
razoavelmente bem-entendidas, e seu pequeno de um cilindro. Um motor gira o cilindro a uma
porte, duração de vida relativamente longa e eco­ velocidade constante, desenrolando a fita. Uma
nômica fazem deles sujeitos particularmente con­ pena ou qualquer outro dispositivo para escre­
venientes. Assim, eles têm servido, freqüente­ ver repousa sobre o papel à medida que ele pas­
mente, em experimentos sobre as conseqüências sa pelo cilindro, e cada resposta (p. ex., uma bi­
do responder. cada no disco pelo pombo) move a pena a uma
Responder em aparelhos como os da Figura pequena distância sobre o cilindro, perpendicu­
5.3 tem sido, às vezes, denominado de operante larmente ao movimento do papel. Assim, a qual­
livre: livre, porque o organismo é livre para emitir quer momento durante a sessão esse registro
a resposta em qualquer momento, sem ter que mostra o total de respostas acumuladas.
esperar pelo experimentador (como quando o Exemplos de registros cumulativos são mos­
rato na área alvo deve esperar ser recolocado no trados na Figura 5.5. Como o papel se move a
ponto de saída do labirinto, antes de percorrê-lo uma velocidade constante, quanto mais elevada

Direcionador
Cilindro da Pena Pena Direção do
Movimento da Pena

Direção do
Movimento do Papel

Rolo de
Papel

FIGURA 5.4 Principais componentes de um registrador cumulativo. Um cilindro gira a uma velocidade constante,
e cada resposta move a pena a uma distância fixa sobre o papel. A velocidade do papel e o tamanho do desloca­
mento da pena a cada resposta dependem do comportamento em estudo. A escala mais comum é de um centímetro
por minuto e 1100 respostas para a largura toda do papel (cerca de 80 respostas por centímetro). Nessa escala,
uma inclinação de 45 graus representa uma taxa de cerca de 40 respostas por minuto. Quando a pena alcança a
extremidade superior do papel, ela retoma automaticamente para a posição inicial na base do papel.

A p re n d iz a g e m 87
DC
o

10 Minutos

FIGURA 5.5 Amostras de registros cumulativos representativos. Nesta figura, uma inclitiação de 45 graus repre­
senta uma taxa de cerca de 20 respostas por minuto. Os registros A e B diferem, principalmente, quanto à taxa de
respostas: a taxa é mais elevada em A do que em B. A taxa é zero em quase todo o registro C; um segmento de C,
durante o qual ocorreram algumas poucas respostas, fo i ampliado e mostrado em relação a um registro de eventos
em D. Os registros E e F são aproximadamente iguais quanto à taxa de respostas, mas mostram detalhes diferentes
nos padrões do responder; E tem aparência de degraus, indicando períodos de resposta alternados com pausas,
enquanto F, com uma granulação mais lisa, indica um responder relativamente constante. Os registros G e H
mostram taxas que se alteram com o correr do tempo, diminuindo em G (aceleração negativa) e aumentando em H
(aceleração positiva).

a taxa de respostas, mais abrupta é a inclinação ma escala temporal. A cada resposta, no registro
do registro cumulativo, como mostram os regis­ de eventos, corresponde um pequeno degrau no
tros A e B. Na escala da Figura 5.5, a taxa de registro cumulativo; esta propriedade dos regis­
resposta é de aproximadamente 30 respostas por tros cumulativos não é, em geral, óbvia, porque
minuto para o registro A e de, aproximadamen­ as escalas típicas de respostas e de tempo são
te, 12 por minuto para o registro B. O registro C pequenas demais para essa resolução fina de
inclui somente algumas poucas respostas; as pormenores.
porções horizontais indicam períodos de tempo Mesmo assim, diferentes padrões de respos­
em que não ocorreram respostas (note que um tas podem ser facilmente distinguidos nos regis­
registro cumulativo não pode ter uma inclinação tros cumulativos. Por exemplo, as taxas de res­
negativa, porque a pena pode registrar as res­ postas nos registros E e F são praticamente as
postas, movendo-se apenas em uma direção ao mesmas, mas o registro E aparenta degraus, en­
longo da página). quanto que o F é relativamente liso. Isto signifi­
Uma pequena seção do registro C, que inclui ca que o registro E foi produzido por surtos rá­
umas poucas respostas, é ampliada no registro pidos de respostas (segmentos íngremes), sepa­
D, em que o registro cumulativo ampliado é rados por pausas (segmentos planos), enquanto
acompanhado do registro de um evento na mes­ o registro F foi produzido por um responder mais

88 A . C h a r le s C a ta n ia
uniforme. Essa propriedade do registro cumula­ respostas. Nesses registros, somente algumas das
tivo é, às vezes, chamada de textura ou granula­ respostas produziam o alimento, irregularmente
ção', dos dois registros, o E tem uma textura mais em A (como em a, b e c), e regularmente em B
áspera que F. (como em d e e). O padrão côncavo repetitivo
Os registros G e H fornecem outros exem­ em B, como aparece entre d ee, costuma ser cha­
plos de propriedades pormenorizadas do com­ mado de padrão de curvatura em concha (scallo-
portamento que o registro cumulativo evidencia. ping). No registro C, o responder que começou
No registro G, a taxa começa em cerca de 25 em/produziu comida emg, como indicado pelo
respostas/min, mas diminui gradualmente à deslocamento da pena A pena então volta a h e
medida que o tempo passa; no registro H, a a seqüência é repetida de h a i, e assim por dian­
taxa se altera na direção oposta, aumentando te. Esse tipo de registro facilita a comparação
de uma taxa relativamente baixa para cerca entre segmentos sucessivos (p. ex., ocorreram
de 30 respostas/min (os registros em que as muito mais respostas no segmento que termina
inclinações diminuem ao longo do tempo são em g do que no que termina em i). O registro D
chamados negativamente acelerados', aqueles serve de ilustração de como deslocamentos cons­
que aumentam são chamados positivamente tantes da pena podem servir para distinguir dife­
acelerados). rentes condições. Aqui o responder, ocasional­
A Figura 5.6 mostra algumas outras caracte­ mente, produz comida, mas apenas na presença
rísticas, geralmente incorporadas nos registros de um tom; na presença desse tom, a pena per­
cumulativos. Os registros A e B mostram como maneceu em sua posição normal, como nos seg­
os deslocamentos da pena de respostas podem mentos j, l e n, mas foi deslocada para baixo em
ser usados para indicar outros eventos, além das sua ausência, como nos segmentos k, m e o.

FIGURA 5.6 Características adicionais de registros cumulativos. Em A í B, os deslocamentos da pena são usados
para superpor o registro de outros eventos, como apresentação de alimento, sobre o registro acumulado das res­
postas (como em a até &). Em C, a reciclagem da pena é usada para simplificar as comparações entre os segmentos
sucessivos de um registro (f a g, h a i). Em D, deslocamentos da pena para cima são usados para distinguir o
responder em presença de um estímulo (em), 1 e n) do não responder na sua ausência (em k, m e o ) . Nesta figura,
uma inclinação de 45 graus representa uma taxa de, aproximadamente, 40 respostas por minuto (a escala difere
daquela da Figura 5.5).

A p re n d iz a g e m 89
Ao tratar do comportamento operante livre e vocabulário contemporâneo do reforço estão re­
dos registros cumulativos, exploramos parte do sumidas na Tabela 5.1.
desenvolvimento tecnológico da ciência do com­ A terminologia do reforço inclui o termo re-
portamento. Antes, porém, de nos dedicarmos forçador como estímulo e os termos reforçar e
efetivamente aos dados proporcionados por essa reforço ou reforçamento, tanto na acepção de
análise, devemos atentar para alguns aspectos da operação quanto na de processo. Por exemplo,
terminologia do comportamento. quando as pressões à barra por um rato produ­
zem pelotas de alimento e as pressões à barra
aumentam, podemos tanto dizer que as pelotas
REFORÇO são reforçadoras, ou que as pressões à barra são
reforçadas com pelotas. A resposta cuja freqüên­
As pressões à barra por um rato privado de cia aumenta deve ser a que produziu a conse­
água tomam-se mais prováveis quando produ­ qüência. Por exemplo, se a pressão à barra de
zem água do que quando não produzem. Bica­ um rato produz choque elétrico, e apenas a fre­
das no disco tomam-se mais prováveis quando qüência de saltos aumenta, seria inapropriado
um pombo privado de alimento bica e produz dizer que a pressão à barra ou que as respostas
comida do que quando não produz. E talvez, o de saltar foram reforçadas.
choro de uma criança torne-se mais provável Embora um reforçador seja uma espécie de
quando chama a atenção dos pais do que quando estímulo, o reforço não é nem o estímulo nem a
não provoca essa atenção. Esses casos ilustram resposta. Como uma operação, o reforçamento é
o princípio do reforço: o responder aumenta a apresentação de um reforçador quando uma
quando produz reforçadores. O princípio é sim­ resposta ocorre; a operação é efetuada sobre as
ples, mas à medida que evoluiu, da versão ini­ respostas e, portanto, podemos falar tão somen­
cial da Lei do Efeito de Thomdike até a posição te de respostas reforçadas, não de organismos
atual, trouxe consigo alguns problemas de lin­ reforçados. Dizemos que a comida reforçou a
guagem e de lógica. Algumas propriedades do pressão à barra no caso do rato ou que as respos-

TABELA 5.1 A Terminologia do Reforço. Esta terminologia“ é adequada se, e somente se, estiverem
presentes três condições: (1) uma resposta produz alguma conseqüência, (2) a resposta ocorre com mais freqüên­
cia do que quando não produz conseqüências e (3) o aumento das respostas ocorre porque a
resposta tem aquela conseqüência.
Termo Restrições Exemplos
Reforçador Um estímulo. Pelotas de alimento foram empregadas como re­
(substantivo) forçadores para as pressões à barra por ratos.
Reforçador (adjetivo) Uma propriedade de um estímulo. O estímulo reforçador era produzido mais freqüen­
temente do que outros estímulos não-reforçado-
res.
Reforço (substantivo) Como uma operação, apresentar O esquema de reforço em razão fixa programava a
conseqüências quando uma res­ apresentação de alimento a cada 10 respostas de
posta ocorre. bicar.
Como um processo, o aumento nas O experimento com macacos demonstrou reforço
respostas que resultam do refor­ produzido por conseqüências sociais.
ço.
Reforçar (verbo) Como uma operação, apresentar Quando um período de recreio foi usado para re­
conseqüências quando uma res­ forçar o cumprimento de uma tarefa escolar, as
posta ocorre; respostas são refor­ notas da criança melhoraram.
çadas, não organismos.
Como um processo, aumentar o res­ O experimento foi planejado para verificar se es­
ponder mediante a operação de trelas douradas reforçariam jogos de coopera­
reforço. ção entre alunos de Ia série.
a Uma terminologia paralela é apropriada para punição (incluindo “punidor” como um estímulo e punir como
verbo; cf. Capítulo 6), com a diferença de que uma conseqüência punitiva reduz em vez de aumentar o responder.

90 A . C h a r le s C a ta n ia
tas de bicar o disco por um pombo foram refor­ Uma solução seria reconhecer que o termo
çadas com água, mas não que o alimento refor­ reforço é descritivo, não explicativo. Ele nomeia
çou o rato ou que o pombo foi reforçado por bi­ uma relação entre o comportamento e o ambien­
car, ou que uma criança foi reforçada. A princi­ te. A relação inclui, pelo menos, três componen­
pal razão para essa restrição é ilustrada nos últi­ tes. Primeiro, as respostas devem ter conseqüên­
mos exemplos: quando se fala em reforçar orga­ cias. Segundo, sua probabilidade deve aumentar
nismos é muito fácil omitir a resposta ou o re- (isto é, as respostas devem-se tornar mais pro­
forçador, ou ambos. A restrição nos força a ex­ váveis do que quando não tinham essas conse­
plicitar o que está sendo reforçado e porquê. qüências). Terceiro, o aumento da probabilida­
Também não devemos omitir o organismo; sem­ de deve ocorrer porque a resposta tem essa con­
pre podemos dizer de quem é a resposta (p. ex., seqüência e não por outra razão qualquer. Por
o choro de uma criança). exemplo, se soubéssemos apenas que o respn-
O termo reforço também tem funcionado, fre­ der aumentou, não seria apropriado dizer que a
qüentemente, como um nome para um processo, resposta deve ter sido reforçada (poderia ter sido
o aumento no responder que se segue à opera­ eliciada). Também não seria suficiente saber que
ção de reforço. Esse emprego duplo, tanto como a resposta está, no momento, produzindo algum
operação quanto como processo, dificulta a des­ estímulo que não produzia antes. Ainda teríamos
crição do comportamento, mas vem sendo feito que saber se o responder aumentou porque o es­
há tanto tempo que é pouco provável que mude. tímulo era a sua conseqüência.
Por exemplo, a afirmação de que uma resposta Suponhamos que um pai atenda a uma crian­
foi reforçada pode ser interpretada de duas ma­ ça sempre que ela fale cochichando, mas supo­
neiras: a resposta produziu um reforçador (ope­ nhamos também que esse comportamento de sus­
ração) ou o responder aumentou porque produ­ surrar da criança seja mais provável na presença
ziu um reforçador (processo). Este texto prefere do pai do que na sua ausência. A criança sussur­
o uso de reforço como uma operação. O proces­ ra e o pai aparece, e agora o sussurrar aumenta
so pode ser tão facilmente descrito em termos em freqüência. Como podemos decidir se a cri­
de mudanças no responder (p. ex., o responder ança agora está sussurrando porque este com­
aumentou) que parece ser pouco justificável a portamento foi reforçado ou porque agora o pai
substituição da descrição direta do que acontece está presente e toma mais provável a ocorrência
com a resposta por outros termos. Contudo, o desse comportamento? Isso é ainda mais com­
uso do termo para se referir ao processo tem tan­ plicado, porque o sussurrar da criança também
tos precedentes que é impossível evitá-lo com­ pode reforçar o comportamento de atenção do
pletamente. Além disso, a superposição entre os pai. Ao trabalhar com essas interações é impor­
vocabulários de operação e processo se estende tante distinguir os efeitos reforçadores das con­
a muitos outros termos da aprendizagem (p. ex., seqüências de outros efeitos (cf. Poulson, 1984).
extinção, punição; Ferster & Skinner, 1957). Consideremos um outro exemplo menos
O vocabulário do reforço acarreta algumas agradável. Digamos que um pai agressivo mal­
dificuldades lógicas, mesmo quando restrito a trate uma criança sempre que ela chore e tente
operações. Quando uma resposta se toma mais fazer com que o choro pare, dando-lhe umas pal­
provável porque produziu um estímulo, dizemos madas. A criança chora, recebe as palmadas e
que a resposta foi reforçada e chamamos o estí­ isso faz com que o choro aumente. Nesse caso, a
mulo de reforçador. Se nos perguntam como sa­ conseqüência do comportamento de chorar é re­
bemos que o estímulo é reforçador, podemos di­ ceber palmadas, e receber palmadas produz mais
zer que a resposta foi reforçada. Logo começa­ choro; no entanto, não diríamos que as palma­
mos a nos repetir. Uma vez que definimos o re­ das reforçaram o chorar. Dois critérios para se
forçador pelos seus efeitos sobre o comportamen­ falar em reforço foram satisfeitos, mas o tercei­
to, criamos um problema de definição circular ro não. O comportamento de chorar não se tor­
se, ao mesmo tempo, definirmos o efeito pelo nou mais freqüente porque as palmadas foram
estímulo-reforçador (Meehl, 1950). uma conseqüência dele; as palmadas levariam a

A p re n d iz a g e m 91
criança a chorar, mesmo que ela não estivesse ser mais reforçadas na idade adulta. Os sistemas
chorando antes da primeira palmada. Os estímu­ educacionais, freqüentemente, programam con­
los podem ter efeitos eliciadores ou outros efei­ seqüências como elogio ou notas para resolver
tos, junto com seus efeitos reforçadores ou em problemas aritméticos ou responder questões
lugar deles. (Nestas circunstâncias infelizes, a fatuais, mas, cedo ou tarde, essas conseqüências
criança pode, eventualmente, aprender a supri­ artificiais são descontinuadas (com a esperança
mir o choro; como será visto no Capítulo 6, se­ de que outras conseqüências mais naturais man­
ria apropriado dizer que as palmadas punem o tenham as respostas quando o estudante passa
chorar.) para outras situações). Quando uma resposta é
A terminologia do reforço requer que uma reforçada, sua probabilidade aumenta. Mas esse
resposta tenha uma conseqüência, que o respon­ aumento não é permanente: o responder volta aos
der aumente e que o aumento ocorra porque o níveis anteriores, tão logo o reforço seja suspenso.
responder tem conseqüências e não por outras A operação de suspender o reforço é chama­
razões. Satisfeitas essas condições, dizemos que da de extinção; quando o responder retoma a seus
a resposta foi reforçada e que o estímulo era um níveis prévios como resultado dessa operação,
reforçador. diz-se que foi extinto. Esse retomo do compor­
Podemos supor também que o estímulo con­ tamento aos seus níveis anteriores ao reforço
tinuará a ser um reforçador eficaz no futuro e demonstra que os efeitos de reforço são tempo­
que reforçará outras respostas em outras situa­ rários. O responder é mantido apenas enquanto
ções. Porém, ambas as suposições podem ser er­ o reforço continua, e não depois que ele é sus­
radas. A eficácia dos reforçadores muda com o penso. Assim, a redução no responder durante a
tempo e qualquer conseqüência pode reforçar extinção não é um processo especial que requei­
algumas respostas, mas não outras. Por exem­ ra um tratamento separado, é uma das proprie­
plo, o dinheiro pode ser mais reforçador do que dades do reforço.
um sorriso para os serviços de um encanador ou Houve uma época em que o responder du­
de um eletricista, mas o oposto talvez seja ver­ rante a extinção era uma medida primária do re­
dadeiro em se tratando do comportamento de forço. A resistência à extinção era expressa como
abraçar a namorada. Apesar dessas restrições, os o tempo decorrido até que o responder fosse re­
reforçadores empregados em muitas situações duzido a algum nível especificado. Dois regis­
experimentais padrão (p. ex., alimento para or­ tros hipotéticos da extinção das pressões à barra
ganismos privados de alimento) provavelmente de um rato são mostrados na Figura 5.7. Em am­
serão eficazes para uma variedade de respostas; bos os registros, a taxa de respostas diminui com
o experimentador que escolhe um estímulo que o passar do tempo (aceleração negativa), mas,
reforça algumas respostas e não outras, cedo ou dependendo do critério de extinção, ambos po­
tarde terá que lidar com a diferença. O tema da dem representar maior resistência à extinção. Se
relatividade do reforço será retomado mais adian­ o critério adotado for o tempo decorrido até o
te, neste capítulo. primeiro período de dois minutos sem resposta,
então, A mostra maior resistência à extinção do
que B. A não inclui 2min sem uma resposta, mas
EXTINÇÃO um período com essa duração aparece do meio
para a frente em B. Se, por outro lado, o critério
As conseqüências de muitas respostas per­ for o total de respostas, a resistência à extinção é
manecem razoavelmente constantes durante a maior para B do que para A. A resistência à ex­
vida toda. Por exemplo, geralmente tocamos os tinção diminuiu de significado, porque sua defi­
objetos para os quais estendemos a mão e con­ nição permitia essas ambigüidades.
seguimos mudar de um andar para o outro, quan­ Mas a resistência à mudança (da qual a ex­
do subimos um lance de escadas. Mas, para ou­ tinção é um caso especial) permanece como uma
tras respostas, as conseqüências mudam. As res­ propriedade importante do comportamento (Ne-
postas reforçadas durante a infância podem não vin, 1992). Por exemplo, resolver problemas arit-

92 A . C h a r le s C a ta n ia
" EXTINÇÃO

FIGURA 5.7 Dois registros cumulativos hi­


potéticos da extinção das pressões à barra
por um rato após reforço alimentar. Pode-se
dizer que tanto A como B demonstram mai­
or resistência à extinção, dependendo de se
a extinção é medida pelo tempo transcorrido
até que se passem dois minutos sem a emis­
são de uma resposta ou pelo total de respos­
tas emitidas durante a sessão de extinção.
10 minutos 10 minutos

méticos, soletrar ou outras habilidades acadêmi­ para o reforço e a extinção, em vez de tratá-los
cas são consideradas fluentes quando forem re­ como dois aspectos do mesmo fenômeno.
forçadas e praticadas até o ponto de serem exe­ Consideremos o fenômeno da recuperação
cutadas com grande exatidão e com uma latên- espontânea. Em uma sessão típica de extinção o
cia curta (Johnson & Layng, 1992). Uma vez que responder diminui à medida que a sessão conti­
essas habilidades se tomem fluentes, é imprová­ nua. Mas a taxa no início da sessão seguinte,
vel que sejam perturbadas por mudanças no am­ geralmente, é mais alta do que era ao final da
biente ou por outras distrações. última sessão. Alguns registros cumulativos hi­
potéticos que ilustram a recuperação espontânea
são mostrados na Figura 5 .8 .0 responder no iní­
Extinção versus Inibição cio de cada sessão era descrito como tendo-se
recuperado espontaneamente da inibição acumu­
Se não ocorresse a extinção, os efeitos do lada até o final da sessão anterior; supostamen­
reforçamento seriam permanentes. Qualquer res­ te, essa inibição cresce no decorrer da sessão,
posta estabelecida por reforçamento duraria o suprimindo ativamente o responder, e dissipa-se
resto da vida do organismo. Mas, claramente, não durante o intervalo entre as sessões de extinção.
é o caso. Por exemplo, quem usa relógio, prova­ Pensava-se que fenômenos como a recupe­
velmente, vira o pulso com freqüência para olhá- ração espontânea significavam que o responder,
lo; a conseqüência de olhar é saber a hora. Mas, reduzido pela extinção, de algum modo “estava
se por alguma razão a pessoa pára de usar o re­ ali o tempo todo, mas inibido” (Reid, 1958).
lógio, eventualmente, pára de olhar o pulso; ver Explicações variadas sobre a extinção foram for­
o pulso apenas não é um reforçador eficaz. muladas através desses processos inferidos,
A história do conceito de extinção, no entan­ como a inibição, a frustração, a interferência ou
to, não foi tão simples. Por muito tempo perdu­ a fadiga (Kimble, 1961). Essas explicações di­
rou a suposição de que a extinção suprimia ati­ feriam apenas na maneira de caracterizar os even­
vamente o responder. Afirmava-se que a extin­ tos que geravam a inibição. Contudo, essas con­
ção tinha efeitos inibitórios, ao contrário dos efei­ cepções explicavam a extinção em termos de
tos excitatórios supostos para o reforço. Esse tra­ eventos ou processos fictícos. Quando se afir­
tamento dado à extinção teve origem na lingua­ mava que uma resposta tinha sido inibida du­
gem que havia sido aplicada aos dados dos ex­ rante a extinção, ela podia ser medida, mas não
perimentos de condicionamento de Pavlov (cf. o que estivesse produzindo a inibição.
Capítulo 12; ver também, Skinner, 1938, pp. 96­ Não era necessário pressupor a existência de
102). Uma vez estendida às conseqüências, essa processos supressivos na extinção. Por exemplo,
linguagem foi mantida, porque parecia consis­ os efeitos de condições pré-sessão, como o ma­
tente com outros efeitos que, geralmente, acom­ nejo do sujeito, podem fazer com que o início da
panham a extinção. Assim, os textos de aprendi­ sessão seja diferente de períodos subseqüentes.
zagem tendiam a devotar capítulos separados Se isso é verdadeiro, os efeitos da extinção mais

A p re n d iz a g e m 93
RECUPERAÇÃO ESPONTÂNEA EM EXTINÇÃO

FIGURA 5.8 Registros cumulativos hipotéticos da recuperação espontânea de pressões à barra por um rato pre­
viamente reforçado com alimento, em sessões sucessivas de extinção. A taxa de respostas no início da sessão 2 é
maior do que era no final da sessão 1; da mesma forma, a taxa no iníco da sessão 3 é maior do que no final da
sessão 2.

no final da sessão podem não se transferir para o Contingências Resposta-Reforçador e


início da sessão seguinte. Baseado nisso, Ken­ Apresentações do Reforçador
dall (1965) raciocinou que os padrões usuais ob­
servados nas taxas de resposta nas sessões de A controvérsia sobre a natureza da extinção
extinção poderiam ser revertidos sob condições pode decorrer do fato de que descontinuar o re­
apropriadas. De início, ele reforçou as respostas forço tem não um, mas dois efeitos: (1) elimina
de bicar o disco, em três pombos, durante ses­ a contingência entre as respostas e os reforçado-
sões de uma hora. Em seguida, programou ses­ res, de modo que (2) os reforçadores não mais
sões de extinção de um minuto de duração. So­ ocorrem. Nesse contexto, o termo contingência
mente depois que o responder tinha sido confia- simplesmente descreve as conseqüências do res­
velmente reduzido a zero, nessas sessões curtas, ponder; aqui ele indica o efeito de uma resposta
é que ele introduziu a primeira sessão de extin­ sobre a probabilidade de um estímulo. Por exem­
ção de longa duração. Em poucos minutos, cada plo, se um rato recebe grãos de alimento apenas
pombo recomeçou a responder. Até essa sessão, quando pressiona a barra e, se cada pressão pro­
o responder nunca havia sido extinto até perío­ duz uma pelota de alimento, a pressão à barra
dos mais longos do que o primeiro minuto da aumenta a probabilidade de apresentações de
sessão; quando a oportunidade, finalmente, apre­ comida de 0 para 1,0; mas, em uma contingên­
sentou-se, o responder ocorreu nesses períodos cia em que as pressões à barra nada fazem, a pro­
posteriores ao minuto inicial. Em certo sentido, babilidade da comida é independente dessas pres­
Kendall havia demonstrado a recuperação espon­ sões. (A rigor, uma contingência resposta-estí-
tânea durante a sessão, e não no seu início. mulo sempre é parte de uma contingência de três
Outro exemplo da recuperação do responder termos, mas essa questão não será tratada neste
extinto tem sido chamado de regressão ou res­ momento; cf. Capítulo 8.)
surgimento (Epstein & Skinner, 1980; Keller & As contingências expressas como relações de
Shoenfeld, 1950, pp. 81-82). Suponhamos que a probabilidade entre as respostas e suas conse­
resposta de um rato de puxar uma argola seja qüências podem ser representadas, graficamen­
extinta e que a resposta de pressionar a barra seja te, da mesma forma que as relações entre os es­
reforçada. Se mais tarde for extinta a resposta tímulos e as respostas que eles eliciam (Figura
de pressão à barra, a resposta anteriormente ex­ 4.2). O sistema de coordenadas é ilustrado na
tinta de puxar a argola, provavelmente, reapare­ Figura 5.9. O eixo y mostra a probabilidade de
cerá. Fazendo uma analogia com a terminologia um estímulo, dada uma resposta oup(S/R); o eixo
clínica, o fenômeno sugere que houve a regres­ x mostra a probabilidade de um estímulo, dada a
são de um comportamento atual (pressionar a ausência de resposta ou p(S/nãoR). Em relação
barra) para um comportamento antigo que já fora à Figura 4.2, os termos S e R foram invertidos.
efetivo (puxar a argola). Aquela figura mostrava os efeitos dos estímulos

94 A . C h a r le s C a ta n ia
mento. A cada 10 ou 15 segundos, o rato pres­
siona a barra e come a pelota apresentada. Se a
resposta de pressão à barra for, então, colocada
em extinção, as pressões não produzirão as pe­
lotas, e o rato não come mais. Esse rato agora é
diferente sob dois aspectos: (1) suas pressões à
barra não têm mais as conseqüências anteriores
e (2) ele não come mais.
Eis um procedimento alternativo. O rato per­
manece privado de alimento, mas quando descon­
tinuamos o reforço das pressões à barra, começa­
mos a apresentar pelotas automaticamente a cada
p(S/naoR) - Probabilidade do Estímulo
10 ou 15 segundos. Nesse caso, alteramos as con­
Dada uma Não-Resposta tingências como no exemplo anterior: as pressões
à barra que, antes, produziam alimento, não têm
FIGURA 5.9 Contingências resposta-estímulo represen­
tadas em termos da probabilidade do estímulo, dada mais efeito. Mas, embora a comida não seja mais
uma resposta, p(S/R), e probabilidade do estímulo na uma conseqüência das pressões à barra, este rato
ausência de resposta, p(S/nãoR). O gráfico inclui a pro­ continua a obter comida a cada 10 ou 15 segun­
dução confiável de estímulos por respostas (A), estímu­ dos. Ambos os ratos, o do procedimento anterior e
los independentes de resposta (B), extinção (C), pre­
este, pressionarão a barra menos freqüentemente,
venção dos estímulos pelas respostas, como em esquiva
(D; ver Capítulo 6), e produção intermitente de estímu­ mas apenas um deles ainda poderá comer.
los, como nos esquemas de reforço (E; ver Capítulo 10). O procedimento padrão de extinção suspen­
Cf. Figura 4.2. de a contingência e as apresentações do estímu­
lo. O último exemplo mostra, contudo, que a con­
tingência pode ser descontinuada enquanto as
sobre as respostas; a Figura 5.9 mostra os efei­ apresentações do estímulo continuam. Em am­
tos das respostas sobre os estímulos. bos os casos, o responder que tinha sido reforça­
Em A, a probabilidade do estímulo é alta dada do diminui. Mas descontinuar a apresentação de
uma resposta, e baixa na ausência de resposta, reforçadores, o que ocorre apenas no primeiro
como quando as pressões à barra por um rato procedimento, afeta uma faixa de respostas, mais
produzem alimento. Em B, a probabilidade do do que apenas a resposta reforçada. Se a comida
estímulo é independente das respostas, por exem­ é subitamente retirada de um rato privado de ali­
plo, quando o alimento é apresentado indepen­ mento que vinha comendo, por exemplo, ele se
dentemente de pressões à barra. Em C, a proba­ toma mais ativo e pode ser que urine ou defe­
bilidade do estímulo é zero, quer uma resposta que. Se as pelotas eram produzidas por pressões
tenha ou não ocorrido, como quando o alimento à barra, o rato pode morder a barra (Mowrer &
é suspenso durante a extinção. Mais tarde va­ Jones, 1943). Se há outros organismos presen­
mos considerar outros tipos de contingências em tes na câmara, o rato pode atacá-los (Azrin, Hu­
outros contextos. Por exemplo, os casos em que as tchinson, & Hake, 1966). E a oportunidade de
respostas reduzem a probabilidade de um estímu­ se engajar em tais respostas agressivas pode re­
lo, como em D, ilustram a esquiva (Capítulo 6), e forçar outras respostas (p. ex., o organismo pode
os casos em que as respostas produzem um estí­ puxar uma corrente se esta resposta coloca ao
mulo com uma probabilidade menor que 1,0, como seu alcance alguma coisa em que possa cravar
em E, ilustram esquemas de reforço (Capítulo 10). os dentes: Azrin, Hutchinson, & McLaughlin,
Comparemos, agora, os procedimentos quan­ 1965). Esses efeitos, embora observados na ex­
to às mudanças nas contingências e às mudan­ tinção, não são o resultado da suspensão da con­
ças nos estímulos. Consideremos, em primeiro tingência de reforço. Eles ocorrem quando as pe­
lugar, um rato privado de alimento, cujas pres­ lotas apresentadas, independentemente da res­
sões à barra são reforçadas com pelotas de ali­ posta, deixam de ser apresentadas, tanto quanto

A p re n d iz a g e m 95
durante o procedimento de extinção. Em ambos tervalos curtos de tempo (p. ex., a cada 10 ou 15
os casos, um rato que vinha sendo alimentado, segundos). As respostas que ocorriam imediata­
deixa de receber comida. Na extinção, esses efei­ mente antes da apresentação de alimento tendiam
tos colaterais são superpostos ao decréscimo no a ser repetidas e, portanto, a ser seguidas de perto
responder previamente reforçado, porque a sus­ por mais apresentações de alimento. O efeito da
pensão de reforçadores é, necessariamente, uma sucessão acidental de respostas de reforçadores
parte da extinção.
Tais observações têm considerável significa­ geralmente é óbvio. Acontece de o pássaro estar
do prático. Em experimentos com crianças, por executando alguma resposta quando o comedouro
aparece; como resultado ele tende a repetir essa res­
exemplo, algumas vezes são usados reforçado­ posta. Se o intervalo antes da próxima apresentação
res, independentes da resposta, em vez de extin­ não for tão grande a ponto de ocorrer extinção,...
ção, para evitar os efeitos colaterais da interrup­ [isto] fortalece ainda mais a resposta... O pombo se
ção da apresentação de reforçadores (p. ex., ver comporta como se houvesse uma relação causal en­
Hart e col., 1968, sobre o reforçamento social tre seu comportamento e a apresentação de alimen­
to, embora tal relação não exista. (Skinner, 1948,
do brincar cooperativo em uma criança). As ope­ pp. 168-171)
rações comportamentais têm, em geral, mais de
um efeito. Um estímulo que reforça uma respos­ Skinner notou que à medida que o procedi­
ta pode eliciar outras respostas e servir como es­ mento continuava, a topografia ou a forma do
tímulo discriminativo para outras. Os fenôme­ pombo responder geralmente mudava de modo
nos considerados indicadores de que a extinção gradual, como as relações acidentais desenvol­
seria mais do que um simples efeito temporário vidas entre o responder e as apresentações de
do reforço eram, provavelmente, apenas efeitos alimento. Skinner se referia a essas mudanças
colaterais. Muitos desses fenômenos, como o res­ como deslocamento topográfico. Um pombo res­
ponder agressivo, gerado pela suspensão de apre­ pondia temporariamente como se suas respostas
sentações do reforçador, poderiam ter sido ob­ estivessem produzindo alimento, como uma con­
servados em situações que não envolviam as con­ seqüência, mas nenhuma resposta particular per­
seqüências do responder. manecia consistentemente como um comporta­
mento supersticioso. Ao longo de períodos de
observação mais extensos com este procedimen­
Extinção e Superstição to, Staddon e Simmelhag (1971) observaram que
o bicar, geralmente, predominava como a res­
Como acabamos de ver, os efeitos gerais de posta que precedia imediatamente as apresenta­
suspender as apresentações do reforçador na ex­ ções de alimento (cf. Capítulo 4, sobre as contri­
tinção são superpostos aos efeitos mais especí­ buições da eliciação).
ficos de suspender as contingências. Por que, en­ O responder supersticioso, gerado por uma
tão, a extinção foi, por tanto tempo, a principal sucessão acidental de respostas e reforçadores,
base para o estudo dos efeitos de suspender as é um problema recorrente na análise do compor­
contingências? E mais conveniente desligar a tamento, porque tais seqüências acidentais po­
barra do equipamento que opera o comedouro dem ocorrer, quer os reforçadores sejam inde­
do que desconectar a barra e, ao mesmo tempo, pendentes de respostas, quer eles sejam conse­
substituí-la por um relógio que opera o come­ qüência delas. Se uma resposta é seguida por uma
douro periodicamente, mas é pouco provável que resposta diferente, que é reforçada, o reforçador
a resposta resida em uma mera mudança no equi­ pode afetar a ambas, embora sua apresentação
pamento. E mais provável que os procedimen­ dependa apenas da segunda resposta (Catania,
tos tenham sido determinados por algumas ou­ 1971; Kazdin, 1977). Mesmo quando as respos­
tras propriedades do comportamento. tas têm conseqüências, propriedades da respos­
Em um fenômeno chamado de superstição ta não relacionadas com o reforço podem se tor­
(Skinner, 1948), a comida era repetidamente apre­ nar estereotipadas se acompanharem consisten­
sentada a um pombo privado de alimento, em in­ temente as respostas reforçadas. Por exemplo,

96 A. C h a r le s C a ta n ia
os gestos do jogador de boliche, após lançar a bola, portamento autolesivo. Dar-lhe atenção, indepen­
podem persistir por causa da relação íntima entre dentemente de seus comportamentos autolesivos,
as respostas prévias e o impacto da bola (Herms­ é uma alternativa possível, mas como vimos, tal
tein, 1966). Além disso, se as contingências de procedimento pode reduzir o comportamento in­
reforço mudam de forma que as características do desejável de forma muito lenta. Um procedimen­
responder, que em um momento eram relevantes, to melhor seria empregar a atenção para refor­
tomam-se irrelevantes e se essas antigas caracte­ çar uma resposta alternativa e, especialmente,
rísticas não são incompatíveis com as característi­ uma que fosse incompatível com o comporta­
cas relevantes atuais, elas podem persistir, simples­ mento autolesivo (Repp & Deitz, 1974). O com­
mente porque continuam a ser seguidas por refor- portamento autolesivo inevitavelmente diminui­
çadores (Stokes & Balsam, 1991). Outra dificul­ rá, à medida que a resposta alternativa aumentar
dade é que a superstição é muito facilmente invo­ em freqüência. Esses procedimentos, referidos
cada para explicar comportamentos para os quais como reforço diferencial de outro comportamen­
não existem outras explicações disponíveis (Gu­ to, têm sido amplamente aplicados a problemas
thrie & Horton, 1946; Moore & Stuttard, 1979). de comportamento (p. ex., ver Skiba, Pettigrew
Podemos agora reconsiderar o que acontece & Alden, 1971, sobre o comportamento de chu­
quando uma contingência de reforço é suspen­ par o dedo). Um modo de reduzir o mau com­
sa, enquanto as apresentações do reforçador con­ portamento de uma criança é reforçar o seu bom
tinuam. Em primeiro lugar, as pressões à barra comportamento. Esta é uma razão pela qual o
por um rato são reforçadas com alimento; em ditado “Surpreenda a criança quando ela estiver
seguida, as pressões já não mais produzem ali­ agindo bem” é tão eficiente, tanto para pais,
mento, mas as apresentações de pelotas conti­ quanto para professores.
nuam independentemente do comportamento.
As pressões à barra continuam por algum tem­
po e tendem ainda a ser seguidas de perto pelo
alimento. A ação de pressionar a barra sofre um Seção B Os Reforçadores como
declínio lento porque a sucessão acidental de Oportunidades para o
respostas e reforçadores se contrapõe aos efeitos Comportamento
da suspensão da contingência de reforço. Final­
mente, a pressão à barra é substituída por outras Os reforçadores são, inevitavelmente, super-
respostas, mas seria difícil dizer que esse decrés­ simplificados quando são tratados meramente
cimo é simples. Por essa razão, programar uma como estímulos. A apresentação de qualquer re­
transição de uma contingência de reforço para as forçador envolve a transição de uma situação
apresentações do reforçador independentemente da para outra (cf. Baum, 1973). Por enquanto, te­
resposta pode ser uma estratégia pobre para exa­ mos identificado os reforçadores apenas pelos
minar os efeitos da suspensão da contingência de seus efeitos. Sem tomar o estímulo uma conse­
reforço (Boakes, 1973; Catania& Keller, 1981). qüência do responder, não podemos dizer se ele
Uma vez mais, existem aqui implicações prá­ será efetivo como um reforçador. Mesmo os re­
ticas. Imaginemos um garoto institucionalizado, forçadores evidentes, como a comida, podem va­
com um atraso de desenvolvimento, e que fre­ riar em eficácia, dependendo da privação. A apre­
qüentemente se engaja em comportamentos sentação da comida como uma conseqüência para
autolesivos, tais como bater na cabeça ou enfiar pressionar a barra pode não alterar a taxa dessa
o dedo nos olhos. Imaginemos também que des­ resposta se o rato já tem comida disponível o
cobrimos que esses comportamentos estão sen­ tempo todo. Veremos que uma propriedade im­
do mantidos, em grande parte, pela atenção dos portante de uma situação de reforço é o respon­
atendentes da instituição, que funciona como um der para o qual ela estabelece a ocasião.
reforçador. Um procedimento de extinção não é O Capítulo 2 introduziu o conceito de opera­
recomendado, por causa dos danos que o garoto ções estabelecedoras, procedimentos que tomam
pode causar a si mesmo, se ignorarmos seu com­ os eventos mais ou menos efetivos como refor-

A p re n d iz a g e m 97
çadores. O Capítulo 4 discutiu alguns dos efei­ comportamentos, como operar um interruptor, por
tos das operações estabelecedoras com exemplos exemplo; por outro lado, quando se proporciona­
de motivação ou impulso. Podemos agora defi­ va música ou aprovação social às crianças, até a
nir esses termos de forma mais precisa. Quando saciação, a efetividade desses eventos como re­
estudamos a motivação, estamos interessados no forçadores diminuía (Vollmer & Iwata, 1991).
que torna as conseqüências mais ou menos efe­ Os reforçadores também têm sido distingui­
tivas como reforçadoras ou punitivas. Na taxo- dos com base em sua relação com as respostas.
nomia das operações estabelecedoras, a priva­ Um reforçador intrínseco (também chamado de
ção e a saciação são formas importantes, mas não reforçador automático) é o que tem uma relação
as únicas, de mudar a efetividade de um estímu­ natural com as respostas que o produzem (por
lo como reforçador ou punidor. Nesse contexto, exemplo, quando um músico toca pela música
podemos agora examinar uma variedade de even­ que produz). Um reforçador extrínseco (também
tos que podem funcionar como reforçadores. chamado de reforçador arbitrário) tem uma re­
Algumas distinções entre os reforçadores, às lação arbitrária com as respostas que o produ­
vezes, são feitas com base nos tipos de opera­ zem (por exemplo, quando um músico toca por
ções que os estabeleceram como reforçadores. dinheiro). O termo extrínseco também tem sido
Por exemplo, um reforçador condicionado é aplicado a estímulos que supostamente fun­
aquele que se toma efetivo em virtude de sua cionam como reforçadores, porque sua fun­
relação com algum outro reforçador (p. ex., a ção foi ensinada (por exemplo, quando se en­
luz que aparece quando o comedouro é operado, sina a uma criança que é importante tirar boas
em uma caixa de pombo, pode, eventualmente, notas na escola). A despeito de seu rótulo, tais
tornar-se um reforçador condicionado devido à estímulos freqüentemente são ineficazes como
sua relação com a apresentação de comida). A reforçadores.
operação estabelecedora programa aqui a rela­ Discutimos as funções eliciadoras, discrimi­
ção entre os estímulos (i.e., liga o comedouro de nativas e reforçadoras dos estímulos. A apresen­
tal modo que as apresentações de comida são tação de estímulos pode ter, também, funções es­
acompanhadas pela luz). No comportamento hu­ tabelecedoras (cf. Michael, 1982). Consideremos
mano, o dinheiro freqüentemente funciona como dois exemplos: provar uma sopa sem sal não au­
um reforçador condicionado e, por causa de sua menta a probabilidade de que o sal seja passado
relação com muitos outros possíveis reforçado­ quando você pedir por ele, e chegar em frente a
res (todas as coisas que se podem comprar com uma porta trancada não aumenta a probabililda-
dinheiro), ele é muitas vezes chamado de refor­ de de que você encontre a chave em seu bolso.
çador condicionado generalizado. Um reforça­ No entanto, essas situações possivelmente au­
dor que não depende de qualquer relação com mentarão a probabilidade de que você peça o sal
outros reforçadores é chamado de reforçador in- ou que coloque a mão no bolso. Nesses casos,
condicionado. alguma coisa que era neutra (o sal ou a chave)
Muitos eventos considerados reforçadores tornou-se reforçadora. (Tais efeitos têm sido cha­
incondicionados tem, claramente, uma importân­ mados, algumas vezes, de funções de incentivo;
cia biológica (p. ex., alimento, água, contato se­ o termo incentivo, no entanto, tem sido aplicado
xual; cf. Richter, 1927). Mas os reforçadores não tanto para a função estabelecedora quanto para
estão limitados a eventos de importância bioló­ a função discriminativa dos estímulos; p. ex.,
gica óbvia. Por exemplo, os estímulos sensori- Bolles, 1975; Logan, 1960).
ais como as luzes pisca-pisca podem ser refor­
çadores poderosos para o comportamento de cri­
anças autistas (Ferrari & Harris, 1981). E quan­ RELATIVIDADE DO REFORÇO
do crianças com atrasos de desenvolvimento fo­
ram privadas de música ou de aprovação social, Existe uma grande variedade de reforçado­
por um curto período de tempo, esses eventos tor­ res. Alguns são consumidos. Outros não. Alguns
naram-se reforçadores mais efetivos para outros parecem eficazes na primeira experiência que o

98 A . C h a r le s C a ta n ia
organismo tem com eles. Outros adquirem suas a restrição física, que impedia que a criança se
propriedades reforçadoras durante a vida do or­ batesse ou se mordesse, podia reforçar respostas
ganismo. Nenhuma propriedade física comum arbitrárias, como colocar bolinhas de gude den­
permite identificar os reforçadores independen­ tro de uma caixa (Favell, McGimsey, & Jones,
temente de seus efeitos sobre o comportamen­ 1978). Uma vez que um reforçador como este
to. Por exemplo, é difícil dizer que aspecto da seja identificado, ele pode ser empregado para
atenção do professor reforça o comportamento reforçar os comportamentos que são incompatí­
do aluno, mas sabemos que quando um profes­ veis com os comportamentos autolesivos.
sor se dirige a um aluno do primeiro grau com As risadas de uma audiência parecem ser uma
um tapinha nas costas ou com um comentário conseqüência reforçadora para o comportamen­
encorajador contingente ao seu comportamento to de contar piadas. Imagine que um professor
de ler, o comportamento de estudar do aluno conte algumas piadas, a classe ri e, como resul­
aumenta, enquanto outros comportamentos tado, o professor conta piadas mais freqüente­
não relacionados com o estudo, como vadiar mente. Podemos dizer que as risadas reforçaram
por exemplo, diminuem (Hall, Lund, & Jack­ o contar piadas, mas com base apenas nessa evi­
son, 1968). Sabemos também que mudanças dência não podemos dizer que o riso, em geral,
no comportamento do aluno podem reforçar seja um reforçador. Imagine agora que o profes­
o comportamento do professor (Sherman & sor faça trocadilho (tentando “pegar” os alunos),
Cormier. 1974). a classe ri do professor (não cai na armadilha) e,
É tentador identificar os reforçadores com como resultado, o professor faz trocadilhos me­
eventos que, coloquialmente, são chamados de nos freqüentemente. As risadas não reforçaram
recompensas, mas isso seria um erro. Os refor­ o comportamento de fazer trocadilhos (na ver­
çadores não funcionam porque fazem o organis­ dade, deveríamos dizer que elas puniram tal com­
mo “sentir-se bem” ou porque o organismo “gos­ portamento: Capítulo 6). Se o riso reforçou
ta deles”. Nossa linguagem cotidiana não captu­ ou puniu, depende de se ele foi contingente ao
ra as propriedades essenciais dos reforçadores. contar piadas ou ao fazer trocadilhos. De fato, o
Por exemplo, em um estudo sobre quais reforça­ comportamento de fazer trocadilhos provavel­
dores poderiam ser efetivos no controle do com­ mente é mais reforçado por protestos dos alunos
portamento de pessoas com retardo mental pro­ (quando eles caem na armadilha do professor)
fundo, as predições baseadas na opinião dos fun­ do que por risos. Imagine que o professor faça
cionários sobre o que funcionaria para cada in­ um trocadilho, os alunos reclamem (porque são
divíduo foram inconsistentes com os reforçado­ “pegos”) e, como resultado, o professor tenta
res identificados por meio de uma avaliação sis­ “pegar” os alunos com maior freqüência. Agora
temática das preferências individuais dos sujei­ podemos dizer que os protestos dos alunos re­
tos (Green e col., 1988; cf. Fischer e col., 1992). forçaram o comportamento de fazer trocadilhos.
Alguns eventos que, superficialmente, pare­ Dependendo de se as conseqüências são risa­
cem “recompensadores” podem não funcionar das ou protestos, o comportamento de fazer
como reforçadores; outros, que parecem o opos­ trocadilhos é reforçado ou punido. (De fato,
to, podem ter poderosos efeitos reforçadores. Por as risadas contingentes aos trocadilhos podem
exemplo, seria difícil imaginar que despencar de ser ruins o bastante para fazerem um homem
um lugar elevado ou ser violentamente torcido e chorar). A efetividade de um reforçador de­
sacudido possa ser reforçador. Mas certamente, pende da sua relação com as respostas que o
esses eventos contribuem para os efeitos refor­ produzem.
çadores da “montanha russa” e de outras para­ Quando um rato produz alimento por meio
fernálias dos parques de diversão. Parece pouco de pressões à barra, o alimento dá ao rato a opor­
provável, também, que a restrição física funcio­ tunidade de comer. Se o alimento e a barra ficam
ne como reforçador, mas uma análise dos com­ simultaneamente à disposição do rato, é mais
portamentos autolesivos de três crianças com se­ provável que o rato coma do que pressione a
veros atrasos de desenvolvimento mostrou que barra. Agora, consideremos a hipótese de que a

A p re n d iz a g e m 99
probabilidade de uma resposta aumente se ela provável que correr, mas correr reforçou o be­
criar uma oportunidade para o organismo se en­ ber quando as probabilidades foram invertidas.
gajar em uma outra resposta mais provável que De acordo com essa concepção, os reforçadores
ela próprias (Premack, 1959, 1971). Em outras são relativos e suas propriedades importantes são
palavras, se a resposta A é mais provável do que baseadas nas respostas às quais eles criam opor­
a resposta B, a oportunidade de se engajar na tunidade de ocorrência.
resposta A pode ser usada para reforçar a res­ Essa relatividade foi ignorada durante muito
posta B. Se isso for verdadeiro, o alimento é um tempo. A maioria dos experimentos sobre apren­
reforçador eficiente para as pressões à barra por dizagem havia se limitado a respostas de proba­
um rato privado de alimento simplesmente por­ bilidades relativamente baixas (p. ex., pressio­
que comer é geralmente mais provável do que nar a barra, com ratos) e a reforçadores que oca­
pressionar a barra. sionavam respostas altamente prováveis (p. ex.,
Consideremos um experimento que inverteu alimento e comer). Esses casos eram comuns e
os efeitos de dois estímulos, manipulando as pro­ convenientes, mas não passavam de casos espe­
babilidades das respostas ocasionadas por eles ciais. Poucos pensaram em perguntar, por exem­
(Premack, 1962). As respostas de correr em uma plo, se seria possível programar situações em que
roda de atividade foram controladas, travando- as oportunidades de pressionar uma barra ou de
se ou soltando o freio da roda. A ingestão de bicar um disco poderiam ser empregadas para
água foi controlada pela introdução e retirada de reforçar o comer (p. ex., Sawisch & Denny,
um tubo de água, por um orifício em uma parede 1973). A questão não é tão forçada. A oportuni­
fixa em um dos lados da roda. O comportamen­ dade de fazer uma boa refeição pode ser um re­
to de ingerir água foi registrado por meio de um forçador eficaz, mas veja com que freqüência as
dispositivo elétrico chamado drinkômetro, que crianças são persuadidas a terminar de almoçar,
registrava as lambidas. De acordo com testes em quando outras atividades dependem disso. O
períodos curtos, quando ambas as respostas fi­ comer pode ser reforçador, por exemplo, quan­
cavam disponíveis, correr tornou-se mais pro­ do uma criança só ganha a sobremesa quando
vável do que beber depois que a roda era trava­ termina o dever de casa, mas pode ser reforçado
da, enquanto a água permanecia disponível, mas se a criança puder assistir televisão quando ter­
beber tornou-se mais provável do que correr de­ minar de comer.
pois que o tubo de água era removido, enquanto A relatividade do reforço pode ser melhor
a roda continuava disponível. Em cada caso, a ilustrada expandindo-se o experimento anterior
oportunidade de engajar-se na resposta mais pro­ para três respostas. Vamos acrescentar um co­
vável reforçava a resposta menos provável. medouro à roda de atividade e ao tubo de água.
Quando correr era mais provável que beber (após Restringindo a acesso a eles de modo apropria­
a restrição de acesso à roda de atividade), as lam­ do, podemos tomar o comer mais provável do
bidas tomavam-se mais prováveis, caso se sol­ que o correr na roda e este mais provável do que
tasse a trava do freio e se permitisse o rato o beber. Descobrimos, então, que correr pode ser
correr, do que se não lhe fosse dada a oportu­ reforçado pela oportunidade de comer, mas a
nidade de correr. Inversamente, quando beber oportunidade de correr na roda pode reforçar o
era mais provável que correr (após restrição beber; correr pode, simultaneamente, tanto re­
de acesso ao tubo de água), correr se tornava forçar como ser reforçado. Essas relações são
mais provável quando isso dava acesso ao ilustradas à esquerda na Figura 5.10. Se utiliza­
tubo, permitindo que o rato bebesse, mesmo mos a privação de água, tornando o beber a res­
quando não tivesse efeito algum sobre a opor­ posta mais provável, as relações de reforço se
tunidade de beber. alteram, como ilustrado à direita, na Figura 5.10.
Isso demonstra que os reforçadores não po­ Em outras palavras, ao alterar as probabilidades
dem ser definidos independentemente das res­ relativas dessas três respostas, podemos trans­
postas que reforçam. No experimento de Prema­ formar a oportunidade de se engajar em qual­
ck, beber reforçou o correr quando beber era mais quer uma delas em um reforçador eficaz com

100 A . C h a r le s C a ta n ia
COMER BEBER
comer pode beber pode
reforçar o » reforçar o
comer

comer pode beber pode


CORRER ►reforçar o COMER ► reforçar o
beber correr
correr pode comer pode
reforçar o reforçar o
beber correr

BEBER CORRER

FIGURA 5.10 Relações de reforço dadas diferentes probabilidades de respostas em uma hierarquia de comporta­
mento. Quando comer é a resposta mais provável e beber a menos provável (à esquerda), a oportunidade de comer
pode reforçar o correr ou o beber, mas a oportunidade de correr pode reforçar apenas o beber. Em um outro
momento (à direita), quando beber é a resposta mais provável e correr é a menos provável (p. ex., depois de um
período de privação de água), comer ainda pode reforçar o correr, mas tanto comer como correr podem agora ser
reforçados pela oportunidade de beber.

respeito a uma das outras duas respostas ou a veis (cada uma substitui a outra como um refor­
ambas. As probabilidades relativas com que di­ çador), mas comer e beber não são.
ferentes crianças preferem colorir livros, brin­ Introduzimos os reforçadores como tipos de
car com blocos de madeira ou brincar no parqui- estímulos, mas agora estamos falando deles em
nho podem ser informações úteis para alguém termos de respostas. O tratamento mudou por­
que tenha que controlar o comportamento de que descobrimos que uma propriedade impor­
crianças em creches ou nos primeiros anos do tante de um reforçador é o responder que ele
primeiro grau (p. ex., Wasik, 1970). ocasiona. Como o reflexo, o reforço é uma rela­
A privação toma os reforçadores mais efeti­ ção, e não uma teoria ou uma hipótese. Essa re­
vos, porque a probabilidade de uma resposta em lação inclui o responder, suas conseqüências e a
geral aumenta quando a oportunidade de se en­ mudança no comportamento que se segue.
gajar nela fica restrita (p. ex., Timberlake, 1980).
Mas a operação pormenorizada do princípio de
Premack tem gerado controvérsias, especialmen­ AQUISIÇÃO DO
te porque essa operação depende de como as pro­ COMPORTAMENTO
babilidades são calculadas. A escolha entre res­
postas simultaneamente disponíveis pode ser Retomemos agora à aprendizagem, exami­
uma medida mais satisfatória do que a propor­ nando como um organismo pode adquirir res­
ção do tempo gasto para cada uma das respostas postas por meio de reforço. O registro A, da fi­
(p. ex., Dunham, 1977; Eisenberg, Karpman, & gura 5.11 mostra um registro cumulativo hipo­
Trattner, 1967). Uma complicação adicional é tético da primeira sessão em que as pressões à
que algumas respostas têm maiores possibilida­ barra por um rato foram reforçadas. As primei­
des do que outras de se substituírem umas às ras respostas são separadas umas das outras por
outras (Bemstein & Ebbesen, 1978; Rachlin & pausas longas. Depois de pouco mais de 5 mi­
Burkhard, 1978). Por exemplo, a privação da nutos, as pausas longas desaparecem e então o
oportunidade de comer um alimento pode não responder aumenta pelo resto da sessão. A aqui­
tomar o comer esse alimento um reforçador efi­ sição da pressão à barra parece gradual. Se qui­
ciente se outro alimento estiver disponível, mas séssemos repetir essas observações, poderíamos
pode fazer isso se, em vez do segundo alimento, extinguir as pressões até que as respostas vol­
houver água disponível. Nesse caso, comer um tassem aos níveis prévios e, então, conduzir uma
alimento e comer outro são respostas permutá­ nova sessão de reforço. O registro B, da Figura

A p r e n d iz a g e m 101
AQUISIÇÃO E REAQUISIÇÃO

FIGURA 5.11 Registros cumulativos hipo­


téticos da aquisição inicial do comportamen­
to de um rato de pressionar a barra durante
a primeira sessão em que cada resposta é
reforçada com alimento (A) e na reaquisi­
ção do comportamento, quando o reforço é
novamente introduzido após um período de
extinção (B).
10 minutos

5.11 mostra como poderia ser o desempenho. No sessões: “Quando o reforço foi novamente in­
início da sessão, devido à extinção prévia, não troduzido..., o animal não teve que reaprender
ocorre nenhuma resposta. Quando finalmente toda a seqüência, porque a seqüência inteira não
uma resposta ocorre e é reforçada, o responder havia sido extinta” (Sidman, 1960, p. 103).
imediatamente aumenta a uma taxa aproxima­ O reforço, então, não produz aprendizagem;
damente igual à do final da primeira sessão de produz comportamento. Ao observar se o rato
reforço. Desta vez, observamos uma aquisição pressiona a barra quando a contingência de re­
abrupta e não gradual da resposta de pressionar forço está em operação e não na sua ausência,
a barra. Como reconciliar esses dois desempe­ estamos simplesmente interessados em até que
nhos tão diferentes? ponto o rato aprendeu as conseqüências de sua
Sidman (1960) discutiu uma alternativa à ar­ ação de pressionar a barra. As conseqüências do
gumentação de que a aprendizagem inicial teria responder são críticas para a aprendizagem não
produzido uma mudança irreversível: porque a aprendizagem ocorra a partir delas, mas
porque elas são o que é aprendido. Certas con­
O animal aprendeu não apenas as respostas que fo­ tingências envolvem o modo pelo qual o ambi­
ram bem-sucedidas em deslocar a barra, mas tam­
bém a se dirigir à bandeja, pegar a pequena pelota,
ente é afetado pelo comportamento, sendo, por­
levá-la à sua boca, etc. E essas respostas foram apren­ tanto, características importantes do ambiente a
didas na seqüência correta, porque o reforço das serem aprendidas pelos organismos.
mesmas estava correlacionado com os estímulos
apropriados, tanto do ambiente como do comporta­
mento anterior. O ato de aproximar-se da bandeja,
por exemplo, podia ser reforçado somente depois Aprendizagem Latente
do som do comedouro; o de pegar a pelota somente
podia ser reforçado depois que a mesma tivesse ca­
ído na bandeja, etc... O que extinguimos quando des­
As questões precedentes estavam implícitas em
ligamos o mecanismo do comedouro?... Já não há o uma controvéria baseada em um fenômeno deno­
som do comedouro, nem o ruído da pelota, nem a minado aprendizagem latente (Thistlethwaite,
visão da pelota, nem a sensação táctil da pelota, etc. 1951). Consideremos o experimento ilustrado
Aproximar-se da bandeja ainda é possível, mas so­ na Figura 5.12 (Tolman & Honzik, 1930; Tol-
mente na ausência de alguns de seus estímulos con­
troladores. As respostas envolvidas no pegar e in­
man, 1948). Ratos privados de alimento, dis­
gerir a pelota não podem mais ocorrer no contexto tribuídos em três grupos, tinham que atraves­
original de sua aprendizagem. Enquanto nosso pro­ sar um labirinto. Os ratos de um dos grupos
cedimento de extinção pode ter reduzido a resposta encontravam o alimento no compartimento-
de pressão à barra a seu nível de pré-condiciona- alvo do labirinto e, após sucessivas tentativas
mento, outros componentes da seqüência completa
aprendida poderiam não ter sofrido uma completa
diárias, as entradas nos becos sem-saída di­
extinção. (Sidman, 1960, pp. 101-103) minuíram gradualmente. Em um segundo gru­
po, os ratos não encontravam alimento no com-
A partir dessa análise, Sidman resumiu as partimento-alvo. Para esses animais, as entra­
razões para a diferença na aquisição nas duas das nos becos sem-saída diminuíram, mas per-

102 A . C h a r le s C a ta n ia
10
FIGURA 5.12 Um experimento sobre
aprendizagem latente. Os ratos foram
submetidos a uma tentativa diária em um
(O labirinto com 14 pontos de escolha. Um
E
grupo (quadrados cheios) sempre en­
contrava alimento no compartimento-
alvo e um segundo grupo (triângulos va­
Sem Comida zios) nunca o encontrava. O terceiro
grupo não encontrava alimento na cai-
xa-alvo até o décimo dia (círculos va­
zios), mas, a partir de então, ele era en­
contrado (círculos cheios). Este grupo,
que teve desempenho como o segundo,
rapidamente se igualou ao primeiro. Os
Comida ratos vinham aprendendo o padrão do
2 - labirinto o tempo todo, assim, o alimen­
Sem Comida to no compartimento-alvo fo i necessá­
para Comida rio somente para que eles exibissem o
que já tinham aprendido. (Tolman &
J __ I__ I__ I Honzik, 1930)
20
Dias

maneceram substancialmente mais elevadas do mento no compartimento-alvo não era o único


que as do primeiro grupo. Em um terceiro gru­ reforçador possível para o comportamento do
po, o alimento foi introduzido no compartimen­ rato de percorrer o labirinto. A remoção do ani­
to-alvo somente depois de dez sessões. O de­ mal do labirinto ao final de uma corrida, sua fuga
sempenho deste último grupo, que tinha sido dos espaços exíguos dos becos sem saída ou seu
igual ao do segundo grupo (sem alimento), tor­ retomo à gaiola-viveiro onde era alimentado tam­
nou-se, rapidamente, comparável ao do primei­ bém poderiam funcionar como reforçadores efe­
ro grupo (com alimento); os ratos que percorre­ tivos. Realizaram-se, então, experimentos em que
ram o labirinto previamente sem alimento no o manejo do rato ao final da corrida, a largura
compartimento-alvo passaram a percorrê-lo com das pistas do labirinto e alimentação na gaiola-
tão poucas entradas nos becos sem saída quanto viveiro foram manipulados. Toda vez que um
os ratos que sempre encontravam o alimento no experimento mostrava que um determinado re­
compartimento-alvo. Até a introdução do ali­ forçador poderia gerar a aprendizagem no labi­
mento, a aprendizagem do terceiro grupo tinha rinto, um outro demonstrava a aprendizagem la­
sido latente; o que havia sido aprendido foi de­ tente de tal maneira que o reforçador em ques­
monstrado pela introdução do alimento. tão não poderia ser eficaz. E assim as coisas con­
O argumento inicial era que os ratos apren­ tinuaram.
diam o labirinto igualmente bem, quer houvesse Mesmo em termos de princípio o debate não
ou não alimento no compartimento-alvo e que, podia ser resolvido e a aprendizagem latente,
portanto, não se podia atribuir a aprendizagem gradualmente, esgotou-se enquanto questão te­
ao alimento como reforçador. O raciocínio foi, órica crítica. A razão disso é que o percurso de
em seguida, estendido aos reforçadores em ge­ um labirinto pelo rato envolve, inevitavelmente,
ral e chegou-se a afirmar que os experimentos as conseqüências do responder. Em qualquer
sobre aprendizagem latente demonstravam que ponto de escolha, uma virada é seguida de uma
a aprendizagem poderia ocorrer sem reforço. entrada num beco sem-saída e uma outra, pela
Mas, logo veio o contra-argumento de que o ali­ oportunidade de avançar mais no labirinto; no

A p re n d iz a g e m 103
último ponto de escolha, apenas uma virada é ganismos aprendem respostas ou relações entre
seguida da entrada no compartimento-alvo, quer os estímulos? Aprendem associações resposta-es-
ele contenha ou não o alimento. Quando o rato tímulo ou não associações estímulo-estímulo?
cheira, toca, olha e move-se no labirinto, está Um dos problemas é o de saber se os proces­
emitindo respostas que têm conseqüências, em­ sos sensoriais deveriam ser tratados como com­
bora esses comportamentos não sejam tão facil­ portamento. Tal tratamento seria condizente com
mente acessíveis à observação como as viradas o ponto de vista de que o comportamento deve
corretas ou as entradas nos becos sem saída. Es­ ser considerado quanto às relações entre os estí­
sas conseqüências são o que o rato aprende. Cha­ mulos e as respostas, em vez de quanto aos estí­
má-las de reforçadores é uma questão, princi­ mulos apenas ou às respostas apenas. Embora
palmente, de preferência, mas a linguagem da não possamos medir o ver e o ouvir sem ambi­
aprendizagem latente parece ter levado a um beco güidade, como medimos respostas discretas, tais
sem-saída. como pressões à barra por um rato ou bicadas de
um pombo, eles são, ainda assim, comportamen­
to. Dependem não apenas de que os estímulos
Aprendizagem Sensório-Motora visuais ou auditivos estejam presentes, mas tam­
bém do que o organismo faz. Olhar aumenta a pro­
As conseqüências nesses experimentos com babilidade de ver, assim como o ouvir aumenta a
ratos apresentaram, principalmente, estímulos probabilidade de escutar. O organismo não é pas­
que, em geral, têm significado biológico para a sivo em seu contato com o ambiente.
sobrevivência do organismo (p. ex., alimento e Os sons, as luzes e outros eventos básicos
água). Mas muitas conseqüências aparentemen­ têm sido descritos, às vezes, como estímulos
te menos importantes são relevantes em nossas neutros em relação a reforçadores ou punidores
interações cotidianas com o meio ambiente, potencialmente fortes (p. ex., a comida e o cho­
como aquelas implicadas na aprendizagem la­ que). Mas, o rótulo neutro, embora conveniente,
tente. Estamos cercados de contingências em que é um nome enganoso. Os eventos não podem ser
um reforçador se segue a uma resposta, mas elas verdadeiramente neutros se forem conseqüências
são facilmente negligenciadas (ver Parsons, do comportamento, porque é improvável que não
1974, para um exemplo humano). Abrimos um tenham algum efeito sobre o comportamento.
livro para ler. Ouvimos para entender o que al­ Contudo, antes que a relatividade dos reforça­
guém está dizendo. Estendemos a mão em dire­ dores fosse reconhecida, as demonstrações dos
ção ao lápis, para pegá-lo. Cada conseqüência efeitos reforçadores de estímulos como luzes e
estabelece a ocasião para novas respostas. Quan­ sons eram recebidas com ceticismo. Ao longo
do terminamos uma página de um livro, viramos de repetidos experimentos, entretanto, o fenô­
a página e lemos a seguinte; quando o conferen­ meno chamado reforço sensorial tomou-se es­
cista acabou de falar, fazemos perguntas ou co­ tabelecido (Kish, 1966). Por exemplo, a ação de
mentários; quando pegamos o lápis, escrevemos pressionar a barra por um rato no escuro aumen­
alguma coisa com ele. Na medida em que cada tava transitoriamente se as pressões acendiam
caso envolve um comportamento mantido por brevemente uma luz. Em outras palavras, a luz
suas conseqüências, eles podem ser discutidos servia temporariamente como um reforçador fra­
com a terminologia do reforço. Ver reforça o co. Fenômenos como esses logo passaram a ser
olhar, ouvir reforça o escutar, e tocar ou pegar discutidos em termos de comportamento explo­
um lápis reforça o ato de estender a mão em di­ ratório e curiosidade, e os experimentos foram
reção a ele. ampliados para uma variedade de conseqüências
A interação dos processos sensoriais com o sensoriais. Por exemplo, se um macaco está so­
comportamento tem sido uma fonte permanente zinho em uma câmara fechada, a oportunidade
de controvérsias na Psicologia da Aprendizagem. de olhar para outros macacos do lado de fora
Os teóricos tomaram partido nos debates sobre pode ser usada para reforçar a operação de um
se a aprendizagem é motora ou sensorial. Os or­ interruptor (Butler, 1957).

104 A. C h a r le s C a ta n ia
Nessas pesquisas, o experimentador avalia os gatos estavam atrelados a uma espécie de car­
afeitos das conseqüências sensoriais sobre uma rossel em miniatura, mas um deles se movia ati­
resposta escolhida por ser fácil de medir. Mas, vamente (A), enquanto o outro era transportado
;m qualquer ambiente, o comportamento do or­ passivamente (P). O gato ativo apoiava-se no
ganismo terá, inevitavelmente, conseqüências piso da câmara, enquanto o passivo era coloca­
sensoriais. O organismo altera seu ambiente, sim­ do dentro de uma caixa suspensa a uma pequena
plesmente, locomovendo-se de um lugar para distância do piso. Enquanto o gato ativo andava
nutro; as coisas que ele vê e toca mudam à medi- em volta do cilindro central, o gato passivo den­
ia que se locomove, e as relações espaciais en­ tro do transportador percorria uma distância cor­
tre os componentes de seu ambiente são uma respondente no outro lado. Se o gato ativo fizes­
sarte fundamental do que ele aprende (Gallistel, se meia volta, em vez de continuar na mesma
1990). direção, um sistema de polias fazia o transporta­
Um experimento realizado por Held e Hein dor virar-se, de modo que o gato passivo tam­
'1963) ilustra tais relações entre o comportamen­ bém voltava-se para a nova direção.
to e as conseqüências sensoriais. Pares de gati­ Ambos os gatos eram expostos a estimulos
lhos foram criados no escuro; suas primeiras ex­ visuais semelhantes, mas os estímulos para o gato
periências com estimulação visual ocorreram no ativo eram uma conseqüência de seu próprio
iparelho mostrado na Figura 5.13. Ambos os ga­ comportamento, enquanto que os do gato passi­
tos recebiam o mesmo tipo de estimulação vi­ vo não o eram; eles dependiam dos movimentos
sual; cada um usava um anteparo que os impe­ do gato ativo e não dos seus próprios movimen­
lia de ver o próprio pé e corpo; o grande cilin­ tos. Os dois gatos foram, então, submetidos a
dro central impedia-os de ver um ao outro e am- testes padrão de coordenação visuomotora, tais
30S viam o mesmo padrão de listras verticais como a colocação da pata com auxílio da visão
nretas e brancas que cobriam uniformemente as (gatos normais estendem suas patas em direção
saredes da câmara circular em que estavam. Os à borda de uma mesa ou de outras superfícies

FIGURA 5.13 Um aparelho para estudar a relação entre o comportamento e a estimulação visual. Tanto o gato
ativo (A) como o passivo (P) eram atrelados a um sistema de polias, sustentado na coluna central. O gato A apoia-
se no piso, enquanto que o gato P fica suspenso em um carrinho. A medida que o gato A se locomove, o sistema de
polias replica suas mudanças de posição para o gato P (ver setas). (Held & Hein, 1963, Figura 1)

A p re n d iz a g e m 105
horizontais quando suspensos no ar a uma pe­ pequena escala podem ter profundas conseqüên­
quena distância das mesmas). Embora a exposi­ cias. Se notamos algo enquanto olhamos com o
ção de ambos os gatos aos estímulos visuais te­ canto do olho, a probabilidade de vê-lo clara­
nha sido eqüivalente, apenas o gato ativo res­ mente é maior se olharmos em direção a ele do
pondeu apropriadamente àqueles testes; o gato que se olharmos para longe dele (exceto sob ilu­
passivo tomou-se capaz de responder apropriada­ minação insuficiente, quando vemos um objeto
mente mais tarde, depois de ter tido oportunidade mais claramente se olharmos não diretamente
de andar livremente em uma sala iluminada. para ele, mas sim levemente ao lado dele). Su­
Este experimento tem muito em comum com ponhamos, então que, em relação a um campo
o clássico experimento de Stratton (1897), que, visual uniforme, ver um contorno tal como a bor­
por oito dias, usou prismas que invertiam e re­ da de um objeto pode reforçar o movimento do
vertiam seus campos visuais. De início, seu mun­ olho. Deveríamos esperar que os movimentos de
do parecia de cabeça para baixo e de trás-para- olho se tomassem coordenados com o campo vi­
a-frente e os seus movimentos não eram coorde­ sual. Os dados disponíveis acerca de movimen­
nados com o meio ambiente. Por exemplo, ao tos do olho de crianças recém-nascidas são con­
andar, ele olhava para o chão para ver onde pi­ sistentes com essa noção. Por exemplo, quando
sava, mas, por causa da inversão produzida pe­ as crianças são expostas a uma figura simples
los prismas, descobriu que estava olhando para tal como um triângulo em um campo visual uni­
o teto e não para o chão. Da mesma forma, tinha forme, elas tendem a fixar-se mais demorada e
dificuldades em apontar para os objetos ou al­ mais precisamente nos contornos e vértices do
cançá-los, porque as coisas vistas antes abaixo triângulo à medida que a experiência visual pro­
do nível do olhar eram agora vistas acima, e as gride (p. ex., Salapatek & Kessen, 1966).
coisas à direita eram agora vistas à esquerda e Temos muito a aprender sobre quão arbitrá­
vice-versa. Com o passar do tempo, contudo, a rias podem ser tais relações entre as respostas e
coordenação melhorou, e Stratton relatou que o as conseqüências (cf. Hein e col., 1979). Por
mundo não mais lhe parecia assim tão de cabeça exemplo, suponhamos que um sistema óptico pu­
para baixo. desse projetar estímulos visuais no campo de
As conseqüências do comportamento são visão de uma criança e alterar as conseqüências
novamente cmciais. Olhar e mover-se no cam­ naturais dos movimentos dos seus olhos. O sis­
po visual têm conseqüências diferentes com e tema apresenta estímulos apenas quando a crian­
sem o uso de prismas inversores, e o ajustamen­ ça olha adiante, em linha reta. Um estímulo apa­
to aos prismas requer que as novas conseqüên­ rece no campo visual direito. Se a criança olha à
cias sejam aprendidas. Por exemplo, ver o chão, direita, o estímulo desaparece. Mas se ela olha à
quando se anda, é importante. Mas, quando se esquerda, o estímulo se desloca para a esquerda,
começa a usar os prismas inversores, ver o chão, para onde a criança está olhando agora (e vice-
que era uma conseqüência de olhar para baixo, versa para estímulos no campo visual esquerdo).
toma-se uma conseqüência de olhar para cima Em outras palavras, esse sistema óptico criaria
(nessa situação, naturalmente, para cima ou para um mundo em que a criança poderia fixar um
baixo podem ser definidos quer em relação ao objeto apenas ao olhar para longe dele (cf. Schro-
campo visual, quer em relação ao corpo; cf. Har­ eder & Holland, 1968).
ris, 1965). Assim, se ver o chão é reforçador para A criança provavelmente aprenderia como
quem está andando e se alguém anda enquanto olhar para as coisas nesse experimento, mas nós
está usando prismas inversores, ver o chão re­ deveríamos pensar duas vezes antes de realizá-
forçará a resposta de olhar para cima em vez da lo. As áreas visuais do cérebro têm seu desen­
de olhar para baixo. volvimento crítico na infância, tanto em huma­
Com a discussão da visão invertida de Strat­ nos quanto em gatos (p. ex., Blakemore & Coo­
ton, fomos da locomoção do organismo no am­ per, 1970; Freeman, Mitchell, &Millidot, 1972).
biente até respostas de magnitude menor como Algumas mudanças iniciais podem ser modifi­
os movimentos do olho. Mesmo as respostas de cadas mais tarde, mas outras podem ser relativa­

106 A . C h a r le s C a ta n ia
mente permanentes. Por exemplo, uma criança responder aumenta por causa de suas conseqüên­
com problemas precoces na visão binocular pode cias. A extinção demonstra que o reforço tem
nunca adquirir uma percepção apropriada de pro­ efeitos temporários, mas outros efeitos acompa­
fundidade, se os problemas não forem corrigi­ nham a extinção e podem ser superpostos ao
dos antes da idade adulta. Algumas coisas são decréscimo no responder que ela produz. A ex­
mais facilmente aprendidas do que outras, em tinção é complicada, porque envolve suspender
geral ou em alguns momentos particulares, e al­ tanto a contingência quanto as apresentações do
gumas coisas aprendidas são mais facilmente estímulo. As contribuições de contingências e
alteradas do que outras. Por um lado, podemos de apresentações de estímulo para o comporta­
relutar em usar o reforço como explicação para mento podem ser isoladas umas das outras, com­
o comportamento que é aprendido muito cedo e parando os procedimentos de reforço, extinção
que é relativamente permanente; por outro, deve­ e superstição. A relação de reforço é relativa.
se tomar cuidado em não o descartar quando a Um estímulo que propicia uma oportunidade para
manutenção do comportamento poderia depen­ a emissão de uma resposta pode reforçar uma
der da permanência, ao longo de toda a vida do outra resposta menos provável e, assim, as rela­
indivíduo, das contingências que originalmente ções de reforço podem ser revertidas alterando-
criaram o comportamento. As contingências e se as probabilidades de respostas por meio de
as conseqüências são parte da descrição do que operações estabelecedoras como a privação. Fe­
aprendemos, mesmo com respeito a nossas inte­ nômenos como a aprendizagem latente e a apren­
rações mais simples com eventos do mundo. dizagem sensório-motora demonstram que o re­
Começamos este capítulo com uma breve forço não é uma explicação de aprendizagem;
história da Lei do Efeito: caixas-problema, labi­ antes, faz parte da descrição do que é aprendido.
rintos, pistas e câmaras operantes. Desses apa­ Os organismos aprendem as conseqüências de
relhos e métodos emergiu o princípio do reforço seu próprio comportamento.
como um termo descritivo apropriado quando o

A p re n d iz a g e m 107
As Conseqüências do Responder:
Controle Aversivo

A. Punição Até aqui, enfatizamos uma relação, o refor­


Comparando Reforço e Punição ço, em que as conseqüências do responder tor­
A Relatividade da Punição nam o responder mais provável. Existe uma ou­
Efeitos Colaterais da Punição tra relação, a punição, em que as conseqüências
Efeitos Eliciadores dos Estímulos Punitivos do responder tomam o responder menos prová­
Efeitos Discriminativos dos Estímulos Punitivos
vel. Além disso, um estímulo que reforça uma
B. Reforço Negativo: Fuga e Esquiva resposta, quando é produzido por ela, pode ter
Fuga uma função diferente quando é removido por
Responder Eliciado e Fuga uma resposta: sua remoção pode punir o respon­
A 'Ambigüidade da Distinção entre Reforço Positivo der. Inversamente, um estímulo que pune a res­
e Reforço Negativo
Esquiva posta que o produz pode reforçar a resposta que
Reações de Defesa Específicas da Espécie o elimina. Por exemplo, o dinheiro pode refor­
A Natureza do Reforçador na Esquiva çar, como quando uma criança é paga por con­
Extinção cluir uma tarefa, no entanto, sua remoção pode
Punição Positiva e Punição Negativa punir, quando a mesada dessa criança é cancela­
A Linguagem do Controle Aversivo
A Etica do Controle Aversivo da por um comportamento inadequado. Da mes­
ma forma, uma queimadura dolorosa pode pu­
nir, quando, por exemplo, se aprende a não tocar
As palavras punição e reforço têm histórias bastante
claras. Punição vem do latim poena, pain (sofrimen­
em uma forma de bolo recém-saída do forno
to) ou penalty (pena ou castigo), e reforço vem do quente, mas sua remoção ou prevenção pode
latim fortis, strong (forte), que está relacionado a ter­ reforçar, quando se aprende a tratar uma quei­
mos estruturais como fort (fortaleza) e burg (cidade). madura com medicação apropriada ou a colo­
A palavra fuga, como ex-, out o f( fora de), mais car uma luva de cozinha antes de manusear
cappa, cape (capa), parece ser derivada do francês
nórdico antigo escaper, tirar a capa de alguém, ou,
objetos no fogão.
por extensão, libertar-se de restrição. A palavra es­ Com exceção do reforço positivo (reforço
quiva compartilha um sentido de sair de, como em pela apresentação de um estímulo: cf. Capítulo
tomar vazio, com outros termos com que tem pa­ 5), essas relações são freqüentemente agrupadas
rentesco: vacant (livre), evacuate (esvaziar), vanish como casos de controle aversivo. Em outras pa­
(desaparecer), waste (desgastar).
A palavra aversivo é derivada do latim a, away
lavras, o controle aversivo inclui tanto a puni­
(fora), mais vertere, to tum (voltar-se). Vertere tem ção como o reforço negativo (reforço pela re­
um parentesco Germânico, com o sufixo -ward ou - moção ou prevenção de estímulos aversivos).
wards, que têm tido significados de warding off, Este capítulo trata, primeiramente, da punição
guardar ou considerar; o sufixo aparece em recom­ e, em seguida, do reforço negativo, em procedi­
pensa (reward), uma palavra freqüentemente trata­
da erroneamente como um substituto para reforço.
mentos de fuga e esquiva.
vessuras foi o chamado de seu pai; a surra ocor­
Seção A Punição
reu depois que a criança obedeceu ao chamado.
Embora a criança possa vir a se envolver em
Enquanto operação, a punição consiste em menos travessuras no futuro, devido à surra, esta
programar, para o responder, uma conseqüência pode também diminuir a probabilidade de que,
que o toma menos provável. O estímulo progra­ na próxima vez, a criança atenda ao chamado do
mado como conseqüência é chamado punidor pai. (Mas seria inapropriado recomendar que o
(estímulo punitivo). Por exemplo, se o compor­ pai vá até a criança ministrar a surra, em vez de
tamento de pressão à barra de um rato produz chamá-la para que a criança vá até ele; muitas
um choque elétrico, o pressionar a barra é consi­ alternativas melhores, como o reforço de respos­
derado punido e o choque é considerado o puni­ tas incompatíveis com o comportamento traves­
dor, porque essa operação reduz o pressionar a so, dispensam a surra.)
barra. Neste sentido, a terminologia de punição A questão não é meramente gramatical. Po­
segue paralela à de reforço (cf. Tabela 4.1). demos ver melhor o que está acontecendo se
Da mesma forma que o reforço, o termo pu­ explicitarmos a resposta punida (a surra puniu a
nição é empregado com referência a operações aproximação da criança em relação ao pai) do
e processos. Assim, afirmar que uma resposta que se fizermos uma descrição menos precisa (a
foi punida pode significar que a resposta produ­ surra puniu a criança). Ao enfatizar a terminolo­
ziu um estímulo punitivo ou que houve um de­ gia de reforçar e punir respostas, não precisa­
créscimo no responder devido à produção de um mos pré-julgar como essas operações afetam o
punidor. Assim como no reforço, é mais indica­ comportamento; partiremos da suposição de que
do restringir o termo punição à terminologia de essas operações freqüentemente afetarão outras
operações e descrever diretamente o processo em respostas além daquelas para as quais foram pro­
termos de alterações no responder. Contudo, gramadas (p. ex., uma surra pode eliciar o cho­
assim como no reforço, a utilização de pro­ ro). Uma terminologia que explicite sem ambi­
cesso tem tantos precedentes que não pode ser güidades as conseqüências do comportamento
evitada. ajuda a descrever tais efeitos.
A terminologia do reforço e da punição é pa­
ralela também no que diz respeito ao seu objeto:
as respostas, não os organismos, são punidas. Se COMPARANDO REFORÇO E
as pressões à barra por um rato produzem cho­ PUNIÇÃO
que e diminuem de freqüência, é apropriado di­
zer que o choque foi aplicado ao rato e que a O efeito da punição é simplesmente o oposto
pressão à barra foi punida; não é apropriado di­ do efeito do reforço. A relação entre os dois pro­
zer que o rato foi punido, embora isso contrarie cessos é ilustrada na Figura 6.1, que apresenta
o uso coloquial. Assim como no reforço, esta dis­ dados hipotéticos de reforço e de punição. O grá­
tinção gramatical nos encoraja a sermos preci­ fico superior apresenta mudanças no responder
sos quando observamos e descrevemos o com­ à barra por um rato, durante o reforço com co­
portamento. Uma razão para uma distinção tão mida e, posteriormente, durante a extinção. Du­
dramática em relação ao uso cotidiano é que neste rante a linha de base, quando pressionar a barra
o interesse, freqüentemente, está voltado para a não produz conseqüências, o responder ocorre
retribuição e não para as alterações comporta- com pouca freqüência. Quando o reforço é ini­
mentais. ciado, o responder aumenta durante as primei­
Considere, por exemplo, uma criança fazen­ ras sessões e depois permanece relativamente
do travessuras. Um dos pais chama a criança e, estável. A extinção, então, gradualmente reduz
quando ela vem, recebe uma surra. Dizer sim­ o responder ao nível da linha de base inicial.
plesmente que o pai puniu a criança pode ser O gráfico inferior da Figura 6.1 apresenta as
conveniente, no entanto, esse uso do termo tor­ mudanças nas pressões à barra pelo rato durante
na fácil a omissão das respostas que poderiam e após a punição das respostas com choque elé­
ser afetadas. A conseqüência imediata das tra­ trico. Uma vez que a punição reduz o responder,

A p re n d iz a g e m 109
FIGURA 6.1 Efeitos do reforço e da punição sobre a pressão à barra hipotética por um rato privado de alimento.
O gráfico superior apresenta as respostas de pressão à barra na ausência do reforço (linha de base), o aumento
quando as pressões à barra produzem alimento (reforço) e o retomo a níveis anteriores quando o reforço é inter­
rompido (extinção). O gráfico inferior mostra o responder mantido pelo reforço (linha de base), seu declínio
quando o choque elétrico, produzido pela resposta, é superposto a este desempenho (punição), e o retomo aos
níveis anteriores elevados quando a punição é interrompida (recuperação). O comportamento de pressionar man­
tido pelo reforço é a linha de base sobre a qual os efeitos da punição estão ilustrados no gráfico inferior, porque o
decréscimo do responder não pode facilmente ser visto quando o responder está com freqüência baixa.

a freqüência inicial de respostas deve ser maior os procedimentos são mantidos e desaparecem
do que zero, do contrário, nenhum declínio seria depois que eles são interrompidos (o responder
observado. Neste exemplo, o responder já é man­ retoma aos níveis prévios à introdução da ope­
tido pelo reforço alimentar que permanece ao ração de reforço ou de punição). Efeitos reais (e
longo de todas as sessões; assim os efeitos da não-hipotéticos) da punição são descritos na Fi­
punição podem ser avaliados por meio da super­ gura 6.2 (Estes, 1944).
posição da punição sobre esta linha de base. A Os efeitos ilustrados na Figura 6.2 são cla­
linha de base mostra o responder mantido, antes ros. Todavia, a efetividade da punição tem sido
da resposta de pressionar a barra ser punida. classicamente objeto de controvérsias. A puni­
Quando a punição é iniciada, as pressões à barra ção foi incorporada nas primeiras versões da Lei
diminuem até um nível baixo e constante. Na re­ do Efeito de Thomdike (cf. Capítulo 5). Thom-
cuperação, a punição é interrompida e o respon­ dike afirmava, então, que o comportamento po­
der, gradualmente, retoma ao nível anterior da dia ser apagado (stamped out), por estados de
linha de base. coisas desagradáveis, e fixado (stamped iri) por
O reforço e a punição são simétricos: o pri­ estados gratificantes. As formulações da lei do
meiro aumenta o responder, enquanto a última efeito de Thomdike, que incluíam o componen­
diminui, mas seus efeitos continuam enquanto te de punição, foram chamadas de Lei do Efeito

110 A . C h a r le s C a ta n ia
notar a redução e notaram apenas a recuperação
do responder depois que a punição era interrom­
pida. O que se segue fornecerá boas razões para
concluir que outras técnicas, que não a punição,
deveriam ser seriamente consideradas, sempre
que possível. Mas, se essa conclusão está corre­
ta, isto será apenas porque Thorndike e seus su­
cessores estavam certos por razões erradas.
Mais recentemente os investigadores têm-se
voltado novamente para a punição e estudado as
condições que modificam sua efetividade em
suprimir o comportamento (p. ex., Azrin & Holz,
1966; Church, 1963). Por exemplo, experimen­
tos com choque elétrico como estímulo punitivo
FIGURA 6.2 Registro cumulativo do efeito de punição para respostas de bicar o disco, que vinham sen­
superposto a uma linha de base de reforço com comida, do reforçadas com alimento, em pombos, mos­
mantida ao longo da sessões. A resposta era a pressão traram que quanto mais intenso e imediato o es­
à barra por um rato e o estímulo punitivo era choque. A
taxa de pressões diminuiu durante a punição e fo i recu­
tímulo punitivo tanto mais eficaz ele será. Um
perada após a retirada da punição. (Estes, 1944, Figu­ estímulo punitivo, introduzido com sua intensi­
ra 10.) dade máxima, suprime o responder mais efeti­
vamente do que um introduzido com intensida­
de baixa, que aumenta gradualmente até a inten­
Forte. Mais tarde, Thorndike retirou o compo­ sidade máxima. Além disso, a efetividade do es­
nente de punição; a versão que permaneceu in­ tímulo punitivo pode mudar ao longo de exten­
cluía apenas a fixação do comportamento e foi sos períodos de punição, quando, por exemplo,
chamada de Lei do Efeito Fraca. Thorndike ba­ um estímulo punitivo de intensidade baixa se
seou suas conclusões em experimentos de apren­ toma, gradualmente, ineficaz após muitas apresen­
dizagem verbal humana, nos quais dizer “certo” tações (cf. Azrin & Holz, 1966, pp. 426-427). E,
para o aprendiz aumentava o responder, enquanto como ocorre com a extinção, é mais fácil reduzir a
que dizer “errado” tinha menos efeito do que não probabilidade de uma resposta quando alguma ou­
dizer nada. Thorndike aceitou essa descoberta tra resposta que produz o mesmo reforçador está
como uma evidência geral contra a efetividade disponível do que quando não há respostas alter­
da punição. nativas que produzam o mesmo reforçador.
A conclusão de Thorndike teve tal impacto Experimentos sobre as propriedades da pu­
que, mesmo os dados da Figura 6.2 foram inter­ nição não apenas mudaram os critérios para se
pretados como significando que a punição era avaliar a efetividade da punição; eles também
um procedimento ineficaz. Com base na recupe­ levantaram dúvidas se a punição tinha sido jul­
ração do responder, após a interrupção da puni­ gada adequadamente, de acordo com os crité­
ção, o argumento era que a punição não deveria rios antigos. Ocasionalmente, um único estímu­
ser tomada seriamente como uma técnica para o lo punitivo ou alguns, se suficientemente inten­
manejo de comportamento, uma vez que ela po­ sos e se aplicados como conseqüência de uma
dia suprimi-lo apenas temporariamente. Contu­ resposta fracamente mantida, podiam fazer a res­
do, com base nesse critério, o reforço também posta desaparecer até mesmo pelo resto da vida
deveria ser considerado ineficaz. Por algum mo­ do organismo. Tais efeitos excepcionais podem
tivo, os critérios empregados para avaliar a efe­ bem ser considerados como permanentes, mas
tividade da punição foram diferentes daqueles por que deveríamos ficar surpresos se a recupe­
empregados para avaliar a efetividade do refor­ ração, às vezes, fosse tão lenta que ultrapassasse
ço. Muito embora o responder fosse reduzido du­ o tempo de vida do organismo? Consideremos
rante a punição, os investigadores tenderam a não um argumento análogo para o reforço. Se alguém

A p r e n d iz a g e m 111
comprasse um bilhete de loteria e ganhasse um choque, mas é também possível dizer que o or­
prêmio de dez mil dólares, não nos surpreende­ ganismo está passivamente se esquivando do es­
ríamos se descobríssemos que a compra ocasio­ tímulo punitivo, evitando descer da mesma. Tal
nal de bilhetes de loteria continuasse ao longo uso do termo possibilitou que os procedimentos
de toda a vida da pessoa, muito embora este com­ efetivos de punição fossem discutidos no voca­
portamento jamais viesse a ser reforçado nova­ bulário de esquiva passiva, enquanto outros pro­
mente. Não rejeitaríamos a existência da extin­ cedimentos que não reduziam o responder fo­
ção com base nisso; portanto, não deveríamos ram usados para defender a noção de que a pu­
rejeitar a recuperação após a punição por causa nição era ineficaz.
de casos episódicos de seus efeitos duradouros. O termo punição se aplica à relação entre o
Algumas características incidentais da puni­ responder e a conseqüência. A questão é, princi­
ção, provavelmente, contribuíram para que ela palmente, saber quando a aplicação do termo é
fosse tratada de modo tão diferente. Uma redu­ apropriada. Desde cedo, em sua evolução, a aná­
ção no responder pode ser estudada apenas se lise da punição enfatizou a transitoriedade de
algum responder já existir. Uma resposta que seus efeitos. Por essa razão, a punição permane­
jamais é emitida não pode ser punida. Assim, ceu por longo tempo não reconhecida como uma
experimentos em punição, freqüentemente, su­ operação comportamental fundamental. Mas a
perpõem a punição ao responder mantido por re­ existência de conseqüências que reduzam o res­
forço. Mas os efeitos da punição podem, então, ponder já não é questionada. A punição é para­
depender do que mantém o responder. Por exem­ lela ao reforço, exceto pelo fato de que os efei­
plo, se pressões à barra são punidas com choque tos diferem quanto ao sinal: o reforço aumenta o
elétrico, o pressionar a barra reforçado com ali­ responder reforçado, e a punição reduz o respon­
mento diminuirá menos se um rato estiver seve­ der punido. Ambas as operações têm efeitos tem­
ramente privado de alimento do que se ele esti­ porários; quando são interrompidas, o responder
ver apenas moderadamente privado. retoma aos níveis prévios. Uma vez que a puni­
Outra dificuldade é que os estímulos puniti­ ção pode modificar o comportamento humano,
vos tendem a ter outros efeitos que ocorrem in­ surgirão, invariavelmente, questões acerca da
dependentemente de eles serem ou não produzi­ ética de sua aplicação. Mas não é provável que
dos pelas respostas. Como no caso do reforço, o tais questões sejam resolvidas sem que seja feita
efeito da punição deve depender da relação en­ uma análise adequada de suas propriedades.
tre as respostas e os estímulos punitivos (con­
tingência) e não simplesmente da aplicação cle
punidores. Por exemplo, o choque elétrico pode A RELATIVIDADE DA PUNIÇÃO
diminuir a taxa com que um pombo bica um dis­
co, mesmo que os choques sejam administrados Em experimentos sobre punição, os estímu­
independentemente do bicar o disco. Assim, antes los punitivos são escolhidos, freqüentemente, por
de tratá-los como estímulos punitivos, é necessá­ seu efeito fidedigno sobre uma variedade de res­
rio demonstrar que os choques têm efeito maior postas, porque tais estímulos revelam mais cla­
quando produzidos pelo bicar do que quando ocor­ ramente os efeitos da punição. Um desses even­
rem independentemente do bicar (cf. Azrin, 1956). tos é o choque elétrico, que pode ser medido pre­
Os preconceitos contra o reconhecimento da cisamente e que pode ser apresentado em inten-
punição foram tão fortes que os procedimentos sidades efetivas, sem danificar o tecido orgâni­
efetivos foram até mesmo chamados por um co. Tais estímulos, contudo, são apenas casos
nome diferente, esquiva passiva. Por exemplo, extremos de punidores. Por exemplo, como vi­
consideremos um rato que esteja numa platafor­ mos anteriormente, crianças com o desenvolvi­
ma, acima de uma grade eletrificada. Ao pisar mento cronicamente comprometido, apresentam
na grade, o rato recebe o choque e toma-se me­ comportamentos de bater a cabeça, morder as
nos propenso, no futuro, a descer. É apropriado mãos e outros comportamentos autolesivos. Uma
dizer que ao descer da plataforma é punido pelo breve esguichada no rosto com um tipo de spray

112 A. C h a r le s C a ta n ia
utilizado para umedecer plantas em ambientes Pode-se, então, tornar o girar da roda uma con­
fechados é, na pior das hipóteses, um pequeno seqüência do beber: cada vez que o rato bebe, a
aborrecimento. No entanto, quando aplicado roda começa a girar, e o rato é forçado a correr.
contingentemente a tais comportamentos, é um Quando o correr é mais provável que o beber,
punidor efetivo (Dorsey e col., 1980). Assim esta operação aumenta o beber, e é apropriado
sendo, o estímulo é relativamente inofensivo, dizer que o beber é reforçado pelo correr. Mas,
especialmente se comparado aos sérios danos que quando o correr é menos provável que o beber,
essas crianças podem exercer sobre si mesmas esta operação tem um efeito oposto: agora o be­
(porém, quem se opõe a qualquer uso de puni­ ber diminui quando o correr é a sua conseqüên­
ção considera essa aplicação inaceitável). cia, e é apropriado dizer que o beber é punido
A punição é inevitável, pois está embutida pelo correr. Se suas probabilidades relativas po­
em muitas contingências naturais. Uma criança dem ser revertidas, como ilustradas neste exem­
que provoca um cachorro que está latindo pode plo, qualquer resposta em particular pode ser re­
ser mordida, e uma criança que brinca com fogo forçada ou punida por qualquer outra resposta.
pode se queimar. Além disso, mesmo os estímu­ Os estímulos e as respostas em experimen­
los que geralmente servem como reforçadores tos típicos de reforço e punição têm sido esco­
podem, sob certas condições, tomarem-se puni- lhidos de modo a fazer com que esses procedi­
dores. Por exemplo, a comida, que é reforçadora mentos funcionem (p. ex., com ratos privados
no início de uma festa, pode se tomar aversiva de comida, comer é muito mais provável do que
ao final da refeição. Por outro lado, eventos que pressionar a barra). Eles obscurecem, assim, a
superficialmente parecem aversivos, como des­ reversibilidade potencial das conseqüências
pencar de lugares altos, podem ser reforçadores como reforçadoras e punitivas. O responder pode
sob certas circunstâncias (consideremos o saltar ser aumentado ou reduzido pela mudança de suas
de pára-quedas e andar na montanha-rassa). Da conseqüências, e esses efeitos são determinados
mesma forma que os reforçadores, os punidores pelas propriedades comportamentais, e não pe­
não podem ser definidos em termos absolutos, las propriedades físicas, das conseqüências.
nem especificados em termos de propriedades
físicas em comum. Eles devem ser avaliados com
base na relação entre as respostas punidas e as EFEITOS COLATERAIS DA PUNIÇÃO
respostas ocasionadas pelo estímulo punitivo.
O princípio de reforço de Premack (Capítulo Da mesma forma que os reforçadores, os es­
5) afirmava que uma oportunidade de executar tímulos punitivos podem ter efeitos independen­
respostas mais prováveis reforçaria as respostas tes de sua relação de contingência com as res­
menos prováveis. Essa análise foi também es­ postas. Se um organismo recebe um choque, uma
tendida à punição (Premack, 1971). Retornemos queimadura ou uma beliscada, algumas de suas
ao equipamento que pode controlar as oportuni­ respostas podem ter pouco a ver com o fato de
dades de um rato correr em uma roda de ativida­ esses eventos terem sido ou não produzidos pelo
de ou beber em um tubo de líquido. O equipa­ próprio comportamento desse organismo. Sur­
mento foi modificado por um motor que pode gem dificuldades para analisar a punição por­
travar a roda de atividade numa posição, impe­ que tais efeitos devem ser distinguidos daqueles
dindo o rato de correr, ou girá-la a uma veloci­ que dependem da relação entre as respostas e
dade fixa, forçando o rato a correr. suas conseqüências. Alguns efeitos do choque
Nesse aparato, o ato de privar um rato da podem ser primariamente fisiológicos, por exem­
oportunidade de correr, enquanto ele tem acesso plo, quando choques sucessivos reduzem, siste­
livre à água, toma o correr mais provável que o maticamente, a resistência da pele de um rato.
beber, e privá-lo de água, enquanto ele tem opor­ Dependendo da natureza da fonte do choque, a
tunidade de correr, toma o beber mais provável efetividade dos choques subseqüentes pode, en­
que o correr (cf. as probabilidades relativas de tão, variar com a resistência do rato. Outros efei­
correr e beber nas duas partes da Figura 5.10). tos são primariamente comportamentais, como

A p re n d iz a g e m 113
quando o aparato possibilita a ocorrência de res­ apropriado afirmar que o choque produzido pela
postas por meio das quais o organismo pode re­ resposta era um estímulo punitivo. Os eventos
duzir seu contato com a fonte de choque (p. ex., afetam mais o comportamento quando, em tro­
o pêlo é um isolante, e os ratos, às vezes, conse­ ca, o comportamento pode afetar esses eventos
guem minimizar os efeitos do choque, pressio­ (Rachlin, 1967, p. 87). Do mesmo modo que de­
nando a barra enquanto se deitam de costas; Azrin vemos distinguir entre os efeitos das aplicações
& Holz, 1966). Em qualquer caso, tais efeitos co­ do reforçador e os efeitos da relação contingen­
laterais devem ser levados em consideração. te entre as respostas e os reforçadores, assim tam­
bém devemos distinguir os efeitos das aplica­
ções do estímulo punitivo daqueles efeitos da
Efeitos Eliciadores dos Estímulos Punitivos relação contingente entre as respostas e os estí­
mulos punitivos.
A Figura 6.3 foi extraída de um experimento A punição de duas classes de comportamen­
(Camp, Raymond & Church, 1967) que compa­ to típicas de uma espécie de ratos do deserto
rou os efeitos de choques produzidos pelas res­ (Mongolian gerbil) representa um outro exem­
postas e de choques independentes de respostas. plo (Walters & Glazer, 1971; ver também
As pressões à barra foram mantidas por reforço Shettleworth, 1978). O ato de escavar na areia,
alimentar em três grupos de ratos. Medido em que é parte do comportamento de construção de
relação a um grupo de controle que não recebeu sua toca, consiste em cavar a areia e chutá-la para
choque, o responder dos dois grupos expostos a trás; postar-se alerta, uma reação defensiva oca­
choque diminuiu, mas o choque produzido pela sionada por estímulos súbitos ou aversivos, con­
resposta suprimiu o responder mais do que o cho­ siste em postar-se ereto nas patas traseiras com
que independente da resposta (ver também Chur­ as orelhas levantadas. Aplicar o choque na cai­
ch, 1969). Com base nessa diferença, parece xa de areia em que o experimento foi conduzido
era difícil, então um som foi estabelecido como
estímulo aversivo, emparelhando-o repetidamen­
te com o choque em uma situação diferente.
Quando contingente ao escavar, o som funcio­
nou como um estímulo punitivo eficaz. O esca­
var diminuiu quando produzia o som e aumen­
tou novamente após a suspensão da contingên­
cia; enquanto o escavar diminuiu, postar-se em
alerta, aumentou. No entanto o som contingente
ao postar-se em alerta não foi efetivo. Postar-se
em alerta aumentou e não voltou aos níveis pré­
vios durante várias sessões depois que a contin­
gência foi interrompida; neste caso, não houve
mudanças apreciáveis no escavar. O efeito elici-
ador do som sobre a postura de alerta foi mais
poderoso que seus efeitos punitivos. Assim, na
Sessões punição como no reforço, é importante reconhe­
cer os efeitos separados das contingências respos-
FIGURA 6-3. Efeitos de choques independentes das
respostas e de choques produzidos pelas respostas sobre ta-estímulo e das apresentações de estímulos.
pressões à barra mantidas por reforço alimentar em Como outro exemplo, consideremos um ma­
ratos. A taxa de choques no grupo que recebeu choques caco em uma cadeira de restrição, com eletro­
independen tes das respostas fo i emparelhada com a do dos de choque ajustados em sua cauda, (p. ex.,
grupo que recebe choques produzidos pelas respostas, Morse & Kelleher, 1977, pp. 193-198). A inter­
mas estes reduziram mais o responder do que os cho­
ques independentes das resposta. (Camp, Raymond, & valos de 5 minutos, uma pressão à barra pelo
Church, 1967, Figura 5.) macaco produz um choque em sua própria cau-

114 A . C h a r le s C a ta n ia
da. Logo após a colocação do macaco na cadei­ entre os dois esquemas, eles alternavam para o
ra, ele começa a pressionar a barra. Finalmente, esquema com um intervalo mais longo entre os
5 minutos se passam e a próxima pressão pro­ choques (Pitts & Malagodi, 1991). Em outras pa­
duz um choque (essa programação é denomina­ lavras, dentre os choques mais e menos freqüen­
da de esquema de intervalo fixo 5min; ver Capí­ tes, os macacos preferiram aplicar em si mes­
tulo 10). O macaco salta e guincha brevemente mos os menos freqüentes. Talvez nos lembre­
e, durante certo tempo, deixa de pressionar a bar­ mos da efetividade da restrição física como re­
ra. Mas logo ele recomeça a pressionar, respon­ forçador com algumas crianças que se engajam
dendo cada vez mais rapidamente, até que ele em comportamentos autolesivos (Capítulo 5);
próprio ocasione o choque ao final do próximo elas preferem a situação com restrição, em que
intervalo de 5 minutos. Esse desempenho se re­ não podem machucar a si mesmas, às situações
pete ao longo de sessões diárias. Quando o cho­ sem restrição, em que elas poderiam se machu­
que é suspenso, as pressões à barra praticamen­ car (e machucam-se).
te cessam; quando o choque é reintroduzido, o Se o comportamento humano inclui proble­
pressionar retorna. Se o nível de choque é au­ mas como comportamentos autolesivos, nossa
mentado, o pressionar a barra aumenta; se o ní­ preocupação com tal fenômeno é justificada.
vel de choque é diminuído, ele diminui. Os cho­ Temos visto que, às vezes, é mais apropriado
ques dependem inteiramente do comportamento comparar o choque produzido pela resposta com
do macaco; ele não os receberia se não pressio­ o choque independente da resposta do que com
nasse a barra. Por que o macaco simplesmente uma situação sem choques. O choque elétrico
não pára de pressionar? elicia respostas manipulativas, como pressionar
O paradoxo é que o mesmo choque que man­ a barra, nos macacos. Esses efeitos eliciadores
tém o responder, quando produzido pelo pressi­ do choque podem ser fortes o suficiente para anu­
onar de acordo com o esquema de intervalo-fixo lar seus efeitos punitivos, de modo que o pressio­
5min, suprime o responder quando é produzido nar a barra ocorre a despeito, e não por causa, da
por cada pressão à barra; o mesmo choque tam­ contingência punitiva. Nesse sentido, o caso pode
bém pode ser empregado para iniciar e manter ser análogo àquele em que o pai tenta fazer uma
comportamentos de fuga e esquiva (p. ex., Bar­ criança parar de chorar punindo o choro e tem pro­
rett & Stanley, 1980). Então, como podemos blemas, visto que o estímulo punitivo elicia a mes­
decidir se a terminologia da punição é apropria­ ma resposta que ele está tentando suprimir.
da? Se cada pressão à barra produz um choque,
podemos chamar o choque de estímulo puniti­
vo, porque ele reduz o responder. Mas quando Efeitos Discriminativos dos Estímulos
as pressões à barra produzem choques apenas a Punitivos
intervalos de 5 minutos, deveríamos chamar o
choque de reforçador, porque ele gera mais res­ Um outro efeito colateral da punição pode
postas? (De nada adianta ceder à tentação de cha­ ocorrer, porque os estímulos punitivos podem
mar o macaco de masoquista. Masoquismo é sim­ adquirir propriedades discriminativas, como
plesmente um nome que usamos quando um es­ quando uma resposta é reforçada apenas quan­
tímulo, o qual acreditamos que deveria ser um do também é punida. Um experimento planeja­
punidor funciona como reforçador; o termo não do para fazer com que um choque produzido por
é explanatório). uma resposta sinalizasse a disponibilidade de
Outro experimento mostrou que um esque­ comida programou duas condições alternativas
ma em que as pressões à barra produzem um (Holz & Azrin, 1961). Em uma delas, as bicadas
choque a cada dois minutos, geralmente man­ do pombo não tinham conseqüências; na outra,
tém taxas de pressionar mais altas do que as pro­ cada bicada produzia um choque e algumas bi­
duzidas por um esquema em que as respostas cadas produziam um alimento. O bicar era man­
produzem um choque a cada seis minutos; quan­ tido a uma taxa baixa, quando as respostas não
do os macacos tinham oportunidade de escolher produziam um choque porque, neste caso, tam­

A p re n d iz a g e m 115
bém não produziam alimento; mas o bicar au­ surrada, porque a surra geralmente é seguida por
mentou assim que as respostas começaram a pro­ uma quantidade de atenção do pai arrependido
duzir choques, pois elas apenas ocasionalmente que é maior do que a atenção nas interações
produziam alimento. Amostras dos registros em menos traumáticas entre o pai e a criança. Neste
que o reforço com comida foi completamente sus­ exemplo, a surra é análoga ao choque na Figura
penso são mostradas, com dois pombos, na Figura 6.4 e a atenção do pai, análoga à comida. A aten­
6.4. Na ausência de choque a taxa de bicadas foi ção de um pai pode ser um reforçador poderoso
baixa. Quando as respostas começaram a produzir e, freqüentemente, pode superar os efeitos das
choques, a taxa aumentou. Quando o choque foi conseqüências que, de outra forma, serviriam
suspenso, um breve aumento na taxa (setas) foi como estímulos punitivos. Assim, uma análi­
seguido por uma redução aos níveis prévios. se comportamental pode ser relevante para
Novamente poderíamos nos perguntar se os problemas humanos como a violência contra
choques poderiam ser chamados de estímulos a criança.
punitivos. De fato, deveríamos concluir, com Vimos que a punição é o oposto do reforço;
base na Figura 6.4, que o choque era um refor- ela é definida pelas reduções no responder con-
çador. A principal diferença aqui entre o choque seqüenciado, enquanto o reforço é definido pe­
e outros reforçadores mais familiares é que o cho­ los aumentos. A terminologia da punição é pa­
que adquiriu seu poder de reforçar por meio de ralela àquela do reforço: os punidores são estí­
sua relação com o alimento; ele perde seu poder mulos, e a punição é uma operação ou processo.
se a relação for interrompida. Talvez esses pro­ Os efeitos da punição geralmente são temporá­
cedimentos sejam relevantes para o comporta­ rios; o responder freqüentemente retoma aos ní­
mento humano. Por exemplo, uma criança que veis prévios da linha de base, depois que a puni­
apanhou pode ter provocado o pai a ponto de ser ção é interrompida. Ao estudar a punição, a taxa
de respostas em linha de base deve ser alta o su­
ficiente para tomar a redução no responder fa­
cilmente visível; por essa razão, os experimen­
Sem Choque Produzido Sem
Choque pela Resposta Choque tos com a punição normalmente superpõem a pu­
nição a uma linha de base de respostas mantidas
pelo reforço. A efetividade dos punidores, as­
sim como a dos reforçadores, é determinada pe­
las probabilidades relativas da resposta punida e
das respostas ocasionadas pelo estímulo puniti­
vo; a punição ocorre quando uma resposta mais
provável força o organismo a se engajar em uma
resposta menos provável. A punição pode ser
complicada pelos efeitos eliciadores ou discri­
minativos dos estímulos punitivos. A tarefa de
uma análise experimental é separar tais efeitos
colaterais dos efeitos primários do estímulo pu­
Minutos
nitivo. Esses efeitos ocorrem porque a punição
inclui, necessariamente, tanto apresentações de
FIGURA 6.4 Efeitos discriminativos do choque. Pri­ estímulo quanto uma contingência entre as res­
meiro, duas condições se alternaram: as bicadas do
pombo não produziam nem alimento nem choque, ou as postas e os estímulos; os efeitos das apresenta­
bicadas sempre produziam choque e, ocasionalmente, ções do estímulo devem ser separados dos da
alimento. Nas sessões mostradas aqui, nenhuma comi­ contingência.
da era apresentada. Para ambos os pombos, as taxas Deixemos agora a punição e voltemos ao re­
de resposta, inicialmente baixas, aumentaram quando forço. Veremos que há complicadores de dife­
começaram a produzir um choque e decresceram aos
níveis prévios, quando o choque fo i descontinuado.
rentes tipos quando o responder, em vez de ser
(Holz & Azrin, 1961, Figura 3.) punido pela apresentação de um estímulo aver-

116 A . C h a r le s C a ta n ia
sivo, é reforçado pela remoção ou prevenção contemporâneo predominante, resumido a se­
desse estímulo. guir:

1. O reforço faz a resposta reforçada aumen­


tar.
Seção B Reforço Negativo: Fuga e 2. A punição faz a resposta punida diminuir.
Esquiva 3. O adjetivo positivo significa que a conse­
qüência do responder é a adição de um es­
Os organismos podem se livrar dos estímu­ tímulo ao ambiente do organismo.
los, bem como produzi-los. Por exemplo, um rato 4. O adjetivo negativo significa que a conse­
normalmente não se expõe ao choque, e se o cho­ qüência do responder é a.subtração de um
que vier a ocorrer, o rato fugirá dele na primeira estímulo do ambiente do organismo.
oportunidade. Se a apresentação de um estímulo 5. Os reforçadores e punidores são estímulos
aversivo pune uma resposta, remover ou preve­ e a não ausência de estímulos (supondo que
nir tal estímulo deve reforçar a resposta. Quan­ seja possível fazer uma distinção clara).
do uma resposta termina ou evita um estímulo
aversivo e, assim, toma-se mais provável, o es­ O último item acima é seguido por uma res­
tímulo é denominado reforçador negativo e a trição entre parênteses porque, às vezes, a dis­
operação é chamada de reforço negativo. A dis­ tinção é difícil. Por exemplo, será mais apropria­
tinção entre reforço positivo e reforço negativo do conceber os efeitos de uma multa de trânsito
depende se uma resposta produz ou remove um pela apresentação do formulário, no qual a mul­
estímulo. ta está registrada ou pela perda de dinheiro quan­
Mais tarde encontraremos alguns problemas do a multa é paga? Do mesmo modo, o que será
na terminologia do reforço positivo e negativo. mais apropriado: conceber os efeitos de um bom
A terminologia, no entanto, tem precedentes desempenho em uma prova pela apresentação de
substanciais. A utilização padrão tem sido a de uma nota alta ou pela esquiva de uma nota bai­
que positivo e negativo, como modificadores do xa?
termo reforço, referem-se à conseqüência pro­
duzida pelo responder (se a resposta acrescenta
ou retira algo do ambiente), e que reforçador ne­ FUGA
gativo refere-se ao estímulo em si mesmo, e não
à sua remoção (se a remoção do choque reforça Os procedimentos de fuga são os exemplos
pressionar a barra, por um rato, o choque, não o mais simples de reforço negativo: a resposta de
período sem choque que segue a resposta, é o um organismo suspende um estímulo aversivo.
reforçador negativo). Essa terminologia foi es­ Os procedimentos de fuga diferem dos procedi­
tabelecida gradualmente (houve uma época em mentos de esquiva, nos quais uma resposta evita
que o reforço negativo foi definido, em alguns ou atrasa um estímulo aversivo. Essa terminolo­
livros texto, como mencionado acima, mas em gia é consistente com o uso cotidiano: fugimos
outros ele foi definido como equivalente à puni­ de circunstâncias aversivas presentes, mas nos
ção; tais equívocos ainda aparecem ocasional­ esquivamos de circunstâncias potencialmente
mente: p. ex., Kimble, 1993). Conforme indica­ aversivas que ainda não ocorreram. Por exem­
do pelas seções de etimologia, no início de cada plo, podemos sair de uma festa para fugir de uma
um dos capítulos deste livro, a linguagem evo­ companhia que já está ali ou para nos esquivar
lui. Assim, a evolução da linguagem do reforço de alguém que estaria para chegar mais tarde.
pode, eventualmente, tomar a distinção entre Em situações institucionais para crianças com
reforço positivo e negativo de valor marginal (cf. atrasos de desenvolvimento, as crianças, às ve­
Michael, 1975). Não obstante, quando fizermos zes, comportam-se agressivamente, porque des­
aso do vocabulário de reforço positivo, reforço ta maneira fogem das exigências simples impos­
negativo e punição, estaremos adotando o uso tas sobre elas, como realizar tarefas planejadas

A p re n d iz a g e m 117
para ensiná-las, por exemplo, a abotoar e desa­ to é mais eficaz do que o reforço atrasado (parâ­
botoar as roupas. Para duas dessas crianças, a metro de atraso), e os reforçadores grandes são
agressão caiu para níveis próximos de zero, quan­ mais eficientes que reforçadores pequenos (pa­
do elas podiam fugir das situações de exigência râmetros de magnitude ou intensidade; ver pa­
engajando-se em outro comportamento que era râmetro no glossário).
incompatível com a agressão (Carr, Newsom, & A locomoção de um lugar para outro toma as
Binkoff, 1980). Entretanto, tais casos de fuga respostas de fuga eficazes, mas as respostas dis­
podem implicar em que as situações típicas de cretas como a pressão à barra são mais fáceis de
exigência nestes ambientes não fornecem os re- registrar. As pressões à barra por um rato na pre­
forçadores suficientes. sença de um choque podem desligar o choque
As condições de fuga podem ser criadas, para ou, na presença de uma luz muito forte, podem
um rato, pela construção de um compartimento desligar a luz (p. ex., Keller, 1941). Se, em qual­
com um piso de grades eletrificadas. A locomo­ quer dos casos, o responder aumenta devido às
ção de um lugar para outro, como resposta de suas conseqüências, dizemos que a resposta foi
fuga, em uma pista de corrida eletrificada, é ilus­ reforçada. Comparemos, então, o reforço positi­
trada na Figura 6.5 (Fowler & Trapold, 1962). vo e o negativo: na ausência de alimento, o res­
A velocidade da corrida foi maior quando o cho­ ponder que produz alimento aumenta; com a pre­
que era desligado assim que o rato alcançava o sença de choque, o responder que remove o cho­
fim da pista. Quanto mais longo o atraso entre que aumenta. O paralelo é direto. Contudo, os
chegar ao fim da pista e o término do choque, procedimentos de fuga recebem menos atenção
tanto mais lento o correr. Esse é um dos muitos do que os procedimentos mais complexos. A pes­
exemplos dos efeitos quantitativos do reforço. quisa em reforço negativo é dominada pela es­
Por exemplo, tanto no caso do reforço positivo quiva, em que estímulos aversivos são preveni­
como no do reforço negativo, o reforço imedia­ dos ou evitados por respostas que ocorrem em
sua ausência.

Responder Eliciado e Fuga

O motivo da relativa negligência em se pes­


quisar a fuga é que geralmente é fácil aumentar
a probabilidade de respostas (pressionar a barra,
com ratos ou bicar o disco, com pombos) utili­
zando reforço positivo, mas, às vezes, é difícil
fazer isso, utilizando o reforço negativo em pro­
cedimentos de fuga (p. ex., Hoffman & Fleshler,
1959). Essa dificuldade ocorre, ao menos em par­
te, porque a relação temporal entre as respostas
reforçadas e as respostas produzidas por um re-
forçador difere, no reforço positivo, daquela pro­
duzida por reforço negativo. As duas condições
são diagramadas na Figura 6.6.
Atraso no Término do Choque (Segundos)
No reforço positivo, o reforçador está ausen­
FIGURA 6.5 Velocidade relativa da corrida de ratos te quando a resposta reforçada é emitida. Após a
em função do atraso na suspensão do choque para res­ resposta, o reforçador é apresentado e ocasiona
postas de fuga em uma pista de corrida. Quanto mais outras respostas. Por exemplo, se a pressão à
longo o atraso entre o alcance do fim do corredor e a
suspensão do choque, tanto mais lentamente os ratos
barra por um rato é a resposta reforçada, e o ali­
corriam. Cada ponto é baseado nas últimas 4 de 28 ten­ mento é o reforçador, o alimento está ausente
tativas de fuga. (De Fowler e Trapold, 1962, Figura 1.) enquanto, o rato está pressionando; o comer não

118 A . C h a r le s C a ta n ia
REFORÇO POSITIVO: REFORÇO PELA PRODUÇÃO DE COMIDA

Pressão à Barra

Comida

Roer, etc.

REFORÇO NEGATIVO: REFORÇO PELA REMOÇÃO DE CHOQUE

Pressão á Barra

Choque

Pular, etc.
Tempo

FIGURA 6.6 Diferentes relações temporais entre as respostas reforçadas e outras respostas produzidas pelo refor-
çador, no reforço positivo (parte superior) e no reforço negativo (parte inferior). No reforço alimentar, as respostas
de pressão à barra reforçadas já ocorreram quando a apresentação de alimento produz um comportamento (p. ex.,
manipular a comida), de modo que essas respostas não competem muito com as de pressionar. Na fuga do choque,
as respostas produzidas pelo choque (p. ex., pular) ocorrem ao mesmo tempo em que a resposta reforçada de
pressionar a barra deve ocorrer, desta forma, tais respostas competem com as de pressionar.

ocorre senão depois da pressão à barra, quando Da mesma forma, se o reforçador negativo
o alimento é apresentado. Pressionar a barra e for uma luz brilhante, da qual o rato possa fugir
comer ocorrem em momentos diferentes, não ao pressionar a barra, o rato pode reduzir os efei­
competindo diretamente entre si. tos da luz fechando os olhos e escondendo a ca­
No reforço negativo, contudo, o reforçador beça em um canto da câmara experimental. Qual­
negativo está presente antes que a resposta a ser quer movimento de sair dessa posição pode ser
reforçada seja emitida; somente depois da res­ punido pela maior exposição à luz e, assim, é
posta é que o estímulo é removido. Por exem­ pequena a probabilidade de que o rato saia do
plo, se a pressão à barra por um rato é a resposta canto e pressione a barra. Fazer com que um rato
reforçada, e o choque é o reforçador negativo, o apresente um comportamento de fuga da luz por
choque está presente antes da ocorrência da pres­ meio da pressão à barra requer procedimentos
são à barra. O choque produz certas respostas que reduzam a probabilidade de tais respostas
como o saltar eliciado ou algum comportamento competitivas (Keller, 1941).
que reduza o contato com a fonte de choque. En­
quanto o choque está presente e produz estas res­
postas, algumas delas competirão com pressio­ A Ambigüidade da Distinção entre
nar a barra. Uma vez que uma pressão à barra Reforço Positivo e Reforço Negativo
desligue o choque, as outras respostas diminu­
em de freqüência e não mais competem com o Se os estímulos são apresentados ou removi­
pressionar. Mas uma vez que o choque esteja dos, isso pode ser um critério menos importante
ausente, novas respostas de pressionar não po­ na distinção entre um reforço positivo e um re­
dem ter a conseqüência de desligá-lo. forço negativo do que se as respostas geradas

A p re n d iz a g e m 119
pelo reforçador ocorrem em momentos em que no ambiente do organismo e, inevitavelmente,
elas podem competir com a resposta reforçada. conduz a diferenças no responder antes e após a
Um experimento sobre fuga do frio pode servir mudança. Na melhor das hipóteses, podemos
de ilustração para isso (Weiss & Laties, 1961). considerar tais mudanças que produzem um con­
Um rato foi colocado em uma câmara fria, em tínuo de efeitos, que variam entre aqueles em
que as pressões à barra eram reforçadas pela que outras respostas têm alta probabilidade de
operação de um aquecedor. Por um lado, tal pro­ preceder e competir com a resposta reforçada,
cedimento pode ser considerado como reforço até aqueles em que elas não o fazem ou talvez
positivo: ele implica em adicionar energia ao am­ até mesmo contribuam para um aumento da pro­
biente, sob a forma de calor, quando ocorre uma babilidade de ocorrência da resposta reforçada.
pressão à barra. Por outro lado, o frio pode fun­
cionar como um estímulo, pelos seus efeitos so­
bre os receptores de temperatura na pele do rato. ESQUIVA
O frio é a ausência de calor, mas é também um
evento ambiental significativo e potencialmente Na esquiva, o estímulo aversivo não está pre­
aversivo. De acordo com essa interpretação, o sente quando a resposta reforçada ocorre. As
procedimento deveria ser chamado de reforço ne­ duas principais variantes da esquiva são deno­
gativo, pois ligar o aquecedor depois de uma res­ minadas cancelamento e adiamento. O procedi­
posta suprime os efeitos do frio. mento de cancelamento é análogo ao matar um
Na fuga do frio, pode-se facilmente argumen­ pernilongo antes que ele pique você: ao matá-lo,
tar que o reforço envolve tanto a apresentação você evita permanentemente que aquele perni­
quanto a remoção de um estímulo. É fácil en­ longo em particular venha a picar alguém. O pro­
contrar ambigüidades em outras instâncias do cedimento de adiamento é análogo ao colocar
reforço. Poderíamos dizer, por exemplo, que en­ fichas em telefones públicos; neste caso, você
quanto reforçador, a água suprime estímulos adia a interrupção da ligação enquanto continua
aversivos gerados pela boca seca, ou que o ali­ a colocar fichas, mas quando pára de colocar as
mento suprime estímulos aversivos gerados pela fichas, o tempo da última se esgota e a ligação é
depleção de nutrientes na corrente sangüínea (cf. interrompida.
Hull, 1943). Por que, então, a distinção entre re­ Como exemplo de um procedimento de can­
forço positivo e reforço negativo chegou a ad­ celamento, imagine um rato colocado em uma
quirir importância comportamental? câmara com uma barra e um piso de grades, por
Vamos retomar ao exemplo do rato no frio. meio do qual podem ser aplicados choques elé­
Antes que as pressões à barra reforçadas ocor­ tricos breves. Os choques são programados para
ressem, o rato se encolhia em um canto e tremia. serem apresentados uma vez por minuto, mas se
Essas respostas reduziam a probabilidade de que o rato pressionar a barra antes do próximo cho­
ele pressionasse a barra. Quando uma pressão à que, ele é omitido. Neste procedimento o rato
barra ocorria, o aquecedor era ligado e as res­ pode evitar completamente o choque pressionan­
postas competitivas tomavam-se menos prová­ do a barra pelo menos uma vez por minuto. Os
veis, mas um rato que não está mais com frio procedimentos de cancelamento são algumas ve­
não pode fugir do frio. As respostas que compe­ zes conduzidos em tentativas discretas. Por exem­
tiam com a resposta reforçada ocorreram antes, plo, uma luz acende por um período de 30s. Se o
e não depois do reforço, assim este exemplo se rato pressionar a barra durante os 30s, nenhum cho­
parece mais com a fuga do choque do que com a que é apresentado ao final da tentativa; ele somen­
produção de alimento ou água (cf. Figura 6.6). te é apresentado se o rato não pressionar a barra.
Portanto, talvez seja mais apropriado considerar Vamos considerar agora, um exemplo de pro­
que este seja um caso de reforço negativo e não cedimento de adiamento (Sidman, 1953). Dois
de reforço positivo. relógios controlam a apresentação do choque.
Mas não eliminamos completamente a ambi­ Qual dos dois relógios está ativado, depende de
güidade. O reforço sempre envolve uma mudança se o último evento foi um choque ou uma pres­

120 A . C h a r le s C a ta n ia
são à barra. O primeiro relógio mede o intervalo
choque-choque ou intervalo SS, o tempo entre
choques sucessivos quando o rato não pressiona
a barra. Cada vez que o choque é apresentado,
este relógio volta a zero e começa a marcar um
novo intervalo SS. Sempre que o rato pressiona
a barra o controle muda para o segundo relógio.
Este mede o intervalo resposta-choque, ou in­
tervalo RS, o tempo pelo qual cada pressão à
barra adia o próximo choque possível. Enquan­
to este relógio está marcando o tempo, cada pres­
são à barra zera o relógio e inicia um novo inter­
valo RS. Sob essas circunstâncias, o rato pode
adiar o choque indefinidamente, pressionando
sempre a barra antes que termine o intervalo RS
em vigor. Se nenhuma resposta ocorre e um cho­ Intervalo RS (Segundos)

que é apresentado ao final de um intervalo RS, o FIGURA 6.7 Taxa de respostas de pressão à barra pelo
relógio do intervalo SS é reiniciado. Com este Rato 46 em função do intervalo RS, tendo o intervalo
procedimento, chamado de esquiva de Sidmati SS como parâmetro. O intervalo SS é o tempo entre cho­
ou esquiva contínua, o responder de esquiva pode ques, quando nenhuma resposta ocorre entre eles. O
intervalo RS é o tempo pelo qual cada pressão adia o
ser estudado independentemente do responder
próximo choque possível. (Sidman, 1953, Figura IA)
de fuga; o choque pode ser evitado por respos­
tas de esquiva, mas uma vez aplicado, ele é tão
breve que há pouca ou nenhuma oportunidade mente falando, se esse aumento na taxa de cho­
para a emissão de comportamentos de fuga. ques reduz o responder, é apropriado dizer que
Os dados para a pressão à barra por um rato o responder é punido). O rato pode evitar por
são mostrados na Figura 6.7, que apresenta a taxa completo os choques respondendo tão rápido que
de respostas em função do intervalo RS, enquan­ os 2 s nunca se esgotem sem uma pressão à bar­
to o intervalo SS é mantido como parâmetro. ra, mas o aumento nos choques produzido por
Comparando as funções, vê-se que o intervalo taxas mais baixas pode impedi-lo de alcançar tal
RS que produziu a taxa máxima de pressão à desempenho.
barra dependeu do intervalo SS. Primeiro consi­ O comportamento de esquiva pode ser per­
deremos um esquema de esquiva com um inter­ sistente depois de uma longa história de esqui­
valo RS de 6 segundos e um intervalo SS de 2 va; como veremos abaixo, sua extinção pode ser
segundos. Qualquer resposta reduz o choque, e lenta. No entanto, a conseqüência de uma res­
uma taxa de uma resposta a cada 4 segundos, posta de esquiva efetiva é que nada acontece: o
aproximadamente, evita completamente os cho­ evento aversivo é esquivado com sucesso. En­
ques. Quando o intervalo RS é mais curto do que tão, embora seja fácil manter a persistência do
o intervalo SS, contudo, alguns padrões de pres­ comportamento de esquiva, é difícil instalar este
são à barra podem aumentar a taxa de choques comportamento. Isso pode explicar por que me­
em vez de diminuí-la. Por exemplo, considere­ didas de segurança e outros procedimentos pre­
mos agora um esquema de esquiva com um in­ ventivos não são modelados com muita freqüên­
tervalo RS de 2 segundos e um intervalo SS de 5 cia por contingências naturais. Uma pessoa que
segundos. Um rato que nunca pressiona a barra nunca esteve envolvida em um sério acidente de
recebe um choque a cada 5 segundos ou 12 cho­ carro pode estar menos propensa a utilizar o cin­
ques por minuto. Mas, se o rato pressiona a cada to de segurança do que outra que esteve, e al­
3 segundos, um choque é apresentado 2 segun­ guém que nunca teve uma má experiência com
dos depois de cada pressão à barra, e o rato rece­ incêndio pode estar menos propenso a instalar
berá, portanto, 20 choques por minuto (estrita­ um detector de fumaça do que outra pessoa que

A p r e n d iz a g e m 121
já tenha tido. Um problema importante na medi­ estímulo novo ou súbito... Essas reações defensivas
cina é a adesão do paciente às medicações pres­ são eliciadas pela aparição de um predador e pela
súbita aparição de objetos inofensivos. Elas estão
critas. Muitos pacientes param de tomar suas me­
sempre próximas do limiar, de modo que o animal
dicações após o desaparecimento dos sintomas, fugirá, ficará congelado ou ameaçará sempre que
mesmo que doses adicionais pudessem trazer ocorrer qualquer evento de estímulo novo. Não é
benefícios. E com vitaminas ou suplementos necessário que o evento de estímulo seja empare­
minerais que podem prevenir deficiências na die­ lhado com o choque ou a dor, ou algum outro estí­
mulo incondicionado. O rato não corre da coruja
ta, não há conseqüências claras e imediatas que porque aprendeu a escapar das garras dolorosas do
possam ser observadas. Esse problema é comum inimigo; ele corre de qualquer coisa que suija em
a um grande número de medidas preventivas, da seu ambiente e faz isso meramente porque é um rato.
imunização ao controle da natalidade e da puri­ A gazela não foge do leão que se aproxima porque
ficação da água de beber ao uso de instrumentos tenha sido mordida por leões; ela foge de qualquer
objeto grande que se aproxime e faz isso porque esta
cirúrgicos esterilizados. Não deveria causar sur­ é uma das reações de defesa específicas de sua es­
presa que tais medidas sejam muitas vezes difí­ pécie. Nem o rato nem a gazela podem se dar ao
ceis de modelar e de manter. luxo de aprender a se esquivar; a sobrevivência é
urgente demais, a oportunidade de aprender é limi­
tada demais, e os parâmetros da situação tomam im­
possível a aprendizagem necessária. (Bolles, 1970,
Reações de Defesa Específicas da Espécie p. 33)

Uma vantagem dos procedimentos de esqui­ A esquiva, como citado por Bolles, implica
va sobre os procedimentos de fuga é que a res­ em foco de controvérsias. A observação de Bol­
posta reforçada ocorre na ausência do estímulo les diz respeito ao grau em que o comportamen­
aversivo. Assim, outras respostas geradas pelo to de esquiva é aprendido. Sem dúvida, o com­
estímulo aversivo não competem continuamen­ portamento atual pode ser, significativamente,
te com a resposta de esquiva. Não obstante, as­
determinado por variáveis evolutivas (até mes­
sim como é mais fácil fazer com que algumas mo a capacidade do responder a ser reforçada
respostas e não outras funcionem como respos­
deve ter evoluído de alguma forma). E geralmen­
tas de fuga, pode ser também mais fácil fazer
te aceito que o comportamento específico da es­
com que algumas respostas e não outras funcio­
pécie, freqüentemente, limita o que pode ser
nem como respostas de esquiva. Por exemplo, os
aprendido.
pombos evitam choques mais prontamente se eles
Consideremos, por exemplo, a transição do
puderem fazê-lo através da locomoção de um lado comportamento eliciado ao ser emitido na aqui­
para outro da câmara do que através de bicadas (p. sição de esquiva sinalizada em ratos (um proce­
ex., Macphail, 1968). Em procedimentos de es­ dimento de cancelamento). Neste procedimento
quiva, é mais difícil argumentar que tais diferen­
um estímulo-aviso, tal como uma campainha,
ças dependem da competição entre as respostas
precede o choque. Se o rato responde durante a
reforçadas e outras respostas geradas pelo estímu­ campainha e antes do choque, o choque é omiti­
lo aversivo. Tem sido argumentado que as dife­
do; se o rato responde após o início do choque, o
renças surgem porque os organismos são equipa­ choque é removido. Em outras palavras, o rato
dos, de maneira variada, com respostas de defesa
esquiva-se do choque, respondendo durante o
que são específicas da espécie. Sendo assim, o su­
estímulo-aviso; se o rato falha em esquivar-se e
cesso com procedimentos de esquiva dependerá
o choque tem início, então ele foge do choque
de o experimentador escolher uma resposta que o
quando responde.
organismo esteja preparado para emitir em situa­
Em tais experimentos, uma resposta freqüen­
ções aversivas (Bolles, 1970; Seligman; 1970).
temente escolhida é uma forma de locomoção,
Bolles resume o argumento como segue:
tal como saltar um obstáculo ou correr de um
O que mantém os animais vivos na selva é que eles lado para outro da câmara. Além disso, a res­
têm reações defensivas matas muito eficazes, que posta de esquiva é, tipicamente, a mesma que a
ocorrem quando eles encontram qualquer tipo de resposta de fuga. Mas, com ratos, tais respostas

122 A. C h a r le s C a ta n ia
locomotoras tendem a ser eliciadas por estímu­ Sidman era demonstrar o responder de esquiva
los aversivos, mesmo na ausência de uma con­ sem um estímulo-aviso.
tingência resposta-choque. Uma vez que tais res­ Esta concepção de que o estímulo-aviso ad­
postas tenham sido produzidas pelo choque, elas quire suas propriedades aversivas a partir de uma
podem continuar quando o choque estiver au­ relação consistente com o estímulo aversivo e
sente. Assim, as primeiras poucas respostas de de que o término do estímulo-aviso, portanto,
esquiva do rato podem ocorrer, principalmente, reforçava a resposta de esquiva foi chamada de
por causa de sua eliciação anterior pelo choque teoria dos dois processos da esquiva (p.ex., Ka­
(cf. Capítulo 4 e Azrin, Hutchinson, & Hake, min, 1956). A questão principal era a natureza
1967). Após o início do responder de esquiva, do reforçador. Alguns teóricos estavam dispos­
saber se ele continua porque tem a conseqüên­ tos a aceitar o fato da esquiva, sem apelar para
cia importante de prevenir o choque ou porque nenhum evento reforçador que ocorresse no mo­
ele é um caso de comportamento específico da mento da resposta de esquiva. Outros acredita­
espécie, facilmente gerado por situações aversi­ vam que era necessário especificar tal evento.
vas, é uma questão experimental. Quando, como na esquiva de Sidman, o evento
Algumas diferenças também podem depen­ não podia ser localizado em algum estímulo-avi­
der dos determinantes específicos da espécie so ambiental, que terminasse com a resposta de
para o que é aversivo. Por exemplo, demons­ esquiva, esses teóricos passavam, então, a con­
trações de fuga ou de esquiva do som das cor­ ceber o evento com estando dentro do organis­
rentezas de água, por parte de castores, levan­ mo. Argumentava-se, por exemplo, que o esta­
tam a intrigante possibilidade de que a aver- do do organismo, logo após uma resposta de es­
sividade de tais sons contribua para a cons­ quiva, quando o choque não era iminente, era
trução e manutenção de suas represas e tocas reforçador em relação a seu estado muito tempo
(cf. Hartman, 1975). após a resposta, quando um choque poderia ocor­
rer a qualquer momento. O último estado adqui­
riria certas propriedades aversivas por sua rela­
A Natureza do Reforçador na Esquiva ção com o choque e, como um estímulo-aviso,
era suspenso pela resposta. Tal mudança de estado
Outra questão é especificar o que reforça o supostamente ocorria imediatamente com cada res­
responder de esquiva. Quando uma resposta de posta de esquiva, assim, supunha-se que uma ex­
esquiva bem-sucedida ocorre, a conseqüência plicação baseada em outros eventos, em algum
importante é que nada ocorre ao organismo. tempo distante da resposta, seria desnecessária.
Como pode a ausência de um evento afetar o Debates acerca do status de tais teorias so­
comportamento? De acordo com um ponto de bre a esquiva têm uma história complexa (p. ex.,
vista, o responder de esquiva é mantido porque Anger, 1963; Herrnstein & Hineline, 1966; Hi-
o organismo está fugindo de algumas proprieda­ neline, 1977), com alguns até mudando de lado
des da situação que acompanharam os estímulos ao longo do tempo (p. ex., Schoenfeld, 1950,
aversivos passados. Essa noção evoluiu a partir 1969). Gradualmente, as divergências reduziram-
dos primeiros procedimentos em que um estí- se a questões experimentais a respeito das con­
mulo-aviso precedia o choque, e o organismo dições sob as quais as respostas de esquiva po­
evitava o choque, respondendo na presença do dem ser mantidas: é necessário que o organismo
estímulo-aviso. A esquiva era mais facilmente seja capaz de reduzir o número total de choques
adquirida quando terminava o estímulo-aviso e em uma sessão ou será suficiente para o orga­
evitava o choque. Supunha-se que a aversivida- nismo que ele seja capaz de adiar os choques
de do estímulo-aviso era estabelecida por meio individuais, embora o mesmo número total de
de sua relação consistente com o choque e, por­ choques seja apresentado? Ocorre que qualquer
tanto, que essa conseqüência imediata, fuga do uma destas condições pode manter o responder
estímulo-aviso, era o reforçador efetivo. De fato, de esquiva, assim essas questões foram rapida­
um dos propósitos do esquema de esquiva de mente substituídas por outras sobre as operações

A p re n d iz a g e m 123
estabelecedoras que tomam os reforçadores ne­ Neste procedimento, os choques eram admi­
gativos eficazes (Hineline, 1970, 1981). nistrados probabilisticamente, sendo assim, mes­
Uma operação estabelecedora que toma os mo com uma probabilidade de choque que man­
reforçadores positivos mais eficazes é a priva­ tinha o responder de esquiva (p. ex., 0,3 reduzi­
ção. Uma operação análoga para os reforçado­ da para 0,1 pelas pressões a barra; algumas pres­
res negativos é a apresentação de um estímulo sões eram imediatamente seguidas por choque
aversivo que toma sua retirada reforçadora (esta e, alguns períodos sem pressão passavam sem o
operação seria denominada saciação, se o estí­ choque. Deste modo, não existia uma relação
mulo fosse comida e não um choque). Mais ain­ temporal consistente entre respostas individuais
da do que no reforço positivo, esses efeitos esta- e choques individuais. Contudo, a probabilida­
belecedores devem ser distinguidos dos efeitos de de choque aumentava mais rapidamente, em
discriminativos, eliciadores e de outros efeitos média, depois de um período sem respostas do
de estímulos. Além disso, a relatividade do re­ que depois de uma resposta. Assim, quem de­
forço se mantém para o reforço negativo, tanto fendia que a conseqüência imediata do respon­
quanto para o positivo. Um procedimento de es­ der era importante podia argumentar que a re­
quiva envolve transições contingentes a respos­ dução na aversividade média produzida pelo
tas de uma situação para outra, e sua eficácia é pressionar a barra foi suficiente para reforçar
determinada pela situação que se segue à resposta o responder de esquiva. E assim o debate con­
de esquiva, assim como pela que a precede. tinuou.
Um caso em que nem todo choque pode ser Essas posições ilustram a diferença entre as
esquivado é um exemplo. O responder de esqui­ orientações molecular e molar em análise do
va pode ser mantido quando reduz a probabili­ comportamento. A primeira abordagem lida com
dade do choque, mas diferente da esquiva de o comportamento em termos de seqüências de
Sidman, não atrasa sistematicamente todo cho­ eventos, momento a momento, em um dado con­
que? Hermstein e Hineline (1966) programaram texto; a segunda lida com propriedades que po­
um esquema de esquiva em que o choque era dem ser medidas apenas ao longo de extensos
aplicado a um rato, com uma probabilidade es­ períodos de tempo. Por exemplo, uma aborda­
pecificada, ao final de cada 2 segundos. O cho­ gem molecular da esquiva examina os interva­
que ocorria com certa probabilidade se nenhu­ los de tempo individuais que separam respostas
ma pressão à barra ocorresse e, com uma proba­ particulares de choques individuais, enquanto
bilidade diferente, se ocorresse uma pressão à uma visão molar examina a relação mais geral
barra. Por exemplo, em uma dada condição, as entre as taxas de resposta e as taxas de choque
pressões à barra reduziam a probabilidade de cho­ ao longo de uma amostra grande de respostas e
que de 0,3 para 0,2: se o rato pressionasse a barra choques (note-se que a taxa pode ser determina­
pelo menos a cada 2 segundos, ele reduzia a taxa da apenas por meio da amostragem de eventos
de choques de 9 para 6 choques/min. O pressionar ao longo de extensos períodos de tempo).
à barra foi mantido por este procedimento. Essas divergências não foram e talvez não
Consideremos agora um caso em que cada possam ser resolvidas. As propriedades mole­
pressão à barra aumenta a probabilidade de cho­ culares e molares do comportamento podem ser
que de 0,1 para 0,2: pressionando pelo menos importantes em contextos diferentes. Também é
uma vez a cada 2 s, o rato aumenta a taxa de razoável supor que a evolução equipou os orga­
choque de 3 para 6 choques/min. Mesmo que a nismos com a capacidade de responder, diferen-
conseqüência do pressionar seja ainda uma pro­ cialmente, a muitas propriedades das situações
babilidade de choque de 0,2, o rato pára de pres­ em que se encontram. Situações em que um rato
sionar. Em relação à probabilidade inicial de cho­ adie choques entre as tentativas, que não reduza
que de 0,3, a transição para uma probabilidade a taxa total de choques ou que reduza a taxa to­
de choque de 0,2, reforça o responder; em rela­ tal de choques, mesmo que o responder encurte
ção a uma probabilidade incial de 0,1, a mesma o período para o próximo choque, podem ser
probabilidade de 0,2 pune o responder. criadas (Hineline, 1981). Assim, parece não ha­

124 A . C h a r l e s C ata n ia
ver nenhuma justificativa para supor que um or­ exemplo, todos os choques poderiam ser con­
ganismo, cujo responder seja determinado pelas trolados pelo relógio SS; as respostas não mais
propriedades moleculares de uma situação (p. operariam o relógio do intervalo RS. Tal proce­
ex., as relações temporais consistentes entre o dimento interromperia a contingência resposta-
responder e os choques, criadas pelos intervalos choque, mas se o responder tivesse mantido uma
RS e SS da esquiva de Sidman), seria incapaz de taxa baixa de choques, ele também aumentaria
responder de acordo com as propriedades mola­ substancialmente as apresentações de choque.
res de outra situação (p. ex., as relações gerais Desse modo, esse procedimento, por si só, não
consistentes entre a taxa de respostas e a taxa de poderia separar os efeitos da mudança na taxa de
choques estabelecidas por um esquema proba- choque daqueles da mudança na contingência.
bilístico de esquiva). Se isso é assim, não se tra­ Suspender as apresentações do estímulo aver­
ta de escolher uma ou outra abordagem, mas sim sivo tem sido o procedimento de extinção mais
decidir qual abordagem é mais apropriada à aná­ comum em esquiva, mas apresentar o estímulo
lise de uma dada situação. aversivo enquanto interrompe-se as conseqüên­
cias do responder é um paralelo mais próximo
da extinção após reforço positivo. A duração da
EXTINÇÃO extinção depende de qual operação é usada e de
que modo a operação altera a taxa de ocorrência
Como no reforço positivo e na punição, os do estímulo aversivo (cf. Hineline, 1977, pp. 377­
efeitos do reforço negativo são temporários. E, 381). Em qualquer caso, um paralelo de nossa
da mesma forma que nessas operações, os efei­ avaliação da extinção após o reforço positivo e
tos de terminar as contingências entre as respos­ da recuperação após a punição mostra que, tam­
tas e os estímulos aversivos devem ser distin­ bém na extinção após o reforço negativo, os efei­
guidos dos efeitos de simplesmente terminar os tos do reforço negativo são temporários.
estímulos aversivos. Em fuga de choque, desli­
gar o choque elimina o responder simplesmente
porque não há uma ocasião de fuga na ausência PUNIÇÃO POSITIVA E PUNIÇÃO
do estímulo aversivo. No entanto, em esquiva, NEGATIVA
desligar a fonte de choque é, algumas vezes, con­
siderado uma operação de extinção. Se o respon­ A distinção entre reforço positivo e negativo
der em esquiva for mantido a uma taxa tal que é facilmente estendida à punição positiva e ne­
os choques sejam raros, a ausência de choques gativa (embora aqui também sejam possíveis
fará pouca diferença, e o responder continuará casos ambíguos). As respostas podem ser puni­
por um longo período. De fato, uma proprieda­ das por alguns eventos como o choque ou o cor­
de amplamente reconhecida do responder em rer forçado em uma roda de atividade. Elas tam­
esquiva é sua persistência, mesmo após a inter­ bém podem ser punidas pelo término de even­
rupção dos estímulos aversivos. Por essa razão, tos. Por exemplo, a remoção de alimento, con­
a esquiva tem sido considerada relevante para tingente ao pressionar a barra por um rato priva­
alguns casos de comportamentos humanos per­ do de alimento, tende a reduzir a taxa do pres­
sistentes, como em compulsões. sionar. O problema é que é difícil demonstrar se
Consideremos as alternativas. Com reforço isso é uma punição negativa. Se o rato está pri­
alimentar, podemos programar a extinção, quer vado de alimento e a comida está disponível, ele
desligando o comedouro, quer interrompendo a provavelmente comerá em vez de pressionar a
conexão entre as respostas e o comedouro. Am­ barra. Assim, teríamos poucas oportunidades de
bos os métodos têm o mesmo efeito: o alimento punir o pressionar a barra pela remoção do ali­
não é mais apresentado. Não é o que acontece mento (considere a Figura 6.6, com comida e
com a fuga ou a esquiva ao choque. O choque choque trocados). Por essa razão, os estudos em
continua se as respostas não puderem mais re­ punição negativa, geralmente, não têm removi­
movê-lo ou evitá-lo. Na esquiva de Sidman, por do o reforçador positivo; pelo contrário, eles têm

A p r e n d iz a g e m 125
removido um estímulo na presença do qual as tos alternativos que poderiam ser reforçados
resposatas são reforçadas, o que é um paralelo (Winett & Winkler, 1972). A utilização do ti­
da ênfase na esquiva e não na fuga, em estudos meout sem a compreensão de suas bases com-
de reforço negativo. portamentais pode ser contraproducente. Por
Por exemplo, suponhamos que duas barras exemplo, os berçários diurnos modernos para cri­
estejam disponíveis a um macaco e que pressões anças pré-escolares tendem a usar uma área des­
em uma barra produzam alimento sempre que tinada ao timeout e não uma sala isolada. Uma
uma luz estiver acesa. Podemos esperar algumas criança que perturba outras crianças em um gru­
pressões na outra barra, mas este pressionar pode po que está brincando pode ser colocada para
ser punido, fazendo com que cada pressão pro­ sentar por 5 min em um carpete próximo à área
duza um período de tempo durante o qual a luz é de brinquedo, à vista de outras crianças. Supo­
apagada e as pressões na primeira barra não mais nhamos que a criança fique quieta por 4 min e
produzam alimento. Tais períodos são chama­ depois começe a chorar ou a fingir que esteja
dos de suspensão discriminada das contingên­ chorando. A atendente que exigir rigidamen­
cias de reforço (timeout). (Estes procedimentos te 5 min de timeout, provavelmente, irá deixar
são chamados, às vezes, de punição por timeout que a criança retome ao grupo justamente no mo­
do reforço positivo: p. ex., Ferster, 1958. Os pro­ mento em que ela está agindo novamente de for­
cedimentos que sinalizam punição negativa têm ma inadequada; seria melhor “surpreender” a cri­
sido chamados de treino de omissão: Sheffield, ança quando ela estivesse agindo adequadamente
1965; ver também Capítulo 12.) e permitir que ela retomasse ao grupo após 3 ou
O timeout teve origem em experimentos com 4 min (afinal, 4 min sentada quieta é um longo
pombos, ratos e macacos, mas atualmente tal­ período de tempo para uma criança pré-escolar).
vez seja melhor conhecido em aplicações ao
comportamento humano (p. ex., Wolf, Risley, &
Mees, 1964). Por exemplo, um período de tem­ A LINGUAGEM DO CONTROLE
po em uma sala isolada vem sendo empregado AVERSIVO
para punir os comportamentos problemáticos de
crianças institucionalizadas. Mas, como vimos A apresentação ou a remoção de estímulos
em outros exemplos, o julgamento a respeito de pode reforçar ou punir o comportamento. O re­
se alguns eventos particulares serão reforçado- forço é mais eficaz se a resposta reforçada é com­
res ou punitivos, às vezes, é difícil. Quando o patível com o responder ocasionado pelo refor­
time-out foi empregado sozinho com o objetivo çador. Inversamente, a punição é mais efetiva se
de punir a agressividade de uma menina autista a resposta punida for incompatível ou, ao me­
de 6 anos de idade, sua agressividade aumentou nos, independente do responder ocasionado pelo
substancialmente, em vez de diminuir. Essa estímulo punitivo. Assim, pode ser fácil refor­
criança se engajava freqüentemente em compor­ çar o saltar com a remoção do choque (fuga),
tamentos auto-estimulatórios (p.ex., criava esti­ mas pode ser difícil punir o saltar com a apre­
mulação visual, mexendo rapidamente os dedos sentação de choque.
em frente e bem próximos aos olhos), no entan­ Os estímulos que podem reforçar por meio
to, esse comportamento era freqüentemente in­ de sua apresentação podem também punir por
terrompido pelos atendentes. Para ela, um perí­ meio de sua remoção e vice-versa. Temos fala­
odo isolada em uma sala era reforçador, porque do, portanto, de estímulos punitivos, de reforça-
ela podia se engajar em comportamentos de auto- dores negativos e de estímulos aversivos. Cada
estimulação sem ser interrompida (Solnick, Rin­ um foi apresentado em um contexto diferente,
cover, & Peterson, 1977). mas isso foi apropriado porque é o contexto que
Assim como com qualquer forma de puni­ determina as funções comportamentais de qual­
ção, a função principal do timeout é reduzir cer­ quer estímulo. Assim, os estímulos aversivos fo­
tos comportamentos, mas ele é freqüentemente ram apresentados em conexão com os fenôme­
aplicado sem uma atenção para os comportamen­ nos de eliciação, os estímulos punitivos foram

126 A . C h a r l e s C a ta nia
apresentados durante a discussão de conseqüên­ podemos reconhecer a diferença entre os casos
cias que reduzem o responder, e os reforçadores de reforço e os casos de punição. De fato, as di­
negativos foram incluídos como classes de con­ ferenças são freqüentemente tópicos de interes­
seqüências que aumentam a probabilidade da res­ se. Por exemplo, nossa sociedade não é indife­
posta. Seria conveniente se pudéssemos supor rente a um pai se este reforça o comportamento
que cada termo identifica diferentes aspectos de cooperativo com elogio ou se ele pune o com­
uma categoria única de eventos. Poderíamos, portamento não-cooperativo com castigos.
então, falar da permutabilidade do choque como Podemos falar mais facilmente em termos de
um estímulo aversivo, um estímulo punitivo ou um respostas discretas do que em termos de ausên­
reforçador negativo, dependendo da situação. cia de respostas. E, portanto, sempre que possí­
Para muitos estímulos, na maior parte do tem­ vel, são preferíveis as descrições diretas, em ter­
po, tal premissa é possivelmente correta. Se sou­ mos de respostas registráveis como pressões à
béssemos que um estímulo é tão eficaz como um barra ou bicadas no disco, do que as descrições
punidor, esperaríamos, com razão, que ele fosse indiretas em termos do que não está ocorrendo.
eficaz como reforçador negativo; esta consistên­ Um organismo pode exibir mais ou menos com­
cia é parte de nossa justificativa para chamá-lo portamento em momentos diferentes, e não pre­
de aversivo. Consistências devem ser esperadas, cisamos supor que todas os casos sem agir se­
porque as categorias têm origem nas relações jam, em si mesmos, ações. Assim como não pre­
entre as probabilidades de diferentes classes de cisamos alcançar uma temperatura de zero ab­
respostas. Mas estas mesmas probabilidades de­ soluto para reconhecer a temperatura como uma
veriam nos lembrar da relatividade dos reforça­ dimensão da matéria que varia em quantidade,
dores e punidores. Devemos ter cuidado para não tampouco temos que produzir um organismo
considerar tal premissa como garantida. O fato completamente não responsivo para reconhecer
de podermos reforçar facilmente o saltar, remo­ que o comportamento de um organismo é uma
vendo o choque, enquanto não podemos punir dimensão que pode mudar em quantidade. O
efetivamente o saltar apresentando choque, de­ comportamento denominado não-responder (ou
monstra que a simetria entre reforço e punição outro comportamento) é uma classe que permite
tem limites. que a totalidade do comportamento seja cons­
A falta de simetria entre o reforço e a puni­ tante, de modo que quando somadas, as proba­
ção, talvez tenha encorajado algumas tentativas bilidades atingem um, mas isso nos permite um
de reduzir um deles a um caso especial do outro. grau de liberdade grande demais. Se punimos
Alguns casos de punição têm sido descritos em uma resposta, deveríamos saber o que acontece
linguagem de esquiva passiva: ao não respon­ com ela antes que procuremos encontrar uma
der, o organismo estaria passivamente evitando explicação em termos de outros comportamen­
o estímulo programado como um estímulo puni­ tos e deveríamos saber o que mais o organismo
tivo para o responder. Mas, então, da mesma for­ está fazendo antes que comecemos a falar do não-
ma, poderíamos dizer que o não responder (p. responder como comportamento.
ex., não descer de uma plataforma para um piso
eletrificado) é uma resposta que pode ser refor­
çada. Se a linguagem funciona neste caso, por­ A Ética do Controle Aversivo
que não o faria em qualquer caso de punição?
A questão do que conta como comportamen­ As propriedades comportamentais do contro­
to está implícita nestes argumentos. Sempre que le aversivo têm implicações que são consisten­
o responder é punido, podemos dizer que o não tes com os argumentos éticos contra o controle
responder é reforçado, e sempre que o respon­ aversivo. Por exemplo, um pai que programa
der é reforçado, podemos dizer que o não res­ conseqüências aversivas para o comportamento
ponder é punido. Quando estendemos nossa ter­ de uma criança pode adquirir propriedades aver­
minologia dessa maneira, a diferença entre re­ sivas. Na medida em que a criança, então, apren­
forço e punição desaparece. Contudo, geralmente de a fugir da companhia do pai ou a evitá-la, con­

A p r e n d iz a g e m 127
tingências outras que não aquelas disponíveis ao cia, aparecem bastante tempo após a apresenta­
pai poderão começar a influenciar o comporta­ ção do reforçador (o efeito de reforçar diaria­
mento da criança. Mas se a punição parecer a mente a dedicação da criança às tarefas de casa
única técnica disponível para reduzir o perigoso pode não ficar evidente, até que vários dias te­
comportamento autolesivo de uma criança au­ nham-se passado), enquanto que os efeitos da
tista, então, ela poderia representar um mal me­ punição geralmente aparecem imediatamente
nor do que o dano permanente que a criança po­ (um efeito de dar uma palmada ou xingar uma
deria infligir a si própria. Os preceitos éticos criança que esteja provocando alguém de sua
expressam a preocupação com os resultados acei­ família é o que fará com que o provocar pare
táveis ou inaceitáveis de nossas ações, o que imediatamente). Dessa forma, é muito mais pro­
implica que as conseqüências de nossas ações vável que se obtenha conseqüências imediatas
não devem ser ignoradas. apresentando um estímulo punitivo do que apre­
Em uma discussão sobre o status de nossa sentando um reforçador. Isso significa que uma
cultura e seu progresso na descoberta de alter­ pessoa, provavelmente, acha mais fácil apren­
nativas para o controle aversivo, B. F. Skinner der técnicas de controle aversivo do que técni­
chegou à seguinte conclusão: cas de reforço. No entanto, isso não significa que
as técnicas aversivas sejam melhores.
Mesmo na política e no governo, o poder da puni­ Algumas pessoas argumentam contra qual­
ção tem sido suplementado por um apoio mais posi­ quer tipo de modificação de comportamento, tan­
tivo do comportamento que está de acordo com os to envolvendo estímulos aversivos quanto refor­
interesses das agências governamentais. Mas ainda
çadores positivos. Os que fazem uso de tal argu­
estamos longe de explorar as alternativas e não é
provável que façamos qualquer avanço real, enquan­ mento deveriam reconhecer que nosso compor­
to nossa informação sobre a punição e sobre as al­ tamento é modificado a todo instante, tanto por
ternativas à punição permanecer no nível da obser­ contingências naturais como por contingências
vação casual. (Skinner, 1953, pp. 192-193) artificiais criadas pelos que estão à nossa volta.
Negar isso não eliminará tais contingências, e
Skinner incluía técnicas de reforço entre suas um contra-argumento é que nossa melhor defe­
“alternativas para a punição”. Infelizmente, se sa contra o mau uso das técnicas comportamen-
olhamos para o comportamento das pessoas que tais é aprender tanto quanto possível a respeito
detêm o controle de reforçadores e punidores, de como elas funcionam.
veremos que os efeitos do reforço com freqüên­

128 A . C h a r l e s C a ta n ia
Operantes: A Seleção do Comportamento

A. Modelagem: Reforço Diferencial de Vimos como podemos mudar o comporta­


Aproximações Sucessivas mento por meio da apresentação de estímulos e
Seleção Natural e Seleção Artificial na Modelagem da programação de conseqüências para o respon­
der. Uma maneira de se discutir os efeitos des­
B. Diferenciação e Indução sas operações é em termos das posições relati­
Classes de Respostas
Alguns Exemplos de Reforço Diferencial vas de respostas na hierarquia comportamental:
Classes Operantes: Função versus Topografia o comportamento do organismo consiste de um
repertório de respostas, cada uma com uma pro­
C. A Estrutura Operante babilidade diferente. Mas, se restringimos nossa
Reforço Diferencial da Organização Temporal atenção apenas a essas respostas, ignoramos uma
Comportamento Complexo: a Aprendizagem em Labirinto
Seqüências de Respostas: Encadeamento versus Unida­ das características mais interessantes das mudan­
des Temporaimente Extendidas ças no comportamento que são denominadas
Classes Operantes e Comportamento Novo aprendizagem; ignoramos as circunstâncias nas
quais um organismo passa a responder de ma­
neiras novas. Então, devemos examinar como
A palavra operante, que designa uma classe de novas respostas podem ser adicionadas ao reper­
respostas, origina-se do latim opus, work (traba­
lho), que também está na origem de operation tório de um organismo. Neste capítulo, começa­
(operação) e copy (cópia). A palavra classe ori­ mos por considerar a modelagem, um procedi­
gina-se do latim classus, uma parcela dos cida­ mento para gerar novas respostas. Isso nos leva­
dãos romanos elegíveis para o serviço militar e, rá a considerar como as classes de respostas são
talvez, portanto, uma convocação ou chamado. definidas como unidades de comportamento, no
Em classify (classificar), ela está vinculada pelo
sufixo -fy, uma forma do latim facere, a fazer.
conceito de operante. Esse conceito fornece a
Variações de facere aparecem em fact (fato), base para se discutir a estrutura do comporta­
modify (modificar), difpcult (dificultar) e effect (efei­ mento.
to). Em especificar, classe está relacionada a speci­ A resposta pressionar a barra de um rato e a
es (espécies), um nome para um outro tipo de classe de bicar um disco de um pombo tem servido
que é selecionada. Pela forma em latim, esta última
vem do indo-europeu spek-, to see (ver) ou observe como nossos exemplos de respostas. Mas, se sim­
(observar), e está muito relacionada a expect (espe­ plesmente colocamos um rato diante de uma bar­
rar), introspect (introspecção), telescope (telescó­ ra ou um pombo diante de um disco, podemos
pio), skeptic (cético) e spy (espionar). Em ofício, a não observar as pressões ou as bicadas. Com al­
partir de opi- mais -ficere. e assim em fazer o traba­ guns organismos podemos ter sorte e tais res­
lho, a palavra está conectada a operante. O termo
work (trabalho) tem, ele próprio, origens gregas e postas ocorrerão depois de uma espera não mui­
está relacionado a organismo, pelo grego organon, to longa; mas outros organismos podem perma­
tnol (ferramenta). necer tanto tempo sem responder que nossa pa­
ciência esgotar-se-á. O reforço não pode ter qual­ apresentação não-freqüente de reforçadores. A
quer efeito se a resposta a ser reforçada nunca apresentação freqüente de reforçadores leva a
for emitida. Felizmente, há uma alternativa. Em uma saciação mais rápida e pode fortalecer, ex­
vez de esperar pela resposta, o experimentador cessivamente, algumas respostas que, mais tar­
pode gerar uma resposta, reforçando sucessiva­ de, não farão parte da resposta a ser modelada.
mente outras respostas que se aproximem dela, Por outro lado, a apresentação não-freqüente de
cada vez mais estreitamente. reforçadores pode reduzir o responder em geral
e, uma vez que o organismo se toma inativo, todo
o progresso na modelagem, até este momento,
pode ser perdido. Assim, o experimentador deve
Seção A Modelagem: Reforço Diferencial trabalhar dentro de limites impostos por esses
de Aproximações Sucessivas dois extremos, mas não existem regras explíci­
tas para julgar exatamente quais seriam esses li­
Consideremos a resposta de bicar de um pom­ mites para qualquer organismo em particular (cf.
bo. Quando o pombo começa a comer sempre Platt, 1973; Eckerman e col., 1980).
que o comedouro é operado, o experimentador Além disso, algumas características da mo­
passa a operá-lo somente quando o pombo se vira delagem são bastante específicas dos organismos
em direção ao disco; depois de reforçar 2 ou 3 e das respostas particulares em estudo, enquan­
movimentos em direção ao disco, o experimen­ to outras são, geralmente, pertinentes à modela­
tador reforça não qualquer movimento em dire­ gem de uma variedade de respostas, em diferen­
ção ao disco, mas somente aqueles que apresen­ tes organismos. Por exemplo, um experimenta­
tarem o deslocamento do bico para a frente. Neste dor que tenha trabalhado, freqüentemente, com
ponto, o pombo começa a passar a maior parte pombos sabe que reforçar um pequeno movimen­
do tempo em frente ao disco, e o experimenta­ to do bico direcionado diretamente para o disco
dor pode mudar a atenção dos movimentos em estabelecerá a resposta de bicar mais efetiva­
direção ao disco para os movimentos do bico para mente do que reforçar um amplo movimento
a frente. Esses movimentos se aproximam mais lateral do bico que termina em frente do dis­
estreitamente do bicar o disco do que os movi­ co. Por outro lado, quaisquer que sejam a res­
mentos em direção ao disco e, uma vez que re­ posta e o organismo, o experimentador não
forçá-los garante que eles continuarão a ocorrer, deveria perder uma oportunidade de reforçar
não será mais necessário reforçar o virar-se em uma resposta caso ela se aproxime mais es­
direção ao disco. Neste ponto, os movimentos treitamente da resposta a ser modelada do que
do bico para a frente são praticamente bicadas qualquer outra resposta que tenha sido refor­
completas e logo uma delas atingirá o disco. O çada antes.
experimentador pode, então, retirar-se, porque
o equipamento pode ser programado de modo
que as próximas bicadas operarão o comedouro SELEÇÃO NATURAL E SELEÇÃO
automaticamente. ARTIFICIAL NA MODELAGEM
Um experimentador experiente é capaz, em
geral, de modelar a resposta de bicar o disco, em A modelagem é uma variedade de seleção que
um pombo, com dez a quinze reforços. Alguns seria o paralelo ontogenético da seleção filoge-
aspectos das habilidades envolvidas em mode­ nética que ocorre na evolução biológica (Do-
lar podem ser descritos explicitamente. Por nahoe, Burgos, & Palmer, 1993). Essa seleção é
exemplo, reforçar um movimento tende a mode­ mais óbvia quando usada por um treinador hu­
lar o responder mais eficientemente do que re­ mano, como no ensino de habilidades a um cão
forçar uma postura. Outros aspectos não podem de cego (cf. Pryor, 1985; Squier, 1993). Esses
ser formulados tão prontamente. Por exemplo, casos são exemplos de seleção artificial, assim
modelar implica sempre em um meio termo en­ como a criação de gado consiste suma seleção
tre os extremos da apresentação freqüente e da artificial no caso filogenético. Mas, a modela­

130 A . C h a r l e s C a ta nia
gem pode também ocorrer como um resultado anteiras. Se o rato vai ou não mudar para a nova
de contingências naturais. topografia, dependerá conjuntamente do seu
Por exemplo, os pássaros pretos machos, em comportamento, da sua anatomia e do equipam-
diferentes partes dos EUA, cantam diferentes nento. Por exemplo, será menos provável que
dialetos de cantos de pássaros (o pássaro preto ele produza a nova topografia envolvendo tanto
fêmea não canta, fato comum quanto ao canto as patas traseiras e dianteiras, se ele tiver come­
dos pássaros). É mais provável que uma fêmea çado a pressionar com muita força alta pulando
responda com uma postura de acasalamento às sobre a barra, em vez de pressioná-la.
canções que se pareçam mais com as ouvidas na Esse exemplo ilustra dois tipos de seleção
sua juventude, presentes no dialeto dos machos ontogenética, uma gradual e outra relativamente
locais. Quando um macho estrangeiro é introdu­ abrupta. A primeira ocorreu com o contrapeso
zido, ele começa cantando no seu próprio diale­ abaixo do peso do rato, e a segunda ocorreu quan­
to. Mas, ele canta com variações e quanto mais do o seu peso foi excedido. (Existem analogias
tempo passa na presença da fêmea, mais seu can­ na seleção filogenética quando, por exemplo, as
to toma a forma do dialeto local. Seu dialeto mudanças quantitativas graduais relativas à mé­
adquirido é um produto da seleção ontogenética dia da população, produzidas pela seleção, são
natural: as reações diferenciais da fêmea são re- contrastadas com mudanças mais abruptas, pro­
forçadoras e modelam seu canto (p. ex., King & duzidas por eventos ambientais catastróficos. Na
West, 1985). evolução filogenética, as últimas mudanças são al­
Normalmente, a modelagem envolve mudan­ gumas vezes chamadas de saltos', cf. Capítulo 3).
ças quantitativas ao longo de uma ou mais di­ Como ilustrado por esse exemplo, as diferen­
mensões de um comportamento do organismo, tes propriedades de diferentes respostas que de­
mas algumas vezes parece produzir mudanças vem ser modeladas fazem da modelagem uma
qualitativas. Consideremos o seguinte exemplo arte. Essa arte pode ser aplicável a uma varieda­
envolvendo a modelagem da força exercida por de de habilidades como fazer ginástica, namo­
um rato ao pressionar a barra (Catania & Har- rar, tocar um instrumento musical, seduzir, es­
nad, 1988, p. 476). O rato produz comida pressi­ crever à mão ou colocar alguém como vítima de
onando uma barra que possui um contrapeso e um jogo de argumentação. Como esses exem­
que se projeta dentro da câmara, a uma altura plos sugerem, a modelagem pode ser usada para
que requer que o rato fique em pé em suas patas o bem ou para o mal, e muitos utilizam-se dela
traseiras para alcançá-la. Começamos com o con­ mesmo sem saber o que estão fazendo (esses ca­
trapeso ajustado para um nível modesto. Nesta sos também podem ser chamados de seleção na­
situação o rato pressiona facilmente, apoiando tural ontogenética). Assim como no caso do re­
uma ou ambas as patas dianteiras sobre a barra. forço e da punição, quando a modelagem é usa­
Com o passar de reforços sucessivos, aumenta­ da para o bem, deve ser feita com eficiência; e
mos gradualmente o contrapeso, até a força re­ quando é usada para o mal, a melhor defesa é
querida ficar próxima do peso do próprio rato. conhecer como ela funciona.
Uma vez que a força exceda o peso do rato, a A modelagem é baseada no reforço diferen­
resposta de pressionar será efetiva somente se cial: em estágios sucessivos, algumas respostas
emergir uma nova topografia. Empurrar a barra são reforçadas e outras não. Além disso, à medi­
para baixo, com ambas as patas traseiras no chão, da que o responder se altera, os critérios para o
não faz mais efeito. Em vez disso, as patas do reforço diferencial também mudam, em aproxi­
rato sobem do chão. Enquanto suspenso na bar­ mações sucessivas da resposta a ser modelada.
ra, o rato deve agora levantar suas patas trasei­ A propriedade do comportamento que torna a
ras até a parede da câmara, onde uma engrena­ modelagem efetiva é a variabilidade do compor­
gem de arame permite que ele se agarre firme­ tamento. Duas respostas nunca são uma mesma
mente. Mesmo com o contrapeso excedendo o resposta e o reforço de uma resposta produz um
seu próprio peso, o rato pode agora pressionar a espectro de respostas, cada uma das quais difere
barra, puxando-a entre suas pernas traseiras e di­ da resposta reforçada ao longo de algumas di­

A p r e n d iz a g e m 131
mensões como topografia (forma), força, mag­ fizesse movimentos semelhantes no outro extre­
nitude e direção. Dessas respostas, algumas es­ mo da câmara, distante da barra, não chamaría­
tarão mais próximas da resposta a ser modelada mos essas respostas de pressão à barra, não im­
do que outras e podem, então, ser selecionadas, porta o quanto elas se assemelhassem a outras
para serem reforçadas em seguida. Reforçar es­ respostas que antes operaram a barra.
tas respostas, por sua vez, será seguido de ou­ Não podemos discutir o comportamento ape­
tras mais, algumas das quais podem estar ainda nas em termos de respostas isoladas. As respos­
mais próximas da resposta a ser modelada. As­ tas individuais são instâncias de comportamen­
sim, o reforço poderá ser usado para mudar o to, e cada uma pode ocorrer apenas uma única
espectro de respostas, até que a resposta a ser vez; as respostas podem ter propriedades em co­
modelada ocorra. mum, mas não podem ser indênticas em todos
Tal aspecto da modelagem é algumas vezes os aspectos. O reforço de uma resposta produz,
suplementado por outros efeitos de reforçado­ mais tarde, respostas que se aproximam mais ou
res. Alguns reforçadores aumentam a atividade menos estreitamente da resposta reforçada, mas
geral. Por exemplo: a apresentação de comida as respostas subseqüentes não podem ser exata­
toma o pombo privado de comida mais ativo (é mente a mesma resposta. Por outro lado, não po­
difícil, por isso, usar comida para reforçar uma demos agrupar todas as respostas sem distinção,
postura; cf. Blough, 1958). Assim, uma resposta porque ficaríamos sem nada para falar a não ser
mais próxima daquela a ser modelada ocorre, do comportamento em geral. Temos que encon­
ocasionalmente, porque a apresentação de um trar um nível intermediário de análise, em que
reforçador toma o organismo mais ativo. não nos referimos nem a respostas individuais,
Há um paradoxo na modelagem. Diz-se que nem a comportamento em geral, mas sim zelas­
o reforço aumenta a probabilidade da resposta ses de respostas definidas por propriedades em
que é reforçada. Mas, uma resposta nunca é re­ comum (Skinner, 1935a).
petida exatamente. Então, como podemos ape­
lar para o reforço como a base da resposta mo­
delada, quando os reforçadores são apresenta­ CLASSES DE RESPOSTA
dos somente depois de respostas que apenas se
aproximam dela? De fato, se as respostas indivi­ Em experimentos sobre respostas de pressio­
duais nunca são repetidas, como podemos sequer nar a barra com ratos, a barra é conectada a uma
falar de reforço? Apontamos esse problema no chave que se fecha sempre que o rato desloca
Capítulo 1, mas não o resolvemos. A seguir, ve­ suficientemente a barra para baixo e com a força
remos que não podemos lidar apenas com res­ necessária. A propriedade comum a todas as res­
postas singulares; devemos lidar com classes de postas de pressão à barra é esta conseqüência:
respostas. toda pressão à barra que feche o circuito preen­
che o requisito. Definir classes de resposta em
termos de efeitos ambientais em comum é a base
tanto para registrar respostas na classe quanto
Seção B Diferenciação e Indução para programar conseqüências para elas. Por
exemplo, um experimentador poderia registrar
Se observarmos as respostas de pressão à as pressões à barra contando o número de vezes
barra por um rato, podemos notar que o rato pres­ que o circuito se fecha e programando reforços
siona a barra com uma pata, com ambas as pa­ com alimento para todas essas respostas.
tas, sentando-se sobre ela ou até mesmo mor­ Mas, essa classe de respostas estabelecida
dendo-a. Cada uma delas é uma resposta dife­ pelo experimentador tem importância compor-
rente; mesmo quando duas respostas são emiti­ tamental apenas se for afetada pelas operações
das com a mesma pata, elas não seriam idênti­ impostas a ela. Devemos acrescentar uma ques­
cas. Contudo, denominamos todas essas respos­ tão fundamental: as conseqüências modificam a
tas de pressão à barra. Por outro lado, se o rato probabilidade de respostas nesta classe? Se sim,

132 A . C h a r l e s C a ta n ia
ela pode ser chamada de uma classe operante; vação emitida poderia ser apropriadamente cha­
uma classe operante é uma classe de respostas mada de uma classe operante, e essas respostas
afetada pela maneira pela qual ela opera sobre de salivação seriam membros desta classe (cf.
ou funciona no ambiente. As pressões à barra e Harris & Turkkan, 1981, sobre modelagem da
as bicadas no disco são exemplos convenientes, elevação da pressão sangüínea).
mas as classes operantes englobam casos mais Um operante é uma classe que pode ser mo­
extensos e complexos. dificada pelas conseqüências das respostas in­
Nos primórdios da Psicologia da Aprendiza­ cluídas na classe. Essa definição de classe de res­
gem, quando o comportamento operante era de­ postas depende de propriedades comportamen-
nominado instrumental ouvoluntário, supunha- tais do responder e não de propriedades fisioló­
se que somente as respostas da musculatura es­ gicas, como a distinção somática-autonômica. As
quelética poderiam fazer parte de classes de res­ propriedades comportamentais de classes ope­
postas modificáveis por suas conseqüências. Ou­ rantes são baseadas na operação denominada
tras classes de respostas, chamadas de autonô­ reforço diferencial, isto é, o reforço de apenas
micas., tais como as das glândulas e dos múscu­ algumas das respostas que se incluem em uma
los lisos, não haviam se mostrado modificáveis determinada classe. Essa operação torna o res­
da mesma maneira. Tais respostas eram tipica­ ponder subseqüente cada vez mais estreitamen­
mente eliciadas e os procedimentos de condicio­ te ajustado às propriedades definidoras da clas­
namento de Pavlov (ver Capítulos 2 e 12) ha­ se. A característica essencial de um operante é a
viam mostrado como estímulos novos poderiam correspondência entre uma classe de respostas
passar a eliciá-las. Naquela época, era negligen- definida por suas conseqüências e o espectro de
ciável a evidência de que essas respostas pode­ respostas geradas por essas conseqüências.
riam ser modificadas por meio de reforço ou de
punição. Além disso, era possível argumentar que
tais mudanças nas respostas autonômicas eram ALGUNS EXEMPLOS DE REFORÇO
mediadas por outros tipos de comportamentos DIFERENCIAL
(como quando exercícios aumentam a taxa de
batimentos cardíacos). Coloquemos um rato privado de alimento em
Apesar das controvérsias (p. ex., Dworkin & um câmara com uma fenda horizontal de 30 cen­
Miller, 1986), algumas respostas autonômicas tímetros de comprimento em uma das paredes
parecem modificáveis por suas conseqüências. (30 cm equivalem a aproximadamente 12 pole­
Consideremos a resposta de salivar. A salivação gadas). Células fotoelétricas registram onde o
pode tanto ocorrer espontaneamente como ser rato introduz seu nariz, ao longo da fenda. Rotu­
eliciada por um estímulo como o alimento na laremos cada segmento sucessivo de 2 centíme­
boca (p. ex., Zener & McCurdy, 1939; cf. Capí­ tros ao longo da extensão da abertura como
tulo 4). Podem-se programar conseqüências para posições 1 a 15, da esquerda para a direita.
a salivação espontânea ou emitida, medida em Pelotas de alimento podem ser apresentadas
gotas de salivas. Contudo, a conseqüência para em um comedouro na parede oposta à da fen­
a salivação não pode ser um alimento, porque da. As apresentações de pelotas são acom pa­
seria difícil distinguir o efeito do alimento como nhadas por um ruído característico, e o rato
reforçador de seu efeito como um eliciador de rapidamente vai ao comedouro e come sem­
salivação. Como a água não elicia salivação, ela pre que uma pelota é apresentada (cf. Antoni-
poderia ser usada para reforçar a salivação em tis, 1951).
cachorros privados de água (Miller & Carmona, De início, o rato passa apenas um tempo cur­
1967). A salivação aumentou quando produzia to próximo à fenda na parede. Ocasionalmente,
água (reforço) e diminuiu quando impedia a apre­ cheira a fenda e introduz o focinho nela, ao mes­
sentação de água (punição). Essas respostas au­ mo tempo que se movimenta ao longo da pare­
tonômicas de salivação foram modificadas por de, mas essas respostas são relativamente infre-
suas conseqüências; em outras palavras, a sali­ qüentes e não têm qualquer relação sistemática

A p r e n d iz a g e m 133
com as posições ao longo da fenda. Uma distri­
buição de freqüência das respostas do rato em
A □ Não-reforçadas
função da posição é mostrada em A, na Figura ^ Reforçadas
7.1.
Agora vamos reforçar a resposta do rato, de
introduzir o focinho na fenda, mas somente se
as respostas ocorrerem nas posições de 9 a 12. O
efeito inicial do reforço, ilustrado no painel B,
não se restringe somente àquelas posições cor­ -r-n -T l PI í~ l I
relacionadas com o reforço; ele aumenta o res­ 1 5 10 15
ponder em todas as posições. Esse fenômeno, a r b r I
extensão do efeito do reforço a outras respostas
não incluídas na classe reforçada, é denominado
indução (um sinônimo ocasional é o de genera­
lização de respostas). No exemplo, reforçar as
respostas nas posições de 9 a 12 afetou não so­
mente o responder naqueles locais, mas também
o responder nas outras posições ao longo de toda -rrr^TTrlM-7-n
1 5 10 15
a fenda.
À medida que continuamos o reforço dife­ f C |--------------1

rencial, reforçando as respostas nas posições 9 a


12, mas não em outras posições, o responder «
aumenta gradualmente nas posições correlacio- R
nadas com o reforço, enquanto decresce nas de- ir
mais posições, como mostrado em C,D e E. Fi­
nalmente, a maioria das respostas ocorre dentro
dos limites que determinam se uma resposta deve
ser reforçada, como em E, e pode-se chegar a
um ponto onde, mesmo que ainda ocorram algu­
mas respostas não-reforçadas, a distribuição de

FIGURA 7.1 Distribuições hipotéticas de respostas, que ilustram os


efeitos de reforço diferencial sobre a localização da resposta. Um rato
introduz o focinho ao longo de uma fenda horizontal, em uma das
paredes da câmara; células fotoelétricas registram essa resposta em
qualquer uma das quinze posições da esquerda para a direita. A dis­
tribuição de posições de resposta, quando nenhuma resposta é refor­
çada, é mostrada em A. De B a E, as respostas nas posições de 9 a 12
(demarcadas pelas linhas tracejadas verticais) são reforçadas com
alimento; as áreas cheias representam as respostas reforçadas. Em B,
os efeitos do reforço estendem-se a respostas ao longo da fenda; esta
dispersão é chamada de indução. De C a E, as respostas ficam mais e
mais restritas à faixa de posições correlacionadas com o reforço; esse
estreitamento ou concentração do efeito do reforço é denominado di­
ferenciação. Com a continuação do reforço diferencial, a distribuição
de respostas toma-se estável e corresponde bem estreitamente, como 1 5 10 15
em E, à classe de respostas correlacionada com o reforço. Posição

134 A . C h a r l e s C a ta n ia
respostas ao longo das posições não muda com tarde, como em E). As duas classes não preci­
a continuação do reforço diferencial. sam corresponder exatamente. De fato, o grau de
Neste exemplo, a distribuição de respostas correspondência entre (1) o comportamento que é
emitidas passou a se circunscrever estreitamen­ reforçado e o (2) comportamento gerado por esse
te aos limites da classe de respostas reforçadas. reforço é uma dimensão fundamental de qualquer
Esse processo é chamado de diferenciação, e o classe de respostas reforçadas. O comportamento
responder estabelecido dessa maneira é denomi­ que é reforçado é chamado de (1) classt descritiva
nado diferenciado. O reforço diferencial estabe­ ou nominal, o comportamento gerado pelo refor­
leceu uma classe de respostas definida em ter­ ço é chamado de (2) classe funcional.
mos de posição da resposta. Contudo, se a dis­ Consideremos agora um outro exemplo hi­
tribuição de respostas em E representa a dife­ potético, ilustrado na Figura 7.2. Usamos nova­
renciação máxima possível, o que dizer sobre as mente células fotoelétricas para registrar as po­
respostas que continuam nas posições 6, 7, e 8 sições nas quais o rato introduz seu focinho na
ou nas posições 13,14 e 15? Elas estão fora dos fenda, mas desta vez a fenda é vertical, e não
limites da classe de respostas correlacionadas horizontal. As quinze posições são numeradas
com o reforço e, de acordo com uma interpreta­ consecutivamente de baixo para cima. Inicial­
ção rigorosa das propriedades definidoras de ope­ mente, o rato introduz o focinho na fenda, oca­
rantes, não podem ser contadas como membros sionalmente, à medida que explora a câmara, mas
da classe operante. Elas podem, no máximo, ser essas respostas ocorrem predominantemente nas
descritas em termos de indução: essas respostas posições mais baixas, como emA, na Figura 7.2.
estão tão próximas da classe de respostas refor­ Talvez uma resposta ocorra na posição 15, no
çadas ao longo do contínuo de posição que os topo da fenda, se formos pacientes o bastante
efeitos do reforço da classe reforçada se esten­ para esperar. Mas pode ser que não. A modela­
deram a elas, a partir da classe reforçada. Essa gem é uma opção melhor.
perspecdva simplesmente atribui o responder, O reforço é programado inicialmente para
dentro dos limites da classe reforçada, à diferen­ respostas nas posições de 7 para cima, como em
ciação e o responder fora desses limites, à indu­ B. O responder aumenta, mas a maioria das res­
ção. A mesma operação gera tanto o responder postas permanece nas posições mais baixas. Mais
dentro como fora desses limites e este responder tarde, o critério de reforço diferencial é aumen­
pode ser representado como uma distribuição ao tado para 9, como em C. Neste ponto, o respon­
longo de um contínuo. der nas posições mais baixas da fenda chegou a
A dificuldade pode ser resolvida reconhecen­ diminuir, a distribuição mudou para posições
do-se que esse exemplo, de fato, envolve duas mais altas e, pela primeira vez, ocorreram res­
classes diferentes. A primeira classe (1) é a base postas na posição 13. Quando a modelagem con­
para a operação de reforço e é representada pe­ tinua, com o aumento do critério para a posição
las linhas tracejadas verticais na Figura 7.1; es­ 11, o responder torna-se mais concentrado na
tas linhas mostram como as conseqüências (co­ região correlacionada com o reforço, em D. Fi­
mida) dependem da posição da resposta. As li­ nalmente, em E, o critério é elevado para a posi­
nhas mostram as probabilidades condicionais da ção 13. Se este critério tivesse sido imposto ao
comida, dada uma resposta, em função da posi­ desempenho inicial, em A, talvez não tivesse
ção; a probabilidade é 1,0, dadas as respostas ocorrido nenhuma resposta reforçável. Com o
nas posições 9 a 12; e é zero em qualquer outra reforço diferencial de aproximações sucessivas,
posição. Essa distribuição define uma classe de entretanto, a distribuição de respostas mudou
respostas em termos das conseqüências das res­ para as posições mais elevadas, com uma fre­
postas dentro daquela classe. A segunda classe qüência máxima de respostas na posição 12.
de respostas (2) é dada pelo desempenho efeti­ Contudo, esse máximo permanece abaixo do li­
vamente produzido pelo reforço. Esta classe é mite que separa as respostas reforçadas das não-
representada, a qualquer momento, pela distri­ reforçadas e, nessas circustâncias, há mais res­
buição real de respostas (p. ex., no início do cur­ postas não-reforçadas do que reforçadas. A base
so do reforço diferencial, como em C, ou mais para esse resultado é simples: o rato pode alcan-

A p r e n d iz a g e m 135
çar algumas posições mais facilmente do que ou­
□ Não-reforçadas
tras. Mas quais são as implicações desse resul­
052 Reforçadas
tado para a definição de classes de respostas em
100 termos de suas conseqüências?
Neste caso, a classe de respostas definida
pelas conseqüências (respostas nas posições 13
e acima, que eram reforçadas) diferiu da classe
de respostas gerada por aquelas conseqüências
(responder até a posição 15, mas com um máxi­
mo na posição 12). O responder foi obviamente
modificado por suas conseqüências, mas parte
dele permaneceu fora dos limites do critério de
100
reforço. Não podemos falar de qualquer classe
separadamente; os operantes devem ser defini­
dos em termos da relação entre (1) o ambiente
(as conseqüências que ele programa para as res­
il—L.-L.i i t u fà n m tn I I I postas) e (2) o comportamento (o responder pro­
10 15 duzido por essas conseqüências). Por conveni­
ência, ocasionalmente falaremos de um operan­
te apenas em termos de uma classe definida pe­
las conseqüências ou somente em termos da dis­
Respostas

100
tribuição gerada por essas conseqüências, mas é
importante lembrar que o operante é mais rigo­
!
rosamente definido em termos da correspondên­
cia entre as duas classes.
.r f - r n - r u O reforço inclui, inevitavelmente, diferencia­
10 15
ção. Respostas como pressões à barra e bicadas
r D em um disco devem ocorrer em um local parti­
cular e ter força suficiente, caso contrário não
100

FIGURA 7.2 Exemplos hipotéticos de modelagem (reforço dife­


rencial de aproximações sucessivas a uma resposta). A situação é
similar àquela da Figura 7.1, exceto que a fenda é vertical, e não
horizontal, e as quinze posições são numeradas de baixo para
cima, ao longo da fenda. Novamente, as áreas vazias representam
as respostas não-reforçadas e as áreas cheias representam as res­
postas reforçadas. Antes do reforço, em A, ocorrem mais respos­
tas nas posições mais baixas do que nas posições mais altas, ao
100 - longo da fenda. Em B, são reforçadas as respostas da posição 7
para cima; o limite inferior de respostas reforçadas é mostrado
pela linha tracejada vertical. Depois que esse reforço diferencial
tem algum efeito, o critério de posição é mudado para 9, em C.
Mais tarde, o critério passa para a posição 11, em D e, finalmen­
te, para a posição 13, em E, quando a modelagem produz algu­
mas respostas na posição 15, a posição superior da fenda, o que
não havia sido observado antes do reforço. Contudo, a distribui­
ção de respostas mantidas neste ponto tem sua freqüência máxi­
ma na posição 12, logo abaixo da posição mínima requerida para
reforço.

136 A . C h a r l e s C a ta n ia
produzirão as conseqüências programadas para mento e passam o tempo batendo a cabeça com
elas. Poderíamos repetir os exemplos das Figu­ força e mordendo-se, de modo que não pode­
ras 7.1 e 7.2, substituindo a localização da res­ mos distinguir entre as crianças pela topografia
posta por dimensões como força da pressão à de seus comportamentos. Contudo, descobrimos
barra ou da bicada no disco. Esses exemplos ilus­ que a primeira criança aumenta esse comporta­
tram a seleção do comportamento por suas co- mento quando as pessoas estão por perto, mas
seqüências. Ao longo da vida de um organismo não prestam atenção nela; a segunda criança au­
individual, a seleção de populações de respostas menta o comportamento autolesivo quando os
é análoga à seleção de populações de organis­ outros pedem a ela que complete alguma tarefa
mos ao longo do tempo evolucionário. Ambos (p. ex., leitura ou aritmética simples); e a tercei­
os tipos de seleção envolvem classes criadas ra apresenta o comportamento independentemen­
pelas contingências (cf. Capítulos 3 e 21). te do contexto social. Para esses três meninos,
os comportamentos autolesivos são muito simi­
lares em topografia, mas suas funções são com­
CLASSES OPERANTES: FUNÇÃO pletamente diferentes. Para a primeira criança o
VERSUS TOPOGRAFIA comportamento de autolesão chama a atenção; para
a segunda, ele evita ter que obedecer a exigências;
Vimos como classes de comportamento po­ e para a terceira, o comportamento não parece de­
dem ser criadas por meio de reforço diferencial. pender de qualquer contingência do meio.
Parece, de início, que essas classes são defini­ Tais análises recomendam programas de tra­
das por suas propriedades topográficas (o que tamento muito diferentes para cada menino. Ao
elas parecem). Mas não é assim. Consideremos, primeiro devem ser ensinadas outras formas mais
mesmo que superficialmente, uma simples resposta efetivas de conseguir a atenção dos outros, e ele
como a pressão à barra pelo rato. O rato pode pres­ deve ser colocado em situações onde será me­
sionar a barra com sua pata esquerda ou com a nos privado de atenção. As tarefas selecionadas
direita ou com ambas as patas. Ele pode também para a segunda criança devem ser apropriadas
pressionar a barra para baixo com o focinho ou para sua competência e seu sucesso nestas tare­
pulando nela ou sentando sobre ela. Essas respos­ fas deve ser reforçado (seu comportamento su­
tas parecem bem diferentes umas das outras, mas gere que foi freqüentemente punido no passa­
todas elas contam como pressões à barra; todas do). A fonte do comportamento autolesivo da
são membros de uma mesma classe operante. Ape­ terceira criança é desconhecida, e devemos
sar de suas diferenças, elas são membros daquela considerar a possibilidade de que ele tenha
classe porque compartilham uma função comum: alguma fonte orgânica (talvez a criança tenha
todas produzem as mesmas conseqüências. nascido de uma mãe usuária de drogas e te­
Em outras palavras, os operantes são defini­ nha sofrido danos no desenvolvimento cere­
dos por suas funções e não por suas formas. O bral pré-natal).
problema do comportamento autolesivo em O fato é que é mais importante definir as clas­
crianças com atrasos no desenvolvimento ilus­ ses de comportamentos por suas conseqüências
tra a importância desta distinção (p. ex., Iwata e do que por suas topografias. Embora o compor­
col., 1990; 1994; Lovaas & Simmons, 1969; tamento autolesivo seja parecido para as três
Wahler, 1975). Este comportamento pode incluir crianças, a atenção produzida pelo comportamen­
bater a cabeça com força, morder a própria pele to da primeira criança o distingue do comporta­
até sair sangue, colocar o dedo no espaço entre o mento de esquiva da segunda criança; algum as­
globo ocular e a cavidade ocular e muitas outras pecto de auto-estimulação pode estar envolvido
topografias. Esse é um comportamento perigoso no comportamento da terceira criança, mas infe­
e as crianças que se engajam nele podem oca­ lizmente não sabemos o bastante sobre tais ca­
sionar danos permanentes para si mesmas. sos.
Consideremos três crianças do sexo mascu­ Vamos agora nos concentrar na primeira
lino que apresentam um comportamento autole­ criança. Suponhamos que tentássemos extinguir
sivo. Elas estão alojadas em um centro de trata­ o comportamento autolesivo, ignorando-o. Em

A p r e n d iz a g e m 137
primeiro lugar, poderíamos ter problemas para
Seção C A Estrutura Operante
fazê-lo, porque não podemos tolerar os danos que
a criança pode provocar em si mesma. Contudo,
se formos persistentes, poderemos descobrir que Vimos que o responder pode variar não so­
o comportamento autolesivo não diminui. Uma mente quanto ao local ou força, mas também
possibilidade é que não tenhamos identificado quanto à topografia ou forma, à direção e assim
adequadamente a classe de comportamentos re­ por diante. O reforço diferencial pode ser basea­
levante. A topografia novamente nos enganou. do em qualquer dimensão de resposta, de modo
Se a função deste comportamento é chamar a que qualquer dimensão ou combinação de dimen­
atenção, ele provavelmente é parte de uma clas­ sões pode fornecer as propriedades definidoras
se de comportamentos muito maior, que inclui de uma classe operante. Vamos explorar agora a
gritaria e fazer diabruras, bater ou até agredir os diferenciação de classes operantes ao longo das
atendentes no centro de tratamento, e um grande dimensões que tem sido objeto de temas teóri­
número de outras respostas que devem funcio­ cos significativos na história da Psicologia da
nar para conseguir atenção. Isso nos diz o quan­ Aprendizagem. Nossos exemplos incluem a or­
to a atenção é importante para esta criança. Isso ganização temporal do comportamento, seu pa­
também nos lembra que não podemos definir as drão seqüencial e a novidade e a variabilidade
classes de respostas pela sua aparência. Neste comportamental.
caso, devemos definir um programa de tratamen­
to que use atenção para reforçar comportamen­
tos efetivos e apropriados. Tanto a criança como REFORÇO DIFERENCIAL DA
os seus atendentes serão beneficiados se o pro­ ORGANIZAÇÃO TEMPORAL
grama tiver sucesso.
O comportamento autolesivo era uma classe As propriedades temporais do responder in­
de comportamentos embutida em uma classe cluem a latência, a duração e o ritmo. Quaisquer
maior de comportamentos de chamar a atenção dessas propriedades podem servir de base para
(cf. Lalli e col., 1995). A classe maior foi esta­ o reforço diferencial. Por exemplo, em um pro­
belecida como classe por causa das conseqüên­ cedimento que reforce diferencialmente longas
cias comuns dos seus membros, assim como as latências, as bicadas de um pombo em um disco
várias topografias de pressão à barra (pata direi­ iluminado podem ser reforçadas com alimento
ta ou esquerda, ambas as patas, sentar na barra) somente se um intervalo mínimo de tempo tiver
passaram a fazer parte de uma mesma classe pela transcorrido desde a iluminação do disco. Quan­
conseqüência comum de produzir comida. As do a latência-critério é menor do que 10 segun­
conseqüências comuns são o elo que une as clas­ dos, a latência-média do pombo geralmente ex­
ses de comportamentos (cf. Malone, 1990, p. cede o critério e há mais respostas reforçadas do
296). Além disso, quando uma classe de respos­ que não-reforçadas, mas à medida que o critério
tas parece insensível às suas conseqüências, de latência se toma mais longo, menos respostas
como quando o comportamento autolesivo da têm latências longas o suficiente para preenche­
primeira criança parecia não se extinguir, deve­ rem o requisito para reforço, e proporções me­
mos considerar a possibilidade de que tenhamos nores de bicadas são reforçadas (a tendência do
definido mal a classe e de que ela seja parte de responder a ultrapassar o critério para reforço
uma classe maior, de modo que os outros nas durações mais curtas e a ficar abaixo dele
membros desta classe mais ampla continuam nas durações mais longas é uma característica
a ter as conseqüências que, antes, comparti­ comum a inúmeros desempenhos gerados pelo
lhavam com a subclasse que estamos focali­ reforço diferencial de propriedades temporais do
zando (p. ex., o comportamento de chamar a comportamento, tanto em humanos como em
atenção do presente exemplo; cf. Capítulo 9, infra-humanos: Catania, 1970).
sobre as classes de comportamento de ordem A diferenciação de propriedades temporais
superior). do comportamento é relevante para os esquemas

138 A . C h a r l e s C a ta nia
de reforço, tratados em detalhe no Capítulo 10. ponder. No desempenho em DRL a taxa do res­
Veremos que quantidades substanciais de com­ ponder diminui, porque a probabilidade de res­
portamento podem ser mantidas, mesmo quan­ postas precedidas por pausas longas (IRTs lon­
do as respostas produzem o reforçador apenas gos) aumenta. Assim, no responder em DRL, o
ocasionalmente. Nos esquemas de reforço, as IRT deve ser considerado um componente de um
respostas podem ser elegíveis para reforço com operante complexo, consistindo de um IRT mais
base no número de respostas já emitidas, no tem­ uma resposta, nesta ordem.
po transcorrido desde algum evento ou em algu­ No segundo exemplo, em que o reforço de­
ma combinação dessas condições. Uma proprie­ pende da emissão de 20 ou mais bicadas em não
dade de particular interesse é a separação de res­ mais que 5 segundos, o responder pode aumen­
postas no tempo. tar, mas apenas porque a taxa alta de respostas
Por exemplo, um motorista pode ter êxito em foi reforçada diferencialmente. Tal esquema é
ligar um carro afogado apenas se esperar o sufi­ denominado reforço diferencial de taxa alta ou
ciente depois da última tentativa de ligá-lo; de esquema DRH. O esquema DRH tem recebido
modo inverso, alguém pode conseguir encher o menor atenção do que o DRL, simplesmente
pneu de uma bicicleta, com uma bomba defei­ porque é mais difícil de trabalhar com esquemas
tuosa, que vaza ar, apenas se bombear bem rapi­ DRH do que com DRL. Considere um pombo
damente. De maneira análoga, o reforço pode ser cuja bicada tenha tido a taxa aumentada para mais
programado para uma bicada de um pombo so­ do que 4 respostas por segundo, por um esque­
mente se aquela bicada tiver sido precedida por ma DRH que requeira 20 bicadas em 5 segun­
10 segundos sem nenhuma outra bicada, ou so­ dos. (De fato, um experimentador habilidoso
mente se o bicar tiver sido emitido tão rapida­ pode, aumentando gradualmente o critério, pro­
mente que ao menos 20 bicadas tenham ocorri­ duzir rotineiramente taxas que excedam 10 bi­
do nos últimos 5 segundos. No primeiro caso, o cadas por segundo, em pombos.) Enquanto o
bicar diminui de freqüência, no segundo ele au­ pombo mantiver esta taxa, as bicadas produzi­
menta. rão reforçadores freqüentemente. Mas, se, por
Contudo, se focalizamos apenas o bicar, so­ alguma razão, o pombo reduz a velocidade do
mos levados a dizer que o primeiro caso não era responder, bicando a uma taxa que atinge o cri­
uma instância de reforço. De fato, a unidade do tério de reforço menos freqüentemente, as bica­
responder reforçada no primeiro caso não era das produzirão reforçadores menos freqüentes.
uma bicada e sim uma seqüência, incluindo uma Isso, por sua vez, reduz ainda mais a taxa de bi­
pausa mais uma bicada. Na medida em que essa cadas, o que leva, novamente, a um decréscimo
combinação toma-se mais provável (demonstran­ na freqüência de reforçadores. Esse círculo vi­
do assim o efeito dos reforçadores sobre a classe cioso pode terminar em uma taxa de respostas
de respostas que os produziu), a taxa de bicar tão baixa que o critério para reforço nunca é
necessariamente diminui. atingido, e as bicadas do pombo podem cessar
O procedimento no primeiro exemplo, no completamente. Para reinstalar o responder, o ex­
qual uma resposta é reforçada somente se for perimentador terá que estabelecer novamente o
precedida por um tempo mínimo sem uma res­ desempenho de taxa alta por meio de modelagem.
posta, é denominado reforço diferencial de taxa No esquema de DRL, no entanto, um efeito
baixa ou esquema DRL (Ferster & Skinner, inicial dos reforçadores que seguem as bicadas
1957); o procedimento é denominado, também, é que as bicadas ocorrem mais freqüentemente.
esquema de tempo entre respostas ou reforço de Essa taxa mais alta de bicadas significa que elas
IRTs (Mallot & Cumming, 1964), porque o re­ ocorrem mais próximas no tempo e, então, me­
forço é baseado no espaçamento temporal de res­ nos IRTs são longos o bastante para atingir o cri­
postas individuais, e não na taxa média gerada tério de reforço. Assim, a apresentação de refor­
por muitas respostas que ocorrem ao longo de çadores diminui, e a taxa de resposta, por sua
um período extenso de tempo. Em geral, quanto vez, também diminui. Mas esse decréscimo na
mais longo o tempo entre as respostas ou o IRT taxa simplesmente toma os IRTs longos o bas­
requerido para reforço, mais baixa a taxa do res­ tante para atingirem com maior probabilidade o

A p r e n d iz a g e m 139
critério de reforço. Assim, o bicar oscila entre zer que elas são punidas negativamente. Nesse
taxas altas acompanhadas por decréscimo no re­ caso, assim como no caso de distinguir entre o
forço e taxas reduzidas acompanhadas por au­ reforço positivo do não-responder e a punição
mento no reforço. O bicar pode ser mantido, por negativa do responder, seria preferível falar de
essas contingências, por extensos períodos de respostas específicas, em vez de falar de sua au­
tempo. sência. Mas a terminologia do DRO está bem-
Estes exemplos indicam que devemos ser estabelecida e, embora potencialmente proble­
cautelosos quando tomamos a taxa de respostas mática, pelo menos especifica um procedimen­
como uma medida fundamental dos efeitos do to, em vez de atribuir propriedades funcionais a
reforço. A taxa de respostas já chegou a ser con­ eventos como o não-responder.
siderada uma medida fundamental dos efeitos do
reforço (cf. força do reflexo, no Capítulo 4; Ne-
vin, 1992), mas, com o reconhecimento de que a COMPORTAMENTO COMPLEXO:
taxa era apenas uma propriedade do comporta­ A APRENDIZAGEM EM LABIRINTO
mento que poderia ser diferenciada, como ou­
tras propriedades tais como força e topografia, A maioria de nossos exemplos até agora en­
essa noção se tomou menos defensável. Embora volveu unidades de respostas relativamente dis­
o responder sob DRL ocorra a uma taxa baixa, o cretas, como pressionar a barra, para ratos, e bi­
responder é facilmente estabelecido e sustenta­ car discos, para pombos. Mas nossa análise da
do; e embora o responder sob DRH ocorra a uma diferenciação indica que as seqüências comple­
taxa alta, ele é difícil de se estabelecer e é frágil, xas de respostas também podem ser tratadas
quando estabelecido. como classes operantes. Por exemplo, o percur­
Existem várias outras classes de esquemas de so de um rato em um labirinto pode ser conside­
reforço diferencial, como o reforço diferencial rado uma resposta única, mas muito complexa.
de responder espaçado, que estabelece limites Consideremos o labirinto mais simples, o labi­
tanto inferiores quanto superiores para os IRTs rinto em T (C, na Figura 5.2). Se a caixa-alvo
que precedem uma resposta reforçada e que ten­ esquerda está vazia, e a caixa-alvo direita con­
de a gerar uma taxa de respostas razoavelmente tém alimento, a seqüência de respostas que in­
constante. O reforço diferencial de outro com­ clui correr da caixa de saída até o ponto de esco­
portamento (geralmente abreviado como DRO lha, virar à direita e, então, correr à caixa-alvo
e ocasionalmente chamado de reforço diferen­ da direita será reforçada. As seqüências que in­
cial de comportamento zero) apresenta um re­ cluam virar à esquerda não serão reforçadas ou,
forçador na condição de que decorra um tempo pelo menos, não levarão ao reforçador tão rapi­
definido sem uma resposta especificada. Este é, damente (se o rato tiver oportunidade de refazer
de fato, o nome técnico para o procedimento o caminho da caixa-alvo esquerda para a caixa-
geralmente usado para programar o reforço para alvo direita). A medida que o rato começa a es­
um responder alternativo, durante a extinção de colher mais e mais freqüentemente a trilha da
um comportamento, em situações de aplicação direita, podemos dizer que esse desempenho no
(cf. o exemplo do comportamento autolesivo, no labirinto em T tomou-se diferenciado.
fim da sessão A, Capítulo 5). Mas a aprendizagem em labirinto pode en­
Consideremos, por exemplo, um esquema de volver seqüências mais complexas. Considere­
DRO de 10 segundos programado para as bica­ mos a seqüência de respostas no problema de
das de um pombo. Esse esquema reforça a clas­ alternação dupla (p. ex., Hunter, 1928). Ao fi­
se de todas as respostas que consistam em 10 nal de uma pista central, um ponto de escolha
segundos sem bicar. Mas, se um reforçador é fornece a oportunidade para uma virada à esquer­
apresentado depois de cada 10 segundos sem uma da (E) ou à direita (D), mas ambas as trilhas le­
bicada, então, cada resposta deve atrasar o re­ vam de volta à outra extremidade do labirinto.
forço por, pelo menos, 10 segundos. Se as bica­ Sem ser removido do aparato, o organismo pode
das ocorrerem menos freqüentemente, já que im­ retomar ao ponto central do labirinto e, então,
pedem ou adiam o reforço, seria apropriado di­ novamente no ponto de escolha, escolher virar à

140 A . C h a r l e s C a ta nia
esquerda ou à direita. Se ele completa uma série meira vez pode sempre virar à esquerda, depois
de viradas à esquerda e à direita na ordem apro­ mais tarde, virar sempre à direita, depois, mais
priada, o alimento é apresentado quando ele re­ tarde, ainda alternar entre direita e esquerda e
torna ao corredor central do labirinto. assim por diante, até que os vários componentes
Nesses equipamentos, a questão era saber se do labirinto sejam dominados. Em uma platafor­
os organismos poderiam aprender uma seqüên­ ma de saltos de Lashley com luz e escuro como
cia de dupla alternação, EEDD ou DDEE. A se­ estímulos, em que as escolhas do estímulo escu­
qüência era aprendida com diferentes graus de ro levam ao alimento, e a luz e o escuro, muda
êxito, por espécies diferentes e por organismos de lado irregularmente, um rato poderia, primei­
diferentes da mesma espécie, mas a questão mais ramente, escolher com mais freqüência o estí­
geral era se o comportamento do organismo, em mulo luz, depois escolher com mais freqüência
um certo momento, poderia determinar seu com­ o estímulo da esquerda, e depois escolher, prin­
portamento em um momento posterior. Um or­ cipalmente, o estímulo da direita, até que final­
ganismo não poderia completar, com sucesso, mente começasse a escolher consistentemente so­
uma seqüência de alternação dupla, a menos que mente o lado escuro. Esses padrões sistemáticos
seu comportamento no ponto de escolha levasse foram notados por Krechevsky (1932), que os
em conta, de alguma maneira, as viradas que ele denominou de hipóteses e discutiu suas implica­
havia feito nas vezes anteriores (no Capítulo 14 ções como segue:
verificaremos que a discriminação das caracte­
rísticas do próprio comportamento é crítica para Quase toda descrição de aprendizagem animal apre­
alguns aspectos da linguagem). senta frases tais como “movimentos exploratórios
aleatórios”; “entradas ao acaso”; “erros ao acaso.”
Uma diferença fundamental entre este e os E implicitamente suposto ou explicitamente afirma­
exemplos prévios de diferenciação está na espe­ do, na maioria das descrições de aprendizagem, que
cificação da classe de respostas. Em uma escala no início do processo o animal é um animal “ao aca­
linear, a posição, a força ou a duração são di­ so”. Suas respostas não têm propósito, forma nem
mensões únicas, ao longo das quais as respostas significado. Ensaio e erro desordenado parecem ser
a regra no início e depois que o comportamento te­
podem ser localizadas, mas seqüências de res­ nha levado o animal a experimentar, finalmente, o
postas em aprendizagem de alternação dupla não padrão “correto”, as várias leis da aprendizagem
podem ser ordenadas sem ambigüidades ao lon­ operam para fixar (stamp in) as respostas corretas e
go de uma dimensão única. Por exemplo, a se­ apagar (stamp out) as incorretas. (Krechevsky, 1932,
qüência EEED contém uma única transição de p. 157)
E a D, e a seqüência EDED contém tantos Es
quanto Ds, mas então, qual delas está mais es­ Baseado nesses dados, Krechevsky contras­
treitamente relacionada à seqüência reforçada tou esta noção com uma diferença, de acordo com
EEDD? Outra questão é se devemos tratar uma a qual o animal
seqüência de alternações como uma unidade
traz para cada nova situação uma história completa
única de comportamento ou subdividi-la em com­ de experiências. Ele está pronto para usar essas ex­
ponentes menores. Por exemplo, se há mais al­ periências. Desde o primeiro momento, o animal
ternações à direita do que à esquerda na apren­ talvez comece a resolver seu problema de uma ma­
dizagem de seqüência EEDD, porque somente neira direta, compreensiva de seu comportamento
total. Ao executar uma série de movimentos que
D é seguida imediatamente por um reforçador;
denominamos “perfeito,” “sem erro,” “aprendido,”
viradas individuais deveriam ser tratadas como “integrado,” o animal não está fazendo algo que te­
unidades em vez de seqüências inteiras? nha emergido de uma série de respostas “imperfei­
À medida que um organismo aprende uma tas”, “não integradas”, “ao acaso”. Ele está agora
seqüência de respostas nesta tarefa e em outras meramente desempenhando um conjunto diferente
de respostas integradas, série esta que foi precedida
relacionadas, o reforço diferencial age sobre o
por outra série de respostas tão integrada quanto
comportamento que o organismo traz para o ex­ aquela. Tais respostas, “falsas soluções,” “tentati­
perimento. Esse comportamento geralmente é vas sistemáticas iniciais” etc. são rotuladas com o
sistemático. Por exemplo, um rato que esteja nome dúbio de “hipóteses”...Quando um indivíduo
aprendendo a correr em um labirinto pela pri­ humano se comporta exatamente da mesma manei-

A p r e n d iz a g e m 141
ra, também podemos dizer que ele tem uma “hipó­ é afetada pela alteração das contingências de re­
tese”. No entanto, estamos primordialmente interes­ forço para outro.
sados não em defender nossa terminologia, mas em
descrever certo comportamento. O termo “hipóte­
Algumas seqüências, no entanto, apresentam
se” foi escolhido meramente como um rótulo con­ problemas diferentes. Por exemplo, em uma sé­
veniente para esse comportamento. (Krechevsky, rie de experimentos (Straub e col., 1979), quatrc
1932, pp. 528-529) discos em uma câmara de pombos eram ilumi­
nados com as cores verde, branco, vermelho e
azul, com a localização de cada cor variando de
SEQÜÊNCIAS DE RESPOSTAS: tentativa a tentativa. Se o pombo bicasse os dis­
ENCADEAMENTO VERSUS cos verde, branco, vermelho e azul, nesta ordem,
UNIDADES TEMPORALMENTE a bicada final no disco azul produzia alimento;
ESTENDIDAS se ele bicasse os discos fora de ordem, a tentati­
va era cancelada. O pombo aprendeu a bicar o
Quando quebramos uma seqüência de com­ branco depois do verde, o vermelho depois do
portamento em seus componentes, podemos co­ branco e o azul depois do vermelho, mesmo
meçar a tratar a seqüência como uma sucessão quando a localização das cores mudava a cada
de operantes diferentes, cada um definido pela tentativa e mesmo que bicadas sucessivas na se­
conseqüência reforçadora de produzir uma opor­ qüência não produzissem mudança de estímulo.
tunidade de emitir o próximo, até que a seqüên­ Além disso, as bicadas tendiam a ocorrer con­
cia seja terminada por um reforçador. Esse tipo forme a seqüência reforçada, mesmo se uma das
de seqüência é denominado uma cadeia de res­ cores estivesse ausente (p. ex., depois de bicar o
postas. Um exemplo de cadeia foi apresentado branco, bicar o azul e não o verde, se o verme­
no Capítulo 5, pela análise detalhada, feita por lho estivesse faltando). Como no problema de
Sidman, da pressão à barra de um rato reforçada alternação dupla na aprendizagem em labirinto,
com alimento. Erguer-se até a barra produzia a presente resposta na seqüência deve depender
contato com ela, o que estabelecia a ocasião para do comportamento passado do organismo. A
pressioná-la, o que produzia a visão do alimen­ mesma questão surge sempre que um organismo
to, o que estabelecia a ocasião para se aproxi­ aprende uma seqüência arbitrária em que respos­
mar do comedouro, e assim por diante. Qualquer tas não são acompanhadas de mudanças de estí­
segmento da seqüência serve à dupla função de mulos (p. ex., Boren & Devine, 1968). Pode o
reforçar a última resposta e de produzir as con­ próprio comportamento do organismo prover os
dições que ocasionam a resposta seguinte. Um estímulos discriminativos que ocasionarão o
estímulo discriminativo que exerce tal função re­ comportamento futuro?
forçadora é denominado um reforçador condici­ A questão crítica, porém, não é tanto se al­
onado (alguns experimentos sobre reforço condi­ gumas seqüências de comportamento são man­
cionado são tratados no Capítulo 11). tidas interligadas desta maneira; é, antes, se essa
Algumas seqüências de comportamento po­ é a única base para o desenvolvimento de se­
dem ser reduzidas a unidades menores e, dessa qüências de comportamento. Na história da Psi­
forma, a análise dos componentes pode ser con­ cologia da Aprendizagem, as posições defendi­
firmada experimentalmente, verificando-se o das em relação a essa questão eram freqüente­
quanto os componentes são independentes uns mente sintomas de sérias divisões entre pesqui­
dos outros ( Skinner, 1934). Por exemplo, se pres­ sadores de orientações diferentes, alguns susten­
sionar a barra não produz mais alimento, o pres­ tando que o comportamento seqüencial sempre
sionar a barra pode diminuir de freqüência, mas poderia ser interpretado com base em uma con-
podemos verificar também, apresentando alimen­ catenação de componentes (denominados, de for­
to independentemente do comportamento, que a ma variada, associações, cadeias, ligações, estí-
visão da pelota continua a ocasionar o movimen­ mulo-resposta ou reflexos condicionados), e ou­
to para o comedouro. Esse procedimento de­ tros afirmando que comportamento seqüencial
monstra que a integridade de um componente não não poderia ser interpretado adequadamente em

142 A . C h a r l e s C a tania
tais termos. Nossa conclusão é a de que é possível Os golpes digitais de um músico podem tocar o te­
o comportamento seqüencial de ambos os tipos; a clado até 16 vezes por segundo em passagens que
demandam uma ordem definida e mutável de movi­
questão experimental relevante, em qualquer caso, mentos sucessivos dos dedos. A sucessão de movi­
é determinar a natureza da ordenação seqüencial. mentos é rápida demais, até mesmo para o tempo de
Talvez o argumento mais veemente seja o reação visual. Em uma leitura visual rápida é im­
apresentado por Lashley (1951), que resumiu as possível ler as notas individuais de um arpejo. As
concepções precedentes da seguinte maneira: notas devem ser lidas em grupos...O controle sen­
sorial dos movimentos parece estar descartado em
atos como estes. (Lashley, 1951, p. 123)
...a única teoria estritamente fisiológica que foi ex­
plicitamente formulada para explicar a integração
temporal é a que postula cadeias de reflexos, nas O argumento de Lashley era que certos pa­
quais o desempenho de cada elemento da série for­ drões seqüenciais de responder não podem ser
nece a excitação para o seguinte. Essa concepção reduzidos a uma sucessão de unidades estímu-
está na base das “teorias motoras” do pensamento lo-resposta ou S-R. Quando um datilografo efi­
que...tentavam identificar o pensamento com movi­
mentos inaudíveis de órgãos vocais, ligados em ca­
ciente tecla rapidamente as letras the, essas le­
deias associativas. Os...impulsos cinéticos de cada tras não podem ser estímulos dicriminativos para
movimento servem como um estímulo único para o o próximo toque, primeiro porque o datilografo
próximo da série. (Lashley, 1951, p. 114) estará executando o próximo toque antes mes­
mo que as letras impressas na página possam ter
Lashley, então, descreveu casos, incluindo ilus­ qualquer efeito como estímulo e, segundo, porque
trações tanto de linguagem como de música, que elas não podem ser um estímulo discriminativo úni­
tomavam estas explicações pouco plausíveis. Por co, se elas podem ocasionar o teclar a barra de es­
exemplo, em resposta ao argumento de que cada paço ou qualquer outra tecla, dependendo do que
movimento serve como um estímulo único para o o datilografo esteja datilografando (p. ex., a pala­
próximo, Lashley considerou a seqüência comple­ vra the, these, then ou thennometer).
xa de movimentos requerida para pronunciar o som O problema histórico foi que, diante de tais
da palavra right na ordem correta. A ordem não é argumentos, os pesquisadores provavelmente
dada pelos próprios sons, porque os sons podem sentiram-se forçados a escolher entre aceitar o
ocorrer em uma variedade de ordens e combina­ pressuposto de que o comportamento seqüencial
ções (p. ex., na ordem oposta como em tire). As­ dependia de seqüências estímulo-resposta ou
sim, a seqüência de sons não pode ser baseada so­ supor que ele dependia de unidades de compor­
mente em conexões diretas, mas deve depender tamento temporalmente estendidas, não redutí­
de alguma organização mais ampla. Lashley ex­ veis a tais seqüências. Mas a questão pode ser
pandiu o caso de seqüências de sons em palavras, considerada, claramente, como uma questão ex­
para seqüências de palavras em sentenças: perimental. Certamente algumas seqüências po­
dem ser compostas de tal modo que cada res­
A palavra right, por exemplo, é um substantivo, ad­ posta produz condições para a próxima respos­
jetivo, um advérbio e um verbo e tem quatro modos
de soletrar e, pelo menos, dez significados. Em uma
ta, enquanto outras devem ser integradas de tal
sentença como “The millwríght on my right thinks it modo que as respostas aparecem na ordem apro­
right that some conventional rite should symbolize priada, sem que cada uma dependa das conse­
the right o f every man to write as he pleases", o qüências da anterior. Para qualquer seqüência de
arranjo de palavras é, obviamente, devido não a comportamento em particular, a questão é deci­
quaisquer associações diretas da palavra right em si
com outras palavras, mas aos significados que são
dir que tipo de seqüência é aquela.
determinados por algumas relações mais amplas.
(Lashley, 1951, pp. 115-116)
CLASSES OPERANTES E
E Lashley usou a música para ressaltar que a COMPORTAMENTO NOVO
mera rapidez de algumas seqüências limitam o
modo como as seqüências podem ter sido gera­ A estreita correspondência entre uma classe
das: de respostas com conseqüências e uma classe de

A p r e n d iz a g e m 143
respostas geradas por essas conseqüências é o (Neuringer, 1986; Page & Neuringer, 1985). Mas
critério para se falar em uma classe operante. o reforço diferencial da novidade (originalida­
Como vimos, essas classes podem ser definidas de) ou da variabilidade suscita algumas questões.
ao longo de dimensões simples como força ou Os reforços são produzidos por respostas indi­
localização, ou podem ter propriedades mais viduais, contudo as propriedades como a novi­
complexas. Nossos exemplos incluíram esque­ dade e a variabilidade não podem ser proprieda­
mas de reforço diferencial, labirintos e seqüên­ des de respostas individuais. Elas somente po­
cias de respostas integradas. dem ser propriedades de respostas no contexto
Em cada caso, nosso interesse principal está de outras respostas que ocorreram antes. Uma
nas dimensões ao longo das quais o responder resposta em particular pode ser variável no con­
se conforma à classe de respostas que é reforça­ texto de uma seqüência de respostas passadas e
da. A estrutura do comportamento é tal que nem estereotipada no contexto de outra. Assim, o fato
sempre podemos definir tais dimensões indepen­ de que a novidade (originalidade) e a variabili­
dentemente das contingências de reforço. Por dade podem ser diferencialmente reforçadas sig­
exemplo, considere o reforço de respostas no­ nifica que os organismos são sensíveis a popu­
vas em golfinhos (Pryor, Haag, & O ’Reilly, lações de respostas e de conseqüências ao longo
1969). Os desempenhos novos foram modela­ de extensos períodos de tempo, e não meramen­
dos reforçando-se, a cada sessão, alguma classe te a seqüências individuais resposta-estímulo (cf.
de respostas não-reforçada em qualquer sessão Capítulo 6, sobre análises molares e molecula­
prévia. Por exemplo, se saltar para trás fosse re­ res).
forçada em uma sessão, bater na água com a cau­ Retornaremos a estas questões de classes de
da poderia ser reforçada na próxima sessão e comportamento mais tarde, especialmente em
pular na borda da piscina em outra sessão. De­ conexão com o comportamento verbal, quando
pois de algumas sessões, a cada nova sessão o trataremos da descoberta de que algumas estru­
golfinho começava a emitir respostas que o ex­ turas gramaticais são mais facilmente aprendi­
perimentador nunca tinha visto antes, como sal­ das do que outras, do mesmo modo que trata­
tar para fora da água com um giro em espiral. A mos a descoberta de que os ratos aprendem as
novidade das respostas foi diferenciada, mas seqüências de alternação simples (EDED) mais
como esta classe operante pode ser especifica­ facilmente do que as seqüências de alternação
da, exceto pela descrição do critério de reforço? dupla (EEDD). Em cada caso, o problema é iden­
O fato de que temos dificuldade em medir a ori­ tificar a dimensão por meio da qual o responder
ginalidade ou outras dimensões complexas do pode passar a se conformar à classe de respostas
comportamento não as elimina como proprieda­ que tem conseqüências. Algumas vezes essas di­
des que possam definir as classes operantes. Um mensões talvez possam ser especificadas somen­
comportamento novo deve ser emitido, antes que te por uma descrição verbal (p. ex., a classe de
possa ser incorporado em outro comportamento. todas as respostas não-reforçadas em ocasiões
Mesmo a variabilidade do responder pode ser prévias, como no reforço das respostas novas do
tomada como base para o reforço diferencial golfinho).

144 A . C h a r l e s C a ta n ia
Operantes Discriminados: Controle
de Estímulo

indo-europeu deuk- (conduzir), a duke (duque),


A. A Natureza dos Operantes Discriminados
adduction (adução), educate (educar) e conduct
Atentar para as Propriedades dos Estímulos
(conduta). A palavra discrimination, do latim dis­
Aprendizagem de Lugar versus Aprendizagem de
apart (separado) mais crimen, judgm ent (julga­
Resposta
mento), está relacionada, por meio do indo-eu­
Gradientes de Controle de Estímulo
ropeu skeri- a cortar ou separar, a crime, descri­
Gradientes de Generalização
be (descrever) e criterion (critério). E a palavra
Gradientes de Pós-Discriminação
generalization (generalização), do latim genere
Gradientes de Inibição
(produzir ou causar), está relacionada, por meio
Esvanecimento (Fading): Controle de Estímulo por
do indo-europeu gen- to give birth or beget (ge­
Aproximações Sucessivas
rar ou partejar), a ingenious (engenhoso), kind
A Terminologia do Reforço Diferencial
(tipo) e nat-ure (natureza).
B. Cognição Animal
Mapas Cognitivos Estudamos o reforço com base nas dimen­
Conceitos Naturais e Classes de Estímulo sões das respostas, mas o reforço diferencial tam­
Probabilísticas bém pode ocorrer com base nas dimensões do
Definição de Classes de Estímulos estímulo em cuja presença as respostas ocorrem.
Por exemplo, as pressões à barra por um rato em
presença da luz são diferentes de suas pressões
As palavras latinas habere, to have (ter) e capere, no escuro, e o reforço pode ser programado para
to take ou size (tomar ou captar) reportam-se a raízes pressões à barra na presença, mas não na ausên­
indo-européias, intimamente ligadas. Habere é um cia de luz. Do mesmo modo, as bicadas de um
antecessor das palavras inglesas behavior (compor­ pombo no disco durante a luz verde são diferen­
tamento), habit (hábito) e inhibit (inibir). Capere le­
vou a concept (conceito) e perception (percepção),
tes das bicadas em presença da luz vermelha.
palavras relevantes para classes de estímulo; assim, Quando o responder é reforçado apenas na pre­
essas palavras e behavior são parentes distantes. sença de alguns estímulos, dizemos que o refor­
Não há elos óbvios entre differentiation (dife­ ço é correlacionado com aquele estímulo. Uma
renciação) e induction (indução), aplicadas a clas­ classe de resposta criada por este reforço dife­
ses de resposta, e discrimination (discriminação) e
generalization (generalização), aplicadas a classes
rencial em relação às propriedades do estímulo
de estímulo. A palavra differentiation (diferencia­ é chamada de operante discriminado.
ção), do latim dis- (separado, distante) mais ferre Os operantes discriminados são um traço di­
(carregar), está relacionada, por meio do indo-euro- fuso do comportamento. Ao dirigir um carro,
çeubher- (carregar ou sustentar), abirth (nascimen­ avançamos por um cruzamento se o semáforo
to), transfer (transferência), preference (preferência)
e metaphor (metáfora), mas não &interfere (interfe­
estiver verde, mas não se ele estiver vermelho.
rir). A palavra induction (indução), do latim in-(em) Ao falar com alguém, o que dizemos é afetado
mais ducere (conduzir), está relacionada, através do pelo que a outra pessoa diz, por sua postura e
expressão facial, pela situação em que ocorre a bém para o estímulo discriminativo (A é delta, a
conversa, e assim por diante. Muitos exemplos letra grega d), ou S', para o estímulo negativo
prévios de reforço incluíram o controle discri­ (rigorosamente falando, S° seria mais apropria­
minativo do responder. Ao discutir a aprendiza­ do, pois nada é removido em presença desse estí­
gem dos ratos em labirinto, enfatizamos o au­ mulo, mas S' é o emprego mais comum).
mento de escolhas de viradas corretas, mas o rato No procedimento da Figura 8.1, a luz e o es­
que não discriminasse o local apropriado para curo altemavam-se irregularmente; quando a
virar à direita ou à esquerda poderia chocar-se lâmpada estava acesa, ela permanecia ligada por
repetidamente contra as paredes, à medida que períodos que variavam de 5 a 30 segundos. As
se locomovia pelo labirinto, e dificilmente iria pressões à barra eram reforçadas de acordo com
aprender o labirinto como um todo. um esquema de reforço de intervalo variável ou
De fato, é bem provável que não exista uma VI: em média, apenas uma pressão à barra a cada
classe operante sem estímulos discriminativos. 30 segundos era reforçada enquanto a luz estava
As bicadas de um pombo não podem ser emiti­ acesa. As características importantes desse esque­
das na ausência de um disco, e as pressões à bar­ ma são que (1) ele mantém uma taxa de respostas
ra por um rato não podem ser emitidas na ausên­ moderada e relativamente constante e (2) os tem­
cia de uma barra. As características que perma­ pos variáveis entre os reforçadores sucessivos tor­
necem relativamente constantes ao longo de um nam o tempo a partir do último reforçador um pre-
experimento, como a própria câmara e os demais ditor não fidedigno de quando a próxima resposta
dispositivos que ela contém, às vezes, são refe­ será reforçada. Com essa programação, as mudan­
ridos como estímulos contextuais. Em geral, es­ ças de estímulo e as apresentações do reforço va­
tamos mais interessados nos estímulos que mu­ riam assistematicamente ao longo do tempo, de
dam dentro das sessões experimentais, mas te­ modo que se o rato pressiona mais na luz, do que
mos que lembrar que o ambiente dentro do qual no escuro, podemos ficar confiantes de que o estí­
um pombo ou um rato responde existe em um mulo discriminativo funcional é a luz, e não a re­
contexto mais amplo, que inclui o biotério onde gularidade temporal daqueles outros eventos.
vive, as balanças em que é pesado e outras ca­ Ao longo das sessões, o pressionar aumen­
racterísticas do laboratório fora da câmara expe­ tou durante a luz e diminuiu em sua ausência.
rimental (cf. Donahoe & Palmer, 1994). Este aumento freqüentemente acompanha tais
Os estímulos discriminativos correspondem discriminações (contraste comportamental: ver
aos estímulos coloquialmente denominados de Capítulo 10). A Figura 8.1 também mostra algu­
sinais ou pistas. Eles não eliciam respostas. Mais mas mudanças em um índice de discriminação,
precisamente, eles estabelecem a ocasião em que o responder na presença da luz como porcenta­
as respostas têm conseqüências, e diz-se que eles gem do total de respostas. O índice aumentou ao
ocasionam as respostas (cf. provisão: Gibson, longo das sessões. Outras maneiras equivalen­
1979). Um exemplo do desenvolvimento de con­ tes de se descrever esse resultado seriam dizer
trole de estímulos, o controle do responder por que pressionar a barra em presença da luz é um
um estímulo discriminativo, pode ser visto na operante discriminado ou que a luz funciona
Figura 8.1 (Herrick, Myers, & Korotkin, 1959). como um estímulo discriminativo para as pres­
Os ratos pressionavam uma barra na presença e sões à barra, ou ainda que o pressionar a barra
na ausência de luz, programadas alternadamen­ está sob controle do estímulo da luz.
te. Quando a luz estava acesa, as pressões à bar­
ra eram ocasionalmente reforçadas com alimen­
to. Quando a luz estava apagada, as pressões à
barra não eram reforçadas. A notação para o es­ Seção A A Natureza dos Operantes
tímulo correlacionado ao reforço é SD, para o Discriminados
estímulo discriminativo, ou S+, para o estímulo
positivo; a notação para o estímulo correlacio­ Podemos ilustrar algumas características dos
nado com o não reforço ou extinção é SA, tam­ operantes discriminados com um exemplo hipo-

146 A . C h a r l e s C a ta n ia
FIGURA 8.1 Pressões à barra por um rato
na presença e na ausência de luz. A luz (SD)
estava correlacionada ao reforço em inter­
valo variável e sua ausência (SA), à extin­
ção. O índice de discriminação é a porcen­
tagem do total de respostas emitidas na pre­
sença de luz (a taxa em SD dividida pela
soma das taxas em SD e SA multiplicada por
100). Os dados são a mediana das taxas de
oito ratos. (Herrick, Myers, & Korotkin,
1959, Figura 2)

tético comparável ao da Figura 7.1, no capítulo Neste ponto começamos a reforçar as pres­
anterior. Novamente temos um rato em uma câ­ sões à barra apenas se a fenda estiver iluminada
mara com uma fenda em uma parede, mas desta nas posições 9, 10, 11 ou 12; quando a luz apa­
vez o rato não pode introduzir seu focinho na rece em qualquer outra posição, não reforçamos
fenda. A fenda está coberta com plástico trans­ as pressões. O efeito inicial do reforço é bastan­
lúcido, e uma série de 15 lâmpadas, por trás do te semelhante àquele em B, na Figura 7.1: o res­
plástico, pode iluminar os segmentos sucessivos ponder aumenta ao longo de todas as posições.
da fenda. Em outras palavras, as lâmpadas for­ Em outras palavras, o efeito do reforço não é
necem uma dimensão de estímulo cujos compo­ restrito apenas a estímulos em posições correla­
nentes são análogos àqueles da dimensão de res­ cionadas ao reforço; ele se dispersa para outras
posta da Figura 7.1. Uma barra fica centralizada posições. A dispersão do efeito do reforço na
logo abaixo da fenda e acima de um comedouro. presença de um estímulo para outros estímulos
Agora acendemos as lâmpadas por trás da fen­ não-correlacionados com o reforço é denomina­
da, uma por vez, em ordem irregular e registra­ da generalização. Neste exemplo, reforçar o res­
mos as pressões à barra que ocorrem em presen­ ponder em presença de luzes nas posições 9 a 12
ça de cada lâmpada. Se não reforçarmos as pres­ afetou o responder em presença não apenas da­
sões à barra, o responder será infreqüente e sem quelas luzes, mas também de luzes em todas as
qualquer relação sistemática com a região da fen­ outras posições ao longo da fenda. Este exem­
da que estiver iluminada. De fato, os dados po­ plo difere essencialmente do anterior na dimen­
dem ser similares àqueles em A, na Figura 7.1, são correlacionada com o reforço: no Capítulo
com a diferença de que o eixo X agora represen­ 7, lidamos com uma dimensão de resposta, mas
ta a posição do estímulo, e não a posição da res­ agora estamos lidando com uma dimensão de
posta. estímulo.

A p r e n d iz a g e m 147
Suponhamos que continuemos o reforço di­ criminação e generalização quando nos referi­
ferencial com respeito à localização do estímu­ mos aos efeitos análogos do reforço diferencial
lo, reforçando as respostas apenas quando ilu­ com respeito a propriedades do estímulo?
minamos as posições de 9 a 12. O responder au­ Um fator metodológico pode ser crucial para
menta gradualmente quando essas posições es­ essa distinção. Quando estudamos o reforço di­
tão iluminadas e diminui quando outras posições ferencial com respeito a propriedades da respos­
são iluminadas. Os efeitos são parecidos com ta, registramos as respostas em diferentes clas­
aqueles da Figura 7.1 em C, D e E. Finalmente, ses, mas além de programar as contingências, não
a maior parte das respostas ocorre com as luzes há muito mais que possamos fazer a respeito
nas posições correlacionadas com o reforço, delas. Se vemos um rato prestes a introduzir seu
como em E, e mesmo que algumas respostas ain­ focinho na posição 7 da fenda, não podemos im­
da ocorram com as luzes em outras posições, pedir que o rato emita aquela resposta naquele
pode-se alcançar um ponto em que a distribui­ momento, mesmo que ele tenha respondido
ção de respostas não muda muito com a conti­ muito mais vezes naquela posição do que em
nuação do reforço diferencial. qualquer outra. Suponhamos, porém, que esti­
Nesse exemplo, os estímulos que ocasiona­ véssemos trabalhando com propriedades do es­
ram o responder vieram a conformar-se estreita­ tímulo. Poderíamos escolher entre várias ordens
mente com a classe de estímulos correlacionada e freqüências relativas possíveis para a apresen­
com o reforço. Esse processo é denominado dis­ tação das luzes. Por exemplo, em vez de apre­
criminação e o responder sob tal controle de es­ sentar luzes com a mesma freqüência em certas
tímulo é denominado de comportamento discri­ posições, poderíamos apresentá-las em certas
minado. O reforço diferencial estabeleceu uma posições, mas não em outras, de modo que o rato
classe de respostas definida pelos estímulos em jamais tivesse uma oportunidade de pressionar a
cuja presença elas ocorrem. E quanto às respos­ barra em presença de alguns estímulos. Essa é a
tas na presença de estímulos fora dos limites cor­ razão pela qual dizemos que, em procedimentos
relacionados com o reforço (p. ex., posições 6,7 de discriminação, os estímulos estabelecem a
e 8, ou 13, 14 e 15)? De acordo com uma inter­ ocasião para respostas: quando uma classe de
pretação estrita, elas não deveriam ser contadas respostas é definida pela presença de um estí­
como membros do operante discriminado; fala­ mulo, as respostas nesta classe não podem ocor­
mos delas em termos de generalização. Mas o rer quando o estímulo está ausente.
reforço diferencial gerou respostas tanto dentro Mesmo essa distinção metodológica tem ex­
quanto fora desses limites; assim, elas são parte ceções. Consideremos, por exemplo, o reforço
de uma distribuição contínua. diferencial de longos intervalos entre respostas
A solução é a mesma que a do Capítulo 7. (o esquema DRL: Capítulo 7). Se as bicadas de
Devemos reconhecer duas classes de estímulos: um pombo forem reforçadas somente depois de,
uma é a classe correlacionada com uma contin­ pelo menos, 5 segundos sem bicar, o pombo pode
gência de reforço; a outra é a classe em cuja pre­ começar a espaçar suas bicadas cerca de 5 se­
sença o responder ocorre. Não estamos interes­ gundos uma da outra. Discutimos esse compor­
sados em qualquer das classes em si, mas sim na tamento com base na diferenciação de um ope­
correspondência entre elas. Essa discussão acom­ rante complexo, que consiste de uma pausa mais
panha de perto o que discutimos sobre a diferen­ uma bicada. Poderíamos, igualmente, tratar a du­
ciação e a indução no Capítulo 7. Isso é apro­ ração da pausa como uma propriedade de estí­
priado, pois podemos considerar um estímulo em mulo e argumentar que o comportamento deve­
cuja presença uma resposta ocorre como uma ria ser considerado como uma discriminação ba­
outra propriedade daquela resposta, como sua seada no tempo transcorrido desde a última bi­
força, duração e topografia. Por que então, nos cada. De fato, neste caso, as terminologias são
referimos aos efeitos do reforço diferencial com permutáveis. Quando falamos de diferenciação
respeito a propriedades da resposta em termos e indução ou de discriminação e generalização,
de diferenciação e indução, mas falamos de dis­ a operação subjacente em cada caso é o reforço

148 A . C h a r l e s C a ta nia
diferencial. Tanto a diferenciação como a discri­ o atentar (para) pode ter conseqüências. Por
minação envolvem correspondências entre as di­ exemplo, se uma contingência de reforço é cor­
mensões sobre as quais o reforço diferencial é relacionada ao brilho de um estímulo visual, mas
aplicado e as dimensões do comportamento re­ não com seu tamanho, fará muita diferença se o
sultante. Apesar disso, vamos manter a distin­ organismo atenta para o brilho ou para o tama­
ção entre as terminologias de propriedades de nho (e se atentar para o brilho ocorre mais fre­
resposta e propriedades de estímulo, porque elas qüentemente devido às suas conseqüências, en­
têm uma fundamentação histórica extensa e am­ tão, é apropriado falar sobre o atentar como um
plamente aceita. operante).
Consideremos um pombo cujas bicadas ao
disco sejam ocasionalmente reforçadas com ali­
ATENTAR PARA AS PROPRIEDADES mento. Uma das duas combinações de estímulo
DOS ESTÍMULOS é apresentada no disco: um triângulo sobre um
fundo vermelho ou um círculo sobre um fundo
Ao discutirmos a correspondência entre os verde. Cada um é apresentado por 3 minutos.
estímulos com os quais as contingências de re­ Depois de 3 minutos de triângulo-sobre-verme­
forço estão correlacionadas e os estímulos a que lho, a próxima bicada na presença deste estímu­
o organismo responde, falamos com base na di­ lo é reforçada; após 3 minutos de círculo-sobre-
mensão de estímulo selecionada pelo experimen­ verde, o estímulo é desligado sem reforço. Esta
tador. Mas os estímulos têm propriedades varia­ programação em presença de triângulo-sobre-
das e não há garantias de que o organismo vá vermelho é denominada esquema de reforço de
responder apenas àquelas propriedades que se­ intervalo fixo ou FI; a programação em presen­
lecionamos. Na diferenciação, as pressões à barra ça de círculo-sobre-verde é de extinção. Exami­
por um rato podem ter uma forma relativamente naremos o esquema de intervalo fixo no Capítu­
constante, embora apenas a força seja a base para lo 10. Por ora, é suficiente observar que este es­
o reforço diferencial. Por exemplo, o rato pode quema, geralmente, mantém um responder cuja
pressionar regularmente a barra com sua pata taxa aumenta à medida que o tempo passa du­
esquerda, embora essa propriedade não seja crí­ rante o intervalo, ao contrário da taxa relativa­
tica na determinação de se a resposta de pressio­ mente constante mantida por um esquema de
nar será reforçada. Do mesmo modo, na discri­ intervalo variável. Se cada bicada em presença
minação um rato pode responder com base na de triângulo-sobre-vermelho produzisse um re-
intensidade de um estímulo visual, embora o re­ forçador, então, as apresentações do reforçador
forço diferencial seja baseado somente em sua por si só poderiam adquirir funções discrimina­
forma; podemos dizer que o rato está atento à tivas, mas com reforço em FI não temos que nos
intensidade. (As propriedades de estímulo às preocupar com tais efeitos, uma vez que nenhu­
quais um organismo tende a responder discrimi­ ma bicada é reforçada até que o intervalo tenha
nativamente são, às vezes, denominadas salien­ terminado.
tes, mas a saliência não é uma propriedade de A Figura 8.2 (Reynolds, 1961a) mostra da­
um estímulo; é uma propriedade do comportamen­ dos da aplicação desse procedimento com dois
to do organismo com relação àquele estímulo.) pombos. Os gráficos à esquerda mostram taxas
O conceito de atenção é essencial em um tra­ de bicar durante cada combinação de estímulo
tamento dos operantes discriminados, porque os ao final de 18 horas de treino. Ambos os pom­
organismos tendem a responder a algumas pro­ bos estavam emitindo mais de 40 bicadas por
priedades de estímulos, e não a outras. Na medi­ minuto durante a presença do triângulo-sobre-
da em que atentar para, ou prestar atenção a uma vermelho, mas bicavam em taxas relativamente
propriedade, ou a outra é algo que os organis­ baixas durante a do círculo-sobre-verde. Em um
mos fazem, podemos tratá-lo como um tipo de teste sem reforço, cada componente da combi­
comportamento (ver Capítulo 20). Uma razão im­ nação era apresentado separadamente. Para o
portante para tratar a atenção desta maneira é que Pombo 105, quase todas as bicadas ocorreram

A p r e n d iz a g e m 149
Treino Teste de Atenção

80

40

O'—
AR OG

80
FIG U RA 8.2. Respostas de bicar de dois
pombos durante o reforço correlacionado ao
triângulo sobre vermelho e durante a extin­
ção correlacionada ao círculo sobre verde (à
40 esquerda, treinamento), e durante testes de
extinção, quando as cores (verm elho-R ,
verde=G) e as formas (A, O) foram apresen­
tadas separadamente (à direita, testes de
I atenção). O Pombo 105 estava respondendo
A_ à forma, mas não à cor; o Pombo 107 estava
AR OG respondendo à cor, mas não à forma. (Rey­
nolds, 1961a, Figura 1)
Estímulo

na presença do triângulo; o vermelho, cor corre­ alguma dimensão de estímulo (prestar atenção
lacionada com o reforço, ocasionou poucas res­ cuidadosamente significa ouvir tudo o que é dito,
postas a mais do que o círculo ou a cor verde, e não apenas algumas partes do que é dito). Di­
componentes previamente correlacionados com zemos que o Pombo 105 atentou à forma e não à
a extinção. Para o Pombo 107, por outro lado, cor, porque o responder discriminado ocorreu ao
quase todas as bicadas ocorreram durante o ver­ longo de mudanças na forma, mas não ao longo
melho; embora o triângulo tivesse sido correlacio­ das mudanças na cor. Quando os estímulos são
nado com o reforço durante o treino, este estímulo discriminados ao longo de uma dimensão de es­
ocasionou ainda menos bicadas do que o círculo tímulo, mas não de outra, dizemos que o orga­
ou o verde. O Pombo 105 estava prestando aten­ nismo está prestando atenção à primeira dimen­
ção à forma, e não à cor, e o Pombo 107 estava são, mas não à segunda.
atentando à cor, e não à forma. A forma e a cor Uma vez que um organismo tenha atentado
haviam sido correlacionadas com o reforço durante para algumas propriedades de estímulo em uma
o treino. Somente ao examinar separadamente os situação, ele também tenderá a atentar àquelas
efeitos dos componentes é que foi possível dizer propriedades em situações novas (p. ex., Lawren­
quais eram suas funções discriminativas. ce, 1949). Podemos também alterar a probabili­
O responder dos pombos nessa situação não dade de que um organismo venha a atentar para
era apenas um caso de generalização. O respon­ uma ou outra propriedade de estímulo simples­
der do Pombo 105 generalizou-se de triângulo- mente mudando a maneira como o reforço está
sobre-vermelho para triângulo sem vermelho, correlacionado com essas propriedades (John­
mas não para vermelho sem triângulo. Geralmen­ son & Cumming, 1968). Na fase de treino da
te falamos da atenção não como uma resposta a Figura 8.2, a forma e a cor estavam igualmente
um estímulo particular, mas como a atenção a bem-correlacionadas com o reforço. Por essa ra-

150 A . C h a r l e s C a ta n ia
zão, o experimento foi particularmente apropri­ partir da qual o rato se aproxima). Por exemplo,
ado para demonstrar algumas das propriedades suponhamos que o braço direito de um labirinto
da atenção. Mas, se nosso interesse principal em T aponte em direção à parede mais iluminada,
fosse a discriminação de forma pelo pombo, te­ a parede leste de um laboratório, onde ficam as
ríamos que tomar a cor irrelevante e correlacio­ janelas. O rato poderia aprender a virar à direita,
nar as mudanças no reforço somente com mu­ ou poderia aprender a correr em direção à janela.
danças na forma. Poderíamos testar essas alternativas, girando o la­
birinto em T, de modo que o braço direito agora
apontasse para o oeste, e o rato se aproximasse do
Aprendizagem de Lugar versus ponto de escolha a partir do norte. Se o rato vira à
Aprendizagem de Resposta direita, e, portanto, na direção oposta à da janela,
ele demonstra aprendizagem de resposta. Se vira
As questões precedentes estão relacionadas à esquerda, rumo à janela, exibe aprendizagem de
indiretamente a uma antiga controvérsia em Psi­ lugar, ele se desloca para o mesmo lugar, embora
cologia, sobre a aprendizagem de lugar versus a faça isso virando em uma direção diferente. A ques­
aprendizagem de resposta (p. ex., Restle, 1957). tão é se o rato aprende a virar à direita versus à
A resposta de deslocar-se de um lugar para ou­ esquerda ou a virar a leste versus a oeste.
tro tem ocupado freqüentemente uma posição O desempenho do rato depende, em grande
privilegiada em análises comportamentais (p. ex., parte, dos estímulos disponíveis tanto dentro
Olton, 1979). Ir em busca de alimento não é o quanto fora do labirinto. O labirinto típico cos­
mesmo que produzir alimento permanecendo no tumava ser coberto por uma tela de arame ou
mesmo lugar. Uma diferença importante entre por alguma outra cobertura que permitisse ao
os dois casos é que o ambiente muda mais dras­ experimentador observar o que o rato estava fa­
ticamente quando nos deslocamos para um novo zendo. Se o experimentador podia olhar para
lugar do que quando introduzimos um novo es­ dentro do labirinto, o rato também podia olhar
tímulo no lugar onde estamos. Os humanos em para fora. Embora ratos sejam míopes, o rato
particular têm encontrado algumas maneiras de comum pode discriminar a direção geral de lu­
substituir a locomoção comum por outras res­ zes e outros aspectos genéricos de um ambiente.
postas: para irmos a diferentes lugares pisamos Enquanto houver estímulos disponíveis do lado
em aceleradores, giramos volantes, apertamos bo­ de fora do labirinto, eles podem tornar-se a base
tões de elevadores e subimos em escadas ou estei­ a partir da qual o rato vira em uma direção parti­
ras rolantes. Além disso, o movimento produz mu­ cular. Mas se esses estímulos são eliminados co­
danças contínuas no ambiente, enquanto as seqüên­ locando-se uma cobertura opaca sobre o labirin­
cias de outras respostas podem não produzir qual­ to, a orientação espacial do labirinto em relação
quer mudança até que a seqüência esteja comple­ à sala toma-se irrelevante, e o rato não pode mos­
ta. Além dessas diferenças, então, será que impor­ trar outra coisa que não a aprendizagem de res­
ta se um organismo se desloca até um novo lugar posta. A aprendizagem de lugar ou a aprendiza­
ou se produz estímulos novos onde está? gem de resposta dependem, portanto, de como o
Questões desse tipo estavam implícitas na experiementador prepara o problema para o rato.
controvérsia sobre a aprendizagem de lugar ver­ Ao escolher criteriosamente as condições, um ex­
sus a aprendizagem de resposta. Podemos dife­ perimentador pode tomar qualquer um dos re­
renciar as viradas de um rato à direita, no ponto sultados mais provável do que o outro.
de escolha de um labirinto em T, ao reforçar vi­ Em ambientes naturais, o alimento em um
radas à direita, mas não à esquerda. Podemos en­ dado local não é necessariamente reabastecido
tão perguntar se o responder do rato está basea­ como no compartimento-alvo de um labirinto de
do em dimensões da resposta (movimentos à di­ laboratório. Ao forragear, um animal pode tor­
reita e não à esquerda) ou em dimensões de estí­ nar-se mais propenso a deslocar-se para um novo
mulo (movimentos em direção a um local parti­ local do que a retornar a um local onde já consu­
cular, sem levar em consideração a direção a miu o alimento que estava disponível. Uma vez

A p r e n d iz a g e m 151
mais, as propriedades do ambiente às quais um então é variada, o responder pode depender de
organismo presta atenção podem variar com as quanto o estímulo mudou. Por exemplo, se du­
limitações impostas pelo experimentador (cf. rante uma fase de treino as bicadas de um pom­
Collier & Rovee-Collier, 1981; Lea, 1979). Por bo no disco forem reforçadas quando o disco
exemplo, quando um rato é exposto a sessões estiver iluminado por amarelo, o pombo geral­
diárias em um aparato em que o alimento é colo­ mente bicará com taxas cada vez mais baixas à
cado nas extremidades de cada um dos vários medida que a luz do disco mudar para o laranja,
becos, e os becos não são reabastecidos durante depois para o vermelho e para o violeta, na fase
a sessão, o rato aprende a não retomar aos becos de teste. Isso demonstra generalização: os efei­
em que já comeu (Olton & Samuelson, 1976). tos do reforço na presença do amarelo estendem-
As propriedades espaciais do ambiente são par­ se para as outras cores.
ticularmente importantes, mas, em circunstânci­ A Figura 8.3 apresenta dados sobre a gene­
as apropriadas, um rato pode aprender outras pro­ ralização de bicadas de pombos no disco, a tons
priedades do ambiente. de diferentes freqüências depois que as bicadas
foram reforçadas apenas em presença de um tom
de 1000 ciclos por segundo (Jenkins & Harri­
GRADIENTES DE CONTROLE DE son, 1960). Em um procedimento (sem treino de
ESTÍM ULO discriminação), o tom estava sempre presente, e
as bicadas eram reforçadas segundo um esque­
Os procedimentos de discriminação colocam ma de intervalo variável ou VI. Em um segundo
uma pesada responsabilidade sobre o experimen­ procedimento (treino de presença versus ausên­
tador. Em um procedimento de diferenciação, o cia), o tom estava presente em algumas vezes e
organismo determina a ordem das respostas, mas ausente em outras, e as bicadas eram reforçadas
em um procedimento de discriminação o expe­ de acordo com o esquema de VI apenas durante
rimentador deve decidir-a ordem em que os estí­ o tom. Após o treino, o reforço foi interrompido,
mulos são apresentados. Um experimentador que e tons de outras freqüências foram apresentados
esteja interessado em algum contínuo de estímulo pela primeira vez, intercalados com a ausência
(isto é, alguma dimensão ao longo da qual os de tom e com a apresentação do tom original.
estímulos podem variar, como a intensidade ou Durante essa fase, cada estímulo era apresenta­
posição de uma luz) deve preocupar-se com do 8 vezes, em ordem mista.
quantos estímulos apresentar, por quanto tempo Para os três pombos sem treino prévio de dis­
e em que ordem e de que forma os estímulos de­ criminação (Figura 8.3, acima), nem a freqüên­
veriam ser correlacionados com o reforço e com cia do tom, nem sua presença ou sua ausência
o não-reforço, para mencionar algumas das pos­ tiveram qualquer efeito substancial sobre o bi­
sibilidades mais importantes. A pesquisa sobre car. O gradiente de generalização foi relativa­
gradientes de controle de estímulo busca os efei­ mente achatado ou, em outras palavras, o efeito
tos de algumas dessas variáveis. Esses procedi­ do reforço na presença do tom original esten­
mentos geralmente envolvem uma fase de trei­ deu-se uniformemente a todos os outros estímu­
no, durante a qual é programada alguma corre­ los. Podemos dizer que esses pombos não esta­
lação entre os estímulos e as respostas reforça­ vam atentando para o tom, porque as mudanças
das, seguida por uma fase de teste, durante a qual na freqüência do estímulo não fizeram qualquer
o reforço é suspenso, enquanto os estímulos no­ diferença para eles.
vos e velhos são apresentados. Para os cinco pombos que receberam treino
prévio de discriminação (Figura 8.3, abaixo), a
freqüência original produziu taxas de respostas
Gradientes de Generalização mais altas do que qualquer outra freqüência du­
rante a fase de teste; em geral, quanto mais pró­
Se uma resposta é reforçada durante um estí­ xima uma freqüência estivesse da freqüência
mulo, e alguma propriedade daquele estímulo original, maior era a taxa de respostas nessa nova

152 A. C harles C a t a n ia
30
SEM TREINO DE DISCRIMINAÇAO
0 70
Tom Apenas SD • 71
20 - V 72

O
V
10
SD

_L l -íh-
TREINO DE PRESENÇA-AUSENCIA

Tom SD - Ausência de Tom SA

FIGURA 8.3 Gradientes de generalização


para pombos individuais como função da
freqüência de um tom após o reforço de bi­
cadas no disco durante um tom de 1000 ci­
clos p o r segundo (acima, 3 pombos), ou
depois do reforço em presença daquele tom
e extinção em sua ausência (abaixo, 5 pom­
bos). Sem o treino de discriminação os gra­
dientes foram relativamente achatados;
após o treino de presença-ausência, eles
foram relativamente agudos, com seu ápice
correspondendo ao estímulo em cuja pre­
sença ocorria o reforço (SD). (Jenkins &
300 450 670 1000 1500 2250 3500 Harrison, 1960, Figuras 1 e 2)
Freqüência (Ciclos/Segundo)

freqüência. Não foi surpresa o fato de que taxas dimensão. A Figura 8.4 compara tal gradiente
baixas ocorressem quando o tom estava ausen­ de pós-discriminação com um gradiente de ge­
te; sua ausência estava correlacionada com a neralização (Hanson, 1959). Para um grupo de
extinção. Mas para esses pombos, a taxa de res­ pombos (generalização), as bicadas ao disco em
postas variou com a freqüência do tom, embora presença de um único comprimento de onda no
o responder discriminado dependesse somente disco foram reforçadas segundo um esquema de
da presença ou ausência do tom, e não de sua VI, depois do que a taxa de bicar em presença
freqüência. Podemos dizer, então, que os pom­ deste e de uma variedade de diferentes compri­
bos estavam prestando atenção ao tom. (A for­ mentos de onda foi determinada durante um pe­
ma dos gradientes de generalização também é ríodo sem reforço. O pico do gradiente (o ponto
afetada por outras variáveis, como o nível de com freqüência mais alta) ficou no estímulo cor­
privação ou o esquema de reforço durante o trei­ relacionado com o reforço; em outras palavras,
no: p. ex., Hearst, Koresko &, Poppen, 1964.) a taxa diminuiu à medida que aumentou a dis­
tância entre o estímulo de teste e o estímulo de
treino.
Gradientes de Pós-Discriminação Para um segundo grupo (pós-discriminação),
as bicadas ao disco foram reforçadas de acordo
Os gradientes de controle de estímulo tam­ com um esquema de VI durante o mesmo com­
bém podem ser obtidos após uma discriminação primento de onda que o do primeiro grupo, mas
entre dois ou mais estímulos ao longo de uma este comprimento de onda se alternava com ou-

A p r e n d iz a g e m 153
FIGURA 8.4 Gradientes de controle de es­
tímulo. O gradiente de generalização mos­
tra bicadas após o reforço sob um com­
primento de ondas de 550 milimicrons
(SD). O gradiente apresenta um pico no SD.
O gradiente de pós-discriminação mostra
respostas de bicar depois do reforço em
presença de um comprimento de onda de
550 milimicrons (SD) e extinção sob um
comprimento de onda de 570 milimicrons
(SA); o pico se deslocou: o máximo de res­
postas desviou-se do SD em direção opos­
ta à do SA. O expectro vai do violeta ao
azul nos comprimentos de onda mais cur­
tos e ao vermelho nos comprimentos de
onda longos, assim o SD e o SA estavam na
região verde-amarelo do espectro. (Han­
Comprimento de Onda (mu) son, 1959, Figura 1)

tro, durante o qual as bicadas não eram reforça­ criminação (cf. Hearst, Besley, & Farthing,
das (extinção); como no primeiro grupo, a taxas 1970).
de bicar durante este e outros comprimentos de Efeitos do treino discriminativo sobre a for­
onda foram determinadas durante um período de ma dos gradientes levou a questões sobre as ori­
não-reforço. Neste caso, o pico do gradiente foi gens dos gradientes de generalização com picos
deslocado do estímulo de reforço, em direção agudos. Uma das sugestões foi a de que os gra­
oposta ao estímulo de extinção; esse deslocamen­ dientes poderiam ser mais agudos ou mais acha­
to é chamado de deslocamento de pico. (Efeitos tados dependendo se os estímulos naquela re­
semelhantes também ocorrem quando a discri­ gião do gradiente eram mais fáceis ou mais difí­
minação é baseada em uma freqüência de refor­ ceis de discriminar. Mas, quando os graus de in­
ço mais alta durante um estímulo do que outro: clinação dos gradientes de generalização em
Guttman, 1959.) torno de estímulos em diferentes regiões do es­
Uma explicação para a forma do gradiente pectro foram comparados com os limiares para
de pós-discriminação (Spence, 1937) supunha a detecção de uma mudança no comprimento da
que o reforço na presença de um estímulo criava onda naquelas regiões, não foi possível encon­
um gradiente de responder aumentado, centrado trar qualquer relação simples entre a generaliza­
naquele estímulo (gradiente excitatório), que a ção e a discriminabilidade (Guttman & Kalish,
extinção em presença do outro estímulo produ­ 1956).
zia um gradiente de responder reduzido, centra­ Outra sugestão foi a de que os gradientes agu­
do neste segundo estímulo (gradiente inibitório), dos dependem da aprendizagem de discrimina­
e que, depois do treino de discriminação, o res­ ção que ocorre antes que o organismo seja ex­
ponder produzido por outros estímulos poderia posto à situação experimental. Por exemplo, um
ser previsto, subtraindo-se o gradiente inibitório pombo supostamente aprende a discriminar en­
do excitatório. O gradiente teórico de Spence tre os grãos que come muito antes de ver o ama­
mostrava um deslocamento de pico: o ponto mais relo projetado em um disco; suas discriminações
alto do gradiente era deslocado do estímulo de de cor devem ser mais marcantes na região do
reforço em direção oposta à do estímulo de ex­ amarelo no espectro, simplesmente porque o
tinção. Mas o novo gradiente, produzido pela amarelo predomina na cor de seu alimento. E di­
subtração, era mais baixo do que o gradiente ex­ fícil controlar as discriminações de cor adquiri­
citatório original em toda a sua extensão; assim, das nos ambientes naturais, mas poderíamos criar
ele era consistente com a forma, mas não com ambientes em que as discriminações de cor não
os valores absolutos do gradiente de pós-dis- fossem possíveis. Em um ambiente iluminado

154 A . C harles C a t a n ia
apenas por luz monocromática, em uma faixa ram um deslocamento de pico, embora os estí­
muito estreita de comprimentos de onda como o mulos consistissem, principalmente, de compri­
amarelo emitido por uma lâmpada de sódio a mentos de onda que eles jamais haviam visto
vapor, os objetos não têm cor; para uma pessoa antes (Terrace, 1975).
em um ambiente assim, tudo aparece em tons
de cinza. Um organismo criado em tal ambi­
ente não tem oportunidade de aprender as dis­ Gradientes de Inibição
criminações de cor.
Um organismo apropriado para um experi­ Diante da proposição de Spence de lidar com
mento sobre a criação em um ambiente mono­ a forma dos gradientes de pós-discriminação,
cromático é o patinho, que é capaz de andar e surgiu o interesse em encontrar um modo de se
bicar logo que sai da casca do ovo; portanto, os medir diretamente o gradiente de inibição. As
procedimentos de reforço podem ser iniciados dificuldades eram tanto metodológicas como te­
cedo. Gradientes de generalização ao longo de óricas. Para determinar se um estímulo redu­
comprimentos de ondas, obtidos com patinhos zia a taxa de respostas, teria de haver alguma
que haviam sido criados em ambientes mono­ taxa para começar. Era necessário um procedi­
cromáticos, às vezes, são achatados (Peterson, mento que separasse a dimensão ao longo da qual
1962; cf. Figura 8.3, acima) e, outras vezes são o gradiente de extinção seria determinado da­
agudos (p. ex., Rudolph, Honig, & Gerry, 1969; quela correlacionada com o reforço. Tal proce­
cf. Figura 8.3, em baixo), sugerindo que o pati­ dimento é ilustrado na Figura 8.5 (Honig e col.,
nho, às vezes, presta atenção à cor, mesmo sem 1963). Com um grupo de pombos, o estímulo
ter experiência com as cores. Quando os pati­ correlacionado ao reforço era uma linha vertical
nhos criados sob iluminação monocromática fo­ sobre o disco, e o estímulo de extinção era um
ram treinados a discriminar entre dois compri­ disco iluminado sem uma linha; com um segun­
mentos de onda, no entanto, seus gradientes de do grupo, esses estímulos eram invertidos. Para
pós-discriminação foram semelhantes aos de pa­ ambos os grupos, durante o treino foram usados
tinhos criados em ambiente natural, e apresenta­ esquemas de intervalo variável (VI), e na fase

FIGURA 8.5 Gradientes de controle de es­


tímulo excitatórios e inibitórios depois do
reforço de respostas de bicar, em pombos,
em intervalo variável na presença de um
estímulo (SD) e extinção em presença de
outro (SA). Dados de pombos são mostra­
dos para dois estudos (símbolos cheios e
vazios). Para um grupo, a linha vertical
era correlacionada ao reforço, e sua au­
sência era correlacionada à extinção (cír­
culos cheios); para outro grupo; esses es­
tímulos eram invertidos (círculos vazios).
Dados obtidos na ausência de reforço
mostram o responder na presença de dife­
rentes orientações da linha e na ausência
da linha. (Honig, Boneau, Burstein, &
© 0 0 0 © © © O Pennypacker, 1963, Figura 1)
Graus

A p r e n d iz a g e m 155
de teste foram obtidos, na ausência de reforço, ao longo da dimensão relevante e da extinção
os gradientes de controle de estímulo ao longo correlacionada ao outro; e (4) o gradiente ini­
da dimensão de orientação da linha. bitório, depois do reforço na presença de um estí­
No grupo com a linha vertical correlaciona­ mulo, mas não na dimensão relevante, e extinção
da ao reforço e a ausência da linha correlaciona­ na presença de um estímulo naquela dimensão.
da à extinção (círculos cheios), o bicar diminuiu Qualquer que seja o gradiente, podemos sem­
com os maiores desvios da vertical; este é um pre formular questões sobre as dimensões de
gradiente de reforço como o da Figura 8.3 (em estímulo a que de fato um organismo presta aten­
baixo). Mas no grupo com a linha vertical corre­ ção. Por exemplo, suponhamos que o pombo olhe
lacionada à extinção e sua ausência correlacio­ apenas para o contorno superior de um disco que
nada ao reforço (círculos vazios), o bicar aumen­ tem uma linha projetada sobre ele. Se mudamos
tou com os maiores desvios da vertical. Neste a direção da linha da vertical, a parte superior da
grupo, mudar a orientação da linha afetava sua linha se desloca daquela região do disco, de modo
distância do estímulo de extinção, mas não sua que o contorno parece mais como ele era quan­
distância do estímulo de reforço que era a au­ do não havia uma linha ali. Nesse caso, a linha é
sência de uma linha. Esse é um gradiente inibi­ o estímulo nominal, mas o estímulo funcional é
tório. o que aparece junto ao contorno superior do dis­
Os gradientes inibitórios geralmente são mais co. A única maneira de avaliar tal possibilidade
achatados do que os gradientes excitatórios cor­ é pela experimentação (p. ex., removendo por­
respondentes, provavelmente porque os organis­ ções da linha e observando se isso produz os mes­
mos tendem a atentar mais para as propriedades mos tipos de mudanças no comportamento do
dos estímulos correlacionadas ao reforço do que pombo que aquelas produzidas pela rotação da
para aquelas correlacionadas à extinção (cf. Dins- linha: cf. Touchette, 1969). O argumento pode
moor, 1995). Uma condição como aquela do pri­ parecer trivial com relação às respostas do pom­
meiro grupo, em que uma linha era a caracterís­ bo, mas pode ser extremamente importante em
tica apresentada somente durante o reforço, é de­ situações de aplicação, quando, por exemplo, um
nominada discriminação da característica posi­ professor tenta descobrir se uma criança está
tiva; uma condição como a do segundo grupo, atentando para as palavras, em um livro de his­
em que a linha era a característica presente so­ tória, ou se está fraudando a leitura e atentando
mente não durante a extinção, é denominada de essencialmente para as figuras.
discrim inação da característica negativa
(Jenkins & Sainsbury, 1970). Como é mais fácil
conseguir que os organismos atentem para os es­ ESVANECIMENTO (FADING):
tímulos correlacionados ao reforço do que à ex­ CONTROLE DE ESTÍM ULO PO R
tinção, treinar uma discriminação com a carac­ APROXIMAÇÕES SUCESSIVAS
terística positiva é mais fácil do que treinar uma
discriminação com a característica negativa. Al­ Do mesmo modo que as propriedades de res­
gumas implicações desses fenômenos serão con­ posta que definem uma classe operante podem
sideradas mais detalhadamente no Capítulo 11, em ser gradualmente modificadas por meio de pro­
uma discussão sobre as respostas de observação. cedimentos de modelagem, as propriedades de
Consideramos até agora os quatro principais estímulo que definem uma classe operante dis­
tipos de gradientes de controle de estímulo: (1) criminada podem ser gradualmente alteradas por
o gradiente de generalização relativamente acha­ procedimentos análogos, denominados de esva-
tado, sem atenção à dimensão de estímulo rele­ necimento ou esmaecimento. O treino não tem
vante; (2) o gradiente de generalização com pico que começar com estímulos que são difíceis de
agudo, com atenção à dimensão de estímulo rele­ discriminar. Ele pode começar com aqueles es­
vante; (3) o gradiente de pós-discriminação, que tímulos que são fáceis de discriminar e, então,
normalmente apresenta um deslocamento de pico mudar gradualmente para os estímulos mais di­
depois do reforço correlacionado a um estímulo fíceis. Por exemplo, para o bicar de um pombo

156 A. C harles C a t a n ia
reforçado com alimento, normalmente, é mais curo, durando 5 segundos. Gradualmente, ao lon­
difícil estabelecer uma discriminação entre as go de 3 sessões, sua duração foi, gradualmente,
linhas verticais e horizontais do que entre o ver­ aumentada, e ele mudou de escuro para verde
melho e o verde. Uma vez que uma discriminação fraco, para verde um pouco mais forte, até um ní­
entre vermelho e verde esteja estabelecida, contu­ vel final que, para o olho humano, igualava-se ao
do, a discriminação entre vertical e horizontal pode brilho do disco vermelho. Ao final dessas condi­
ser aproximada sucessivamente ao superpor verti­ ções, os 3 minutos de vermelho correlacionado ao
cal sobre vermelho e horizontal sobre verde e, en­ reforço se alternavam com 3 minutos de verde cor­
tão, gradualmente, remover ou esvanecer as cores relacionado com a extinção. Cada pombo tratado
(Terrace, 1963b). (Um pouco de esvanecimento dessa maneira bicava o disco de extinção menos
grosseiro vem sendo programado neste capítulo, do que 10 vezes durante todo o treino; o bicar ocor­
pela substituição da expressão completa intervalo ria, quase sem exceção, no disco vermelho, e não
variável, em favor de sua abreviatura, VI, depois no verde. Pombos expostos a este procedimento
que ambas apareceram juntas mais de uma vez.) mais tarde, depois de um treino inicial ou para os
O estabelecimento de controle de estímulo quais o verde foi introduzido abruptamente, com
por meio da alteração gradual de estímulo geral­ duração e intensidade plenas, bicaram no disco
mente é bastante efetivo (p. ex., Sidman & Stod­ verde de extinção centenas e mesmo milhares de
dard, 1967) mas, como no caso da modelagem, vezes durante períodos equivalentes de treino.
não há regras simples para determinar quão ra­ A introdução gradual do verde foi suficiente
pidamente os estímulos devem ser gradualmen­ porque, entre outras coisas, escurecer o disco
te introduzidos (fading in) ou removidos (fading vermelho logo no início do treino impedia o pom­
out) em diferentes situações. Por exemplo, se bo de bicar por uns poucos segundos (qualquer
superpomos o vertical sobre o vermelho e o ho­ mudança de estímulo abmpta poderia ter tido tal
rizontal sobre o verde e, então, esvanecemos par­ efeito). Era pouco provável que o bicar recome­
cialmente as cores, podemos descobrir mais tar­ çasse antes do término dos 5 segundos do estí­
de, após remover completamente as cores, que o mulo de extinção. Assim, uma diferença no res­
pombo aprendeu a discriminar entre o vertical e ponder aos dois estímulos foi estabelecida des­
o horizontal. Por outro lado, o esvanecimento pode de o início, e as mudanças graduais na duração e
ser mal sucedido; se o pombo atenta apenas para intensidade do estímulo de extinção foram esta­
as cores, mesmo quando elas se tomam muito fra­ belecidas a partir dessa diferença. Depois de uma
cas, podemos descobrir que o responder discrimi­ história como essa, podemos mudar o estímulo
nado desaparece toda vez que enfraquecemos as de extinção para reforço e pode ser que o pombo
cores abaixo de certos níveis de limiar. nunca responda durante aquele estímulo para
Do mesmo modo que a modelagem requer chegar a descobrir que fizemos isso. Em que sen­
que algum comportamento esteja disponível para tido este é um desempenho sem erro não é ób­
ser modelado, o esvanecimento requer que al­ vio. Devemos ter cuidado com a linguagem de
gum comportamento sob controle discriminati­ erros; o termo erro implica um julgamento sobre o
vo esteja disponível para ser mudado no contro­ valor do responder e pode ser inapropriado a uma
le de uma nova dimensão de estímulo. Conside­ análise do comportamento. O procedimento de es­
remos, por exemplo, a aprendizagem de discri­ vanecimento não tem interesse apenas teórico; suas
minação sem erro (Terrace, 1963a). Logo depois possíveis aplicações à educação conferem a ele
que as bicadas de um pombo em um disco ver­ uma importância prática (p. ex., ver Capítulo 17).
melho foram modeladas com reforço alimentar,
o reforço durante o vermelho passou a ser pro­
gramado de acordo com um esquema de inter­ A TERMINOLOGIA DO REFORÇO
valo variável. Períodos de três minutos de ver­ DIFERENCIAL
melho se alternavam com um outro estímulo,
durante o qual as bicadas não eram reforçadas. Tanto a diferenciação quanto a discrimina­
De início, este outro estímulo era um disco es­ ção envolvem o reforço diferencial. A principal

A p r e n d iz a g e m 157
diferença está em se o reforço diferencial é im­ distinguir entre outras (p. ex., linhas retas ver­
posto sobre as propriedades do responder ou so­ sus linhas curvas são importantes para distinguir
bre as propriedades do estímulo em cuja presen­ entre U e V, mas não entre V e N), e distinções
ça o responder ocorre. A principal implicação diferentes são importantes para letras minúscu­
dessa diferença diz respeito ao procedimento: em las e maiúsculas (p. ex., nenhum par de letras
estudos de diferenciação, o experimentador deve maiúsculas tem as reversões para cima e para
esperar pelas respostas do organismo, enquanto baixo ou para a esquerda e a direita que devem
em estudos de discriminação o experimentador ser dominadas para a leitura de b, p, d, e q). A
controla a ordem e a duração das apresentações maneira pela qual uma criança aprende a distin­
do estímulo. A terminologia da diferenciação e guir as letras do alfabeto depende da relação en­
da discriminação está resumida na Tabela 8.1. tre as propriedades dos estímulos como a sime­
O reforço diferencial pode ser baseado em tria, a curvatura e o fechamento. As proprieda­
dimensões simples de estímulos, como a inten­ des essenciais para discriminar as letras diferen­
sidade ou a localização. A questão experimental tes são chamadas de características críticas (p.
é se o responder se conforma às conseqüências ex., Gibson, 1965).
diferenciais, de modo que mais respostas ocor­ Não é suficiente, porém, enumerar caracte­
ram na presença dos estímulos correlacionados rísticas críticas. Para algumas letras, as formas
ao reforço do que na presença daqueles correla­ maiúscula e minúscula diferem mais entre si do
cionados com a ausência de reforço. As impli­ que diferem de outras letras (p. ex., e, E e F, ou
cações são profundas. O que aprendemos a par­ h, n, e N). Dada a multiplicidade de formas, o
tir do treino de discriminações simples com ra­ que então define uma classe de estímulos que
tos e pombos têm sido empregado para desen­ ocasiona a resposta de dizer A, ou B, ou C? Essa
volver métodos para treinar primatas a discrimi­ é uma pergunta sobre a estrutura de estímulo das
nar entre os diferentes tipos de drogas que lhes letras do alfabeto. O problema pode ser ainda
são administradas (p. ex., Schuster & Balster, mais complicado quando se consideram diferen­
1977), para ensinar pais jovens a discriminar tes contextos. Por exemplo, a letra O poderia ser
doenças em suas crianças (p. ex., Delgado & uma letra ou um zero, e a letra I poderia ser uma
Lutzger, 1988) e para instruir mulheres na reali­ letra ou um numeral romano. O conceito de um
zação do auto-exame da mama (p. ex., Pennypa­ X, Y ou Z é definido pela classe de estímulos a
cker & Iwata, 1990), só para mencionar algu­ que respondemos com o nome da letra corres­
mas das inúmeras aplicações bem-sucedidas. pondente, mas veremos que essas classes são ba­
Como ilustrado por essas aplicações, o reforço seadas no comportamento, não em propriedades
diferencial pode ser programado para proprie­ físicas comuns (cf. Capítulo 14).
dades complexas dos estímulos que não são fa­ Os operantes discriminados são classes de
cilmente quantificáveis. Por exemplo, crianças comportamento definidas pelos estímulos que
que estão aprendendo a ler devem ser capazes ocasionam o responder. Tais classes são freqüen­
de nomear as letras do alfabeto. Mas as proprie­ temente identificadas em nosso vocabulário co­
dades importantes para distinguir entre algumas tidiano, por exemplo, quando falamos de parar
letras são diferentes das que são importantes para em um semáforo vermelho ou de atender ao te-

TABELA 8.1 A Terminologia do Reforço Diferencial


Reforço Diferencial Concentração dos Extensão dos Reforço Diferencial
(Operação) Efeitos do Reforço Efeitos do Reforço por Aproximações
(Processo) (Processo) (Operação)
Em relação às Diferenciação Indução Modelagem
propriedades da resposta

Em relação às propriedades Discriminação Generalização Esvanecimento


do estímulo
'ST" . Q

158 A. C harles C a t a n ia
lefone. A luz vermelha pode variar em brilho e to do organismo (p. ex., Shimp, Sabuslky, &
tamanho e o toque do telefone em altura e tim­ Childers, 1989) para mencionar apenas alguns.
bre, mas o responder é razoavelmente indepen­ Muitos exemplos de pesquisas sobre a cogni­
dente de variações ao longo de tais dimensões, e ção animal são apresentados em outros trechos
assim falamos em termos dessas classes de even­ neste livro, assim esta seção apresenta apenas
tos, e não de casos particulares. uma amostra altamente seletiva.
Freqüentemente, tratamos os estímulos como Consideremos um pombo que observa o mos­
se fossem restritos a objetos concretos ou a even­ trador de um relógio de pulso projetado no disco
tos ambientais. Mas, embora possamos apren­ do centro de três discos para pombos (Neiworth
der a responder consistentemente a objetos ou & Rilling, 1987). O ponteiro longo começa na
eventos em nosso ambiente, também discrimi­ vertical e gira até os 90°; então ele desaparece.
namos entre as características, às vezes, chama­ Um pouco mais tarde ele reaparece mais longe,
das de abstratas ou de relacionais que são inde­ em 135° ou em 180°. O momento de seu reapa­
pendentes dos objetos ou dos eventos particula­ recimento é consistente ou inconsistente com
res. O termo estímulo, geralmente, funciona des­ uma taxa constante de rotação, enquanto ele está
se modo mais geral, no sentido de alguma pro­ invisível. Depois de uma tentativa consistente
priedade de eventos ambientais. Por exemplo, com uma taxa de rotação constante, as bicadas
podemos dizer que uma cadeira foi colocada à no disco da esquerda são reforçadas; depois de
direita de uma mesa. Embora a cadeira e a mesa uma tentativa inconsistente, as bicadas no disco
sejam objetos concretos, estar-à-direita-de não da direita são reforçadas. Sob condições como
é, e ainda assim podemos discriminar entre esta essas, os pombos aprenderam a discriminar as
relação e estar-à-esquerda-de. Portanto, em alguns tentativas consistentes com uma taxa de rotação
experimentos de discriminação, as relações entre constante daquelas em que a taxa constante era
estímulos têm sido as dimensões de interesse. violada, mesmo que o estímulo em rotação esti­
vesse ausente por algum tempo; a discriminação
também se transferiu para novas localizações do
reaparecimento do mostrador do relógio. Esse
Seção B Cognição Animal desempenho não estava baseado em durações das
tentativas ou em localizações específicas do mos­
O campo da cognição animal interessa-se por trador do relógio. Ele demonstra, assim, o ras-
aquilo que os animais sabem. O campo aborda treamento visual na ausência do estímulo visual;
esse problema identificando os eventos e as re­ tal rastreamento é chamado de representação (ou
lações que podem ser discriminados por dife­ imaginação) visual (imagery, cf. Capítulo 20).
rentes espécies. Os estudos da cognição animal Coloquialmente, podemos dizer que o pombo
têm examinado uma variedade de desempenhos sabia onde o estímulo estava, mesmo enquanto
discriminativos e apresentam especial quando ele estava invisível (uma habilidade útil, quan­
envolvem discriminações de propriedades rela­ do, por exemplo, um inseto comestível passa por
cionais complexas do ambiente. Certos exem­ trás de uma obstrução, e o pássaro espera que
plos incluem o julgamento de simetria visual (p. ele surja do outro lado).
ex., Delius & Nowak, 1982); discriminação de Os estudos sobre cognição animal estão in­
numerosidade (p. ex., Davis & Pérusse, 1988); teressados no que os organismos sabem, e as ex­
busca visual (Blough, 1989); controle discrimi­ plicações, geralmente, estão vinculadas à estru­
nativo por contingências de reforço ou por estí­ tura dos estímulos relevantes (cf. Capítulo 1,
mulos correlacionados com tais contingências sobre linguagem estrutural e funcional). Por
(p. ex., Washburn, Hopkins, & Rumbaugh, exemplo, se um organismo discrimina entre cer­
1991); a organização do comportamento dentro tos estímulos com base em alguma característi­
de uma seqüência discriminada sequencialmen­ ca crítica, um cognitivista pode dizer que o or­
te (Terrace & Chen, 1991); e o responder sob ganismo representa os estímulos para si mesmo
controle de estímulo do próprio comportamen­ com base naquela característica (p. ex., no exem-

A p r e n d iz a g e m 159
pio do mostrador de relógio, diria que o pombo te equivalentes à navegação celeste. Os organis­
representa ou imagina seu movimento constante mos que deixam seu território natal, devem ser
ou no caso da busca da presa, o predador com­ capazes de retomar a ele; quanto mais precisa­
para o alvo potencial com uma imagem de bus­ mente puderem fazer isso, mais amplamente
ca). Discutimos o papel da representação nas te­ podem forragear. Os organismos que armazenam
orias biológicas, no contexto da seleção natural, alimento no invemo devem ser capazes de loca­
no Capítulo 3. A questão será retomada no con­ lizar o alimento mais tarde; quanto mais variá­
texto da memória e da recordação, como em re­ veis seus locais de armazenagem e quanto mais
construir e então “reapresentar” (no sentido lite­ locais eles puderem rastrear, menor a probabili­
ral de apresentar de novo) as características de dade de que percam o que armazenaram para seus
eventos que já ocorreram, e no contexto das teo­ competidores (p. ex., Balda, Kamil, & Grim,
rias comportamentais e cognitivas, no Capítulo 1986). Os organismos que se evadem de preda­
20, onde argumentaremos que o imaginar pode dores devem ser capazes de localizar rotas de
ser apropriadamente tratado como um tipo de fuga; os que se deixam perseguir para becos sem-
comportamento. saída não sobrevivem.
Consideramos algumas questões relevantes
à orientação espacial, quando discutimos a apren­
MAPAS COGNITIVOS dizagem de lugar versus a aprendizagem de res­
posta. Os dois tipos de comportamento foram
Sempre que os ambientes locais têm proprie­ distinguidos, principalmente, com base em se ha­
dades diferentes, é vantajoso para um organis­ via estímulos disponíveis para o rato fora do la­
mo ser capaz de encontrar sua rota de um lugar birinto. Se havia, o rato podia orientar-se no com­
para o outro. Um ambiente com um suprimento plexo mais amplo de estímulo, a sala em que o
de alimento rico e estável é preferível a um em labirinto estava localizado; e assim ele aprendia
que existe o mesmo alimento, mas ele está me­ os lugares. Se não, ele dominava apenas as vira­
nos acessível; um ambiente com áreas seguras das específicas dentro do labirinto e aprendia res­
para procriar e para cuidar da prole é preferível postas. Complexidades adicionais foram intro­
a um que seja mais perigoso, e assim por diante. duzidas em outros experimentos em labirintos
(O argumento vale para a maioria dos grupos ani­ (cf. Olton, 1979). Por exemplo, demonstrou-se
mais. Seria ir longe demais considerar as variá­ que um rato, às vezes, escolhe a rota mais curta
veis fílogenéticas que operaram na evolução das disponível no labirinto, quando uma outra rota
plantas, mas é apropriado notar que muitas plan­ preferida anteriormente é bloqueada ou que, às
tas dispersam suas sementes; os animais estão fre­ vezes, ele segue atalhos apropriados, que acaba­
qüentemente envolvidos nesta dispersão, por ram de ser acrescentados ao labirinto, mesmo que
exemplo, quando as abelhas polinizam as flores). nunca tenha percorrido aqueles atalhos antes. Os
Uma vez que algum tipo de orientação tenha resultados justificam falar de mapas cognitivos
emergido, a seleção natural tende a acentuá-la (Tolman, 1948); a descoberta de que os organis­
ao longo do tempo filogenético (cf. Capítulo 3). mos podem localizar uma área mesmo quando
Assim, não é de se surpreender que muitas espé­ se aproximam dela por uma nova direção de­
cies animais encontrem prontamente sua dire­ monstra que eles podem aprender as relações es­
ção no mundo. Algumas de suas habilidades de paciais além das, ou talvez em vez de, trilhas
“navegação” são aprendidas, e outras são não- específicas.
aprendidas. Gallistel (1990) elaborou um trata­ Os problemas para determinar as caracterís­
mento detalhado que trata do forrageio em for­ ticas ambientais às quais os organismos prestam
migas, à localização pelo eco (ecolocação) em atenção, emergem em uma escala maior na ha­
morcegos e à escolha de rotas pelos chimpan­ bitação e na migração animal à medida que se
zés, e que vai da orientação baseada em dimen­ deslocam de um lugar para outro. As vespas re­
sões simples do estímulo, como os gradientes de tomam a seus ninhos, as abelhas retomam a suas
odor ou luz, a variedades que são funcionalmen­ colméias, os salmões retomam a seus rios de ori­

160 A. C harles C a t a n ia
gem, e os pássaros retomam a ninhos sazonais. nação de propriedades que inclui necessariamen­
Entre as características ambientais que são im­ te um ponto de referência e um estímulo à es­
portantes podem estar os marcos geográficos, querda daquele ponto de referência.)
como a localização e o movimento do sol e das Já comentamos que é difícil definir os e s tí­
estrelas, a luz polarizada, os gradientes quími­ mulos discriminativos por dimensões físicas. Por
cos e os campos magnéticos (p. ex., Tinbergen, exemplo, as propriedades que definem a letra A
1972; Walcott, Gould, & Kirshvink, 1979). Em variam dependendo se ela é maiúscula ou mi­
alguns casos, os organismos navegam isolada­ núscula ou se aparece em letra de forma ou ma­
mente para regiões que nunca visitaram antes; nuscrita. A capacidade de discriminar entre tais
em outros eles o fazem em companhia de outros estímulos existe em animais, assim como em
membros de suas espécies. Ambos os casos de­ humanos (p. ex., discriminações entre várias for­
vem envolver substanciais componentes filoge- mas da letra A e do dígito 2 foram estabelecidas
néticos, com relação a importantes propriedades em pombos: Morgan e col., 1976). Mas a difi­
do ambiente ou com relação a contingências que culdade de definir os estímulos com base em pro­
levam à migração em gmpo (ou ambos). Em re­ priedades físicas mensuráveis não se limita a
lação a migrações de longas distâncias, as con­ classes arbitrárias estabelecidas por humanos, tais
tingências filogenéticas podem ter envolvido a como letras e números. Elas existem também com
seleção daqueles capazes de manter a orienta­ objetos e eventos do cotidiano. O que distingue os
ção no curso de jornadas cada vez mais longas, à cachorros dos outros animais? Com base em que
medida que os continentes foram lentamente se se­ generalizamos entre chihuahuas e huskies, cha­
parando ao longo do tempo geológico (Skinner, mando-os de cachorros, enquanto discriminamos
1975). Um tratamento mais detalhado desse fenô­ entre huskies e lobos, embora eles pareçam mais
meno está além do escopo deste livro, mas ele ilus­ semelhantes entre si que huskies e chihuahuasl
tra que uma análise das propriedades do estímulo Pombos foram ensinados a discriminar entre
que determinam o comportamento é relevante tanto certas figuras que continham uma forma huma­
para a fílogenia quanto para a ontogenia. na e figuras que não continham tal forma (p. ex.,
Herrnstein & Loveland, 1975). Essas discrimi­
nações foram denominadas conceitos naturais.
CONCEITOS NATURAIS E CLASSES Em um estudo (Herrnstein, Loveland, & Cable,
DE ESTÍM ULOS PROBABILÍSTICAS 1976), diapositivos eram projetados em uma tela
próxima ao disco de um pombo, e suas bicadas
Podemos falar de conceitos como generali­ eram reforçadas na presença de algumas figu­
zação, dentro de uma classe de estímulos, e dis­ ras, mas não na presença de outras. Alguns pom­
criminação, entre classes de estímulos (Keller & bos aprenderam discriminações entre algumas fi­
Schoenfeld, 1950). Assim, nosso conceito de guras com e sem árvores; outros aprenderam a
vermelho deve envolver a generalização entre discriminar entre figuras com e sem água; ou­
todos os estímulos a que chamamos de verme­ tros ainda aprenderam discriminações entre fi­
lho, e a discriminação entre esses estímulos e guras com e sem uma pessoa. Após treino com
todos os outros a que não chamamos de verme­ um conjunto de figuras (p. ex., figuras com e sem
lho. Então, os conceitos estão para as classes de árvores), os pombos discriminaram entre figu­
estímulos como os operantes estão para as clas­ ras da mesma classe de estímulos que não ha­
ses de respostas. (O responder com base em al­ viam sido apresentadas até então. As novas fi­
guma propriedade singular de estímul os é deno­ guras, às vezes, eram discriminadas mais preci­
minado abstração, e a linguagem de conceitos, samente do que as empregadas no treino. As
às vezes, restringe-se ao responder baseado em implicações delineadas foram que:
alguma combinação de propriedades. Mas essas
são distinções ambíguas. Por exemplo, estar-à- ...não podemos começar a esboçar uma lista de ele­
mentos comuns. Para reconhecerem uma árvore, os
esquerda-de pode ser tratado como uma propri­ pombos não requeriam que ela fosse verde, repleta
edade relacional singular ou como uma combi­ de folhas, vertical, composta de madeira, tivesse

A p r e n d iz a g e m 161
tronco grosso, muitos galhos, e assim por diante (dei­ son, 1978; ver Glossário) e as classes de equi­
xando de lado o problema de elementos em comum valência (que serão abordadas no próximo capítu­
subjacentes a termos como repleto de folhas, verti­
cal, tronco grosso, etc). Além do mais, para ser re­
lo). De fato, a classe de classes de estímulo é, ela
conhecível como uma não-árvore, uma figura não própria, uma classe de estímulo probabilística, no
tinha que deixar de conter elementos como a cor sentido de que sua definição muda à medida que
verde, aparência de madeira, ramificações, traçados expandimos os limites de pesquisa relevante.
verticais, e assim por diante. Também não pudemos
identificar elementos em comum nos outros dois ex­
perimentos. Se não existem elementos em comum,
DEFINIÇÃO DE CLASSES DE ESTÍMULOS
então qual a base para o responder? Nenhuma outra
teoria é tão facilmente caracterizável, embora uma al­
ternativa se imponha, ainda que em termos amplos. O problema de definir as classes de estímu­
Os pombos respondem a agrupamentos de traços los é generalizado. Ele não será resolvido por
mais ou menos isomórficos como os agrupamentos meio do apelo a procedimentos de mensuração
a que nós mesmos respondemos. O verde deveria física, porque a leitura de instrumentos de medi­
estar nas folhas, caso a cor verde ou as folhas este­
jam presentes. Contudo, nenhum deles é necessário
da também é um comportamento discriminativo.
ou suficiente. As partes verticais ou as ramificações Como veremos no próximo capítulo, as classes de
de galhos deveriam ser as partes da madeira, embo­ comportamento dependem das contingências co­
ra nenhum desses traços seja necessário ou suficien­ muns que as estabeleceram, e não de suas proprie­
te. O que vemos como árvores engloba uma lista dades físicas. Mesmo o comportamento do cien­
complexa de conjunções e disjunções probabilísticas,
tista depende de discriminações aprendidas no la­
cuja descoberta requereria muito mais esforço do que
pareceria justificado por qualquer benefício possível. boratório. Como já vimos, as distinções entre re­
(Hermstein, Loveland, & Cable, 1976, pp. 298-299) forço, punição, eliciação e outros processos com-
portamentais são baseadas em tais discriminações.
Os conceitos naturais são exemplos de classes Elas são o ponto de partida para nossa taxonomia.
de estímulo probabilísticas, classes em que cada O controle de estímulos é um fundamento (um ele­
membro contém algum subconjunto de caracterís­ mento básico) no que diz respeito a nosso próprio
ticas, mas nenhum é comum a todos os membros. comportamento científico, tanto quanto no que
O número de características no subconjunto pode concerne ao comportamento dos organismos que
variar de um membro da classe para outro. As ve­ estudamos. Assim, qualquer filosofia da ciência
zes, estas classes denominadas conjuntos impreci­ efetiva deve levá-lo em consideração.
sos ou indefinidos (fuzzy sets) não têm limites bem Começamos este capítulo explorando os pa­
definidos, embora membros da classe possam ter ralelos entre diferenciação e indução, de um lado,
semelhanças de famílias (Rosch, 1973). e discriminação e generalização, de outro. Os
Algumas classes de estímulo probabilísticas quatro processos são resultado do reforço dife­
são definidas por referência a um protótipo. Um rencial; eles diferem, principalmente, se o refor­
protótipo é um membro típico de uma classe pro- ço diferencial é programado para as proprieda­
babilística; é derivado de uma média ponderada des de estímulo ou de resposta. Tratamos os as­
de todas as características de todos os membros pectos funcionais de controle de estímulo no
da classe. Por exemplo, os pássaros constituem contexto de experimentos sobre a atenção, sobre
uma classe de estímulo probabilística; a maioria os gradientes de controle de estímulo e sobre os
deles voa, mas os avestruzes e os pingüins não. procedimentos de esvanecimento. Ao lidar com
Na produção de um pássaro prototípico, as pe­ as propriedades discrimináveis do ambiente no
nas devem ter um peso maior do que os pés, com contexto da cognição animal, consideramos de que
membranas interdigitais, porque os pássaros têm modo as características relacionais complexas do
mais penas do que pés com membranas. Assim, ambiente poderiam definir as classes de estímulo.
um tordo é mais prototípico do que um pato, Os mapas cognitivos e os conceitos naturais for­
porque o tordo partilha mais características com neceram os exemplos relevantes. No próximo ca­
outros pássaros do que o pato. pítulo, iremos explorar melhor as classes de estí­
Outros tipos de classes de estímulo incluem mulo complexas e verificar como elas são rele­
as classes de estímulo polimorfas (Lea & Harri- vantes para julgamentos humanos importantes.

162 A . C harles C a t a n ia
Discriminação Condicional e
Classes de Ordem Superior
9
A. Dimensões Relacionais de Estímulos Como contingências, as discriminações po­
Emparelhamento com o Modelo e Emparelhamento por dem ser efetivas sob algumas condições, mas não
Singularidade sob outras. Por exemplo, sua resposta a uma luz
Comportamento Simbólico: Classes de Equivalência verde em um cruzamento dependerá de que lado
você está, se de frente para a luz ou olhando para
B. Classes de Comportamento de Ordem Superior
Aprender a Aprender (Leaming Set) ela do outro lado da rua. Tais discriminações,
Propriedades de Classes de Ordem Superior em que o papel de um estímulo depende de ou­
Origens da Estrutura tros que forneçam o contexto para ele, são deno­
minadas discriminações condicionais. Conside­
C. Fontes do Comportamento Novo remos o caso da atenção em relação ao pombo,
discutida no Capítulo 8 (Figura 8.2). Os estímu­
A palavra matching (emparelhamento) tem sua los disponíveis são triângulos ou círculos, sobre
origem no inglês arcaico do indo-europeu mag- ou um fundo vermelho ou verde. Suponhamos que
mak-, to knead (trabalho manual) ou fashion (moda); acrescentemos uma lâmpada sobre o disco e que
está relacionada a to make (fazer), among (em com­ reforcemos as bicadas na presença de triângulos
panhia de) e mass (massa). A palavra sample (amos­
tra ou modelo) pode ser relacionada à raiz indo-eu-
quando ela estiver acesa e bicadas na presença
ropéia em-, to take (tomar) ou distribute (distribuir). do vermelho quando ela estiver apagada. Sob
Como example (exemplo), esta palavra combina a essas circunstâncias, quando a lâmpada está ace­
raiz latina ex-, fo rt (forte), e emere, to buy (com­ sa o pombo passa a bicar os triângulos, mas não
prar) ou obtain (obter); ela está relacionada a exempt os círculos, independente da cor; quando ela está
(livre de uma obrigação), prompt (pista) e consume
(consumo). Comparison (comparação) é derivada
apagada, ele passa a bicar os discos vermelhos,
do latim com-, with (com), mais par, equal (igual); mas não os verdes, independente da forma. Em
está relacionada a part (parte), pair (par) e, talvez outras palavras, se o pombo discrimina a forma
também a repertory (repertório). Oddity (singular ou a cor é condicional a se a lâmpada está acesa.
ou diferente) tem mais do que uma etimologia; é Neste capítulo iremos considerar diversos
derivado do antigo escandinavo odtdi, um ponto ou
um triângulo.
procedimentos experimentais em que as contin­
O conceito de classes está implícito na etimolo­ gências discriminativas dependem do contexto
gia de symbolic (simbólico), que ao combinar o ter­ em que elas são programadas. Veremos que es­
mo grego sym-, together (junto), e ballein, to throw ses procedimentos geram classes de comporta­
(lançar), sugere a criação de uma unidade de partes mento de ordem superior, no sentido de que as
separadas. Combinado com dia-, across (de um lado
classes são definidas não por estímulos ou por
para o outro), a palavra ballein fornece, através de
diabolic (diabólico), a raiz para devil (demônio), e respostas particulares, mas por relações que in­
combinado com pro-, before (antes de), fornece a cluem tais estímulos e respostas como casos es­
raiz para problema. peciais (cf. Capítulo 7). Serão revistos os pro­
cedimentos de emparelhamento com o modelo,
de emparelhamento por singularidade (oddity), 1

•••
de emparelhamento arbitrário e o de aprendiza­
gem de séries de problemas sucessivos (lear­ íntervaio entre
as tentativas
ning set). Eles formam um contexto dentro do
qual poderemos explorar as condições sob as Ts
quais um estímulo pode tornar-se o equivalente

• Ç)•
funcional de um outro estímulo (quando, por 1

exemplo, em uma variedade de situações, a le­


tra maiúscula A e a letra minúscula a funcionam Modelo
como a mesma letra).
Bicada Resposta de
observação
I

Oo0
í ”

Seção A Dimensões Relacionais de


Estímulos de
Estímulos comparação

1 Resposta de
Muitas discriminações condicionais envol­ Bicada Bicada emparelhar
vem relações arbitrárias entre um estímulo dis­ 1
Sem comida Comida j Conseqüência
criminativo condicional e as discriminações para
as quais ele estabelece a ocasião. Alguns casos
em que tais relações não são arbitrárias são de
interesse especial. Por exemplo, se em uma si­ FIGURA 9.1 Diagrama de uma tentativa de empare­
lhamento com o modelo em uma câmara para pombos,
tuação um estímulo é comparável a um ou a vá­ com três discos. Depois de um intervalo entre as tenta­
rios outros ou é um estímulo singular, depende tivas, de ts, um estímulo - modelo ou amostra (verde:
do, ou é condicional ao, contexto no qual ele é G) aparece no disco do centro. Uma bicada no disco do
apresentado. Por exemplo, se os estímulos A e centro ilumina os dois discos laterais. Um estímulo de
B são azuis e o estímulo C é amarelo, então, em comparação é igual ao modelo; o outro (vermelho: R)
não é. Uma bicada no estímulo de comparação igual
relação a A, B é um estímulo igual e C é um
produz alimento, e inicia o próximo intervalo entre ten­
estímulo diferente. Consideraremos, a seguir, tativas; uma bicada no estímulo de comparação dife­
algumas propriedades de tais discriminações rente dá início ao próximo intervalo entre tentativas,
condicionais. sem a apresentação de comida. O estímulo modelo e as
posições direita-esquerda dos comparações variam de
tentativa a tentativa.

EMPARELHAMENTO COM O
M ODELO E EM PARELHAM ENTO
POR SINGULARIDADE dade de que o pombo olhe para o modelo (cf.
discussão de respostas de observação nos Capí­
O procedimento de emparelhamento com o tulos 8 e 11). Os dois estímulos laterais produzi­
modelo é ilustrado na Figura 9.1, como poderia dos pela resposta no disco do centro são deno­
ser programado em um câmara para pombos, minados estímulos de comparação (ou de esco­
com três discos (cf. Skinner, 1950; Ferster, 1960). lha)', um deles é igual ao modelo e o outro não é.
Durante um intervalo entre as tentativas, todos Uma bicada no disco igual produz um reforça-
os discos estão escuros. Uma tentativa começa dor, seguido por um novo intervalo entre as ten­
quando o disco do centro é iluminado, apresen­ tativas, mas uma bicada no disco com um estí­
tando um estímulo modelo. Uma bicada é, en­ mulo diferente é seguida diretamente pelo inter­
tão, requerida no disco do centro. Essa bicada, valo entre as tentativas, sem o reforçador (às ve­
denominada resposta de observação, produz zes, respostas de não-emparelhamento também
novos estímulos e também aumenta a probabili- produzem um intervalo entre as tentativas mais

164 A . C harles C a t a n ia
prolongado, que talvez funcione como um estí­ De qualquer modo, suponhamos agora que
mulo punitivo leve; cf. Holt & Shafer, 1973). um pombo esteja respondendo acuradamente
Geralmente, tanto o estímulo modelo como dado o vermelho ( R) ou o verde (G), em um
a posição do estímulo de comparação correto procedimento de emparelhamento com o mode­
mudam ao longo das tentativas. Uma caracterís­ lo. Como poderíamos descrever esse desempe­
tica comum do emparelhamento com o modelo nho? Ele aprendeu apenas a bicar na esquerda,
é um procedimento de correção que repete o dadas as configurações RRG e GGR e à direita
mesmo modelo e os estímulos de comparação dadas as configurações GRR e RGG? Ou ele
na tentativa seguinte, se uma tentativa termina aprendeu a emparelhar de modo geral, isto é,
com uma bicada no disco com o estímulo não- aprendeu a relação de identidade? Se agora apre­
emparelhado. Esse procedimento impede o de­ sentarmos a cor azul ou a cor amarela, e o pom­
senvolvimento do responder restrito a apenas um bo faz o emparelhamento com as novas cores
disco ou a uma cor (mas como veremos no Ca­ modelo, teremos mais confiança em falar de em­
pítulo 10, ele também garante que erros sejam parelhamento generalizado (de fato, o empare­
freqüentemente seguidos de perto pelos reforça- lhamento em pombos não se transfere facilmen­
dores produzidos por respostas corretas). te para as novas cores, embora a probabilidade
Suponhamos que um pombo bique apenas no dessa transferência dependa de detalhes do trei­
estímulo de comparação à esquerda. Se o disco no). Mesmo se vemos o emparelhamento com
com o estímulo emparelhado se alterna irregular­ as novas cores, o que dizer se não obtemos o
mente entre a esquerda e a direita, essas bicadas emparelhamento com figuras geom étricas?
serão reforçadas apenas na metade das tentativas Podemos dizer apenas que o pombo aprendeu
(aquelas em que o estímulo emparelhado estiver à o emparelhamento de cor, mas não o de for­
esquerda). O reforço em metade das tentativas, pro­ ma, notando que o conceito humano de em­
vavelmente, será suficiente para manter indefini­ parelhamento não parece tão limitado por di­
damente as bicadas no disco da esquerda. No en­ mensões específicas dos estímulos. O empa­
tanto, com um procedimento de correção, o pom­ relhamento com o modelo também tem sido de­
bo terá que mudar para o disco da direita mais cedo nominado de emparelhamento por identidade,
ou mais tarde, porque uma tentativa com um estí­ mas devemos reservar esse termo para os casos
mulo emparelhado na direita será repetida até que em que o emparelhamento se generaliza para
uma resposta ocorra no disco da direita e seja re­ novos estímulos modelo e de comparação, como
forçada. Do mesmo modo, se um pombo sempre o emparelhamento de forma, depois do treino
bica as comparações vermelhas, essas bicadas se­ com cores. Com um conjunto limitado de estí­
rão reforçadas em metade das tentativas, a menos mulos, o que parece emparelhamento de identi­
que um procedimento de correção force o pombo dade freqüentemente nada mais é do que um em­
a mudar ocasionalmente para o verde. parelhamento baseado em configurações espe­
Um outro refinamento do procedimento con­ cíficas de estímulos.
siste em aumentar a atenção do pombo ao modelo, Há muitas variações de emparelhamento com
modificando as contingências programadas para o modelo. Se o reforço é programado para que
as bicadas no disco do modelo. Por exemplo, se a haja bicadas no estímulo não-emparelhado, e não
produção dos estímulos de comparação depende para o estímulo emparelhado, o procedimento
de diferentes padrões de responder a cada modelo toma-se um caso de emparelhamento por singu­
(p. ex., diferentes taxas de respostas), os padrões laridade (oddity), porque esse disco é necessa­
de respostas que o pombo produz podem nos in­ riamente o diferente, dentre os três discos. Essa
formar se ele está discriminando entre os mode­ versão de emparelhamento por singularidade
los. Tais procedimentos, às vezes, produzem uma requer um mínimo de duas bicadas por tentati­
aquisição mais rápida do emparelhamento, mas va, uma no modelo e outra na comparação não-
infelizmente o aumento da atenção ao modelo, emparelhada. Em outras versões de emparelha­
às vezes, também reduz a atenção aos estímulos mento por singularidade, nenhum modelo é apre­
de comparação (p. ex., Urcuioli, 1985). sentado; com pombos em uma câmara de três

A p r e n d iz a g e m 165
discos, por exemplo, cada tentativa consiste em COMPORTAMENTO SIMBÓLICO:
iluminar todos os três discos, com o estímulo CLASSES DE EQUIVALÊNCIA
diferente em um deles. Esse procedimento re­
quer apenas uma bicada por tentativa. Se as bicadas de um pombo são reforçadas
As relações entre os estímulos também po­ na presença do verde, mas não do vermelho, não
dem implicar no emparelhamento arbitrário. Por consideraríamos a possibilidade de que o pom­
exemplo, poderíamos treinar o pombo a bicar em bo “esverdeasse” na presença das bicadas. Tal
um disco verde, dado um quadrado como mode­ reversão não teria sentido como comportamen­
lo, e a bicar em um disco vermelho dado um cír­ to. Mas isso não ocorre assim no emparelhamen­
culo como modelo. Poderíamos, então, pergun­ to. Tanto o estímulo modelo como a resposta de
tar se o pombo poderia bicar em um quadrado, comparação são definidos pelos estímulos apre­
dado o verde como modelo, e em um círculo, sentados nos discos. Poderíamos perguntar so­
dado o vermelho como modelo. Geralmente es­ bre uma resposta vermelha ao estímulo verme­
peramos essa reversibilidade quando lidamos lho, ou sobre a reversibilidade de uma resposta
com palavras e objetos, por exemplo, quando vertical a um estímulo diagonal, ou sobre se res­
uma criança que aprendeu a apontar para a figu­ postas redondas a estímulos esmaecidos podem
ra de um carro ao ver a palavra carro, pode apon­ ser criadas pelo treino de respostas redondas a
tar para a palavra ao ver a figura. Esta reversibi­ estímulos grandes e depois de respostas grandes
lidade, uma propriedade do comportamento sim­ a estímulos esmaecidos.
bólico, não pode ser tida como certa. Por exem­ Estes casos ilustram as propriedades de rela­
plo, uma criança pode mostrar tal reversibilida­ ções denominadas reflexividade, simetria e tran­
de sem treino explícito, mas um pombo, não. O sitividade. As propriedades reflexivas são aque­
emparelhamento arbitrário também pode ser es­ las que se mantêm entre um termo e ele mesmo
tendido a casos em que a mesma resposta de em­ (p. ex., A = A); as propriedades simétricas são
parelhar é treinada com mais de uma compara­ aquelas em que a ordem dos termos é reversível
ção (p. ex., bicar uma comparação verde, dado (p. ex., se A = B, então B = A); e as proprieda­
um círculo ou uma elipse como modelo, e bicar des transitivas são aquelas em que os termos co­
uma vermelha, dado um quadrado ou um triân­ muns em dois pares ordenados determinam um
gulo; cf. Zentall & Urcuioli, 1993, sobre o em­ terceiro par ordenado (p. ex., se A = B e B = C,
parelhamento de muitos-para-um e de um-para- então A = C). As relações de equivalência são
muitos). aquelas que têm todas as três propriedades, e os
As várias tarefas que acabamos de conside­ termos que entram nelas (aqui, A, B e C) são
rar envolvem, todas elas, relações entre diferen­ considerados membros de uma classe de equi­
tes classes de estímulo. Algumas são arbitrári­ valência (Sidman, 1994).
as, como quando designamos bicadas ao verde Outras relações partilham apenas algumas
como corretas, dado um quadrado como mode­ dessas propriedades. Por exemplo, a relação de
lo, e bicadas no vermelho como corretas, dado oposição é simétrica (se D é o oposto de E, E é o
um círculo como modelo; mas outras, tais como oposto de D), mas não é reflexiva (D não é o
o emparelhamento por identidade e por singu­ oposto de si mesmo) nem transitiva (se D é o
laridade, parecem envolver dimensões mais fun­ oposto de E e E é o oposto de F, D não é o oposto
damentais. Como, então, deveríamos lidar com de F; pelo contrário, D é o mesmo que F). E uma
relações como: o mesmo que, diferente de, e o relação de magnitude como maior que é transitiva
oposto de; e o que podemos dizer sobre as con­ (se G é maior que H e H é maior que I, então G é
tingências que as criaram (cf. Hayes, 1994, so­ maior que I), mas não é reflexiva nem simétrica.
bre molduras relacionais)? Questões sobre a es­ A Figura 9.2 ilustra como os procedimentos
trutura do estímulo parecem estar inevitavelmen­ de emparelhamento de identidade e emparelha­
te interligadas com questões sobre a estrutura do mento arbitrário podem ser usados para demons­
comportamento (p. ex., Fujita, 1983; Lamb & Ri­ trar a reflexividade, a simetria e a transitividade.
ley. 1981; Wasserman, Kiedinger, &Bhatt, 1988). Cada procedimento inclui dois estímulos mode­

166 A. C harles C a t a n ia
Disco de Disco de Disco de Disco de
comparação Modelo comparação comparação Modelo comparação
correto A incorreto correto B incorreto

© © © © © ©
REFLEXIVIDADE

Emparelhamento de
cor

Emparelhamento de
forma
© © © © © ©
SIMETRIA

©©
©©
©©
©©
©©
©©
Emparelhamento
arbitrário (cor-forma)

Teste de reversão
(forma-cor)

© © © © © ©
TRANSITIVIDADE

Emparelhamento ar­
bitrário 1 (cor-forma)
Emparelhamento ar­
bitrário 2 (forma-in-
O © • • © o
• © o
tensidade)
Teste de transitivida­
de (cor-intensidade) o © •
Teste combinado de
reversão-transitivida-
de (intensidade-cor) © o © © • ©
FIGURA 9.2 Procedimentos de emparelhamento para estudar as três propriedades de relações de equivalência:
reflexividade (emparelhamento por identidade), simetria (reversão do emparelhamento arbitrário) e transitividade
(transferência entre pares ordenados, de emparelhamentos arbitrários). Cada matriz de três discos é mostrada em
apenas um dos dois arranjos possíveis, com o estímulo de comparação correto à esquerda. Os estímulos incluem as
cores vermelho (R) e verde (G), triângulos, círculos, disco iluminado e apagado.

lo, mostrados como em A, na matriz de três dis­ de cores como comparações. As duas linhas de
cos à esquerda, e como B, na matriz da direita. baixo (transitividade) mostram como os estímu­
Por conveniência, o estímulo de comparação los comuns nos dois procedimentos de empare­
correto é sempre mostrado à esquerda na matriz lhamento simbólico (cor emparelhada à forma e
de três discos, embora na prática as posições la­ forma emparelhada à intensidade) podem ser
terais dos estímulos de comparação variem de combinados em um teste de transitividade (cor e
tentativa a tentativa. Como na Figura 9.1, uma intensidade). Um teste alternativo, ilustrado na
bicada no estímulo-modelo produz compara­ última linha, combina os testes de reversão e de
ções, e uma bicada no estímulo de compara­ transitividade (intensidade e cor); ele é denomi­
ção correto produz comida, enquanto uma bi­ nado de teste de equivalência, e a relação entre
cada no estímulo de comparação incorreto não os estímulos do teste de equivalência é denomi­
produz. nada uma relação de equivalência. As relações
As duas linhas superiores na Figura 9.2 (re­ dos testes de reversão e de equivalência nunca
flexividade) ilustram os procedimentos padrão foram explicitamente ensinadas. Se ocorre um
de emparelhamento com cor e com forma. As emparelhamento apropriado nesses testes, as
duas linhas seguintes (simetria) ilustram o em­ novas relações demonstradas por esse compor­
parelhamento simbólico com as cores como mo­ tamento são denominadas relações emergentes,
delos e as formas como comparações e, depois, no sentido de que emergiram sem treino explíci­
um teste de reversão de formas como modelos e to; elas são exemplos de comportamento novo,

A p r e n d iz a g e m 167
produzido por contingências de emparelhamen­ As relações de equivalência são facilmente
to arbitrário. geradas em humanos. Por exemplo, jovens re­
Quando dizemos que um pombo que bica em tardados que já haviam mostrado reflexividade
presença de verde não pode “esverdear” na pre­ (emparelhamento de identidade) foram ensina­
sença de bicadas, estamos dizendo que as rela­ dos a fazer emparelhamentos envolvendo (A) pa­
ções entre os estímulos antecedentes e as res­ lavras ditadas, (B) figuras correspondentes àque­
postas que eles ocasionam em uma contingência las palavras e (C) as palavras impressas corres­
de três termos não são simétricas. Isso significa pondentes (p. ex., carro, cachorro, menino: Sid­
que não podemos reduzir as classes de equiva­ man, Cressom, & Wilson-Morris, 1974). Inicial­
lência a classes de estímulos discriminativos. As mente dado um grupo de 20 palavras ditadas, a
relações de equivalência são simétricas, mas as tarefa consistia em selecionar a figura correspon­
relações entre os termos de uma contingência de dente, dentre um conjunto de comparações (AB).
três termos não são. Então, dado o mesmo conjunto de 20 palavras
Já questionamos se o desempenho do pombo ditadas, os jovens aprenderam a selecionar as pa­
no procedimento padrão de emparelhamento lavras impressas correspondentes, dentre um
depende da relação de identidade em geral ou conjunto de comparações (AC). Para todas as 20
somente das relações entre os estímulos especí­ palavras, esses dois tipos de emparelhamento (fi­
ficos. Poderíamos supor que a relação de identi­ guras com palavras ditadas e palavras impressas
dade entre os estímulos modelo e os de compa­ com palavras ditadas) também geraram quatro
ração tomaria o emparelhamento por identidade outras relações sem treino adicional: duas novas
mais fácil do que o emparelhamento arbitrário. relações através da simetria (BA, dada uma fi­
Para os pombos, no entanto, a aquisição do em­ gura, dizer seu nome; e CA, dada uma palavra
parelhamento depende mais das dimensões de impressa, dizer a palavra) e duas através da tran­
estímulo escolhidas para os modelos e compara­ sitividade (BC, dada uma figura, selecionar a pa­
ções do que do tipo de procedimento, se se tratar lavra impressa correspondente; e CB, dada uma
de um emparelhamento por identidade ou de um palavra impressa, selecionar a figura correspon­
emparelhamento arbitrário. Por exemplo, o de­ dente). Quarenta relações foram ensinadas (20
sempenho nos dois tipos de procedimento de­ de cada em AB e em AC), e outras 80 emergi­
senvolve-se mais rapidamente com modelos ver­ ram indiretamente (em BA, CA, BC e CB). O
melhos e verdes do que com modelos verticais e reforço de emparelhamento arbitrário criou o
horizontais (p. ex., Carter & Werner, 1978). A início de um repertório de leitura nesses jovens.
simetria e a transitividade têm sido demonstra­ As relações emergentes justificam chamar seus
das de maneira limitada com pombos, mas os desempenhos de emparelhamento simbólico, e
efeitos geralmente não têm sido robustos (p. ex., não apenas de emparelhamento arbitrário. Cada
D’Amato e col., 1985; Richards, 1988). Além uma das 20 classes de equivalência consistia em
disso, existem certas armadilhas técnicas e lógi­ uma figura, a palavra falada e a palavra impres­
cas a serem evitadas na análise de relações de sa correspondentes. Novas classes poderiam ter
equivalência através dos testes de transferência, sido adicionadas, com novas figuras e as pala­
tais como se as discriminações condicionais re­ vras correspondentes, e o número de equivalên-
levantes foram aprendidas como a seleção do cias poderia ter sido expandido pela adição de
comparação correto ou como a exclusão ou a re­ novas relações (p. ex., palavras impressas e pa­
jeição do estímulo incorreto (p. ex., Carrigan & lavras escritas em letras cursivas ou figuras e
Sidman, 1992). Assim, a evidência de relações objetos reais). Não há limites óbvios para o nú­
de equivalência no comportamento de empare­ mero de classes que podem ser criadas ou para o
lhamento do pombo é, no mínimo, pouco con­ número de estímulos que podem ser incluídos
vincente (provavelmente todas as relações com­ em cada classe. O status desses tipos de classes
ponentes poderiam ser explicitamente ensinadas, no comportamento de não-humanos permanece
mas esse resultado teria interesse apenas do ponto como objeto de controvérsias (p. ex., Dube e col.,
de vista do procedimento). 1993; Home & Lowe, 1996; Schusterman &

168 A. C h a r le s C a ta n ia
Kastak, 1993; Zentall & Urcuioli, 1993). Mas (Catania, Home, & Lowe, 1989; cf. de Rose e
as classes de equivalência definem comporta­ col., 1988).
mento simbólico, e assim, pode ser que elas se­
jam uma propriedade exclusiva do comporta­
mento humano, ou pode ser que partilhemos essa
propriedade apenas com nossos parentes mais Seção B Classes de Comportamento de
próximos, os primatas. De fato, o grande inte­ Ordem Superior
resse nas classes de equivalência deriva de sua
possível relevância para os fenômenos da lin­ Em nossos exemplos de procedimentos de
guagem, que iremos considerar nos Capítulos 14 emparelhamento com o modelo e outros proce­
a 16. Os membros de uma classe de equivalên­ dimentos relacionados, descrevemos desempe­
cia são equivalentes no sentido de que podem nhos em mais de um nível de análise. Descreve­
ser permutáveis uns pelos outros no contexto de mos respostas de bicar em um estímulo de com­
procedimentos de emparelhamento arbitrário. paração vermelho, dado um modelo vermelho,
Mas isso não significa necessariamente que eles como discriminação condicional, mas também
sejam funcionalmente equivalentes, no sentido perguntamos se poderíamos caracterizar esse de­
de que um seja substituível pelos outros em ou­ sempenho como um emparelhamento de identi­
tros contextos. Em outras palavras, a equivalên­ dade. Nossa decisão dependia de se havíamos
cia funcional não é o mesmo que ser membro de criado uma classe operante definida por estímu­
uma classe de equivalência, e não se pode supor los particulares em um contexto particular ou
que as propriedades lógicas dessas relações se­ uma classe que se generalizasse por meio de re­
jam completamente consistentes com suas pro­ lações com uma ampla gama de estímulos. Faz
priedades comportamentais (Saunders & Green, diferença se um pombo que emparelha verde ao
1992). A equivalência funcional de membros de verde e vermelho ao vermelho também empare­
uma classe de equivalência tem que ser testada lha outras cores, ou se um pombo que empare­
experimentalmente. A questão é se uma função lha com uma ampla gama de cores também o
adquirida por um membro de uma classe de equi­ faça quando apresentamos problemas que envol­
valência, como uma função discriminativa, por vam formas ou texturas ou outras dimensões. Da
exemplo, pode se transferir para os outros mem­ mesma maneira, faz diferença se o desempenho
bros daquela classe (cf. Sidman e col., 1989). de um pombo em emparelhamento arbitrário é
Consideremos um exemplo. Uma criança uma classe operante restrita a um conjunto par­
aprendeu a obedecer às palavras de um pai, vá e ticular de modelos e comparações ou se inclui
pare, quando está em um cruzamento com o pai. todas as relações reflexivas, simétricas e transi­
Em uma situação separada, a criança é ensinada tivas que definem as classes de equivalência.
que ir e luz verde são equivalentes e que parar e Esses exemplos apresentam classes embuti­
luz vermelha são equivalentes (em outras pala­ das em outras classes. Se demonstramos empa­
vras, ir e luz verde tomam-se membros de uma relhamento por identidade, cada emparelhamento
classe de equivalência, e parar e vermelho tor­ específico define uma classe, mas o emparelha­
nam-se membros de outra classe). Se as funções mento de identidade é, então, uma classe de or­
discriminativas das palavras vá e pare se trans­ dem superior que inclui, como seus componen­
ferem para as respectivas luzes de tráfego, a tes, todos os emparelhamentos específicos. No
criança obedecerá às luzes, sem necessidade de emparelhamento com o modelo, o emparelha­
instrução adicional. Um tipo análogo de transfe­ mento de verde ao verde ou de vermelho ao ver­
rência foi experimentalmente documentado com melho podem existir como operantes separados.
crianças: taxas de respostas altas e baixas, oca­ Eles podem ser tratados como instâncias de em­
sionadas cada uma por um conjunto de estímu­ parelhamento por identidade somente se puder
los, transferiram-se para outros conjuntos quan­ ser demonstrado que são componentes de um
do os estímulos nos conjuntos foram estabeleci­ único operante de ordem superior, definido pela
dos como membros de classes de equivalência relação de identidade entre modelo e compara­

A p r e n d iz a g e m 169
ção. Um teste para o operante de ordem superior de um certo número de tentativas, o macaco do­
é se relações novas podem ser demonstradas, minava a discriminação. Então, um novo pro­
como o emparelhamento de novas cores (p. ex., blema, com um novo par de objetos, era apre­
azul a azul, ou amarelo a amarelo); um outro teste sentado, com o reforço diferencial novamente
é se todas as subclasses de emparelhamento se programado para selecionar apenas um dos dois
mantêm juntas como classe, caso mudemos as objetos. Novamente, uma discriminação emer­
contingências somente para um subconjunto de­ gia. Um novo problema, com outro novo par, era
las. Examinaremos, a seguir, algumas classes de então apresentado e mais tarde um outro, e as­
ordem superior, faremos uma revisão de suas pro­ sim por diante. Dados médios de oito sujeitos
priedades e consideraremos algumas implicações são mostrados na Figura 9.3. Cada conjunto de
que podem ser tiradas das mesmas. pontos mostra a porcentagem de respostas cor­
retas às seis primeiras tentativas ao longo de blo­
cos sucessivos de problemas. Com os oito pri­
APRENDER A APRENDER meiros problemas (1-8), as respostas corretas au­
cLEARNING SET) mentaram gradualmente ao longo das tentativas;
pela sexta tentativa, elas ainda não haviam atin­
A aprendizagem de uma nova discriminação gido 80%. No bloco seguinte de oito problemas
pode depender daquilo que o organismo já apren­ (9-16), as respostas corretas aumentaram mais
deu (às vezes chamamos o que foi aprendido no rapidamente ao longo das tentativas. Ao longo
laboratório d&história experimental). Como ilus­ de blocos sucessivos, o responder correto aumen­
trado pelo fenômeno conhecido como leaming tou mais e mais rapidamente a cada tentativa,
set (Harlow, 1949), o responder pode depender até que, no último bloco (tentativas 289-344), o
das relações entre as propriedades do estímulo, responder atingiu aproximadamente 100 % de
independentes de estímulos específicos. Nos es­ acurácia na segunda tentativa de cada novo pro­
tudos de Harlow, dois objetos diferentes eram blema. Em outras palavras, quanto mais proble­
apresentados a um macaco privado de comida, mas o macaco havia aprendido, mais rapidamente
em tentativas sucessivas. Suas posições varia­ ele aprendia um novo.
vam de tentativa a tentativa. A comida era colo­ Nesse procedimento, não podemos descrever
cada apenas sob um deles e assim, selecionar o operante discriminado apenas com base em um
aquele era diferencialmente reforçado. Depois par de estímulos. Quando um macaco adquire

100 r-
C 289-344
- 133-232
233-288
33-132
17-32
9-16
FIGURA 9.3 Leaming set ou aprender
o
O a aprender. Oito macacos aprenderam
uma variedade de problemas de discri­
minação de duas escolhas. Cada con­
junto de pontos mostra a porcentagem
de respostas corretas ao longo das seis
primeiras tentativas de cada problema,
para blocos de problemas sucessivos (o
eixo y começa em 50%, o nível do aca­
so). A taxa de aprendizagem aumentou
ao longo de problemas sucessivos. No
último bloco de problemas (problemas
289-344), o responder apresentava qua­
se 100% de acurácia na segunda tenta­
3 4 5
tiva de cada novo problema. (Adaptada
de Harlow, 1949, Figura 2)
Tentativas em Cada Problema

170 A. C harles C a t a n ia
discriminações sucessivas tão rapidamente que quando esta se torna disponível em uma nova
ele consistentemente seleciona o estímulo cor­ situação, ao contrário dos ratos que nunca foram
relacionado com o reforço, depois de uma única expostos a choques inescapáveis e inevitáveis (cf.
tentativa com um novo par, seu desempenho de­ Maier, Albin, & Testa, 1973). Aqui, novamente,
pende de relações entre os estímulos e suas con­ é difícil definir a classe de respostas, exceto se
seqüências correlacionadas, ao longo de proble­ notarmos que os ratos que receberam choques
mas sucessivos, e não de pares particulares de inevitáveis e inescapáveis aparentemente apren­
estímulos que aparecem dentro de problemas par­ deram que suas respostas não tinham conseqüên­
ticulares. Em cada problema inicial, o macaco cias importantes; o comportamento gerado por
tinha que aprender muitas outras características essas contingências se transfere para situações
do procedimento, além de qual era o estímulo nas quais o responder poderia ter conseqüências.
correlacionado com a comida. Ele devia apren­ Talvez o desamparo aprendido, como uma clas­
der que a comida era correlacionada apenas com se de ordem superior, pudesse ser colocado sob
um dos dois estímulos, e não com a posição nem controle de estímulos discriminativos, por meio
com outras dimensões da situação e que esta cor­ de contingências diferenciais.
relação não mudava dentro de um mesmo pro­ O learning set ilustra a amplitude e a com­
blema, assim como não havia reforço para pe­ plexidade do que os organismos podem apren­
gar, simultaneamente, os dois estímulos e assim der; esse fenômeno também mostra que não po­
por diante. Durante os primeiros problemas, a demos tratar como um caso simples o que acon­
aprendizagem ocorreu lentamente, porque o ma­ tece quando introduzimos um organismo expe­
caco estava aprendendo muitas coisas como estas; rimentalmente ingênuo na situação de laborató­
finalmente, quando o macaco tinha aprendido es­ rio (cf. Capítulo 5, sobre a aquisição). Para estu­
tas outras coisas, tudo o que ele tinha que apren­ dar a aprendizagem, alguns investigadores têm,
der em qualquer novo problema, qual era o estí­ então, voltado-se para a aquisição repetida de dis­
mulo que estava correlacionado ao reforço. criminações simples ou de seqüências simples
Nesse ponto, podemos definir o operante dis­ de respostas. Paradoxalmente, eles têm passado
criminado como segue: se a resposta de selecio­ a estudar a aprendizagem, definida como mu­
nar um dos objetos é reforçada na primeira ten­ danças no desempenho, no contexto de procedi­
tativa de um novo problema, selecione aquele mentos de estado estável, definidos pela estabi­
objeto em todas as tentativas subseqüentes; se a lidade no desempenho. Por exemplo, em uma câ­
resposta não é reforçada, mude para o outro ob­ mara de macacos, com quatro grupos de três bar­
jeto nas tentativas subseqüentes. Na aprendiza­ ras em cada um, somente uma seqüência parti­
gem de problemas sucessivos, esse é o desem­ cular de pressões era reforçada dentro de uma
penho que é reforçado e é nisso que o comporta­ mesma sessão (p. ex., barra da esquerda, do gru­
mento do organismo se transforma. Assim, a po 1; barra da direita do grupo 2; barra do meio,
correspondência entre as contingências de refor­ do grupo 3, e barra da direita, do grupo 4), mas a
ço e o comportamento gerado por essas contin­ seqüência mudava de sessão para sessão (Boren
gências permanece como um critério apropria­ & Devine, 1968). Quando a taxa de aprendiza­
do para essa classe operante. Aprender a apren­ gem do macaco para um novo problema a cada
der qualifica-se como uma classe de ordem su­ dia se tornava estável, essas aquisições repeti­
perior, porque é definida por essas relações, e das tornavam-se uma linha de base para o estu­
não pelos estímulos e pelas respostas a qualquer do de uma variedade de fenômenos: efeitos de
problema particular. diferentes procedimentos de esvanecimento;
Um fenômeno que pode ser visto como uma efeitos de drogas sobre a aprendizagem; efeitos
variação de leaming set é o desamparo aprendi­ de diferentes tipos de conseqüências para as res­
do (Maier, Seligman, & Solomon, 1969). Por postas em várias posições da seqüência; efeitos
exemplo, ratos que receberam choques elétricos da criação de uma seqüência como um todo, em
inescapáveis e inevitáveis em uma situação ten­ oposição a construí-la pelo começo ou pelo fi­
dem a não aprender uma resposta de esquiva nal, e assim por diante.

A p r e n d iz a g e m 171
PROPRIEDADES DAS CLASSES DE danças nas contingências que são program a­
ORDEM SUPERIOR das para elas.
Quando programamos novas contingências
Uma propriedade significativa das classes de para as subclasses das classes de ordem supe­
ordem superior estava implícita no tratamento rior, geralmente, esperamos que aquelas subclas­
do comportamento autolesivo no Capítulo 7. ses, eventualmente, sejam diferenciadas das ou­
Naquele exemplo, o comportamento autolesivo tras. Mas se as subclasses se superpõem de di­
mantido pela atenção não foi facilmente reduzi­ versas maneiras com outras classes que partilham
do pela extinção, na medida em que ele perma­ de outras contingências, isso pode não aconte­
necia como parte de uma classe mais ampla (a cer. Por exemplo, imitar o que alguém disse par­
de obter atenção), cuja maioria dos membros tilha a participação na classe com outras imita­
continuava efetiva na obtenção de conseqüên­ ções, mas também pode participar de contingên­
cias. Sempre que as contingências que mantêm cias sociais que não envolvem a imitação. Isso
uma classe de ordem superior são diferentes das pode ser suficiente para manter o comportamen­
que mantêm uma ou mais de suas subclasses, to como uma subclasse, quando as contingênci­
podemos nos perguntar quais das contingências as mudam para ele, mas não para outros tipos de
prevalecerão. Por exemplo, imaginemos uma imitação. Essas complexidades estão implícitas
classe de ordem superior que consista nas imita­ na seguinte explicação da seleção ontogenética
ções, por uma criança, das ações apresentadas em que “regras, princípios, estratégias e simila­
como modelo por um boneco. Quando o boneco res” correspondem ao que temos chamado de
bate palmas, a criança bate palmas; quando o bo­ classes de ordem superior:
neco ri, a criança ri; quando o boneco pula, a
criança pula, e assim por diante. Vamos identifi­ Em seres humanos mais maduros, uma grande par­
te do comportamento instrumental e, mais especial­
car uma dezena de imitações diferentes com as mente, do comportamento verbal está organizado
letras de A a L. Uma vez que tenhamos reforça­ em rotinas de ordem superior e é, em muitas ins­
do essas imitações, uma maneira pela qual pode­ tâncias, melhor entendido em termos da operação
mos dizer se criamos uma classe de ordem supe­ de regras, princípios, estratégias e similares, do que
rior é verificar se a criança também imita novas em termos de sucessões de respostas a estímulos
particulares.... Nessas situações, é a seleção de es­
ações que o boneco nunca tenha modelado antes. tratégias, mais do que a seleção de reações particu­
Agora suponhamos que paremos de reforçar lares a estímulos, que é modificada pela experiên­
a G, enquanto continuamos a reforçar todas as cia passada com conseqüências reforçadoras ou pu­
outras imitações, de A a F e de H a L. Se as imi­ nitivas.
tações de G irão decrescer ou se elas persistirão Se alguém que está tentando descrever e predi­
zer o comportamento de um aprendiz humano adul­
por muito tempo depois de terem sido excluídas to deixa de levar em conta essas organizações com-
das contingências de reforço é uma questão ex­ portamentais e tenta construir uma explicação com
perimental. Se elas diminuírem, teremos demons­ base somente nas unidades estímulo-resposta indi­
trado que podemos separar G dos outros mem­ viduais, os princípios de operação de reforçadores e
bros da classe de ordem superior. Caso contrá­ punidores podem parecer muito diferentes daqueles
revelados em experimentos mais simples com ani­
rio, teremos que supor que ainda está funcionan­ mais ou com aprendizes humanos menos am adu­
do como membro da classe de ordem superior recidos. De fato, pode ser que os princípios de
chamada de imitação, que é definida pelas cor­ operação desses fatores sejam os mesmos em to­
respondências entre o que o boneco faz e o que a dos os casos e que a diferença resida na natureza
criança faz. Enquanto a classe de ordem supe­ das unidades comportamentais, cujas probabili­
dades estão sendo modificadas como resultado
rior mantém sua integridade, suas subclasses são da experiência com vários tipos de resultados.
mantidas juntamente com os outros membros, (Estes, 1971, p. 23)
mesmo que não estejam consistentemente en­
volvidas nas contingências que mantém as Vimos considerando as classes de ordem su­
outras. Quando isso acontece, as subclasses perior potenciais no emparelhamento com o mo­
de ordem inferior parecerão insensíveis às mu­ delo, nas aprendizagens sucessivas e na imita­

172 A. C harles C a t a n ia
ção. Nestes e em outros casos, o treino com mui­ des do conjunto, o comportamento mudava de
tas instâncias específicas, às vezes, pode ser pré- modo apropriado para todos eles. Essa equiva­
requisito suficiente para as classes de ordem su­ lência funcional emergiu porque as mesmas con­
perior ou classes generalizadas (p. ex., o treino seqüências foram programadas para as respos­
com muitos problemas de simetria pode produ­ tas na presença de todos os estímulos, dentro de
zir simetria generalizada, o treino com muitos um mesmo conjunto.
problemas de transitividade pode produzir tran­ Esse procedimento criou dois operantes dis­
sitividade generalizada, e etc.; tais classes gene­ criminados arbitrários, bicar um conjunto de sli­
ralizadas também têm sido denominadas moldu­ des e bicar outro conjunto de slides, pela pro­
ras (ou quadros) relacionais: Hayes, 1994). gramação de contingências para os membros
Encontraremos muitos exemplos de classes de dentro de cada conjunto. A correlação com as
ordem superior em outros contextos, como quan­ bicadas reforçadas era a única coisa que distin­
do lidamos com a aprendizagem social e o com­ guia uma classe da outra. E provável que pense­
portamento verbal. Por exemplo, iremos retor­ mos sobre classes de modo diferente, quando
nar à imitação generalizada no Capítulo 13 e con­ seus constituintes são arbitrários, como no estu­
sideraremos as classes de respostas verbais, como do de Vaughan, do que quando os constituintes
a nomeação, no Capítulo 14, e o seguimento de têm coerência natural (p. ex., quando são seleci­
instruções, no Capítulo 15. onados de uma faixa estreita do espectro de estí­
mulos ou são todos instâncias de algumas cate­
gorias naturais: cf. Capítulo 8). Mas o ponto cen­
ORIGENS DA ESTRUTURA tral do argumento é que as contingências comuns
selecionam os membros de classes operantes. As
A maioria das classes que consideramos até pressões à barra por um rato com a pata esquer­
aqui tem sido as classes estruturais. As proprie­ da, com a pata direita e com ambas as patas tam­
dades que as definem não eram arbitrárias, mas bém são arbitrárias, até que partilhem as contin­
sim derivadas de relações sistemáticas entre as gências comuns no deslocamento da barra. Po­
propriedades de eventos ambientais (p. ex., o demos ver o experimento de Vaughan apenas
emparelhamento, a singularidade, a simetria). Va­ como um outro exemplo do emprego de contin­
mos agora examinar algumas classes arbitrárias, gências comuns para criar um operante discri­
como as criadas em um experimento por Vau­ minado; ele difere dos outros, principalmente,
ghan (1988). Um grupo de slides de fotografias nas classes particulares que criou. Então, qual­
foi arbitrariamente dividido em dois subconjun­ quer estrutura existente nos dois conjuntos de
tos de 20 slides cada. Os slides eram apresenta­ slides foi imposta pelos dois conjuntos de con­
dos um por vez, no disco de uma câmara para tingências comuns (reforço para um e extinção
pombos, e as bicadas do pombo eram reforçadas para o outro).
na presença dos slides de um conjunto, mas não Uma expressão do problema de como a es­
na presença dos slides do outro conjunto. De­ trutura emerge a partir de um início indiferen­
pois de vários blocos de sessões com um desem­ ciado é familiar aos psicólogos na forma da des­
penho bastante consistente, a correlação entre os crição metafórica de William James, das respos­
conjuntos à&slides e o reforço era ocasionalmen­ tas de um recém-nascido ao mundo como “uma
te revertida. Depois de várias reversões, os pom­ grande e explosiva confusão” (James, 1890, p.
bos começaram a mudar o responder de um con­ 488). James apelou para as primeiras discrimi­
junto de slides para outro depois que somente nações da criança como a base para que ela or­
alguns dos slides haviam sido mostrados. Em ganizasse o que começava como desorganizado.
outras palavras, as contingências comuns pro­ Atualmente sabemos muito mais sobre discrimi­
gramadas para os 20 slides em um conjunto fi­ nação do que estava disponível para James. Ele
zeram com que eles se tomassem funcionalmente não teve o benefício da pesquisa de Thomdike
equivalentes, no sentido de que uma vez que as sobre as conseqüências do responder ou da de
contingências mudavam para apenas alguns sli­ Pavlov, sobre as funções sinalizadoras de estí-

A p r e n d iz a g e m 173
mulos, ou da de Skinner sobre as classes ope­ bitrárias podem emergir, não por causa dos efei­
rantes e as contingências de três termos. tos diretos daquelas propriedades partilhadas,
Para atacar o problema de James, podemos mas porque, devido a elas, todos os membros da
começar por considerar como os operantes dis­ classe estão necessariamente envolvidos em con­
criminados são criados pelas contingências. Os tingências comuns. Por exemplo, passar a mão
operantes, definidos com base nas propriedades por uma esfera difere de passar a mão sobre um
de suas respostas e dos estímulos na presença cubo; somente no segundo caso, encontra-se uma
dos quais elas ocorrem, são selecionados por suas extremidade angulosa. Essas contingências na­
conseqüências. Mas devemos distinguir entre turais podem, então, ser a base para se poder dis­
contingências comuns e conseqüências comuns. criminar entre esferas e cubos. Em outras pala­
As conseqüências comuns não são suficientes vras, é bem possível que as categorias que pare­
para criar classes diferenciadas, porque um úni­ ciam ser categorias naturais não-arbitrárias pos­
co reforçador pode manter duas ou mais classes sam ser criadas da mesma maneira que as arbi­
diferentes. Por exemplo, quando as bicadas de trárias, ao longo de uma vida de experiência com
um pombo à esquerda produzem comida de acor­ as contingências comuns que elas engendram (cf.
do com um esquema de intervalo, ao passo que a discussão das conseqüências sensoriais no Ca­
suas bicadas à direita produzem a mesma comi­ pítulo 5). Não é verdade que qualquer coisa que
da de acordo com um esquema de intervalo di­ seja significativa envolva contingências de al­
ferente, as bicadas à esquerda e à direita são clas­ gum tipo e esteja plena de oportunidades para
ses diferentes, embora elas produzam a mesma aquelas contingências que tragam ordem, na for­
conseqüência, a comida. ma de operantes discriminados, a partir de “uma
Em outras palavras, cada operante é criado grande e explosiva confusão” ?
não apenas por conseqüências comuns, mas por Sem dúvida, alguns aspectos da seleção ope­
conseqüências comuns que dependem de con­ rante devem ser limitados pelas propriedades dos
tingências comuns. As contingências operantes sistemas sensoriais e motores e das organizações
tomam todos os membros de um operante fun­ neurais que foram selecionadas filogeneticamen-
cionalmente equivalentes e o experimento de te (exploraremos alguns desses limites e restri­
Vaughan demonstrou um operante discriminado ções no Capítulo 12). Skinner falou desses tipos
totalmente arbitrário, baseado apenas em con­ de limitações como “as linhas naturais de fratu­
tingências comuns. Mas as explicações de dis­ ra ao longo das quais o comportamento e o am­
criminação complexa freqüentemente apelam biente de fato se quebram” (Skinner, 1935a, p.
para a contribuição relativa do estímulo e do or­ 40); “Nós dividimos o comportamento em clas­
ganismo, sem incluir as contingências (p. ex., ses fortes e rápidas e então nos surpreendemos
Fetterman, 1996). Consideramos algumas des­ ao descobrir que o organismo desconsidera os
sas questões no Capítulo 8, no contexto de con­ limites que estabelecemos” (Skinner, 1953, p.
ceitos naturais. Quando os membros da classe 94). Mas as contingências ontogenéticas são tão
não têm características físicas comuns, então pervasivas que nunca devemos desconsiderá-las,
qualquer abordagem que olhe para as proprie­ quando estamos tentando identificar as origens
dades do estímulo para definir como tal classe do comportamento. A estrutura do comportamen­
foi formada pode fracassar (Lakoff, 1987). É ne­ to é determinada por contingências, mas as con­
cessário, em vez disso, olhar para os processos tingências são determinadas, por sua vez, pela
que criaram essas classes, e a única característi­ estrutura ambiental.
ca consistentemente comum de seus membros
são as contingências nas quais eles se inserem.
Acabamos de argumentar que contingências
comuns podem criar as classes funcionais arbi­ Seção C Fontes do Comportamento Novo
trárias denominadas operantes. Mas quando
membros da classe de fato partilham as mesmas Um tema presente nas discussões de muitos
propriedades físicas, classes funcionais não-ar- dos exemplos que consideramos é de onde vem

174 A . C harles C a t a n ia
o comportamento novo. A seleção ontogenética Consideremos o seguinte exemplo (cf. Esper,
deve dispor de variações sobre as quais realizar 1973, e ver Capítulo 15). Suponhamos que ar­
seu trabalho e, assim, é de especial interesse iden­ ranjamos uma matriz de três por três discos pró­
tificar as fontes da novidade e da variação. ximos a uma janela, na qual podemos projetar,
Identificamos um método para produzir o para um pombo, estímulos de diferentes cores,
comportamento novo, quando examinamos a mo­ formas e tamanhos. Primeiro restringimos o bi­
delagem no Capítulo 7, e um outro quando exa­ car do pombo à linha do meio dos discos na
minamos o esvanecimento no Capítulo 8. Tam­ matriz, e fazemos o alimento ser contingente a
bém vimos que a novidade e a variabilidade eram, bicadas na esquerda, se o estímulo na janela for
por si mesmas, propriedades do comportamento vermelho, a bicadas no disco do meio, se o estí­
que podem ser reforçadas (p. ex., Neuringer, mulo for azul, e a bicadas na direita, se o estí­
1986; Page & Neuringer, 1985; Pryor, Haag, & mulo for verde. Depois que o desempenho do
O’Reilly, 1969). Mas essas não são as únicas pos­ pombo tiver se tomado acurado em relação à cor,
sibilidades, como descobrimos quando explora­ restringimos as bicadas do pombo à coluna do meio
mos as classes de equivalência e as classes de dos discos e agora tomamos a comida contingente
ordem superior. Os testes de equivalência têm a uma bicada em cima, se o estímulo for um círcu­
demonstrado relações emergentes, relações que lo azul, a uma bicada no meio, se for um quadrado
emergem sem treino explícito. Por exemplo, de­ azul, e a uma bicada em baixo, se for um triângulo
pois dos emparelhamentos arbitrários AB e AC, azul. E depois que o desempenho do pombo tiver
crianças de modo geral desempenharam acura­ se tomado acurado com respeito à forma, restrin­
damente emparelhamentos envolvendo outras re­ gimos suas bicadas apenas ao disco do meio da
lações que nunca haviam visto antes, como BA, matriz e reforçamos o bicar rápido, se o estímulo
AC ou CA. E um de nossos critérios para cha­ for um quadrado azul grande, o bicar moderado,
mar uma classe de um operante de ordem supe­ se for um quadrado azul médio, e o bicar devagar,
rior era a emergência de novas instâncias. Por se for um quadrado azul pequeno.
exemplo, uma maneira de dizer se um desempe­ Teremos criado três classes de operantes dis­
nho de emparelhamento com o modelo se quali­ criminados, baseados, respectivamente, na cor,
fica como um emparelhamento de identidade é na forma e no tamanho. Agora a questão é o que
verificar se o emparelhar se generaliza para no­ acontecerá quando deixarmos todos os discos da
vos estímulos, como no emparelhamento de for­ matriz disponíveis e apresentarmos combinações
mas, depois do treino com cores. De modo se­ de cor, forma e tamanho que o pombo nunca viu
melhante, uma maneira de dizer se as imitações antes. Se apresentarmos um círculo azul peque­
de uma criança aos comportamentos apresentados no, o pombo bicará devagar, no disco do meio,
como modelo se qualificam como uma classe de da linha de cima? Se apresentarmos um quadra­
ordem superior é verificar se a criança imita ações do grande verde, o pombo bicará depressa, no
que nunca foram modeladas antes. disco do meio, da coluna da direita? E se apre­
Muitos exemplos de comportamento novo sentarmos um triângulo médio vermelho, o pom­
envolvem implicitamente a combinação nova de bo bicará com uma taxa moderada, no disco da
classes já existentes. Nosso exemplo da transfe­ esquerda, na linha de baixo?
rência de função entre os membros de classes de O exemplo é hipotético e, se a adução ocorre
equivalência envolveu a combinação de operan­ com qualquer nova combinação de dimensões
tes discriminados (atravessar a rua diante da pa­ de estímulos em particular, isso dependerá dos
lavra falada vá e parar diante da palavra falada detalhes do treino, da seqüência dos vários está­
pare) com classes engendradas por relações de gios do procedimento, da acurácia do desempe­
equivalência (vá e luzes verdes nos semáforos, e nho do pombo no momento em que os testes são
pare e luzes vermelhas nos semáforos). A novi­ conduzidos e de outros detalhes. Por exemplo,
dade que tem origem na junção de operantes se­ provavelmente ajudaria, depois do teste de cada
parados tem sido denominada adução (Andro- nova combinação de estímulo, adicionar esta di­
nis, 1983; Johnson & Laying, 1992). mensão ao conjunto de estímulos envolvidos no

A p r e n d iz a g e m 175
treino por algum tempo, antes de prosseguir para pombos, poderíamos ser capazes de encontrá-la
um novo teste. As condições acima envolvem em outros contextos. Por exemplo, uma criança
27 possíveis combinações de estímulos e as con­ que tenha aprendido a identificar as cores e que
dições de treino envolveram apenas 7 delas; a possa distinguir um cavalo de outros animais,
transferência para uma nova combinação, pro­ certamente, será capaz de identificar um cavalo
vavelmente, seria muito mais efetiva depois que de cor diferente ao vê-lo pela primeira vez. De
o pombo tivesse dominado 20 ou mais das com­ fato, veremos nos Capítulos 14 e 15 que a ocor­
binações de estímulo do que apenas depois das rência conjunta de diferentes dimensões de res­
7 originais. É possível, também, que a transfe­ posta, dadas novas combinações de estímulos
rência para as novas combinações tome-se mais discriminativos, é uma propriedade importante
provável à medida que os níveis de acurácia se do comportamento verbal humano. Além disso,
tomem mais elevados no treino (cf. Johnson & o que temos considerado até aqui pode consti­
Laying, 1992, sobre fluência). tuir apenas uma parcela das fontes de comporta­
Em qualquer caso, tal treino ao longo dessas mento novo. De fato, nossos vários exemplos
três dimensões de estímulos e de respostas é cer­ sugerem que a taxonomia dos processos que
tamente exeqüível (cf. Catania & Cerutti, 1986). podem gerar o comportamento novo ainda não
Mas mesmo que, com esses procedimentos, não foi esgotada.
fôssemos capazes de demonstrar a adução em

176 A. C harles C a t a n ia
Esquemas de Reforço
1 0

A. Esquemas de Razão Variável e de Intervalo é o reforço de cada resposta dentro da classe ope­
Variável rante, é a exceção mais do que a regra. Por isso,
Esquemas Acoplados devemos examinar os efeitos dos esquemas de
Contenção Limitada (Limited Hold) reforço, arranjos que especificam que respostas,
Esquemas de Reforço e Causação dentro de uma classe operante, serão reforçadas.
B. Esquemas de Razão Fixa e de Intervalo Fixo Os três tipos mais básicos de esquemas são
Atraso de Reforço (1) aqueles que permitem que uma resposta seja
reforçada depois de algum número de respostas
C. A Terminologia dos Esquemas de Reforço (Esquemas de razão); (2) os que permitem que
uma resposta seja reforçada depois de um tempo
transcorrido, desde algum evento anterior (Es­
A palavra schedule (esquema) é derivada do inglês quemas de intervalo); e (3) aqueles que permi­
medieval sedule, um pedaço de pergaminho ou pa­
pel, que, por sua vez, é derivado do latim scheda, tem que uma resposta seja reforçada, dependen­
folha de papiro e do grego skhizein, to split (divi­ do da taxa ou do espaçamento temporal das res­
dir). A raiz indo-européia skei-, to cut (cortar) ou to postas prévias (esquemas que reforçam diferen-
split (dividir), relaciona schedule a schizo-, como cialmente a taxa ou tempos entre as respostas).
em schizofrenia (esquizofrenia) e a Science (ciên­ As exigências de número, taxa e tempo também
cia) e conscious (consciência), do latim scire, to
know (saber), saber no sentido de ser capaz de sepa­ podem ser combinadas de diversas maneiras,
rar uma coisa da outra. para produzir esquemas mais complexos. Con­
sideramos os esquemas de intervalo no Capítulo
Nem todas as classes de respostas têm con­ 8 e os esquemas de reforço diferencial no Capí­
seqüências consistentes. O reforço de algumas tulo 7. Neste capítulo nos concentraremos nos
respostas, mas não de outras, chamado de Re­ esquemas de razão e em algumas propriedades
forço intermitente ou parcial, é uma caracterís­ dos esquemas de intervalo que estavam além do
tica geral do comportamento. Encontrar um pro­ escopo do Capítulo 8. Vamos nos preocupar com
duto particular não é conseqüência invariável de os efeitos dos esquemas de reforço não apenas
ir a um supermercado; obter uma resposta nem como instrumentos experimentais valiosos, mas
sempre é uma conseqüência de se fazer uma per­ também como propriedades ubíquas do compor­
gunta. Pense em fazer uma ligação telefônica tamento em si mesmo (cf. Ferster & Skinner,
para um amigo. Algumas vezes, essa resposta é 1957; Schoenfeld & Cole, 1972).
reforçada pela oportunidade de falar com o ami­ Voltemos ao exemplo do telefone. Suponha­
go; outras vezes o amigo não atende, a linha está mos que você telefone para um amigo que não
ocupada ou a chamada é atendida pela secretá­ tem secretária eletrônica e não obtenha respos­
ria eletrônica. O reforço contínuo ou regular, que ta. A probabilidade de obter uma resposta mais
tarde vai depender do momento e não do núme­ tes pessoas, a fim de obter fundos para uma obra
ro de vezes que você ligar. Seu amigo irá aten­ de caridade ou para uma campanha política. Se
der somente se você ligar quando ele estiver no alguma chamada em particular é respondida, isso
local; se seu amigo não estiver, não faz qualquer depende de quando você liga, mas o número de
diferença o número de vezes que você tenta li­ doações que será obtido dependerá do número
gar. Da mesma maneira, suponhamos que a liga­ de ligações feitas. Do ponto de vista de se uma
ção receba um sinal de ocupado. O fato de ligar chamada é respondida, as contingências são
de novo não vai interferir na duração do sinal de aquelas de esquemas de intervalo; mas, se con­
ocupado. Vai passar um período variável de tem­ sideramos a obtenção de doações, as contingên­
po, que depende de quanto o amigo utiliza o te­ cias são as de esquemas de razão. Além disso,
lefone. Para obter uma resposta, você tem que quando se está fazendo as chamadas telefônicas,
ligar na hora certa. Esses casos são aproxima­ faz diferença se sua última ligação teve como
ções dos esquemas de reforço em Intervalo Va­ resultado não obter uma resposta ou se a linha
riável ou VI (yariable interval) na vida quotidi­ estava ocupada; telefonar para alguém que man­
ana. Esses esquemas reforçam uma única res­ tém um esquema irregular difere de ligar para
posta que ocorre após a passagem de um perío­ um endereço comercial que abra, impreterivel­
do determinado de tempo, e este período varia mente, em um determinado horário; ligar depois
de uma ocorrência para outra; as respostas que de um sinal de ocupado, para alguém que deixa
ocorrem antes do término do intervalo não têm efei­ a linha livre, difere de ligar para um número ati­
to. Um esquema de VI é designado pelo tempo vo, no qual a linha não permanece aberta por
médio para a disponibilidade de um reforçador. muito tempo.
Vejamos agora uma situação diferente. Te­
mos que fazer uma ligação de um telefone pú­
blico, mas não temos ficha. Podemos tentar com­
prar uma ficha com alguém que passa e conse­ Seção A Esquemas de Razão Variável e
guir. Nesse caso, obter a ficha não depende de de Intervalo Variável
quando você faz isso. De fato, somente algumas
poucas pessoas estarão dispostas a vender a fi­ Em um esquema de razão variável ou VR, a
cha. Teremos que continuar perguntando, até en­ apresentação de um reforçador depende da emis­
contrarmos uma dessas pessoas. Podemos ter su­ são de um número variável de respostas, inde­
cesso depois de solicitar à primeira pessoa ou pendentemente da passagem de tempo. Em um
pode ser necessário pedir a duas pessoas ou mais. esquema de intervalo variável ou VI, a apresen­
Em outras palavras, conseguir a ficha depende tação de um reforçador depende da passagem de
do número de vezes que você pede, e esse nú­ um período variável de tempo e da emissão de
mero varia de uma ocasião para outra. Tais es­ uma única resposta; as respostas que ocorrem
quemas são chamados de razão variável ou VR. antes do final do intervalo não têm efeito. Algu­
São designados pelo número médio de respos­ mas propriedades das contingências programa­
tas exigidas por reforçador ou, em outras pala­ das por esquemas de VI e VR são ilustradas pe­
vras, a razão média de respostas por reforçador. los registros cumulativos hipotéticos da Figura
Na revisão que se segue, iremos nos concen­ 10.1. Três curvas que poderiam ter sido produ­
trar em respostas simples, como as bicadas de zidas por um esquema de razão variável de 100
um pombo no disco, e em reforçadores simples, respostas (VR 100) são mostradas à esquerda (A,
como as apresentações de alimento. É importante B e C); três curvas que poderiam ter sido produ­
lembrar, porém, que a aplicação precisa da lin­ zidas por um esquema de intervalo variável de
guagem dos esquemas de reforço a situações fora lmin (VI lmin) são mostradas à direita (D, E e
do laboratório requer que especifiquemos cui­ F).
dadosamente as repostas e os reforçadores que Geralmente, um esquema de razão variável é
entram em tais contingências. Por exemplo, con­ programado por um computador que seleciona
sideremos a resposta de telefonar para diferen­ aleatoriamente as respostas a serem reforçadas;

178 A . C harles C a t a n ia
Tempo (Minutos) ------ ►­

FIGURA 10.1 Segmentos hipotéticos de registros cumulativos do responder mantido por um esquema de razão
variável de 100 respostas (VR 100) e por um esquema de intervalo variável 1 minuto (VI lmin). A tira vertical à
esquerda da escala de respostas para VR e a tira horizontal abaixo da escala de tempo para VI representam partes
de fitas perfuradas, empregadas para selecionar as respostas a serem reforçadas (mas, os laboratórios modernos
usariam computadores para programar esses esquemas). Os três registros à esquerda (A B C) mostram que a taxa
de respostas em VR afeta a taxa de reforço, mas não o número de respostas por reforçador; os três registros à
direita (D E F) mostram que a taxa de respostas em VI afetam o número de respostas por reforço, mas não a taxa
de reforços.

um esquema de VR que seleciona aleatoriamen­ dores menos rapidamente. Em outras palavras,


te alguma fração de respostas para serem refor­ nos esquemas de VR uma taxa de respostas mai­
çadas é denominado de esquema de razão ran- or também produz uma taxa de reforços maior.
dômica ou esquema RR. Antes que os computa­ Com um pombo bicando um disco, um esquema
dores estivessem disponíveis, os esquemas de de VR 100 real, provavelmente, produziria um
VR eram programados com o auxílio de uma fita desempenho que seria próximo do registro em
de filme, que girava em um dispositivo, até um A. Com razões moderadas de respostas por re­
interruptor. Cada resposta movimentava a fita, forços, os esquemas de VR, geralmente, geram
de modo que ela avançava uma pequena distân­ taxas de respostas altas e aproximadamente cons­
cia constante. A fita tinha furos e quando o in­ tantes entre os reforços. Quando uma razão tor­
terruptor detectava um furo na fita, a resposta na-se muito alta (p. ex., centenas ou milhares de
seguinte era reforçada. Para ilustrar, uma parte respostas por reforçador), a taxa de respostas de­
de uma fita desse tipo é mostrada verticalmente cresce; isso acontece não tanto porque a taxa de
à direita da escala de respostas que acompanha respostas diminui no seu total mas, muito mais por­
os registros de VR, na Figura 10.1. Em um es­ que a taxa de respostas alta e contínua é freqüente­
quema de VR 100, uma resposta é reforçada a mente interrompida por pausas pós-reforço.
cada 100 respostas, em média, mas o número Assim como nos esquemas de VR, antes da
varia de um reforçador para outro. A figura mos­ utilização dos computadores, os esquemas de VI
tra a relação entre os orifícios na fita e as respos­ também eram tipicamente programados por uma
tas reforçadas, identificadas pelos pequenos tra­ fita que se movia na direção de um interruptor.
ços oblíquos no registro. Nestes esquemas, a fita era controlada por um
Na Figura 10.1, a taxa de respostas mais alta, motor em velocidade constante, e não pelas res­
A, produz reforçadores mais rapidamente; a taxa postas. Sempre que o interruptor detectava um
de respostas mais baixa, C, produz os reforça­ orifício, a próxima resposta era reforçada. Esses

A p r e n d iz a g e m 179
arranjos possibilitavam que as respostas fossem um esquema que pode ser usado para estudar os
reforçadas após algum tempo ter transcorrido, e efeitos de outras variáveis, como drogas ou po­
não depois de algum número de respostas. Uma luentes químicos (cf. Capítulo 8, sobre gradien­
porção de uma dessas fitas é apresentada acima tes de controle de estímulo). Um esquema real
da escala do tempo, à direita da Figura 10.1. Mais de VI lmin, com um pombo bicando um disco,
uma vez, a figura mostra a correspondência en­ provavelmente, produz um desempenho com a
tre os orifícios da fita e as respostas reforçadas, taxa de respostas moderadas similar ao visto no
indicadas pelas marcas nos registros. registro D. Note-se que a taxa moderada do re­
Sempre que o interruptor era operado em um gistro em D não é muito diferente daquela taxa
esquema de VI, a fita parava até o reforço ser observada no registro do esquema de VR, no re­
apresentado; neste ponto, dizia-se que o reforço gistro C. Um esquema de DRL 10 s, como dis­
estava disponível, no sentido de que a próxima cutido no Capítulo 7, provavelmente produziria
resposta seria elegível para produzir um refor- um registro com taxa baixa, como no registro de
çador. Um método alternativo, agora utilizado esquema de VI, no registro F. O ponto importante
quando os esquemas de VI são programados em é que os vários registros apresentados nesta figura
computador, consite em gerar pulsos com taxa mostram como diferentes taxas de respostas afe­
constante e selecionar, aleatoriamente, uma cer­ tam as taxas de reforços, dados os esquemas de
ta proporção deles para programar um reforça- VR ou VI; eles não representam desempenhos tí­
dor para a próxima resposta; por exemplo, se picos produzidos por cada um dos esquemas.
pulsos a uma taxa de l/s são selecionados com Taxas de respostas mantidas por esquemas
uma probabilidade de 0,1, a disponibilidade do de VI e VR são ilustradas nas Figuras 10.2 e 10.3.
reforço iria ser criada uma vez a cada 10 s em Ambas as figuras mostram os dados obtidos com
média, programando dessa forma um esquema as respostas de bicar o disco, por pombos, refor­
de V I 10 s. Esquemas programados deste modo çadas por comida. Na Figura 10.2, a taxa de bi­
são chamados esquemas de Intervalo Randômi- car é representada como uma função da razão,
co ou esquemas de R I . programada por um esquema de VR, ou seja, do
Os registros de D a F, da Figura 10.1 ilus­ número de respostas por reforçador. Em VR1
tram uma importante propriedade dos esquemas (ponto mais à esquerda) todas as respostas são
de VI: mesmo que as taxas de respostas nos três reforçadas. Mesmo excluindo-se a duração do
registros sejam consideravelmente diferentes, reforço, o responder é pouco maior que 25 res­
todos eles incluem o mesmo número de reforça- postas por minuto. A taxa de respostas é subs­
dores. Esse esquema fornece uma taxa de refor­ tancialmente maior em VR 10 (segundo ponto)
ço relativamente constante para uma variedade e atinge o máximo, mais de 200 respostas por
substancial de possíveis taxas de respostas. Con­ minuto, em VR 50. A taxa de respostas, a se­
tudo, os reforçadores não são apresentados a não guir, diminui gradualmente, com aumentos no
ser que as respostas ocorram. Desta forma, a fre­ tamanho da VR.
qüência de reforçadores produzidos por respos­ Na Figura 10.3, a taxa de bicar é representa­
tas será menor do que a especificada pelo esque­ da como uma função da taxa de reforços forne­
ma de VI se o intervalo entre as respostas suces­ cida por um esquema de VI (p. ex., VI 1 min
sivas se tornar longo em relação ao intervalo fornece, no máximo, 60 reforços por hora). A
entre os reforçadores programados. taxa de bicar aumentou em função da taxa de re­
Na prática, com classes de respostas como forços, mas a função foi negativamente acelerada;
as bicadas de um pombo, as diferenças entre as a mudança na taxa de respostas produzida por uma
taxas de reforços programadas e as taxas reais dada mudança na taxa de reforços tomou-se me­
obtidas, geralmente, são pequenas. Essa indepen­ nor à medida que a taxa de reforços aumentou.
dência relativa entre a taxa de reforços e de res­ As duas figuras mostram que os esquemas
postas, associada à taxa de respostas relativamen­ de VR e VI diferem consideravelmente. Por
te constante que ele produz, faz com que o es­ exemplo, as diferentes escalas, no eixo das or­
quema de VI seja o preferido como linha de base, denadas de ambas figuras, mostram que as taxas

180 A. C harles C a t a n ia
Respostas por minuto

FIGURA 10.2 Taxa de respostas de bicar o


disco como função do esquema de VR, para
três pombos. Aí duas escalas abaixo mos­
Respostas por reforço tram as correspondências entre o número
de respostas por reforço e a probabilidade
I____ I____ I_________ I___________________ I— de reforço. (Adaptado de Brandauer, 1958,
1,0 0,02 0,01 0,005 0,0025
Tabela 2)
Probabilidade de reforço
Respostas por minuto

FIGURA 10.3 Taxa de respostas de bi­


car o disco como função da taxa de re­
forços em VI, para seis pombos. As duas
escalas abaixo mostram as correspon­
Reforços por hora dências entre a taxa de reforços e o in­
tervalo médio entre os reforços em es­
120 60 30 15 quemas de VI. (Adaptado de Catania &
Reynolds, 1968, Figura 1)
Intervalo entre reforços (segundos)

A p r e n d iz a g e m 181
de respostas em VR são maiores que em VI, ao reforço em VR, em geral, também produz tran­
longo da maior parte dos valores de cada esque­ sições abruptas de taxas altas de respostas para
ma; as taxas em VR freqüentemente ultrapassam períodos sem respostas (um padrão de acelera­
200 respostas/min, enquanto as taxas sob esque­ ção de respostas seguido por uma pausa e nova­
ma de VI raramente excedem 100 respostas/min. mente por aceleração das respostas - break-and-
Mesmo assim, os efeitos detalhados de cada es­ rurí). Com os esquemas de VI, por outro lado,
quema podem variar com outras condições. Por uma taxa alta de reforços produz um responder
exemplo, as formas das funções podem ser afe­ mais alto do que um VI com uma baixa taxa de
tadas pelo fato do organismo receber toda sua reforços (cf., V I 1 min e V I 15 min) mas, em am­
comida exclusivamente durante as sessões expe­ bos os casos, o responder se distribui de uma ma­
rimentais ou se recebe algum alimento fora das neira razoavelmente uniforme ao longo do tempo.
sessões (essas duas situações têm sido denomina­ Além disso, a extinção após o reforço em VI pro­
das economias fechadas e abertas: Hursh, 1980). duz decréscimos graduais na taxa de respostas, di­
Os esquemas de razão e de intervalo também ferente do padrão de pausas e de aceleração obser­
diferem na maneira como o desempenho é afe­ vado na extinção depois do reforço em VR.
tado quando o reforço é reduzido ou interrompi­ Quais são as propriedades dos esquemas de
do. Os registros acumulados idealizados da Fi­ VI e de VR responsáveis pelas diferenças nos
gura 10.4 ilustram o responder mantido por es­ desempenhos que eles geram? Parece razoável
quemas de VR e de VI e o responder durante a que os esquemas de VR deveriam produzir ta­
extinção, após o reforço em VR ou em VI. No xas mais altas de respostas do que os esquemas
reforço em VR, a taxa de respostas diminuiu com de VI; as apresentações do reforçador tomam-
razões maiores (cf. VR50 e VR1000). Esse de­ se mais freqüentes quando o responder em VR
créscimo em razões altas ocorre, em parte, por­ aumenta, o que não ocorre com o responder em
que o responder começa a ser interrompido por VI. Porém, em ambos os esquemas, a separação
longas pausas (o aparecimento de pausas longas entre os reforçadores sucessivos é variável, então,
durante o desempenho em razão, às vezes, é cha­ como essas relações diferentes entre o responder e
mado de distensão da razão). A extinção após o os reforçadores afetam o comportamento?

FIGURA 10.4 Padrões de resposta duran­


te o reforço em VR e VI e durante a extin­
ção depois do reforço em VR ou VI. Esses
registros acumulados hipotéticos comparam
os efeitos dos dois tipos de esquemas: em
VR, o responder é mantido em taxas mais
altas e ocorre uma transição abrupta entre
as taxas altas e as pausas longas, com exi­
gências muito grandes de respostas ou du­
rante a extinção; em VI, o responder é rela­
tivamente constante e ocorre uma diminui­
ção gradual durante a extinção. Ambos os
esquemas geram um montante substancial
de respostas em extinção.

182 A. C harles C a t a n ia
ESQUEMAS ACOPLADOS De forma inversa, o número de respostas por
reforçador pode ser igualado para os dois esque­
O procedimento de câmaras acopladas (Fers- mas, fazendo com que o número de respostas
ter & Skinner, 1957) permite o estudo de algu­ emitidas para cada reforçador, por um pombo,
mas variáveis que atuam nos esquemas. Em câ­ determine as razões de um esquema de VR para
maras acopladas, o desempenho de um organis­ um segundo pombo. Nesse caso, as bicadas do
mo em uma caixa determina os eventos que ocor­ segundo pombo são mantidas por um esquema
rerão na caixa de um segundo organismo. O pro­ de VR, no qual as razões sucessivas são iguala­
cedimento pode ser usado para igualar as taxas das àquelas produzidas pelo desempenho em VI,
de reforços em esquemas de VR e de VI: cada do primeiro pombo.
reforçador produzido pelas bicadas de um pom­ Registros acumulados de ambos os tipos de
bo em VR, programa um reforçador em VI para acoplamento são mostrados na Figura 10.5 (Ca­
a próxima bicada, para um segundo pombo. Em tania e col., 1977). Com um grupo de pombos,
outras palavras, as bicadas do segundo pombo pares de sujeitos eram atribuídos a esquemas
são mantidas por um esquema de VI, no qual os acoplados nos quais o número de bicadas de um
intervalos sucessivos entre os reforços igualam- pombo, por reforçador, em um esquema de VI
se àqueles produzidos pelo desempenho em VR, 30 s, gerava um esquema de VR para um segun­
do primeiro pombo. Nessas circunstâncias, o dois do pombo, conforme ilustrado pelos pombos 402
esquemas diferem quanto ao número de respos­ e 410. Para um outro grupo, pares eram atribuí­
tas por reforçador, mas não quanto ao intervalo dos a esquemas acoplados nos quais os interva­
de tempo entre os reforçadores sucessivos. los entre os reforços de um pombo em esquema

FIGURA 10.5 Registros acumulados da terceira sessão do procedimento acoplado para dois pares de pombos. As
respostas por reforço em VI, para o pombo 402, produziam um esquema acoplado de VR para as bicadas do pombo
410. Os intervalos entre os reforços em VR, para o pombo 414, produziam um esquema acoplado de VI para as
bicadas do pombo 406. Ai setas horizontais que ligam os registros da esquerda mostram a correspondência entre
o número de respostas por reforço para aquele par de esquemas; as setas verticais que ligam o par de registros da
direita mostram a correspondência de intervalos entre os reforços. Em ambos os casos, a taxa de respostas em VR
fo i maior do que em VI. (Catania, Mattews, Silverman, & Yohalem, 1977, Figura 1)

A p r e n d iz a g e m 183
le VR 25 geravam um esquema de VI para um quemas de DRL programam explicitamente o re­
segundo pombo, como ilustrado pelos pombos 414 forço diferencial de longos IRTs, desenvolve-se,
e 406. Os esquemas de VR produzem taxas mais de maneira relativamente lenta, um responder
altas que os esquemas de VI, independentemente temporalmente espaçado, que não é consistente
de estar o VR acoplado ao VI ou o VI ao VR. Mais com a separação rápida das taxas de resposta nos
ainda, a diferença aparece rapidamente: os regis­ esquemas de VR e VI acoplados.
tros são da última de apenas três sessões de 50
reforços cada. O fenômeno é tão fidedigno que os
registros das Figura 10.5 foram obtidos em um Contenção Lim itada (Limited Hold)
exercício rotineiro de laboratório, em um curso de
graduação de Psicologia Experimental. Uma contingência temporal freqüentemente
O experimento de caixas acopladas mostra acrescentada aos esquemas é a chamada de con­
que a diferença de taxas entre os esquemas de tenção limitada (limited hold ou LH). Com a con­
VR e VI não pode ser atribuída, exclusivamen­ tenção limitada, um reforçador programado per­
te, às respostas por reforçador ou ao tempo por manece disponível apenas por um período limi­
reforçador, uma vez que a diferença entre as ta­ tado de tempo; se nenhuma resposta ocorrer neste
xas permanece, mesmo quando essas variáveis período, o reforçador é perdido. Novamente, a
são as mesmas em ambos os esquemas. Uma ação de telefonar serve como ilustração. Se ob­
outra possibilidade é que, mesmo com o acopla­ tivermos um sinal de ocupado em uma linha so­
mento, a taxa de reforços, em média, mude com brecarregada, é possível que não consigamos
a taxa de respostas em esquemas de VR, mas mais completar a chamada e sermos atendidos à
não nos de VI. Pode-se argumentar que o orga­ medida que o tempo passa, porque a linha nunca
nismo simplesmente aprende que responder mais permanece livre por muito tempo. Se a linha des­
rápido produz reforço mais rápido em VR, mas te tronco sobrecarregado tornar-se ocupada no­
não em esquemas de VI. vamente apenas uns poucos segundos após al­
Uma outra possibilidade deriva de uma rela­ guém desligar, o esquema será um VI com uma
ção entre os intervalos entre as respostas (IRTs) contenção limitada. A probabilidade de se con­
e a probabilidade de reforço (Anger, 1956). O seguir a ligação será maior se a pessoa que cha­
intervalo entre as respostas ou IRT é apenas o ma desligar imediatamente após ouvir o sinal de
tempo entre duas respostas sucessivas (cf. esque­ ocupado e discar de novo. Nesse exemplo do te­
mas de DRL, no Capítulo 7). Nos esquemas de lefone, a contenção limitada irá variar em dura­
VR, a probabilidade de uma resposta ser refor­ ção; no laboratório, ela geralmente é constante.
çada depende apenas da razão; não varia com o Uma contenção limitada tipicamente produz au­
tempo decorrido desde a resposta anterior. Por mentos nas taxas de respostas, mas uma conten­
outro lado, em esquemas de VI, quanto mais tem­ ção muito curta pode permitir tão poucas res­
po tiver transcorrido desde a última resposta, postas reforçadas que o esquema deixa de man­
maior a probabilidade de que o intervalo tenha ter o responder (Hearst, 1958).
passado e, portanto, de que a próxima resposta
seja reforçada. Em outras palavras, uma propor­
ção relativamente maior de IRTs longos é refor­ ESQUEMAS DE REFORÇO E
çada em esquemas de VI do que em esquemas CAUSAÇÃO
de VR; e, assim, os esquemas de VI reforçam
diferencialmente os IRTs longos, em relação aos Os efeitos dos reforçadores dependem das
esquemas de VR. Um aumento nestes intervalos respostas às quais se seguem, mas eventos re­
maiores entre as respostas implica, necessaria­ forçadores podem se seguir a respostas quando
mente, em taxas mais baixas de respostas. Em­ produzidos por respostas ou quando apresenta­
bora possa contribuir para o desempenho em es­ dos independentemente delas. O responder muda
quemas, o reforço diferencial de IRTs não pode da mesma maneira quando ele produz um refor­
ser a história completa. Por exemplo, quando es­ çador ou quando é seguido acidentalmente por

184 A. C harles C a t a n ia
um evento que funciona como reforçador quan­ mais ou menos a cada 2 s. Por que, então, essas
do é contingente a respostas? Consideramos essa contigüidades temporais acidentais entre as res­
questão quando examinamos brevemente o fe­ postas e os reforçadores não mantinham o res­
nômeno chamado superstição (Capítulo 5). A ponder a uma taxa próxima daquela que ocorria,
citação seguinte sugere que a relação entre as quando todos os reforçadores eram produzidos
respostas e o reforçador pode ser afetada de ma­ por respostas?
neira diferente por contigüidades resposta-refor- Quando os reforçadores são apresentados in­
çador causais ou acidentais: dependentemente das respostas, é provável que
o intervalo entre a resposta mais recente e o re­
E possível que as correlações acidentais no tempo forçador varie de um reforçador para outro. Os
entre as respostas, os estímulos e os reforçadores dados de Lattal sugerem que essa variabilidade
não exerçam controle sobre o comportamento?... se contrapõe ao responder supersticioso. Mas, o
Uma das características das correlações acidentais
entre os eventos comportamentais e ambientais é a
que ocorre nos casos em que o intervalo entre a
variabilidade. Cada aspecto do comportamento pode resposta mais recente e o reforçador varia, mesmo
variar e, contudo, ser contíguo com um reforçador que o reforçador seja produzido pela resposta? Isso
independente do comportamento. Por outro lado, o ocorre, por exemplo, quando um atraso de reforço
comportamento que é instrumental deve ter ao me­ é acrescentado a um esquema (Dews, 1960).
nos um aspecto correlacionado mais ou menos cons­
tantemente com o reforçador. Se os animais forem
Um caso é ilustrado no registro de eventos
sensíveis a essa diferença, eles poderão detectar da Figura 10.6 (à esquerda). As linhas verticais
aqueles eventos sobre os quais seu comportamento representam as respostas; as setas, os reforçado­
não tem controle real. (Hermstein, 1966, pp. 42-43) res. O registro superior mostra um segmento de
um esquema padrão de VI: o intervalo termina
Em um experimento (Lattal, 1974), as bica­ na linha pontilhada e a próxima resposta, a, é
das de um pombo em um disco eram reforçadas seguida imediatamente por um reforçador. Um
de acordo com um esquema de VI. Quando o segmento de um esquema de VI, ao qual foi
desempenho em VI estava bem-estabelecido, o acrescentado um atraso de reforço de 3 s, é mos­
esquema foi mudado: ao final de alguns interva­ trado no registro do meio: o intervalo termina na
los, o reforçador era apresentado imediatamen­ linha pontilhada, e a resposta b produz um re­
te, sem se considerar o responder. A taxa de res­ forçador 3 segundos mais tarde. O intervalo en­
postas diminuiu com a diminuição da porcenta­ tre a última resposta e o reforçador, c, é menor
gem de reforçadores produzidos pelo responder. do que o período de atraso, d, porque outras res­
Quando a porcentagem de reforços produzidos postas ocorrem durante esse período; o interva­
pelas respostas era zero, de modo que toda a co­ lo entre a resposta e o reforçador varia depen­
mida era completamente independente do com­ dendo do espaçamento de respostas durante o
portamento, as taxas de respostas se aproxima­ atraso. O registro inferior mostra um trecho de
ram de zero. Essa diminuição na taxa de respos­ um esquema que fornece reforçadores indepen­
tas tem implicações interessantes. Por exemplo, dentemente da respostas (tecnicamente, esse é
quando 33% dos reforçadores eram produzidos um esquema de Tempo Variável ou VT): quando
por respostas, a taxa de respostas era aproxima­ o intervalo termina, na linha pontilhada, o refor­
damente a metade daquela quando todos os re­ çador é apresentado, e o intervalo (e) entre a úl­
forçadores eram produzidos pela resposta; mas tima resposta e o reforçador varia porque este é
mesmo o pombo com a menor taxa de respostas apresentado independentemente da resposta.
respondia cerca de 30 vezes por minuto ou a uma O gráfico de barras, na Figura 10.6 mostra
taxa de uma resposta a cada 2 s. Um terço dos dados de três pombos, obtidos com esses esque­
reforçadores (reforçadores produzidos por res­ mas (Sizemore & Lattal, 1977). As taxas de bi­
postas) seguiam imediatamente as respostas, e car mantidas pelo VI com atraso ficaram entre
todos os outros tinham uma probabilidade de as taxas moderadas mantidas pelo esquema de
seguir a última resposta dentro de um ou dois VI, e as taxas baixas, mantidas pelos reforçado­
segundos, se as respostas estivessem ocorrendo res independentes da resposta do esquema de VT.

A p r e n d iz a g e m 185
□ vi
VI
VI com atraso
1 i.l
■ VT
VI com atraso c
\*>
I I hl i r i i

~d T
VT e !
1 1 i 11 t 11 1

Segundos-
4

I 'll
Pombo 33 Pombo 61
(atraso de 6s) (atraso de 3s) (atraso de 3s)

FIGURA 10.6 Segmentos hipotéticos de registros de eventos de esquemas de reforço em VI, VI com atraso e VT
(esquerda); e taxas de respostas de bicar o disco, para três pombos, mantidas por esses esquemas (direita). Aí
taxas de respostas mais altas foram mantidas pelo reforço em VI e as mais baixas pelo VT. (Adaptado de Sizemore
& Lattal, 1977, Tabela 1)

Acabamos por concluir que a diferença entre VI a causalidade dependem não de conjunções cons­
e VT deve depender, de alguma forma, dos in­ tantes de eventos, mas de uma amostragem de con­
tervalos variáveis entre a última resposta e o re- tingências que, às vezes, são muito complexas.
forçador (c e e). Então, por que as taxas produ­ A pesquisa sobre os efeitos de contingências
zidas por reforço em VI com atraso são maiores mostra o quanto os organismos são sensíveis às
do que aquelas produzidas por reforço em VT? conseqüências de seu próprio comportamento.
Essas questões permanecem abertas à análi­ Essa sensibilidade pode depender das relações
se experimental. Os diferentes efeitos dos refor- detalhadas ou moleculares entre as respostas e
çadores dependentes e independentes das respos­ os reforçadores ou das propriedades globais ou
tas dependem, de uma forma complexa, de como molares de taxas de respostas e de reforçadores,
as correlações entre os eventos são integradas e mesmo de ambas em combinação (cf. Capítulo
no tempo. A complexidade talvez seja melhor 6). A distinção entre os eventos causados pelo
ilustrada por uma analogia humana (cf. Catania comportamento e os eventos acidentalmente cor­
& Keller, 1981).Senaportade um elevador não relacionados com o comportamento é central
existe uma indicação do andar, a única conse­ para os nossos conceitos de causação. Por esse
qüência de nosso comportamento de apertar o motivo, o estudo dos esquemas de reforço é es­
botão para chamar o elevador pode ser a sua che­ sencial. As demonstrações de que seres huma­
gada, após um período de atraso. Mas o eleva­ nos são igualmente sensíveis às conseqüências
dor pode chegar também porque, antes de nós, de seu próprio comportamento podem ter signi­
alguém apertou o botão e depois subiu pela es­ ficado não apenas prático, mas também teórico.
cada; ou porque alguém, dentro do elevador, Por exemplo, em tarefas de vigilância, como ob­
apertou o botão para aquele andar; ou porque o servar uma tela de radar, a detecção e o relato de
elevador sempre retorna àquele pavimento após um sinal podem ser usados para reforçar o com­
ter atendido a outros chamados. Um dia, a porta portamento de observar a tela. Uma taxa alta de
do elevador pode se abrir exatamente no momen­ observação é mantida se um observador tem um
to em que alcançamos o botão para apertá-lo; botão que ilumina a tela e sinais detectáveis são
em outra ocasião, ele pode chegar, ir embora e apresentados, em esquema de VR, após as pres­
chegar de novo, mesmo que, por algum motivo, sões a este botão; este observador vai detectar
não tenhamos apertado o botão durante esse pe­ com mais precisão alvos reais, não programados
ríodo. Quando o elevador chega, podemos não pelo experimentador, do que um observador sen­
ter certeza se isso se deve à nossa chamada. Con­ tado em frente a uma tela de radar continuamente
tudo, provavelmente continuaremos a apertar o iluminada, na ausência de um esquema semelhan­
botão de elevadores. Nossos julgamentos sobre te (Holland, 1958; ver também Capítulo 15).

186 A. C harles C a t a n ia
aumenta com aumentos no valor da FR (Felton
Seção B Esquemas de Razão Fixa e de
& Lyon, 1966). A pausa é chamada pausa pós-
Intervalo Fixo
reforço ou PRP, mas pode ser mais apropriado
pensar nela como uma pausa pré-responder: por
Se a probabilidade de uma resposta ser re­ exemplo, as pausas em FR ocorrem tão consis -
forçada for maior em alguns momentos do que tentemente quando uma razão começa depois de
em outros, é provável que a taxa de respostas um estímulo, como quando ela começa depois de
seja maior nestes momentos do que nos outros um reforço ser produzido ao fim da última razão.
(Catania & Reynolds, 1968). Suponhamos, por Uma vez começado, após a pausa pós-refor­
exemplo, que a maioria dos intervalos em um ço, o responder ocorre, tipicamente, em uma taxa
esquema de VI seja de 10 segundos e que os in­ alta e sem interrupção, até que o reforçador seja
tervalos restantes estejam entre 50 e 100 segun­ apresentado (pausas e taxas altas em FR são ou­
dos. Provavelmente, a taxa de respostas será tro exemplo do responder alternado com pau­
maior cerca de 10 segundos após o reforço e, se sas; cf. esquemas de VR). O grau de coesão com
uma resposta não for reforçada, a taxa pode en­ o qual o responder em FR se mantém, uma vez
tão decair pelos próximos 20 ou 30 segundos, iniciado, sugere que uma seqüência de FR deve
antes de aumentar novamente. Falamos, princi­ ser encarada como uma unidade comportamen-
palmente, de esquemas de VI e VR planejados tal em si mesma e não apenas como uma suces­
para manter a probabilidade de reforço aproxi­ são de respostas.
madamente constante ao longo do tempo (no VI) O tratamento do desempenho nos esquemas
ou do número de respostas (no VR). Mas, po­ como unidades de respostas em si mesmas le­
dem-se programar esquemas nos quais o núme­ vou ao desenvolvimento de esquemas de refor­
ro de respostas por reforçador ou o intervalo para ço de ordem superior. Por exemplo, se o reforço
disponibilidade de um reforçador seja constante depende de se completar um número variável de
de um reforço para outro; tais esquemas são cha­ razões fixas, a programação consite em um es­
mados, respectivamente, de razão fixa ou FR e quema de segunda ordem no qual esquemas de
de intervalo fixo ou FI (além desses, esquemas FR sucessivas são reforçados de acordo com um
nos quais o intervalo entre as apresentações su­ esquema em VR (p. ex., Findley, 1962). Uma
cessivas de reforçadores independentes da res­ análise do desempenho no componente em tais
posta é constante são chamados de tempo fixo esquemas está relacionado com a estrutura do
ou FT). Uma propriedade importante dos esque­ comportamento e é análogo ao exame das pro­
mas fixos é que eles introduzem períodos discri­ priedades que definem uma classe operante (c.f.
mináveis, durante os quais não ocorrem reforça­ Capítulos 7 e 11).
dores. Em geral, o desenvolvimento do responder
Vamos ver primeiramente os esquemas de em FR ocorre tão rapidamente que seus detalhes
razão fixa ou FR. Nesses esquemas, a última res­ não podem ser vistos com facilidade. A Figura
posta de uma série fixa é reforçada. Por exem­ 10.7, entretanto, mostra um exemplo de desen­
plo, se uma máquina de refrigerante funciona volvimento gradual do responder em FR. Em
apenas com moedas de 25 centavos, e o refrige­ uma caixa de condicionamento para pombos
rante que se quer custa R$ 1,00, ao inserir a quar­ equipada com dois discos, as bicadas do pombo
ta moeda você completa uma razão fixa de exa­ em um disco eram reforçadas de acordo com um
tamente quatro respostas (supondo que a máqui­ esquema de FR 100, enquanto um esquema de
na esteja funcionando bem). Cada razão fixa ter­ VI vigorava concorrentemente na outra chave.
mina com um reforçador. A contagem não reco­ O esquema de VI em vigor neste disco retardou
meça se o responder em FR é interrompido. A o desenvolvimento de um desempenho típico de
primeira resposta da razão nunca é reforçada; FR e tomou possível examiná-lo em câmara len­
assim o responder em FR consiste tipicamente ta; a mudança no padrão temporal, que geral­
de uma pausa, seguida por uma alta taxa de res­ mente emerge em duas ou três sessões, deman­
postas. A duração média das pausas pós-reforço dou mais de 150 sessões. Nas primeiras sessões,

A p r e n d iz a g e m 187
FIGURA 10.7 Desenvolvimento do desempenho em FR 100para bicadas de um pombo reforçadas por comida. O
desenvolvimento comumente rápido do responder em FR fo i retardado pela operação concorrente de um esquema
de reforço em VI (não mostrado), que operava para bicadas em um segundo disco. Os segmentos dos registros
cumulativos são do início das sessões numeradas para reforço em FR.

o responder era espaçado uniformemente entre andar mais depressa. Uma característica do res­
os reforçadores. Com a exposição continuada ao ponder em FI é o fato de ocorrer com taxa baixa
esquema, após os reforçadores começaram a ou zero no começo do intervalo e de aumentar à
ocorrer taxas mais baixas e, finalmente aparece­ medida que se aproxima o final do mesmo. De
ram as pausas. A parte da razão que consistia modo que esperaríamos que você olhasse rara­
em um responder ininterrupto, em taxa alta, tor­ mente para o relógio no início da aula e muito
nou-se gradualmente mais longa, de modo que mais freqüentemente à medida que ela se apro­
nas sessões subseqüentes, o responder continuou ximasse do final (obviamente, é possível dizer
com pouca ou nenhuma interrupção após cada outras coisas sobre os reforços envolvidos em
pausa. À medida que as sessões se sucediam, a uma aula, se ela mantém o ouvinte tão interessa­
série de FRs pareceu se construir de trás para do que ele nunca olha para o relógio até que a
frente, a partir do reforçador. mesma tenha terminado).
Agora retomemos ao esquema de Intervalo Duas amostras de registros cumulativos do
Fixo ou FI: uma resposta é reforçada apenas após desempenho em FI são mostradas no Capítulo 5
a passagem de um período constante de tempo, (ver B e C , na Figura 5.6). Cada registro mostra
a partir de algum evento ambiental; as respostas uma seqüência de intervalos fixos. O padrão côn­
que ocorrem antes deste momento não têm qual­ cavo, voltado para cima, desses registros é cha­
quer efeito. Um exemplo é olhar para o relógio à mado de curvatura do FI ou padrão meia-lua.
medida que se aproxima o final de uma aula; Dependendo da quantidade de sessões de expo­
neste caso, estamos supondo que o reforçador sição ao esquema FI e de outras variáveis, as
seja ver que chegou o momento de sair da classe curvaturas do FI podem mostrar transições re­
sem chamar muito a atenção. Olhar para o reló­ lativamente abruptas de ausência de respostas
gio em momentos anteriores não faz o tempo para um responder relativamente constante,

188 A. C harles C a t a n ia
como em B, ou um aumento gradual da taxa sempenho em FI não era interrompido durante o
depois que começa o responder, como em C. O intervalo.
padrão de respostas em FI tende a ser consis­ Descobertas como estas levantaram questões
tente ao longo da posição relativa de cada mo­ sobre as contribuições relativas, para a curvatu­
mento dentro do intervalo, e não da passagem ra de FI, de um gradiente de discriminação tem­
de tempo em termos absolutos. Por exemplo, se poral de FI (em que as taxas de respostas dife­
o responder atinge metade de sua taxa final ou rentes de um organismo, em momentos diferen­
terminal em 40 s dentro de um intervalo fixo de tes do intervalo, implicariam na discriminação
100s, é provável que o mesmo ocorra em 20 s e do tempo decorrido) e um gradiente de atraso do
não em 40 s, dentro de um intervalo fixo de 50 s. reforço (no qual respostas em vários momentos
Qualquer modelo teórico do desempenho em do intervalo são consistentemente seguidas pelo
FI deve levar em consideração o fato de que a reforçador no final do intervalo). Os dois gradi­
curvatura de FI se mantém, apesar das interrup­ entes podem existir juntos, porque responder a
ções repetidas. O fenômeno é ilustrado na Figu­ qualquer tempo de um intervalo depende do que
ra 10.8 (Dews, 1962). As bicadas ao disco, emi­ aconteceu depois daquele tempo no intervalo
tidas por 4 pombos, eram reforçadas de acordo anterior; ele não pode depender do reforço no
com um esquema de FI 500 s. O gráfico à es­ fim do intervalo atual, uma vez que esse reforço
querda mostra a taxa média de bicar em segmen­ ainda não foi apresentado.
tos sucessivos de intervalos de 50 s. Em outro
procedimento, a luz da caixa, que fornecia uma
iluminação difusa, era ligada e desligada em seg­ ATRASO DE REFORÇO
mentos sucessivos de 50 s ao longo do interva­
lo; após o último segmento de 50 s, a luz perma­ A sugestão de que a curvatura de FI envolve
necia acesa até que uma bicada no final do inter­ algum tipo de gradiente de atraso do reforço
valo fosse reforçada. A ação de bicar não era implica que o reforço produzido pela última de
reforçada na ausência de luz, e a taxa desta res­ uma seqüência de respostas tem efeitos que de­
posta diminuiu nestes períodos (barras escuras pendem de sua relação com todas as respostas
na Figura 10.8). Entretanto, o aumento no res­ precedentes, e não simplesmente com aquela que
ponder, em períodos sucessivos, quando a luz o produziu. Nos primeiros estudos sobre os es­
estava acesa (barras sombreadas) tinha forma se­ quemas de reforço, os efeitos dos esquemas eram
melhante ao aumento que ocorria quando o de­ discutidos como reforço parcial e era visto como
um paradoxo que mais comportamentos pudes-

Fl e Estímulos
Adicionados

100 300 500

Tempo no intervalo (Segundos)

FIGURA 10.8 Taxas de bicar em períodos de 50 segundos, durante um esquema padrão de reforço em FI 500 s
(FI, esquerda) e em um esquema de FI 500 segundos no qual uma luz e sua ausência se alternavam a cada 50 s (FI
e estímulos adicionados, direita), para 4 pombos. Nos períodos em que a luz estava apagada, a taxa de respostas
era baixa e, portanto, interrompia o responder no FI. Porém, quando a luz estava acesa, a taxa aumentava de
modo exatamente igual ao do FI padrão. (Adaptado de Dews, 1962, Figura 2)

A p r e n d iz a g e m 189
sem ser gerados pelo reforço de cada fração do Algumas implicações práticas podem ser
total de respostas do que pelo reforço de cada mais importantes do que esses problemas técni­
resposta especificamente. Olhar os esquemas com cos. Sabemos que os efeitos do reforço atrasado
base no atraso de reforço de todas as respostas que sobre as respostas que precedem aquela que pro­
precederam a resposta reforçada, contudo, sugere duz um reforçador não se restringem a respostas
que o reforço parcial ou intermitente funciona como em uma única classe operante. Por exemplo, as
tal porque permite que cada conseqüência re­ bicadas de um pombo em um disco podem ser
force muitas respostas, e não apenas uma. mantidas porque elas são seguidas, posteriormen­
As respostas iniciais em uma seqüência que te, por bicadas reforçadas em um outro disco
termina com um reforço contribuem menos para (Catania, 1971). Vamos considerar uma tarefa
o responder futuro do que aquelas emitidas pos­ que envolve respostas corretas e erros em tenta­
teriormente, devido aos atrasos mais longos que tivas sucessivas (p. ex., um experimento sobre
as separam do reforço (Dews, 1962). Isso signi­ conceitos naturais: cf Capítulo 8). Podemos usar
fica que ao interpretar os efeitos dos esquemas, um procedimento em que todas as respostas cor­
precisamos conhecer a forma do gradiente de retas serão reforçadas, e toda tentativa com erro
atraso. O gradiente de atraso tem sido descrito será repetida, até que o pombo possa responder
com sucesso com alguns modelos matemáticos de forma correta. Com esse procedimento, po­
do comportamento operante (p. ex., Killeen, rém, garantimos que qualquer seqüência de er­
1994), mas, certos problemas técnicos compli­ ros será seguida, depois de algum atraso, por uma
cam sua determinação experimental. Por exem­ resposta correta reforçada. As respostas corre­
plo, se programamos reforçadores atrasados em­ tas finalmente passarão a ser dominantes, por­
pregando um tempo fixo depois de uma respos­ que elas são seguidas mais de perto pelo refor­
ta, devemos permitir que respostas adicionais çador, mas os erros podem diminuir mais lenta­
ocorram neste ínterim, em cujo caso o tempo real mente e podem, até mesmo, persistir em um ní­
entre a última resposta e o reforço será, freqüente­ vel modesto, embora eles nunca realmente pro­
mente, mais curto do que aquele programado ou duzam o reforçador, porque são sistematicamente
podemos, ainda, reiniciar o atraso a cada resposta seguidos, depois de um atraso, por uma resposta
subseqüente, caso em que o reiniciar do tempo irá correta reforçada. (Os procedimentos de apren­
reforçar diferencialmente pausas pelo menos tão dizagem sem erro podem ser efetivos, porque er­
longas quanto o atraso do intervalo e esta diferen­ ros que nunca ocorrem nunca são seguidos de
ciação será confundida com os efeitos atrasados perto por um reforçador subseqüente para res­
do reforçador (p. ex., Catania & Keller, 1981). E postas corretas: cf. Capítulo 8).
não podemos evitar esses problemas apresentan­ A moral dessa história é que os professores
do um estímulo durante o atraso, porque então es­ devem estar atentos para as seqüências nas quais
taremos, simplesmente, substituindo um reforça­ os erros dos estudantes são seguidos por corre­
dor condicionado imediato por um atrasado. ções, de forma que eles não fortaleçam as res­
Mais do que isso, sob muitas circunstâncias postas incorretas juntamente com as respostas
não podemos atribuir um determinado respon­ corretas que estão fortalecendo. Provavelmente,
der mais tardio inequivocamente a uma relação um reforçador que segue uma seqüência de res­
entre respostas e reforçadores particulares. Ima­ postas corretas funcionará melhor do que aque­
ginemos que a segunda resposta de bicar um dis­ le que segue uma única resposta correta depois
co, emitida por um pombo, produza um reforça­ de vários erros. O melhor professor será aquele
dor e, então, várias bicadas adicionais ocorrem que puder julgar se as respostas corretas são tão
em seguida. Esse responder adicional ocorreu infreqüentes que deveriam ser reforçadas, mesmo
porque o bicar foi reforçado, mas quantas des­ se precedidas por erros ou se são freqüentes o su­
sas respostas ocorreram porque a segunda res­ ficiente para que o reforçador possa esperar até
posta produziu um reforço e quantas ocorreram que o estudante tenha apresentado várias respos­
porque o primeiro bicar, depois de um atraso, tas corretas em uma série. Exemplos como esses
foi seguido pelo reforçador? deveriam nos lembrar que a modelagem é freqüen-

1 9 0 A . C h a r l e s C a t a n ia
temente, muito mais uma arte do que uma ciência tos da terminologia dos esquemas são lógicos,
(mas ver Galbicka, Kautz, & Jagers, 1993). mas outros são admitidamente idiossincráticos.
Por exemplo, os nomes dos esquemas de FI e VI
versus FT e VT são arbitrários (cada par pode­
ria, com igual facilidade, ser denominado dura­
Seção C A Terminologia dos Esquemas de ção fixa e duração variável, supostamente abre­
Reforço viadas com o FD e VD). Além disso, nomes di­
ferentes são correlacionados com contingências
Consideramos, até esse momento, uma va­ muito diferentes. Embora os esquemas de FI,
riedade de esquemas de reforço. Alguns elemen­ DRL e FT requeiram igualmente a passagem de

TABELA 10.1 Esquemas Básicos


Nome e Abreviação Contingência* Comentário
Intervalo variável VI t s, então 1 resposta t varia; com intervalos randômi-
(intervalo randômico) (RI) cos, a taxa de respostas é apro­
ximadamente constante
Intervalo fixo FI t s, então 1 resposta t constante; gera curvaturas de FI
Razão variável VR n respostas n variável; taxas de respostas al­
(Razão randômica) (RR) tas e constantes, entretanto n
grande pode produzir distensão
de razão
Razão fixa FR n respostas n constante; produz pausa pós-
reforço; pausas seguidas por ta­
xas altas
Tempo variável VT ts t variável; reforçadores indepen­
dentes de resposta
Tempo fixo FT ts t constante; reforçadores indepen­
dentes de resposta
Reforço Contínuo (FR 1) 1 resposta Todas as respostas reforçadas;
também abreviado como CRF
Extinção EXT Como procedimento, freqüente­
mente usado mesmo que a res­
posta nunca tenha sido reforça-
da
Contenção lim itada (L im ited LH Reforço cancelado se nenhu­ t constante, se não for especifica­
hold) ma resp o sta refo rçad a do; LH, sempre adicionado a
ocorrer em t s outro esquema, não pode ocor­
rer sozinho
Reforço diferencial de baixas ta­ DRL t s sem resposta, então 1 res­ Mantém o responder facilmente;
xas (ou IRT longo) posta redução no responder aumenta
o reforço e, assim, previne a ex­
tinção
Reforço diferencial de altas ta­ DRH 1 resposta dentro de í s o u Alternativamente, pelo menos n
xas (ou IRTs curtos) menos de / s da última res­ respostas em t s; algumas ve­
posta zes difícil de ser mantido, por­
que o decréscimo do responder
reduz o reforço.
Reforço diferencial de responder DRP 1 resposta entre t e t’s da úl­ Estabelece limites, inferior e su­
espaçado tima resposta perior, das taxas de respostas
reforçáveis.
Reforço diferencial de outro DRO t s sem respostas Um procedimento de omissão ou
comportamento de punição negativa; geralmen­
te reduz a taxa da resposta es­
colhida.
*t s = tempo em segundos; n = número de respostas

A p r e n d iz a g e m 191
um tempo constante, o que as respostas podem dor mas, se outros eventos forem programados
produzir é diferente em cada um deles. Um es­ entre os intervalos sucessivos, a contagem do
quema de FI não impõe restrições sobre o res­ tempo pode começar com a apresentação de al­
ponder durante o intervalo, mas uma resposta gum estímulo, como uma cor, projetada no dis­
deve ocorrer no final dele. Passa-se algum tem­ co do pombo). O glossário oferece detalhes adi­
po, durante o qual as respostas não têm efeito e, cionais sobre os esquemas.
então, a próxima resposta é reforçada. Um es­ As duas primeiras colunas da Tabela 10.1
quema de DRL exige que se passe um tempo apresentam os nomes dos esquemas e suas abre­
específico sem que ocorram respostas e, então, viações padronizadas. Na prática, as designações
a próxima resposta é reforçada. As respostas que de tempo ou número, geralmente, acompanham
ocorrem muito cedo têm algum efeito: elas rei­ as abreviações (p. ex., V I30 s, LH 5 s, DRL 10 s
niciam a contagem de tempo. Finalmente, em um e FR 50). A terceira coluna descreve as contin­
esquema de FT, o reforçador é apresentado ao gências do esquema, as condições sob as quais
final do intervalo especificado, quer as respos­ as respostas são elegíveis para produzir reforça­
tas tenham ocorrido, quer não. Nesse esquema, dores (cf., FI versus FT e DRL versus DRO). A
as respostas nunca têm efeito. Estes nomes de última coluna mostra comentários breves sobre
esquemas emergiram incidentalmente, à medida cada esquema. O vocabulário dessa tabela, apre­
que a pesquisa evoluiu, e agora estão tão bem sentado com base em esquemas de reforço, tam­
estabelecidos que seria difícil mudá-los. bém pode ser estendido a esquemas de punição
Das várias tentativas importantes que foram (p. ex., Azrin, 1956). A simetria entre o reforço
feitas para classificar os esquemas de reforço de e a punição, ilustrada no Capítulo 6 (na Figura
forma mais sistemática (p. ex., Schoenfeld & 6.1), aplica-se também aos efeitos dos esquemas.
Cole, 1972; Snapper, Kadden, & Inglis, 1982), Por exemplo, a superposição de um esquema de
nenhuma conseguiu passar a ter um uso geral. A punição em FI sobre o responder mantido pro­
Tabela 10.1 resume alguns dos principais esque­ duz uma curvatura invertida, uma taxa de res­
mas. As definições de esquemas aplicam-se, quer postas gradualmente decrescente, à medida que
os reforçadores sejam programados sucessiva­ se aproxima o final do intervalo, e não a taxa
mente e sem interrupção, quer ocorram em ten­ crescente que um esquema de reforço em FI ge­
tativas separadas (p. ex., geralmente, o intervalo ralmente produz.
em um FI é contado a partir do último reforça­

192 A. C harles C a t a n ia
Combinações de Esquemas:
Síntese Comportamental
ii
conjugado está relacionada a to juxtapose (justapor),
A. Esquem as M últiplos e Mistos
a to conjugate (conjugar), yoga (ioga) e a to yoke
Respostas de Observação
(unir, acoplar).
Interações entre Esquemas: Contraste Comportamental

B. Esquemas Encadeados, Tandem e de Segunda Os esquemas não operam isoladamente. Eles


O rdem podem se alternar uns com os outros, com estí­
Reforço Condicionado mulos correlacionados (esquemas múltiplos) ou
Estímulos Breves em Esquemas de Segunda Ordem não (esquemas mistos). A conseqüência de com­
C. Esquemas Concorrentes pletar um esquema pode ser o início de um outro
Igualação, Maximização e Escolha esquema, com estímulos correlacionados (esque­
Esquemas Encadeados Concorrentes mas encadeados) ou sem eles (esquemas tan­
Forrageio Natural e Síntese Comportamental dem); em tal contexto, um esquema pode ser a
Preferência por Escolha Livre unidade do comportamento sobre a qual outro
Autocontrole
esquema opera (esquema de ordem superior). Os
D. Combinações de Esquem as e Síntese esquemas podem operar ao mesmo tempo, para
C om portam ental respostas diferentes (esquemas concorrentes) ou
para uma mesma resposta (esquemas conjuga­
dos); os esquemas que operam concorrentemen­
A terminologia das combinações dos esquemas ofe­ te podem produzir outros esquemas (esquemas
rece um pacote etimológico misto. A palavra múlti­ encadeados concorrentes). Mas essas combina­
plo, do indo-europeu mel-, strong (forte) ou great ções de esquemas não têm interesse em si mes­
(grande), mais pel-,fold (juntar) está relacionada a
mas. Elas estão relacionadas a problemas que ti­
to meliorate (aperfeiçoar), to imply (implicar) e to
complicate (complicar). A palavra misto, do indo­ veram importância histórica, como a aprendiza­
europeu meik-, to mix (misturar) ou mingle (combi­ gem de discriminação (esquemas múltiplos), o
nar-se) está relacionada a promiscous (promíscuo) reforço condicionado (esquemas de segunda or­
e miscellaneous (miscelânia). A palavra cadeia vem dem e esquemas encadeados) e a escolha (es­
de uma palavra latina de origem obscura, catena, e
quemas concorrentes e cadeias concorrentes).
pode estar relacionada a to enchant (encantar). Tan­
dem, aplicado a ciclos duplos (bicycles) do latim Uma análise experimental implica em decom­
tandem, lengthwise (comprido), está relacionado a por comportamentos complexos, para descobrir
tantamount (ter força igual) e though (posto que). do que eles são constituídos. A taxonomia do
Concorrente e conjugado partilham o prefixo latino comportamento que temos desenvolvido neste
con-, with (com). Do latim currere, to run (correr),
livro provê unidades comportamentais para nossa
concorrente está relacionado a to carry (carregar), a
intercourse (intercurso) e curriculum (currículo); do análise. Quando terminamos uma análise, pela
latim iungere, to join (juntar, agregar), a palavra separação das partes, podemos validá-la exami-
nando se podemos reconstituir novamente o com­ As substâncias que agem sobre o comportamento
portamento analisado. A reversão de uma análi­ podem ser classificadas com base em tais efeitos
se é a síntese (como na química, quando um com­ (p. ex., Dews, 1970; Weiss & Laties, 1969).
posto é sintetizado, depois de uma análise ter de­
terminado seus elementos e sua estrutura). Em­
pregaremos várias combinações de esquemas RESPOSTAS DE OBSERVAÇÃO
para sintetizar o comportamento complexo. O su­
cesso de nossa síntese nos dirá algo sobre a ade­ Os estímulos discriminativos são efetivos
quação de nossa análise. Dentre as questões que apenas se o organismo os observa. Podemos fa­
discutiremos ao revisarmos as áreas específicas zer um pombo observar certos estímulos ao exi­
de pesquisas que envolvem a combinação de es­ gir que bique um disco para produzi-los. Vamos
quemas estão os estímulos de natureza informa­ começar com a alternação irregular do reforço
tiva, escolha livre e autocontrole. em VR e a extinção da resposta de bicar o disco
de um pombo. Nesse esquema misto (mix EXT
VR), mantemos a luz do disco branca na presen­
ça de ambos os esquemas, de forma que o pom­
Seção A Esquemas M últiplos e Mistos bo vai bicar tanto no componente de EXT como
no de VR. Mas agora acrescentamos um disco
Falamos dos esquemas múltiplos como exem­ de observação, um segundo disco no qual as res­
plos de controle de estímulo (p. ex., múltiplo VI postas produzem os estímulos correlacionados
EXT na Figura 7.1; ver Tabela 10.1, para abre­ com os esquemas componentes. Durante a EXT,
viações). Dois esquemas se alternam, cada um as respostas sobre esse disco mudam a cor dele
correlacionado com um estímulo diferente; fala­ para vermelho durante algum tempo; durante VR
mos de controle de estímulos quando o desem­ tornam o disco verde. Na verdade, as bicadas no
penho apropriado a cada esquema ocorre em pre­ disco de observação transformam o esquema
sença do estímulo correspondente. Por exemplo, misto em múltiplo (mult EXT VR); na presença
se um esquema de FI opera para bicadas de um dos estímulos do esquema múltiplo, o pombo
pombo sob luz verde e um esquema de VI para passa a bicar com taxa próxima de zero durante
bicadas no vermelho, a curvatura de FI (padrão o vermelho, o estímulo do esquema em EXT, e
meia-lua) no verde pode alternar com uma taxa com taxa alta durante o verde, o estímulo do es­
de respostas aproximadamente constante, típica quema de VR. (Essas contingências diferem da­
de VI, no vermelho (o reforço pode se alternar quelas para as respostas de observação no pro­
com extinção em esquemas múltiplos, mas nes­ cedimento de emparelhamento com o modelo
te exemplo temos dois esquemas de reforço di­ que produzem os estímulos de comparação, por­
ferentes, cada um correlacionado com um estí­ que as contingências aqui correlacionadas com
mulo). os esquemas múltiplos operam quando estes es­
Os esquemas múltiplos têm sido freqüente­ tímulos estão ausentes, assim como quando es­
mente usados como linha de base em estudos de tão presentes: cf. Capítulo 9.)
variáveis que afetam o comportamento. Por As bicadas no disco de observação são man­
exemplo, com esquemas múltiplos FI FR, os efei­ tidas pelos procedimentos de resposta de obser­
tos de uma droga sobre o responder em FI e FR vação que acabamos de descrever (Kelleher, Ri­
podem ser obtidos com um único conjunto de ddle, & Cook, 1962). Mas, o que mantém essa
doses; os efeitos de drogas freqüentemente vari­ observação? Uma possibilidade é que os efeitos
am com o esquema que mantém o responder. Em reforçadores dos estímulos discriminativos de­
farmacologia comportamental e toxicologia com- pendam de sua relação com o reforçador alimen­
portamental, tais linhas de base algumas vezes re­ tar programado pelos esquemas; outra é que os
velam amplos efeitos comportamentais de subs­ estímulos sejam observados, porque permitem
tâncias, tais como como poluentes, em concentra­ ao pombo se comportar de forma mais eficiente
ções que apresentam poucos efeitos fisiológicos. em relação aos esquemas componentes (o pom­

194 A. C harles C a t a n ia
bo não pára de bicar durante a EXT, quando o ângulo é a característica distintiva desses estí­
disco está sempre branco, mas pára quando ele mulos, e um pombo, provavelmente, adquirirá
fica vermelho). A questão pode ser colocada em essa discriminação mais rapidamente se o triân­
termos de se a resposta de observação é manti­ gulo estiver correlacionado ao reforço (caracte­
da, porque estímulos discriminativos são reforça­ rística positiva) do que se estiver correlaciona­
dores condicionados ou porque são informativos. do com a extinção (característica negativa), por­
Se a informação está envolvida, então os dois que olhar para um estímulo é uma resposta de
estímulos discriminativos deveriam ser igual­ observação. O pombo tenderá a olhar mais para
mente informativos, mesmo que um esteja cor­ o triângulo no primeiro caso do que no segundo.
relacionado com a extinção e outro com o refor­ (Jenkins & Sainsbury, 1970, e Capítulo 8, sobre
ço. Suponhamos que as respostas de observação discriminação de características positivas).
simplesmente iniciem o vermelho durante a EXT Nós humanos não estamos imunes a tais con­
e não o façam durante o VR. Se as respostas de tingências. Por exemplo, suponhamos que al­
observação ocorrem, porque permitem ao pom­ guém mostre a você alguns cartões com letras
bo se comportar mais eficientemente com rela­ de um lado e números do outro, e diga-lhe que
ção aos esquemas componentes, ligar unicamente cada carta com uma vogal em um dos lados tem
a luz vermelha neste novo procedimento é tão um número ímpar do outro. Quatro cartas são
útil quanto ligar ambas as luzes. Mas foi verifi­ apresentadas com A, 8, X e 7 voltados para cima
cado que o comportamento de observar é clara­ e você é solicitado a virar o número mínimo de
mente mantido quando produz apenas o estímu­ cartas para verificar a regra: se forem vogais, en­
lo correlacionado com o esquema de VR, mas tão, teremos números ímpares (cf. Wason & Jo-
não quando produz unicamente o estímulo cor­ hnson-Laird, 1970). Quantas cartas você viraria
relacionado com a extinção (Dinsmoor, 1983). para examinar e quais seriam elas? Muitas pes­
Da mesma forma, estímulos correlacionados com soas irão virar a carta contendo o A, para ver se
punição diferencial (reforço em um componen­ há um número ímpar do outro lado. Aqueles que
te e reforço mais punição no outro) não mantêm viram uma segunda carta geralmente tentam o
bem as respostas de observação; se existem 7, para confirmar a vogal do outro lado. Mas a
quaisquer efeitos informativos, eles são sobre­ regra não será negada se eles encontrarem uma
pujados pela aversividade do estímulo correla­ consoante, porque a regra não diz que consoan­
cionado com reforço e punição, mesmo quando tes não podem ter números ímpares também.
este estímulo permitiria ao pombo responder Você precisa virar duas cartas, mas a outra carta
mais eficientemente, diminuindo o responder a ser examinada é o 8, que negará a regra se exis­
somente quando o mesmo aparece (Dinsmoor, tir uma vogal do outro lado. Somente um núme­
1983). ro pequeno de pessoas escolhe esta carta.
Em outras palavras, a efetividade reforçado- Por quê? O ponto é que as pessoas estão, pro­
ra de um estímulo discriminativo não depende vavelmente, procurando mais confirmar do
do caráter informativo, mas, muito mais das con­ que negar suas hipóteses. Virar uma carta é uma
seqüências particulares com as quais está corre­ resposta de observação, e todos temos longas his­
lacionado. Assim, um problema central na apren­ tórias de verificar nossas suposições sobre as
dizagem da discriminação pode ser simplesmente coisas. Presumivelmente checamos coisas que
o de levar o organismo a observar os estímulos são importantes para nós, então, no passado terá
relevantes. Por exemplo, os organismos estão sido muito mais agradável ter tido nossas supo­
provavelmente mais atentos às características dos sições confirmadas do que negadas. Com o tem­
estímulos correlacionadas com um esquema de po, provavelmente, aprendemos que alguns ti­
reforço do que com aquelas correlacionadas com pos de suposições podem somente ser confirma­
a extinção. Suponhamos que os estímulos de uma das e que outras podem unicamente ser negadas,
discriminação reforço-extinção consistem em e fazemos suposições de acordo com isso. Se não
uma matriz de círculos ou a mesma matriz com é verdade, infelizmente significa que algumas
um triângulo substituindo um dos círculos. O tri­ vezes pensamos ter confirmado alguma coisa

A p r e n d iz a g e m 195
quando não confirmamos; talvez então a verda­ do bicar o disco na presença do primeiro estí­
de fosse alguma coisa que não queríamos saber. mulo é freqüentemente acompanhada de aumento
A efetividade de uma mensagem depende em presença do segundo, mesmo que o esquema
mais de se seu conteúdo é reforçador ou aversi- programado durante o segundo se mantenha inal­
vo, do que se está correta ou completa. E consis­ terado. O fenômeno, chamado de contraste com-
tente com esta descoberta, por exemplo, que pes­ portamental, é ilustrado na Figura 11.1 (Reynol­
soas freqüentemente hesitam em procurar diag­ ds, 1961b). Um esquema múltiplo V I3 min V I3
nósticos médicos para certos sintomas. O fenô­ min estava programado para as respostas de um
meno tem sido longamente reconhecido na sa­ pombo, de bicar o disco tanto em presença da
bedoria popular, como naquelas histórias sobre luz vermelha quanto da luz verde. O esquema
o tratamento infeliz dado aos mensageiros que em verde foi mudado de esquema de VI para.
traziam más notícias. Que os organismos traba­ EXT e então foi mudado novamente para VI,
lham mais por informações correlacionadas com enquanto o reforço em VI foi mantido na pre­
reforçadores do que por informações em si mes­ sença do vermelho. A taxa de respostas no ver­
mas, é simplesmente mais um fato do comporta­ melho aumentou enquanto vigorava EXT em pre­
mento que tem sido derivado da análise do com­ sença do verde, mesmo não tendo havido mu­
portamento, e algumas vezes é um fato contra o dança no VI em presença da luz vermelha; am­
qual resistimos. Quando isso acontece, é um fato bas as taxas retomaram a seus valores anteriores,
que ilustra a si mesmo. quando o esquema de VI foi reinstalado no verde.
Efeitos de contraste variam com as respos­
tas, os reforçadores e os organismos (p. ex., Hem-
INTERAÇÕES ENTRE ESQUEMAS: mes, 1973), variando desde aumentos prolonga­
CONTRASTE COMPORTAMENTAL dos até aumentos que duram apenas segundos
ou minutos após a mudança do esquema (p. ex.,
Em esquemas múltiplos, o comportamento Catania & Gill, 1964). Esses efeitos têm sido in­
em um componente é freqüentemente afetado terpretados como a somatória de dois tipos de
pelo que acontece no outro componente. Por bicar: o bicar operante mantido pelo reforço ali­
exemplo, se o esquema que mantém o compor­ mentar, e o bicar respondente produzido pela
tamento de um pombo de bicar o disco em pre­ correlação de estímulos discriminativos com re­
sença de um estímulo é alterado de Reforço em forçadores (p. ex., a apresentação de reforçado­
VI, para Extinção, enquanto o Reforço em VI res durante o VI, mas não durante o estímulo em
continua durante o segundo estímulo, a redução EXT do múltiplo VI EXT: cf. o tópico de auto-

FIGURA 11.1 Efeitos da extinção em um


componente de um esquema múltiplo,
sobre o responder mantido por reforço em
VI, no outro componente. Ai apresentações
do vermelho e do verde no disco eram al­
ternadas a cada 3 minutos. Durante as ses­
sões, o esquema na luz verde fo i mudado
de V I3 min para a extinção e novamente