Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
www.facebook.com/groups/livrosparadownload
www.slideshare.net/jsfernandes/documents
A p r e n d iz a g e m
T radutores:
Andreia Schmidt (Programa de Pós-Graduação em Educação Especial - UFSCar)
Deisy das Graças de Souza (Universidade Federal de São Carlos)
Fernando Cesar Capovilla (Universidade de São Paulo)
Julio Cesar Coelho de Rose (Universidade Federal de São Carlos)
Maria de Jesus Dutra dos Reis (Universidade Federal de São Carlos)
Aline Acetuno da Costa (Programa de Pós-Graduação em Educação Especial - UFSCar)
t Ligia Maria de Castro Marcondes Machado (Universidade de São Paulo)
t Alcides Gadotti (Universidade Federal do Pará)
CDU 371.13:159.922
ISBN 85-7307-553-8
A. Charles Catania
U niversity o f M aryland B altim ore County
A p r e n d iz a g e m :
Comportamento, Linguagem e Cognição
4- Edição
ARÜVED
E D I T O R A
SÃO PAULO
Av. Rebouças, 1073 - Jardins
05401-150 São Paulo SP
Fone (11) 3062-3757 Fax (11) 3062-2487
IMPRESSO NO BRASIL
PRINTED IN BRAZIL
P ara Connie, B ill e Ken.
Prefácio
V III P refácio
Para estudar a aprendizagem é necessário sa O capítulo final consiste em uma revisão e inte
ber o que é a aprendizagem. O Capítulo 1 come gração de questões centrais na Psicologia da
ça, portanto, com o problema da definição de Aprendizagem.
aprendizagem (mas não o resolve). O Capítulo 2 Vários destes tópicos foram revistos ou am
trata basicamente da organização do livro e apre pliados. Alguns deles são: nomeação como uma
senta uma perspectiva dos tópicos examinados, classe verbal; classes de comportamento de or
em detalhes, nos Capítulos 4 a 12, no contexto dem superior; desenvolvimento de linguagem e
da história deste campo de estudos. O Capítulo o argumento da pobreza do estímulo; classes de
3 lida com a seleção, como um conceito central equivalência; discriminação do próprio compor
para o que se segue, e fornece informações bási tamento; processos autoclíticos; comportamen
cas sobre a evolução. O Capítulo 4 examina o to governado verbalmente e controle instrucio-
reflexo e outras relações decorrentes da apresen nal; a distinção entre seleção natural e seleção
tação de estímulos aos organismos. Em outros artificial; a modelagem do comportamento ver
textos, é prática comun introduzir o condiciona bal; linguagem animal; memória distorcida e re
mento neste ponto, mas dentro da presente orga primida: e metáfora e outros fenômenos de lin
nização, este tópico será efetivamente adiado guagem. A homogeneidade entre os capítulos so
para mais tarde. bre aprendizagem não-humana e condicionamen
Os Capítulos 5 e 6. sobre reforço e controle to e os capítulos sobre aprendizagem humana e
aversivo, mostram como as conseqüências do memória também foi melhorada.
responder podem afetar o comportamento. Es Ao longo de sua história, a Psicologia da
tes tópicos levantam a questão sobre classes de Aprendizagem tem-se preocupado com teorias.
respostas e classes de estímulos como unidades Teorias particulares de aprendizagem foram de
comportamentais. Eles levam, portanto, ao con senvolvidas, elaboradas e, então, substituídas por
ceito de operante, no Capítulo 7, e ao conceito outras. Muitas permanecem conosco, tipicamente
de operante discriminado, nos Capítulos 8 e 9. mais circunscritas em seu escopo do que quan
O Capítulo 9 também considera as implicações do introduzidas. Seja qual for a posição atual
de unidades comportamentais de ordem superior dessas teorias, os achados empíricos que susten
ou de segunda ordem. Esses conceitos continuam taram sua proposição ainda requerem que se lide
sendo ilustrados nos Capítulos 10 e 11, que exa com eles. Por essa razão, o presente texto enfati
minam como o comportamento complexo pode za descobertas empíricas em detrimento de teo
ser sintetizado no contexto de esquemas de rias de aprendizagem. Ele é teórico apenas, e
reforço. O Capítulo 12 retoma o condiciona principalmente, na medida em que adere a uma
mento e mostra como ele pode estar relacio linguagem comportamental consistente e na me
nado aos processos discutidos em capítulos dida em que busca uma organização sistemáti
anteriores. ca, capaz de acomodar os vários procedimentos
Ao abordar o tema da linguagem, os Capítu e processos de aprendizagem. Embora a teoria
los 14 e 15 tratam das complexidades do com não seja enfatizada, tentei incluir informação su
portamento verbal humano. Algumas caracterís ficiente a respeito de procedimentos experimen
ticas das abordagens comportamental e cogniti tais, terminologia e dados, para fornecer um pon
va são explicitamente comparadas no Capítulo to de partida efetivo ao aluno, ao instrutor ou ao
16. que versa sobre Psicolingiiística. Estes três leitor em geral que queira adotar teorias especí
capítulos estabelecem o cenário para o exame ficas. A ênfase do livro não reside tanto na inter
da aprendizagem verbal e da transferência, no pretação de descobertas específicas, mas nas re
Capítulo 17, e da memória, nos Capítulos 18 e lações entre os vários fenômenos incluídos na
19. Cognição e resolução de problemas (pro- Psicologia da Aprendizagem. Meu intento foi
hlem-solving). que são o foco do Capítulo 20, tornar o livro útil não apenas para pessoas com
apresentam uma oportunidade para síntese, por inclinações comportamentais. mas também para
que colocam juntos tópicos considerados sepa aquelas que decididamente não adotam uma po
radamente em vários pontos ao longo do texto. sição comportamental.
P refácio IX
O conteúdo deste livro foi desenvolvido ao taria também de registrar meu apreço pela ajuda
longo de um curso introdutório de Psicologia da incalculável de Madelon Kellough, Tem Harold
Aprendizagem, primeiro no University College e Mary Johnston, pelo encorajamento de Jack
o f Arts and Science da New York University e, a Burton e pela tramitação do livro ao longo das
seguir, na University o f Maryland Baltimore sucessivas etapas de publicação, conduzida por
County. Sou grato a meus alunos e colegas em Ilene Kalish e Karen Trost.
ambos os campi e, especialmente, a Eliot H. Shi- Gostaria também de agradecer aos seguintes
moff. Como meus professores e colegas, muitos revisores do manuscrito para esta quarta edição:
outros colaboraram com comentários, discussões Rebecca M. Chesire, da University ofH aw aii;
e encorajamento. Como nas edições anteriores, Robert H. I. Dale, da Butler University, Lewis
cito apenas alguns deles, sobretudo porque ain R. Gollub, da University o f Maryland College
da sou capaz de identificar contribuições parti Park\ e David K. Hogberg, do Albion College.
culares de cada um: Abraham Amsel, Kenneth Acima de tudo, e como nas edições anterio
C. Catania, William J. Catania, Joseph Cautelli, res, falta ainda um reconhecimento. Desta vez,
Daniel Cerutti, Leonard Cook, Willard F. Day, infelizmente, eles já não estão conosco para re
Israel Goldiamond, Lewis R. Gollub, Ernest S. cebê-lo. Devo mais do que sou capaz de dizer ao
Graham, Stevan Harnad, Eliot Hearst, Ralph F. Nat e ao Fred: W. N. Schoenfeld e Fred S. Kel
Hefferline, Philip N. Hineline, Per Holth, Koji ler. Seus cursos e seu Princípios de Psicologia
Hori, Pauline Horne, Herbert M. Jenkins, Victor introduziram-me à análise do comportamento e
G. Laties, Kennon A. Lattal, Richard A. Littman, me comprometeram, irrevogavelmente, com a
C. Fergus Lowe, Ernest L. Moerk, J. A. Nevin, exploração de suas preocupações. Espero que
Koichi Ono, Michael J. Owren, Robert R. Pro este livro seja suficientemente fiel aos seus en
vine, Robert Remington, George S. Reynolds, sinamentos e que os leitores que os conheceram
Marc Richelle, Terje Sagvolden, B. F. Skinner, e os que aprenderam com eles possam reconhe
Deisy de Souza, William C. Stebbins, S. S. Ste cer algo deles nestas páginas.
vens, Mark Sundberg e Vicci Tucci. Em uma lista
assim, omissões são inevitáveis; felizmente, a
contribuição de muitos outros profissinais é re A. Charles Catania
conhecida por sua inclusão nas referências. Gos Columbia, Maryland
X P refácio
Sumário Reduzido
PARTE V C onclusão...................................................................................................................................................369
Capítulo 21 Estrutura e Função na Aprendizagem...................................................................................................... 371
Glossário............................................................................................................................................................................ 383
Créditos das Ilustrações................................................................................................................................................... 427
Referências Bibliográficas..............................................................................................................................................429
ín d ice................................................................................................................................................................................. 455
Sumário
PAR TE I Introdução...........................................................................19
C a p ítu lo 1 A p r e n d i z a g e m e C o m p o r t a m e n t o ....................................................................................... 21
A. A Linguagem da Aprendizagem e do C om portam ento.................................................................................22
Linguagem Comportamental e Linguagem Cognitiva........................................................................................ 24
O Mundo e o Laboratório...................................................................................................................................... 26
B. Antecedentes, Com portam ento, C onseqüências............................................................................................ 27
Estímulos e Respostas............................................................................................................................................. 28
Hierarquias Comportamentais...............................................................................................................................30
C a p ítu lo 2 U m a T a x o n o m ia d o C o m p o r t a m e n t o ................................................................................32
A. A Observação do C om portam ento.................................................................................................................... 33
B. A Apresentação de E stím u lo s............................................................................................................................. 35
C. Operações Conseqüenciais.................................................................................................................................. 37
D. Operações de Sinalização ou de Controle de E stím u lo .................................................................................38
Sinalização de Apresentações de Estímulo.......................................................................................................... 39
Sinalização de Conseqüências...............................................................................................................................39
E. Estabelecendo a Efetividade das C onseqüências........................................................................................... 43
F. R esu m o .................................................................................................................................................................... 44
PA R T E III A p re n d iz a g e m S e m P a l a v r a s ...................................................................... 79
C a p ítu lo 5 A s C o n s e q ü ê n c ia s d o R e s p o n d e r : R e f o r ç o ......................................................................81
A. Reforço e E xtin ção ................................................................................................................................................ 82
Labirintos e Curvas de Aprendizagem .................................................................................................................82
Câmaras Experimentais e Registros Cumulativos...............................................................................................85
Reforço..................................................................................................................................................................... 90
E xtinção................................................................................................................................................................... 92
B. Os Reforçadores como O portunidades p ara o C om portam ento.................................................................97
Relatividade do R eforço.........................................................................................................................................98
Aquisição do Comportamento...........................................................................................................................101
14 S um ário
C a p ítu lo 9 D is c r im in a ç ã o C o n d i c io n a l e C la s s e s d e O r d e m S u p e r i o r .............................. 163
A. Dimensões Relacionais de E stím ulos............................................................................................................... 164
Emparelhamento com o Modelo e Emparelhamento por Singularidade........................................................ 164
Comportamento Simbólico: Classes de Equivalência.......................................................................................166
B. Classes de Com portam ento de O rdem S u p e rio r..........................................................................................169
Aprender a Aprender (Leaming S e t)...................................................................................................................170
Propriedades das Classes de Ordem S uperior................................................................................................... 172
Origens da E strutura..............................................................................................................................................173
C. Fontes do Com portam ento N ovo......................................................................................................................174
S um ário 15
P A R T E IV Aprendizagem Com P a la v ra s .......................................... 249
16 S um ário
Proação e Retroação.............................................................................................................................................. 324
Extensões a Procedimentos não Verbais............................................................................................................. 325
Resumo....................................................................................................................................................................326
C a p ítu lo 19 A E s t r u t u r a d o L e m b r a r .....................................................................................................342
A. M em ória Icônica: Os Efeitos Persistentes dos Estímulos ......................................................................... 343
B. M em ória de C urto Prazo: O Papel do E nsaio...............................................................................................344
C. M emória de Longo Prazo: Interferência e E squecim ento......................................................................... 347
D. A E stru tu ra da M emória: O que é L em b ra d o ?........................................................................................... 350
Memória de Procedimento e Memória Declarativa.......................................................................................... 350
Memória Implícita e Memória Explícita.............................................................................................................351
Memória Autobiográfica e Memória Semântica ............................................................................................... 351
Outròs Tipos de Lem brar..................................................................................................................................... 352
Resumo....................................................................................................................................................................352
PA R T E V C o n c l u s ã o ..............................................................................................................................369
G l o s s á r i o .........................................................................................................................................................................383
C ré d ito s d as I l u s tr a ç õ e s ...........................................................................................................................................427
í n d i c e ................................................................................................................................................................................ 455
S um ário 1 7
PARTE I
INTRODUÇÃO
Aprendizagem e Comportamento
22 A . C h a r l e s C a ta n i a
te que tem e seria fascinante saber que mudan feridas. Contudo, esse tipo de vocabulário não é
ças neurológicas acompanham a aprendizagem. apropriado para discutir como interesses ou tra
Mas teríamos problemas em decidir o que pro ços particulares se desenvolveram em um indi
curar no sistema nervoso, se não soubéssemos o víduo.
bastante sobre a aprendizagem. De fato, não po Consideremos um outro exemplo. Há uma di
demos ter uma adequada neurociência da apren ferença importante entre mentir e dizer a verda
dizagem, a menos que compreendamos suas pro de. Mas, se uma criança aprende a evitar proble
priedades comportamentais. Tais propriedades mas dizendo mentiras, e outra aprende a evitá-
determinam que tipo de coisas o neurocientista los dizendo a verdade não deveríamos nos sur
interessado em aprendizagem deve procurar no preender se a primeira criança vier a se tornar
sistema nervoso. Essa é a razão pela qual nossa menos confiável do que a segunda. Contudo, o
principal preocupação será com as propriedades comportamento de cada criança foi modelado por
comportamentais da aprendizagem, mais do que suas conseqüências, cada criança se comporta
com suas bases fisiológicas. de modo a evitar problemas. Essa modelagem
Até aqui, estivemos pouco preocupados com do comportamento deveria ser de nosso interes
os fatos da aprendizagem; estivemos mais preo se, mas o vocabulário cotidiano não nos equipa
cupados sobre como falar a respeito deles. As bem para discuti-la.
linguagens mudam; suas terminologias refletem Problemas desse tipo também ocorrem em
o que é importante, no momento presente, para outros campos, além da Psicologia. Quando ob
os que falam uma dada linguagem. Um proble servam eventos no mundo, os físicos não consi
ma é que a linguagem que evoluiu em nossa in deram adequado o vocabulário do cotidiano. Eles
teração cotidiana com os outros não é, necessa cunham novos termos ou apoderam-se de outros
riamente, a mais apropriada para uma linguagem já existentes. O último recurso pode criar difi
da aprendizagem (essa é uma das razões para a culdades. Palavras como trabalho, força e ener
inclusão da seção etimológica, ou história das gia, por exemplo, significam para os físicos, na
palavras, no início de cada capítulo). linguagem técnica, coisas diferentes do que sig
Normalmente, estamos mais interessados no nificam para a maioria das pessoas em sua con
que as outras pessoas sabem e no que tendem a versação rotineira. Felizmente, para os físicos,
fazer do que em como elas vieram a se tomar o muitos fenômenos que eles estudam atualmente
que são. Um pai ou uma professora, por exem estão tão distantes de nossa experiência comum,
plo, poderiam preocupar-se com uma criança que que não confundimos sua linguagem técnica com
briga, freqüentemente, com outras crianças e que o discurso leigo.
nunca brinca cooperativamente. Mas, se a crian Esse não é o caso da Psicologia. Todos esta
ça começa a brincar cooperativamente, o pai mos, inexoravelmente, envolvidos com o com
pode não se importar se isso ocorreu devido às portamento. Falamos sobre como as pessoas cres
recompensas naturais da cooperação, se a coo cem e mudam, especulamos sobre as razões que
peração foi explicitamente ensinada ou se brigar elas têm para fazer certas coisas e nós próprios
ou outras alternativas para o brincar foram puni aprendemos novos fatos e adquirimos novas ha
das. bilidades. Se desejarmos criar novas formas de
A linguagem que geralmente empregamos falar sobre esses eventos, temos que cuidar para
para descrever o que as pessoas fazem é útil. E que a nova linguagem não venha a se confundir
importante saber o que esperar dos outros, e deve com a antiga. Temos passado a maior parte de
ser por isso que descrevemos as pessoas pela nossas vidas falando de maneiras específicas
maneira como elas tendem a se comportar. Re sobre o que fazemos, e esses modos familiares
ferimo-nos uns aos outros como expansivos ou de falar podem interferir com quaisquer novas
reservados, relaxados ou compulsivos, confiá- formas que tentemos estabelecer. Algumas se
>eis ou imprevisíveis. Descrever pessoas com ções deste livro serão dedicadas ao estabeleci
r ilivras como artístico, atlético, social, intelec- mento de uma linguagem comportamental, e essa
3kj1 ou musical especifica suas atividades pre linguagem não será simplesmente uma paráfra
A pr en d iza g em 2 3
se dos usos cotidianos; ela irá exigir algumas no Por exemplo, às vezes, dizemos, casualmen
vas formas de lidar com fenômenos ou eventos te, que uma idéia, um sentimento ou um palpite
familiares. levou alguém a fazer algo. O comportamentalis-
ta não questiona a existência de idéias, sentimen
tos e intuições, mas critica sua invocação como
LINGUAGEM COMPORTAMENTAL causa do comportamento. E fácil demais con
E LINGUAGEM COGNITIVA tentar-se com uma explicação assim; para um
comportamentalista não basta dizer que alguém
Algumas vezes, falamos sobre o que as pes fez algo por causa de uma idéia, de um senti
soas fazem, outras sobre o que elas sabem. Por mento ou de uma intuição. As idéias, os senti
um lado, o que alguém faz é a única coisa que mentos e os palpites dizem respeito ao mundo e,
está acessível a nós. Não há outra coisa a ser portanto, devem ter sua origem em nossas expe
estudada, senão o comportamento. Em um ex riências com o mundo. Para explicar o que faze
perimento de aprendizagem, por exemplo, uma mos, devemos estender a busca a essas experiên
pessoa pode descrever pensamentos ou sentimen cias passadas ou, em outras palavras, ao com
tos, mas tais descrições ainda são comportamen portamento passado. Se tivermos êxito, teremos
tos (o comportamento verbal pode ser especial, também algo útil a dizer acerca das origens de nos
mas ainda assim é um comportamento). Indepen sas idéias, de nossos sentimentos e de intuições.
dentemente de quais sejam os fenômenos que es O cognitivista sustenta que essa visão é des
tudamos em Psicologia, nossas terminologias e necessariamente estreita. Quando lidamos com
teorias devem ser, em última instância, deriva o mundo, devem ocorrer processos que não são
das de um comportamento, daquilo que os orga observáveis em nosso comportamento. Quando
nismos fazem. tentamos lembrar de uma palavra que está na
Por outro lado, um organismo é mais do que “ponta da língua” ou tentamos resolver um pro
aquilo que pode ser visto em seu comportamento. blema “dormindo sobre ele”, acontecem algu
Dois alunos podem permanecer quietos durante mas coisas que não transparecem em nosso com
uma aula, e ainda assim pode ficar claro para o portamento, e pode ser que nem mesmo sejamos
professor que um deles é capaz de responder a cer capazes de relatá-las. Se pudéssemos descobrir
tas questões e resolver certos problemas, enquan algo acerca de tais processos„isso certamente se
to o outro não. Embora eles possam ser distingui ria relevante para o estudo da aprendizagem.
dos com base no desempenho passado, no presen Contudo, a disputa entre comportamentalis
te momento eles não se comportam de forma dife tas e cognitivistas pode ter origem tanto nas di
rente. A diferença está naquilo que cada um é vir ferentes maneiras de se falar sobre o comporta
tualmente capaz de fazer. Poder-se-ia dizer sim mento quanto em diferenças nas descobertas de
plesmente que um dos estudantes sabe mais que o pesquisa. Algumas dificuldades surgem porque
outro. Quando estudamos esse conhecimento, é esses dois tipos de psicólogos geralmente estão
tentador dizer que estudamos a mente. interessados em tipos diferentes de questões. Os
O debate entre psicólogos que se denominam comportamentalistas tendem a lidar com ques
comportamentalistas e os que se intitulam men- tões relativas à função, e os cognitivistas ten
talistas ou cognitivistas tem sido consideravel dem a lidar com questões de estrutura.
mente duradouro. Trata-se, até certo ponto, de Suponhamos que estejamos interessados em
um debate sobre os modos apropriados de se fa ensinar uma criança a ler. Por um lado, podería
lar de eventos psicológicos. O comportamenta- mos cogitar sobre o que teríamos que fazer para
lista afirma que se o comportamento é tudo o envolver a criança na leitura. Pensaríamos no que
que está disponível para ser medido, a lingua poderia manter a criança alerta, no que a ajuda
gem de eventos mentais pode ser enganadora, ria a prestar atenção às palavras apresentadas e
especialmente quando uma afirmação mentalis- no que poderia ajudá-la a lembrar quais são as
ta é aceita como explicação, e por isso desenco várias palavras. Seríamos melhor sucedidos se
raja a continuidade da pesquisa. recompensássemos seus acertos ou se penalizás
24 A . C h a rle s C atania
semos os erros? Quando planejamos conseqüên ções entre palavras e figuras e as respostas da
cias diferentes para as diferentes respostas que a criança, sua efetividade poderia ser prejudicada
criança pode apresentar, estamos determinando se tentássemos ensinar as palavras difíceis antes
as funções dessas várias respostas ou, mais pre das palavras fáceis ou as palavras com grafia ir
cisamente, as relações funcionais entre o com regular antes das palavras com grafia regular. Um
portamento e suas conseqüências. programa de leitura para ensinar uma língua al
Por outro lado, por mais preocupados que fabética, como o inglês, provavelmente seria bem
estejamos com os efeitos da recompensa e da diferente de um programa para ensinar uma lín
punição no domínio da leitura pela criança, isso gua ideográfica, como o chinês. Cada programa
não nos dirá qual o modo mais eficiente de lhe teria que levar em consideração a estrutura fala
apresentar materiais de leitura. Como a leitura é da e escrita da língua a ser ensinada.
estruturada? Qual é a melhor forma de seqüen- Historicamente, certas controvérsias surgiram
ciar os materiais? Deveríamos ensinar a criança na Psicologia, porque os psicólogos interessa
a ler, começando por letras individuais, por síla dos em problemas funcionais tendiam a falar uma
bas ou por palavras inteiras? Quando programa linguagem comportamental, enquanto os interes
mos diferentes ordens de apresentação dos ma sados em problemas estruturais tendiam a falar
teriais a serem aprendidos, estamos interessados uma linguagem cognitiva ou mental. Embora os
nas relações estruturais efetivas dentro do mate comportamentalistas pudessem ter estudado os
rial a ser ensinado. As palavras seriam melhor problemas estruturais, do mesmo modo que os
ensinadas como estruturas unitárias ou como cognitivistas poderiam ter estudado os proble
estruturas complexas construídas a partir de uni mas funcionais, os problemas nos quais os com
dades mais simples, como letras ou sílabas? Pro portamentalistas e os cognitivistas estavam in
blemas de estrutura dizem respeito a como o teressados tendiam a ser correlacionados com a
comportamento e o ambiente estão organizados. linguagem que eles empregavam.
Os dois tipos de problemas são importantes. E fácil ver como tal correlação pode ter sur
Qualquer tentativa de melhorar a forma como as gido. Se o experimentador está preocupado com
crianças aprendem a ler será deficiente se for ig a função, ele estuda as conseqüências de rela
norado qualquer um deles. Considere um outro ções particulares entre os eventos ambientais es
exemplo. Suponhamos que descobrimos que as pecíficos e as ações específicas; essas relações
crianças que aprendem a ler a partir de textos podem ser convenientemente expressas na lin
acompanhados por figuras apresentem maior guagem comportamental de estímulos e respos
probabilidade de atentar para as figuras do que tas. Se a preocupação do experimentador é com
para as palavras. Um de nossos problemas seria a estrutura, ele estuda as propriedades de capa
funcional e poderia nos levar a perguntar se po cidades ou as habilidades particulares; essas pro
deríamos melhorar o ensino de leitura colocan priedades são convenientemente expressas na
do as palavras em uma página e a figura rele linguagem cognitiva de conhecimento e mente.
vante na página seguinte. Isso também poderia (Uma distinção paralela entre estrutura e função,
ajudar o professor, que tem que julgar se a crian a separação entre anatomia e fisiologia, ocorreu
ça de fato leu a palavra ou se apenas adivinhou a na história da Biologia; ver Capítulo 21.)
palavra a partir da figura. Poderíamos, até mesmo, Mas não temos que nos desviar de nosso pro
criar um sistema de instrução por computador, em pósito por causa dessa controvérsia. Vamos con
que a criança somente pudesse ver a figura como siderar tanto os problemas funcionais quanto os
conseqüência da leitura correta da palavra. estruturais em aprendizagem e, portanto, exami
Mas outro de nossos problemas seria estru naremos os dois tipos de pesquisa. Em ambos os
tural, porque ainda seria importante saber quais casos, será útil descrever as situações em termos
figuras deveriam acompanhar quais palavras e a de antecedentes, ou as circunstâncias que esta
ordem em que os diferentes materiais de leitura belecem a ocasião para o comportamento, o com
deveriam ser apresentados. Por melhor que seja portamento que ocorre nessas circunstâncias e
a instrução informatizada para manejar as rela as conseqüências do comportamento (esses três
26 A . C harles C atania
ca e mais à descrição apropriada das descober Imagine um pombo em uma câmara experi
tas. Geralmente será mais útil descrever o que mental. Em uma das paredes há uma abertura
um organismo aprendeu ou lembrou do que ten para um comedouro, no qual pode-se colocar o
tar explicar sua aprendizagem ou sua memória. alimento. Acima da abertura do comedouro, há
um disco transparente embutido na parede que
pode ser iluminado por trás. O pombo está sen
do treinado para bicar o disco (e obter alimento)
Seção B Antecedentes, Comportamento, sempre que estiver iluminado. Agora suponha
Conseqüências mos que o disco esteja iluminado, que o pombo
esteja sem comer por algum tempo e que sua bi
Voltemos agora ao comportamento como cada no disco produza, imediatamente, uma pe
objeto de estudo. Estudar a aprendizagem é es quena quantidade de alimento. Nessa situação,
tudar como o comportamento pode ser modifi se a alternativa de não bicar nunca for seguida
cado; então devemos considerar primeiro o que por comida, será muito diferente se a mesma al
é comportamento, como ele pode ser investiga ternativa for seguida por uma quantidade de co
do e que vocabulário pode descrevê-lo melhor. mida muito maior, mas que só é apresentada de
O comportamento não é mais fácil de definir do pois de um certo tempo (com atraso). Em cada
que a aprendizagem. Podemos dizer, superficial caso, uma resposta, como bicar o disco, é segui
mente, que comportamento é qualquer coisa que da por um estímulo, por um alimento. Mas os
um organismo faça, mas essa definição seria contextos são muito diferentes. Esperaríamos que
muito abrangente. Deveríamos incluir a respira o pombo bicasse no disco no primeiro caso, mas
ção ou o metabolismo juntamente com os movi não no segundo? Se o pombo não bica, pode
mentos musculares e as secreções glandulares? mos ficar tentados a dizer que ele demonstra
Os comportamentos são descritos com verbos: as autocontrole, rejeitando a pequena quantidade de
pessoas andam, falam, pensam, fazem coisas. Mas alimento imediato pela quantidade maior que
também fazemos distinção entre ações ativas e pas recebe mais tarde. Esse tipo de situação será dis
sivas. Embora possamos dizer que alguém respi cutida mais detalhadamente no Capítulo 11. Por
ra, não diríamos que alguém “bate o coração”. As ora, o ponto importante é que devemos conside
pessoas sangram quando se cortam, mas não fala rar não apenas os detalhes dos eventos momen
mos de seu sangramento como comportamento. to a momento, mas também o contexto em que
Vamos tentar resolver esse problema. Nosso eles ocorrem, ao longo de extensos períodos de
objetivo é examinar algumas propriedades do tempo.
comportamento. Embora os fenômenos do com Examinemos melhor a relação entre compor
portamento, às vezes, compartilhem nomes em tamento e ambiente, observando um bebê huma
comum, eles são variados, de modo que pode no. Poderíamos começar perguntando o que o
ser melhor considerar alguns exemplos do que bebê sente, mas isso traria muitas complicações.
tentar elaborar definições. Podemos lidar com O bebê ainda não fala e não poderia nos dizer.
exemplos específicos sem grandes riscos de mal Mesmo que fosse uma criança mais velha, que
entendidos. Quando observamos um organismo, pudesse nos contar o que sente, teríamos que nos
vemos propriedades de seu ambiente e proprie preocupar sobre como a criança aprendeu as pa
dades de seu comportamento. Essas proprieda lavras apropriadas e se elas significam, para nós
des são chamadas de estímulos e respostas, mas a mesma coisa que significam para quem ensi
nem o estímulo nem a resposta têm interesses nou a criança. Quando tratarmos da linguagem,
por si só. Uma análise experimental determina no Capítulo 14, vamos examinar o papel que ela
que existem alguns tipos de relações entre os desempenha em moldar nosso conhecimento e o
estímulos e as respostas e como surgem essas dos outros, mas isso não vai nos ajudar.
relações. Ela deve considerar também contextos Sabemos que o bebê é ativo, aprendendo do
mais amplos, as situações nas quais essas relações ambiente e interagindo com ele. Mas como des
entre os estímulos e as respostas estão inseridas. cobrirmos o que está acontecendo? Podemos co
28 A . C harles C atania
pio, é tanto um estímulo como uma conseqüên sença elas ocorrem. Levando em conta tais re
cia, mas o alimento apresentado, independente servas, consideremos agora algumas outras pro
mente do comportamento, é somente um estímu priedades dos estímulos e das respostas.
lo; o choque evitado por uma resposta é um estí Um estímulo é um evento ambiental, mas tais
mulo, mas a conseqüência da resposta é a au eventos têm graus variados de complexidade. No
sência do choque, o que não é um estímulo. exemplo em que o choro do bebê produzia a aten
No que diz respeito a estímulo e resposta, a ção da mãe, consideramos a mãe como um estí
relação entre os usos técnico e coloquial não é mulo. O ambiente do bebê certamente é diferen
tão simples. Os estímulos são eventos no mundo te, quando sua mãe está presente e quando ela
e as respostas são instâncias do comportamento. está ausente. Porém, que tipo de estímulo é a
O termo estímulo é freqüentemente restrito aos mãe? Não sabemos que aspectos de sua aparên
eventos físicos específicos, tais como luzes, sons cia, de sua voz ou de seu toque são importantes
ou toques. Mas os organismos podem responder para a criança, nos primórdios de sua vida. Po
a características variadas do ambiente, incluin demos especular que o bebê não reagiria à mãe
do as relações (p. ex., à esquerda de, acima de), da maneira usual se ela se aproximasse dele usan
o comportamento complexo (p. ex., expressões do uma máscara cirúrgica, mas não poderíamos
faciais, tons de voz), as propriedades funcionais estar certos, a menos que fizéssemos o experi
(p. ex., comestível, confortável) e assim por di mento. A despeito de nossa ignorância em rela
ante (cf. Gibson, 1979). Freqüentemente tais ca ção a essas questões, não temos dúvida de que a
racterísticas ambientais serão tratadas como es mãe é uma parte importante do ambiente do bebê
tímulos, mesmo que não sejamos capazes de es e podemos ainda considerar útil falar dos efeitos
pecificar as dimensões físicas que as caracteri que a mãe tem, à medida que entra e sai do mun
zam. do do bebê.
A linha entre os estímulos e as respostas é Esse exemplo ilustra, novamente, os diferen
raramente ambígua. Ainda assim, às vezes os ca tes problemas de estrutura e de função. Quando
sos especiais complicam nossas definições. O tentamos analisar que características visuais, au
que dizer, por exemplo, dos estímulos que se ori ditivas e táteis da mãe são importantes para o
ginam no organismo? Consideremos a diferen bebê, estamos lidando com a estrutura deste es
ça entre um ruído intenso e o incômodo de uma tímulo complexo, a mãe. Poderíamos nos per
dor de dente (a dor de dente pode ser vista como guntar como o bebê aprende a responder a um
uma ocasião para ir ao dentista). Eles diferem indivíduo particular como a mãe, apesar das mu
no sentido de que o ruído é público, e a dor é danças em seu vestuário ou penteado, em sua
privada; em outras palavras, o ruído pode ser expressão facial ou em sua postura. Se, por ou
ouvido por mais de uma pessoa, enquanto a dor tro lado, nos concentrarmos em como a mãe in
de dentes pode ser sentida apenas pela pessoa que terage com as respostas do bebê, estaremos pre
tem o dente afetado. Isso seria um problema se ocupados com o significado funcional da mãe
insistíssemos em que todos os estímulos tivessem no ambiente da criança. Se ela está chorando,
que estar fora do organismo, mas se existissem re por exemplo, pode não ser relevante se ela reco
ceptores apropriados, não teríamos razão para ex nhece a mãe por sua face, pelos cabelos ou pela
cluir, como estímulos, partes importantes do mun voz, contanto que sua presença faça alguma di
do que estariam dentro da pele do organismo. ferença; seria suficiente notar que quando a mãe
Quanto ao termo resposta, o uso coloquial se aproxima da criança, o choro pára.
freqüentemente implica que a resposta seja uma Mais adiante, falaremos em estímulos ainda
“resposta a algo” (tipicamente um estímulo). mais simples: luzes, sons, alimento na boca. Mas,
Contudo, o termo não funcionará dessa forma mesmo com os estímulos mais simples, teremos
aqui, porque uma explicação do que causa as que distinguir entre os problemas estruturais,
respostas inclui, tipicamente, outros fatores (p. como ao analisar as propriedades dos estímulos,
ex., suas conseqüências passadas, características e os problemas funcionais, ao analisar as intera
do organismo) além dos estímulos em cuja pre ções entre os estímulos e as respostas.
A pr en d iza g em 2 9
E quanto às respostas? Como devemos lidar rado em pé, nosso julgamento de que ele está se
com elas? Ao descrevê-las, encontramos pelo comportando provém, parcialmente, de nosso co
menos duas dificuldades. A primeira é que o nhecimento de que ele cairia se estivesse incons
comportamento não se repete exatamente da ciente ou morto. Poderíamos argumentar que o
mesma forma de uma ocorrência para outra. Se adulto em pé está, de fato, apresentando movi
a criança agarra um objeto em duas ocasiões di mentos pequenos, imperceptíveis, mas, mesmo
ferentes, o agarrar não será o mesmo a cada vez. que ocorram ligeiros ajustes posturais da pessoa
A diferença pode ser pequena, na força do agar que está de pé, não precisamos observá-los para
rar, por exemplo, ou na posição exata dos dedos. concluir que a pessoa está se comportando. A
Mas, se houver qualquer diferença que seja, de característica crítica do agarrar da criança e do
vemos nos perguntar se deveríamos considerar ficar de pé do adulto é, simplesmente, que essas
as duas ocorrências do agarrar como duas ins respostas têm um efeito; nenhum dos dois cai.
tâncias da mesma resposta ou como duas res Assim, nem todos os movimentos precisam
postas diferentes. Devemos falar não de respos ser instâncias do comportamento, e nem todas
tas individuais, mas de classes de respostas com as instâncias do comportamento precisam ser mo
propriedades em comum. vimentos. Fazemos muitas coisas que não en
A segunda dificuldade é que as respostas, às volvem qualquer movimento óbvio. Quando
vezes, são adequadamente descritas em termos ouvimos música, por exemplo, podemos mudar
de movimentos, mas, outras vezes, a descrição nossa atenção de um instrumento para outro. A
deve incluir o ambiente em que as respostas ocor mudança de atenção é comportamento, mesmo
rem. Suponhamos que desejemos comparar, por que não seja medida como um movimento. Mui
exemplo, as instâncias em que o bebê sustenta tos aspectos do pensar e do imaginar não envol
um objeto com a mão fechada. Em termos dos vem qualquer movimento, mas, como as coisas
músculos que se movem, segurar ou agarrar um que fazemos, elas são variedades de comporta
objeto com a mão direita tem mais em comum mento.
do que segurar um objeto com a mão direita e Quer o comportamento envolva ou não os
com a mão esquerda. Contudo, às vezes, pode movimentos, ele tipicamente tem conseqüências,
ser mais importante falar de segurar um objeto, e uma das conseqüências mais relevantes do
não importa com que' mão, do que falar do mo comportamento é que ele cria oportunidades para
vimento de uma mão em particular. outros comportamentos. Se uma criança recebe
Uma análise do comportamento deve fazer um biscoito, por exemplo, o biscoito lhe dá a
uma distinção entre os movimentos, respostas de oportunidade de comer. A importância do bis
finidas por sua forma ou pela musculatura em coito é baseada no comportamento de comer da
pregada, e as ações, respostas definidas por suas criança, seu comportamento com relação àquele
relações com o ambiente. Para nossos propósi estímulo. Como teremos reiteradas oportunida
tos, vamos verificar que ações são mais impor des de ver, não podemos caracterizar os estímu
tantes. Consideremos com que freqüência fala los independentemente do comportamento do
mos em fazer coisas, ir a lugares ou manipular organismo, nem podemos caracterizar as respos
objetos, sem levar em conta os detalhes de como tas independentemente do ambiente do organis
ïssas ações são executadas. mo. •
Mesmo na ausência de movimento, podemos
:oncluir, às vezes, que ocorreu um comportamen
to. Por exemplo, normalmente um bebê agarra HIERARQUIAS COMPORTAMENTAIS
as dedos de um adulto tão fortemente que pode
ser levantado no ar. Uma vez levantado, o bebê Uma maneira de se classificar o comporta
pode não se mover enquanto segura pelo dedo e mento de um organismo é ordenar as respostas
linda assim, o simples fato de que ele não cai de acordo com as freqüências relativas com que
leva-nos a concluir que a resposta de agarrar con o organismo as realiza. Por exemplo, se damos a
tinua. Do mesmo modo, se vemos um adulto pa uma criança a oportunidade de comer, brincar
3 0 A . C ha rle s C atania
ou tomar banho, podemos verificar que a crian Em geral, é conveniente falar de estímulos,
ça brinca bastante, come de vez em quando, e em vez de oportunidades para responder. Assim,
dificilmente toma a iniciativa para tomar banho. para a criança do exemplo podemos descrever a
Brincar, como o comportamento mais provável, comida como um estímulo ou evento apetitivo e
vem primeiro na ordem, seguida pelo comer e, tomar banho como um evento aversivo, enquan
então, pelo tomar banho. Essa ordenação tem to os eventos que não são nem apetitivos nem
sido chamada de hierarquia de comportamento aversivos seriam categorizados como neutros.
(cf. a hierarquia de famílias de hábitos de Hull, Infelizmente, mesmo que sejamos capazes de
1943). Uma maneira equivalente de se descre empregar esses termos em situações específicas,
ver essa ordenação é a linguagem da preferên os estímulos em geral não podem ser agrupados
cia: poderíamos dizer que a criança prefere jo tão facilmente. Os contextos fazem muita dife
gar a comer e que prefere qualquer destes dois a rença. Não podemos simplesmente dividir o
tomar banho. ambiente em três classes de eventos, chamados
As hierarquias de comportamento são mutá apetitivos, neutros e aversivos. Pelo contrário,
veis. Se esperássemos até o momento da refei devemos avaliar cada estímulo em relação a ou
ção e déssemos a escolha entre comer e brincar, tras variáveis.
poderíamos descobrir que o comer tornou-se Com mudanças na hierarquia de comporta
mais provável do que o brincar ou, em outras mentos, surgem mudanças na importância dos
palavras, que o comer deslocou-se para o alto da estímulos. Consideremos, por exemplo, como a
hierarquia em relação ao brincar. Enquanto está comida pode mudar de apetitiva para aversiva
comendo, a criança não está brincando nem durante um jantar de feriado excessivamente lon
tomando banho, mas poderíamos verificar as go. Na banheira, por exemplo, se os pais mane
posições relativas dessas duas respostas, dan jarem a situação com cuidado, a criança pode
do à criança a escolha entre os brinquedos e a começar a tolerar os banhos e, eventualmente,
banheira. Talvez descobríssemos que esta cri vir a preferir os brinquedos na banheira do que
ança quase sempre prefere os brinquedos. os brinquedos em outros lugares. De qualquer
Assim podemos concluir que, agora, brincar modo, à medida que o comportamento da criança
com os brinquedos está acima do tomar ba muda, podemos dizer que a criança está aprenden
nho na hierarquia de comportamentos desta do alguma coisa sobre brinquedos e banheiras.
criança. Revimos, até aqui, algumas das proprie
Podemos mesmo verificar que a criança sem dades gerais dos estímulos e das respostas à
pre deixa a área de banho, mesmo quando não medida que eles entram nas relações entre os
há muito mais o que fazer, em outro lugar. Pode antecendentes, o comportamento e as conse
ser que a criança tenha tido uma má experiência qüências. Com esses preliminares como base,
ali, recentemente. Para qualquer tipo de compor estamos prontos para avançar para alguns ex
tamento, devemos considerar quando ele come perimentos e descobertas clássicas na Psico
ça e quando termina. logia da Aprendizagem.
A pr en d iza g em 3 1
Uma Taxonomia do Comportamento
34 A . C harles C atania
Köhler achava o termo insight (descoberta seu pescoço e, logo, uma intumescência aparece em
súbita) apropriado, devido ao aspecto súbito com sua base. A intumescência desloca-se para cima, cau
sando as deformações mais assustadoras e as voltas
que a solução do problema freqüentemente emer e contorções mais peculiares do pescoço. Subita
gia. Essa solução de problemas que parecia ba mente, ela abaixa a cabeça e regurgita um enorme
seada em insights levou a outras questões: se a monte de alimento meio digerido. Isto cai e um pe
aprendizagem tinha lugar gradual ou abrupta queno pedaço é agora pego e apresentado aos filho
mente, e se este tipo de resolução de problema tes. Eles redobram seus esforços e, logo, apoderam-
se do alimento, ao que ela lhes apresenta um novo
poderia ser explicitamente ensinado. Debates bocado. Uma vez ou outra, os filhotes bicam o ali
acerca do quanto os primatas não-humanos po mento no chão, mas, mais freqüentemente, o alvo é
dem aprender continuam até os dias de hoje. Mas o bico do progenitor e, embora sua pontaria não seja
a observação por si só raramente identifica as sempre certeira, raramente, eles precisam mais que
fontes do comportamento e, assim, raramente re três ou quatro tentativas até que acertem (Tinber
gen, 1960, p. 178).
solve tais questões.
A rigor, Köhler fez mais do que simplesmente Por enquanto, temos aqui apenas algumas
observar o comportamento. Ele arranjou os am observações do comportamento dos filhotes. Mas
bientes dentro dos quais suas observações eram elas envolvem os efeitos dos estímulos e, por
feitas. Observação sem intervenção é algo difí tanto, provocam algumas questões. Quais são,
cil de se conseguir. Para ser bem-sucedido na exatamente, as “características críticas” desses
observação dos organismos na situação natural, estímulos especiais apresentados pela gaivota-
é preciso saber os possíveis efeitos de uma pre mãe? Algumas são mais importantes que outras?
sença humana sobre seu comportamento. Mes Seriam elas as mais efetivas?
mo levar um organismo para o cativeiro é, em si Tinbergen dispôs-se a responder a essas ques
mesmo, uma intervenção. Para estudar tais efei tões preparando estímulos que se assemelhassem,
tos, deve-se apresentar os estímulos apropriados. de várias formas, à gaivota-mãe. Então, ele me
Em qualquer estudo do comportamento, então, diu o bicar quando esses estímulos eram apre
apresentar estímulos é praticamente inevitável. sentados a filhotes de gaivota arenque recém-
saídos da casca do ovo. A gaivota arenque tem
uma cabeça branca e um bico amarelo com uma
mancha vermelha próxima da extremidade. Um
Seção B A Apresentação de Estímulos
bico com uma mancha negra, azul ou branca
gerou menos bicadas do que um com uma man
Kõhler, de fato, apresentou estímulos quan cha vermelha, mas um bico com uma mancha de
do programou o ambiente para os chimpanzés qualquer cor produziu mais bicadas do que um
que observou. Então, vamos considerar um con bico sem qualquer mancha. Comparadas à man
junto de exemplos em que o papel dos estímulos cha vermelha, as cores do bico e da cabeça
é examinado mais diretamente. A seguinte pas foram relativamente irrelevantes na geração
sagem, pelo etólogo Niko Tinbergen, descreve de bicadas. De fato, desde que o modelo ti
o primeiro episódio de alimentação do filhote da vesse um bico com uma mancha vermelha, a
gaivota arenque: presença ou a ausência de uma cabeça fazia
pouca diferença.
As vezes o pássaro adulto levanta-se e olha para o
Tinbergen variou também a forma do bico,
ninho abaixo e, então, podemos ver o primeiro com
portamento de solicitação dos filhotes. Eles não per como ilustrado na Figura 2.1. Ao lado de cada
dem tempo contemplando ou estudando o progeni estímulo, o bicar é mostrado como uma porcen
tor, cuja cabeça eles vêem pela primeira vez, mas tagem do número de bicadas gerado pela forma
começam a bicar imediatamente na ponta do bico normal do bico, o primeiro, em cima. A mancha
dele, com arremessos relativamente certeiros, repe
vermelha e outras diferenças de cor foram eli
tidos e rápidos de seus pequenos bicos. Eles nor
malmente abrem as asas e soltam uns fracos piados. minadas, de modo que as mudanças no bicar po
A velha ave não pode resistir a isso e, se os filhotes deriam ser atribuídas apenas a mudanças na for
persistirem, ela os alimentará. Primeiro ela estica ma. A maior parte dos modelos produziu menos
36 A . C harles C atania
tural da gaivota risonha, é mais provável que uma Quase no final do século XIX, Thorndike des
bicada certeira seja seguida do regurgitar de co crevia seus procedimentos do seguinte modo:
mida pelo progenitor do que uma não-certeira.
As bicadas precisas podem aumentar, em rela Escolhi, como meu método geral, um que, simples
ção às bicadas fora do alvo, devido às diferen como é, possui várias outras vantagens notáveis,
além daquelas que acompanham um experimento de
ças em suas conseqüências. As observações de qualquer tipo. O método consistiu meramente em
Hailman são consistentes com essa idéia: colocar animais, quando famintos, em espaços fe
chados, dos quais eles poderiam escapar por meio
Se um filhote inexperiente está inicialmente próxi de algum ato simples, como puxar um laço de cor
mo demais do alvo, o impacto de sua bicada contra da, pressionar uma barra ou pisar sobre uma plata
o bico ou modelo é tão grande que o filhote é joga forma... O animal era colocado no espaço fechado,
do para trás, cerca de uma polegada (2,4cm). Se o o alimento era deixado à vista, do lado de fora, e
filhote começa longe demais do alvo, o ímpeto da suas ações eram observadas. Além de resgistrar seu
bicada perde o alvo, e o filhote cai para a frente, comportamento geral, atenção especial era diri
cerca de duas polegadas. Os filhotes mais velhos gida a como ele fazia para desempenhar o ato
raramente cometem tais erros grosseiros, o que su necessário (caso ele fosse bem-sucedido), e fazia-
gere que a experiência de bicar de muito longe e de se o registro do tempo que ele levava dentro da cai
muito perto ajudou o filhote a aprender a ajustar sua xa, até desempenhar a puxada, a unhada ou a mor
distância (Hailman, 1969, p. 100). dida bem-sucedida... Se, por outro lado, após um
certo tempo, o animal não tivesse sido bem-sucedi
Para estudar tais casos, não é suficiente a sim do, ele era retirado, mas não alimentado (Thorndi
ke, 1898, pp. 5-6).
ples apresentação de estímulos. Uma operação
mais complexa deve ser programada: os estímu
Uma das caixas-problema de Thorndike é
los devem ser apresentados como conseqüências
ilustrada na Figura 2.2. Em tais aparatos, Thorn
do comportamento do organismo.
dike estudou gatos, cachorros e pintinhos. Ele
apresentou a seguinte descrição como típica do
comportamento da maioria dos gatos:
Seção C Operações Conseqüenciais
Quando colocado dentro da caixa, o gato mostrava
sinais evidentes de desconforto e de um impulso a
Novamente recorremos a um novo conjunto
de exemplos, desta vez baseados na pesquisa
sobre inteligência animal, desenvolvida pelo psi
cólogo norte-americano Edward L. Thorndike.
A diferença crítica entre a pesquisa de Thorndi
ke e a de Köhler é que Thorndike observou, sis
tematicamente, certas mudanças no comporta
mento, ao longo de muitas repetições do com
portamento de um organismo em uma dada si
tuação, em vez de restringir sua atenção a ins
tâncias unitárias de resolução de um problema.
Thorndike notou, tipicamente, as mudanças gra
duais no comportamento, ao longo de muitas re
FIGURA 2.2 Na maioria das caixas que Thomdike
petições, ao contrário das mudanças súbitas ou (1898) empregou, o animal tinha um única maneira de
abruptas tipicamente relatadas por Köhler, tal abrir a porta. Na caixa mostrada, são ilustrados três
vez porque os problemas que ele estudou não métodos diferentes para abrir a porta: um pedal dentro
levassem a soluções súbitas ou baseadas em da caixa (A); um arame ou corrente que podia ser al
nsights. O mais importante é que os experi cançado de dentro da caixa (B); e duas tramelas, que
podiam ser alcançadas de dentro para destrancar a
mentos de Thorndike demonstraram o quanto porta (C). A porta (D) geralmente tinha um contrapeso,
o responder geralmente depende de suas con de modo que ela se abria por si mesma quando o ani
seqüências passadas. mal executava a resposta apropriada.
38 A . C h a rle s C atania
estímulos podem ser combinados com apresen lo previamente neutro com algum estímulo incon
tações de estímulo ou com operações conseqüen- dicional definido. Além disso, não é suficiente que
haja superposição entre os dois estímulos; é tam
ciais. Retomaremos a eles mais tarde. Ambos bém igualmente necessário que o estímulo condici
demonstram as funções sinalizadoras de estímu onado comece a operar antes que o estímulo incon-
los, embora, como veremos, os dois tipos de sina dicionado entre em ação. Se essa ordem for inverti
lização possam ter propriedades muito diferentes. da, o estímulo incondicionado sendo aplicado pri
meiro e o estímulo neutro em seguida, o reflexo con
dicionado pode não ser estabelecido de modo al
gum. (Pavlov, 1927, pp. 26-27)
SINALIZAÇÃO DE APRESENTAÇÕES
DE ESTÍMULO Os experimentos de condicionamento de Pa
vlov demonstraram como uma operação sinali
Os estímulos que sinalizavam a apresentação zadora pode ser superposta à operação mais sim
de outros estímulos eram a base dos experimen ples de apresentação de estímulo.
tos sobre reflexos condicionais ou condiciona
dos, conduzidos pelo fisiólogo russo Ivan P.
Pavio v. Pavlov (1927) estudou como os estímu SINALIZAÇÃO DE CONSEQÜÊNCIAS
los adquiriam propriedades sinalizadoras, de
monstrando que respostas a estímulos como o Em vez de sinalizar a apresentação de estí
alimento, às vezes, eram produzidas por outros mulos, um estímulo pode sinalizar as ocasiões
estímulos que tinham precedido o alimento de em que as respostas terão conseqüências. A si
modo regular e previsível. Pavlov falava dos efei nalização de conseqüências desempenhou um
tos de alimento na boca de um cachorro em ter importante papel na história da Psicologia da
mos de reflexo alimentar (para Pavlov, os com Aprendizagem, bem antes que começasse a ser
ponentes de tal reflexo incluíam tanto a resposta estudada experimentalmente. Ela esteve envol
glandular de salivar, como as respostas motoras vida, por exemplo, na análise do caso de Clever
como mastigar e engolir). Ele se concentrou na Hans, um cavalo que parecia ter sido ensinado a
salivação, porque a tecnologia disponível torna resolver problemas aritméticos (Pfungst, 1911).
va o salivar mais fácil de medir do que as res O cavalo aparentemente resolvia, com suas pa
postas motoras. O duto de uma das glândulas sa tas, não apenas adição e multiplicação, mas tam
livares do cachorro era exposto, por meio de ci bém raiz quadrada.
rurgia, para fora de seu queixo e era conectado a
um sistema hidráulico que permitia contar as O visitante podia andar livremente e, se quisesse,
gotas de saliva. podia aproximar-se do cavalo e de seu mestre, um
Para um cachorro, o som de um metrônomo homem entre 60 e 70 anos de idade. Sua cabeça bran
ca era coberta por um chapéu preto de abas largas.
precedia consistentemente a apresentação de ali
A sua esquerda, o animal majestoso, um cavalo rus
mento. Pavlov apresentou a seguinte descrição so de trote, permanecia como um aluno dócil, ma
das condições necessárias para fazer um estímu nejado não por meio de chicote, mas por encoraja
lo funcionar como sinal: mento gentil e recompensas freqüentes com pão ou
cenouras... Nosso cavalo inteligente era certamente
incapaz de falar. Seu principal modo de expressão
Em várias ocasiões, esse animal tinha sido estimu
consistia em batidas com a pata dianteira direita.
lado pelo som do metrônomo, seguido imediatamen
(Pfungst, 1911, pp.18-19)
te pelo alimento - isto é, um estímulo que, em si
mesmo, era neutro, tinha sido superposto à ação do
reflexo alimentar inato. Observamos que, após vá Clever Hans dava suas respostas pelo núme
rias repetições da estimulação combinada, os sons ro de vezes que batia com a pata. Seu desempe
do metrônomo tinham adquirido a propriedade de nho foi investigado por Oskar Pfungst, que des
estimular a secreção salivar e de evocar as reações cobriu que o cavalo acertava com precisão ape
motoras características do reflexo alimentar... As
sim, o requisito primeiro e mais essencial para a for
nas na presença do treinador. Além disso, Cle
mação de um novo reflexo condicionado reside na ver Hans somente sabia as respostas se seu mes
coincidência temporal da ação de qualquer estímu tre também as soubesse. Assim, Pfungst mudou
40 A . C harles C atania
Nesse exemplo, a luz sinaliza as conseqüên nem sempre é reforçado, pois o lápis nem sempre
cias do pressionar a barra: a pressão à barra é está ali. Em virtude da estimulação visual do lápis
(SD), faço o movimento requerido apenas quando
reforçada na presença, mas não na ausência de ele será reforçado. O papel desempenhado pelo es
luz. A luz é um estímulo discriminativo, e o rato tímulo visual é mostrado, considerando-se o mes
passa a pressionar a barra mais freqüentemente mo caso em um quarto escuro. Em uma ocasião, es
quando a luz está acesa do que quando está apa tendo a mão e encontro um lápis, em outra estendo
gada. À medida que o rato começa a responder a mão e não o encontro... Nem no claro nem no es
curo o lápis elicia minha resposta (como um cho
diferentemente na presença e na ausência da luz, que elicia flexão), mas, no claro, ele estabelece a
seu comportamento entra sob controle da luz ocasião em que a resposta será reforçada. (Skinner,
como um estímulo discriminativo; pode-se di 1938, p. 178)
zer, também, que a luz ocasiona o comportamen
to. O desenvolvimento desse responder diferen A relação de três termos, estímulo discrimi-
cial tem sido denominado aprendizagem discri nativo-resposta-conseqüência, será um tema re
minativa. corrente. Cada um dos termos é crítico. Sua com
As relações entre um estímulo discriminati binação distingue este caso de outras relações
vo e as conseqüências do responder são elabora comportamentais mais simples. Na situação pa-
das por Skinner na seguinte passagem (o termo vloviana, por exemplo, em que um estímulo é
operante refere-se a uma classe de respostas que sinalizado, o comportamento do organismo não
têm certas conseqüências particulares, e o termo tem qualquer efeito sobre a seqüência de even
reforço refere-se a essas conseqüências): tos; nenhuma conseqüência é programada para
as respostas.
... o operante deve operar sobre a natureza para pro Consideremos novamente os exemplos do re
duzir seu reforço. Embora a resposta seja livre para lâmpago que precede o trovão e das luzes do se
ocorrer em um grande número de situações estimu
ladoras, ela será eficaz para produzir o reforço ape máforo. Nossas piscadas ou o susto com o cla
nas em uma pequena parcela delas. A situação fa rão do relâmpago não impedirão o estampido
vorável geralmente é marcada de algum modo e o subseqüente do trovão. Mas, se o semáforo está
organismo... passa a responder sempre que estiver vermelho quando nos aproximamos do cruza
presente um estímulo que esteve presente em uma
mento, freiar é ocasionado por esse estímulo ape
situação prévia de reforço, e a não responder, se este
não for o caso. O estímulo precedente não elicia a nas porque aprendemos as conseqüências poten
resposta, ele meramente estabelece a ocasião em que ciais de fazer ou não fazer isso. Apenas o segun
a resposta será reforçada... Portanto, três termos de do destes dois exemplos envolve todos os ter
vem ser considerados: um estímulo discriminativo mos da contingência de três termos de Skinner.
prévio (SD), a resposta (R°) e o estímulo reforçador Uma diferença terminológica importante acom
(S1). A relação entre eles pode ser formulada como
segue: apenas em presença de SD é que uma R ° é panha estas distinções, (i) quando um estímulo é
seguida de S*. (Skinner, 1938, p. 178) a causa fundamental de uma resposta, dizemos
que o estímulo elicia a resposta ou que a res
Skinner explorou experimentalmente essa re posta é eliciada; mas, (ii) quando uma resposta
lação de três termos com as luzes como estímu ocorre em presença de um estímulo, porque o
los discriminativos, as pressões à barra por ratos estímulo sinaliza alguma conseqüência do res
como respostas e as pelotas de alimento como ponder, dizemos que o estímulo ocasiona a res
conseqüências reforçadoras, mas seu exemplo se posta e que a resposta é emitida.
guinte, de alcançar e tocar objetos no ambiente Os primeiros experimentos com animais fre
visual, ilustra a ampla gama de situações a que o qüentemente estavam interessados não tanto no
conceito se aplica. estudo da natureza da aprendizagem de discri
minação, mas nas capacidades sensoriais dos
Um exemplo conveniente é o comportamento ele
organismos. A visão de roedores, por exemplo,
mentar de fazer contato com partes específicas do
ambiente estimulante. Certo movimento de meu bra foi estudada pelo arranjo de duas trilhas, uma
ço (R°) é reforçado pela estimulação tátil de um lá das quais levava ao alimento (Yerkes & Watson,
pis em minha mesa de trabalho (S1). O movimento 1911). No ponto em que o rato teria que esco-
42 A . C harles C atania
tentativa quatro, saltar rumo à direita era tão efi mo. Quando esse intercâmbio é perturbado - quan
caz em levar ao alimento quanto saltar rumo às do o organismo é privado da oportunidade de beber
—toma-se evidente que o beber teria maior probabi
linhas verticais. lidade de ocorrer na primeira oportunidade. Em sen
O tipo de discriminação em que um único tido evolucionário, isso “explica” por que a priva
estímulo está presente ou ausente, como no ção fortalece todos os comportamentos condiciona
exemplo de pressionar a barra, é denominado dos e incondicionados relacionados com a ingestão
discriminação sucessiva ou vai-não-vai. Aquela em de água. (Skinner, 1953, pp. 141-142)
que dois ou mais estímulos estão presentes ao
Skinner falou desses fenômenos em termos
mesmo tempo e em que cada um deles está corre
de impulsos:
lacionado a uma resposta diferente, como no exem
plo da plataforma de saltos, é denominada discri O termo é simplesmente uma maneira conveniente
minação simultânea. Ambas ilustram operações si de se referir aos efeitos da privação e da saciação e
nalizadoras superpostas às conseqüências do res de outras operações que alteram a probabilidade do
ponder. A comparação entre discriminações suces comportamento mais ou menos da mesma maneira.
Ele é conveniente porque nos permite lidar com
siva e simultânea mostra que essas operações ocor muitos casos de uma vez. Há muitas maneiras de se
rem em graus variados de complexidade. mudar a probabilidade de que um organismo venha
a comer; ao mesmo tempo, um único tipo de priva
ção fortalece muitos tipos de comportamento. (Skin
ner, 1953, p. 144)
Seção E Estabelecendo a Efetividade das
Conseqüências O comportamento decorrente de operações
estabelecedoras é chamado de evocado. Skinner,
Algumas conseqüências do comportamento no entanto, apontou que os efeitos de operações
são mais importantes do que outras e sua efeti estabelecedoras não devem ser igualados aos de
vidade pode variar ao longo do tempo. Por exem estímulos:
plo, a água pode ser um reforçador efetivo se Uma crença comum é a de que a privação afeta o
alguém estiver privado de água por algum tem organismo pela criação de um estímulo. O exemplo
po, mas terá menor probabilidade de funcionar clássico são as pontadas de fome. Quando um orga
como reforçador se uma grande quantidade de nismo fica sem comida por um tempo suficiente, as
água tiver sido consumida. As coisas que podem contrações do estômago estimulam-no de modo ca
racterístico. Geralmente essa estimulação é identi
ser feitas para mudar a efetividade dos reforça-
ficada com o impulso da fome. Mas tal estimulação
dores são chamadas de operações estabelecedo- não está estreitamente relacionada com a probabili
ras. A privação e a saciação são dois exemplos, dade do comer. As pontadas de fome são caracterís
mas não são as únicas possibilidades. O exercí ticas apenas de uma parcela pequena de toda a gama
cio vigoroso no calor e em clima seco, por exem ao longo da qual essa probabilidade varia continua
mente. Geralmente fazemos nossas refeições sem
plo, ou a boca cheia de uma comida bem salga
atingir a condição em que as dores são percebidas e
da podem ter o mesmo efeito que um período de continuamos a comer por muito tempo depois que
privação de água. As operações estabelecedoras as primeiras garfadas interromperam quaisquer do
mudam a efetividade das conseqüências, mudan res que pudessem ter ocorrido. (Skinner, 1953,
do a probabilidade do comportamento, como ilus p. 144-145)
trado por B. F. Skinner na seguinte passagem:
Como o exemplo de Skinner indica, deve-se
... a probabilidade de beber toma-se muito alta sob distinguir os efeitos discriminativos dos estímu
severa privação de água e muito baixa sob saciação los dos efeitos de operações estabelecedoras.
excessiva... O significado biológico da mudança na Considere um outro exemplo (Michael, 1982).
probabilidade é óbvio. A água está sendo constan Uma pessoa está propensa a tomar um refrige
temente perdida pela excreção e pela evaporação, e
rante e, ao localizar uma máquina de venda au
uma quantidade igual deve ser ingerida para com
pensar essa perda. Sob circunstâncias normais, um tomática, procura na bolsa por uma moeda. A
organismo bebe intermitentemente e mantém um máquina é um estímulo discriminativo, porque
estado razoavelmente constante e supostamente óti estabelece a ocasião na qual é possível obter o
A pr en d iza g em 4 3
refrigerante. Mas com relação à moeda, a má bientais, os estímulos, e as ações do organismo,
quina é um evento estabelecedor: ela torna a as respostas. Podemos examinar essas relações
moeda importante. Ela não é um estímulo dis analisando como as manipulações do ambiente
criminativo para olhar na carteira ou no porta- produzem mudanças no responder. Um primei
moedas e encontrar uma moeda, porque a moe ro passo crítico é a observação do comportamen
da seria encontrada ali sempre que fosse procu to, mas não basta simplesmente observar. Para
rada, quer a pessoa tivesse ou não visto a máqui compreender o comportamento devemos inter
na de refrigerante. Em outras palavras, a máqui vir, mudando o ambiente. Podemos descrever as
na de refrigerante não é um estímulo em cuja mudanças ambientais em termos de classes de
presença alguém tem maior probabilidade de operações experimentais: operações deapresen-
encontrar moeda na carteira; mas ela toma a tação de estímulo, operações conseqüenciais e
moeda uma conseqüência reforçadora significa operações sinalizadoras ou de controle de estí
tiva para checar a carteira. mulo e operações estabelecedoras. Ao longo
Em contraste com a linguagem de controle deste livro, retomaremos freqüentemente a es
de estímulos, em que se diz que as mudanças sas operações e elas ajudar-nos-ão a organizar,
nos estímulos discriminativos ocasionam respos especialmente, o tópico sobre aprendizagem sem
tas, na linguagem das operações estabelecedo palavras da Parte III. A Tabela 2.1 sumariza as
ras diz-se que o responder evocado por tais ope operações.
rações ocorre em um ambiente relativamente Exceto pela observação, a apresentação de
constante. Por exemplo, se há maior probabili estímulos é a operação mais simples. Quando
dade de que alguém abra a geladeira muito tem apresentamos estímulos, podemos observar as
po depois das refeições, é o comportamento da respostas produzidas. Um toque na bochecha de
pessoa que muda de tempos em tempos e não o um bebê recém-nascido, por exemplo, pode fazê-
refrigerador. Nesse caso, diz-se que abrir a gela lo voltar-se e começar a sugar. As apresentações
deira foi evocado pela operação estabelecedora, de estímulo são relevantes para a aprendizagem,
privação de alimento. Mas ainda assim tal com porque as respostas produzidas pelos estímulos
portamento é ocasionado pelo refrigerador, por podem variar, dependendo das condições sob as
que abri-lo pode ocorrer em sua presença, mas quais os estímulos são apresentados.
não em sua ausência. E quando queremos falar Às vezes, o organismo muda seu ambiente: o
desse comportamento sem mencionar as opera comportamento pode ter conseqüências. Progra
ções estabelecedoras nem os estímulos discrimi mar o ambiente de modo que ele seja afetado
nativos, é apropriado falar que o comportamen pelas respostas de um organismo é uma opera
to foi emitido. Em outras palavras, as operações ção conseqüencial. As conseqüências podem in
estabelecedoras evocam, os estímulos discrimi cluir a apresentação, a remoção ou a prevenção
nativos ocasionam e as respostas que eles evo de estímulos, ou eventos mais complexos, como
cam e/ou ocasionam são emitidas. mudanças nas conseqüências de outras respos
Nosso tratamento sobre as operações estabe tas. Por exemplo, uma criança pode aprender a
lecedoras foi rápido, porque, em si mesmas, elas pedir um copo de leite ou ela pode descobrir que
não fornecem exemplos de aprendizagem. Como o que tem na xícara de café do pai é algo geral
teremos oportunidade de verificar, no entanto, mente quente e amargo, ou ela pode ainda apren
elas fornecem os contextos nos quais normal der que aceitar um copo de suco só é permitido
mente ocorre a aprendizagem e, portanto, é difí depois que ela tiver dito obrigada. Algumas res
cil estudar a aprendizagem sem elas. postas que têm conseqüências podem ocorrer
mais freqüentemente e outras, menos freqüente
mente. Se um organismo responde mais freqüen
temente porque seu comportamento mudou o
Seção F Resumo ambiente, dizemos que o comportamento foi re
compensado ou reforçado', se um organismo res
Como vimos, o estudo do comportamento ponde menos freqüentemente pela mesma razão,
está interessado nas relações entre os eventos am dizemos que a resposta foi suprimida ou punida.
44 A. C h a r l e s C a ta n i a
TABELA 2-1 Operações Comportamentais Básicas
46 A . C ha rle s C atania
PARTE II
COMPORTAMENTO
SEM APRENDIZAGEM
Evolução e Comportamento
3
A. A Natureza da Evolução gundo. Se parar para dormir, você vai levar muito
Receitas e Fotocópias mais tempo. (A estimativa de um por segundo é
Variação e Seleção muito generosa; é fácil contar rápido quando os
Tipos de Seleção números são pequenos, mas os números maio
Resumo res, como 374.516.982, certamente vão tornar a
contagem mais lenta, principalmente, se você es
B. Filogenia, Ontogenia e Comportamento
tiver preocupado em não perder a conta).
Durante a maior parte desse período, existiu
vida na Terra (ver Gould, 1989, para uma expla
As palavras evolução e revolução derivam do latim nação detalhada). Evidências químicas e fósseis
volvere, to roll (rolar); a diferença é que evolução
implica unrolling (desenrolar), ou rolling out (rolar
indicam que ela começou, aproximadamente, no
para fora), e revolução implica rolling over (rolar primeiro bilhão de anos, e, ao longo da maior
sobre) ou tuming around (voltar ao redor de si). A parte dos três bilhões de anos seguintes, a vida
seleção pode estar relacionada a legere, em latim, consistiu de organismos unicelulares. Os orga
to gather (conseguir) ou to choose (escolher) (cf. a nismos multicelulares apareceram há apenas 600
etimologia de logos, no Capítulo 14). O prefixo se-
milhões de anos atrás, mais ou menos no perío
acrescenta a implicação de weeding outfrom a lar
ge tiumber (eliminação ou exclusão de um grande do geológico chamado de Cambriano. Durante
número), em contraste com bringing together (agru esse período ocorreu uma explosão na diversi
par ou juntar), implicado pelo con-, o prefixo radi dade de vida multicelular que foi seguida por uma
cal para collection (coleção). ampla exterminação; os sobreviventes consisti
As palavras filogenia, a história evolutiva, e on
togenia, a história de vida de um organismo indivi
ram nos principais grupos a partir dos quais as
dual, partilham o radical grego gen-, no sentido de espécies contemporâneas evoluiram. Um desses
kind (tipo) ou sort (espécie de) (cf. etimologia de grupos era o de vertebrados. A evolução de an
generalização, no Capítulo 8). Phylo- tem uma raiz fíbios para répteis incluiu muitos eventos signi
grega que implica uma tribo ou clã ou uma linhagem ficativos, como a colonização da terra. Os di
racial. Onto- tem um radical que implica being (ser)
ou reality (realidade). Em combinação com gen-,
nossauros foram uma parte espetacular da histó
ambos implicam origem: a origem de um filo ou uma ria, mas eles desapareceram há mais ou menos
população, ou a origem de um ser vivo. 65 milhões de anos. Seu desaparecimento abriu
espaço para a evolução dos mamíferos, e, pro
Nosso planeta tem aproximadamente 4,6 bi vavelmente, há 4 milhões de anos haviam evo
lhões de anos. E um tempo muito longo. Se você luído os primatas que andam de pé. Posterior
tentar contar até um milhão, vai levar mais de mente, nós, humanos, surgimos desta linha, há
trinta anos para terminar, mesmo que mantenha pouco mais de 100.000 anos. Todos somos apa
um ritmo ininterrupto de uma contagem por se rentados e todos descendemos de uma linha
muito longa de sobreviventes. A evolução con pessoas sabiam como cultivar, seletivamente,
tinua em progresso e é rápida o bastante para ser plantas ou rebanhos para conseguir maior resis
observada no período de vida de uma pessoa tência ou para manter uma ou outra característi
(Weiner, 1994). Ela ocorre em habitats naturais, ca. Esse cultivo seletivo era denominado sele
como as Ilhas Galápagos, onde diferentes espé ção artificial e criava novas variedades de vege
cies de tentilhões evoluem com mudanças nos tais, flores, etc. Os cavalos para trabalho eram
habitats locais de cada ilha, mas acontece tam selecionados pela sua força e os cavalos de corri
bém como resultado de intervenções humanas, da eram selecionados pela velocidade. Uma parte
quando, por exemplo, os organismos que cau do insight de Darwin foi que um tipo semelhante
sam doenças tomam-se resistentes a antibióti de seleção podia ocorrer na natureza, sem a inter
cos, ou pragas de insetos tomam-se resistentes venção humana; esta era a seleção natural.
aos inseticidas. Esses são, apenas alguns dos mui Os principais argumentos de Darwin foram
tos fatos sobre a evolução. O registro fóssil é publicados pela primeira vez em seu livro A ori
incompleto, e há muitos detalhes que desconhe gem das espécies (Darwin, 1859). Os argumen
cemos, mas as evidências da biologia, da geolo tos foram calorosamente recebidos em alguns
gia e de outras disciplinas mostram que a evolu setores, mas sofreram fortes resistências por parte
ção aconteceu e continua a ocorrer. Em outras de outros. A resistência cresceu e lá pelo final
palavras, a evolução não é uma teoria; é um nome do século XIX espalhou-se a crença de que o
para certos tipos de mudanças que ocorrem com Darwinismo estava morto. Ele se recuperou bem
as populações biológicas a que denominamos es mais tarde no século XX. O período de mais ou
pécies. As teorias da evolução não são teorias menos meio século que precedeu sua recupera
sobre se espécies contemporâneas são descenden ção passou a ser chamado de o eclipse do Da
tes dos ancestrais tão diferentes que encontramos rwinismo (Bowler, 1983; cf. Catania, 1987).
nos registros geológicos. Todas as teorias da evo A razão para o eclipse não foi o de que a evo
lução tomam isso como certo. Elas diferem no que lução em si tivesse sido desacreditada, mas sim
dizem sobre como a evolução surgiu. A Teoria que que outras teorias que não a de Darwin torna
tem sido melhor sucedida em acomodar os fatos ram-se dominantes. As principais alternativas à
da evolução é a teoria de Charles Darwin sobre a (1) seleção natural foram (2) o Lamarckismo,
evolução em termos de seleção natural. (3) a ortogênese e (4) a combinação da genética
Mendeliana com a teoria da mutação. O Lamar
ckismo baseava-se no trabalho do cientista fran
cês do século XVIII, que, em sua época, havia
Seção A A Natureza da Evolução trabalhado muito para demonstrar o fato da evo
lução. A teoria de Lamarck era a de que as ca
A seleção natural se refere à explicação de racterísticas adquiridas durante a vida de um or
Darwin sobre a evolução com base no diferen ganismo podiam ser passadas para seus descen
cial de sobrevivência e de reprodução dos mem dentes, por meio de mudanças em seu próprio
bros de uma população; o ambiente seleciona os material genético. Um problema com essa teoria
indivíduos que transmitem suas características é que ela não conseguia mostrar por que as ca
de uma geração para a outra e, assim, modela as racterísticas adquiridas que apresentavam van
características dos membros das populações se tagens deveriam ter maior probabilidade de serem
guintes (para discussões sobre os detalhes da passadas adiante do que as características desvan
seleção natural, ver Dawkins, 1976, 1986). A tajosas, como uma mutilação, por exemplo.
evolução por seleção natural requer variação De acordo com a teoria da ortogênese, a evo
dentro de populações; essas variações são o ma lução era ditada por forças internas dos organis
terial sobre o qual a seleção trabalha. mos, sem referência às demandas do ambiente;
A seleção era bem conhecida mesmo antes ela poderia estar ligada ao desenrolar do desen
de Darwin, mas era do tipo empregado pelo ho volvimento. Supunha-se que uma manifestação
mem na horticultura e na criação de animais. As desse desenrolar era a recapitulação da filoge-
50 A . C harles C atania
nia pela ontogenia. A ontogenia é o desenvolvi teradas nas gerações seguintes. Em qualquer dos
mento do organismo individual e a filogenia é casos, o plasma germinativo podia ser conside
sua história evolutiva. Pensava-se que durante a rado como uma representação ou cópia do orga
ontogenia o embrião passasse por estágios que nismo.
correspondiam à sua filogenia. Essa idéia de re Uma receita é uma seqüência de procedimen
capitulação, porém, tem sérias limitações e já não tos ou instruções. Ela descreve como criar um
é central na teoria da evolução (Gould, 1977). produto, mas não incorpora, necessariamente,
O problema com a genética Mendeliana era uma descrição do produto (a receita de um bolo
que, em si mesma, ela não fornecia um mecanis não se parece com um bolo). Uma receita pode
mo para a variação. Em uma descendência estri ser informativa, mas é pouco provável que con
tamente Mendeliana, os gens dominantes e os tenha informações sobre suas origens, como o
recessivos em uma geração determinavam suas número de tentativas feitas até que ela funcio
proporções na geração seguinte. Sem variação, nasse bem. Uma fotocópia, por outro lado, ge
a seleção natural não tinha sobre o que agir. Para ralmente não diz como construir a estrutura que
explicar o aparecimento de formas novas, expli ela mostra. Como uma receita, ela pode ser in
cações Mendelianas acrescentaram a teoria da formativa, mas é provável que ela também omi
mutação, a qual sustentava que a evolução se pro ta informações sobre suas origens, tais como a
cessava por meio de mudanças genéticas espon ordem em que as diferentes partes foram desen
tâneas e geralmente grandes. Naquela época, volvidas. Uma fotocópia é uma representação ou
porém, sabia-se muito pouco sobre a mutação, cópia, mas uma receita não é. As explicações
para que ela pudesse ser a base de uma explica Lamarckistas e da ortogênese preformacionista
ção convincente. tratavam o material genético como fotocópias,
mais do que como receitas.
Uma das principais realizações da Biologia
RECEITAS E FOTOCÓPIAS contemporânea consistiu em reinterpretar o ma
terial genético não como uma fotocópia da es
No século XIX, os gens eram entidades teó trutura do organismo, mas como uma receita para
ricas. As técnicas da biologia celular ainda não seu desenvolvimento (ver Dawkins, 1986, Ca
haviam atingido o ponto em que os gens foram pítulo 11, sobre as metáforas de receita e fotocó
localizados em células reais. Contudo, todas es pia). A formulação moderna exigiu que se re
sas teorias evolucionárias supunham que algum pensasse em que sentido se pode dizer que o
tipo de material hereditário era transmitido de material genético contém informação, se sobre a
uma geração para a outra e que a evolução era história evolucionária ou sobre a estrutura do
determinada pelas propriedades desse material. organismo (cf. Dawkins, 1982, Capítulo 9). Os
A principal falha em algumas teorias era a supo materiais genéticos fornecem informação limi
sição de que o material genético constituía uma tada sobre os ambientes passados em que eles
representação ou cópia do organismo. Na ver foram selecionados, em parte porque não incluem
são inicial da ortogênese, chamada preformaci- o material genético de todos os outros organis
onista, o embrião era literalmente um homún- mos que não sobreviveram. E fornecem infor
culo, um pequeno indivíduo, completo em todas mação limitada sobre a eventual estrutura de um
as partes; em variações posteriores da teoria, o organismo, porque são receitas para a produção
embrião era visto como tomando formas ances de proteínas, mais do que fotocópias de partes
trais, à medida que a ontogenia, como se dizia, do corpo. Uma implicação disso é a de que o
recapitulava a filogenia. Para o Lamarckismo, a Lamarckismo e pelo menos algumas variedades
transmissão de características adquiridas reque da ortogênese não tem sustentação como uma
ria que elas fossem, de algum modo, preserva alteranativa à seleção Darwiniana, porque suas
das no plasma genético; assim, o plasma germi- teorias implícitas da cópia são inconsistentes com
nativo tinha que conter algum tipo de plano da o que aprendemos sobre como o material gené
quelas partes do organismo que deveriam ser al tico funciona.
52 A . C h a rle s C atania
damente do que outro, mas este pode ser mais sido os mais competentes fugitivos do seu tipo,
difícil de capturar, porque pode mudar de dire no seu tempo, mas eles já não estão vivos. Quan
ção mais rapidamente ou de maneira mais im do a seleção opera sobre alguma propriedade
previsível. Contanto que os membros de uma po relativa, como a velocidade relativa à média de
pulação variem, nosso argumento pode ser uma população, a média da população muda. Por
reelaborado em termos dos efeitos de tais fato exemplo, depois que a captura pelos predadores
res sobre a probabilidade de ser capturado. Va selecionou repetidamente uma fuga mais rápida
mos falar sobre velocidade, porque é conveniente em uma população, poucos descendentes dos que
para nossa finalidade, mas devemos notar que as eram originalmente mais lentos terão sobrevivi
dimensões efetivas de fuga de predadores são, pro do, mesmo que sua velocidade de corrida tenha
vavelmente, muito mais complexas do que isso. tido uma vantagem seletiva em uma época em
Em algum momento ao longo da história, nos que ela era uma velocidade muito rápida em re
sa população de presas tem uma certa velocida lação à média da população. Em outras palavras,
de média, com alguns membros da população como demonstra o oehippus, não devemos es
estando acima da média e outros abaixo. Os que perar encontrar, nas populações atuais, exempla
estão abaixo da média são os que mais prova res de formas ancestrais.
velmente serão capturados e, portanto, terão De acordo com esses argumentos, a fonte de
menor probabilidade de passar seus gens para a seleção está no ambiente (os ambientes dos pre
geração seguinte. Então, a geração seguinte de dadores incluem suas presas e os ambientes das
verá apresentar mais descendentes dos que esta presas incluem os predadores). A seleção cria as
vam acima da média, ou, em outras palavras, ven características dos organismos, mas a seleção é
cerão os corredores mais rápidos. Assim, a ve tão necessária para mantê-las como para criá-las.
locidade média nesta geração será mais alta do Por exemplo, os ancestrais das baleias eram, em
que na geração anterior. Mas o mesmo tipo de certa época, mamíferos terrestres. Depois que
seleção continua operando: novamente, os mais voltaram para o mar, as contingências que fa
lentos terão maior probabilidade de serem cap ziam com que as pernas representassem uma
turados do que os mais rápidos. Ao longo de vantagem não mais mantiveram a seleção de per
muitas gerações, portanto, a velocidade média nas bem-formadas. Pelo contrário, a seleção co
vai se tomando cada vez maior. (Um tipo seme meçou a favorecer pernas que eram efetivas para
lhante de seleção também opera sobre os preda movimentos na água. As pernas dos ancestrais
dores, porque sua eficiência em capturar as pre da baleia desapareceram gradualmente; em certo
sas também vai variar entre os indivíduos.) sentido, é apropriado dizer que as pemas foram
A evolução do cavalo fornece fortes evidên extintas ou que se tomaram extintas (Skinner, 1988,
cias para esse tipo de seleção (Simpson, 1951; p. 73; cf. Provine, 1984). A seleção opera sobre as
Gould, 1996). Ao longo dos 50 milhões de anos espécies, mas o faz pela ação sobre os órgãos, os
ou mais desde o eohippus, o assim chamado ca sistemas e as partes particulares do corpo.
valo da aurora (tecnicamente seu nome é Hyra- Consideremos um outro exemplo. Os ambi
cotherium), os indivíduos das populações das entes que possuem árvores altas, cujas folhas são
quais descendem os cavalos modernos aumen comestíveis, são ambientes em que pescoços lon
taram gradualmente em tamanho. Essas mudan gos podem ser vantajosos, especialmente se ár
ças no tamanho foram acompanhadas por outras vores mais curtas são raras ou se suas folhas são
mudanças (p. ex., os dedos tomaram-se patas), freqüentemente consumidas por competidores.
incluindo, supostamente, mudanças no compor As girafas passaram pela seleção natural de pes
tamento. O eohippus foi o antecessor dos cava coços relativamente longos; tal seleção não po
los modernos, mas é improvável que uma popu deria ter ocorrido em ambientes sem árvores al
lação de eohippus pudesse sobreviver nos habi tas (as árvores altas estabeleceram a ocasião para
tais dos cavalos contemporâneos. O fato de que pescoços longos). Mas a seleção também depen
o eohippus está extinto é relevante para nossa deu do que estava disponível como ponto de par
história. Muitos de seus descendentes devem ter tida. Em uma espécie, as variações entre os indi
54 A . C harles C atania
a alternativa for não ver nada. A seleção não Cada sprandel contém um desenho admiravelmen
substitui mecanismos existentes com outros que te adaptado em seu espaço decrescente. Um evan
gelista está sentado na parte superior, ladeado pelas
realizariam a mesma função; assim, não deve cidades celestes. Abaixo, um homem representan
ríamos esperar que um terceiro olho se desen do um dos quatro rios bíblicos (o Tigre, o Eufrates,
volvesse no meio da testa dos homens. o Indu e o Nilo) derrama água de um ajarra no espa
O que dizer de outros casos, como o disfarce ço que se estreita entre seus pés. O desenho é
ou o mimetismo nos animais? Um inseto bastão tão elaborado, harmonioso e proposital, que so
mos tentados a vê-lo como o ponto de partida de
pode se parecer tanto com um bastão que um qualquer análise (Gould & Lewontin, 1979, pp.
pássaro que come tais insetos passaria por ele 581-582).
sem comê-lo. Mas qual seria a vantagem de se
parecer apenas 5% com um bastão? Em respos A questão é que a Catedral de São Marcos
ta a essa questão, Dawkins (1986, pp. 83-84) as não foi construída para criar os sprandels. Os
segura que mesmo 5% de semelhança pode ser sprandels foram um subproduto arquitetônico
o suficiente para fazer diferença ao entardecer, inevitável, mas incidental, da construção de um
sob neblina ou se o pássaro estiver distante. Se domo no topo de arcos arredondados. De modo
os indivíduos de uma população variam em sua análogo, algumas características de populações
similaridade a ramos e gravetos, a seleção natu contemporâneas podem não ser produtos dire
ral baseada em diferenças ainda que pequenas tos da seleção natural; em vez disso, elas podem
pode direcionar a população para disfarces mais ter sido subprodutos incidentais de outras carac
e mais convincentes. terísticas não-relacionadas, que tenham surgido
A semelhança com um bastão é uma proprie por meio da seleção. Quando a fonte de uma ca
dade pouco usual e é, certamente, apenas uma racterística herdada é incerta, a questão, às ve
das muitas direções possíveis para a seleção. Já zes, é apresentada nos termos da analogia de São
salientamos que a seleção pode operar sobre di Marcos: ela é um produto da seleção natural ou
ferentes características em diferentes populações, é um sprandel?
e nem toda característica que pareça adaptativa Até aqui estivemos concentrados nas proprie
é, necessariamente, um produto da seleção natu dades da seleção, mas o que podemos dizer, ago
ral. Darwin considerava a seleção natural como ra, sobre a evolução do comportamento (cf. Skin
o mais importante mecanismo da evolução, mas ner, 1984)? Já notamos que o comportamento
ele tomou o cuidado de apontar que a seleção deixa apenas evidência indireta no registro fós
natural não era o único mecanismo possível: sil. Apesar disso, é seguro supor que os sistemas
“Estou convencido de que a Seleção Natural tem de respostas evoluiram antes dos sistemas sen-
sido o meio principal, mas não exclusivo, de soriais. Para um organismo que nada pode fazer
modificação” (Darwin, 1859, p. 6, itálicos acres sobre o que vê, não há vantagem em ver. Alguns
centados). As explicações selecionistas das ca organismos permaneceram imóveis, mas outros
racterísticas de uma população requerem mais começaram a se contrair e a se contorcer. Al
do que uma história plausível sobre como tais guns organismos foram passivamente arrastados
características podem ser vantajosas. pelas correntes oceânicas e outros se fixaram em
Algumas características podem surgir como lugares particulares. Os organismos dos quais
produtos incidentais da seleção. Gould e Lewon- descendemos desenvolveram maneiras de se des
tin (1979) utilizaram a construção de São Mar locar de um lugar para outro.
cos como uma analogia. São Marcos é uma ca À medida que os sistemas motores se desen
tedral em Veneza, com um domo sustentado por volveram, as vantagens de responder diferenci-
arcos. Quaisquer dois arcos adjacentes se encon almente aos eventos ambientais foram, possivel
tram no topo de um pilar comum e na constru mente, a base para a seleção dos sistemas senso-
ção da catedral o espaço triangular acima do pi riais. Afastar-se ao ser tocado pode ser o bastan
lar e entre os dois arcos foi preenchido, e sua te para evitar um predador e certamente seria
superfície usada como um mosaico. O espaço é mais vantajoso do que se afastar ao acaso. Inge
denominado um sprandel: rir coisas com base em suas propriedades quí
56 A . C harles C atania
dizagem ocorre também pode ser limitado. Mas postas que produzem comida continuam a ocor
à medida que o bezerro cresce e toma-se mais rer; outras respostas não. A comida é a conse
independente, ele também aprende sobre muitas qüência que seleciona algumas respostas e não
coisas que mudam dia após dia, como a passa outras. Essa é uma maneira de dizer que o res
gem de predadores ou os lugares onde o alimen ponder é selecionado por seu ambiente (é im
to e a água são encontrados. portante notar o quanto isso é diferente de dizer
Os que buscam por mecanismos de aprendi que o próprio organismo selecionou alguma
zagem no sistema nervoso devem esperar que maneira de responder). Poderíamos dizer que as
contingências evolucionárias tenham seleciona respostas que produzem comida sobrevivem e
do diferentes tipos, com alguns produzindo mu que as outras se extinguem. Paralelos entre es
danças relativamente permanentes no compor tas duas variedades de seleção, seleção filoge
tamento, enquanto outros produzem mudanças nética ou Darwiniana e seleção ontogenética ou
facilmente reversíveis, com alguns restritos a si seleção do comportamento por suas conseqüên
tuações relativamente específicas e outros a si cias, têm sido exploradas com um detalhamento
tuações geralmente amplas, com alguns operan considerável (p. ex., Catania, 1978; Skinner,
do em momentos da vida do organismo diferen 1981; T. L. Smith, 1986); alguns paralelos serão
tes de outros. Em outras palavras, a seleção de salientados à medida que os fenômenos da apren
diferentes tipos de sistemas nervosos depende dizagem forem sendo explorados.
dos diferentes tipos de comportamento que eles O comportamento adquirido por meio de
produzem. Vamos retomar a este tópico no Ca aprendizagem, durante a vida de um organismo
pítulo 12, quando considerarmos os limites bio particular, desaparecerá, a menos que seja, de
lógicos para a aprendizagem. alguma maneira, passado para outros. Uma ter
ceira variedade de seleção ocorre quando o com
portamento pode ser passado de um organismo
TIPOS DE SELEÇÃO para outro, como na imitação, ou, mais impor
tante, na linguagem. O que alguém disse ou es
A seleção que consideramos até agora, a se creveu, por exemplo, pode sobreviver à morte
leção de populações de organismos ao longo do da pessoa, se for passado e repetido por outros.
tempo evolucionário, pode ser chamada de sele O comportamento verbal que sobrevive entre os
ção filogenética. Mas esse não é o único tipo de membros de um grupo e é partilhado por eles é
seleção que nos interessa. Dos vários tipos de parte da cultura daquele grupo. Vamos dar uma
aprendizagem que serão explorados nos capítu atenção especial a este terceiro tipo de sele
los que se seguem, um é o caso em que as res ção, que tem sido chamado de seleção cultu
postas são afetadas por suas conseqüências. Por ral, nos capítulos sobre aprendizagem social
exemplo, se um organismo está privado de ali e sobre o comportamento verbal (Capítulos 13
mento e alguma resposta produz comida, aquela a 15).
resposta provavelmente irá ocorrer mais freqüen Vimos considerando três tipos de seleção: (1)
temente. Já discutimos casos como esse, como a seleção filogenética, a evolução, ao longo do
instâncias de reforçamento. O reforçamento tam tempo biológico, de populações de organismos
bém pode ocorrer em situações ou ambientes par e suas características, tais como o comportamen
ticulares, quando, então, dizemos que a situação to; (2) a seleção ontogenética, a modelagem do
estabelece a ocasião em que as respostas são re comportamento por suas conseqüências, duran
forçadas. Tais casos envolvem um dpo de sele te a vida de um organismo individual; e (3) a
ção que opera ao longo da vida do indivíduo, em seleção cultural, a sobrevivência de padrões de
vez de ao longo de sucessivas gerações. comportamento à medida que são passados de
Esse tipo de seleção pode ser chamado de se um indivíduo para outros. Esses tipos de sele
leção ontogenética-, ele envolve seleção pelas ção dependem de comportamentos que mudam
conseqüências (cf. Skinner, 1981). Para o orga tanto durante a ontogenia quanto durante a filo
nismo privado de alimento, por exemplo, as res genia.
A pr en d iza g em 5 7
RESUMO recapitula a filogenia, assim, não podemos es
perar traçar a evolução do comportamento se
Começamos esta seção com uma breve revi guindo o desenvolvimento do comportamento
são da evolução da vida na Terra. A concepção em um indivíduo (ou vice-versa). Se apesar des
de Darwin sobre essa evolução, a seleção natu sas limitações ou se devido a elas, uma questão
ral, sofreu desafios de outras abordagens, tais recorrente tem sido a das contribuições relativas
como a ortogênese e o Lamarckismo. Ela supe da filogenia e da ontogenia para o comportamen
rou esses desafios quando foi integrada à gené to, em que medida o comportamento depende da
tica Mendeliana e à teoria da mutação e quando história evolutiva e em que medida depende da
começou a ser reconhecido que o material gené aprendizagem? Quando tais perguntas são for
tico era mais do tipo de uma receita do que uma muladas em relação a questões socialmente sig
cópia de um organismo. As mudanças acumula nificativas, como a herança da inteligência, isso
das produzidas ao longo do tempo pela seleção geralmente resulta em acaloradas controvérsias,
natural criaram a complexidade organizada, mas especialmente quando as alternativas são apre
também significaram, freqüentemente, que as sentadas como dicotomias ou oposições (p. ex.,
formas ancestrais não sobreviveram nas popula natureza versus criação, hereditariedade versus
ções contemporâneas. Alguns sistemas biológi ambiente).
cos foram modelados diretamente pela seleção e A pesquisa de Spalding, um naturalista bri
outros foram subprodutos incidentais (spran- tânico do século XIX, fornece um argumento elo
deis). O advento da aprendizagem foi um even qüente para o papel da filogenia no comporta
to importante na evolução do comportamento; mento.
ele permitiu um segundo tipo de seleção, a sele
ção ontogenética ou a seleção de classes de com ... temos apenas que olhar para os filhotes de ani
portamento no período de vida de um organis mais inferiores para verificar que, de fato, eles não
têm que passar pelo processo de aprender o signifi
mo, como quando o responder persiste porque cado de suas sensações em relação às coisas exter
tem certas conseqüências. Um terceiro tipo de nas; que pintinhos, por exemplo, correm, bicam e
seleção tomou-se possível quando o comporta pegam pedaços de alimento e seguem imediatamente
mento pode ser passado de um indivíduo para o chamado da mãe, depois de deixar a casca do ôvo...
outro, na seleção cultural. A análise do compor Tenho observado e experimentado com mais de 50
pintinhos, retirando-os debaixo da galinha quando
tamento deve considerar o comportamento como ainda estão no ovo. Mas destes, nenhum dos que
um produto da seleção filogenética, ontogenéti emergiram da casca estava em condições de mani
ca e cultural; devemos entender cada tipo de se festar familiaridade com as qualidades do mundo
leção para entender de onde vem o comporta externo. Ao deixar a casca eles estavam molhados e
mento. Vamos tratar brevemente, a seguir, da desamparados.... (Spalding, 1873/1954, pp. 2-3)
relação entre a filogenia do comportamento e sua
ontogenia. Spalding notou que os pintinhos desenvolvi
am-se rapidamente. Dentro de quatro ou cinco
horas depois de sair do ovo, eles estavam bican
do objetos e alisando as penas de suas asas. Mas
ele também reconheceu que muito podia ser
Seção B Filogenia, Ontogenia e
aprendido em quatro ou cinco horas
Comportamento
Para tomar óbvia essa objeção em relação ao olho,
O comportamento é uma função conjunta de vou recorrer ao seguinte expediente. Tomando os
contingências filo genéticas, aquelas que opera ovos justamente quando os pequenos prisioneiros
ram nos ambientes ancestrais durante a evolu começavam a abrir seu caminho de saída, eu remo
via um pedaço da casca e, antes que eles abrissem o
ção de uma espécie, e de contingências ontoge-
olho, colocava em suas cabeças um pequeno capuz
néticas, as que operaram durante as interações que, tendo uma tira de elástico na parte inferior, fe
de um organismo com seu ambiente, durante sua chava-se ao redor de seu pescoço. (Spalding, 1897/
própria vida (cf. Skinner, 1966). A ontogenia não 1954, p. 3)
58 A . C ha rles C atania
Spalding mantinha os pintinhos cegos durante após o nascimento. As criaturas podem estar pre
um a três dias e, então, removia seus capuzes. paradas pela filogenia para fazer todo o tipo de
coisas que seus ancestrais faziam, mas eles tam
Quase invariavelmente, eles pareciam um pouco bém podem estar preparados para começar a
atordoados pela luz, permaneciam imóveis por vá aprender imediatamente. O comportamento co
rios minutos e continuavam, por algum tempo, me
nos ativos do que antes de terem sido desencapuza-
meça no embrião (p. ex., Hall & Oppenheim,
dos. Seu comportamento, no entanto, foi, em todos 1987). Tanto no período pré-natal como no perí
os casos, conclusivo contra a teoria de que as per odo pós-natal, alguns desses comportamentos são
cepções de distância e direção pelo olho sejam re independentes da estimulação sensorial e das
sultado de experiência, de associações formadas na conseqüências. Outros comportamentos são mo
história de cada vida individual. Geralmente, ao fi
nal de um ou dois minutos, eles seguiam com os
dificáveis, talvez até mesmo no período pré-na
olhos os movimentos de insetos rastejantes, viran tal: o comportamento muda mesmo com as pri
do suas cabeças com a precisão de uma velha ave. meiras interações do organismo com seu ambi
(Spalding, 1873/1954, p. 3) ente (p. ex., Johanson & Hall, 1979; Rudy, Vogt,
& Hyson, 1984). De acordo com esse ponto de
Nosso principal interesse neste texto é o com vista, deveria ficar evidente que a resposta à ques
portamento que é aprendido, mas devemos sem tão de ser o comportamento um produto da filo
pre considerar a possibilidade de que o compor genia ou da ontogenia é que ele é um produto de
tamento que estudamos tenha fontes filogenéti- ambas (quanto às questões sobre as magnitudes
cas. Podemos tentar criar ambientes arbitrários relativas de suas contribuições, naturalmente, a
para minimizar o papel da filogenia. A caixa resposta geralmente é: “depende...”).
experimental padrão para pombos, por exemplo, Antes de tratar do comportamento que é
é um ambiente arbitrário, porque os ambientes aprendido, devemos notar a variedade de com
naturais não apresentam os discos nos quais os portamento que está disponível antes que a apren
pombos bicam para produzir alimento, quando dizagem ocorra. O comportamento que não é
o disco está iluminado. Mas os ambientes arbi aprendido aparece em muitas variedades (Gallis-
trários nem sempre são suficientemente arbitrá tel, 1980; von Holst, 1973). Alguns tipos têm
rios; eles não necessariamente tornam arbitrário características de osciladores (p. ex., os batimen
o comportamento que ocorre neles. Considere tos cardíacos). Outros têm características de ser-
mos as respostas de bicar de um pombo: vo-mecanismos (p. ex., a manutenção do equilí
brio, durante a qual pequenos deslocamentos
Tais respostas não são totalmente arbitrárias. Elas produzem ajustes compensatórios). Outros ain
são escolhidas porque podem ser facilmente execu
tadas e porque podem ser repetidas rapidamente, e
da são produzidos, de diversas maneiras, por
por longos períodos de tempo, sem fadiga. Em um estímulos ( p. ex., como nas relações reflexas ou
pássaro como o pombo, o bicar tem uma certa uni nas cinesias e taxias ou na mudança contínua no
dade genética; ele é uma partícula característica de tamanho da pupila com mudanças na intensida
comportamento que aparece com uma topografia de da luz). As várias fontes do comportamento
bem-definida (Ferster & Skinner, 1957, p. 7)
fornecem nossa taxonomia, nosso sistema para
a classificação do comportamento. Nos capí
O comportamento deve começar muito cedo
tulos seguintes, iremos examinar os respon-
na vida de um organismo, mas isso, por si só,
dentes, os operantes, os operantes discrimi
não é uma evidência de que as fontes são filoge-
nados, os significados e as lembranças como
néticas, e não ontogenéticas. Lembre-se de que
classes de comportamentos que emergem des
Spalding estava incerto sobre o quanto um pin-
sa taxonomia.
tinho podia aprender em apenas algumas horas
62 A . C harles C atania
mado de latência da resposta. Além disso, a res xos. O conceito de reflexo tinha uma simplici
posta deve ocorrer com alguma magnitude e ter dade tentadora e, à medida que passou a ser mais
alguma duração. Uma vez que essas proprieda amplamente aceito como uma unidade compor-
des podem covariar, elas têm recebido, às vezes, tamental, parecia razoável concluir que as rela
um nome comum, a.força do reflexo. Assim, a ções reflexas poderiam constituir uma base para
força do reflexo seria fraca se o responder ocor a compreensão de uma variedade de processos
resse com a latência longa, a magnitude peque comportamentais. Alguns estímulos haviam sido
na e a duração curta, mas seria forte se o respon identificados como causa de algumas respostas
der ocorresse com a latência curta, grande mag e, indevidamente, passou-se a supor que para
nitude e longa duração. (A taxa da resposta eli- toda resposta deveria existir um estímulo elicia
ciada não é relevante para a força do reflexo, dor correspondente.
porque ela é determinada pela taxa de apresen O sistema de reflexo condicionado de Pavlov
tação do estímulo eliciador). e o behaviorismo de Watson, nas décadas de 1920
Sechenov (1863), um fisiólogo russo, notou e 1930, desenvolveram-se a partir de tal suposi
que o gasto de energia do organismo em muitas ção. Com reflexos servindo como unidades de
respostas (p. ex., espirros e tosses) excede de lon comportamento, o comportamento complexo era,
ge a energia fornecida por um estímulo elicia então, tratado como nada mais que a combina
dor. O efeito eliciador de um estímulo não de ção de tais unidades. Quando uma resposta ocor
pende de qualquer transferência direta de ener ria sem que um estímulo eliciador fosse obser
gia do ambiente para o organismo; pelo contrá vado, eram hipotetizados alguns estímulos com
rio, observou Sechenov, o estímulo deveria ser propriedades apropriadas. Além disso, supunha-
considerado como um tipo de gatilho, liberando se que as respostas de um reflexo tinham propri
a energia que o organismo já tem disponível em edades de estímulo que as tomavam capazes, por
músculos, glândulas ou outras estruturas. Essa sua vez, de eliciar outras respostas. Assim, o
noção era, naturalmente, consistente com a con comportamento que se estendia por longos perí
cepção de reflexo de Descartes. odos de tempo podia ser interpretado como uma
Embora o estímulo eliciador seja mais preci seqüência ou cadeia de reflexos, em que cada
samente considerado um gatilho que libera ener resposta funcionaria simultaneamente como a
gia já disponível no organismo, a intensidade do resposta eliciada de um reflexo e 0 estímulo eli
estímulo eliciador pode afetar a resposta elicia- ciador do próximo. Tais sistemas de reflexo fo
da. A latência da resposta, de modo típico, varia ram elaborados de várias maneiras mas, apesar
inversamente à intensidade do estímulo; em ou da engenhosidade de seus proponentes, eles não
tras palavras, a latência da resposta diminui à mais provocam atenção substancial na psicolo
medida que a intensidade do estímulo aumenta. gia da aprendizagem. O conceito de reflexo tem
E a magnitude e a duração da resposta, tipica seu lugar na análise do comportamento, mas seu
mente, variam diretamente com a intensidade do alcance é limitado, e ele não se sustenta por si
estímulo; em outras palavras, essas medidas au mesmo.
mentam à medida que a intensidade do estímulo
aumenta. Dizer que a força do reflexo aumenta
com a intensidade do estímulo é uma maneira de ESTÍMULOS ELICIADORES E
resumir essas relações. PROBABILIDADES DE RESPOSTA
Uma vez que se tomou comum falar de rela
ções reflexas em termos de força, mais do que O reflexo é apenas uma relação, entre as
em termos de medidas específicas, também se muitas relações possíveis entre os estímulos e as
tomou mais fácil considerar a relação reflexa respostas. No reflexo, a apresentação de algum
como uma unidade fundamental de comporta estímulo produz fidedignamente alguma respos
mento, e os reflexos começaram a ser tratados ta. Mas, o estímulo desse reflexo pode afetar
como componentes básicos, a partir dos quais outras respostas de maneira diferente, e a res
eram construídos comportamentos mais comple posta desse reflexo pode ser diretamente afetada
A p re n d iz a g e m 63
por outros estímulos. Para qualquer estímulo par Probabilidades ou Freqüências Relativas
ticular, sua apresentação pode aumentar a pro
babilidade de algumas respostas, diminuir a pro Essas várias relações entre os estímulos e as
babilidade de outras e ainda não ter qualquer efei respostas podem ser melhor descritas quantitati
to sobre outras. Do mesmo modo, para uma res vamente em termos de probabilidades ou fre
posta particular, sua probabilidade pode ser au qüências relativas. Então seremos capazes de
mentada por alguns estímulos, diminuída por definir os efeitos de estímulos comparando a pro
outros e, ainda, pode não ser afetada por outros. babilidade de uma resposta quando um estímulo
Além disso, não basta simplesmente notar que está presente com sua probabilidade quando o
uma resposta segue regularmente um estímulo estímulo está ausente. Uma probabilidade ou fre
para concluir que a linguagem do reflexo seja qüência relativa é uma proporção ou razão: o
apropriada. Precisamos também saber o quanto número de vezes em que o evento ocorre, com
a resposta é provável sem o estímulo. Por exem parado com o número de vezes em que ele pode
plo, se um rato, em uma roda de atividade, gasta ria ter ocorrido.
a maior parte de seu tempo correndo e corre tan Por exemplo, no reflexo de Babinski, um leve
to na presença quanto na ausência de ruído, não toque na sola do pé de um bebê recém-nascido
poderíamos dizer que o ruído elicia o correr, sim elicia, tipicamente, o espalhamento ou distensão
plesmente porque observamos que o rato corre dos dedos. Calculamos a probabilidade de res
quando apresentamos o ruído. Para falar de rela posta contando quantas vezes uma resposta é
ções reflexas, devemos saber qual a probabili produzida ao longo de um dado número de apre
dade da resposta tanto na ausência quanto na sentações de estímulo. No bebê recém-nascido,
presença do estímulo. a distensão dos dedos pode ser produzida por
Considere um cachorro que esteja se coçan cada um dos vinte toques na sola do pé; a pro
do. Se aparece um gato, ele para de se coçar, porção de respostas é, portanto, de 20 respostas
rosna e assume uma postura agressiva. Se o gato em 20 oportunidades, ou uma probabilidade de
vai embora e o dono do cachorro chega, ele late, 1,0. O reflexo de Babinski geralmente diminui
pula e abana o rabo. Mas, se o dono ralha, o ca com a idade e, se testarmos este reflexo de novo
chorro pode choramingar e esconder o rabo en algum tempo depois, pode ser que somente 6 dos
tre as pernas. Não podemos dizer sequer se as 20 toques possam, então, produzir uma respos
respostas do cachorro ao dono são estritamente ta; a probabilidade agora é de 0,3. Mais tarde
eliciadas ou se dependem, em alguma medida, ainda na vida da criança, provavelmente, verifi
de conseqüências de respostas passadas na pre caremos que o reflexo terá desaparecido com
sença do dono. pletamente: nenhum dos 20 toques produz uma
O gato, o dono e a repreensão do dono, cada resposta, e a probabilidade, então, é 0,0.
um desses eventos toma algumas respostas mais Na notação matemática de probabilidades,
prováveis, enquanto toma outras menos prová esses exemplos podem ser escritos, respectiva
veis. Algumas das respostas podem ser observa mente, como:
das de tempos em tempos, mesmo na ausência
desses estímulos e nenhuma delas ocorrerá ne p(Rj) = 1,0; píR j) = 0,3; e, p(R3) = 0,0.
cessariamente toda vez que um estímulo especí
fico for apresentado. Em uma relação reflexa, Aqui p representa probabilidade e os termos
uma resposta pouco freqüente na ausência de entre parêntesis são abreviações dos eventos
algum estímulo ocorre regularmente quando tal cujas probabilidades são especificadas na equa
estímulo é apresentado, mas essa é apenas uma ção (neste caso, R para respostas, onde os índi
entre muitas possibilidades. A resposta de latir, ces 1,2 e 3 correspondem às três medidas suces
por exemplo, é afetada por vários estímulos di sivas do reflexo de Babinski). Esses exemplos
ferentes, e podemos estar interessados em estí também ilustram que as probabilidades são de
mulos que a tornem menos provável, bem como finidas de tal modo que elas podem ter valo
naqueles que a tomem mais provável. res somente na faixa entre 0,0, quando o even-
64 A . C h a r le s C a ta n ia
to nunca ocorre, e 1,0, quando o evento sem estímulo e comparamos o responder, nesses pe
pre ocorre. ríodos de tempo, com o responder em períodos
de tempo equivalentes na ausência de um estí
mulo.
Probabilidades Condicionais As probabilidades, neste exemplo, são ex
pressas com a seguinte notação:
O reflexo de Babinski é um exemplo apro
priado a nossos propósitos, porque a resposta de p(RJS) = 1,0 ; p(R/não S) = 0,6.
distensão dos dedos não ocorre freqüentemente
na ausência de seu estímulo eliciador. Mas o que Nessa notação, o R é uma resposta e o S é
ocorre com o piscar eliciado por um sopro de ar um estímulo. A primeira equação pode ser lida
no olho? Se estudamos esse reflexo com uma como: a probabilidade de uma resposta, dada a
criança cujas piscadas já ocorrem a uma taxa de apresentação de um estímulo (piscar o olho, dado
uma resposta a cada um ou dois segundos, como o sopro de ar), é 1,0. A segunda equação pode
podemos distinguir piscadas eliciadas daquelas ser lida como: a probabilidade de uma resposta,
que teriam ocorrido mesmo na ausência do so dada a ausência de um estímulo (piscar o olho,
pro do ar (Spence & Ross, 1959)? De fato, po sem sopro de ar), é 0,6. Este tipo de probabilida
demos ser incapazes de dizer se uma piscada de, em que a probabilidade de um evento é espe
específica é ou não eliciada. Mas, comparando a cificada em termos da presença ou ausência de
probabilidade de uma piscada depois do sopro um outro evento, é uma probabilidade condici
de ar com a probabilidade na ausência de sopro, onal (a terminologia não deveria ser confundida
podemos, pelo menos, avaliar o efeito do estí com a de reflexos condicionados ou condicio
mulo. nais de Pavlov, embora ambas tenham a caracte
Nosso procedimento é ilustrado na Figura 4.1. rística de que um evento é uma condição para
Observamos a pálpebra, registramos as piscadas algum outro evento). Em outras palavras, p(AJ
dentro de um período de tempo depois de cada B) pode ser lida como: a probabilidade de A,
Tempo (Secundos) ♦
FIGURA 4.1 Estimativa da probabilidade de piscadas com e sem o sopro eliciador. Cada Unha vertical sólida
representa uma piscada. Na linha A nenhum sopro fo i apresentado. As linhas tracejadas separam 5 períodos de 1
segundo durante os quais as piscadas foram registradas (S=segundos). Ocorreram piscadas em três destes cinco
períodos e a probabilidade de piscadas na ausência do estímulo é, portanto, 0,6. Na linha B, cada seta representa
um sopro no olho. Ocorreu uma piscada em cada um dos cinco períodos de um segundo que se seguiu a esses
estímulos. Assim, a probabilidade de uma piscada dado um sopro de ar é, portanto, 1,0. Somente a primeira das
duas piscadas que se seguiram ao estímulo X contaram para esta probabilidade. Contamos um período de tempo
como não contendo piscadas ou contendo ao menos uma piscada e, então, calculamos a probabilidade, dividindo
os períodos de tempo, com ao menos uma piscada, pelo total dos períodos de tempo. O sopro de ar aumentou de 0,6
para 1,0. (Um experimento real usaria uma amostra muito mais ampla de observações para efeito de cálculo de
probabilidades.)
A p re n d iz a g e m 65
dado B; ou a probabilidade de A na condição de Para essa finalidade, usaremos o sistema de co
que B esteja presente. De maneira semelhante, ordenadas da Figura 4.2. O eixo y representa a
/?(X/não Y) pode ser lida como: a probabilidade probabilidade de resposta considerando que um
de X, dado não-Y; ou, a probabilidade de X sob estímulo tenha sido apresentado; o eixo x repre
a condição de que Y esteja ausente. senta a probabilidade de resposta considerando
As análises subseqüentes favorecerão a lin que o estímulo não tenha sido apresentado (cf.
guagem de probabilidades em detrimento de coordenada no glossário). Em outras palavras,
outras maneiras de se descrever o comportamen qualquer ponto neste gráfico representa duas pro
to. Não há muita diferença entre dizer que um babilidades condicionais: a probabilidade de res
estímulo causou uma resposta e que um estímu posta dado um estímulo, p{R/S), e a probabili
lo eliciou uma resposta. Qualquer uma das duas dade de resposta dado um não-estímulo,/?(R/não
formas poderia ser aplicada a casos particulares S). Por exemplo, o ponto A, na Figura 4.2 repre
de uma relação reflexa (como quando a apresen senta uma relação estímulo-resposta em que a
tação de um estímulo específico, M, é seguida probabilidade de resposta é 0,75 quando o estí
por uma instância particular de resposta, N). Tam mulo está presente e somente 0,50 quando o es
bém não há muita diferença entre dizer que um tímulo está ausente; neste caso, o estímulo au
estímulo aumentou a tendência a responder e que menta a probabilidade da resposta.
um estímulo elevou a probabilidade da resposta. A diagonal, na Figura 4.2 apresenta um inte
Esses usos podem ser aplicados aos efeitos médi resse especial. Uma resposta que ocorra sem ser
os ao longo de muitas ocorrências (p. ex., quando eliciada por um estímulo é considerada emitida.
o estímulo O geralmente produz a resposta P). A diagonal representa as relações estímulo-res
posta em que a probabilidade de resposta é inde
pendente do estímulo ou não é afetada por ele.
TIPOS DE RELAÇÕES
ESTÍMULO-RESPOSTA
66 A . C h a r le s C a ta n ia
Assim, no ponto B, a probabilidade de resposta fosse aumentada pelo estímulo para uma proba
é 0,25, quer o estímulo seja apresentado ou não. bilidade de 0,32 ? Certamente não.
Por exemplo, os pios de contentamento ou os Todos os pontos acima e à esquerda da dia
pios de desconforto do patinho podem não ser gonal na fi gura representam excitação, casos nos
afetados pela presença ou ausência de algum de quais um estímulo aumenta a probabilidade de
seus irmãos. Para dizer que uma resposta foi eli- resposta; enquanto aqueles abaixo e à direita re
ciada, não basta saber que a resposta seguiu um presentam inibição, casos em que um estímu
estímulo. Pode acontecer que uma resposta seja lo reduz a probabilidade de resposta. Qualquer
emitida assim que um estímulo é apresentado. limite que pudéssemos estabelecer para separar
Então, quando uma resposta segue um estímulo, essas relações estímulo-resposta que chamamos
não podemos dizer que a resposta foi eliciada, a de reflexos daquelas que não chamamos, seria
menos que saibamos que o estímulo, de fato, arbitrário. Essa conclusão é importante. Vimos
causou a resposta. que alguns dos sistemas comportamentais ini
Uma terceira classe de relações estímulo-res- ciais, como os de Watson e Pavlov, basearam seus
posta é ilustrada pelo ponto C, para o qual uma desenvolvimentos no reflexo como unidades fun
probabilidade de resposta de 0,90, quando o es damentais de comportamento. Sem dúvida, era
tímulo está ausente, é reduzida para 0,10 pela mais fácil lidar com as relações reflexas, alta
presença do estímulo; neste caso, o estímulo re mente regulares, do que com outras relações es
duz a probabilidade de resposta. Tais reduções tímulo-resposta, menos fidedignas. Mas, se a
de probabilidade de resposta por um estímulo Figura 4.2 é apropriada para descrever as rela
são, algumas vezes, chamadas de inibição do ções estímulo-resposta e, se o reflexo é apenas
reflexo. Por exemplo, se os pios de contentamen um caso especial entre elas, então, qualquer sis
to do patinho cessassem quando um pássaro tema de comportamento construído somente com
estranho aparecesse, poderíamos dizer que o base no reflexo, como uma unidade comporta-
pássaro estranho inibiu os pios de contenta mental, estava destinado a ser incompleto.
mento. Uma das propriedades do comportamento
O ponto D representa um caso onde um estí deixadas de fora das primeiras explanações era
mulo aumenta a probabilidade de resposta de, a emissão de respostas, a ocorrência de respos
aproximadamente, 0,1 para cerca de 1,0. Esse é tas na ausência de estímulos eliciadores. As res
o tipo de relação estímulo-resposta que denomi postas emitidas recebiam nomes como compor
namos de reflexo. Enquanto inibe os pios de con tamento instrumental ou operante, porque eram
tentamento, o pássaro estranho pode produzir um estudadas em termos do quanto eram instrumen
efeito também sobre os pios de desconforto do tais para mudar o ambiente ou como operavam
patinho. no ambiente. Elas derivavam sua importância não
O gráfico mostra que esta é apenas uma den de sua relação com os estímulos eliciadores, mas
tre as inúmeras possibilidades existentes. Em al de suas conseqüências. Por contraste, o compor
gum ponto, entre o extremo superior do gráfico tamento eliciado era denominado reflexo ou res-
ondep(R/S) é próxima de 1,0 e a diagonal, onde pondente.
S não tem qualquer efeito sobre R, temos que Quando essa distinção foi feita, outras carac
decidir se o efeito eliciador do estímulo não é terísticas foram adicionadas a ela. Especifica
mais fidedigno o suficiente para justificar que mente, argumentou-se que o comportamento ins
chamemos a relação de reflexo. Mas onde deve trumental ou operante consistia de respostas es
estar o limite? Provavelmente não excluiríamos queléticas, como os movimentos dos membros,
os casos em que p(RJS) é apenas um pouco me enquanto o comportamento reflexo ou respon-
nor que 1,0 (p. ex., 0,95 ou mesmo 0,90). Mas dente consistia de respostas autônomas, como as
também não tenderíamos a incluir efeitos muito secreções glandulares. Essa distinção também foi
leves dos estímulos. Por exemplo, falaríamos de vista como paralela à distinção tradicional entre
uma relação estímulo-resposta como sendo re ação voluntária e involuntária. Tais distinções,
flexa, se uma resposta com probabilidade de 0,26 desde então, têm sido seriamente questionadas.
A p re n d iz a g e m 67
Por exemplo, o comportamento de curvar a qualquer localização no gráfico; sua localização
postura, eliciado por um barulho forte e súbito depende da resposta que estamos medindo. Si
no reflexo de sobressalto, é uma resposta moto milarmente, o pio de desconforto do patinho,
ra melhor descrita como involuntária. Mas a res como resposta, não tem qualquer localização no
posta de engolir parece voluntária e também en gráfico; sua localização depende do estímulo que
volve uma relação reflexa. Essa resposta é elici estamos apresentando.
ada pela estimulação proveniente do fundo da
garganta, gerada por qualquer coisa sólida ou lí
quida que esteja na boca, já que é impossível EFEITOS DE ELICIAÇÕES
engolir se a boca está seca ou se não houver algo SUCESSIVAS
a ser engolido para estimular essa área. Por ou
tro lado, dirigir certamente parece ser uma ação Descrevemos alguns efeitos de apresentações
voluntária e operante. Contudo, um motorista de estímulos sobre o comportamento. Uma com
experiente que se sente no banco do passageiro plicação é que duas apresentações diferentes de
de um carro pode, involuntariamente, pisar forte um mesmo estímulo podem ter efeitos diferen
no assoalho do carro sem que haja ali um pedal tes. Por exemplo, podemos nos assustar muito
de freio, quando um obstáculo se aproxima re mais com o primeiro relâmpago em uma tem
pentinamente à sua frente na estrada. Temos aqui pestade do que com os outros relâmpagos que se
todas as possibilidades: quer o comportamento seguem. Além disso, os efeitos dos estímulos
seja operante ou respondente, podemos identifi podem depender de quão rapidamente eles se
car exemplos que pareçam ser tanto voluntários seguem uns aos outros. Por exemplo, se estamos
quanto involuntários. Em outras palavras, a dis descascando cebolas, as lágrimas eliciadas pela
tinção leiga entre as ações voluntárias e aquelas cebola que está sendo descascada no momento
involuntárias nada tem a ver com a nossa distin podem depender de se começamos a trabalhar
ção entre comportamento operante e responden com ela imediatamente depois de terminar a úl
te. (Como será visto quando tratarmos do com tima ou se acabamos de retomar de um interva
portamento verbal, no Capítulo 14, o mais im lo. E, em um outro efeito denominado somação,
portante para determinar se um comportamento um estímulo abaixo do limiar para eliciar uma
pode ser chamado de voluntário ou de involun resposta se for apresentado uma só vez, pode
tário deve ser se a pessoa que agiu pode identifi tornar-se um eliciador efetivo, se for apresen
car a origem do controle de suas ações.) tado repetidamente, com uma taxa suficiente
As respostas esqueléticas podem ser elicia- mente alta. Em outras palavras, o responder
das e as respostas autônomas podem ser emiti eliciado freqüentemente depende do número de
das. É importante manter a distinção entre o res apresentações do estímulo e de seu espaçamen
ponder emitido e o eliciado. Mas, a mesma res to no tempo.
posta pode ser, algumas vezes, eliciada e, algu
mas vezes, emitida. Assim, não podemos classi
ficar o responder efetivamente nestas duas cate Habituação
gorias, com base em propriedades fisiológicas
do comportamento, tais como a diferença entre Já mencionamos a reação de sobressalto pro
as respostas esqueléticas e as autônomas. duzida por um evento inesperado, como um re
A Figura 4.2 apóia um outro ponto mencio lâmpago ou um ruído intenso súbito. Mesmo sem
nado anteriormente. Quando definimos reflexo, outros eventos que sinalizem sua ocorrência, a
argumentamos que o reflexo não é nem o estí repetição de um ruído intenso produzirá suces
mulo nem a resposta, mas sim a relação entre sivamente menores reações de sobressalto, até
eles. O gráfico representa as relações estímulo- que, eventualmente, nenhum comportamento
resposta; ele não pode representar os estímulos será observado quando o ruído ocorrer. Muitos
sozinhos, nem as respostas sozinhas. Assim, o estímulos eliciam as respostas chamadas de
pássaro estranho como um estímulo não tem orientação ou de observação; por exemplo, um
68 A . C h a r le s C a ta n ia
cachorro levanta suas orelhas em resposta a um os estímulos considerados aversivos ou puniti
som novo ou começa a farejar em resposta a um vos do que com os estímulos considerados neu
odor não-usual. Com as repetições desses estí tros, apetitivos ou reforçadores.
mulos, entretanto, o responder do cachorro dimi A potenciação não deve ser confundida com
nui; o responder ocorre com magnitude menor e outro fenômeno chamado de sensibilização (cf.
latência mais longa, até que, eventualmente, desa Ison & Hoffman, 1983). Na sensibilização, os
parece completamente (no entanto, veremos mais efeitos eliciadores de um estímulo aumentam
tarde que as respostas de orientação e de observa como resultado de apresentações de algum ou
ção podem depender não apenas de estímulos eli- tro estímulo; um estímulo amplifica o efeito eli
ciadores, mas também de suas conseqüências). ciador de outro estímulo. Por exemplo, um cho
Esse decréscimo no responder com estímu que elétrico pode tomar mais provável que um
los repetidos tem recebido o nome de habitua ruído intenso subseqüente produza uma reação
ção. (Outro termo possível, adaptação, algumas de sobressalto; diz-se que o choque sensibiliza o
vezes se refere a mudanças ocorridas no com organismo para o ruído.
portamento, devido à exposição contínua a al O método de apresentação do estímulo pode
guns estímulos ou situações, como quando se diz determinar se o efeito observado é o da habitua
que um organismo se adapta ao ambiente do la ção ou da potenciação. Kimble e Ray (1965) es
boratório; algumas características da terminolo tudaram o reflexo de limpeza no sapo: o toque
gia da habituação e de termos relacionados de de uma cerda no dorso do sapo elicia um movi
pendem de se as mudanças no responder podem mento da pata traseira sobre as costas. Em um
ser atribuídas a tipos específicos de mudanças no grupo, toques sucessivos eram feitos em uma
sistema nervoso; cf. Groves & Thompson, 1970). região específica do dorso do sapo, mas dentro
A habituação é uma característica do respon dessa região a localização exata da estimulação
der eliciado, produzida por uma variedade de es podia variar de um toque para o outro; em um
tímulos. Ela ocorre com respostas tão diferentes segundo grupo, os toques sucessivos eram fei
como a mudança na resistência elétrica da pele tos exatamente na mesma localização do dorso,
produzida por choque (a reação galvânica da pele a cada vez. Em ambos os grupos eram apresen
ou GSR), pios de desconforto de pássaros à si tados, por dia, 100 toques a intervalos de 10 se
lhueta de um predador passando por sobre sua gundos, ao longo de 12 dias consecutivos. Os
cabeça e contrações em minhocas, produzidas grupos começaram com aproximadamente a
por exposição à luz, para não mencionar as rea mesma probabilidade de movimentos de limpe
ções de sobressalto e as respostas de orientação, za eliciados, mas essa probabilidade aumentou
já mencionadas antes (p. ex., Ratner, 1970). A ao longo dos dias para o primeiro grupo e dimi
adaptação também pode ser um componente im nuiu para o segundo grupo. Em outras palavras,
portante da dinâmica das emoções (Solomon & ocorreu a potenciação quando a localização do
Corbit, 1974). toque eliciador variava ligeiramente de apresen
tação para apresentação, mas quando a localiza
ção era constante, ocorreu a habituação.
Potenciação
Mas os estímulos, às vezes, podem ter efei Efeitos do Tempo desde o Último
tos opostos. Por exemplo, os choques elétricos Estímulo Eliciador
eliciam guinchos em ratos; se vários choques são
apresentados, apresentações subseqüentes pro Se o estímulo deixa de ser apresentado por
duzem mais o responder do que as primeiras (p. algum tempo depois da habituação ou da poten
ex., Badia, Suter & Lewis, 1966). Esse efeito tem ciação, a probabilidade de o responder ser elici
sido chamado de potenciação (outro termo tam ado poderá retomar a valores prévios. Por exem
bém utilizado éfacilitação', p. ex., Wilson, 1959). plo, a reação de sobressalto ao ruído alto pode
O processo de potenciação é mais provável com diminuir ou mesmo desaparecer depois de vári
A p re n d iz a g e m 69
os ruídos em sucessão, mas pode aparecer de Essas relações estão resumidas na Figura 4.3.
novo, com toda a força, se, mais tarde, um ruído Cada linha mostra os efeitos hipotéticos de dez
intenso se seguir a várias horas de silêncio. Se o estímulos sucessivos sobre a probabilidade de
responder eliciado diminui ao longo de estímu resposta ou força do reflexo. A parte superior da
los sucessivos, é provável que ele retome aos Figura 4.3 (A, B e C) ilustra a habituação; a par
níveis anteriores mais elevados, depois que os te inferior (D, E e F) ilustra a potenciação. Em
estímulos forem descontinuados. De maneira ambos os casos, são dados três exemplos que di
inversa, se o responder eliciado aumenta ao lon ferem somente no tempo que separa os primei
go de estímulos sucessivos, ele geralmente re ros cinco estímulos dos últimos cinco. À medi
torna a seus níveis anteriores mais baixos, de da que esse tempo se toma mais longo (de A a C
pois que os estímulos são descontinuados. As e de D a F), o responder produzido pelos cinco
mudanças no responder, chamadas de adaptação últimos estímulos fica mais similar ao respon
e de facilitação, não são permanentes e, à medi der produzido pelos primeiros cinco estímulos.
da que o tempo passa, ocorre um retomo aos ní Em outras palavras, com a passagem do tempo,
veis prévios. o responder retorna a seus níveis prévios. Por
HABITUAÇAO
hi
W
m
X
-
h -
POTENCIAÇÃO
CD
cc
Q)
Aff: FIGURA 4.3 Habituação e potenciação.
As setas indicam os estímulos; as linhas
verticais indicam as probabilidades com
as quais estes estímulos eliciam as res
ffí«
— li postas. A habituação é ilustrada em A, B
e C; a probabilidade diminui com os estí
mulos sucessivos. A potenciação é ilus
trada em D, E e F; a probabilidade au
menta com os estímulos sucessivos. Em
ambos os casos, as probabilidades de res
posta retomam a níveis prévios à medida
que aumenta o tempo desde o último estí
Tempo mulo.
70 A . C h a r le s C a ta n ia
exemplo, em A o responder é eliciado pelo últi estímulo serão explorados quando tratarmos da
mo estímulo x com uma probabilidade menor do lei do exercício. Considerados em conjunto, es
que pelo primeiro estímulo w. Mas quando o es ses tópicos identificam as possíveis origens do
tímulo x é apresentado depois de períodos su responder, quando ele é considerado emitido, e
cessivamente mais longos sem estímulos, como não eliciado. O capítulo termina com uma dis
em B e C, a probabilidade com a qual o estímulo cussão das maneiras pelas quais a importância
x elicia o responder se aproxima daquela com comportamental de estímulos pode mudar ao
que o estímulo w eliciou o responder. Relações longo do tempo; a estampagem (imprinting) é
análogas existem para os estímulos y e z em D, um exemplo usado para relacionar tais efeitos
E, e F. ao conceito de motivação.
Se a habituação fosse irreversível, podería
mos observar a adaptação apenas uma vez ao lon
go da vida de um indivíduo ou, do contrário, as O PADRÃO TEMPORAL DO
adaptações sucessivas levariam o responder a ní COMPORTAMENTO
veis cada vez mais baixos, até que, finalmente,
desaparecesse por completo. Um caso paralelo A apresentação de um estímulo pode deter
para a potenciação levaria, de modo semelhan minar a seqüência de respostas que ocorrem ao
te, ou a uma única ocorrência de potenciação ao longo de um período extenso de tempo. Por
longo da vida do organismo, ou a aumentos con exemplo, se um rato está privado e damos-lhe
tinuados e ilimitados no responder eliciado. Tais uma pelota de alimento, ele come a pelota. Quan
coisas, às vezes, podem acontecer. Por exemplo, do termina de comer, se houver água disponível,
reações do sistema imunológico, que podem ser ele bebe. Esta relação entre comer e beber sub
consideradas como instâncias de comportamen seqüente é tão forte que, apresentando alimento
to eliciado, algumas vezes parecem mostrar uma em pequenas quantidades, ao longo de um perí
potenciação irreversível (p. ex., para algumas odo extenso, podemos fazer o rato beber muitas
pessoas que tenham desenvolvido uma reação vezes sua ração diária normal de água (Falk,
alérgica a picadas de abelha após serem picadas 1977; Wetherington, 1982). Esse aumento no be
várias vezes, a reação pode diminuir pouco, se é ber é chamado de polidipsia, e o responder que
que diminui, à medida que o tempo passa). depende de um outro responder, dessa maneira,
é chamado de comportamento adjuntivo. O com
portamento adjuntivo, então, é o comportamen
to em que uma resposta acompanha de modo
Seção B Do Comportamento Eliciado ao regular alguma outra resposta.
Comportamento Emitido A polidipsia, como um tipo de comportamen
to adjuntivo, decorre, ao menos parcialmente, da
Vimos que o reflexo é apenas uma das várias maneira pela qual o comer e o beber estão rela
relações possíveis entre os estímulos e as res cionados no padrão alimentar do rato. Se o ali
postas. Examinaremos, a seguir, como as apre mento e a água estão livremente disponíveis, o
sentações do estímulo afetam o modo como o rato, geralmente, faz poucas e grandes refeições
reponder se distribui ao longo do tempo. Quan diariamente e bebe depois de cada refeição. Se,
do os estímulos ocorrem repetidamente, eles po então, forçamos o rato a fazer muitas refeições
dem produzir padrões temporais de comporta pequenas, apresentando alimento em muitas por
mento. Os tópicos desta seção incluem a ordem ções pequenas a curtos intervalos de tempo, o
e o padrão temporal das respostas que ocorrem rato ainda bebe depois de cada refeição, mas não
quando duas ou mais respostas diferentes são reduz suficientemente a quantidade de cada in
produzidas por um estímulo. O comportamento gestão de água para compensar o beber mais fre
adjuntivo, em que uma resposta segue regular qüente. Assim, um rato que tenha passado de
mente alguma outra resposta, é um exemplo. cinco grandes refeições para cinqüenta peque
Outros exemplos da apresentação repetida de um nas refeições diárias, beberia, agora, dez vezes
A p re n d iz a g e m 71
mais. Mas, se a ingestão, depois de cada uma as apresentações do comedouro, variou de um
das cinqüenta pequenas refeições, fosse de ape pombo para outro, enquanto o responder no fi
nas metade, em vez de um décimo da quantida nal do período era relativamente constante entre
de das ingestões depois de cada uma das cinco pombos e, geralmente, incluía alguma forma de
grandes refeições, o rato beberia cinco vezes mais bicar. Bicar também é o comportamento ocasio
do que antes. Tais aumentos na ingestão diária nado por apresentações de alimento; o pássaro
de água são tão regulares em ratos que apolidip- obtém comida em sua boca por meio do bicar.
sia tem sido empregada para fazer com que eles Ao menos neste caso, o comportamento termi
ingiram substâncias que geralmente rejeitam (p. nal parece ter algo em comum com as respostas
ex., álcool; Meisch & Thompson, 1971). produzidas pelas apresentações de estímulo (cf.
O comportamento adjuntivo pode incluir ou condicionamento temporal, no Capítulo 12). As
tras respostas além de comer e beber. Por exem apresentações repetidas de estímulo parecem não
plo, se, em vez de água, há uma roda de ativida apenas eliciar as respostas, mas também produ
de disponível para o rato, correr na roda seguirá zir um comportamento, em outros momentos, que
o comer, da mesma maneira que o beber segue o é estreitamente relacionado ao responder elicia
comer no procedimento de polidipsia (Levitsky do. O problema é que é difícil demonstrar que
& Collier, 1968). seqüências de comportamento geradas por apre
A apresentação de estímulos pode impor uma sentações sucessivas de estímulo não são afeta
estrutura temporal sobre o comportamento de ou das por outras variáveis como, por exemplo, por
tras maneiras. Um experimento examinou os suas conseqüências ou pelos efeitos discrimina
padrões de comportamento gerados em pombos tivos dos estímulos (p. ex., Reid & Staddon,
por apresentações repetidas de alimento (Staddon 1982).
&Simmelhag, 1971). Cada pombo era colocado
em uma câmara, em cuja parede havia uma aber
tura para o comedouro. O comedouro consistia O PAPEL DO EXERCÍCIO
de uma bandeja com grãos ordinariamente fora
do alcance do pombo; o alimento era apresenta “A prática faz a perfeição” é um ditado fami
do iluminando-se a bandeja e levantando-a para liar sobre o papel da repetição no comportamen
uma posição em que o pombo poderia comer. to. Antes que os efeitos das conseqüências do
Os pombos eram observados por uma janela na responder fossem reconhecidos, acreditava-se
câmara e o seu responder era classificado em que a mera repetição do responder, sem a consi
várias categorias, tais como bicadas dirigidas à deração de suas conseqüências, era suficiente
parede do comedouro ou ao piso, posturas e para manter o comportamento. Consideremos o
orientação para a parede do comedouro. seguinte trecho de Sechenov:
No início do intervalo entre as apresentações
... um bebê é capaz de tossir, espirrar e engolir, ime
de alimento, um pombo, geralmente, fazia uma diatamente após o nascimento. O ato de sugar tam
volta de 90 graus e, então, menos freqüentemen bém pertence a essa categoria de movimentos com
te, introduzia sua cabeça na abertura do come plexos... De fato, todo mundo sabe que uma criança
douro ou bicava em direção ao piso. Outros pom recém-nascida é capaz de sugar... Além disso, é um
bos mostraram padrões que incluíam respostas fato bem conhecido que a atividade desse comple
xo mecanismo no bebê é provocado pela irritação
diferentes, tais como limpar as penas ou andar dos lábios; ponha, por exemplo, seus dedos ou uma
de um lado para outro. Essas respostas se torna vela, ou um palito de madeira entre os lábios de um
vam menos prováveis e o bicar se tornava a res bebê e ele começará a sugar. Tente a mesma coisa
posta dominante ou mais provável, à medida que com uma criança, três meses depois que foi desma
se aproximava o momento da próxima opera mada, e ela não mais sugará; entretanto, a habilida
de de produzir movimentos de sucção à vontade é
ção do comedouro. retida pelo homem por toda a vida. Esses são fatos
As apresentações repetidas do estímulo im altamente notáveis: por um lado mostram que a con
puseram uma estrutura temporal ao comporta dução da sensação dos lábios para os mecanismos
.j.-HIu. O responder inicial, nos intervalos entre nervosos centrais que produzem os movimentos de
2 - C- a r l e s C a ta n ia
sugar cessam, aparentemente, depois do desmame; (Zebra danio), a um estímulo planejado para as
por outro lado, indicam que a integridade dessa con semelhar-se à rápida aproximação do seu maior
dução é mantida pela repetição freqüente do refle
xo. (Sechenov, 1863, pp. 28-29)
predador (Dill, 1974). À medida que o estímulo
se aproxima, o peixe começa a nadar para longe
Sechenov enfatiza aqui a complexidade da do local (apesar de estar em um meio aquático,
resposta no reflexo de sucção, mas o mais im essa resposta do peixe de nadar em fuga pode
portante é sua observação sobre o papel da repe ser adequadamente chamada de reação de vôo).
tição. De acordo com Sechenov, não apenas a A latência da resposta de nadar começa a dimi
repetição é importante para a manutenção da res nuir com as repetidas exposições ao estímulo;
posta, mas a resposta também se toma indepen em outras palavras, o estímulo passa a eliciar a
dente dos efeitos de estímulos eliciadores. No resposta de fuga mais e mais fortemente. Após
bebê, o sugar é eliciado por estímulos (“irrita dez dias sem a ocorrência de eliciações, a res
ção nos lábios”) mais tarde, esses estímulos não posta não havia retomado aos seus níveis ini
mais eliciam a resposta, mas o organismo per ciais: a mudança produzida pelo estímulo não
manece capaz, até a vida adulta, de produzir a foi revertida (cf. a seção sobre potenciação; ver,
resposta, mesmo na ausência desses estímulos também, o Capítulo 6 sobre as reações defensi
(cf. Schoenfeld, 1966; ver, também, Hall & vas específicas da espécie).
Oppenheim, 1987, p. 113: “Para a maior parte Mas nem todas as respostas começam com a
das espécies em que o filhote suga o alimento na eliciação. Algumas das primeiras respostas na
mãe, essa habilidade é reduzida se o sugar não vida de um organismo ocorrem espontaneamen
for praticado... pode-se m ostrar que, para a te, na ausência de estímulos identificáveis. Por
maioria dos filhotes de animais, virtualmente exemplo, dentro do ovo, o embrião do pintinho
todos os comportamentos organizados orien faz movimentos não coordenados de seus mem
tados para a mãe são fortemente influencia bros e corpo. Esses movimentos podem evitar
dos pelos eventos experienciados”). que os ossos, em desenvolvimento, fixem-se em
Com base em tais fenômenos, podemos con suas articulações ou podem modificar a forma
cluir que a eliciação repetida de uma resposta dos ossos em crescimento e do tecido conjunti
aumenta a probabilidade de que a resposta seja vo. Mais tarde, no desenvolvimento do embrião,
emitida. As primeiras explicações sobre a apren aparecem efeitos de estímulos eliciadores, tal
dizagem (p. ex., Thorndike, 1921; Verhave, vez simplesmente à medida que o aparato sen
1967) trataram dos efeitos da repetição da res sorial do embrião amadurece. Essa progressão
posta como componentes básicos da aprendiza do responder espontâneo para o responder elici
gem, descritos em termos de leis do exercício e ado pode ser resumida, dizendo-se que os em
leis da prática. Essas leis eram freqüentemente briões de pintinhos “agem” antes de “reagir”
ambíguas em relação a questões como se era ou (Provine, 1976, p. 210). Os estímulos tomam-se
não importante que a resposta repetida fosse eli importantes mais tarde, como quando os movi
ciada ou emitida. De qualquer modo, elas foram mentos rotatórios do pintinho, ao romper a cas
logo superadas por outras preocupações. A me ca, são afetados, dependendo de se ele continua
dida que a Psicologia da Aprendizagem se vol ou não a encontrar porções intactas da casca.
tou para outros fenômenos, tais como o reforço A evidência sugere que o bicar, em pintinhos
e o controle de estímulos, a possibilidade de um recém-nascidos, depende não somente das con
papel para o exercício ou a prática ficou negli dições que eliciam o bicar e das conseqüências
genciada. A evidência é muito escassa para per das primeiras bicadas, mas também de quanto o
mitir conclusões seguras sobre se o exercício ou pintinho já se engajou em bicar (Hogan, 1971).
a prática podem ser um componente básico de Uma vez que o responder ocorra, qualquer que
aprendizagem, mas existem alguns dados pro tenha sido sua origem, ele pode ter conseqüên
vocativos. cias, e a sobrevivência do pintinho pode depen
Um exemplo é fornecido por uma pesquisa der, por sua vez, das conseqüências que afeta
sobre as respostas de fuga de um peixe tropical rem ou não seu comportamento. Entre as gaivo
A p re n d iz a g e m 73
tas, por exemplo, bicar o bico do progenitor, mas temunha, uma vez mais, a grande importância
não atingir o alvo tem conseqüências diferentes da repetição freqüente para a atividade nervosa”
de atingir o bico; somente no último caso é que (Sechenov, 1863, p. 29).
a gaivota-mãe alimenta o filhote. Essas conse Já não podemos estar tão certos acerca da
qüências diferenciais afetarão a precisão das bi evidência sobre a qual Sechenov baseou sua con
cadas subseqüentes do filhote, somente, à medi clusão (p. ex., ele observou uma criança ou mui
da que a resposta se toma independente de seus tas crianças?), mas podemos considerar um
estímulos eliciadores. Esse desenvolvimento cor exemplo contemporâneo em Zelazo, Zelazo &
responde a uma formulação possível da lei do Kolb (1972). Esta pesquisa envolveu o reflexo
exercício: uma vez que uma resposta tenha sido de andar, que aparece em bebês recém-nascidos
eliciada por um estímulo, a resposta pode tor e desaparece em, aproximadamente, 8 semanas
nar-se mais provável, mesmo na ausência do es (McGraw, 1945). A resposta do reflexo de an
tímulo. dar tem muito em comum com o comportamen
Em experimentos sobre salivação, os cães sa to em que a criança se engaja mais tarde, quan
livam, inicialmente, somente quando o alimento do está aprendendo a andar. Os movimentos co
é apresentado, mas, depois de várias apresenta ordenados de andar, assemelhando-se àqueles de
ções de alimento, eles começam, também, a sa um adulto, podem ser eliciados segurando o bebê
livar ocasionalmente quando o alimento está au sob os braços e deixando seus pés tocarem uma
sente (p. ex., Zener & McCurdy, 1939). Tal res superfície horizontal. Quando os pais exercita
posta, denominada salivação espontânea, tem ram o reflexo de andar de seus bebês, seguran
sido atribuída ao condicionamento da resposta do-os de maneira a eliciar a resposta de andar,
salivar a características da situação experimen este reflexo tinha menor probabilidade de desa
tal (p. ex., pode ser argumentado que o estímulo parecer e o andar, em média, iniciava mais cedo
eliciador era uma mancha na parede, que o ca do que em outros grupos de bebês, para os quais
chorro viu casualmente, justamente quando co o andar não foi exercitado. Assim, o exercício
meçou a apresentação de alimento). Nenhum desse reflexo durante as oito primeiras semanas
outro estímulo eliciador era identificável, assim de vida não somente aumentou o responder eli
a única maneira de resguardar o tratamento de ciado, que ordinariamente diminui durante esse
respostas salivares como parte de uma relação período de tempo, mas parece ter encurtado o
reflexa seria supor que a salivação poderia ser tempo para o posterior aparecimento dessa res
eliciada por tais características arbitrárias da si posta como um componente do comportamento
tuação experimental. Contudo, o problema de emitido, o andar.
identificar estímulos simplesmente desaparece se Mas os autores reconheceram que os movi
admitirmos a possibilidade da ocorrência de res mentos de andar produzem outras mudanças no
postas sem estímulos eliciadores; de fato, não mundo do bebê (visuais, cinestésicas ou táteis),
poderíamos, de outra maneira, conceber o res que podem reforçar tais respostas. Mesmo du
ponder emitido. O conceito de responder emiti rante as 8 semanas de exercício, o andar era al
do será essencial para a abordagem das opera gumas vezes emitido, em vez de eliciado, e algo
ções conseqüenciais, como o reforçamento e a mais do que uma simples eliciação estava ocor
punição. rendo: “O andar...parecia progredir de uma res
As primeiras teorias do comportamento sus posta reflexa para uma instrumental. Há pouca
tentavam que a simples repetição do comporta dúvida de que tenha ocorrido alguma aprendi
mento era importante, em si mesma, para o de zagem... Não apenas havia mais respostas... mas
senvolvimento e a manutenção daquele compor elas eram melhor executadas” (Zelazo, Zelazo
tamento. Consideremos a seguinte afirmação de & Kolb, 1972, p. 315). A situação complica-se
Sechenov “...Se uma criança que acabou de ainda mais como um exemplo de eliciação, da
aprender a andar fica doente e permanece na das as mudanças no peso do bebê e nas capaci
cama por um longo tempo, ela esquece a arte dades de suporte de suas pemas ao longo de tais
previamente adquirida de andar... Esse fato tes estudos (Thelen e col., 1982).
74 A. C h a r le s C a ta n ia
Especulamos que uma resposta, uma vez pro ele veja seja sua mãe e, mesmo neste primeiro
duzida por um estímulo, pode tornar-se mais pro dia de vida fora do ovo, o patinho, provavelmen
vável, mesmo na ausência do estímulo. Em ou te, começará a ficar perto dela. Mas, se a mãe
tras palavras, eliciar uma resposta pode elevar não está presente e o patinho vê, de início, algu
sua probabilidade de emissão. Essa formulação ma outra coisa em movimento, tal como uma
difere das leis clássicas do exercício ou da práti pessoa, ele comportar-se-á, em relação a esse
ca às quais a relacionamos. Ela depende apenas estímulo, como teria feito em relação à sua
da mais simples das operações experimentais, a mãe. Considera-se que tais estímulos são es
apresentação de estímulos. Mas não precisamos tampados, isto é, em sentido figurado, grava
tentar estabelecer tais leis. É possível que algu dos no patinho.
mas respostas emitidas tenham sua origem por A estampagem tem sido demonstrada, tanto
que são primeiro eliciadas, enquanto outras são no laboratório como no campo, com uma varie
emitidas desde o início. A questão, então, não é dade de estímulos, indo de pássaros reais e pás-
a universalidade das leis do exercício ou alter saros-modelos a trens elétricos (alguns estímu
nativas, tais como emissão espontânea; antes, tra los, certamente, funcionam melhor que outros).
ta-se da questão experimental de qual é a fonte Tem sido dito, algumas vezes, que o desenvolvi
do responder em casos particulares. Outros pro mento da estampagem tem um período crítico
blemas na análise do comportamento terão esse de um ou uns poucos dias: se a estampagem não
mesmo enfoque nos capítulos seguintes. Em vez ocorre durante esse período crítico, ela pode não
de tentar explicar os casos de comportamento ocorrer mais. De fato, as coisas parecem ser mais
em termos de leis formais exaustivas, vamos ten complicadas (Hoffman, 1996). Por exemplo, o
tar melhorar nossa taxonomia do comportamen medo de estímulos novos se desenvolve ao final
to, fazendo uma classificação do comportamen do período crítico. À medida que os pássaros se
to em termos de suas origens. tomam mais velhos, eles apresentam piados de
desconforto característicos na presença de estí
mulos novos e movem-se para longe de tais estí
AS APRESENTAÇÕES DE ESTÍMULO EM mulos. Assim, os pássaros mais velhos, geral
ESTAMPAGEM (IMPRINT1NG) mente, não ficam perto de tais estímulos por tem
po suficiente para que a estampagem ocorra, mas
Até este ponto, estivemos concentrados em isso pode ocorrer se esse efeito dos estímulos
como os estímulos afetam o responder. Virtual novos for prevenido ou revertido.
mente todos os fenômenos considerados neste Em quaisquer dos casos, o patinho começa a
capítulo podem ser descritos em termos de pro responder de maneira significativa a um estímu
babilidades de resposta. Por exemplo, em uma lo, seja a mãe-pata, seja uma pessoa ou algum
relação reflexa, um estímulo aumenta a probabi objeto arbitrário em movimento, se o estímulo é
lidade de uma resposta para perto de 1,0; na ha apresentado sob condições apropriadas e sufi
bituação, a probabilidade da resposta diminui ao cientemente cedo em sua vida. Uma dessas res
longo de apresentações sucessivas do estímulo, postas é seguir o estímulo estampado à medida
e no comportamento adjuntivo a eliciação de uma que ele se move; tem sido dito, algumas vezes,
resposta muda a probabilidade de alguma outra que esse seguir é eliciado pelo estímulo estam
resposta. Vamos examinar agora um resultado pado, mas esse uso da linguagem de eliciação é
de apresentações de estímulo, a estampagem (Lo enganador.
renz, 1937), que deve ser discutida em outros Se o estímulo estampado é a mãe-pata, o
termos que não o dos efeitos sobre a probabili patinho a seguirá e emitirá piados de descon
dade de resposta. A estampagem oferece uma forto em sua ausência. Mas, que tipo de con
ponte para o tratamento das conseqüências das trole o estímulo estampado exerce sobre a res
respostas no próximo capítulo. posta de seguir? Sempre que o patinho anda
Quando um patinho sai da casca do ovo, é em direção à mãe, ele se encontra mais próxi
provável que a primeira coisa em movimento que mo dela; sempre que se afasta, ele se encon-
A p re n d iz a g e m 75
tra mais longe dela. Em outras palavras, a con AS OPERAÇÕES ESTABELECEDORAS E
seqüência natural de caminhar em diferentes A IMPORTANCIA DE ESTÍMULOS
direções é mudar a distância entre o patinho e
a mãe. Se a proximidade da mãe é uma conse Há outras maneiras de mudar a importância
qüência importante para o patinho, não deve dos estímulos. Algumas delas foram tratadas no
ria causar surpresa que ele caminhe em dire Capítulo 2, como os casos de operações estabe
ção a ela e não para longe dela. Segue-se tam lecedoras. Por exemplo, se for mais provável que
bém que, se o ambiente do patinho for altera um rato coma do que corra na roda de atividade,
do de tal modo que a proximidade com a mãe esperaremos que o rato pressione a barra mais
requeira uma outra resposta que não o andar, freqüentemente, e que suas pressões à barra pro
essa outra resposta deveria substituí-lo. duzam mais alimento do que se suas pressões
Tal experimento foi planejado por Peterson produzissem apenas acesso à roda de atividade.
(1960). De um dos lados de uma janela havia Mas suponhamos que o rato continue a ter livre
um compartimento escuro, contendo um estímu acesso ao alimento, enquanto a roda é trancada,
lo estampado em movimento. Um patinho, do impedindo assim o rato de correr. Depois de um
outro lado da janela, podia iluminar o lado com período de privação do correr na roda de ativi
o estímulo estampado, apresentando um resposta dade, poderíamos, então, descobrir que o rato
apropriada. Ele fez isso, mesmo quando a res estaria mais propenso a correr do que a comer,
posta requerida era incompatível com o seguir, se a oportunidade de correr na roda ficasse no
tal como bicar um disco localizado na parede vamente disponível, e que o rato pressionaria a
ou ficar parado sobre uma plataforma perto da barra mais freqüentemente se as pressões à bar
janela. Em outras palavras, a propriedade críti ra produzissem mais acesso à roda de atividade
ca do estímulo estampado não era que ele podia do que se elas produzissem alimento. Em outras
eliciar respostas particulares, tais como seguir, palavras, ao privar o rato de um ou outro desses
bicar ou ficar parado, mas, antes, que tornou-se estímulos, podemos mudar a importância de um
uma conseqüência importante para o patinho e, em relação ao outro; podemos fazer o correr na
assim, podia reforçar ou aumentar a freqüência roda mais provável do que o comer ou o comer
de tais respostas como seguir, bicar ou ficar pa mais provável do que o correr, dependendo da
rado. Em ambientes naturais, seguir geralmente privação prévia, de cada um deles, a que o rato
mantém o patinho próximo do estímulo estam tenha sido submetido.
pado (geralmente sua mãe), mas um ambiente As mudanças na importância dos estímulos
de laboratório mostra que o patinho pode apren que ocorrem com as operações estabelecedoras
der a apresentar outras respostas, se são elas ou são discutidas em termos de impulso ou motiva
não que têm a importante conseqüência de man ção (p. ex., Bolles, 1975). Os estímulos tomam-
ter próximo o estímulo estampado. se mais ou menos reforçadores ou mais ou me
Na estampagem, os efeitos de apresentação nos aversivos, dependendo dos fatores como o tem
inicial do estímulo a ser estampado não são as po desde sua última apresentação. O alimento, por
mudanças nas probabilidades do responder. An exemplo, toma-se mais reforçador à medida que o
tes, são as operações estabelecedoras. Elas tempo passa sem comer e pode, até mesmo, tor
mudam a importância do estímulo. O estímu nar-se aversivo depois do comer, se for consumi
lo estampado adquire sua importância para o da uma quantidade muito maior do que a usual.
organismo simplesmente por ter sido apresen A importância dos estímulos também pode
tado sob circunstâncias apropriadas. Ele co ser mudada por outros meios que não a priva
meça como um estímulo em relação ao qual o ção; como veremos nos capítulos seguintes, os
organismo é relativamente indiferente, mas reforçadores condicionados e os estímulos aver
termina como um estímulo que funciona como sivos condicionados, por exemplo, são estímu
reforçador e, portanto, modela o comporta los que adquiriram suas propriedades reforçado-
mento do patinho. ras ou aversivas por meio de sua relação com
outros estímulos. (Para uma discussão da intera
76 A . C h a r le s C a ta n ia
ção entre a motivação e os efeitos da adaptação, cessivas de um estímulo, a probabilidade de eli
ver Solomon & Corbit, 1974). ciação da resposta pode decrescer (habituação)
Os estudos fisiológicos de motivação normal ou aumentar (potenciação); no comportamento
mente estão interessados nas relações entre os adjuntivo, a eliciação de uma resposta muda a
fatores orgânicos e a importância dos estímulos probabilidade de uma outra resposta; as apresen
(p. ex., os efeitos dos níveis de açúcar no sangue tações repetidas de um estímulo podem produ
sobre o comportamento relacionado ao alimen zir padrões temporais de comportamento; elicia-
to, os efeitos de níveis hormonais sobre o com ções sucessivas podem aumentar a probabilida
portamento sexual, etc.). A motivação, então, não de da resposta na ausência do estímulo, como
é uma força ou um impulso especial a ser locali no fenômeno do exercício. O exemplo da estam
zado em algum lugar dentro do organismo; an pagem envolve os efeitos adicionais da apresen
tes, é um termo aplicado a muitas variáveis or tação do estímulo e estabelece a ocasião para a
gânicas e ambientais, que tomam vários estímu discussão de operações estabelecedoras.
los importantes para um organismo. Estamos prontos para passar para as opera
Este capítulo se concentrou em como os estí ções de reforçamento e punição. Toda vez que
mulos afetam o responder. Muitos fenômenos as respostas têm conseqüências, essas conse
considerados aqui podem ser descritos em ter qüências também terão seus efeitos como estí
mos de probabilidades de resposta: em uma re mulos. Dadas as muitas mudanças no responder
lação reflexa, um estímulo aumenta a probabili que podem ser produzidas pela apresentação de
dade da resposta para cerca de 1,0; em uma ini estímulos, não deveríamos esperar compreender
bição reflexa, um estímulo reduz a probabilida o responder conseqüencial sem levá-las em con
de da resposta; ao longo de apresentações su sideração.
A p re n d iz a g e m 77
PARTE III
APRENDIZAGEM
SEM PALAVRAS
As Conseqüências do Responder:
Reforço
82 A . C h a r le s C a ta n ia
Tentativas
FIGURA 5.1 Uma curva de aprendizagem. Tempo gasto por um gato para escapar de uma caixa problema, em
função das tentativas. (Thorndike, 1898, Figura 1)
vel quando tinha certas conseqüências. Essa O problema era que esses experimentos pro
mudança na probabilidade era medida de maneira duziam desempenhos complexos. Por exemplo,
diferente, dependendo do equipamento empre medir o tempo que o rato levava para deixar de
gado e dos objetivos experimentais. Os gráficos entrar nos becos sem saída à medida que ia apren
que mostravam como o comportamento mudava dendo a percorrer o labirinto não mostrava como
durante o experimento eram chamados de cur a aprendizagem se dava num único ponto de es
vas de aprendizagem: o tempo gasto para com colha. Essa consideração levou a uma gradual
pletar uma resposta em função do número de ten simplificação dos labirintos, como ilustrado na
tativas (p. ex., Figura 5.1); a percentagem de res Figura 5.2.
postas corretas; a proporção de animais que atin O diagrama A mostra o plano de um dos pri
giam algum critério de desempenho bem-suce meiros labirintos empregados no estudo da apren
dido. Algumas vezes, essas medidas eram trans dizagem animal (Small, 1899-1900), uma ver
formadas para facilitar a comparação entre elas. são de 1,80 m por 2,40 m do labirinto de sebes
Quando ratos percorriam um labirinto, por exem de Hampton Court na Inglaterra. (Curiosamen
plo, o tempo de corrida da caixa de partida para te, esses labirintos podem também ter criado o
a chegada geralmente diminuía, enquanto a por contexto para as estátuas operadas hidraulica
centagem de escolhas corretas e a proporção de mente, que contribuíram para o conceito de re
animais que não cometiam erros aumentava. flexo de Descartes; cf. Capítulo 4). Quando a
Converter o tempo, para percorrer o labirinto, porta da caixa de saída era levantada, os ratos
em velocidade (definida como a recíproca do podiam entrar no labirinto; o alimento era colo
tempo gasto) fazia com que as três medidas au cado na área alvo, no centro. Com o aumento da
mentassem com a aprendizagem. Mas as formas experiência no labirinto, os ratos atingiam a área
das curvas de aprendizagem dependiam tanto dos alvo com maior rapidez e com menos viradas
equipamentos usados e das medidas tomadas que incorretas ao longo do caminho. Mas era difícil
o progresso da aprendizagem não podia ser des examinar a aprendizagem em qualquer ponto par
crito de uma única maneira. ticular de escolha. O ponto de escolha em 1, no
A p re n d iz a g e m 83
Saída
Saída Alvo
FIGURA 5.2 Etapas na evolução dos labirintos no estudo da aprendizagem animal. A. o labirinto de Hampton-
Court, conforme adaptação de Small (1899-1900); B. um labirinto em U, com seis pontos de escolha; C. o labirinto
em T, com um único ponto de escolha; e D, a pista reta.
diagrama A, podia ser aprendido mais rapida especificar a seqüência correta (em B, direita-
mente do que o 7, porque o ponto 1 aparecia mais esquerda-direita-esquerda-esquerda-direita) e
cedo do que o 7 ou porque os planos do piso computar os erros. Mesmo aqui, contudo, as in
eram diferentes; a escolha no ponto 4 poderia terações entre as posições e as seqüências com
ser aprendida mais rapidamente que a escolha plicam a análise. Por exemplo, seria a escolha
no ponto 5, devido às diferentes possibilidades da esquerda, no ponto 4, afetada pelo fato de ela
de abordar o ponto 4 (vindo do 3 ou do 5) ou ter sido precedida por outra virada à direita no
devido ao menor número de ocasiões em que o ponto 3 ou seguida por uma virada à esquerda
ponto 5 seria encontrado, se o rato fosse direta no ponto 5? Seria importante se o rato chegasse
mente do ponto 3 ao 4 com maior freqüência do ao ponto 4, após retomar de um beco sem saída
que do 3 ao 5. no ponto 3, tendo feito um erro ali, em vez de
Gradualmente, as estruturas do labirinto evo após uma virada correta à direita? Seria impor
luíram para formas mais sistemáticas, como no tante que o ponto 4 estivesse no meio do labirin
diagrama B. Neste labirinto, algumas vezes cha to, em vez de próximo a seu início ou fim?
mado de labirinto em U devido à forma das uni Era talvez inevitável que o labirinto fosse
dades sucessivas, os pontos de escolha eram es reduzido a um ponto de escolha única, como no
sencialmente os mesmos quando o rato chegava labirinto em T, com uma área alvo à direita em C
a cada um deles; eles diferiam apenas em suas na Figura 5.2. Aqui, quando o rato deixava a área
localizações na seqüência e em se virar à esquer de saída, ele tinha que fazer uma única escolha,
da ou à direita seriam as respostas corretas. Esse à direita ou à esquerda. Mas algumas complica
tipo de procedimento sistemático tomava fácil ções possíveis ainda não estavam eliminadas.
84 A . C h a r le s C a ta n ia
Suponhamos, por exemplo, que um rato em sua do ponto de chegada permitisse ao rato diminuir
primeira tentativa no labirinto em T virasse à a velocidade sem bater a cabeça contra a parede
direita enquanto que um segundo rato virasse à (Killeen & Amsel, 1987).
esquerda. Deveríamos permitir que o segundo Tanto com os labirintos como com as pistas,
rato refizesse o percurso depois de ter alcançado o experimentador tinha que retornar o organis
a área vazia no fim do braço esquerdo? Se, em mo da área de chegada para a de saída, toda vez
vez disso, ele fosse recolocado na área de parti que iniciava uma nova tentativa. Assim, era o
da, deveria ele ser forçado a alcançar a área alvo experimentador, e não o organismo, quem de
(p. ex., bloqueando-se o braço esquerdo da pis terminava quando o comportamento ocorria.
ta), para garantir que sua experiência na área alvo Além disso, medir quanto o rato demorava não
fosse comparável à do primeiro rato? O próxi especificava o que ele estava realmente fazendo
mo passo lógico era eliminar completamente os durante aquele tempo. Duas inovações experi
pontos de escolha, deixando nada mais do que mentais ajudaram a resolver esses problemas. A
um simples corredor, como em D, na Figura 5.2. primeira consistiu em um aparelho construído
Agora, nenhum erro era possível, e as medidas de tal modo que o organismo podia emitir repe
de comportamento ficaram reduzidas simples tidamente, sem a intervenção do experimenta
mente à velocidade com que o rato se locomo dor, uma resposta facilmente especificada; a se
via do ponto de saída para o ponto de chegada. gunda foi um método de registro, baseado dire
Havia outros problemas. As medidas médias tamente na taxa ou freqüência de respostas, em
do desempenho de um grupo de animais não re contraposição às medidas indiretas derivadas de
presentavam necessariamente o desempenho dos seqüências de respostas ou de grupos de orga
indivíduos do grupo. Suponhamos, por exemplo, nismos. Essas inovações, inspiradas parcialmente
que, para ratos sozinhos em um labirinto em T pelo interesse em reduzir a manipulação do or
simples, os erros freqüentes mudem abruptamen ganismo, simplificando assim o trabalho do ex
te para viradas consistentemente corretas, mas perimentador, foram características importantes
que essa mudança ocorra em diferentes tentati de uma linha de pesquisa iniciada por Skinner
vas para os diferentes ratos. Em um grupo gran (1930, 1938,1950; ver, especialmente, Skinner,
de de ratos, 65% podem passar a virar correta 1956, para uma história dessa evolução).
mente em tomo da quinta tentativa, 72% em tor
no da sexta, 79% em tomo da sétima, 83% por
volta da oitava, e assim por diante, até que o de CÂMARAS EXPERIMENTAIS E
sempenho se tome estável entre 98 e 100% na REGISTROS CUMULATIVOS
vigésima tentativa. Esse desempenho do grupo,
dada a aparência de um aumento gradativo de Dois aparatos representativos são ilustra
viradas corretas, obscureceria completamente a dos na Figura 5.3: uma câmara padrão para
mudança abrupta no desempenho individual dos ratos com uma única barra, à esquerda, e uma
ratos (Sidman, 1952). câmara para pombos com três discos, à direi
Mesmo a pista simples não foi a solução de ta. Ambas compartilham de dispositivos de
finitiva, porque a velocidade para percorrer a ala resposta; de mecanismos para apresentar re-
reta era afetada por muitos fatores triviais. Se as forçadores como alimento ou água e de fon
tentativas começassem com a abertura da porta tes de estímulos.
do ponto de saída, a velocidade dependeria da Em um procedimento típico, um rato é colo
direção para a qual o animal estaria voltado no cado na câmara após ter sido privado de alimen
momento em que a porta fosse aberta. A veloci to. Uma barra ressalta da parede. Próximo à bar
dade seria também afetada pela manipulação do ra, encontra-se um comedouro para receber as
animal quando o experimentador o transportas pelotas de alimento, depositadas por um meca
se, a cada tentativa, do ponto de chegada para o nismo do outro lado da parede; um ruído carac
de partida ou pelos rastros de cheiro deixados terístico acompanha cada apresentação da pelo
pelos outros animais, ou até mesmo se o espaço ta. Uma lâmpada piloto ilumina a câmara, e um
A p re n d iz a g e m 85
FIGURA 5.3 Uma câmara para ratos (à esquerda) e uma câmara com três discos para pombos (à direita). A
câmara do rato inclui uma barra (A), um comedouro e um tubo para fornecimento de pelotas (B), um alto-falante
(C) e uma lâmpada ou luz da caixa (D); algumas câmaras para ratos incluem um piso de grades, por meio do qual
pode ser aplicado um choque elétrico (E). A câmara do pombo inclui três discos (F, G e H) e a abertura para um
comedouro (I). As lâmpadas ou os projetores localizados atrás de cada disco permitem projetar cores ou figuras
sobre os discos.
ruído do alto-falante pode mascarar os sons de bos, fica a seu alcance por alguns poucos segun
fora da câmara. dos. A abertura do comedouro se localiza no
O primeiro passo é o treino ao comedouro. centro e abaixo dos discos. O comedouro fica
As pelotas vão sendo depositadas no comedou centralizado abaixo dos discos. E prática comum
ro. Cedo ou tarde, o rato acaba encontrando-as e iluminar o comedouro e apagar todas as outras
comendo-as. Uma vez que isso ocorra, as pelo luzes, sempre que o comedouro é operado. A
tas continuam caindo até que, após cada apre câmara comumente apresenta outras caracterís
sentação, o rato se aproxime rapidamente do co ticas, como uma lâmpada para iluminação geral
medouro a partir de qualquer ponto da caixa. tênue, fontes de ruído mascarador e outros estí
Normalmente 10 pelotas são suficientes. Uma mulos audidvos, etc.
vez completado o treino ao comedouro, muda- O disco é uma peça de plástico, montado atrás
se o procedimento de maneira que a apresenta de um orifício redondo aberto na parede da câ
ção do alimento passe a depender das pressões à mara. Ele é conectado a um micro-interruptor,
barra. Eventualmente o rato pressiona a barra, a que registra as bicadas do pombo se elas forem
pressão produz a queda da pelota e a pelota oca suficientemente fortes (os discos são, normal
siona o comer. O rato então, provavelmente, vol mente, sensíveis a bicadas de menos de 0,1
tará à barra e a pressionará de novo. (As alterna Newton, que corresponde a aproximadamente 10
tivas para a demora em pressionar a barra são gramas ou um terço de uma onça). O plástico
consideradas no Capítulo 7). O resultado de in geralmente é translúcido, de modo que cores ou
teresse aqui é a freqüência com que o rato pres padrões podem ser projetados nele por meio de
siona a barra. Se a freqüência aumenta, chama lâmpadas ou projetores miniaturizados localiza
mos a pelota de alimento de reforçador. No tipo dos atrás dos discos. A câmara na Figura 5.3 con
de câmara mostrado na Figura 5.3, podemos em tém 3 discos, dispostos horizontalmente, a uma
pregar outros tipos de reforçadores. Por exem distância de 23 centímetros acima do piso da
plo, o dispensador de pelotas pode ser substituí câmara. Qualquer experimento em particular
do por uma pequena concha para apresentar go pode usar apenas um dos discos, dois deles ou
tas de água ou de leite. todos os três. Quando em uso, os discos geral
A câmara do pombo difere da do rato, por mente são iluminados. Como ocorre com os ra
que as barras são substituídas por discos e o ali- tos, se as bicadas de um pombo privado de ali
mentador, que contém a dieta padrão para pom mento em um disco produzem alimento, pode-
86 A . C h a r le s C a ta n ia
se esperar um aumento na taxa com que o pom novamente); e operante, porque a resposta ope
bo bica o disco. ra sobre o meio ambiente.
O rato e o pombo são organismos comuns de O operante livre se presta ao emprego dos
laboratório. Cada um deles tem padrões idios métodos de registro, como o registro cumulati
sincráticos específicos da espécie, que devem ser vo, que fornece um quadro pormenorizado e con
levados em conta, e não devemos supor que qual veniente de como o responder se altera ao longo
quer coisa observada com ratos ou pombos pos do tempo. A maioria dos registros cumulativos
sa ser generalizada para outros organismos. Con modernos são computadorizados, mas em um
tudo, sua dieta, manutenção em cativeiro, sus- registrador cumulativo original, ilustrado na Fi
cetibilidade a doenças e outras características são gura 5.4, uma fita de papel é enrolada em torno
razoavelmente bem-entendidas, e seu pequeno de um cilindro. Um motor gira o cilindro a uma
porte, duração de vida relativamente longa e eco velocidade constante, desenrolando a fita. Uma
nômica fazem deles sujeitos particularmente con pena ou qualquer outro dispositivo para escre
venientes. Assim, eles têm servido, freqüente ver repousa sobre o papel à medida que ele pas
mente, em experimentos sobre as conseqüências sa pelo cilindro, e cada resposta (p. ex., uma bi
do responder. cada no disco pelo pombo) move a pena a uma
Responder em aparelhos como os da Figura pequena distância sobre o cilindro, perpendicu
5.3 tem sido, às vezes, denominado de operante larmente ao movimento do papel. Assim, a qual
livre: livre, porque o organismo é livre para emitir quer momento durante a sessão esse registro
a resposta em qualquer momento, sem ter que mostra o total de respostas acumuladas.
esperar pelo experimentador (como quando o Exemplos de registros cumulativos são mos
rato na área alvo deve esperar ser recolocado no trados na Figura 5.5. Como o papel se move a
ponto de saída do labirinto, antes de percorrê-lo uma velocidade constante, quanto mais elevada
Direcionador
Cilindro da Pena Pena Direção do
Movimento da Pena
Direção do
Movimento do Papel
Rolo de
Papel
FIGURA 5.4 Principais componentes de um registrador cumulativo. Um cilindro gira a uma velocidade constante,
e cada resposta move a pena a uma distância fixa sobre o papel. A velocidade do papel e o tamanho do desloca
mento da pena a cada resposta dependem do comportamento em estudo. A escala mais comum é de um centímetro
por minuto e 1100 respostas para a largura toda do papel (cerca de 80 respostas por centímetro). Nessa escala,
uma inclinação de 45 graus representa uma taxa de cerca de 40 respostas por minuto. Quando a pena alcança a
extremidade superior do papel, ela retoma automaticamente para a posição inicial na base do papel.
A p re n d iz a g e m 87
DC
o
10 Minutos
FIGURA 5.5 Amostras de registros cumulativos representativos. Nesta figura, uma inclitiação de 45 graus repre
senta uma taxa de cerca de 20 respostas por minuto. Os registros A e B diferem, principalmente, quanto à taxa de
respostas: a taxa é mais elevada em A do que em B. A taxa é zero em quase todo o registro C; um segmento de C,
durante o qual ocorreram algumas poucas respostas, fo i ampliado e mostrado em relação a um registro de eventos
em D. Os registros E e F são aproximadamente iguais quanto à taxa de respostas, mas mostram detalhes diferentes
nos padrões do responder; E tem aparência de degraus, indicando períodos de resposta alternados com pausas,
enquanto F, com uma granulação mais lisa, indica um responder relativamente constante. Os registros G e H
mostram taxas que se alteram com o correr do tempo, diminuindo em G (aceleração negativa) e aumentando em H
(aceleração positiva).
a taxa de respostas, mais abrupta é a inclinação ma escala temporal. A cada resposta, no registro
do registro cumulativo, como mostram os regis de eventos, corresponde um pequeno degrau no
tros A e B. Na escala da Figura 5.5, a taxa de registro cumulativo; esta propriedade dos regis
resposta é de aproximadamente 30 respostas por tros cumulativos não é, em geral, óbvia, porque
minuto para o registro A e de, aproximadamen as escalas típicas de respostas e de tempo são
te, 12 por minuto para o registro B. O registro C pequenas demais para essa resolução fina de
inclui somente algumas poucas respostas; as pormenores.
porções horizontais indicam períodos de tempo Mesmo assim, diferentes padrões de respos
em que não ocorreram respostas (note que um tas podem ser facilmente distinguidos nos regis
registro cumulativo não pode ter uma inclinação tros cumulativos. Por exemplo, as taxas de res
negativa, porque a pena pode registrar as res postas nos registros E e F são praticamente as
postas, movendo-se apenas em uma direção ao mesmas, mas o registro E aparenta degraus, en
longo da página). quanto que o F é relativamente liso. Isto signifi
Uma pequena seção do registro C, que inclui ca que o registro E foi produzido por surtos rá
umas poucas respostas, é ampliada no registro pidos de respostas (segmentos íngremes), sepa
D, em que o registro cumulativo ampliado é rados por pausas (segmentos planos), enquanto
acompanhado do registro de um evento na mes o registro F foi produzido por um responder mais
88 A . C h a r le s C a ta n ia
uniforme. Essa propriedade do registro cumula respostas. Nesses registros, somente algumas das
tivo é, às vezes, chamada de textura ou granula respostas produziam o alimento, irregularmente
ção', dos dois registros, o E tem uma textura mais em A (como em a, b e c), e regularmente em B
áspera que F. (como em d e e). O padrão côncavo repetitivo
Os registros G e H fornecem outros exem em B, como aparece entre d ee, costuma ser cha
plos de propriedades pormenorizadas do com mado de padrão de curvatura em concha (scallo-
portamento que o registro cumulativo evidencia. ping). No registro C, o responder que começou
No registro G, a taxa começa em cerca de 25 em/produziu comida emg, como indicado pelo
respostas/min, mas diminui gradualmente à deslocamento da pena A pena então volta a h e
medida que o tempo passa; no registro H, a a seqüência é repetida de h a i, e assim por dian
taxa se altera na direção oposta, aumentando te. Esse tipo de registro facilita a comparação
de uma taxa relativamente baixa para cerca entre segmentos sucessivos (p. ex., ocorreram
de 30 respostas/min (os registros em que as muito mais respostas no segmento que termina
inclinações diminuem ao longo do tempo são em g do que no que termina em i). O registro D
chamados negativamente acelerados', aqueles serve de ilustração de como deslocamentos cons
que aumentam são chamados positivamente tantes da pena podem servir para distinguir dife
acelerados). rentes condições. Aqui o responder, ocasional
A Figura 5.6 mostra algumas outras caracte mente, produz comida, mas apenas na presença
rísticas, geralmente incorporadas nos registros de um tom; na presença desse tom, a pena per
cumulativos. Os registros A e B mostram como maneceu em sua posição normal, como nos seg
os deslocamentos da pena de respostas podem mentos j, l e n, mas foi deslocada para baixo em
ser usados para indicar outros eventos, além das sua ausência, como nos segmentos k, m e o.
FIGURA 5.6 Características adicionais de registros cumulativos. Em A í B, os deslocamentos da pena são usados
para superpor o registro de outros eventos, como apresentação de alimento, sobre o registro acumulado das res
postas (como em a até &). Em C, a reciclagem da pena é usada para simplificar as comparações entre os segmentos
sucessivos de um registro (f a g, h a i). Em D, deslocamentos da pena para cima são usados para distinguir o
responder em presença de um estímulo (em), 1 e n) do não responder na sua ausência (em k, m e o ) . Nesta figura,
uma inclinação de 45 graus representa uma taxa de, aproximadamente, 40 respostas por minuto (a escala difere
daquela da Figura 5.5).
A p re n d iz a g e m 89
Ao tratar do comportamento operante livre e vocabulário contemporâneo do reforço estão re
dos registros cumulativos, exploramos parte do sumidas na Tabela 5.1.
desenvolvimento tecnológico da ciência do com A terminologia do reforço inclui o termo re-
portamento. Antes, porém, de nos dedicarmos forçador como estímulo e os termos reforçar e
efetivamente aos dados proporcionados por essa reforço ou reforçamento, tanto na acepção de
análise, devemos atentar para alguns aspectos da operação quanto na de processo. Por exemplo,
terminologia do comportamento. quando as pressões à barra por um rato produ
zem pelotas de alimento e as pressões à barra
aumentam, podemos tanto dizer que as pelotas
REFORÇO são reforçadoras, ou que as pressões à barra são
reforçadas com pelotas. A resposta cuja freqüên
As pressões à barra por um rato privado de cia aumenta deve ser a que produziu a conse
água tomam-se mais prováveis quando produ qüência. Por exemplo, se a pressão à barra de
zem água do que quando não produzem. Bica um rato produz choque elétrico, e apenas a fre
das no disco tomam-se mais prováveis quando qüência de saltos aumenta, seria inapropriado
um pombo privado de alimento bica e produz dizer que a pressão à barra ou que as respostas
comida do que quando não produz. E talvez, o de saltar foram reforçadas.
choro de uma criança torne-se mais provável Embora um reforçador seja uma espécie de
quando chama a atenção dos pais do que quando estímulo, o reforço não é nem o estímulo nem a
não provoca essa atenção. Esses casos ilustram resposta. Como uma operação, o reforçamento é
o princípio do reforço: o responder aumenta a apresentação de um reforçador quando uma
quando produz reforçadores. O princípio é sim resposta ocorre; a operação é efetuada sobre as
ples, mas à medida que evoluiu, da versão ini respostas e, portanto, podemos falar tão somen
cial da Lei do Efeito de Thomdike até a posição te de respostas reforçadas, não de organismos
atual, trouxe consigo alguns problemas de lin reforçados. Dizemos que a comida reforçou a
guagem e de lógica. Algumas propriedades do pressão à barra no caso do rato ou que as respos-
TABELA 5.1 A Terminologia do Reforço. Esta terminologia“ é adequada se, e somente se, estiverem
presentes três condições: (1) uma resposta produz alguma conseqüência, (2) a resposta ocorre com mais freqüên
cia do que quando não produz conseqüências e (3) o aumento das respostas ocorre porque a
resposta tem aquela conseqüência.
Termo Restrições Exemplos
Reforçador Um estímulo. Pelotas de alimento foram empregadas como re
(substantivo) forçadores para as pressões à barra por ratos.
Reforçador (adjetivo) Uma propriedade de um estímulo. O estímulo reforçador era produzido mais freqüen
temente do que outros estímulos não-reforçado-
res.
Reforço (substantivo) Como uma operação, apresentar O esquema de reforço em razão fixa programava a
conseqüências quando uma res apresentação de alimento a cada 10 respostas de
posta ocorre. bicar.
Como um processo, o aumento nas O experimento com macacos demonstrou reforço
respostas que resultam do refor produzido por conseqüências sociais.
ço.
Reforçar (verbo) Como uma operação, apresentar Quando um período de recreio foi usado para re
conseqüências quando uma res forçar o cumprimento de uma tarefa escolar, as
posta ocorre; respostas são refor notas da criança melhoraram.
çadas, não organismos.
Como um processo, aumentar o res O experimento foi planejado para verificar se es
ponder mediante a operação de trelas douradas reforçariam jogos de coopera
reforço. ção entre alunos de Ia série.
a Uma terminologia paralela é apropriada para punição (incluindo “punidor” como um estímulo e punir como
verbo; cf. Capítulo 6), com a diferença de que uma conseqüência punitiva reduz em vez de aumentar o responder.
90 A . C h a r le s C a ta n ia
tas de bicar o disco por um pombo foram refor Uma solução seria reconhecer que o termo
çadas com água, mas não que o alimento refor reforço é descritivo, não explicativo. Ele nomeia
çou o rato ou que o pombo foi reforçado por bi uma relação entre o comportamento e o ambien
car, ou que uma criança foi reforçada. A princi te. A relação inclui, pelo menos, três componen
pal razão para essa restrição é ilustrada nos últi tes. Primeiro, as respostas devem ter conseqüên
mos exemplos: quando se fala em reforçar orga cias. Segundo, sua probabilidade deve aumentar
nismos é muito fácil omitir a resposta ou o re- (isto é, as respostas devem-se tornar mais pro
forçador, ou ambos. A restrição nos força a ex váveis do que quando não tinham essas conse
plicitar o que está sendo reforçado e porquê. qüências). Terceiro, o aumento da probabilida
Também não devemos omitir o organismo; sem de deve ocorrer porque a resposta tem essa con
pre podemos dizer de quem é a resposta (p. ex., seqüência e não por outra razão qualquer. Por
o choro de uma criança). exemplo, se soubéssemos apenas que o respn-
O termo reforço também tem funcionado, fre der aumentou, não seria apropriado dizer que a
qüentemente, como um nome para um processo, resposta deve ter sido reforçada (poderia ter sido
o aumento no responder que se segue à opera eliciada). Também não seria suficiente saber que
ção de reforço. Esse emprego duplo, tanto como a resposta está, no momento, produzindo algum
operação quanto como processo, dificulta a des estímulo que não produzia antes. Ainda teríamos
crição do comportamento, mas vem sendo feito que saber se o responder aumentou porque o es
há tanto tempo que é pouco provável que mude. tímulo era a sua conseqüência.
Por exemplo, a afirmação de que uma resposta Suponhamos que um pai atenda a uma crian
foi reforçada pode ser interpretada de duas ma ça sempre que ela fale cochichando, mas supo
neiras: a resposta produziu um reforçador (ope nhamos também que esse comportamento de sus
ração) ou o responder aumentou porque produ surrar da criança seja mais provável na presença
ziu um reforçador (processo). Este texto prefere do pai do que na sua ausência. A criança sussur
o uso de reforço como uma operação. O proces ra e o pai aparece, e agora o sussurrar aumenta
so pode ser tão facilmente descrito em termos em freqüência. Como podemos decidir se a cri
de mudanças no responder (p. ex., o responder ança agora está sussurrando porque este com
aumentou) que parece ser pouco justificável a portamento foi reforçado ou porque agora o pai
substituição da descrição direta do que acontece está presente e toma mais provável a ocorrência
com a resposta por outros termos. Contudo, o desse comportamento? Isso é ainda mais com
uso do termo para se referir ao processo tem tan plicado, porque o sussurrar da criança também
tos precedentes que é impossível evitá-lo com pode reforçar o comportamento de atenção do
pletamente. Além disso, a superposição entre os pai. Ao trabalhar com essas interações é impor
vocabulários de operação e processo se estende tante distinguir os efeitos reforçadores das con
a muitos outros termos da aprendizagem (p. ex., seqüências de outros efeitos (cf. Poulson, 1984).
extinção, punição; Ferster & Skinner, 1957). Consideremos um outro exemplo menos
O vocabulário do reforço acarreta algumas agradável. Digamos que um pai agressivo mal
dificuldades lógicas, mesmo quando restrito a trate uma criança sempre que ela chore e tente
operações. Quando uma resposta se toma mais fazer com que o choro pare, dando-lhe umas pal
provável porque produziu um estímulo, dizemos madas. A criança chora, recebe as palmadas e
que a resposta foi reforçada e chamamos o estí isso faz com que o choro aumente. Nesse caso, a
mulo de reforçador. Se nos perguntam como sa conseqüência do comportamento de chorar é re
bemos que o estímulo é reforçador, podemos di ceber palmadas, e receber palmadas produz mais
zer que a resposta foi reforçada. Logo começa choro; no entanto, não diríamos que as palma
mos a nos repetir. Uma vez que definimos o re das reforçaram o chorar. Dois critérios para se
forçador pelos seus efeitos sobre o comportamen falar em reforço foram satisfeitos, mas o tercei
to, criamos um problema de definição circular ro não. O comportamento de chorar não se tor
se, ao mesmo tempo, definirmos o efeito pelo nou mais freqüente porque as palmadas foram
estímulo-reforçador (Meehl, 1950). uma conseqüência dele; as palmadas levariam a
A p re n d iz a g e m 91
criança a chorar, mesmo que ela não estivesse ser mais reforçadas na idade adulta. Os sistemas
chorando antes da primeira palmada. Os estímu educacionais, freqüentemente, programam con
los podem ter efeitos eliciadores ou outros efei seqüências como elogio ou notas para resolver
tos, junto com seus efeitos reforçadores ou em problemas aritméticos ou responder questões
lugar deles. (Nestas circunstâncias infelizes, a fatuais, mas, cedo ou tarde, essas conseqüências
criança pode, eventualmente, aprender a supri artificiais são descontinuadas (com a esperança
mir o choro; como será visto no Capítulo 6, se de que outras conseqüências mais naturais man
ria apropriado dizer que as palmadas punem o tenham as respostas quando o estudante passa
chorar.) para outras situações). Quando uma resposta é
A terminologia do reforço requer que uma reforçada, sua probabilidade aumenta. Mas esse
resposta tenha uma conseqüência, que o respon aumento não é permanente: o responder volta aos
der aumente e que o aumento ocorra porque o níveis anteriores, tão logo o reforço seja suspenso.
responder tem conseqüências e não por outras A operação de suspender o reforço é chama
razões. Satisfeitas essas condições, dizemos que da de extinção; quando o responder retoma a seus
a resposta foi reforçada e que o estímulo era um níveis prévios como resultado dessa operação,
reforçador. diz-se que foi extinto. Esse retomo do compor
Podemos supor também que o estímulo con tamento aos seus níveis anteriores ao reforço
tinuará a ser um reforçador eficaz no futuro e demonstra que os efeitos de reforço são tempo
que reforçará outras respostas em outras situa rários. O responder é mantido apenas enquanto
ções. Porém, ambas as suposições podem ser er o reforço continua, e não depois que ele é sus
radas. A eficácia dos reforçadores muda com o penso. Assim, a redução no responder durante a
tempo e qualquer conseqüência pode reforçar extinção não é um processo especial que requei
algumas respostas, mas não outras. Por exem ra um tratamento separado, é uma das proprie
plo, o dinheiro pode ser mais reforçador do que dades do reforço.
um sorriso para os serviços de um encanador ou Houve uma época em que o responder du
de um eletricista, mas o oposto talvez seja ver rante a extinção era uma medida primária do re
dadeiro em se tratando do comportamento de forço. A resistência à extinção era expressa como
abraçar a namorada. Apesar dessas restrições, os o tempo decorrido até que o responder fosse re
reforçadores empregados em muitas situações duzido a algum nível especificado. Dois regis
experimentais padrão (p. ex., alimento para or tros hipotéticos da extinção das pressões à barra
ganismos privados de alimento) provavelmente de um rato são mostrados na Figura 5.7. Em am
serão eficazes para uma variedade de respostas; bos os registros, a taxa de respostas diminui com
o experimentador que escolhe um estímulo que o passar do tempo (aceleração negativa), mas,
reforça algumas respostas e não outras, cedo ou dependendo do critério de extinção, ambos po
tarde terá que lidar com a diferença. O tema da dem representar maior resistência à extinção. Se
relatividade do reforço será retomado mais adian o critério adotado for o tempo decorrido até o
te, neste capítulo. primeiro período de dois minutos sem resposta,
então, A mostra maior resistência à extinção do
que B. A não inclui 2min sem uma resposta, mas
EXTINÇÃO um período com essa duração aparece do meio
para a frente em B. Se, por outro lado, o critério
As conseqüências de muitas respostas per for o total de respostas, a resistência à extinção é
manecem razoavelmente constantes durante a maior para B do que para A. A resistência à ex
vida toda. Por exemplo, geralmente tocamos os tinção diminuiu de significado, porque sua defi
objetos para os quais estendemos a mão e con nição permitia essas ambigüidades.
seguimos mudar de um andar para o outro, quan Mas a resistência à mudança (da qual a ex
do subimos um lance de escadas. Mas, para ou tinção é um caso especial) permanece como uma
tras respostas, as conseqüências mudam. As res propriedade importante do comportamento (Ne-
postas reforçadas durante a infância podem não vin, 1992). Por exemplo, resolver problemas arit-
92 A . C h a r le s C a ta n ia
" EXTINÇÃO
méticos, soletrar ou outras habilidades acadêmi para o reforço e a extinção, em vez de tratá-los
cas são consideradas fluentes quando forem re como dois aspectos do mesmo fenômeno.
forçadas e praticadas até o ponto de serem exe Consideremos o fenômeno da recuperação
cutadas com grande exatidão e com uma latên- espontânea. Em uma sessão típica de extinção o
cia curta (Johnson & Layng, 1992). Uma vez que responder diminui à medida que a sessão conti
essas habilidades se tomem fluentes, é imprová nua. Mas a taxa no início da sessão seguinte,
vel que sejam perturbadas por mudanças no am geralmente, é mais alta do que era ao final da
biente ou por outras distrações. última sessão. Alguns registros cumulativos hi
potéticos que ilustram a recuperação espontânea
são mostrados na Figura 5 .8 .0 responder no iní
Extinção versus Inibição cio de cada sessão era descrito como tendo-se
recuperado espontaneamente da inibição acumu
Se não ocorresse a extinção, os efeitos do lada até o final da sessão anterior; supostamen
reforçamento seriam permanentes. Qualquer res te, essa inibição cresce no decorrer da sessão,
posta estabelecida por reforçamento duraria o suprimindo ativamente o responder, e dissipa-se
resto da vida do organismo. Mas, claramente, não durante o intervalo entre as sessões de extinção.
é o caso. Por exemplo, quem usa relógio, prova Pensava-se que fenômenos como a recupe
velmente, vira o pulso com freqüência para olhá- ração espontânea significavam que o responder,
lo; a conseqüência de olhar é saber a hora. Mas, reduzido pela extinção, de algum modo “estava
se por alguma razão a pessoa pára de usar o re ali o tempo todo, mas inibido” (Reid, 1958).
lógio, eventualmente, pára de olhar o pulso; ver Explicações variadas sobre a extinção foram for
o pulso apenas não é um reforçador eficaz. muladas através desses processos inferidos,
A história do conceito de extinção, no entan como a inibição, a frustração, a interferência ou
to, não foi tão simples. Por muito tempo perdu a fadiga (Kimble, 1961). Essas explicações di
rou a suposição de que a extinção suprimia ati feriam apenas na maneira de caracterizar os even
vamente o responder. Afirmava-se que a extin tos que geravam a inibição. Contudo, essas con
ção tinha efeitos inibitórios, ao contrário dos efei cepções explicavam a extinção em termos de
tos excitatórios supostos para o reforço. Esse tra eventos ou processos fictícos. Quando se afir
tamento dado à extinção teve origem na lingua mava que uma resposta tinha sido inibida du
gem que havia sido aplicada aos dados dos ex rante a extinção, ela podia ser medida, mas não
perimentos de condicionamento de Pavlov (cf. o que estivesse produzindo a inibição.
Capítulo 12; ver também, Skinner, 1938, pp. 96 Não era necessário pressupor a existência de
102). Uma vez estendida às conseqüências, essa processos supressivos na extinção. Por exemplo,
linguagem foi mantida, porque parecia consis os efeitos de condições pré-sessão, como o ma
tente com outros efeitos que, geralmente, acom nejo do sujeito, podem fazer com que o início da
panham a extinção. Assim, os textos de aprendi sessão seja diferente de períodos subseqüentes.
zagem tendiam a devotar capítulos separados Se isso é verdadeiro, os efeitos da extinção mais
A p re n d iz a g e m 93
RECUPERAÇÃO ESPONTÂNEA EM EXTINÇÃO
FIGURA 5.8 Registros cumulativos hipotéticos da recuperação espontânea de pressões à barra por um rato pre
viamente reforçado com alimento, em sessões sucessivas de extinção. A taxa de respostas no início da sessão 2 é
maior do que era no final da sessão 1; da mesma forma, a taxa no iníco da sessão 3 é maior do que no final da
sessão 2.
94 A . C h a r le s C a ta n ia
mento. A cada 10 ou 15 segundos, o rato pres
siona a barra e come a pelota apresentada. Se a
resposta de pressão à barra for, então, colocada
em extinção, as pressões não produzirão as pe
lotas, e o rato não come mais. Esse rato agora é
diferente sob dois aspectos: (1) suas pressões à
barra não têm mais as conseqüências anteriores
e (2) ele não come mais.
Eis um procedimento alternativo. O rato per
manece privado de alimento, mas quando descon
tinuamos o reforço das pressões à barra, começa
mos a apresentar pelotas automaticamente a cada
p(S/naoR) - Probabilidade do Estímulo
10 ou 15 segundos. Nesse caso, alteramos as con
Dada uma Não-Resposta tingências como no exemplo anterior: as pressões
à barra que, antes, produziam alimento, não têm
FIGURA 5.9 Contingências resposta-estímulo represen
tadas em termos da probabilidade do estímulo, dada mais efeito. Mas, embora a comida não seja mais
uma resposta, p(S/R), e probabilidade do estímulo na uma conseqüência das pressões à barra, este rato
ausência de resposta, p(S/nãoR). O gráfico inclui a pro continua a obter comida a cada 10 ou 15 segun
dução confiável de estímulos por respostas (A), estímu dos. Ambos os ratos, o do procedimento anterior e
los independentes de resposta (B), extinção (C), pre
este, pressionarão a barra menos freqüentemente,
venção dos estímulos pelas respostas, como em esquiva
(D; ver Capítulo 6), e produção intermitente de estímu mas apenas um deles ainda poderá comer.
los, como nos esquemas de reforço (E; ver Capítulo 10). O procedimento padrão de extinção suspen
Cf. Figura 4.2. de a contingência e as apresentações do estímu
lo. O último exemplo mostra, contudo, que a con
tingência pode ser descontinuada enquanto as
sobre as respostas; a Figura 5.9 mostra os efei apresentações do estímulo continuam. Em am
tos das respostas sobre os estímulos. bos os casos, o responder que tinha sido reforça
Em A, a probabilidade do estímulo é alta dada do diminui. Mas descontinuar a apresentação de
uma resposta, e baixa na ausência de resposta, reforçadores, o que ocorre apenas no primeiro
como quando as pressões à barra por um rato procedimento, afeta uma faixa de respostas, mais
produzem alimento. Em B, a probabilidade do do que apenas a resposta reforçada. Se a comida
estímulo é independente das respostas, por exem é subitamente retirada de um rato privado de ali
plo, quando o alimento é apresentado indepen mento que vinha comendo, por exemplo, ele se
dentemente de pressões à barra. Em C, a proba toma mais ativo e pode ser que urine ou defe
bilidade do estímulo é zero, quer uma resposta que. Se as pelotas eram produzidas por pressões
tenha ou não ocorrido, como quando o alimento à barra, o rato pode morder a barra (Mowrer &
é suspenso durante a extinção. Mais tarde va Jones, 1943). Se há outros organismos presen
mos considerar outros tipos de contingências em tes na câmara, o rato pode atacá-los (Azrin, Hu
outros contextos. Por exemplo, os casos em que as tchinson, & Hake, 1966). E a oportunidade de
respostas reduzem a probabilidade de um estímu se engajar em tais respostas agressivas pode re
lo, como em D, ilustram a esquiva (Capítulo 6), e forçar outras respostas (p. ex., o organismo pode
os casos em que as respostas produzem um estí puxar uma corrente se esta resposta coloca ao
mulo com uma probabilidade menor que 1,0, como seu alcance alguma coisa em que possa cravar
em E, ilustram esquemas de reforço (Capítulo 10). os dentes: Azrin, Hutchinson, & McLaughlin,
Comparemos, agora, os procedimentos quan 1965). Esses efeitos, embora observados na ex
to às mudanças nas contingências e às mudan tinção, não são o resultado da suspensão da con
ças nos estímulos. Consideremos, em primeiro tingência de reforço. Eles ocorrem quando as pe
lugar, um rato privado de alimento, cujas pres lotas apresentadas, independentemente da res
sões à barra são reforçadas com pelotas de ali posta, deixam de ser apresentadas, tanto quanto
A p re n d iz a g e m 95
durante o procedimento de extinção. Em ambos tervalos curtos de tempo (p. ex., a cada 10 ou 15
os casos, um rato que vinha sendo alimentado, segundos). As respostas que ocorriam imediata
deixa de receber comida. Na extinção, esses efei mente antes da apresentação de alimento tendiam
tos colaterais são superpostos ao decréscimo no a ser repetidas e, portanto, a ser seguidas de perto
responder previamente reforçado, porque a sus por mais apresentações de alimento. O efeito da
pensão de reforçadores é, necessariamente, uma sucessão acidental de respostas de reforçadores
parte da extinção.
Tais observações têm considerável significa geralmente é óbvio. Acontece de o pássaro estar
do prático. Em experimentos com crianças, por executando alguma resposta quando o comedouro
aparece; como resultado ele tende a repetir essa res
exemplo, algumas vezes são usados reforçado posta. Se o intervalo antes da próxima apresentação
res, independentes da resposta, em vez de extin não for tão grande a ponto de ocorrer extinção,...
ção, para evitar os efeitos colaterais da interrup [isto] fortalece ainda mais a resposta... O pombo se
ção da apresentação de reforçadores (p. ex., ver comporta como se houvesse uma relação causal en
Hart e col., 1968, sobre o reforçamento social tre seu comportamento e a apresentação de alimen
to, embora tal relação não exista. (Skinner, 1948,
do brincar cooperativo em uma criança). As ope pp. 168-171)
rações comportamentais têm, em geral, mais de
um efeito. Um estímulo que reforça uma respos Skinner notou que à medida que o procedi
ta pode eliciar outras respostas e servir como es mento continuava, a topografia ou a forma do
tímulo discriminativo para outras. Os fenôme pombo responder geralmente mudava de modo
nos considerados indicadores de que a extinção gradual, como as relações acidentais desenvol
seria mais do que um simples efeito temporário vidas entre o responder e as apresentações de
do reforço eram, provavelmente, apenas efeitos alimento. Skinner se referia a essas mudanças
colaterais. Muitos desses fenômenos, como o res como deslocamento topográfico. Um pombo res
ponder agressivo, gerado pela suspensão de apre pondia temporariamente como se suas respostas
sentações do reforçador, poderiam ter sido ob estivessem produzindo alimento, como uma con
servados em situações que não envolviam as con seqüência, mas nenhuma resposta particular per
seqüências do responder. manecia consistentemente como um comporta
mento supersticioso. Ao longo de períodos de
observação mais extensos com este procedimen
Extinção e Superstição to, Staddon e Simmelhag (1971) observaram que
o bicar, geralmente, predominava como a res
Como acabamos de ver, os efeitos gerais de posta que precedia imediatamente as apresenta
suspender as apresentações do reforçador na ex ções de alimento (cf. Capítulo 4, sobre as contri
tinção são superpostos aos efeitos mais especí buições da eliciação).
ficos de suspender as contingências. Por que, en O responder supersticioso, gerado por uma
tão, a extinção foi, por tanto tempo, a principal sucessão acidental de respostas e reforçadores,
base para o estudo dos efeitos de suspender as é um problema recorrente na análise do compor
contingências? E mais conveniente desligar a tamento, porque tais seqüências acidentais po
barra do equipamento que opera o comedouro dem ocorrer, quer os reforçadores sejam inde
do que desconectar a barra e, ao mesmo tempo, pendentes de respostas, quer eles sejam conse
substituí-la por um relógio que opera o come qüência delas. Se uma resposta é seguida por uma
douro periodicamente, mas é pouco provável que resposta diferente, que é reforçada, o reforçador
a resposta resida em uma mera mudança no equi pode afetar a ambas, embora sua apresentação
pamento. E mais provável que os procedimen dependa apenas da segunda resposta (Catania,
tos tenham sido determinados por algumas ou 1971; Kazdin, 1977). Mesmo quando as respos
tras propriedades do comportamento. tas têm conseqüências, propriedades da respos
Em um fenômeno chamado de superstição ta não relacionadas com o reforço podem se tor
(Skinner, 1948), a comida era repetidamente apre nar estereotipadas se acompanharem consisten
sentada a um pombo privado de alimento, em in temente as respostas reforçadas. Por exemplo,
96 A. C h a r le s C a ta n ia
os gestos do jogador de boliche, após lançar a bola, portamento autolesivo. Dar-lhe atenção, indepen
podem persistir por causa da relação íntima entre dentemente de seus comportamentos autolesivos,
as respostas prévias e o impacto da bola (Herms é uma alternativa possível, mas como vimos, tal
tein, 1966). Além disso, se as contingências de procedimento pode reduzir o comportamento in
reforço mudam de forma que as características do desejável de forma muito lenta. Um procedimen
responder, que em um momento eram relevantes, to melhor seria empregar a atenção para refor
tomam-se irrelevantes e se essas antigas caracte çar uma resposta alternativa e, especialmente,
rísticas não são incompatíveis com as característi uma que fosse incompatível com o comporta
cas relevantes atuais, elas podem persistir, simples mento autolesivo (Repp & Deitz, 1974). O com
mente porque continuam a ser seguidas por refor- portamento autolesivo inevitavelmente diminui
çadores (Stokes & Balsam, 1991). Outra dificul rá, à medida que a resposta alternativa aumentar
dade é que a superstição é muito facilmente invo em freqüência. Esses procedimentos, referidos
cada para explicar comportamentos para os quais como reforço diferencial de outro comportamen
não existem outras explicações disponíveis (Gu to, têm sido amplamente aplicados a problemas
thrie & Horton, 1946; Moore & Stuttard, 1979). de comportamento (p. ex., ver Skiba, Pettigrew
Podemos agora reconsiderar o que acontece & Alden, 1971, sobre o comportamento de chu
quando uma contingência de reforço é suspen par o dedo). Um modo de reduzir o mau com
sa, enquanto as apresentações do reforçador con portamento de uma criança é reforçar o seu bom
tinuam. Em primeiro lugar, as pressões à barra comportamento. Esta é uma razão pela qual o
por um rato são reforçadas com alimento; em ditado “Surpreenda a criança quando ela estiver
seguida, as pressões já não mais produzem ali agindo bem” é tão eficiente, tanto para pais,
mento, mas as apresentações de pelotas conti quanto para professores.
nuam independentemente do comportamento.
As pressões à barra continuam por algum tem
po e tendem ainda a ser seguidas de perto pelo
alimento. A ação de pressionar a barra sofre um Seção B Os Reforçadores como
declínio lento porque a sucessão acidental de Oportunidades para o
respostas e reforçadores se contrapõe aos efeitos Comportamento
da suspensão da contingência de reforço. Final
mente, a pressão à barra é substituída por outras Os reforçadores são, inevitavelmente, super-
respostas, mas seria difícil dizer que esse decrés simplificados quando são tratados meramente
cimo é simples. Por essa razão, programar uma como estímulos. A apresentação de qualquer re
transição de uma contingência de reforço para as forçador envolve a transição de uma situação
apresentações do reforçador independentemente da para outra (cf. Baum, 1973). Por enquanto, te
resposta pode ser uma estratégia pobre para exa mos identificado os reforçadores apenas pelos
minar os efeitos da suspensão da contingência de seus efeitos. Sem tomar o estímulo uma conse
reforço (Boakes, 1973; Catania& Keller, 1981). qüência do responder, não podemos dizer se ele
Uma vez mais, existem aqui implicações prá será efetivo como um reforçador. Mesmo os re
ticas. Imaginemos um garoto institucionalizado, forçadores evidentes, como a comida, podem va
com um atraso de desenvolvimento, e que fre riar em eficácia, dependendo da privação. A apre
qüentemente se engaja em comportamentos sentação da comida como uma conseqüência para
autolesivos, tais como bater na cabeça ou enfiar pressionar a barra pode não alterar a taxa dessa
o dedo nos olhos. Imaginemos também que des resposta se o rato já tem comida disponível o
cobrimos que esses comportamentos estão sen tempo todo. Veremos que uma propriedade im
do mantidos, em grande parte, pela atenção dos portante de uma situação de reforço é o respon
atendentes da instituição, que funciona como um der para o qual ela estabelece a ocasião.
reforçador. Um procedimento de extinção não é O Capítulo 2 introduziu o conceito de opera
recomendado, por causa dos danos que o garoto ções estabelecedoras, procedimentos que tomam
pode causar a si mesmo, se ignorarmos seu com os eventos mais ou menos efetivos como refor-
A p re n d iz a g e m 97
çadores. O Capítulo 4 discutiu alguns dos efei comportamentos, como operar um interruptor, por
tos das operações estabelecedoras com exemplos exemplo; por outro lado, quando se proporciona
de motivação ou impulso. Podemos agora defi va música ou aprovação social às crianças, até a
nir esses termos de forma mais precisa. Quando saciação, a efetividade desses eventos como re
estudamos a motivação, estamos interessados no forçadores diminuía (Vollmer & Iwata, 1991).
que torna as conseqüências mais ou menos efe Os reforçadores também têm sido distingui
tivas como reforçadoras ou punitivas. Na taxo- dos com base em sua relação com as respostas.
nomia das operações estabelecedoras, a priva Um reforçador intrínseco (também chamado de
ção e a saciação são formas importantes, mas não reforçador automático) é o que tem uma relação
as únicas, de mudar a efetividade de um estímu natural com as respostas que o produzem (por
lo como reforçador ou punidor. Nesse contexto, exemplo, quando um músico toca pela música
podemos agora examinar uma variedade de even que produz). Um reforçador extrínseco (também
tos que podem funcionar como reforçadores. chamado de reforçador arbitrário) tem uma re
Algumas distinções entre os reforçadores, às lação arbitrária com as respostas que o produ
vezes, são feitas com base nos tipos de opera zem (por exemplo, quando um músico toca por
ções que os estabeleceram como reforçadores. dinheiro). O termo extrínseco também tem sido
Por exemplo, um reforçador condicionado é aplicado a estímulos que supostamente fun
aquele que se toma efetivo em virtude de sua cionam como reforçadores, porque sua fun
relação com algum outro reforçador (p. ex., a ção foi ensinada (por exemplo, quando se en
luz que aparece quando o comedouro é operado, sina a uma criança que é importante tirar boas
em uma caixa de pombo, pode, eventualmente, notas na escola). A despeito de seu rótulo, tais
tornar-se um reforçador condicionado devido à estímulos freqüentemente são ineficazes como
sua relação com a apresentação de comida). A reforçadores.
operação estabelecedora programa aqui a rela Discutimos as funções eliciadoras, discrimi
ção entre os estímulos (i.e., liga o comedouro de nativas e reforçadoras dos estímulos. A apresen
tal modo que as apresentações de comida são tação de estímulos pode ter, também, funções es
acompanhadas pela luz). No comportamento hu tabelecedoras (cf. Michael, 1982). Consideremos
mano, o dinheiro freqüentemente funciona como dois exemplos: provar uma sopa sem sal não au
um reforçador condicionado e, por causa de sua menta a probabilidade de que o sal seja passado
relação com muitos outros possíveis reforçado quando você pedir por ele, e chegar em frente a
res (todas as coisas que se podem comprar com uma porta trancada não aumenta a probabililda-
dinheiro), ele é muitas vezes chamado de refor de de que você encontre a chave em seu bolso.
çador condicionado generalizado. Um reforça No entanto, essas situações possivelmente au
dor que não depende de qualquer relação com mentarão a probabilidade de que você peça o sal
outros reforçadores é chamado de reforçador in- ou que coloque a mão no bolso. Nesses casos,
condicionado. alguma coisa que era neutra (o sal ou a chave)
Muitos eventos considerados reforçadores tornou-se reforçadora. (Tais efeitos têm sido cha
incondicionados tem, claramente, uma importân mados, algumas vezes, de funções de incentivo;
cia biológica (p. ex., alimento, água, contato se o termo incentivo, no entanto, tem sido aplicado
xual; cf. Richter, 1927). Mas os reforçadores não tanto para a função estabelecedora quanto para
estão limitados a eventos de importância bioló a função discriminativa dos estímulos; p. ex.,
gica óbvia. Por exemplo, os estímulos sensori- Bolles, 1975; Logan, 1960).
ais como as luzes pisca-pisca podem ser refor
çadores poderosos para o comportamento de cri
anças autistas (Ferrari & Harris, 1981). E quan RELATIVIDADE DO REFORÇO
do crianças com atrasos de desenvolvimento fo
ram privadas de música ou de aprovação social, Existe uma grande variedade de reforçado
por um curto período de tempo, esses eventos tor res. Alguns são consumidos. Outros não. Alguns
naram-se reforçadores mais efetivos para outros parecem eficazes na primeira experiência que o
98 A . C h a r le s C a ta n ia
organismo tem com eles. Outros adquirem suas a restrição física, que impedia que a criança se
propriedades reforçadoras durante a vida do or batesse ou se mordesse, podia reforçar respostas
ganismo. Nenhuma propriedade física comum arbitrárias, como colocar bolinhas de gude den
permite identificar os reforçadores independen tro de uma caixa (Favell, McGimsey, & Jones,
temente de seus efeitos sobre o comportamen 1978). Uma vez que um reforçador como este
to. Por exemplo, é difícil dizer que aspecto da seja identificado, ele pode ser empregado para
atenção do professor reforça o comportamento reforçar os comportamentos que são incompatí
do aluno, mas sabemos que quando um profes veis com os comportamentos autolesivos.
sor se dirige a um aluno do primeiro grau com As risadas de uma audiência parecem ser uma
um tapinha nas costas ou com um comentário conseqüência reforçadora para o comportamen
encorajador contingente ao seu comportamento to de contar piadas. Imagine que um professor
de ler, o comportamento de estudar do aluno conte algumas piadas, a classe ri e, como resul
aumenta, enquanto outros comportamentos tado, o professor conta piadas mais freqüente
não relacionados com o estudo, como vadiar mente. Podemos dizer que as risadas reforçaram
por exemplo, diminuem (Hall, Lund, & Jack o contar piadas, mas com base apenas nessa evi
son, 1968). Sabemos também que mudanças dência não podemos dizer que o riso, em geral,
no comportamento do aluno podem reforçar seja um reforçador. Imagine agora que o profes
o comportamento do professor (Sherman & sor faça trocadilho (tentando “pegar” os alunos),
Cormier. 1974). a classe ri do professor (não cai na armadilha) e,
É tentador identificar os reforçadores com como resultado, o professor faz trocadilhos me
eventos que, coloquialmente, são chamados de nos freqüentemente. As risadas não reforçaram
recompensas, mas isso seria um erro. Os refor o comportamento de fazer trocadilhos (na ver
çadores não funcionam porque fazem o organis dade, deveríamos dizer que elas puniram tal com
mo “sentir-se bem” ou porque o organismo “gos portamento: Capítulo 6). Se o riso reforçou
ta deles”. Nossa linguagem cotidiana não captu ou puniu, depende de se ele foi contingente ao
ra as propriedades essenciais dos reforçadores. contar piadas ou ao fazer trocadilhos. De fato, o
Por exemplo, em um estudo sobre quais reforça comportamento de fazer trocadilhos provavel
dores poderiam ser efetivos no controle do com mente é mais reforçado por protestos dos alunos
portamento de pessoas com retardo mental pro (quando eles caem na armadilha do professor)
fundo, as predições baseadas na opinião dos fun do que por risos. Imagine que o professor faça
cionários sobre o que funcionaria para cada in um trocadilho, os alunos reclamem (porque são
divíduo foram inconsistentes com os reforçado “pegos”) e, como resultado, o professor tenta
res identificados por meio de uma avaliação sis “pegar” os alunos com maior freqüência. Agora
temática das preferências individuais dos sujei podemos dizer que os protestos dos alunos re
tos (Green e col., 1988; cf. Fischer e col., 1992). forçaram o comportamento de fazer trocadilhos.
Alguns eventos que, superficialmente, pare Dependendo de se as conseqüências são risa
cem “recompensadores” podem não funcionar das ou protestos, o comportamento de fazer
como reforçadores; outros, que parecem o opos trocadilhos é reforçado ou punido. (De fato,
to, podem ter poderosos efeitos reforçadores. Por as risadas contingentes aos trocadilhos podem
exemplo, seria difícil imaginar que despencar de ser ruins o bastante para fazerem um homem
um lugar elevado ou ser violentamente torcido e chorar). A efetividade de um reforçador de
sacudido possa ser reforçador. Mas certamente, pende da sua relação com as respostas que o
esses eventos contribuem para os efeitos refor produzem.
çadores da “montanha russa” e de outras para Quando um rato produz alimento por meio
fernálias dos parques de diversão. Parece pouco de pressões à barra, o alimento dá ao rato a opor
provável, também, que a restrição física funcio tunidade de comer. Se o alimento e a barra ficam
ne como reforçador, mas uma análise dos com simultaneamente à disposição do rato, é mais
portamentos autolesivos de três crianças com se provável que o rato coma do que pressione a
veros atrasos de desenvolvimento mostrou que barra. Agora, consideremos a hipótese de que a
A p re n d iz a g e m 99
probabilidade de uma resposta aumente se ela provável que correr, mas correr reforçou o be
criar uma oportunidade para o organismo se en ber quando as probabilidades foram invertidas.
gajar em uma outra resposta mais provável que De acordo com essa concepção, os reforçadores
ela próprias (Premack, 1959, 1971). Em outras são relativos e suas propriedades importantes são
palavras, se a resposta A é mais provável do que baseadas nas respostas às quais eles criam opor
a resposta B, a oportunidade de se engajar na tunidade de ocorrência.
resposta A pode ser usada para reforçar a res Essa relatividade foi ignorada durante muito
posta B. Se isso for verdadeiro, o alimento é um tempo. A maioria dos experimentos sobre apren
reforçador eficiente para as pressões à barra por dizagem havia se limitado a respostas de proba
um rato privado de alimento simplesmente por bilidades relativamente baixas (p. ex., pressio
que comer é geralmente mais provável do que nar a barra, com ratos) e a reforçadores que oca
pressionar a barra. sionavam respostas altamente prováveis (p. ex.,
Consideremos um experimento que inverteu alimento e comer). Esses casos eram comuns e
os efeitos de dois estímulos, manipulando as pro convenientes, mas não passavam de casos espe
babilidades das respostas ocasionadas por eles ciais. Poucos pensaram em perguntar, por exem
(Premack, 1962). As respostas de correr em uma plo, se seria possível programar situações em que
roda de atividade foram controladas, travando- as oportunidades de pressionar uma barra ou de
se ou soltando o freio da roda. A ingestão de bicar um disco poderiam ser empregadas para
água foi controlada pela introdução e retirada de reforçar o comer (p. ex., Sawisch & Denny,
um tubo de água, por um orifício em uma parede 1973). A questão não é tão forçada. A oportuni
fixa em um dos lados da roda. O comportamen dade de fazer uma boa refeição pode ser um re
to de ingerir água foi registrado por meio de um forçador eficaz, mas veja com que freqüência as
dispositivo elétrico chamado drinkômetro, que crianças são persuadidas a terminar de almoçar,
registrava as lambidas. De acordo com testes em quando outras atividades dependem disso. O
períodos curtos, quando ambas as respostas fi comer pode ser reforçador, por exemplo, quan
cavam disponíveis, correr tornou-se mais pro do uma criança só ganha a sobremesa quando
vável do que beber depois que a roda era trava termina o dever de casa, mas pode ser reforçado
da, enquanto a água permanecia disponível, mas se a criança puder assistir televisão quando ter
beber tornou-se mais provável do que correr de minar de comer.
pois que o tubo de água era removido, enquanto A relatividade do reforço pode ser melhor
a roda continuava disponível. Em cada caso, a ilustrada expandindo-se o experimento anterior
oportunidade de engajar-se na resposta mais pro para três respostas. Vamos acrescentar um co
vável reforçava a resposta menos provável. medouro à roda de atividade e ao tubo de água.
Quando correr era mais provável que beber (após Restringindo a acesso a eles de modo apropria
a restrição de acesso à roda de atividade), as lam do, podemos tomar o comer mais provável do
bidas tomavam-se mais prováveis, caso se sol que o correr na roda e este mais provável do que
tasse a trava do freio e se permitisse o rato o beber. Descobrimos, então, que correr pode ser
correr, do que se não lhe fosse dada a oportu reforçado pela oportunidade de comer, mas a
nidade de correr. Inversamente, quando beber oportunidade de correr na roda pode reforçar o
era mais provável que correr (após restrição beber; correr pode, simultaneamente, tanto re
de acesso ao tubo de água), correr se tornava forçar como ser reforçado. Essas relações são
mais provável quando isso dava acesso ao ilustradas à esquerda na Figura 5.10. Se utiliza
tubo, permitindo que o rato bebesse, mesmo mos a privação de água, tornando o beber a res
quando não tivesse efeito algum sobre a opor posta mais provável, as relações de reforço se
tunidade de beber. alteram, como ilustrado à direita, na Figura 5.10.
Isso demonstra que os reforçadores não po Em outras palavras, ao alterar as probabilidades
dem ser definidos independentemente das res relativas dessas três respostas, podemos trans
postas que reforçam. No experimento de Prema formar a oportunidade de se engajar em qual
ck, beber reforçou o correr quando beber era mais quer uma delas em um reforçador eficaz com
100 A . C h a r le s C a ta n ia
COMER BEBER
comer pode beber pode
reforçar o » reforçar o
comer
BEBER CORRER
FIGURA 5.10 Relações de reforço dadas diferentes probabilidades de respostas em uma hierarquia de comporta
mento. Quando comer é a resposta mais provável e beber a menos provável (à esquerda), a oportunidade de comer
pode reforçar o correr ou o beber, mas a oportunidade de correr pode reforçar apenas o beber. Em um outro
momento (à direita), quando beber é a resposta mais provável e correr é a menos provável (p. ex., depois de um
período de privação de água), comer ainda pode reforçar o correr, mas tanto comer como correr podem agora ser
reforçados pela oportunidade de beber.
respeito a uma das outras duas respostas ou a veis (cada uma substitui a outra como um refor
ambas. As probabilidades relativas com que di çador), mas comer e beber não são.
ferentes crianças preferem colorir livros, brin Introduzimos os reforçadores como tipos de
car com blocos de madeira ou brincar no parqui- estímulos, mas agora estamos falando deles em
nho podem ser informações úteis para alguém termos de respostas. O tratamento mudou por
que tenha que controlar o comportamento de que descobrimos que uma propriedade impor
crianças em creches ou nos primeiros anos do tante de um reforçador é o responder que ele
primeiro grau (p. ex., Wasik, 1970). ocasiona. Como o reflexo, o reforço é uma rela
A privação toma os reforçadores mais efeti ção, e não uma teoria ou uma hipótese. Essa re
vos, porque a probabilidade de uma resposta em lação inclui o responder, suas conseqüências e a
geral aumenta quando a oportunidade de se en mudança no comportamento que se segue.
gajar nela fica restrita (p. ex., Timberlake, 1980).
Mas a operação pormenorizada do princípio de
Premack tem gerado controvérsias, especialmen AQUISIÇÃO DO
te porque essa operação depende de como as pro COMPORTAMENTO
babilidades são calculadas. A escolha entre res
postas simultaneamente disponíveis pode ser Retomemos agora à aprendizagem, exami
uma medida mais satisfatória do que a propor nando como um organismo pode adquirir res
ção do tempo gasto para cada uma das respostas postas por meio de reforço. O registro A, da fi
(p. ex., Dunham, 1977; Eisenberg, Karpman, & gura 5.11 mostra um registro cumulativo hipo
Trattner, 1967). Uma complicação adicional é tético da primeira sessão em que as pressões à
que algumas respostas têm maiores possibilida barra por um rato foram reforçadas. As primei
des do que outras de se substituírem umas às ras respostas são separadas umas das outras por
outras (Bemstein & Ebbesen, 1978; Rachlin & pausas longas. Depois de pouco mais de 5 mi
Burkhard, 1978). Por exemplo, a privação da nutos, as pausas longas desaparecem e então o
oportunidade de comer um alimento pode não responder aumenta pelo resto da sessão. A aqui
tomar o comer esse alimento um reforçador efi sição da pressão à barra parece gradual. Se qui
ciente se outro alimento estiver disponível, mas séssemos repetir essas observações, poderíamos
pode fazer isso se, em vez do segundo alimento, extinguir as pressões até que as respostas vol
houver água disponível. Nesse caso, comer um tassem aos níveis prévios e, então, conduzir uma
alimento e comer outro são respostas permutá nova sessão de reforço. O registro B, da Figura
A p r e n d iz a g e m 101
AQUISIÇÃO E REAQUISIÇÃO
5.11 mostra como poderia ser o desempenho. No sessões: “Quando o reforço foi novamente in
início da sessão, devido à extinção prévia, não troduzido..., o animal não teve que reaprender
ocorre nenhuma resposta. Quando finalmente toda a seqüência, porque a seqüência inteira não
uma resposta ocorre e é reforçada, o responder havia sido extinta” (Sidman, 1960, p. 103).
imediatamente aumenta a uma taxa aproxima O reforço, então, não produz aprendizagem;
damente igual à do final da primeira sessão de produz comportamento. Ao observar se o rato
reforço. Desta vez, observamos uma aquisição pressiona a barra quando a contingência de re
abrupta e não gradual da resposta de pressionar forço está em operação e não na sua ausência,
a barra. Como reconciliar esses dois desempe estamos simplesmente interessados em até que
nhos tão diferentes? ponto o rato aprendeu as conseqüências de sua
Sidman (1960) discutiu uma alternativa à ar ação de pressionar a barra. As conseqüências do
gumentação de que a aprendizagem inicial teria responder são críticas para a aprendizagem não
produzido uma mudança irreversível: porque a aprendizagem ocorra a partir delas, mas
porque elas são o que é aprendido. Certas con
O animal aprendeu não apenas as respostas que fo tingências envolvem o modo pelo qual o ambi
ram bem-sucedidas em deslocar a barra, mas tam
bém a se dirigir à bandeja, pegar a pequena pelota,
ente é afetado pelo comportamento, sendo, por
levá-la à sua boca, etc. E essas respostas foram apren tanto, características importantes do ambiente a
didas na seqüência correta, porque o reforço das serem aprendidas pelos organismos.
mesmas estava correlacionado com os estímulos
apropriados, tanto do ambiente como do comporta
mento anterior. O ato de aproximar-se da bandeja,
por exemplo, podia ser reforçado somente depois Aprendizagem Latente
do som do comedouro; o de pegar a pelota somente
podia ser reforçado depois que a mesma tivesse ca
ído na bandeja, etc... O que extinguimos quando des
As questões precedentes estavam implícitas em
ligamos o mecanismo do comedouro?... Já não há o uma controvéria baseada em um fenômeno deno
som do comedouro, nem o ruído da pelota, nem a minado aprendizagem latente (Thistlethwaite,
visão da pelota, nem a sensação táctil da pelota, etc. 1951). Consideremos o experimento ilustrado
Aproximar-se da bandeja ainda é possível, mas so na Figura 5.12 (Tolman & Honzik, 1930; Tol-
mente na ausência de alguns de seus estímulos con
troladores. As respostas envolvidas no pegar e in
man, 1948). Ratos privados de alimento, dis
gerir a pelota não podem mais ocorrer no contexto tribuídos em três grupos, tinham que atraves
original de sua aprendizagem. Enquanto nosso pro sar um labirinto. Os ratos de um dos grupos
cedimento de extinção pode ter reduzido a resposta encontravam o alimento no compartimento-
de pressão à barra a seu nível de pré-condiciona- alvo do labirinto e, após sucessivas tentativas
mento, outros componentes da seqüência completa
aprendida poderiam não ter sofrido uma completa
diárias, as entradas nos becos sem-saída di
extinção. (Sidman, 1960, pp. 101-103) minuíram gradualmente. Em um segundo gru
po, os ratos não encontravam alimento no com-
A partir dessa análise, Sidman resumiu as partimento-alvo. Para esses animais, as entra
razões para a diferença na aquisição nas duas das nos becos sem-saída diminuíram, mas per-
102 A . C h a r le s C a ta n ia
10
FIGURA 5.12 Um experimento sobre
aprendizagem latente. Os ratos foram
submetidos a uma tentativa diária em um
(O labirinto com 14 pontos de escolha. Um
E
grupo (quadrados cheios) sempre en
contrava alimento no compartimento-
alvo e um segundo grupo (triângulos va
Sem Comida zios) nunca o encontrava. O terceiro
grupo não encontrava alimento na cai-
xa-alvo até o décimo dia (círculos va
zios), mas, a partir de então, ele era en
contrado (círculos cheios). Este grupo,
que teve desempenho como o segundo,
rapidamente se igualou ao primeiro. Os
Comida ratos vinham aprendendo o padrão do
2 - labirinto o tempo todo, assim, o alimen
Sem Comida to no compartimento-alvo fo i necessá
para Comida rio somente para que eles exibissem o
que já tinham aprendido. (Tolman &
J __ I__ I__ I Honzik, 1930)
20
Dias
A p re n d iz a g e m 103
último ponto de escolha, apenas uma virada é ganismos aprendem respostas ou relações entre
seguida da entrada no compartimento-alvo, quer os estímulos? Aprendem associações resposta-es-
ele contenha ou não o alimento. Quando o rato tímulo ou não associações estímulo-estímulo?
cheira, toca, olha e move-se no labirinto, está Um dos problemas é o de saber se os proces
emitindo respostas que têm conseqüências, em sos sensoriais deveriam ser tratados como com
bora esses comportamentos não sejam tão facil portamento. Tal tratamento seria condizente com
mente acessíveis à observação como as viradas o ponto de vista de que o comportamento deve
corretas ou as entradas nos becos sem saída. Es ser considerado quanto às relações entre os estí
sas conseqüências são o que o rato aprende. Cha mulos e as respostas, em vez de quanto aos estí
má-las de reforçadores é uma questão, princi mulos apenas ou às respostas apenas. Embora
palmente, de preferência, mas a linguagem da não possamos medir o ver e o ouvir sem ambi
aprendizagem latente parece ter levado a um beco güidade, como medimos respostas discretas, tais
sem-saída. como pressões à barra por um rato ou bicadas de
um pombo, eles são, ainda assim, comportamen
to. Dependem não apenas de que os estímulos
Aprendizagem Sensório-Motora visuais ou auditivos estejam presentes, mas tam
bém do que o organismo faz. Olhar aumenta a pro
As conseqüências nesses experimentos com babilidade de ver, assim como o ouvir aumenta a
ratos apresentaram, principalmente, estímulos probabilidade de escutar. O organismo não é pas
que, em geral, têm significado biológico para a sivo em seu contato com o ambiente.
sobrevivência do organismo (p. ex., alimento e Os sons, as luzes e outros eventos básicos
água). Mas muitas conseqüências aparentemen têm sido descritos, às vezes, como estímulos
te menos importantes são relevantes em nossas neutros em relação a reforçadores ou punidores
interações cotidianas com o meio ambiente, potencialmente fortes (p. ex., a comida e o cho
como aquelas implicadas na aprendizagem la que). Mas, o rótulo neutro, embora conveniente,
tente. Estamos cercados de contingências em que é um nome enganoso. Os eventos não podem ser
um reforçador se segue a uma resposta, mas elas verdadeiramente neutros se forem conseqüências
são facilmente negligenciadas (ver Parsons, do comportamento, porque é improvável que não
1974, para um exemplo humano). Abrimos um tenham algum efeito sobre o comportamento.
livro para ler. Ouvimos para entender o que al Contudo, antes que a relatividade dos reforça
guém está dizendo. Estendemos a mão em dire dores fosse reconhecida, as demonstrações dos
ção ao lápis, para pegá-lo. Cada conseqüência efeitos reforçadores de estímulos como luzes e
estabelece a ocasião para novas respostas. Quan sons eram recebidas com ceticismo. Ao longo
do terminamos uma página de um livro, viramos de repetidos experimentos, entretanto, o fenô
a página e lemos a seguinte; quando o conferen meno chamado reforço sensorial tomou-se es
cista acabou de falar, fazemos perguntas ou co tabelecido (Kish, 1966). Por exemplo, a ação de
mentários; quando pegamos o lápis, escrevemos pressionar a barra por um rato no escuro aumen
alguma coisa com ele. Na medida em que cada tava transitoriamente se as pressões acendiam
caso envolve um comportamento mantido por brevemente uma luz. Em outras palavras, a luz
suas conseqüências, eles podem ser discutidos servia temporariamente como um reforçador fra
com a terminologia do reforço. Ver reforça o co. Fenômenos como esses logo passaram a ser
olhar, ouvir reforça o escutar, e tocar ou pegar discutidos em termos de comportamento explo
um lápis reforça o ato de estender a mão em di ratório e curiosidade, e os experimentos foram
reção a ele. ampliados para uma variedade de conseqüências
A interação dos processos sensoriais com o sensoriais. Por exemplo, se um macaco está so
comportamento tem sido uma fonte permanente zinho em uma câmara fechada, a oportunidade
de controvérsias na Psicologia da Aprendizagem. de olhar para outros macacos do lado de fora
Os teóricos tomaram partido nos debates sobre pode ser usada para reforçar a operação de um
se a aprendizagem é motora ou sensorial. Os or interruptor (Butler, 1957).
104 A. C h a r le s C a ta n ia
Nessas pesquisas, o experimentador avalia os gatos estavam atrelados a uma espécie de car
afeitos das conseqüências sensoriais sobre uma rossel em miniatura, mas um deles se movia ati
resposta escolhida por ser fácil de medir. Mas, vamente (A), enquanto o outro era transportado
;m qualquer ambiente, o comportamento do or passivamente (P). O gato ativo apoiava-se no
ganismo terá, inevitavelmente, conseqüências piso da câmara, enquanto o passivo era coloca
sensoriais. O organismo altera seu ambiente, sim do dentro de uma caixa suspensa a uma pequena
plesmente, locomovendo-se de um lugar para distância do piso. Enquanto o gato ativo andava
nutro; as coisas que ele vê e toca mudam à medi- em volta do cilindro central, o gato passivo den
ia que se locomove, e as relações espaciais en tro do transportador percorria uma distância cor
tre os componentes de seu ambiente são uma respondente no outro lado. Se o gato ativo fizes
sarte fundamental do que ele aprende (Gallistel, se meia volta, em vez de continuar na mesma
1990). direção, um sistema de polias fazia o transporta
Um experimento realizado por Held e Hein dor virar-se, de modo que o gato passivo tam
'1963) ilustra tais relações entre o comportamen bém voltava-se para a nova direção.
to e as conseqüências sensoriais. Pares de gati Ambos os gatos eram expostos a estimulos
lhos foram criados no escuro; suas primeiras ex visuais semelhantes, mas os estímulos para o gato
periências com estimulação visual ocorreram no ativo eram uma conseqüência de seu próprio
iparelho mostrado na Figura 5.13. Ambos os ga comportamento, enquanto que os do gato passi
tos recebiam o mesmo tipo de estimulação vi vo não o eram; eles dependiam dos movimentos
sual; cada um usava um anteparo que os impe do gato ativo e não dos seus próprios movimen
lia de ver o próprio pé e corpo; o grande cilin tos. Os dois gatos foram, então, submetidos a
dro central impedia-os de ver um ao outro e am- testes padrão de coordenação visuomotora, tais
30S viam o mesmo padrão de listras verticais como a colocação da pata com auxílio da visão
nretas e brancas que cobriam uniformemente as (gatos normais estendem suas patas em direção
saredes da câmara circular em que estavam. Os à borda de uma mesa ou de outras superfícies
FIGURA 5.13 Um aparelho para estudar a relação entre o comportamento e a estimulação visual. Tanto o gato
ativo (A) como o passivo (P) eram atrelados a um sistema de polias, sustentado na coluna central. O gato A apoia-
se no piso, enquanto que o gato P fica suspenso em um carrinho. A medida que o gato A se locomove, o sistema de
polias replica suas mudanças de posição para o gato P (ver setas). (Held & Hein, 1963, Figura 1)
A p re n d iz a g e m 105
horizontais quando suspensos no ar a uma pe pequena escala podem ter profundas conseqüên
quena distância das mesmas). Embora a exposi cias. Se notamos algo enquanto olhamos com o
ção de ambos os gatos aos estímulos visuais te canto do olho, a probabilidade de vê-lo clara
nha sido eqüivalente, apenas o gato ativo res mente é maior se olharmos em direção a ele do
pondeu apropriadamente àqueles testes; o gato que se olharmos para longe dele (exceto sob ilu
passivo tomou-se capaz de responder apropriada minação insuficiente, quando vemos um objeto
mente mais tarde, depois de ter tido oportunidade mais claramente se olharmos não diretamente
de andar livremente em uma sala iluminada. para ele, mas sim levemente ao lado dele). Su
Este experimento tem muito em comum com ponhamos, então que, em relação a um campo
o clássico experimento de Stratton (1897), que, visual uniforme, ver um contorno tal como a bor
por oito dias, usou prismas que invertiam e re da de um objeto pode reforçar o movimento do
vertiam seus campos visuais. De início, seu mun olho. Deveríamos esperar que os movimentos de
do parecia de cabeça para baixo e de trás-para- olho se tomassem coordenados com o campo vi
a-frente e os seus movimentos não eram coorde sual. Os dados disponíveis acerca de movimen
nados com o meio ambiente. Por exemplo, ao tos do olho de crianças recém-nascidas são con
andar, ele olhava para o chão para ver onde pi sistentes com essa noção. Por exemplo, quando
sava, mas, por causa da inversão produzida pe as crianças são expostas a uma figura simples
los prismas, descobriu que estava olhando para tal como um triângulo em um campo visual uni
o teto e não para o chão. Da mesma forma, tinha forme, elas tendem a fixar-se mais demorada e
dificuldades em apontar para os objetos ou al mais precisamente nos contornos e vértices do
cançá-los, porque as coisas vistas antes abaixo triângulo à medida que a experiência visual pro
do nível do olhar eram agora vistas acima, e as gride (p. ex., Salapatek & Kessen, 1966).
coisas à direita eram agora vistas à esquerda e Temos muito a aprender sobre quão arbitrá
vice-versa. Com o passar do tempo, contudo, a rias podem ser tais relações entre as respostas e
coordenação melhorou, e Stratton relatou que o as conseqüências (cf. Hein e col., 1979). Por
mundo não mais lhe parecia assim tão de cabeça exemplo, suponhamos que um sistema óptico pu
para baixo. desse projetar estímulos visuais no campo de
As conseqüências do comportamento são visão de uma criança e alterar as conseqüências
novamente cmciais. Olhar e mover-se no cam naturais dos movimentos dos seus olhos. O sis
po visual têm conseqüências diferentes com e tema apresenta estímulos apenas quando a crian
sem o uso de prismas inversores, e o ajustamen ça olha adiante, em linha reta. Um estímulo apa
to aos prismas requer que as novas conseqüên rece no campo visual direito. Se a criança olha à
cias sejam aprendidas. Por exemplo, ver o chão, direita, o estímulo desaparece. Mas se ela olha à
quando se anda, é importante. Mas, quando se esquerda, o estímulo se desloca para a esquerda,
começa a usar os prismas inversores, ver o chão, para onde a criança está olhando agora (e vice-
que era uma conseqüência de olhar para baixo, versa para estímulos no campo visual esquerdo).
toma-se uma conseqüência de olhar para cima Em outras palavras, esse sistema óptico criaria
(nessa situação, naturalmente, para cima ou para um mundo em que a criança poderia fixar um
baixo podem ser definidos quer em relação ao objeto apenas ao olhar para longe dele (cf. Schro-
campo visual, quer em relação ao corpo; cf. Har eder & Holland, 1968).
ris, 1965). Assim, se ver o chão é reforçador para A criança provavelmente aprenderia como
quem está andando e se alguém anda enquanto olhar para as coisas nesse experimento, mas nós
está usando prismas inversores, ver o chão re deveríamos pensar duas vezes antes de realizá-
forçará a resposta de olhar para cima em vez da lo. As áreas visuais do cérebro têm seu desen
de olhar para baixo. volvimento crítico na infância, tanto em huma
Com a discussão da visão invertida de Strat nos quanto em gatos (p. ex., Blakemore & Coo
ton, fomos da locomoção do organismo no am per, 1970; Freeman, Mitchell, &Millidot, 1972).
biente até respostas de magnitude menor como Algumas mudanças iniciais podem ser modifi
os movimentos do olho. Mesmo as respostas de cadas mais tarde, mas outras podem ser relativa
106 A . C h a r le s C a ta n ia
mente permanentes. Por exemplo, uma criança responder aumenta por causa de suas conseqüên
com problemas precoces na visão binocular pode cias. A extinção demonstra que o reforço tem
nunca adquirir uma percepção apropriada de pro efeitos temporários, mas outros efeitos acompa
fundidade, se os problemas não forem corrigi nham a extinção e podem ser superpostos ao
dos antes da idade adulta. Algumas coisas são decréscimo no responder que ela produz. A ex
mais facilmente aprendidas do que outras, em tinção é complicada, porque envolve suspender
geral ou em alguns momentos particulares, e al tanto a contingência quanto as apresentações do
gumas coisas aprendidas são mais facilmente estímulo. As contribuições de contingências e
alteradas do que outras. Por um lado, podemos de apresentações de estímulo para o comporta
relutar em usar o reforço como explicação para mento podem ser isoladas umas das outras, com
o comportamento que é aprendido muito cedo e parando os procedimentos de reforço, extinção
que é relativamente permanente; por outro, deve e superstição. A relação de reforço é relativa.
se tomar cuidado em não o descartar quando a Um estímulo que propicia uma oportunidade para
manutenção do comportamento poderia depen a emissão de uma resposta pode reforçar uma
der da permanência, ao longo de toda a vida do outra resposta menos provável e, assim, as rela
indivíduo, das contingências que originalmente ções de reforço podem ser revertidas alterando-
criaram o comportamento. As contingências e se as probabilidades de respostas por meio de
as conseqüências são parte da descrição do que operações estabelecedoras como a privação. Fe
aprendemos, mesmo com respeito a nossas inte nômenos como a aprendizagem latente e a apren
rações mais simples com eventos do mundo. dizagem sensório-motora demonstram que o re
Começamos este capítulo com uma breve forço não é uma explicação de aprendizagem;
história da Lei do Efeito: caixas-problema, labi antes, faz parte da descrição do que é aprendido.
rintos, pistas e câmaras operantes. Desses apa Os organismos aprendem as conseqüências de
relhos e métodos emergiu o princípio do reforço seu próprio comportamento.
como um termo descritivo apropriado quando o
A p re n d iz a g e m 107
As Conseqüências do Responder:
Controle Aversivo
A p re n d iz a g e m 109
FIGURA 6.1 Efeitos do reforço e da punição sobre a pressão à barra hipotética por um rato privado de alimento.
O gráfico superior apresenta as respostas de pressão à barra na ausência do reforço (linha de base), o aumento
quando as pressões à barra produzem alimento (reforço) e o retomo a níveis anteriores quando o reforço é inter
rompido (extinção). O gráfico inferior mostra o responder mantido pelo reforço (linha de base), seu declínio
quando o choque elétrico, produzido pela resposta, é superposto a este desempenho (punição), e o retomo aos
níveis anteriores elevados quando a punição é interrompida (recuperação). O comportamento de pressionar man
tido pelo reforço é a linha de base sobre a qual os efeitos da punição estão ilustrados no gráfico inferior, porque o
decréscimo do responder não pode facilmente ser visto quando o responder está com freqüência baixa.
a freqüência inicial de respostas deve ser maior os procedimentos são mantidos e desaparecem
do que zero, do contrário, nenhum declínio seria depois que eles são interrompidos (o responder
observado. Neste exemplo, o responder já é man retoma aos níveis prévios à introdução da ope
tido pelo reforço alimentar que permanece ao ração de reforço ou de punição). Efeitos reais (e
longo de todas as sessões; assim os efeitos da não-hipotéticos) da punição são descritos na Fi
punição podem ser avaliados por meio da super gura 6.2 (Estes, 1944).
posição da punição sobre esta linha de base. A Os efeitos ilustrados na Figura 6.2 são cla
linha de base mostra o responder mantido, antes ros. Todavia, a efetividade da punição tem sido
da resposta de pressionar a barra ser punida. classicamente objeto de controvérsias. A puni
Quando a punição é iniciada, as pressões à barra ção foi incorporada nas primeiras versões da Lei
diminuem até um nível baixo e constante. Na re do Efeito de Thomdike (cf. Capítulo 5). Thom-
cuperação, a punição é interrompida e o respon dike afirmava, então, que o comportamento po
der, gradualmente, retoma ao nível anterior da dia ser apagado (stamped out), por estados de
linha de base. coisas desagradáveis, e fixado (stamped iri) por
O reforço e a punição são simétricos: o pri estados gratificantes. As formulações da lei do
meiro aumenta o responder, enquanto a última efeito de Thomdike, que incluíam o componen
diminui, mas seus efeitos continuam enquanto te de punição, foram chamadas de Lei do Efeito
110 A . C h a r le s C a ta n ia
notar a redução e notaram apenas a recuperação
do responder depois que a punição era interrom
pida. O que se segue fornecerá boas razões para
concluir que outras técnicas, que não a punição,
deveriam ser seriamente consideradas, sempre
que possível. Mas, se essa conclusão está corre
ta, isto será apenas porque Thorndike e seus su
cessores estavam certos por razões erradas.
Mais recentemente os investigadores têm-se
voltado novamente para a punição e estudado as
condições que modificam sua efetividade em
suprimir o comportamento (p. ex., Azrin & Holz,
1966; Church, 1963). Por exemplo, experimen
tos com choque elétrico como estímulo punitivo
FIGURA 6.2 Registro cumulativo do efeito de punição para respostas de bicar o disco, que vinham sen
superposto a uma linha de base de reforço com comida, do reforçadas com alimento, em pombos, mos
mantida ao longo da sessões. A resposta era a pressão traram que quanto mais intenso e imediato o es
à barra por um rato e o estímulo punitivo era choque. A
taxa de pressões diminuiu durante a punição e fo i recu
tímulo punitivo tanto mais eficaz ele será. Um
perada após a retirada da punição. (Estes, 1944, Figu estímulo punitivo, introduzido com sua intensi
ra 10.) dade máxima, suprime o responder mais efeti
vamente do que um introduzido com intensida
de baixa, que aumenta gradualmente até a inten
Forte. Mais tarde, Thorndike retirou o compo sidade máxima. Além disso, a efetividade do es
nente de punição; a versão que permaneceu in tímulo punitivo pode mudar ao longo de exten
cluía apenas a fixação do comportamento e foi sos períodos de punição, quando, por exemplo,
chamada de Lei do Efeito Fraca. Thorndike ba um estímulo punitivo de intensidade baixa se
seou suas conclusões em experimentos de apren toma, gradualmente, ineficaz após muitas apresen
dizagem verbal humana, nos quais dizer “certo” tações (cf. Azrin & Holz, 1966, pp. 426-427). E,
para o aprendiz aumentava o responder, enquanto como ocorre com a extinção, é mais fácil reduzir a
que dizer “errado” tinha menos efeito do que não probabilidade de uma resposta quando alguma ou
dizer nada. Thorndike aceitou essa descoberta tra resposta que produz o mesmo reforçador está
como uma evidência geral contra a efetividade disponível do que quando não há respostas alter
da punição. nativas que produzam o mesmo reforçador.
A conclusão de Thorndike teve tal impacto Experimentos sobre as propriedades da pu
que, mesmo os dados da Figura 6.2 foram inter nição não apenas mudaram os critérios para se
pretados como significando que a punição era avaliar a efetividade da punição; eles também
um procedimento ineficaz. Com base na recupe levantaram dúvidas se a punição tinha sido jul
ração do responder, após a interrupção da puni gada adequadamente, de acordo com os crité
ção, o argumento era que a punição não deveria rios antigos. Ocasionalmente, um único estímu
ser tomada seriamente como uma técnica para o lo punitivo ou alguns, se suficientemente inten
manejo de comportamento, uma vez que ela po sos e se aplicados como conseqüência de uma
dia suprimi-lo apenas temporariamente. Contu resposta fracamente mantida, podiam fazer a res
do, com base nesse critério, o reforço também posta desaparecer até mesmo pelo resto da vida
deveria ser considerado ineficaz. Por algum mo do organismo. Tais efeitos excepcionais podem
tivo, os critérios empregados para avaliar a efe bem ser considerados como permanentes, mas
tividade da punição foram diferentes daqueles por que deveríamos ficar surpresos se a recupe
empregados para avaliar a efetividade do refor ração, às vezes, fosse tão lenta que ultrapassasse
ço. Muito embora o responder fosse reduzido du o tempo de vida do organismo? Consideremos
rante a punição, os investigadores tenderam a não um argumento análogo para o reforço. Se alguém
A p r e n d iz a g e m 111
comprasse um bilhete de loteria e ganhasse um choque, mas é também possível dizer que o or
prêmio de dez mil dólares, não nos surpreende ganismo está passivamente se esquivando do es
ríamos se descobríssemos que a compra ocasio tímulo punitivo, evitando descer da mesma. Tal
nal de bilhetes de loteria continuasse ao longo uso do termo possibilitou que os procedimentos
de toda a vida da pessoa, muito embora este com efetivos de punição fossem discutidos no voca
portamento jamais viesse a ser reforçado nova bulário de esquiva passiva, enquanto outros pro
mente. Não rejeitaríamos a existência da extin cedimentos que não reduziam o responder fo
ção com base nisso; portanto, não deveríamos ram usados para defender a noção de que a pu
rejeitar a recuperação após a punição por causa nição era ineficaz.
de casos episódicos de seus efeitos duradouros. O termo punição se aplica à relação entre o
Algumas características incidentais da puni responder e a conseqüência. A questão é, princi
ção, provavelmente, contribuíram para que ela palmente, saber quando a aplicação do termo é
fosse tratada de modo tão diferente. Uma redu apropriada. Desde cedo, em sua evolução, a aná
ção no responder pode ser estudada apenas se lise da punição enfatizou a transitoriedade de
algum responder já existir. Uma resposta que seus efeitos. Por essa razão, a punição permane
jamais é emitida não pode ser punida. Assim, ceu por longo tempo não reconhecida como uma
experimentos em punição, freqüentemente, su operação comportamental fundamental. Mas a
perpõem a punição ao responder mantido por re existência de conseqüências que reduzam o res
forço. Mas os efeitos da punição podem, então, ponder já não é questionada. A punição é para
depender do que mantém o responder. Por exem lela ao reforço, exceto pelo fato de que os efei
plo, se pressões à barra são punidas com choque tos diferem quanto ao sinal: o reforço aumenta o
elétrico, o pressionar a barra reforçado com ali responder reforçado, e a punição reduz o respon
mento diminuirá menos se um rato estiver seve der punido. Ambas as operações têm efeitos tem
ramente privado de alimento do que se ele esti porários; quando são interrompidas, o responder
ver apenas moderadamente privado. retoma aos níveis prévios. Uma vez que a puni
Outra dificuldade é que os estímulos puniti ção pode modificar o comportamento humano,
vos tendem a ter outros efeitos que ocorrem in surgirão, invariavelmente, questões acerca da
dependentemente de eles serem ou não produzi ética de sua aplicação. Mas não é provável que
dos pelas respostas. Como no caso do reforço, o tais questões sejam resolvidas sem que seja feita
efeito da punição deve depender da relação en uma análise adequada de suas propriedades.
tre as respostas e os estímulos punitivos (con
tingência) e não simplesmente da aplicação cle
punidores. Por exemplo, o choque elétrico pode A RELATIVIDADE DA PUNIÇÃO
diminuir a taxa com que um pombo bica um dis
co, mesmo que os choques sejam administrados Em experimentos sobre punição, os estímu
independentemente do bicar o disco. Assim, antes los punitivos são escolhidos, freqüentemente, por
de tratá-los como estímulos punitivos, é necessá seu efeito fidedigno sobre uma variedade de res
rio demonstrar que os choques têm efeito maior postas, porque tais estímulos revelam mais cla
quando produzidos pelo bicar do que quando ocor ramente os efeitos da punição. Um desses even
rem independentemente do bicar (cf. Azrin, 1956). tos é o choque elétrico, que pode ser medido pre
Os preconceitos contra o reconhecimento da cisamente e que pode ser apresentado em inten-
punição foram tão fortes que os procedimentos sidades efetivas, sem danificar o tecido orgâni
efetivos foram até mesmo chamados por um co. Tais estímulos, contudo, são apenas casos
nome diferente, esquiva passiva. Por exemplo, extremos de punidores. Por exemplo, como vi
consideremos um rato que esteja numa platafor mos anteriormente, crianças com o desenvolvi
ma, acima de uma grade eletrificada. Ao pisar mento cronicamente comprometido, apresentam
na grade, o rato recebe o choque e toma-se me comportamentos de bater a cabeça, morder as
nos propenso, no futuro, a descer. É apropriado mãos e outros comportamentos autolesivos. Uma
dizer que ao descer da plataforma é punido pelo breve esguichada no rosto com um tipo de spray
112 A. C h a r le s C a ta n ia
utilizado para umedecer plantas em ambientes Pode-se, então, tornar o girar da roda uma con
fechados é, na pior das hipóteses, um pequeno seqüência do beber: cada vez que o rato bebe, a
aborrecimento. No entanto, quando aplicado roda começa a girar, e o rato é forçado a correr.
contingentemente a tais comportamentos, é um Quando o correr é mais provável que o beber,
punidor efetivo (Dorsey e col., 1980). Assim esta operação aumenta o beber, e é apropriado
sendo, o estímulo é relativamente inofensivo, dizer que o beber é reforçado pelo correr. Mas,
especialmente se comparado aos sérios danos que quando o correr é menos provável que o beber,
essas crianças podem exercer sobre si mesmas esta operação tem um efeito oposto: agora o be
(porém, quem se opõe a qualquer uso de puni ber diminui quando o correr é a sua conseqüên
ção considera essa aplicação inaceitável). cia, e é apropriado dizer que o beber é punido
A punição é inevitável, pois está embutida pelo correr. Se suas probabilidades relativas po
em muitas contingências naturais. Uma criança dem ser revertidas, como ilustradas neste exem
que provoca um cachorro que está latindo pode plo, qualquer resposta em particular pode ser re
ser mordida, e uma criança que brinca com fogo forçada ou punida por qualquer outra resposta.
pode se queimar. Além disso, mesmo os estímu Os estímulos e as respostas em experimen
los que geralmente servem como reforçadores tos típicos de reforço e punição têm sido esco
podem, sob certas condições, tomarem-se puni- lhidos de modo a fazer com que esses procedi
dores. Por exemplo, a comida, que é reforçadora mentos funcionem (p. ex., com ratos privados
no início de uma festa, pode se tomar aversiva de comida, comer é muito mais provável do que
ao final da refeição. Por outro lado, eventos que pressionar a barra). Eles obscurecem, assim, a
superficialmente parecem aversivos, como des reversibilidade potencial das conseqüências
pencar de lugares altos, podem ser reforçadores como reforçadoras e punitivas. O responder pode
sob certas circunstâncias (consideremos o saltar ser aumentado ou reduzido pela mudança de suas
de pára-quedas e andar na montanha-rassa). Da conseqüências, e esses efeitos são determinados
mesma forma que os reforçadores, os punidores pelas propriedades comportamentais, e não pe
não podem ser definidos em termos absolutos, las propriedades físicas, das conseqüências.
nem especificados em termos de propriedades
físicas em comum. Eles devem ser avaliados com
base na relação entre as respostas punidas e as EFEITOS COLATERAIS DA PUNIÇÃO
respostas ocasionadas pelo estímulo punitivo.
O princípio de reforço de Premack (Capítulo Da mesma forma que os reforçadores, os es
5) afirmava que uma oportunidade de executar tímulos punitivos podem ter efeitos independen
respostas mais prováveis reforçaria as respostas tes de sua relação de contingência com as res
menos prováveis. Essa análise foi também es postas. Se um organismo recebe um choque, uma
tendida à punição (Premack, 1971). Retornemos queimadura ou uma beliscada, algumas de suas
ao equipamento que pode controlar as oportuni respostas podem ter pouco a ver com o fato de
dades de um rato correr em uma roda de ativida esses eventos terem sido ou não produzidos pelo
de ou beber em um tubo de líquido. O equipa próprio comportamento desse organismo. Sur
mento foi modificado por um motor que pode gem dificuldades para analisar a punição por
travar a roda de atividade numa posição, impe que tais efeitos devem ser distinguidos daqueles
dindo o rato de correr, ou girá-la a uma veloci que dependem da relação entre as respostas e
dade fixa, forçando o rato a correr. suas conseqüências. Alguns efeitos do choque
Nesse aparato, o ato de privar um rato da podem ser primariamente fisiológicos, por exem
oportunidade de correr, enquanto ele tem acesso plo, quando choques sucessivos reduzem, siste
livre à água, toma o correr mais provável que o maticamente, a resistência da pele de um rato.
beber, e privá-lo de água, enquanto ele tem opor Dependendo da natureza da fonte do choque, a
tunidade de correr, toma o beber mais provável efetividade dos choques subseqüentes pode, en
que o correr (cf. as probabilidades relativas de tão, variar com a resistência do rato. Outros efei
correr e beber nas duas partes da Figura 5.10). tos são primariamente comportamentais, como
A p re n d iz a g e m 113
quando o aparato possibilita a ocorrência de res apropriado afirmar que o choque produzido pela
postas por meio das quais o organismo pode re resposta era um estímulo punitivo. Os eventos
duzir seu contato com a fonte de choque (p. ex., afetam mais o comportamento quando, em tro
o pêlo é um isolante, e os ratos, às vezes, conse ca, o comportamento pode afetar esses eventos
guem minimizar os efeitos do choque, pressio (Rachlin, 1967, p. 87). Do mesmo modo que de
nando a barra enquanto se deitam de costas; Azrin vemos distinguir entre os efeitos das aplicações
& Holz, 1966). Em qualquer caso, tais efeitos co do reforçador e os efeitos da relação contingen
laterais devem ser levados em consideração. te entre as respostas e os reforçadores, assim tam
bém devemos distinguir os efeitos das aplica
ções do estímulo punitivo daqueles efeitos da
Efeitos Eliciadores dos Estímulos Punitivos relação contingente entre as respostas e os estí
mulos punitivos.
A Figura 6.3 foi extraída de um experimento A punição de duas classes de comportamen
(Camp, Raymond & Church, 1967) que compa to típicas de uma espécie de ratos do deserto
rou os efeitos de choques produzidos pelas res (Mongolian gerbil) representa um outro exem
postas e de choques independentes de respostas. plo (Walters & Glazer, 1971; ver também
As pressões à barra foram mantidas por reforço Shettleworth, 1978). O ato de escavar na areia,
alimentar em três grupos de ratos. Medido em que é parte do comportamento de construção de
relação a um grupo de controle que não recebeu sua toca, consiste em cavar a areia e chutá-la para
choque, o responder dos dois grupos expostos a trás; postar-se alerta, uma reação defensiva oca
choque diminuiu, mas o choque produzido pela sionada por estímulos súbitos ou aversivos, con
resposta suprimiu o responder mais do que o cho siste em postar-se ereto nas patas traseiras com
que independente da resposta (ver também Chur as orelhas levantadas. Aplicar o choque na cai
ch, 1969). Com base nessa diferença, parece xa de areia em que o experimento foi conduzido
era difícil, então um som foi estabelecido como
estímulo aversivo, emparelhando-o repetidamen
te com o choque em uma situação diferente.
Quando contingente ao escavar, o som funcio
nou como um estímulo punitivo eficaz. O esca
var diminuiu quando produzia o som e aumen
tou novamente após a suspensão da contingên
cia; enquanto o escavar diminuiu, postar-se em
alerta, aumentou. No entanto o som contingente
ao postar-se em alerta não foi efetivo. Postar-se
em alerta aumentou e não voltou aos níveis pré
vios durante várias sessões depois que a contin
gência foi interrompida; neste caso, não houve
mudanças apreciáveis no escavar. O efeito elici-
ador do som sobre a postura de alerta foi mais
poderoso que seus efeitos punitivos. Assim, na
Sessões punição como no reforço, é importante reconhe
cer os efeitos separados das contingências respos-
FIGURA 6-3. Efeitos de choques independentes das
respostas e de choques produzidos pelas respostas sobre ta-estímulo e das apresentações de estímulos.
pressões à barra mantidas por reforço alimentar em Como outro exemplo, consideremos um ma
ratos. A taxa de choques no grupo que recebeu choques caco em uma cadeira de restrição, com eletro
independen tes das respostas fo i emparelhada com a do dos de choque ajustados em sua cauda, (p. ex.,
grupo que recebe choques produzidos pelas respostas, Morse & Kelleher, 1977, pp. 193-198). A inter
mas estes reduziram mais o responder do que os cho
ques independentes das resposta. (Camp, Raymond, & valos de 5 minutos, uma pressão à barra pelo
Church, 1967, Figura 5.) macaco produz um choque em sua própria cau-
114 A . C h a r le s C a ta n ia
da. Logo após a colocação do macaco na cadei entre os dois esquemas, eles alternavam para o
ra, ele começa a pressionar a barra. Finalmente, esquema com um intervalo mais longo entre os
5 minutos se passam e a próxima pressão pro choques (Pitts & Malagodi, 1991). Em outras pa
duz um choque (essa programação é denomina lavras, dentre os choques mais e menos freqüen
da de esquema de intervalo fixo 5min; ver Capí tes, os macacos preferiram aplicar em si mes
tulo 10). O macaco salta e guincha brevemente mos os menos freqüentes. Talvez nos lembre
e, durante certo tempo, deixa de pressionar a bar mos da efetividade da restrição física como re
ra. Mas logo ele recomeça a pressionar, respon forçador com algumas crianças que se engajam
dendo cada vez mais rapidamente, até que ele em comportamentos autolesivos (Capítulo 5);
próprio ocasione o choque ao final do próximo elas preferem a situação com restrição, em que
intervalo de 5 minutos. Esse desempenho se re não podem machucar a si mesmas, às situações
pete ao longo de sessões diárias. Quando o cho sem restrição, em que elas poderiam se machu
que é suspenso, as pressões à barra praticamen car (e machucam-se).
te cessam; quando o choque é reintroduzido, o Se o comportamento humano inclui proble
pressionar retorna. Se o nível de choque é au mas como comportamentos autolesivos, nossa
mentado, o pressionar a barra aumenta; se o ní preocupação com tal fenômeno é justificada.
vel de choque é diminuído, ele diminui. Os cho Temos visto que, às vezes, é mais apropriado
ques dependem inteiramente do comportamento comparar o choque produzido pela resposta com
do macaco; ele não os receberia se não pressio o choque independente da resposta do que com
nasse a barra. Por que o macaco simplesmente uma situação sem choques. O choque elétrico
não pára de pressionar? elicia respostas manipulativas, como pressionar
O paradoxo é que o mesmo choque que man a barra, nos macacos. Esses efeitos eliciadores
tém o responder, quando produzido pelo pressi do choque podem ser fortes o suficiente para anu
onar de acordo com o esquema de intervalo-fixo lar seus efeitos punitivos, de modo que o pressio
5min, suprime o responder quando é produzido nar a barra ocorre a despeito, e não por causa, da
por cada pressão à barra; o mesmo choque tam contingência punitiva. Nesse sentido, o caso pode
bém pode ser empregado para iniciar e manter ser análogo àquele em que o pai tenta fazer uma
comportamentos de fuga e esquiva (p. ex., Bar criança parar de chorar punindo o choro e tem pro
rett & Stanley, 1980). Então, como podemos blemas, visto que o estímulo punitivo elicia a mes
decidir se a terminologia da punição é apropria ma resposta que ele está tentando suprimir.
da? Se cada pressão à barra produz um choque,
podemos chamar o choque de estímulo puniti
vo, porque ele reduz o responder. Mas quando Efeitos Discriminativos dos Estímulos
as pressões à barra produzem choques apenas a Punitivos
intervalos de 5 minutos, deveríamos chamar o
choque de reforçador, porque ele gera mais res Um outro efeito colateral da punição pode
postas? (De nada adianta ceder à tentação de cha ocorrer, porque os estímulos punitivos podem
mar o macaco de masoquista. Masoquismo é sim adquirir propriedades discriminativas, como
plesmente um nome que usamos quando um es quando uma resposta é reforçada apenas quan
tímulo, o qual acreditamos que deveria ser um do também é punida. Um experimento planeja
punidor funciona como reforçador; o termo não do para fazer com que um choque produzido por
é explanatório). uma resposta sinalizasse a disponibilidade de
Outro experimento mostrou que um esque comida programou duas condições alternativas
ma em que as pressões à barra produzem um (Holz & Azrin, 1961). Em uma delas, as bicadas
choque a cada dois minutos, geralmente man do pombo não tinham conseqüências; na outra,
tém taxas de pressionar mais altas do que as pro cada bicada produzia um choque e algumas bi
duzidas por um esquema em que as respostas cadas produziam um alimento. O bicar era man
produzem um choque a cada seis minutos; quan tido a uma taxa baixa, quando as respostas não
do os macacos tinham oportunidade de escolher produziam um choque porque, neste caso, tam
A p re n d iz a g e m 115
bém não produziam alimento; mas o bicar au surrada, porque a surra geralmente é seguida por
mentou assim que as respostas começaram a pro uma quantidade de atenção do pai arrependido
duzir choques, pois elas apenas ocasionalmente que é maior do que a atenção nas interações
produziam alimento. Amostras dos registros em menos traumáticas entre o pai e a criança. Neste
que o reforço com comida foi completamente sus exemplo, a surra é análoga ao choque na Figura
penso são mostradas, com dois pombos, na Figura 6.4 e a atenção do pai, análoga à comida. A aten
6.4. Na ausência de choque a taxa de bicadas foi ção de um pai pode ser um reforçador poderoso
baixa. Quando as respostas começaram a produzir e, freqüentemente, pode superar os efeitos das
choques, a taxa aumentou. Quando o choque foi conseqüências que, de outra forma, serviriam
suspenso, um breve aumento na taxa (setas) foi como estímulos punitivos. Assim, uma análi
seguido por uma redução aos níveis prévios. se comportamental pode ser relevante para
Novamente poderíamos nos perguntar se os problemas humanos como a violência contra
choques poderiam ser chamados de estímulos a criança.
punitivos. De fato, deveríamos concluir, com Vimos que a punição é o oposto do reforço;
base na Figura 6.4, que o choque era um refor- ela é definida pelas reduções no responder con-
çador. A principal diferença aqui entre o choque seqüenciado, enquanto o reforço é definido pe
e outros reforçadores mais familiares é que o cho los aumentos. A terminologia da punição é pa
que adquiriu seu poder de reforçar por meio de ralela àquela do reforço: os punidores são estí
sua relação com o alimento; ele perde seu poder mulos, e a punição é uma operação ou processo.
se a relação for interrompida. Talvez esses pro Os efeitos da punição geralmente são temporá
cedimentos sejam relevantes para o comporta rios; o responder freqüentemente retoma aos ní
mento humano. Por exemplo, uma criança que veis prévios da linha de base, depois que a puni
apanhou pode ter provocado o pai a ponto de ser ção é interrompida. Ao estudar a punição, a taxa
de respostas em linha de base deve ser alta o su
ficiente para tomar a redução no responder fa
cilmente visível; por essa razão, os experimen
Sem Choque Produzido Sem
Choque pela Resposta Choque tos com a punição normalmente superpõem a pu
nição a uma linha de base de respostas mantidas
pelo reforço. A efetividade dos punidores, as
sim como a dos reforçadores, é determinada pe
las probabilidades relativas da resposta punida e
das respostas ocasionadas pelo estímulo puniti
vo; a punição ocorre quando uma resposta mais
provável força o organismo a se engajar em uma
resposta menos provável. A punição pode ser
complicada pelos efeitos eliciadores ou discri
minativos dos estímulos punitivos. A tarefa de
uma análise experimental é separar tais efeitos
colaterais dos efeitos primários do estímulo pu
Minutos
nitivo. Esses efeitos ocorrem porque a punição
inclui, necessariamente, tanto apresentações de
FIGURA 6.4 Efeitos discriminativos do choque. Pri estímulo quanto uma contingência entre as res
meiro, duas condições se alternaram: as bicadas do
pombo não produziam nem alimento nem choque, ou as postas e os estímulos; os efeitos das apresenta
bicadas sempre produziam choque e, ocasionalmente, ções do estímulo devem ser separados dos da
alimento. Nas sessões mostradas aqui, nenhuma comi contingência.
da era apresentada. Para ambos os pombos, as taxas Deixemos agora a punição e voltemos ao re
de resposta, inicialmente baixas, aumentaram quando forço. Veremos que há complicadores de dife
começaram a produzir um choque e decresceram aos
níveis prévios, quando o choque fo i descontinuado.
rentes tipos quando o responder, em vez de ser
(Holz & Azrin, 1961, Figura 3.) punido pela apresentação de um estímulo aver-
116 A . C h a r le s C a ta n ia
sivo, é reforçado pela remoção ou prevenção contemporâneo predominante, resumido a se
desse estímulo. guir:
A p re n d iz a g e m 117
para ensiná-las, por exemplo, a abotoar e desa to é mais eficaz do que o reforço atrasado (parâ
botoar as roupas. Para duas dessas crianças, a metro de atraso), e os reforçadores grandes são
agressão caiu para níveis próximos de zero, quan mais eficientes que reforçadores pequenos (pa
do elas podiam fugir das situações de exigência râmetros de magnitude ou intensidade; ver pa
engajando-se em outro comportamento que era râmetro no glossário).
incompatível com a agressão (Carr, Newsom, & A locomoção de um lugar para outro toma as
Binkoff, 1980). Entretanto, tais casos de fuga respostas de fuga eficazes, mas as respostas dis
podem implicar em que as situações típicas de cretas como a pressão à barra são mais fáceis de
exigência nestes ambientes não fornecem os re- registrar. As pressões à barra por um rato na pre
forçadores suficientes. sença de um choque podem desligar o choque
As condições de fuga podem ser criadas, para ou, na presença de uma luz muito forte, podem
um rato, pela construção de um compartimento desligar a luz (p. ex., Keller, 1941). Se, em qual
com um piso de grades eletrificadas. A locomo quer dos casos, o responder aumenta devido às
ção de um lugar para outro, como resposta de suas conseqüências, dizemos que a resposta foi
fuga, em uma pista de corrida eletrificada, é ilus reforçada. Comparemos, então, o reforço positi
trada na Figura 6.5 (Fowler & Trapold, 1962). vo e o negativo: na ausência de alimento, o res
A velocidade da corrida foi maior quando o cho ponder que produz alimento aumenta; com a pre
que era desligado assim que o rato alcançava o sença de choque, o responder que remove o cho
fim da pista. Quanto mais longo o atraso entre que aumenta. O paralelo é direto. Contudo, os
chegar ao fim da pista e o término do choque, procedimentos de fuga recebem menos atenção
tanto mais lento o correr. Esse é um dos muitos do que os procedimentos mais complexos. A pes
exemplos dos efeitos quantitativos do reforço. quisa em reforço negativo é dominada pela es
Por exemplo, tanto no caso do reforço positivo quiva, em que estímulos aversivos são preveni
como no do reforço negativo, o reforço imedia dos ou evitados por respostas que ocorrem em
sua ausência.
118 A . C h a r le s C a ta n ia
REFORÇO POSITIVO: REFORÇO PELA PRODUÇÃO DE COMIDA
Pressão à Barra
Comida
Roer, etc.
Pressão á Barra
Choque
Pular, etc.
Tempo
FIGURA 6.6 Diferentes relações temporais entre as respostas reforçadas e outras respostas produzidas pelo refor-
çador, no reforço positivo (parte superior) e no reforço negativo (parte inferior). No reforço alimentar, as respostas
de pressão à barra reforçadas já ocorreram quando a apresentação de alimento produz um comportamento (p. ex.,
manipular a comida), de modo que essas respostas não competem muito com as de pressionar. Na fuga do choque,
as respostas produzidas pelo choque (p. ex., pular) ocorrem ao mesmo tempo em que a resposta reforçada de
pressionar a barra deve ocorrer, desta forma, tais respostas competem com as de pressionar.
ocorre senão depois da pressão à barra, quando Da mesma forma, se o reforçador negativo
o alimento é apresentado. Pressionar a barra e for uma luz brilhante, da qual o rato possa fugir
comer ocorrem em momentos diferentes, não ao pressionar a barra, o rato pode reduzir os efei
competindo diretamente entre si. tos da luz fechando os olhos e escondendo a ca
No reforço negativo, contudo, o reforçador beça em um canto da câmara experimental. Qual
negativo está presente antes que a resposta a ser quer movimento de sair dessa posição pode ser
reforçada seja emitida; somente depois da res punido pela maior exposição à luz e, assim, é
posta é que o estímulo é removido. Por exem pequena a probabilidade de que o rato saia do
plo, se a pressão à barra por um rato é a resposta canto e pressione a barra. Fazer com que um rato
reforçada, e o choque é o reforçador negativo, o apresente um comportamento de fuga da luz por
choque está presente antes da ocorrência da pres meio da pressão à barra requer procedimentos
são à barra. O choque produz certas respostas que reduzam a probabilidade de tais respostas
como o saltar eliciado ou algum comportamento competitivas (Keller, 1941).
que reduza o contato com a fonte de choque. En
quanto o choque está presente e produz estas res
postas, algumas delas competirão com pressio A Ambigüidade da Distinção entre
nar a barra. Uma vez que uma pressão à barra Reforço Positivo e Reforço Negativo
desligue o choque, as outras respostas diminu
em de freqüência e não mais competem com o Se os estímulos são apresentados ou removi
pressionar. Mas uma vez que o choque esteja dos, isso pode ser um critério menos importante
ausente, novas respostas de pressionar não po na distinção entre um reforço positivo e um re
dem ter a conseqüência de desligá-lo. forço negativo do que se as respostas geradas
A p re n d iz a g e m 119
pelo reforçador ocorrem em momentos em que no ambiente do organismo e, inevitavelmente,
elas podem competir com a resposta reforçada. conduz a diferenças no responder antes e após a
Um experimento sobre fuga do frio pode servir mudança. Na melhor das hipóteses, podemos
de ilustração para isso (Weiss & Laties, 1961). considerar tais mudanças que produzem um con
Um rato foi colocado em uma câmara fria, em tínuo de efeitos, que variam entre aqueles em
que as pressões à barra eram reforçadas pela que outras respostas têm alta probabilidade de
operação de um aquecedor. Por um lado, tal pro preceder e competir com a resposta reforçada,
cedimento pode ser considerado como reforço até aqueles em que elas não o fazem ou talvez
positivo: ele implica em adicionar energia ao am até mesmo contribuam para um aumento da pro
biente, sob a forma de calor, quando ocorre uma babilidade de ocorrência da resposta reforçada.
pressão à barra. Por outro lado, o frio pode fun
cionar como um estímulo, pelos seus efeitos so
bre os receptores de temperatura na pele do rato. ESQUIVA
O frio é a ausência de calor, mas é também um
evento ambiental significativo e potencialmente Na esquiva, o estímulo aversivo não está pre
aversivo. De acordo com essa interpretação, o sente quando a resposta reforçada ocorre. As
procedimento deveria ser chamado de reforço ne duas principais variantes da esquiva são deno
gativo, pois ligar o aquecedor depois de uma res minadas cancelamento e adiamento. O procedi
posta suprime os efeitos do frio. mento de cancelamento é análogo ao matar um
Na fuga do frio, pode-se facilmente argumen pernilongo antes que ele pique você: ao matá-lo,
tar que o reforço envolve tanto a apresentação você evita permanentemente que aquele perni
quanto a remoção de um estímulo. É fácil en longo em particular venha a picar alguém. O pro
contrar ambigüidades em outras instâncias do cedimento de adiamento é análogo ao colocar
reforço. Poderíamos dizer, por exemplo, que en fichas em telefones públicos; neste caso, você
quanto reforçador, a água suprime estímulos adia a interrupção da ligação enquanto continua
aversivos gerados pela boca seca, ou que o ali a colocar fichas, mas quando pára de colocar as
mento suprime estímulos aversivos gerados pela fichas, o tempo da última se esgota e a ligação é
depleção de nutrientes na corrente sangüínea (cf. interrompida.
Hull, 1943). Por que, então, a distinção entre re Como exemplo de um procedimento de can
forço positivo e reforço negativo chegou a ad celamento, imagine um rato colocado em uma
quirir importância comportamental? câmara com uma barra e um piso de grades, por
Vamos retomar ao exemplo do rato no frio. meio do qual podem ser aplicados choques elé
Antes que as pressões à barra reforçadas ocor tricos breves. Os choques são programados para
ressem, o rato se encolhia em um canto e tremia. serem apresentados uma vez por minuto, mas se
Essas respostas reduziam a probabilidade de que o rato pressionar a barra antes do próximo cho
ele pressionasse a barra. Quando uma pressão à que, ele é omitido. Neste procedimento o rato
barra ocorria, o aquecedor era ligado e as res pode evitar completamente o choque pressionan
postas competitivas tomavam-se menos prová do a barra pelo menos uma vez por minuto. Os
veis, mas um rato que não está mais com frio procedimentos de cancelamento são algumas ve
não pode fugir do frio. As respostas que compe zes conduzidos em tentativas discretas. Por exem
tiam com a resposta reforçada ocorreram antes, plo, uma luz acende por um período de 30s. Se o
e não depois do reforço, assim este exemplo se rato pressionar a barra durante os 30s, nenhum cho
parece mais com a fuga do choque do que com a que é apresentado ao final da tentativa; ele somen
produção de alimento ou água (cf. Figura 6.6). te é apresentado se o rato não pressionar a barra.
Portanto, talvez seja mais apropriado considerar Vamos considerar agora, um exemplo de pro
que este seja um caso de reforço negativo e não cedimento de adiamento (Sidman, 1953). Dois
de reforço positivo. relógios controlam a apresentação do choque.
Mas não eliminamos completamente a ambi Qual dos dois relógios está ativado, depende de
güidade. O reforço sempre envolve uma mudança se o último evento foi um choque ou uma pres
120 A . C h a r le s C a ta n ia
são à barra. O primeiro relógio mede o intervalo
choque-choque ou intervalo SS, o tempo entre
choques sucessivos quando o rato não pressiona
a barra. Cada vez que o choque é apresentado,
este relógio volta a zero e começa a marcar um
novo intervalo SS. Sempre que o rato pressiona
a barra o controle muda para o segundo relógio.
Este mede o intervalo resposta-choque, ou in
tervalo RS, o tempo pelo qual cada pressão à
barra adia o próximo choque possível. Enquan
to este relógio está marcando o tempo, cada pres
são à barra zera o relógio e inicia um novo inter
valo RS. Sob essas circunstâncias, o rato pode
adiar o choque indefinidamente, pressionando
sempre a barra antes que termine o intervalo RS
em vigor. Se nenhuma resposta ocorre e um cho Intervalo RS (Segundos)
que é apresentado ao final de um intervalo RS, o FIGURA 6.7 Taxa de respostas de pressão à barra pelo
relógio do intervalo SS é reiniciado. Com este Rato 46 em função do intervalo RS, tendo o intervalo
procedimento, chamado de esquiva de Sidmati SS como parâmetro. O intervalo SS é o tempo entre cho
ou esquiva contínua, o responder de esquiva pode ques, quando nenhuma resposta ocorre entre eles. O
intervalo RS é o tempo pelo qual cada pressão adia o
ser estudado independentemente do responder
próximo choque possível. (Sidman, 1953, Figura IA)
de fuga; o choque pode ser evitado por respos
tas de esquiva, mas uma vez aplicado, ele é tão
breve que há pouca ou nenhuma oportunidade mente falando, se esse aumento na taxa de cho
para a emissão de comportamentos de fuga. ques reduz o responder, é apropriado dizer que
Os dados para a pressão à barra por um rato o responder é punido). O rato pode evitar por
são mostrados na Figura 6.7, que apresenta a taxa completo os choques respondendo tão rápido que
de respostas em função do intervalo RS, enquan os 2 s nunca se esgotem sem uma pressão à bar
to o intervalo SS é mantido como parâmetro. ra, mas o aumento nos choques produzido por
Comparando as funções, vê-se que o intervalo taxas mais baixas pode impedi-lo de alcançar tal
RS que produziu a taxa máxima de pressão à desempenho.
barra dependeu do intervalo SS. Primeiro consi O comportamento de esquiva pode ser per
deremos um esquema de esquiva com um inter sistente depois de uma longa história de esqui
valo RS de 6 segundos e um intervalo SS de 2 va; como veremos abaixo, sua extinção pode ser
segundos. Qualquer resposta reduz o choque, e lenta. No entanto, a conseqüência de uma res
uma taxa de uma resposta a cada 4 segundos, posta de esquiva efetiva é que nada acontece: o
aproximadamente, evita completamente os cho evento aversivo é esquivado com sucesso. En
ques. Quando o intervalo RS é mais curto do que tão, embora seja fácil manter a persistência do
o intervalo SS, contudo, alguns padrões de pres comportamento de esquiva, é difícil instalar este
são à barra podem aumentar a taxa de choques comportamento. Isso pode explicar por que me
em vez de diminuí-la. Por exemplo, considere didas de segurança e outros procedimentos pre
mos agora um esquema de esquiva com um in ventivos não são modelados com muita freqüên
tervalo RS de 2 segundos e um intervalo SS de 5 cia por contingências naturais. Uma pessoa que
segundos. Um rato que nunca pressiona a barra nunca esteve envolvida em um sério acidente de
recebe um choque a cada 5 segundos ou 12 cho carro pode estar menos propensa a utilizar o cin
ques por minuto. Mas, se o rato pressiona a cada to de segurança do que outra que esteve, e al
3 segundos, um choque é apresentado 2 segun guém que nunca teve uma má experiência com
dos depois de cada pressão à barra, e o rato rece incêndio pode estar menos propenso a instalar
berá, portanto, 20 choques por minuto (estrita um detector de fumaça do que outra pessoa que
A p r e n d iz a g e m 121
já tenha tido. Um problema importante na medi estímulo novo ou súbito... Essas reações defensivas
cina é a adesão do paciente às medicações pres são eliciadas pela aparição de um predador e pela
súbita aparição de objetos inofensivos. Elas estão
critas. Muitos pacientes param de tomar suas me
sempre próximas do limiar, de modo que o animal
dicações após o desaparecimento dos sintomas, fugirá, ficará congelado ou ameaçará sempre que
mesmo que doses adicionais pudessem trazer ocorrer qualquer evento de estímulo novo. Não é
benefícios. E com vitaminas ou suplementos necessário que o evento de estímulo seja empare
minerais que podem prevenir deficiências na die lhado com o choque ou a dor, ou algum outro estí
mulo incondicionado. O rato não corre da coruja
ta, não há conseqüências claras e imediatas que porque aprendeu a escapar das garras dolorosas do
possam ser observadas. Esse problema é comum inimigo; ele corre de qualquer coisa que suija em
a um grande número de medidas preventivas, da seu ambiente e faz isso meramente porque é um rato.
imunização ao controle da natalidade e da puri A gazela não foge do leão que se aproxima porque
ficação da água de beber ao uso de instrumentos tenha sido mordida por leões; ela foge de qualquer
objeto grande que se aproxime e faz isso porque esta
cirúrgicos esterilizados. Não deveria causar sur é uma das reações de defesa específicas de sua es
presa que tais medidas sejam muitas vezes difí pécie. Nem o rato nem a gazela podem se dar ao
ceis de modelar e de manter. luxo de aprender a se esquivar; a sobrevivência é
urgente demais, a oportunidade de aprender é limi
tada demais, e os parâmetros da situação tomam im
possível a aprendizagem necessária. (Bolles, 1970,
Reações de Defesa Específicas da Espécie p. 33)
Uma vantagem dos procedimentos de esqui A esquiva, como citado por Bolles, implica
va sobre os procedimentos de fuga é que a res em foco de controvérsias. A observação de Bol
posta reforçada ocorre na ausência do estímulo les diz respeito ao grau em que o comportamen
aversivo. Assim, outras respostas geradas pelo to de esquiva é aprendido. Sem dúvida, o com
estímulo aversivo não competem continuamen portamento atual pode ser, significativamente,
te com a resposta de esquiva. Não obstante, as
determinado por variáveis evolutivas (até mes
sim como é mais fácil fazer com que algumas mo a capacidade do responder a ser reforçada
respostas e não outras funcionem como respos
deve ter evoluído de alguma forma). E geralmen
tas de fuga, pode ser também mais fácil fazer
te aceito que o comportamento específico da es
com que algumas respostas e não outras funcio
pécie, freqüentemente, limita o que pode ser
nem como respostas de esquiva. Por exemplo, os
aprendido.
pombos evitam choques mais prontamente se eles
Consideremos, por exemplo, a transição do
puderem fazê-lo através da locomoção de um lado comportamento eliciado ao ser emitido na aqui
para outro da câmara do que através de bicadas (p. sição de esquiva sinalizada em ratos (um proce
ex., Macphail, 1968). Em procedimentos de es dimento de cancelamento). Neste procedimento
quiva, é mais difícil argumentar que tais diferen
um estímulo-aviso, tal como uma campainha,
ças dependem da competição entre as respostas
precede o choque. Se o rato responde durante a
reforçadas e outras respostas geradas pelo estímu campainha e antes do choque, o choque é omiti
lo aversivo. Tem sido argumentado que as dife
do; se o rato responde após o início do choque, o
renças surgem porque os organismos são equipa choque é removido. Em outras palavras, o rato
dos, de maneira variada, com respostas de defesa
esquiva-se do choque, respondendo durante o
que são específicas da espécie. Sendo assim, o su
estímulo-aviso; se o rato falha em esquivar-se e
cesso com procedimentos de esquiva dependerá
o choque tem início, então ele foge do choque
de o experimentador escolher uma resposta que o
quando responde.
organismo esteja preparado para emitir em situa
Em tais experimentos, uma resposta freqüen
ções aversivas (Bolles, 1970; Seligman; 1970).
temente escolhida é uma forma de locomoção,
Bolles resume o argumento como segue:
tal como saltar um obstáculo ou correr de um
O que mantém os animais vivos na selva é que eles lado para outro da câmara. Além disso, a res
têm reações defensivas matas muito eficazes, que posta de esquiva é, tipicamente, a mesma que a
ocorrem quando eles encontram qualquer tipo de resposta de fuga. Mas, com ratos, tais respostas
122 A. C h a r le s C a ta n ia
locomotoras tendem a ser eliciadas por estímu Sidman era demonstrar o responder de esquiva
los aversivos, mesmo na ausência de uma con sem um estímulo-aviso.
tingência resposta-choque. Uma vez que tais res Esta concepção de que o estímulo-aviso ad
postas tenham sido produzidas pelo choque, elas quire suas propriedades aversivas a partir de uma
podem continuar quando o choque estiver au relação consistente com o estímulo aversivo e
sente. Assim, as primeiras poucas respostas de de que o término do estímulo-aviso, portanto,
esquiva do rato podem ocorrer, principalmente, reforçava a resposta de esquiva foi chamada de
por causa de sua eliciação anterior pelo choque teoria dos dois processos da esquiva (p.ex., Ka
(cf. Capítulo 4 e Azrin, Hutchinson, & Hake, min, 1956). A questão principal era a natureza
1967). Após o início do responder de esquiva, do reforçador. Alguns teóricos estavam dispos
saber se ele continua porque tem a conseqüên tos a aceitar o fato da esquiva, sem apelar para
cia importante de prevenir o choque ou porque nenhum evento reforçador que ocorresse no mo
ele é um caso de comportamento específico da mento da resposta de esquiva. Outros acredita
espécie, facilmente gerado por situações aversi vam que era necessário especificar tal evento.
vas, é uma questão experimental. Quando, como na esquiva de Sidman, o evento
Algumas diferenças também podem depen não podia ser localizado em algum estímulo-avi
der dos determinantes específicos da espécie so ambiental, que terminasse com a resposta de
para o que é aversivo. Por exemplo, demons esquiva, esses teóricos passavam, então, a con
trações de fuga ou de esquiva do som das cor ceber o evento com estando dentro do organis
rentezas de água, por parte de castores, levan mo. Argumentava-se, por exemplo, que o esta
tam a intrigante possibilidade de que a aver- do do organismo, logo após uma resposta de es
sividade de tais sons contribua para a cons quiva, quando o choque não era iminente, era
trução e manutenção de suas represas e tocas reforçador em relação a seu estado muito tempo
(cf. Hartman, 1975). após a resposta, quando um choque poderia ocor
rer a qualquer momento. O último estado adqui
riria certas propriedades aversivas por sua rela
A Natureza do Reforçador na Esquiva ção com o choque e, como um estímulo-aviso,
era suspenso pela resposta. Tal mudança de estado
Outra questão é especificar o que reforça o supostamente ocorria imediatamente com cada res
responder de esquiva. Quando uma resposta de posta de esquiva, assim, supunha-se que uma ex
esquiva bem-sucedida ocorre, a conseqüência plicação baseada em outros eventos, em algum
importante é que nada ocorre ao organismo. tempo distante da resposta, seria desnecessária.
Como pode a ausência de um evento afetar o Debates acerca do status de tais teorias so
comportamento? De acordo com um ponto de bre a esquiva têm uma história complexa (p. ex.,
vista, o responder de esquiva é mantido porque Anger, 1963; Herrnstein & Hineline, 1966; Hi-
o organismo está fugindo de algumas proprieda neline, 1977), com alguns até mudando de lado
des da situação que acompanharam os estímulos ao longo do tempo (p. ex., Schoenfeld, 1950,
aversivos passados. Essa noção evoluiu a partir 1969). Gradualmente, as divergências reduziram-
dos primeiros procedimentos em que um estí- se a questões experimentais a respeito das con
mulo-aviso precedia o choque, e o organismo dições sob as quais as respostas de esquiva po
evitava o choque, respondendo na presença do dem ser mantidas: é necessário que o organismo
estímulo-aviso. A esquiva era mais facilmente seja capaz de reduzir o número total de choques
adquirida quando terminava o estímulo-aviso e em uma sessão ou será suficiente para o orga
evitava o choque. Supunha-se que a aversivida- nismo que ele seja capaz de adiar os choques
de do estímulo-aviso era estabelecida por meio individuais, embora o mesmo número total de
de sua relação consistente com o choque e, por choques seja apresentado? Ocorre que qualquer
tanto, que essa conseqüência imediata, fuga do uma destas condições pode manter o responder
estímulo-aviso, era o reforçador efetivo. De fato, de esquiva, assim essas questões foram rapida
um dos propósitos do esquema de esquiva de mente substituídas por outras sobre as operações
A p re n d iz a g e m 123
estabelecedoras que tomam os reforçadores ne Neste procedimento, os choques eram admi
gativos eficazes (Hineline, 1970, 1981). nistrados probabilisticamente, sendo assim, mes
Uma operação estabelecedora que toma os mo com uma probabilidade de choque que man
reforçadores positivos mais eficazes é a priva tinha o responder de esquiva (p. ex., 0,3 reduzi
ção. Uma operação análoga para os reforçado da para 0,1 pelas pressões a barra; algumas pres
res negativos é a apresentação de um estímulo sões eram imediatamente seguidas por choque
aversivo que toma sua retirada reforçadora (esta e, alguns períodos sem pressão passavam sem o
operação seria denominada saciação, se o estí choque. Deste modo, não existia uma relação
mulo fosse comida e não um choque). Mais ain temporal consistente entre respostas individuais
da do que no reforço positivo, esses efeitos esta- e choques individuais. Contudo, a probabilida
belecedores devem ser distinguidos dos efeitos de de choque aumentava mais rapidamente, em
discriminativos, eliciadores e de outros efeitos média, depois de um período sem respostas do
de estímulos. Além disso, a relatividade do re que depois de uma resposta. Assim, quem de
forço se mantém para o reforço negativo, tanto fendia que a conseqüência imediata do respon
quanto para o positivo. Um procedimento de es der era importante podia argumentar que a re
quiva envolve transições contingentes a respos dução na aversividade média produzida pelo
tas de uma situação para outra, e sua eficácia é pressionar a barra foi suficiente para reforçar
determinada pela situação que se segue à resposta o responder de esquiva. E assim o debate con
de esquiva, assim como pela que a precede. tinuou.
Um caso em que nem todo choque pode ser Essas posições ilustram a diferença entre as
esquivado é um exemplo. O responder de esqui orientações molecular e molar em análise do
va pode ser mantido quando reduz a probabili comportamento. A primeira abordagem lida com
dade do choque, mas diferente da esquiva de o comportamento em termos de seqüências de
Sidman, não atrasa sistematicamente todo cho eventos, momento a momento, em um dado con
que? Hermstein e Hineline (1966) programaram texto; a segunda lida com propriedades que po
um esquema de esquiva em que o choque era dem ser medidas apenas ao longo de extensos
aplicado a um rato, com uma probabilidade es períodos de tempo. Por exemplo, uma aborda
pecificada, ao final de cada 2 segundos. O cho gem molecular da esquiva examina os interva
que ocorria com certa probabilidade se nenhu los de tempo individuais que separam respostas
ma pressão à barra ocorresse e, com uma proba particulares de choques individuais, enquanto
bilidade diferente, se ocorresse uma pressão à uma visão molar examina a relação mais geral
barra. Por exemplo, em uma dada condição, as entre as taxas de resposta e as taxas de choque
pressões à barra reduziam a probabilidade de cho ao longo de uma amostra grande de respostas e
que de 0,3 para 0,2: se o rato pressionasse a barra choques (note-se que a taxa pode ser determina
pelo menos a cada 2 segundos, ele reduzia a taxa da apenas por meio da amostragem de eventos
de choques de 9 para 6 choques/min. O pressionar ao longo de extensos períodos de tempo).
à barra foi mantido por este procedimento. Essas divergências não foram e talvez não
Consideremos agora um caso em que cada possam ser resolvidas. As propriedades mole
pressão à barra aumenta a probabilidade de cho culares e molares do comportamento podem ser
que de 0,1 para 0,2: pressionando pelo menos importantes em contextos diferentes. Também é
uma vez a cada 2 s, o rato aumenta a taxa de razoável supor que a evolução equipou os orga
choque de 3 para 6 choques/min. Mesmo que a nismos com a capacidade de responder, diferen-
conseqüência do pressionar seja ainda uma pro cialmente, a muitas propriedades das situações
babilidade de choque de 0,2, o rato pára de pres em que se encontram. Situações em que um rato
sionar. Em relação à probabilidade inicial de cho adie choques entre as tentativas, que não reduza
que de 0,3, a transição para uma probabilidade a taxa total de choques ou que reduza a taxa to
de choque de 0,2, reforça o responder; em rela tal de choques, mesmo que o responder encurte
ção a uma probabilidade incial de 0,1, a mesma o período para o próximo choque, podem ser
probabilidade de 0,2 pune o responder. criadas (Hineline, 1981). Assim, parece não ha
124 A . C h a r l e s C ata n ia
ver nenhuma justificativa para supor que um or exemplo, todos os choques poderiam ser con
ganismo, cujo responder seja determinado pelas trolados pelo relógio SS; as respostas não mais
propriedades moleculares de uma situação (p. operariam o relógio do intervalo RS. Tal proce
ex., as relações temporais consistentes entre o dimento interromperia a contingência resposta-
responder e os choques, criadas pelos intervalos choque, mas se o responder tivesse mantido uma
RS e SS da esquiva de Sidman), seria incapaz de taxa baixa de choques, ele também aumentaria
responder de acordo com as propriedades mola substancialmente as apresentações de choque.
res de outra situação (p. ex., as relações gerais Desse modo, esse procedimento, por si só, não
consistentes entre a taxa de respostas e a taxa de poderia separar os efeitos da mudança na taxa de
choques estabelecidas por um esquema proba- choque daqueles da mudança na contingência.
bilístico de esquiva). Se isso é assim, não se tra Suspender as apresentações do estímulo aver
ta de escolher uma ou outra abordagem, mas sim sivo tem sido o procedimento de extinção mais
decidir qual abordagem é mais apropriada à aná comum em esquiva, mas apresentar o estímulo
lise de uma dada situação. aversivo enquanto interrompe-se as conseqüên
cias do responder é um paralelo mais próximo
da extinção após reforço positivo. A duração da
EXTINÇÃO extinção depende de qual operação é usada e de
que modo a operação altera a taxa de ocorrência
Como no reforço positivo e na punição, os do estímulo aversivo (cf. Hineline, 1977, pp. 377
efeitos do reforço negativo são temporários. E, 381). Em qualquer caso, um paralelo de nossa
da mesma forma que nessas operações, os efei avaliação da extinção após o reforço positivo e
tos de terminar as contingências entre as respos da recuperação após a punição mostra que, tam
tas e os estímulos aversivos devem ser distin bém na extinção após o reforço negativo, os efei
guidos dos efeitos de simplesmente terminar os tos do reforço negativo são temporários.
estímulos aversivos. Em fuga de choque, desli
gar o choque elimina o responder simplesmente
porque não há uma ocasião de fuga na ausência PUNIÇÃO POSITIVA E PUNIÇÃO
do estímulo aversivo. No entanto, em esquiva, NEGATIVA
desligar a fonte de choque é, algumas vezes, con
siderado uma operação de extinção. Se o respon A distinção entre reforço positivo e negativo
der em esquiva for mantido a uma taxa tal que é facilmente estendida à punição positiva e ne
os choques sejam raros, a ausência de choques gativa (embora aqui também sejam possíveis
fará pouca diferença, e o responder continuará casos ambíguos). As respostas podem ser puni
por um longo período. De fato, uma proprieda das por alguns eventos como o choque ou o cor
de amplamente reconhecida do responder em rer forçado em uma roda de atividade. Elas tam
esquiva é sua persistência, mesmo após a inter bém podem ser punidas pelo término de even
rupção dos estímulos aversivos. Por essa razão, tos. Por exemplo, a remoção de alimento, con
a esquiva tem sido considerada relevante para tingente ao pressionar a barra por um rato priva
alguns casos de comportamentos humanos per do de alimento, tende a reduzir a taxa do pres
sistentes, como em compulsões. sionar. O problema é que é difícil demonstrar se
Consideremos as alternativas. Com reforço isso é uma punição negativa. Se o rato está pri
alimentar, podemos programar a extinção, quer vado de alimento e a comida está disponível, ele
desligando o comedouro, quer interrompendo a provavelmente comerá em vez de pressionar a
conexão entre as respostas e o comedouro. Am barra. Assim, teríamos poucas oportunidades de
bos os métodos têm o mesmo efeito: o alimento punir o pressionar a barra pela remoção do ali
não é mais apresentado. Não é o que acontece mento (considere a Figura 6.6, com comida e
com a fuga ou a esquiva ao choque. O choque choque trocados). Por essa razão, os estudos em
continua se as respostas não puderem mais re punição negativa, geralmente, não têm removi
movê-lo ou evitá-lo. Na esquiva de Sidman, por do o reforçador positivo; pelo contrário, eles têm
A p r e n d iz a g e m 125
removido um estímulo na presença do qual as tos alternativos que poderiam ser reforçados
resposatas são reforçadas, o que é um paralelo (Winett & Winkler, 1972). A utilização do ti
da ênfase na esquiva e não na fuga, em estudos meout sem a compreensão de suas bases com-
de reforço negativo. portamentais pode ser contraproducente. Por
Por exemplo, suponhamos que duas barras exemplo, os berçários diurnos modernos para cri
estejam disponíveis a um macaco e que pressões anças pré-escolares tendem a usar uma área des
em uma barra produzam alimento sempre que tinada ao timeout e não uma sala isolada. Uma
uma luz estiver acesa. Podemos esperar algumas criança que perturba outras crianças em um gru
pressões na outra barra, mas este pressionar pode po que está brincando pode ser colocada para
ser punido, fazendo com que cada pressão pro sentar por 5 min em um carpete próximo à área
duza um período de tempo durante o qual a luz é de brinquedo, à vista de outras crianças. Supo
apagada e as pressões na primeira barra não mais nhamos que a criança fique quieta por 4 min e
produzam alimento. Tais períodos são chama depois começe a chorar ou a fingir que esteja
dos de suspensão discriminada das contingên chorando. A atendente que exigir rigidamen
cias de reforço (timeout). (Estes procedimentos te 5 min de timeout, provavelmente, irá deixar
são chamados, às vezes, de punição por timeout que a criança retome ao grupo justamente no mo
do reforço positivo: p. ex., Ferster, 1958. Os pro mento em que ela está agindo novamente de for
cedimentos que sinalizam punição negativa têm ma inadequada; seria melhor “surpreender” a cri
sido chamados de treino de omissão: Sheffield, ança quando ela estivesse agindo adequadamente
1965; ver também Capítulo 12.) e permitir que ela retomasse ao grupo após 3 ou
O timeout teve origem em experimentos com 4 min (afinal, 4 min sentada quieta é um longo
pombos, ratos e macacos, mas atualmente tal período de tempo para uma criança pré-escolar).
vez seja melhor conhecido em aplicações ao
comportamento humano (p. ex., Wolf, Risley, &
Mees, 1964). Por exemplo, um período de tem A LINGUAGEM DO CONTROLE
po em uma sala isolada vem sendo empregado AVERSIVO
para punir os comportamentos problemáticos de
crianças institucionalizadas. Mas, como vimos A apresentação ou a remoção de estímulos
em outros exemplos, o julgamento a respeito de pode reforçar ou punir o comportamento. O re
se alguns eventos particulares serão reforçado- forço é mais eficaz se a resposta reforçada é com
res ou punitivos, às vezes, é difícil. Quando o patível com o responder ocasionado pelo refor
time-out foi empregado sozinho com o objetivo çador. Inversamente, a punição é mais efetiva se
de punir a agressividade de uma menina autista a resposta punida for incompatível ou, ao me
de 6 anos de idade, sua agressividade aumentou nos, independente do responder ocasionado pelo
substancialmente, em vez de diminuir. Essa estímulo punitivo. Assim, pode ser fácil refor
criança se engajava freqüentemente em compor çar o saltar com a remoção do choque (fuga),
tamentos auto-estimulatórios (p.ex., criava esti mas pode ser difícil punir o saltar com a apre
mulação visual, mexendo rapidamente os dedos sentação de choque.
em frente e bem próximos aos olhos), no entan Os estímulos que podem reforçar por meio
to, esse comportamento era freqüentemente in de sua apresentação podem também punir por
terrompido pelos atendentes. Para ela, um perí meio de sua remoção e vice-versa. Temos fala
odo isolada em uma sala era reforçador, porque do, portanto, de estímulos punitivos, de reforça-
ela podia se engajar em comportamentos de auto- dores negativos e de estímulos aversivos. Cada
estimulação sem ser interrompida (Solnick, Rin um foi apresentado em um contexto diferente,
cover, & Peterson, 1977). mas isso foi apropriado porque é o contexto que
Assim como com qualquer forma de puni determina as funções comportamentais de qual
ção, a função principal do timeout é reduzir cer quer estímulo. Assim, os estímulos aversivos fo
tos comportamentos, mas ele é freqüentemente ram apresentados em conexão com os fenôme
aplicado sem uma atenção para os comportamen nos de eliciação, os estímulos punitivos foram
126 A . C h a r l e s C a ta nia
apresentados durante a discussão de conseqüên podemos reconhecer a diferença entre os casos
cias que reduzem o responder, e os reforçadores de reforço e os casos de punição. De fato, as di
negativos foram incluídos como classes de con ferenças são freqüentemente tópicos de interes
seqüências que aumentam a probabilidade da res se. Por exemplo, nossa sociedade não é indife
posta. Seria conveniente se pudéssemos supor rente a um pai se este reforça o comportamento
que cada termo identifica diferentes aspectos de cooperativo com elogio ou se ele pune o com
uma categoria única de eventos. Poderíamos, portamento não-cooperativo com castigos.
então, falar da permutabilidade do choque como Podemos falar mais facilmente em termos de
um estímulo aversivo, um estímulo punitivo ou um respostas discretas do que em termos de ausên
reforçador negativo, dependendo da situação. cia de respostas. E, portanto, sempre que possí
Para muitos estímulos, na maior parte do tem vel, são preferíveis as descrições diretas, em ter
po, tal premissa é possivelmente correta. Se sou mos de respostas registráveis como pressões à
béssemos que um estímulo é tão eficaz como um barra ou bicadas no disco, do que as descrições
punidor, esperaríamos, com razão, que ele fosse indiretas em termos do que não está ocorrendo.
eficaz como reforçador negativo; esta consistên Um organismo pode exibir mais ou menos com
cia é parte de nossa justificativa para chamá-lo portamento em momentos diferentes, e não pre
de aversivo. Consistências devem ser esperadas, cisamos supor que todas os casos sem agir se
porque as categorias têm origem nas relações jam, em si mesmos, ações. Assim como não pre
entre as probabilidades de diferentes classes de cisamos alcançar uma temperatura de zero ab
respostas. Mas estas mesmas probabilidades de soluto para reconhecer a temperatura como uma
veriam nos lembrar da relatividade dos reforça dimensão da matéria que varia em quantidade,
dores e punidores. Devemos ter cuidado para não tampouco temos que produzir um organismo
considerar tal premissa como garantida. O fato completamente não responsivo para reconhecer
de podermos reforçar facilmente o saltar, remo que o comportamento de um organismo é uma
vendo o choque, enquanto não podemos punir dimensão que pode mudar em quantidade. O
efetivamente o saltar apresentando choque, de comportamento denominado não-responder (ou
monstra que a simetria entre reforço e punição outro comportamento) é uma classe que permite
tem limites. que a totalidade do comportamento seja cons
A falta de simetria entre o reforço e a puni tante, de modo que quando somadas, as proba
ção, talvez tenha encorajado algumas tentativas bilidades atingem um, mas isso nos permite um
de reduzir um deles a um caso especial do outro. grau de liberdade grande demais. Se punimos
Alguns casos de punição têm sido descritos em uma resposta, deveríamos saber o que acontece
linguagem de esquiva passiva: ao não respon com ela antes que procuremos encontrar uma
der, o organismo estaria passivamente evitando explicação em termos de outros comportamen
o estímulo programado como um estímulo puni tos e deveríamos saber o que mais o organismo
tivo para o responder. Mas, então, da mesma for está fazendo antes que comecemos a falar do não-
ma, poderíamos dizer que o não responder (p. responder como comportamento.
ex., não descer de uma plataforma para um piso
eletrificado) é uma resposta que pode ser refor
çada. Se a linguagem funciona neste caso, por A Ética do Controle Aversivo
que não o faria em qualquer caso de punição?
A questão do que conta como comportamen As propriedades comportamentais do contro
to está implícita nestes argumentos. Sempre que le aversivo têm implicações que são consisten
o responder é punido, podemos dizer que o não tes com os argumentos éticos contra o controle
responder é reforçado, e sempre que o respon aversivo. Por exemplo, um pai que programa
der é reforçado, podemos dizer que o não res conseqüências aversivas para o comportamento
ponder é punido. Quando estendemos nossa ter de uma criança pode adquirir propriedades aver
minologia dessa maneira, a diferença entre re sivas. Na medida em que a criança, então, apren
forço e punição desaparece. Contudo, geralmente de a fugir da companhia do pai ou a evitá-la, con
A p r e n d iz a g e m 127
tingências outras que não aquelas disponíveis ao cia, aparecem bastante tempo após a apresenta
pai poderão começar a influenciar o comporta ção do reforçador (o efeito de reforçar diaria
mento da criança. Mas se a punição parecer a mente a dedicação da criança às tarefas de casa
única técnica disponível para reduzir o perigoso pode não ficar evidente, até que vários dias te
comportamento autolesivo de uma criança au nham-se passado), enquanto que os efeitos da
tista, então, ela poderia representar um mal me punição geralmente aparecem imediatamente
nor do que o dano permanente que a criança po (um efeito de dar uma palmada ou xingar uma
deria infligir a si própria. Os preceitos éticos criança que esteja provocando alguém de sua
expressam a preocupação com os resultados acei família é o que fará com que o provocar pare
táveis ou inaceitáveis de nossas ações, o que imediatamente). Dessa forma, é muito mais pro
implica que as conseqüências de nossas ações vável que se obtenha conseqüências imediatas
não devem ser ignoradas. apresentando um estímulo punitivo do que apre
Em uma discussão sobre o status de nossa sentando um reforçador. Isso significa que uma
cultura e seu progresso na descoberta de alter pessoa, provavelmente, acha mais fácil apren
nativas para o controle aversivo, B. F. Skinner der técnicas de controle aversivo do que técni
chegou à seguinte conclusão: cas de reforço. No entanto, isso não significa que
as técnicas aversivas sejam melhores.
Mesmo na política e no governo, o poder da puni Algumas pessoas argumentam contra qual
ção tem sido suplementado por um apoio mais posi quer tipo de modificação de comportamento, tan
tivo do comportamento que está de acordo com os to envolvendo estímulos aversivos quanto refor
interesses das agências governamentais. Mas ainda
çadores positivos. Os que fazem uso de tal argu
estamos longe de explorar as alternativas e não é
provável que façamos qualquer avanço real, enquan mento deveriam reconhecer que nosso compor
to nossa informação sobre a punição e sobre as al tamento é modificado a todo instante, tanto por
ternativas à punição permanecer no nível da obser contingências naturais como por contingências
vação casual. (Skinner, 1953, pp. 192-193) artificiais criadas pelos que estão à nossa volta.
Negar isso não eliminará tais contingências, e
Skinner incluía técnicas de reforço entre suas um contra-argumento é que nossa melhor defe
“alternativas para a punição”. Infelizmente, se sa contra o mau uso das técnicas comportamen-
olhamos para o comportamento das pessoas que tais é aprender tanto quanto possível a respeito
detêm o controle de reforçadores e punidores, de como elas funcionam.
veremos que os efeitos do reforço com freqüên
128 A . C h a r l e s C a ta n ia
Operantes: A Seleção do Comportamento
130 A . C h a r l e s C a ta nia
gem pode também ocorrer como um resultado anteiras. Se o rato vai ou não mudar para a nova
de contingências naturais. topografia, dependerá conjuntamente do seu
Por exemplo, os pássaros pretos machos, em comportamento, da sua anatomia e do equipam-
diferentes partes dos EUA, cantam diferentes nento. Por exemplo, será menos provável que
dialetos de cantos de pássaros (o pássaro preto ele produza a nova topografia envolvendo tanto
fêmea não canta, fato comum quanto ao canto as patas traseiras e dianteiras, se ele tiver come
dos pássaros). É mais provável que uma fêmea çado a pressionar com muita força alta pulando
responda com uma postura de acasalamento às sobre a barra, em vez de pressioná-la.
canções que se pareçam mais com as ouvidas na Esse exemplo ilustra dois tipos de seleção
sua juventude, presentes no dialeto dos machos ontogenética, uma gradual e outra relativamente
locais. Quando um macho estrangeiro é introdu abrupta. A primeira ocorreu com o contrapeso
zido, ele começa cantando no seu próprio diale abaixo do peso do rato, e a segunda ocorreu quan
to. Mas, ele canta com variações e quanto mais do o seu peso foi excedido. (Existem analogias
tempo passa na presença da fêmea, mais seu can na seleção filogenética quando, por exemplo, as
to toma a forma do dialeto local. Seu dialeto mudanças quantitativas graduais relativas à mé
adquirido é um produto da seleção ontogenética dia da população, produzidas pela seleção, são
natural: as reações diferenciais da fêmea são re- contrastadas com mudanças mais abruptas, pro
forçadoras e modelam seu canto (p. ex., King & duzidas por eventos ambientais catastróficos. Na
West, 1985). evolução filogenética, as últimas mudanças são al
Normalmente, a modelagem envolve mudan gumas vezes chamadas de saltos', cf. Capítulo 3).
ças quantitativas ao longo de uma ou mais di Como ilustrado por esse exemplo, as diferen
mensões de um comportamento do organismo, tes propriedades de diferentes respostas que de
mas algumas vezes parece produzir mudanças vem ser modeladas fazem da modelagem uma
qualitativas. Consideremos o seguinte exemplo arte. Essa arte pode ser aplicável a uma varieda
envolvendo a modelagem da força exercida por de de habilidades como fazer ginástica, namo
um rato ao pressionar a barra (Catania & Har- rar, tocar um instrumento musical, seduzir, es
nad, 1988, p. 476). O rato produz comida pressi crever à mão ou colocar alguém como vítima de
onando uma barra que possui um contrapeso e um jogo de argumentação. Como esses exem
que se projeta dentro da câmara, a uma altura plos sugerem, a modelagem pode ser usada para
que requer que o rato fique em pé em suas patas o bem ou para o mal, e muitos utilizam-se dela
traseiras para alcançá-la. Começamos com o con mesmo sem saber o que estão fazendo (esses ca
trapeso ajustado para um nível modesto. Nesta sos também podem ser chamados de seleção na
situação o rato pressiona facilmente, apoiando tural ontogenética). Assim como no caso do re
uma ou ambas as patas dianteiras sobre a barra. forço e da punição, quando a modelagem é usa
Com o passar de reforços sucessivos, aumenta da para o bem, deve ser feita com eficiência; e
mos gradualmente o contrapeso, até a força re quando é usada para o mal, a melhor defesa é
querida ficar próxima do peso do próprio rato. conhecer como ela funciona.
Uma vez que a força exceda o peso do rato, a A modelagem é baseada no reforço diferen
resposta de pressionar será efetiva somente se cial: em estágios sucessivos, algumas respostas
emergir uma nova topografia. Empurrar a barra são reforçadas e outras não. Além disso, à medi
para baixo, com ambas as patas traseiras no chão, da que o responder se altera, os critérios para o
não faz mais efeito. Em vez disso, as patas do reforço diferencial também mudam, em aproxi
rato sobem do chão. Enquanto suspenso na bar mações sucessivas da resposta a ser modelada.
ra, o rato deve agora levantar suas patas trasei A propriedade do comportamento que torna a
ras até a parede da câmara, onde uma engrena modelagem efetiva é a variabilidade do compor
gem de arame permite que ele se agarre firme tamento. Duas respostas nunca são uma mesma
mente. Mesmo com o contrapeso excedendo o resposta e o reforço de uma resposta produz um
seu próprio peso, o rato pode agora pressionar a espectro de respostas, cada uma das quais difere
barra, puxando-a entre suas pernas traseiras e di da resposta reforçada ao longo de algumas di
A p r e n d iz a g e m 131
mensões como topografia (forma), força, mag fizesse movimentos semelhantes no outro extre
nitude e direção. Dessas respostas, algumas es mo da câmara, distante da barra, não chamaría
tarão mais próximas da resposta a ser modelada mos essas respostas de pressão à barra, não im
do que outras e podem, então, ser selecionadas, porta o quanto elas se assemelhassem a outras
para serem reforçadas em seguida. Reforçar es respostas que antes operaram a barra.
tas respostas, por sua vez, será seguido de ou Não podemos discutir o comportamento ape
tras mais, algumas das quais podem estar ainda nas em termos de respostas isoladas. As respos
mais próximas da resposta a ser modelada. As tas individuais são instâncias de comportamen
sim, o reforço poderá ser usado para mudar o to, e cada uma pode ocorrer apenas uma única
espectro de respostas, até que a resposta a ser vez; as respostas podem ter propriedades em co
modelada ocorra. mum, mas não podem ser indênticas em todos
Tal aspecto da modelagem é algumas vezes os aspectos. O reforço de uma resposta produz,
suplementado por outros efeitos de reforçado mais tarde, respostas que se aproximam mais ou
res. Alguns reforçadores aumentam a atividade menos estreitamente da resposta reforçada, mas
geral. Por exemplo: a apresentação de comida as respostas subseqüentes não podem ser exata
toma o pombo privado de comida mais ativo (é mente a mesma resposta. Por outro lado, não po
difícil, por isso, usar comida para reforçar uma demos agrupar todas as respostas sem distinção,
postura; cf. Blough, 1958). Assim, uma resposta porque ficaríamos sem nada para falar a não ser
mais próxima daquela a ser modelada ocorre, do comportamento em geral. Temos que encon
ocasionalmente, porque a apresentação de um trar um nível intermediário de análise, em que
reforçador toma o organismo mais ativo. não nos referimos nem a respostas individuais,
Há um paradoxo na modelagem. Diz-se que nem a comportamento em geral, mas sim zelas
o reforço aumenta a probabilidade da resposta ses de respostas definidas por propriedades em
que é reforçada. Mas, uma resposta nunca é re comum (Skinner, 1935a).
petida exatamente. Então, como podemos ape
lar para o reforço como a base da resposta mo
delada, quando os reforçadores são apresenta CLASSES DE RESPOSTA
dos somente depois de respostas que apenas se
aproximam dela? De fato, se as respostas indivi Em experimentos sobre respostas de pressio
duais nunca são repetidas, como podemos sequer nar a barra com ratos, a barra é conectada a uma
falar de reforço? Apontamos esse problema no chave que se fecha sempre que o rato desloca
Capítulo 1, mas não o resolvemos. A seguir, ve suficientemente a barra para baixo e com a força
remos que não podemos lidar apenas com res necessária. A propriedade comum a todas as res
postas singulares; devemos lidar com classes de postas de pressão à barra é esta conseqüência:
respostas. toda pressão à barra que feche o circuito preen
che o requisito. Definir classes de resposta em
termos de efeitos ambientais em comum é a base
tanto para registrar respostas na classe quanto
Seção B Diferenciação e Indução para programar conseqüências para elas. Por
exemplo, um experimentador poderia registrar
Se observarmos as respostas de pressão à as pressões à barra contando o número de vezes
barra por um rato, podemos notar que o rato pres que o circuito se fecha e programando reforços
siona a barra com uma pata, com ambas as pa com alimento para todas essas respostas.
tas, sentando-se sobre ela ou até mesmo mor Mas, essa classe de respostas estabelecida
dendo-a. Cada uma delas é uma resposta dife pelo experimentador tem importância compor-
rente; mesmo quando duas respostas são emiti tamental apenas se for afetada pelas operações
das com a mesma pata, elas não seriam idênti impostas a ela. Devemos acrescentar uma ques
cas. Contudo, denominamos todas essas respos tão fundamental: as conseqüências modificam a
tas de pressão à barra. Por outro lado, se o rato probabilidade de respostas nesta classe? Se sim,
132 A . C h a r l e s C a ta n ia
ela pode ser chamada de uma classe operante; vação emitida poderia ser apropriadamente cha
uma classe operante é uma classe de respostas mada de uma classe operante, e essas respostas
afetada pela maneira pela qual ela opera sobre de salivação seriam membros desta classe (cf.
ou funciona no ambiente. As pressões à barra e Harris & Turkkan, 1981, sobre modelagem da
as bicadas no disco são exemplos convenientes, elevação da pressão sangüínea).
mas as classes operantes englobam casos mais Um operante é uma classe que pode ser mo
extensos e complexos. dificada pelas conseqüências das respostas in
Nos primórdios da Psicologia da Aprendiza cluídas na classe. Essa definição de classe de res
gem, quando o comportamento operante era de postas depende de propriedades comportamen-
nominado instrumental ouvoluntário, supunha- tais do responder e não de propriedades fisioló
se que somente as respostas da musculatura es gicas, como a distinção somática-autonômica. As
quelética poderiam fazer parte de classes de res propriedades comportamentais de classes ope
postas modificáveis por suas conseqüências. Ou rantes são baseadas na operação denominada
tras classes de respostas, chamadas de autonô reforço diferencial, isto é, o reforço de apenas
micas., tais como as das glândulas e dos múscu algumas das respostas que se incluem em uma
los lisos, não haviam se mostrado modificáveis determinada classe. Essa operação torna o res
da mesma maneira. Tais respostas eram tipica ponder subseqüente cada vez mais estreitamen
mente eliciadas e os procedimentos de condicio te ajustado às propriedades definidoras da clas
namento de Pavlov (ver Capítulos 2 e 12) ha se. A característica essencial de um operante é a
viam mostrado como estímulos novos poderiam correspondência entre uma classe de respostas
passar a eliciá-las. Naquela época, era negligen- definida por suas conseqüências e o espectro de
ciável a evidência de que essas respostas pode respostas geradas por essas conseqüências.
riam ser modificadas por meio de reforço ou de
punição. Além disso, era possível argumentar que
tais mudanças nas respostas autonômicas eram ALGUNS EXEMPLOS DE REFORÇO
mediadas por outros tipos de comportamentos DIFERENCIAL
(como quando exercícios aumentam a taxa de
batimentos cardíacos). Coloquemos um rato privado de alimento em
Apesar das controvérsias (p. ex., Dworkin & um câmara com uma fenda horizontal de 30 cen
Miller, 1986), algumas respostas autonômicas tímetros de comprimento em uma das paredes
parecem modificáveis por suas conseqüências. (30 cm equivalem a aproximadamente 12 pole
Consideremos a resposta de salivar. A salivação gadas). Células fotoelétricas registram onde o
pode tanto ocorrer espontaneamente como ser rato introduz seu nariz, ao longo da fenda. Rotu
eliciada por um estímulo como o alimento na laremos cada segmento sucessivo de 2 centíme
boca (p. ex., Zener & McCurdy, 1939; cf. Capí tros ao longo da extensão da abertura como
tulo 4). Podem-se programar conseqüências para posições 1 a 15, da esquerda para a direita.
a salivação espontânea ou emitida, medida em Pelotas de alimento podem ser apresentadas
gotas de salivas. Contudo, a conseqüência para em um comedouro na parede oposta à da fen
a salivação não pode ser um alimento, porque da. As apresentações de pelotas são acom pa
seria difícil distinguir o efeito do alimento como nhadas por um ruído característico, e o rato
reforçador de seu efeito como um eliciador de rapidamente vai ao comedouro e come sem
salivação. Como a água não elicia salivação, ela pre que uma pelota é apresentada (cf. Antoni-
poderia ser usada para reforçar a salivação em tis, 1951).
cachorros privados de água (Miller & Carmona, De início, o rato passa apenas um tempo cur
1967). A salivação aumentou quando produzia to próximo à fenda na parede. Ocasionalmente,
água (reforço) e diminuiu quando impedia a apre cheira a fenda e introduz o focinho nela, ao mes
sentação de água (punição). Essas respostas au mo tempo que se movimenta ao longo da pare
tonômicas de salivação foram modificadas por de, mas essas respostas são relativamente infre-
suas conseqüências; em outras palavras, a sali qüentes e não têm qualquer relação sistemática
A p r e n d iz a g e m 133
com as posições ao longo da fenda. Uma distri
buição de freqüência das respostas do rato em
A □ Não-reforçadas
função da posição é mostrada em A, na Figura ^ Reforçadas
7.1.
Agora vamos reforçar a resposta do rato, de
introduzir o focinho na fenda, mas somente se
as respostas ocorrerem nas posições de 9 a 12. O
efeito inicial do reforço, ilustrado no painel B,
não se restringe somente àquelas posições cor -r-n -T l PI í~ l I
relacionadas com o reforço; ele aumenta o res 1 5 10 15
ponder em todas as posições. Esse fenômeno, a r b r I
extensão do efeito do reforço a outras respostas
não incluídas na classe reforçada, é denominado
indução (um sinônimo ocasional é o de genera
lização de respostas). No exemplo, reforçar as
respostas nas posições de 9 a 12 afetou não so
mente o responder naqueles locais, mas também
o responder nas outras posições ao longo de toda -rrr^TTrlM-7-n
1 5 10 15
a fenda.
À medida que continuamos o reforço dife f C |--------------1
134 A . C h a r l e s C a ta n ia
respostas ao longo das posições não muda com tarde, como em E). As duas classes não preci
a continuação do reforço diferencial. sam corresponder exatamente. De fato, o grau de
Neste exemplo, a distribuição de respostas correspondência entre (1) o comportamento que é
emitidas passou a se circunscrever estreitamen reforçado e o (2) comportamento gerado por esse
te aos limites da classe de respostas reforçadas. reforço é uma dimensão fundamental de qualquer
Esse processo é chamado de diferenciação, e o classe de respostas reforçadas. O comportamento
responder estabelecido dessa maneira é denomi que é reforçado é chamado de (1) classt descritiva
nado diferenciado. O reforço diferencial estabe ou nominal, o comportamento gerado pelo refor
leceu uma classe de respostas definida em ter ço é chamado de (2) classe funcional.
mos de posição da resposta. Contudo, se a dis Consideremos agora um outro exemplo hi
tribuição de respostas em E representa a dife potético, ilustrado na Figura 7.2. Usamos nova
renciação máxima possível, o que dizer sobre as mente células fotoelétricas para registrar as po
respostas que continuam nas posições 6, 7, e 8 sições nas quais o rato introduz seu focinho na
ou nas posições 13,14 e 15? Elas estão fora dos fenda, mas desta vez a fenda é vertical, e não
limites da classe de respostas correlacionadas horizontal. As quinze posições são numeradas
com o reforço e, de acordo com uma interpreta consecutivamente de baixo para cima. Inicial
ção rigorosa das propriedades definidoras de ope mente, o rato introduz o focinho na fenda, oca
rantes, não podem ser contadas como membros sionalmente, à medida que explora a câmara, mas
da classe operante. Elas podem, no máximo, ser essas respostas ocorrem predominantemente nas
descritas em termos de indução: essas respostas posições mais baixas, como emA, na Figura 7.2.
estão tão próximas da classe de respostas refor Talvez uma resposta ocorra na posição 15, no
çadas ao longo do contínuo de posição que os topo da fenda, se formos pacientes o bastante
efeitos do reforço da classe reforçada se esten para esperar. Mas pode ser que não. A modela
deram a elas, a partir da classe reforçada. Essa gem é uma opção melhor.
perspecdva simplesmente atribui o responder, O reforço é programado inicialmente para
dentro dos limites da classe reforçada, à diferen respostas nas posições de 7 para cima, como em
ciação e o responder fora desses limites, à indu B. O responder aumenta, mas a maioria das res
ção. A mesma operação gera tanto o responder postas permanece nas posições mais baixas. Mais
dentro como fora desses limites e este responder tarde, o critério de reforço diferencial é aumen
pode ser representado como uma distribuição ao tado para 9, como em C. Neste ponto, o respon
longo de um contínuo. der nas posições mais baixas da fenda chegou a
A dificuldade pode ser resolvida reconhecen diminuir, a distribuição mudou para posições
do-se que esse exemplo, de fato, envolve duas mais altas e, pela primeira vez, ocorreram res
classes diferentes. A primeira classe (1) é a base postas na posição 13. Quando a modelagem con
para a operação de reforço e é representada pe tinua, com o aumento do critério para a posição
las linhas tracejadas verticais na Figura 7.1; es 11, o responder torna-se mais concentrado na
tas linhas mostram como as conseqüências (co região correlacionada com o reforço, em D. Fi
mida) dependem da posição da resposta. As li nalmente, em E, o critério é elevado para a posi
nhas mostram as probabilidades condicionais da ção 13. Se este critério tivesse sido imposto ao
comida, dada uma resposta, em função da posi desempenho inicial, em A, talvez não tivesse
ção; a probabilidade é 1,0, dadas as respostas ocorrido nenhuma resposta reforçável. Com o
nas posições 9 a 12; e é zero em qualquer outra reforço diferencial de aproximações sucessivas,
posição. Essa distribuição define uma classe de entretanto, a distribuição de respostas mudou
respostas em termos das conseqüências das res para as posições mais elevadas, com uma fre
postas dentro daquela classe. A segunda classe qüência máxima de respostas na posição 12.
de respostas (2) é dada pelo desempenho efeti Contudo, esse máximo permanece abaixo do li
vamente produzido pelo reforço. Esta classe é mite que separa as respostas reforçadas das não-
representada, a qualquer momento, pela distri reforçadas e, nessas circustâncias, há mais res
buição real de respostas (p. ex., no início do cur postas não-reforçadas do que reforçadas. A base
so do reforço diferencial, como em C, ou mais para esse resultado é simples: o rato pode alcan-
A p r e n d iz a g e m 135
çar algumas posições mais facilmente do que ou
□ Não-reforçadas
tras. Mas quais são as implicações desse resul
052 Reforçadas
tado para a definição de classes de respostas em
100 termos de suas conseqüências?
Neste caso, a classe de respostas definida
pelas conseqüências (respostas nas posições 13
e acima, que eram reforçadas) diferiu da classe
de respostas gerada por aquelas conseqüências
(responder até a posição 15, mas com um máxi
mo na posição 12). O responder foi obviamente
modificado por suas conseqüências, mas parte
dele permaneceu fora dos limites do critério de
100
reforço. Não podemos falar de qualquer classe
separadamente; os operantes devem ser defini
dos em termos da relação entre (1) o ambiente
(as conseqüências que ele programa para as res
il—L.-L.i i t u fà n m tn I I I postas) e (2) o comportamento (o responder pro
10 15 duzido por essas conseqüências). Por conveni
ência, ocasionalmente falaremos de um operan
te apenas em termos de uma classe definida pe
las conseqüências ou somente em termos da dis
Respostas
100
tribuição gerada por essas conseqüências, mas é
importante lembrar que o operante é mais rigo
!
rosamente definido em termos da correspondên
cia entre as duas classes.
.r f - r n - r u O reforço inclui, inevitavelmente, diferencia
10 15
ção. Respostas como pressões à barra e bicadas
r D em um disco devem ocorrer em um local parti
cular e ter força suficiente, caso contrário não
100
136 A . C h a r l e s C a ta n ia
produzirão as conseqüências programadas para mento e passam o tempo batendo a cabeça com
elas. Poderíamos repetir os exemplos das Figu força e mordendo-se, de modo que não pode
ras 7.1 e 7.2, substituindo a localização da res mos distinguir entre as crianças pela topografia
posta por dimensões como força da pressão à de seus comportamentos. Contudo, descobrimos
barra ou da bicada no disco. Esses exemplos ilus que a primeira criança aumenta esse comporta
tram a seleção do comportamento por suas co- mento quando as pessoas estão por perto, mas
seqüências. Ao longo da vida de um organismo não prestam atenção nela; a segunda criança au
individual, a seleção de populações de respostas menta o comportamento autolesivo quando os
é análoga à seleção de populações de organis outros pedem a ela que complete alguma tarefa
mos ao longo do tempo evolucionário. Ambos (p. ex., leitura ou aritmética simples); e a tercei
os tipos de seleção envolvem classes criadas ra apresenta o comportamento independentemen
pelas contingências (cf. Capítulos 3 e 21). te do contexto social. Para esses três meninos,
os comportamentos autolesivos são muito simi
lares em topografia, mas suas funções são com
CLASSES OPERANTES: FUNÇÃO pletamente diferentes. Para a primeira criança o
VERSUS TOPOGRAFIA comportamento de autolesão chama a atenção; para
a segunda, ele evita ter que obedecer a exigências;
Vimos como classes de comportamento po e para a terceira, o comportamento não parece de
dem ser criadas por meio de reforço diferencial. pender de qualquer contingência do meio.
Parece, de início, que essas classes são defini Tais análises recomendam programas de tra
das por suas propriedades topográficas (o que tamento muito diferentes para cada menino. Ao
elas parecem). Mas não é assim. Consideremos, primeiro devem ser ensinadas outras formas mais
mesmo que superficialmente, uma simples resposta efetivas de conseguir a atenção dos outros, e ele
como a pressão à barra pelo rato. O rato pode pres deve ser colocado em situações onde será me
sionar a barra com sua pata esquerda ou com a nos privado de atenção. As tarefas selecionadas
direita ou com ambas as patas. Ele pode também para a segunda criança devem ser apropriadas
pressionar a barra para baixo com o focinho ou para sua competência e seu sucesso nestas tare
pulando nela ou sentando sobre ela. Essas respos fas deve ser reforçado (seu comportamento su
tas parecem bem diferentes umas das outras, mas gere que foi freqüentemente punido no passa
todas elas contam como pressões à barra; todas do). A fonte do comportamento autolesivo da
são membros de uma mesma classe operante. Ape terceira criança é desconhecida, e devemos
sar de suas diferenças, elas são membros daquela considerar a possibilidade de que ele tenha
classe porque compartilham uma função comum: alguma fonte orgânica (talvez a criança tenha
todas produzem as mesmas conseqüências. nascido de uma mãe usuária de drogas e te
Em outras palavras, os operantes são defini nha sofrido danos no desenvolvimento cere
dos por suas funções e não por suas formas. O bral pré-natal).
problema do comportamento autolesivo em O fato é que é mais importante definir as clas
crianças com atrasos no desenvolvimento ilus ses de comportamentos por suas conseqüências
tra a importância desta distinção (p. ex., Iwata e do que por suas topografias. Embora o compor
col., 1990; 1994; Lovaas & Simmons, 1969; tamento autolesivo seja parecido para as três
Wahler, 1975). Este comportamento pode incluir crianças, a atenção produzida pelo comportamen
bater a cabeça com força, morder a própria pele to da primeira criança o distingue do comporta
até sair sangue, colocar o dedo no espaço entre o mento de esquiva da segunda criança; algum as
globo ocular e a cavidade ocular e muitas outras pecto de auto-estimulação pode estar envolvido
topografias. Esse é um comportamento perigoso no comportamento da terceira criança, mas infe
e as crianças que se engajam nele podem oca lizmente não sabemos o bastante sobre tais ca
sionar danos permanentes para si mesmas. sos.
Consideremos três crianças do sexo mascu Vamos agora nos concentrar na primeira
lino que apresentam um comportamento autole criança. Suponhamos que tentássemos extinguir
sivo. Elas estão alojadas em um centro de trata o comportamento autolesivo, ignorando-o. Em
A p r e n d iz a g e m 137
primeiro lugar, poderíamos ter problemas para
Seção C A Estrutura Operante
fazê-lo, porque não podemos tolerar os danos que
a criança pode provocar em si mesma. Contudo,
se formos persistentes, poderemos descobrir que Vimos que o responder pode variar não so
o comportamento autolesivo não diminui. Uma mente quanto ao local ou força, mas também
possibilidade é que não tenhamos identificado quanto à topografia ou forma, à direção e assim
adequadamente a classe de comportamentos re por diante. O reforço diferencial pode ser basea
levante. A topografia novamente nos enganou. do em qualquer dimensão de resposta, de modo
Se a função deste comportamento é chamar a que qualquer dimensão ou combinação de dimen
atenção, ele provavelmente é parte de uma clas sões pode fornecer as propriedades definidoras
se de comportamentos muito maior, que inclui de uma classe operante. Vamos explorar agora a
gritaria e fazer diabruras, bater ou até agredir os diferenciação de classes operantes ao longo das
atendentes no centro de tratamento, e um grande dimensões que tem sido objeto de temas teóri
número de outras respostas que devem funcio cos significativos na história da Psicologia da
nar para conseguir atenção. Isso nos diz o quan Aprendizagem. Nossos exemplos incluem a or
to a atenção é importante para esta criança. Isso ganização temporal do comportamento, seu pa
também nos lembra que não podemos definir as drão seqüencial e a novidade e a variabilidade
classes de respostas pela sua aparência. Neste comportamental.
caso, devemos definir um programa de tratamen
to que use atenção para reforçar comportamen
tos efetivos e apropriados. Tanto a criança como REFORÇO DIFERENCIAL DA
os seus atendentes serão beneficiados se o pro ORGANIZAÇÃO TEMPORAL
grama tiver sucesso.
O comportamento autolesivo era uma classe As propriedades temporais do responder in
de comportamentos embutida em uma classe cluem a latência, a duração e o ritmo. Quaisquer
maior de comportamentos de chamar a atenção dessas propriedades podem servir de base para
(cf. Lalli e col., 1995). A classe maior foi esta o reforço diferencial. Por exemplo, em um pro
belecida como classe por causa das conseqüên cedimento que reforce diferencialmente longas
cias comuns dos seus membros, assim como as latências, as bicadas de um pombo em um disco
várias topografias de pressão à barra (pata direi iluminado podem ser reforçadas com alimento
ta ou esquerda, ambas as patas, sentar na barra) somente se um intervalo mínimo de tempo tiver
passaram a fazer parte de uma mesma classe pela transcorrido desde a iluminação do disco. Quan
conseqüência comum de produzir comida. As do a latência-critério é menor do que 10 segun
conseqüências comuns são o elo que une as clas dos, a latência-média do pombo geralmente ex
ses de comportamentos (cf. Malone, 1990, p. cede o critério e há mais respostas reforçadas do
296). Além disso, quando uma classe de respos que não-reforçadas, mas à medida que o critério
tas parece insensível às suas conseqüências, de latência se toma mais longo, menos respostas
como quando o comportamento autolesivo da têm latências longas o suficiente para preenche
primeira criança parecia não se extinguir, deve rem o requisito para reforço, e proporções me
mos considerar a possibilidade de que tenhamos nores de bicadas são reforçadas (a tendência do
definido mal a classe e de que ela seja parte de responder a ultrapassar o critério para reforço
uma classe maior, de modo que os outros nas durações mais curtas e a ficar abaixo dele
membros desta classe mais ampla continuam nas durações mais longas é uma característica
a ter as conseqüências que, antes, comparti comum a inúmeros desempenhos gerados pelo
lhavam com a subclasse que estamos focali reforço diferencial de propriedades temporais do
zando (p. ex., o comportamento de chamar a comportamento, tanto em humanos como em
atenção do presente exemplo; cf. Capítulo 9, infra-humanos: Catania, 1970).
sobre as classes de comportamento de ordem A diferenciação de propriedades temporais
superior). do comportamento é relevante para os esquemas
138 A . C h a r l e s C a ta nia
de reforço, tratados em detalhe no Capítulo 10. ponder. No desempenho em DRL a taxa do res
Veremos que quantidades substanciais de com ponder diminui, porque a probabilidade de res
portamento podem ser mantidas, mesmo quan postas precedidas por pausas longas (IRTs lon
do as respostas produzem o reforçador apenas gos) aumenta. Assim, no responder em DRL, o
ocasionalmente. Nos esquemas de reforço, as IRT deve ser considerado um componente de um
respostas podem ser elegíveis para reforço com operante complexo, consistindo de um IRT mais
base no número de respostas já emitidas, no tem uma resposta, nesta ordem.
po transcorrido desde algum evento ou em algu No segundo exemplo, em que o reforço de
ma combinação dessas condições. Uma proprie pende da emissão de 20 ou mais bicadas em não
dade de particular interesse é a separação de res mais que 5 segundos, o responder pode aumen
postas no tempo. tar, mas apenas porque a taxa alta de respostas
Por exemplo, um motorista pode ter êxito em foi reforçada diferencialmente. Tal esquema é
ligar um carro afogado apenas se esperar o sufi denominado reforço diferencial de taxa alta ou
ciente depois da última tentativa de ligá-lo; de esquema DRH. O esquema DRH tem recebido
modo inverso, alguém pode conseguir encher o menor atenção do que o DRL, simplesmente
pneu de uma bicicleta, com uma bomba defei porque é mais difícil de trabalhar com esquemas
tuosa, que vaza ar, apenas se bombear bem rapi DRH do que com DRL. Considere um pombo
damente. De maneira análoga, o reforço pode ser cuja bicada tenha tido a taxa aumentada para mais
programado para uma bicada de um pombo so do que 4 respostas por segundo, por um esque
mente se aquela bicada tiver sido precedida por ma DRH que requeira 20 bicadas em 5 segun
10 segundos sem nenhuma outra bicada, ou so dos. (De fato, um experimentador habilidoso
mente se o bicar tiver sido emitido tão rapida pode, aumentando gradualmente o critério, pro
mente que ao menos 20 bicadas tenham ocorri duzir rotineiramente taxas que excedam 10 bi
do nos últimos 5 segundos. No primeiro caso, o cadas por segundo, em pombos.) Enquanto o
bicar diminui de freqüência, no segundo ele au pombo mantiver esta taxa, as bicadas produzi
menta. rão reforçadores freqüentemente. Mas, se, por
Contudo, se focalizamos apenas o bicar, so alguma razão, o pombo reduz a velocidade do
mos levados a dizer que o primeiro caso não era responder, bicando a uma taxa que atinge o cri
uma instância de reforço. De fato, a unidade do tério de reforço menos freqüentemente, as bica
responder reforçada no primeiro caso não era das produzirão reforçadores menos freqüentes.
uma bicada e sim uma seqüência, incluindo uma Isso, por sua vez, reduz ainda mais a taxa de bi
pausa mais uma bicada. Na medida em que essa cadas, o que leva, novamente, a um decréscimo
combinação toma-se mais provável (demonstran na freqüência de reforçadores. Esse círculo vi
do assim o efeito dos reforçadores sobre a classe cioso pode terminar em uma taxa de respostas
de respostas que os produziu), a taxa de bicar tão baixa que o critério para reforço nunca é
necessariamente diminui. atingido, e as bicadas do pombo podem cessar
O procedimento no primeiro exemplo, no completamente. Para reinstalar o responder, o ex
qual uma resposta é reforçada somente se for perimentador terá que estabelecer novamente o
precedida por um tempo mínimo sem uma res desempenho de taxa alta por meio de modelagem.
posta, é denominado reforço diferencial de taxa No esquema de DRL, no entanto, um efeito
baixa ou esquema DRL (Ferster & Skinner, inicial dos reforçadores que seguem as bicadas
1957); o procedimento é denominado, também, é que as bicadas ocorrem mais freqüentemente.
esquema de tempo entre respostas ou reforço de Essa taxa mais alta de bicadas significa que elas
IRTs (Mallot & Cumming, 1964), porque o re ocorrem mais próximas no tempo e, então, me
forço é baseado no espaçamento temporal de res nos IRTs são longos o bastante para atingir o cri
postas individuais, e não na taxa média gerada tério de reforço. Assim, a apresentação de refor
por muitas respostas que ocorrem ao longo de çadores diminui, e a taxa de resposta, por sua
um período extenso de tempo. Em geral, quanto vez, também diminui. Mas esse decréscimo na
mais longo o tempo entre as respostas ou o IRT taxa simplesmente toma os IRTs longos o bas
requerido para reforço, mais baixa a taxa do res tante para atingirem com maior probabilidade o
A p r e n d iz a g e m 139
critério de reforço. Assim, o bicar oscila entre zer que elas são punidas negativamente. Nesse
taxas altas acompanhadas por decréscimo no re caso, assim como no caso de distinguir entre o
forço e taxas reduzidas acompanhadas por au reforço positivo do não-responder e a punição
mento no reforço. O bicar pode ser mantido, por negativa do responder, seria preferível falar de
essas contingências, por extensos períodos de respostas específicas, em vez de falar de sua au
tempo. sência. Mas a terminologia do DRO está bem-
Estes exemplos indicam que devemos ser estabelecida e, embora potencialmente proble
cautelosos quando tomamos a taxa de respostas mática, pelo menos especifica um procedimen
como uma medida fundamental dos efeitos do to, em vez de atribuir propriedades funcionais a
reforço. A taxa de respostas já chegou a ser con eventos como o não-responder.
siderada uma medida fundamental dos efeitos do
reforço (cf. força do reflexo, no Capítulo 4; Ne-
vin, 1992), mas, com o reconhecimento de que a COMPORTAMENTO COMPLEXO:
taxa era apenas uma propriedade do comporta A APRENDIZAGEM EM LABIRINTO
mento que poderia ser diferenciada, como ou
tras propriedades tais como força e topografia, A maioria de nossos exemplos até agora en
essa noção se tomou menos defensável. Embora volveu unidades de respostas relativamente dis
o responder sob DRL ocorra a uma taxa baixa, o cretas, como pressionar a barra, para ratos, e bi
responder é facilmente estabelecido e sustenta car discos, para pombos. Mas nossa análise da
do; e embora o responder sob DRH ocorra a uma diferenciação indica que as seqüências comple
taxa alta, ele é difícil de se estabelecer e é frágil, xas de respostas também podem ser tratadas
quando estabelecido. como classes operantes. Por exemplo, o percur
Existem várias outras classes de esquemas de so de um rato em um labirinto pode ser conside
reforço diferencial, como o reforço diferencial rado uma resposta única, mas muito complexa.
de responder espaçado, que estabelece limites Consideremos o labirinto mais simples, o labi
tanto inferiores quanto superiores para os IRTs rinto em T (C, na Figura 5.2). Se a caixa-alvo
que precedem uma resposta reforçada e que ten esquerda está vazia, e a caixa-alvo direita con
de a gerar uma taxa de respostas razoavelmente tém alimento, a seqüência de respostas que in
constante. O reforço diferencial de outro com clui correr da caixa de saída até o ponto de esco
portamento (geralmente abreviado como DRO lha, virar à direita e, então, correr à caixa-alvo
e ocasionalmente chamado de reforço diferen da direita será reforçada. As seqüências que in
cial de comportamento zero) apresenta um re cluam virar à esquerda não serão reforçadas ou,
forçador na condição de que decorra um tempo pelo menos, não levarão ao reforçador tão rapi
definido sem uma resposta especificada. Este é, damente (se o rato tiver oportunidade de refazer
de fato, o nome técnico para o procedimento o caminho da caixa-alvo esquerda para a caixa-
geralmente usado para programar o reforço para alvo direita). A medida que o rato começa a es
um responder alternativo, durante a extinção de colher mais e mais freqüentemente a trilha da
um comportamento, em situações de aplicação direita, podemos dizer que esse desempenho no
(cf. o exemplo do comportamento autolesivo, no labirinto em T tomou-se diferenciado.
fim da sessão A, Capítulo 5). Mas a aprendizagem em labirinto pode en
Consideremos, por exemplo, um esquema de volver seqüências mais complexas. Considere
DRO de 10 segundos programado para as bica mos a seqüência de respostas no problema de
das de um pombo. Esse esquema reforça a clas alternação dupla (p. ex., Hunter, 1928). Ao fi
se de todas as respostas que consistam em 10 nal de uma pista central, um ponto de escolha
segundos sem bicar. Mas, se um reforçador é fornece a oportunidade para uma virada à esquer
apresentado depois de cada 10 segundos sem uma da (E) ou à direita (D), mas ambas as trilhas le
bicada, então, cada resposta deve atrasar o re vam de volta à outra extremidade do labirinto.
forço por, pelo menos, 10 segundos. Se as bica Sem ser removido do aparato, o organismo pode
das ocorrerem menos freqüentemente, já que im retomar ao ponto central do labirinto e, então,
pedem ou adiam o reforço, seria apropriado di novamente no ponto de escolha, escolher virar à
140 A . C h a r l e s C a ta nia
esquerda ou à direita. Se ele completa uma série meira vez pode sempre virar à esquerda, depois
de viradas à esquerda e à direita na ordem apro mais tarde, virar sempre à direita, depois, mais
priada, o alimento é apresentado quando ele re tarde, ainda alternar entre direita e esquerda e
torna ao corredor central do labirinto. assim por diante, até que os vários componentes
Nesses equipamentos, a questão era saber se do labirinto sejam dominados. Em uma platafor
os organismos poderiam aprender uma seqüên ma de saltos de Lashley com luz e escuro como
cia de dupla alternação, EEDD ou DDEE. A se estímulos, em que as escolhas do estímulo escu
qüência era aprendida com diferentes graus de ro levam ao alimento, e a luz e o escuro, muda
êxito, por espécies diferentes e por organismos de lado irregularmente, um rato poderia, primei
diferentes da mesma espécie, mas a questão mais ramente, escolher com mais freqüência o estí
geral era se o comportamento do organismo, em mulo luz, depois escolher com mais freqüência
um certo momento, poderia determinar seu com o estímulo da esquerda, e depois escolher, prin
portamento em um momento posterior. Um or cipalmente, o estímulo da direita, até que final
ganismo não poderia completar, com sucesso, mente começasse a escolher consistentemente so
uma seqüência de alternação dupla, a menos que mente o lado escuro. Esses padrões sistemáticos
seu comportamento no ponto de escolha levasse foram notados por Krechevsky (1932), que os
em conta, de alguma maneira, as viradas que ele denominou de hipóteses e discutiu suas implica
havia feito nas vezes anteriores (no Capítulo 14 ções como segue:
verificaremos que a discriminação das caracte
rísticas do próprio comportamento é crítica para Quase toda descrição de aprendizagem animal apre
alguns aspectos da linguagem). senta frases tais como “movimentos exploratórios
aleatórios”; “entradas ao acaso”; “erros ao acaso.”
Uma diferença fundamental entre este e os E implicitamente suposto ou explicitamente afirma
exemplos prévios de diferenciação está na espe do, na maioria das descrições de aprendizagem, que
cificação da classe de respostas. Em uma escala no início do processo o animal é um animal “ao aca
linear, a posição, a força ou a duração são di so”. Suas respostas não têm propósito, forma nem
mensões únicas, ao longo das quais as respostas significado. Ensaio e erro desordenado parecem ser
a regra no início e depois que o comportamento te
podem ser localizadas, mas seqüências de res nha levado o animal a experimentar, finalmente, o
postas em aprendizagem de alternação dupla não padrão “correto”, as várias leis da aprendizagem
podem ser ordenadas sem ambigüidades ao lon operam para fixar (stamp in) as respostas corretas e
go de uma dimensão única. Por exemplo, a se apagar (stamp out) as incorretas. (Krechevsky, 1932,
qüência EEED contém uma única transição de p. 157)
E a D, e a seqüência EDED contém tantos Es
quanto Ds, mas então, qual delas está mais es Baseado nesses dados, Krechevsky contras
treitamente relacionada à seqüência reforçada tou esta noção com uma diferença, de acordo com
EEDD? Outra questão é se devemos tratar uma a qual o animal
seqüência de alternações como uma unidade
traz para cada nova situação uma história completa
única de comportamento ou subdividi-la em com de experiências. Ele está pronto para usar essas ex
ponentes menores. Por exemplo, se há mais al periências. Desde o primeiro momento, o animal
ternações à direita do que à esquerda na apren talvez comece a resolver seu problema de uma ma
dizagem de seqüência EEDD, porque somente neira direta, compreensiva de seu comportamento
total. Ao executar uma série de movimentos que
D é seguida imediatamente por um reforçador;
denominamos “perfeito,” “sem erro,” “aprendido,”
viradas individuais deveriam ser tratadas como “integrado,” o animal não está fazendo algo que te
unidades em vez de seqüências inteiras? nha emergido de uma série de respostas “imperfei
À medida que um organismo aprende uma tas”, “não integradas”, “ao acaso”. Ele está agora
seqüência de respostas nesta tarefa e em outras meramente desempenhando um conjunto diferente
de respostas integradas, série esta que foi precedida
relacionadas, o reforço diferencial age sobre o
por outra série de respostas tão integrada quanto
comportamento que o organismo traz para o ex aquela. Tais respostas, “falsas soluções,” “tentati
perimento. Esse comportamento geralmente é vas sistemáticas iniciais” etc. são rotuladas com o
sistemático. Por exemplo, um rato que esteja nome dúbio de “hipóteses”...Quando um indivíduo
aprendendo a correr em um labirinto pela pri humano se comporta exatamente da mesma manei-
A p r e n d iz a g e m 141
ra, também podemos dizer que ele tem uma “hipó é afetada pela alteração das contingências de re
tese”. No entanto, estamos primordialmente interes forço para outro.
sados não em defender nossa terminologia, mas em
descrever certo comportamento. O termo “hipóte
Algumas seqüências, no entanto, apresentam
se” foi escolhido meramente como um rótulo con problemas diferentes. Por exemplo, em uma sé
veniente para esse comportamento. (Krechevsky, rie de experimentos (Straub e col., 1979), quatrc
1932, pp. 528-529) discos em uma câmara de pombos eram ilumi
nados com as cores verde, branco, vermelho e
azul, com a localização de cada cor variando de
SEQÜÊNCIAS DE RESPOSTAS: tentativa a tentativa. Se o pombo bicasse os dis
ENCADEAMENTO VERSUS cos verde, branco, vermelho e azul, nesta ordem,
UNIDADES TEMPORALMENTE a bicada final no disco azul produzia alimento;
ESTENDIDAS se ele bicasse os discos fora de ordem, a tentati
va era cancelada. O pombo aprendeu a bicar o
Quando quebramos uma seqüência de com branco depois do verde, o vermelho depois do
portamento em seus componentes, podemos co branco e o azul depois do vermelho, mesmo
meçar a tratar a seqüência como uma sucessão quando a localização das cores mudava a cada
de operantes diferentes, cada um definido pela tentativa e mesmo que bicadas sucessivas na se
conseqüência reforçadora de produzir uma opor qüência não produzissem mudança de estímulo.
tunidade de emitir o próximo, até que a seqüên Além disso, as bicadas tendiam a ocorrer con
cia seja terminada por um reforçador. Esse tipo forme a seqüência reforçada, mesmo se uma das
de seqüência é denominado uma cadeia de res cores estivesse ausente (p. ex., depois de bicar o
postas. Um exemplo de cadeia foi apresentado branco, bicar o azul e não o verde, se o verme
no Capítulo 5, pela análise detalhada, feita por lho estivesse faltando). Como no problema de
Sidman, da pressão à barra de um rato reforçada alternação dupla na aprendizagem em labirinto,
com alimento. Erguer-se até a barra produzia a presente resposta na seqüência deve depender
contato com ela, o que estabelecia a ocasião para do comportamento passado do organismo. A
pressioná-la, o que produzia a visão do alimen mesma questão surge sempre que um organismo
to, o que estabelecia a ocasião para se aproxi aprende uma seqüência arbitrária em que respos
mar do comedouro, e assim por diante. Qualquer tas não são acompanhadas de mudanças de estí
segmento da seqüência serve à dupla função de mulos (p. ex., Boren & Devine, 1968). Pode o
reforçar a última resposta e de produzir as con próprio comportamento do organismo prover os
dições que ocasionam a resposta seguinte. Um estímulos discriminativos que ocasionarão o
estímulo discriminativo que exerce tal função re comportamento futuro?
forçadora é denominado um reforçador condici A questão crítica, porém, não é tanto se al
onado (alguns experimentos sobre reforço condi gumas seqüências de comportamento são man
cionado são tratados no Capítulo 11). tidas interligadas desta maneira; é, antes, se essa
Algumas seqüências de comportamento po é a única base para o desenvolvimento de se
dem ser reduzidas a unidades menores e, dessa qüências de comportamento. Na história da Psi
forma, a análise dos componentes pode ser con cologia da Aprendizagem, as posições defendi
firmada experimentalmente, verificando-se o das em relação a essa questão eram freqüente
quanto os componentes são independentes uns mente sintomas de sérias divisões entre pesqui
dos outros ( Skinner, 1934). Por exemplo, se pres sadores de orientações diferentes, alguns susten
sionar a barra não produz mais alimento, o pres tando que o comportamento seqüencial sempre
sionar a barra pode diminuir de freqüência, mas poderia ser interpretado com base em uma con-
podemos verificar também, apresentando alimen catenação de componentes (denominados, de for
to independentemente do comportamento, que a ma variada, associações, cadeias, ligações, estí-
visão da pelota continua a ocasionar o movimen mulo-resposta ou reflexos condicionados), e ou
to para o comedouro. Esse procedimento de tros afirmando que comportamento seqüencial
monstra que a integridade de um componente não não poderia ser interpretado adequadamente em
142 A . C h a r l e s C a tania
tais termos. Nossa conclusão é a de que é possível Os golpes digitais de um músico podem tocar o te
o comportamento seqüencial de ambos os tipos; a clado até 16 vezes por segundo em passagens que
demandam uma ordem definida e mutável de movi
questão experimental relevante, em qualquer caso, mentos sucessivos dos dedos. A sucessão de movi
é determinar a natureza da ordenação seqüencial. mentos é rápida demais, até mesmo para o tempo de
Talvez o argumento mais veemente seja o reação visual. Em uma leitura visual rápida é im
apresentado por Lashley (1951), que resumiu as possível ler as notas individuais de um arpejo. As
concepções precedentes da seguinte maneira: notas devem ser lidas em grupos...O controle sen
sorial dos movimentos parece estar descartado em
atos como estes. (Lashley, 1951, p. 123)
...a única teoria estritamente fisiológica que foi ex
plicitamente formulada para explicar a integração
temporal é a que postula cadeias de reflexos, nas O argumento de Lashley era que certos pa
quais o desempenho de cada elemento da série for drões seqüenciais de responder não podem ser
nece a excitação para o seguinte. Essa concepção reduzidos a uma sucessão de unidades estímu-
está na base das “teorias motoras” do pensamento lo-resposta ou S-R. Quando um datilografo efi
que...tentavam identificar o pensamento com movi
mentos inaudíveis de órgãos vocais, ligados em ca
ciente tecla rapidamente as letras the, essas le
deias associativas. Os...impulsos cinéticos de cada tras não podem ser estímulos dicriminativos para
movimento servem como um estímulo único para o o próximo toque, primeiro porque o datilografo
próximo da série. (Lashley, 1951, p. 114) estará executando o próximo toque antes mes
mo que as letras impressas na página possam ter
Lashley, então, descreveu casos, incluindo ilus qualquer efeito como estímulo e, segundo, porque
trações tanto de linguagem como de música, que elas não podem ser um estímulo discriminativo úni
tomavam estas explicações pouco plausíveis. Por co, se elas podem ocasionar o teclar a barra de es
exemplo, em resposta ao argumento de que cada paço ou qualquer outra tecla, dependendo do que
movimento serve como um estímulo único para o o datilografo esteja datilografando (p. ex., a pala
próximo, Lashley considerou a seqüência comple vra the, these, then ou thennometer).
xa de movimentos requerida para pronunciar o som O problema histórico foi que, diante de tais
da palavra right na ordem correta. A ordem não é argumentos, os pesquisadores provavelmente
dada pelos próprios sons, porque os sons podem sentiram-se forçados a escolher entre aceitar o
ocorrer em uma variedade de ordens e combina pressuposto de que o comportamento seqüencial
ções (p. ex., na ordem oposta como em tire). As dependia de seqüências estímulo-resposta ou
sim, a seqüência de sons não pode ser baseada so supor que ele dependia de unidades de compor
mente em conexões diretas, mas deve depender tamento temporalmente estendidas, não redutí
de alguma organização mais ampla. Lashley ex veis a tais seqüências. Mas a questão pode ser
pandiu o caso de seqüências de sons em palavras, considerada, claramente, como uma questão ex
para seqüências de palavras em sentenças: perimental. Certamente algumas seqüências po
dem ser compostas de tal modo que cada res
A palavra right, por exemplo, é um substantivo, ad posta produz condições para a próxima respos
jetivo, um advérbio e um verbo e tem quatro modos
de soletrar e, pelo menos, dez significados. Em uma
ta, enquanto outras devem ser integradas de tal
sentença como “The millwríght on my right thinks it modo que as respostas aparecem na ordem apro
right that some conventional rite should symbolize priada, sem que cada uma dependa das conse
the right o f every man to write as he pleases", o qüências da anterior. Para qualquer seqüência de
arranjo de palavras é, obviamente, devido não a comportamento em particular, a questão é deci
quaisquer associações diretas da palavra right em si
com outras palavras, mas aos significados que são
dir que tipo de seqüência é aquela.
determinados por algumas relações mais amplas.
(Lashley, 1951, pp. 115-116)
CLASSES OPERANTES E
E Lashley usou a música para ressaltar que a COMPORTAMENTO NOVO
mera rapidez de algumas seqüências limitam o
modo como as seqüências podem ter sido gera A estreita correspondência entre uma classe
das: de respostas com conseqüências e uma classe de
A p r e n d iz a g e m 143
respostas geradas por essas conseqüências é o (Neuringer, 1986; Page & Neuringer, 1985). Mas
critério para se falar em uma classe operante. o reforço diferencial da novidade (originalida
Como vimos, essas classes podem ser definidas de) ou da variabilidade suscita algumas questões.
ao longo de dimensões simples como força ou Os reforços são produzidos por respostas indi
localização, ou podem ter propriedades mais viduais, contudo as propriedades como a novi
complexas. Nossos exemplos incluíram esque dade e a variabilidade não podem ser proprieda
mas de reforço diferencial, labirintos e seqüên des de respostas individuais. Elas somente po
cias de respostas integradas. dem ser propriedades de respostas no contexto
Em cada caso, nosso interesse principal está de outras respostas que ocorreram antes. Uma
nas dimensões ao longo das quais o responder resposta em particular pode ser variável no con
se conforma à classe de respostas que é reforça texto de uma seqüência de respostas passadas e
da. A estrutura do comportamento é tal que nem estereotipada no contexto de outra. Assim, o fato
sempre podemos definir tais dimensões indepen de que a novidade (originalidade) e a variabili
dentemente das contingências de reforço. Por dade podem ser diferencialmente reforçadas sig
exemplo, considere o reforço de respostas no nifica que os organismos são sensíveis a popu
vas em golfinhos (Pryor, Haag, & O ’Reilly, lações de respostas e de conseqüências ao longo
1969). Os desempenhos novos foram modela de extensos períodos de tempo, e não meramen
dos reforçando-se, a cada sessão, alguma classe te a seqüências individuais resposta-estímulo (cf.
de respostas não-reforçada em qualquer sessão Capítulo 6, sobre análises molares e molecula
prévia. Por exemplo, se saltar para trás fosse re res).
forçada em uma sessão, bater na água com a cau Retornaremos a estas questões de classes de
da poderia ser reforçada na próxima sessão e comportamento mais tarde, especialmente em
pular na borda da piscina em outra sessão. De conexão com o comportamento verbal, quando
pois de algumas sessões, a cada nova sessão o trataremos da descoberta de que algumas estru
golfinho começava a emitir respostas que o ex turas gramaticais são mais facilmente aprendi
perimentador nunca tinha visto antes, como sal das do que outras, do mesmo modo que trata
tar para fora da água com um giro em espiral. A mos a descoberta de que os ratos aprendem as
novidade das respostas foi diferenciada, mas seqüências de alternação simples (EDED) mais
como esta classe operante pode ser especifica facilmente do que as seqüências de alternação
da, exceto pela descrição do critério de reforço? dupla (EEDD). Em cada caso, o problema é iden
O fato de que temos dificuldade em medir a ori tificar a dimensão por meio da qual o responder
ginalidade ou outras dimensões complexas do pode passar a se conformar à classe de respostas
comportamento não as elimina como proprieda que tem conseqüências. Algumas vezes essas di
des que possam definir as classes operantes. Um mensões talvez possam ser especificadas somen
comportamento novo deve ser emitido, antes que te por uma descrição verbal (p. ex., a classe de
possa ser incorporado em outro comportamento. todas as respostas não-reforçadas em ocasiões
Mesmo a variabilidade do responder pode ser prévias, como no reforço das respostas novas do
tomada como base para o reforço diferencial golfinho).
144 A . C h a r l e s C a ta n ia
Operantes Discriminados: Controle
de Estímulo
146 A . C h a r l e s C a ta n ia
FIGURA 8.1 Pressões à barra por um rato
na presença e na ausência de luz. A luz (SD)
estava correlacionada ao reforço em inter
valo variável e sua ausência (SA), à extin
ção. O índice de discriminação é a porcen
tagem do total de respostas emitidas na pre
sença de luz (a taxa em SD dividida pela
soma das taxas em SD e SA multiplicada por
100). Os dados são a mediana das taxas de
oito ratos. (Herrick, Myers, & Korotkin,
1959, Figura 2)
tético comparável ao da Figura 7.1, no capítulo Neste ponto começamos a reforçar as pres
anterior. Novamente temos um rato em uma câ sões à barra apenas se a fenda estiver iluminada
mara com uma fenda em uma parede, mas desta nas posições 9, 10, 11 ou 12; quando a luz apa
vez o rato não pode introduzir seu focinho na rece em qualquer outra posição, não reforçamos
fenda. A fenda está coberta com plástico trans as pressões. O efeito inicial do reforço é bastan
lúcido, e uma série de 15 lâmpadas, por trás do te semelhante àquele em B, na Figura 7.1: o res
plástico, pode iluminar os segmentos sucessivos ponder aumenta ao longo de todas as posições.
da fenda. Em outras palavras, as lâmpadas for Em outras palavras, o efeito do reforço não é
necem uma dimensão de estímulo cujos compo restrito apenas a estímulos em posições correla
nentes são análogos àqueles da dimensão de res cionadas ao reforço; ele se dispersa para outras
posta da Figura 7.1. Uma barra fica centralizada posições. A dispersão do efeito do reforço na
logo abaixo da fenda e acima de um comedouro. presença de um estímulo para outros estímulos
Agora acendemos as lâmpadas por trás da fen não-correlacionados com o reforço é denomina
da, uma por vez, em ordem irregular e registra da generalização. Neste exemplo, reforçar o res
mos as pressões à barra que ocorrem em presen ponder em presença de luzes nas posições 9 a 12
ça de cada lâmpada. Se não reforçarmos as pres afetou o responder em presença não apenas da
sões à barra, o responder será infreqüente e sem quelas luzes, mas também de luzes em todas as
qualquer relação sistemática com a região da fen outras posições ao longo da fenda. Este exem
da que estiver iluminada. De fato, os dados po plo difere essencialmente do anterior na dimen
dem ser similares àqueles em A, na Figura 7.1, são correlacionada com o reforço: no Capítulo
com a diferença de que o eixo X agora represen 7, lidamos com uma dimensão de resposta, mas
ta a posição do estímulo, e não a posição da res agora estamos lidando com uma dimensão de
posta. estímulo.
A p r e n d iz a g e m 147
Suponhamos que continuemos o reforço di criminação e generalização quando nos referi
ferencial com respeito à localização do estímu mos aos efeitos análogos do reforço diferencial
lo, reforçando as respostas apenas quando ilu com respeito a propriedades do estímulo?
minamos as posições de 9 a 12. O responder au Um fator metodológico pode ser crucial para
menta gradualmente quando essas posições es essa distinção. Quando estudamos o reforço di
tão iluminadas e diminui quando outras posições ferencial com respeito a propriedades da respos
são iluminadas. Os efeitos são parecidos com ta, registramos as respostas em diferentes clas
aqueles da Figura 7.1 em C, D e E. Finalmente, ses, mas além de programar as contingências, não
a maior parte das respostas ocorre com as luzes há muito mais que possamos fazer a respeito
nas posições correlacionadas com o reforço, delas. Se vemos um rato prestes a introduzir seu
como em E, e mesmo que algumas respostas ain focinho na posição 7 da fenda, não podemos im
da ocorram com as luzes em outras posições, pedir que o rato emita aquela resposta naquele
pode-se alcançar um ponto em que a distribui momento, mesmo que ele tenha respondido
ção de respostas não muda muito com a conti muito mais vezes naquela posição do que em
nuação do reforço diferencial. qualquer outra. Suponhamos, porém, que esti
Nesse exemplo, os estímulos que ocasiona véssemos trabalhando com propriedades do es
ram o responder vieram a conformar-se estreita tímulo. Poderíamos escolher entre várias ordens
mente com a classe de estímulos correlacionada e freqüências relativas possíveis para a apresen
com o reforço. Esse processo é denominado dis tação das luzes. Por exemplo, em vez de apre
criminação e o responder sob tal controle de es sentar luzes com a mesma freqüência em certas
tímulo é denominado de comportamento discri posições, poderíamos apresentá-las em certas
minado. O reforço diferencial estabeleceu uma posições, mas não em outras, de modo que o rato
classe de respostas definida pelos estímulos em jamais tivesse uma oportunidade de pressionar a
cuja presença elas ocorrem. E quanto às respos barra em presença de alguns estímulos. Essa é a
tas na presença de estímulos fora dos limites cor razão pela qual dizemos que, em procedimentos
relacionados com o reforço (p. ex., posições 6,7 de discriminação, os estímulos estabelecem a
e 8, ou 13, 14 e 15)? De acordo com uma inter ocasião para respostas: quando uma classe de
pretação estrita, elas não deveriam ser contadas respostas é definida pela presença de um estí
como membros do operante discriminado; fala mulo, as respostas nesta classe não podem ocor
mos delas em termos de generalização. Mas o rer quando o estímulo está ausente.
reforço diferencial gerou respostas tanto dentro Mesmo essa distinção metodológica tem ex
quanto fora desses limites; assim, elas são parte ceções. Consideremos, por exemplo, o reforço
de uma distribuição contínua. diferencial de longos intervalos entre respostas
A solução é a mesma que a do Capítulo 7. (o esquema DRL: Capítulo 7). Se as bicadas de
Devemos reconhecer duas classes de estímulos: um pombo forem reforçadas somente depois de,
uma é a classe correlacionada com uma contin pelo menos, 5 segundos sem bicar, o pombo pode
gência de reforço; a outra é a classe em cuja pre começar a espaçar suas bicadas cerca de 5 se
sença o responder ocorre. Não estamos interes gundos uma da outra. Discutimos esse compor
sados em qualquer das classes em si, mas sim na tamento com base na diferenciação de um ope
correspondência entre elas. Essa discussão acom rante complexo, que consiste de uma pausa mais
panha de perto o que discutimos sobre a diferen uma bicada. Poderíamos, igualmente, tratar a du
ciação e a indução no Capítulo 7. Isso é apro ração da pausa como uma propriedade de estí
priado, pois podemos considerar um estímulo em mulo e argumentar que o comportamento deve
cuja presença uma resposta ocorre como uma ria ser considerado como uma discriminação ba
outra propriedade daquela resposta, como sua seada no tempo transcorrido desde a última bi
força, duração e topografia. Por que então, nos cada. De fato, neste caso, as terminologias são
referimos aos efeitos do reforço diferencial com permutáveis. Quando falamos de diferenciação
respeito a propriedades da resposta em termos e indução ou de discriminação e generalização,
de diferenciação e indução, mas falamos de dis a operação subjacente em cada caso é o reforço
148 A . C h a r l e s C a ta nia
diferencial. Tanto a diferenciação como a discri o atentar (para) pode ter conseqüências. Por
minação envolvem correspondências entre as di exemplo, se uma contingência de reforço é cor
mensões sobre as quais o reforço diferencial é relacionada ao brilho de um estímulo visual, mas
aplicado e as dimensões do comportamento re não com seu tamanho, fará muita diferença se o
sultante. Apesar disso, vamos manter a distin organismo atenta para o brilho ou para o tama
ção entre as terminologias de propriedades de nho (e se atentar para o brilho ocorre mais fre
resposta e propriedades de estímulo, porque elas qüentemente devido às suas conseqüências, en
têm uma fundamentação histórica extensa e am tão, é apropriado falar sobre o atentar como um
plamente aceita. operante).
Consideremos um pombo cujas bicadas ao
disco sejam ocasionalmente reforçadas com ali
ATENTAR PARA AS PROPRIEDADES mento. Uma das duas combinações de estímulo
DOS ESTÍMULOS é apresentada no disco: um triângulo sobre um
fundo vermelho ou um círculo sobre um fundo
Ao discutirmos a correspondência entre os verde. Cada um é apresentado por 3 minutos.
estímulos com os quais as contingências de re Depois de 3 minutos de triângulo-sobre-verme
forço estão correlacionadas e os estímulos a que lho, a próxima bicada na presença deste estímu
o organismo responde, falamos com base na di lo é reforçada; após 3 minutos de círculo-sobre-
mensão de estímulo selecionada pelo experimen verde, o estímulo é desligado sem reforço. Esta
tador. Mas os estímulos têm propriedades varia programação em presença de triângulo-sobre-
das e não há garantias de que o organismo vá vermelho é denominada esquema de reforço de
responder apenas àquelas propriedades que se intervalo fixo ou FI; a programação em presen
lecionamos. Na diferenciação, as pressões à barra ça de círculo-sobre-verde é de extinção. Exami
por um rato podem ter uma forma relativamente naremos o esquema de intervalo fixo no Capítu
constante, embora apenas a força seja a base para lo 10. Por ora, é suficiente observar que este es
o reforço diferencial. Por exemplo, o rato pode quema, geralmente, mantém um responder cuja
pressionar regularmente a barra com sua pata taxa aumenta à medida que o tempo passa du
esquerda, embora essa propriedade não seja crí rante o intervalo, ao contrário da taxa relativa
tica na determinação de se a resposta de pressio mente constante mantida por um esquema de
nar será reforçada. Do mesmo modo, na discri intervalo variável. Se cada bicada em presença
minação um rato pode responder com base na de triângulo-sobre-vermelho produzisse um re-
intensidade de um estímulo visual, embora o re forçador, então, as apresentações do reforçador
forço diferencial seja baseado somente em sua por si só poderiam adquirir funções discrimina
forma; podemos dizer que o rato está atento à tivas, mas com reforço em FI não temos que nos
intensidade. (As propriedades de estímulo às preocupar com tais efeitos, uma vez que nenhu
quais um organismo tende a responder discrimi ma bicada é reforçada até que o intervalo tenha
nativamente são, às vezes, denominadas salien terminado.
tes, mas a saliência não é uma propriedade de A Figura 8.2 (Reynolds, 1961a) mostra da
um estímulo; é uma propriedade do comportamen dos da aplicação desse procedimento com dois
to do organismo com relação àquele estímulo.) pombos. Os gráficos à esquerda mostram taxas
O conceito de atenção é essencial em um tra de bicar durante cada combinação de estímulo
tamento dos operantes discriminados, porque os ao final de 18 horas de treino. Ambos os pom
organismos tendem a responder a algumas pro bos estavam emitindo mais de 40 bicadas por
priedades de estímulos, e não a outras. Na medi minuto durante a presença do triângulo-sobre-
da em que atentar para, ou prestar atenção a uma vermelho, mas bicavam em taxas relativamente
propriedade, ou a outra é algo que os organis baixas durante a do círculo-sobre-verde. Em um
mos fazem, podemos tratá-lo como um tipo de teste sem reforço, cada componente da combi
comportamento (ver Capítulo 20). Uma razão im nação era apresentado separadamente. Para o
portante para tratar a atenção desta maneira é que Pombo 105, quase todas as bicadas ocorreram
A p r e n d iz a g e m 149
Treino Teste de Atenção
80
40
O'—
AR OG
80
FIG U RA 8.2. Respostas de bicar de dois
pombos durante o reforço correlacionado ao
triângulo sobre vermelho e durante a extin
ção correlacionada ao círculo sobre verde (à
40 esquerda, treinamento), e durante testes de
extinção, quando as cores (verm elho-R ,
verde=G) e as formas (A, O) foram apresen
tadas separadamente (à direita, testes de
I atenção). O Pombo 105 estava respondendo
A_ à forma, mas não à cor; o Pombo 107 estava
AR OG respondendo à cor, mas não à forma. (Rey
nolds, 1961a, Figura 1)
Estímulo
na presença do triângulo; o vermelho, cor corre alguma dimensão de estímulo (prestar atenção
lacionada com o reforço, ocasionou poucas res cuidadosamente significa ouvir tudo o que é dito,
postas a mais do que o círculo ou a cor verde, e não apenas algumas partes do que é dito). Di
componentes previamente correlacionados com zemos que o Pombo 105 atentou à forma e não à
a extinção. Para o Pombo 107, por outro lado, cor, porque o responder discriminado ocorreu ao
quase todas as bicadas ocorreram durante o ver longo de mudanças na forma, mas não ao longo
melho; embora o triângulo tivesse sido correlacio das mudanças na cor. Quando os estímulos são
nado com o reforço durante o treino, este estímulo discriminados ao longo de uma dimensão de es
ocasionou ainda menos bicadas do que o círculo tímulo, mas não de outra, dizemos que o orga
ou o verde. O Pombo 105 estava prestando aten nismo está prestando atenção à primeira dimen
ção à forma, e não à cor, e o Pombo 107 estava são, mas não à segunda.
atentando à cor, e não à forma. A forma e a cor Uma vez que um organismo tenha atentado
haviam sido correlacionadas com o reforço durante para algumas propriedades de estímulo em uma
o treino. Somente ao examinar separadamente os situação, ele também tenderá a atentar àquelas
efeitos dos componentes é que foi possível dizer propriedades em situações novas (p. ex., Lawren
quais eram suas funções discriminativas. ce, 1949). Podemos também alterar a probabili
O responder dos pombos nessa situação não dade de que um organismo venha a atentar para
era apenas um caso de generalização. O respon uma ou outra propriedade de estímulo simples
der do Pombo 105 generalizou-se de triângulo- mente mudando a maneira como o reforço está
sobre-vermelho para triângulo sem vermelho, correlacionado com essas propriedades (John
mas não para vermelho sem triângulo. Geralmen son & Cumming, 1968). Na fase de treino da
te falamos da atenção não como uma resposta a Figura 8.2, a forma e a cor estavam igualmente
um estímulo particular, mas como a atenção a bem-correlacionadas com o reforço. Por essa ra-
150 A . C h a r l e s C a ta n ia
zão, o experimento foi particularmente apropri partir da qual o rato se aproxima). Por exemplo,
ado para demonstrar algumas das propriedades suponhamos que o braço direito de um labirinto
da atenção. Mas, se nosso interesse principal em T aponte em direção à parede mais iluminada,
fosse a discriminação de forma pelo pombo, te a parede leste de um laboratório, onde ficam as
ríamos que tomar a cor irrelevante e correlacio janelas. O rato poderia aprender a virar à direita,
nar as mudanças no reforço somente com mu ou poderia aprender a correr em direção à janela.
danças na forma. Poderíamos testar essas alternativas, girando o la
birinto em T, de modo que o braço direito agora
apontasse para o oeste, e o rato se aproximasse do
Aprendizagem de Lugar versus ponto de escolha a partir do norte. Se o rato vira à
Aprendizagem de Resposta direita, e, portanto, na direção oposta à da janela,
ele demonstra aprendizagem de resposta. Se vira
As questões precedentes estão relacionadas à esquerda, rumo à janela, exibe aprendizagem de
indiretamente a uma antiga controvérsia em Psi lugar, ele se desloca para o mesmo lugar, embora
cologia, sobre a aprendizagem de lugar versus a faça isso virando em uma direção diferente. A ques
aprendizagem de resposta (p. ex., Restle, 1957). tão é se o rato aprende a virar à direita versus à
A resposta de deslocar-se de um lugar para ou esquerda ou a virar a leste versus a oeste.
tro tem ocupado freqüentemente uma posição O desempenho do rato depende, em grande
privilegiada em análises comportamentais (p. ex., parte, dos estímulos disponíveis tanto dentro
Olton, 1979). Ir em busca de alimento não é o quanto fora do labirinto. O labirinto típico cos
mesmo que produzir alimento permanecendo no tumava ser coberto por uma tela de arame ou
mesmo lugar. Uma diferença importante entre por alguma outra cobertura que permitisse ao
os dois casos é que o ambiente muda mais dras experimentador observar o que o rato estava fa
ticamente quando nos deslocamos para um novo zendo. Se o experimentador podia olhar para
lugar do que quando introduzimos um novo es dentro do labirinto, o rato também podia olhar
tímulo no lugar onde estamos. Os humanos em para fora. Embora ratos sejam míopes, o rato
particular têm encontrado algumas maneiras de comum pode discriminar a direção geral de lu
substituir a locomoção comum por outras res zes e outros aspectos genéricos de um ambiente.
postas: para irmos a diferentes lugares pisamos Enquanto houver estímulos disponíveis do lado
em aceleradores, giramos volantes, apertamos bo de fora do labirinto, eles podem tornar-se a base
tões de elevadores e subimos em escadas ou estei a partir da qual o rato vira em uma direção parti
ras rolantes. Além disso, o movimento produz mu cular. Mas se esses estímulos são eliminados co
danças contínuas no ambiente, enquanto as seqüên locando-se uma cobertura opaca sobre o labirin
cias de outras respostas podem não produzir qual to, a orientação espacial do labirinto em relação
quer mudança até que a seqüência esteja comple à sala toma-se irrelevante, e o rato não pode mos
ta. Além dessas diferenças, então, será que impor trar outra coisa que não a aprendizagem de res
ta se um organismo se desloca até um novo lugar posta. A aprendizagem de lugar ou a aprendiza
ou se produz estímulos novos onde está? gem de resposta dependem, portanto, de como o
Questões desse tipo estavam implícitas na experiementador prepara o problema para o rato.
controvérsia sobre a aprendizagem de lugar ver Ao escolher criteriosamente as condições, um ex
sus a aprendizagem de resposta. Podemos dife perimentador pode tomar qualquer um dos re
renciar as viradas de um rato à direita, no ponto sultados mais provável do que o outro.
de escolha de um labirinto em T, ao reforçar vi Em ambientes naturais, o alimento em um
radas à direita, mas não à esquerda. Podemos en dado local não é necessariamente reabastecido
tão perguntar se o responder do rato está basea como no compartimento-alvo de um labirinto de
do em dimensões da resposta (movimentos à di laboratório. Ao forragear, um animal pode tor
reita e não à esquerda) ou em dimensões de estí nar-se mais propenso a deslocar-se para um novo
mulo (movimentos em direção a um local parti local do que a retornar a um local onde já consu
cular, sem levar em consideração a direção a miu o alimento que estava disponível. Uma vez
A p r e n d iz a g e m 151
mais, as propriedades do ambiente às quais um então é variada, o responder pode depender de
organismo presta atenção podem variar com as quanto o estímulo mudou. Por exemplo, se du
limitações impostas pelo experimentador (cf. rante uma fase de treino as bicadas de um pom
Collier & Rovee-Collier, 1981; Lea, 1979). Por bo no disco forem reforçadas quando o disco
exemplo, quando um rato é exposto a sessões estiver iluminado por amarelo, o pombo geral
diárias em um aparato em que o alimento é colo mente bicará com taxas cada vez mais baixas à
cado nas extremidades de cada um dos vários medida que a luz do disco mudar para o laranja,
becos, e os becos não são reabastecidos durante depois para o vermelho e para o violeta, na fase
a sessão, o rato aprende a não retomar aos becos de teste. Isso demonstra generalização: os efei
em que já comeu (Olton & Samuelson, 1976). tos do reforço na presença do amarelo estendem-
As propriedades espaciais do ambiente são par se para as outras cores.
ticularmente importantes, mas, em circunstânci A Figura 8.3 apresenta dados sobre a gene
as apropriadas, um rato pode aprender outras pro ralização de bicadas de pombos no disco, a tons
priedades do ambiente. de diferentes freqüências depois que as bicadas
foram reforçadas apenas em presença de um tom
de 1000 ciclos por segundo (Jenkins & Harri
GRADIENTES DE CONTROLE DE son, 1960). Em um procedimento (sem treino de
ESTÍM ULO discriminação), o tom estava sempre presente, e
as bicadas eram reforçadas segundo um esque
Os procedimentos de discriminação colocam ma de intervalo variável ou VI. Em um segundo
uma pesada responsabilidade sobre o experimen procedimento (treino de presença versus ausên
tador. Em um procedimento de diferenciação, o cia), o tom estava presente em algumas vezes e
organismo determina a ordem das respostas, mas ausente em outras, e as bicadas eram reforçadas
em um procedimento de discriminação o expe de acordo com o esquema de VI apenas durante
rimentador deve decidir-a ordem em que os estí o tom. Após o treino, o reforço foi interrompido,
mulos são apresentados. Um experimentador que e tons de outras freqüências foram apresentados
esteja interessado em algum contínuo de estímulo pela primeira vez, intercalados com a ausência
(isto é, alguma dimensão ao longo da qual os de tom e com a apresentação do tom original.
estímulos podem variar, como a intensidade ou Durante essa fase, cada estímulo era apresenta
posição de uma luz) deve preocupar-se com do 8 vezes, em ordem mista.
quantos estímulos apresentar, por quanto tempo Para os três pombos sem treino prévio de dis
e em que ordem e de que forma os estímulos de criminação (Figura 8.3, acima), nem a freqüên
veriam ser correlacionados com o reforço e com cia do tom, nem sua presença ou sua ausência
o não-reforço, para mencionar algumas das pos tiveram qualquer efeito substancial sobre o bi
sibilidades mais importantes. A pesquisa sobre car. O gradiente de generalização foi relativa
gradientes de controle de estímulo busca os efei mente achatado ou, em outras palavras, o efeito
tos de algumas dessas variáveis. Esses procedi do reforço na presença do tom original esten
mentos geralmente envolvem uma fase de trei deu-se uniformemente a todos os outros estímu
no, durante a qual é programada alguma corre los. Podemos dizer que esses pombos não esta
lação entre os estímulos e as respostas reforça vam atentando para o tom, porque as mudanças
das, seguida por uma fase de teste, durante a qual na freqüência do estímulo não fizeram qualquer
o reforço é suspenso, enquanto os estímulos no diferença para eles.
vos e velhos são apresentados. Para os cinco pombos que receberam treino
prévio de discriminação (Figura 8.3, abaixo), a
freqüência original produziu taxas de respostas
Gradientes de Generalização mais altas do que qualquer outra freqüência du
rante a fase de teste; em geral, quanto mais pró
Se uma resposta é reforçada durante um estí xima uma freqüência estivesse da freqüência
mulo, e alguma propriedade daquele estímulo original, maior era a taxa de respostas nessa nova
152 A. C harles C a t a n ia
30
SEM TREINO DE DISCRIMINAÇAO
0 70
Tom Apenas SD • 71
20 - V 72
O
V
10
SD
_L l -íh-
TREINO DE PRESENÇA-AUSENCIA
freqüência. Não foi surpresa o fato de que taxas dimensão. A Figura 8.4 compara tal gradiente
baixas ocorressem quando o tom estava ausen de pós-discriminação com um gradiente de ge
te; sua ausência estava correlacionada com a neralização (Hanson, 1959). Para um grupo de
extinção. Mas para esses pombos, a taxa de res pombos (generalização), as bicadas ao disco em
postas variou com a freqüência do tom, embora presença de um único comprimento de onda no
o responder discriminado dependesse somente disco foram reforçadas segundo um esquema de
da presença ou ausência do tom, e não de sua VI, depois do que a taxa de bicar em presença
freqüência. Podemos dizer, então, que os pom deste e de uma variedade de diferentes compri
bos estavam prestando atenção ao tom. (A for mentos de onda foi determinada durante um pe
ma dos gradientes de generalização também é ríodo sem reforço. O pico do gradiente (o ponto
afetada por outras variáveis, como o nível de com freqüência mais alta) ficou no estímulo cor
privação ou o esquema de reforço durante o trei relacionado com o reforço; em outras palavras,
no: p. ex., Hearst, Koresko &, Poppen, 1964.) a taxa diminuiu à medida que aumentou a dis
tância entre o estímulo de teste e o estímulo de
treino.
Gradientes de Pós-Discriminação Para um segundo grupo (pós-discriminação),
as bicadas ao disco foram reforçadas de acordo
Os gradientes de controle de estímulo tam com um esquema de VI durante o mesmo com
bém podem ser obtidos após uma discriminação primento de onda que o do primeiro grupo, mas
entre dois ou mais estímulos ao longo de uma este comprimento de onda se alternava com ou-
A p r e n d iz a g e m 153
FIGURA 8.4 Gradientes de controle de es
tímulo. O gradiente de generalização mos
tra bicadas após o reforço sob um com
primento de ondas de 550 milimicrons
(SD). O gradiente apresenta um pico no SD.
O gradiente de pós-discriminação mostra
respostas de bicar depois do reforço em
presença de um comprimento de onda de
550 milimicrons (SD) e extinção sob um
comprimento de onda de 570 milimicrons
(SA); o pico se deslocou: o máximo de res
postas desviou-se do SD em direção opos
ta à do SA. O expectro vai do violeta ao
azul nos comprimentos de onda mais cur
tos e ao vermelho nos comprimentos de
onda longos, assim o SD e o SA estavam na
região verde-amarelo do espectro. (Han
Comprimento de Onda (mu) son, 1959, Figura 1)
tro, durante o qual as bicadas não eram reforça criminação (cf. Hearst, Besley, & Farthing,
das (extinção); como no primeiro grupo, a taxas 1970).
de bicar durante este e outros comprimentos de Efeitos do treino discriminativo sobre a for
onda foram determinadas durante um período de ma dos gradientes levou a questões sobre as ori
não-reforço. Neste caso, o pico do gradiente foi gens dos gradientes de generalização com picos
deslocado do estímulo de reforço, em direção agudos. Uma das sugestões foi a de que os gra
oposta ao estímulo de extinção; esse deslocamen dientes poderiam ser mais agudos ou mais acha
to é chamado de deslocamento de pico. (Efeitos tados dependendo se os estímulos naquela re
semelhantes também ocorrem quando a discri gião do gradiente eram mais fáceis ou mais difí
minação é baseada em uma freqüência de refor ceis de discriminar. Mas, quando os graus de in
ço mais alta durante um estímulo do que outro: clinação dos gradientes de generalização em
Guttman, 1959.) torno de estímulos em diferentes regiões do es
Uma explicação para a forma do gradiente pectro foram comparados com os limiares para
de pós-discriminação (Spence, 1937) supunha a detecção de uma mudança no comprimento da
que o reforço na presença de um estímulo criava onda naquelas regiões, não foi possível encon
um gradiente de responder aumentado, centrado trar qualquer relação simples entre a generaliza
naquele estímulo (gradiente excitatório), que a ção e a discriminabilidade (Guttman & Kalish,
extinção em presença do outro estímulo produ 1956).
zia um gradiente de responder reduzido, centra Outra sugestão foi a de que os gradientes agu
do neste segundo estímulo (gradiente inibitório), dos dependem da aprendizagem de discrimina
e que, depois do treino de discriminação, o res ção que ocorre antes que o organismo seja ex
ponder produzido por outros estímulos poderia posto à situação experimental. Por exemplo, um
ser previsto, subtraindo-se o gradiente inibitório pombo supostamente aprende a discriminar en
do excitatório. O gradiente teórico de Spence tre os grãos que come muito antes de ver o ama
mostrava um deslocamento de pico: o ponto mais relo projetado em um disco; suas discriminações
alto do gradiente era deslocado do estímulo de de cor devem ser mais marcantes na região do
reforço em direção oposta à do estímulo de ex amarelo no espectro, simplesmente porque o
tinção. Mas o novo gradiente, produzido pela amarelo predomina na cor de seu alimento. E di
subtração, era mais baixo do que o gradiente ex fícil controlar as discriminações de cor adquiri
citatório original em toda a sua extensão; assim, das nos ambientes naturais, mas poderíamos criar
ele era consistente com a forma, mas não com ambientes em que as discriminações de cor não
os valores absolutos do gradiente de pós-dis- fossem possíveis. Em um ambiente iluminado
154 A . C harles C a t a n ia
apenas por luz monocromática, em uma faixa ram um deslocamento de pico, embora os estí
muito estreita de comprimentos de onda como o mulos consistissem, principalmente, de compri
amarelo emitido por uma lâmpada de sódio a mentos de onda que eles jamais haviam visto
vapor, os objetos não têm cor; para uma pessoa antes (Terrace, 1975).
em um ambiente assim, tudo aparece em tons
de cinza. Um organismo criado em tal ambi
ente não tem oportunidade de aprender as dis Gradientes de Inibição
criminações de cor.
Um organismo apropriado para um experi Diante da proposição de Spence de lidar com
mento sobre a criação em um ambiente mono a forma dos gradientes de pós-discriminação,
cromático é o patinho, que é capaz de andar e surgiu o interesse em encontrar um modo de se
bicar logo que sai da casca do ovo; portanto, os medir diretamente o gradiente de inibição. As
procedimentos de reforço podem ser iniciados dificuldades eram tanto metodológicas como te
cedo. Gradientes de generalização ao longo de óricas. Para determinar se um estímulo redu
comprimentos de ondas, obtidos com patinhos zia a taxa de respostas, teria de haver alguma
que haviam sido criados em ambientes mono taxa para começar. Era necessário um procedi
cromáticos, às vezes, são achatados (Peterson, mento que separasse a dimensão ao longo da qual
1962; cf. Figura 8.3, acima) e, outras vezes são o gradiente de extinção seria determinado da
agudos (p. ex., Rudolph, Honig, & Gerry, 1969; quela correlacionada com o reforço. Tal proce
cf. Figura 8.3, em baixo), sugerindo que o pati dimento é ilustrado na Figura 8.5 (Honig e col.,
nho, às vezes, presta atenção à cor, mesmo sem 1963). Com um grupo de pombos, o estímulo
ter experiência com as cores. Quando os pati correlacionado ao reforço era uma linha vertical
nhos criados sob iluminação monocromática fo sobre o disco, e o estímulo de extinção era um
ram treinados a discriminar entre dois compri disco iluminado sem uma linha; com um segun
mentos de onda, no entanto, seus gradientes de do grupo, esses estímulos eram invertidos. Para
pós-discriminação foram semelhantes aos de pa ambos os grupos, durante o treino foram usados
tinhos criados em ambiente natural, e apresenta esquemas de intervalo variável (VI), e na fase
A p r e n d iz a g e m 155
de teste foram obtidos, na ausência de reforço, ao longo da dimensão relevante e da extinção
os gradientes de controle de estímulo ao longo correlacionada ao outro; e (4) o gradiente ini
da dimensão de orientação da linha. bitório, depois do reforço na presença de um estí
No grupo com a linha vertical correlaciona mulo, mas não na dimensão relevante, e extinção
da ao reforço e a ausência da linha correlaciona na presença de um estímulo naquela dimensão.
da à extinção (círculos cheios), o bicar diminuiu Qualquer que seja o gradiente, podemos sem
com os maiores desvios da vertical; este é um pre formular questões sobre as dimensões de
gradiente de reforço como o da Figura 8.3 (em estímulo a que de fato um organismo presta aten
baixo). Mas no grupo com a linha vertical corre ção. Por exemplo, suponhamos que o pombo olhe
lacionada à extinção e sua ausência correlacio apenas para o contorno superior de um disco que
nada ao reforço (círculos vazios), o bicar aumen tem uma linha projetada sobre ele. Se mudamos
tou com os maiores desvios da vertical. Neste a direção da linha da vertical, a parte superior da
grupo, mudar a orientação da linha afetava sua linha se desloca daquela região do disco, de modo
distância do estímulo de extinção, mas não sua que o contorno parece mais como ele era quan
distância do estímulo de reforço que era a au do não havia uma linha ali. Nesse caso, a linha é
sência de uma linha. Esse é um gradiente inibi o estímulo nominal, mas o estímulo funcional é
tório. o que aparece junto ao contorno superior do dis
Os gradientes inibitórios geralmente são mais co. A única maneira de avaliar tal possibilidade
achatados do que os gradientes excitatórios cor é pela experimentação (p. ex., removendo por
respondentes, provavelmente porque os organis ções da linha e observando se isso produz os mes
mos tendem a atentar mais para as propriedades mos tipos de mudanças no comportamento do
dos estímulos correlacionadas ao reforço do que pombo que aquelas produzidas pela rotação da
para aquelas correlacionadas à extinção (cf. Dins- linha: cf. Touchette, 1969). O argumento pode
moor, 1995). Uma condição como aquela do pri parecer trivial com relação às respostas do pom
meiro grupo, em que uma linha era a caracterís bo, mas pode ser extremamente importante em
tica apresentada somente durante o reforço, é de situações de aplicação, quando, por exemplo, um
nominada discriminação da característica posi professor tenta descobrir se uma criança está
tiva; uma condição como a do segundo grupo, atentando para as palavras, em um livro de his
em que a linha era a característica presente so tória, ou se está fraudando a leitura e atentando
mente não durante a extinção, é denominada de essencialmente para as figuras.
discrim inação da característica negativa
(Jenkins & Sainsbury, 1970). Como é mais fácil
conseguir que os organismos atentem para os es ESVANECIMENTO (FADING):
tímulos correlacionados ao reforço do que à ex CONTROLE DE ESTÍM ULO PO R
tinção, treinar uma discriminação com a carac APROXIMAÇÕES SUCESSIVAS
terística positiva é mais fácil do que treinar uma
discriminação com a característica negativa. Al Do mesmo modo que as propriedades de res
gumas implicações desses fenômenos serão con posta que definem uma classe operante podem
sideradas mais detalhadamente no Capítulo 11, em ser gradualmente modificadas por meio de pro
uma discussão sobre as respostas de observação. cedimentos de modelagem, as propriedades de
Consideramos até agora os quatro principais estímulo que definem uma classe operante dis
tipos de gradientes de controle de estímulo: (1) criminada podem ser gradualmente alteradas por
o gradiente de generalização relativamente acha procedimentos análogos, denominados de esva-
tado, sem atenção à dimensão de estímulo rele necimento ou esmaecimento. O treino não tem
vante; (2) o gradiente de generalização com pico que começar com estímulos que são difíceis de
agudo, com atenção à dimensão de estímulo rele discriminar. Ele pode começar com aqueles es
vante; (3) o gradiente de pós-discriminação, que tímulos que são fáceis de discriminar e, então,
normalmente apresenta um deslocamento de pico mudar gradualmente para os estímulos mais di
depois do reforço correlacionado a um estímulo fíceis. Por exemplo, para o bicar de um pombo
156 A. C harles C a t a n ia
reforçado com alimento, normalmente, é mais curo, durando 5 segundos. Gradualmente, ao lon
difícil estabelecer uma discriminação entre as go de 3 sessões, sua duração foi, gradualmente,
linhas verticais e horizontais do que entre o ver aumentada, e ele mudou de escuro para verde
melho e o verde. Uma vez que uma discriminação fraco, para verde um pouco mais forte, até um ní
entre vermelho e verde esteja estabelecida, contu vel final que, para o olho humano, igualava-se ao
do, a discriminação entre vertical e horizontal pode brilho do disco vermelho. Ao final dessas condi
ser aproximada sucessivamente ao superpor verti ções, os 3 minutos de vermelho correlacionado ao
cal sobre vermelho e horizontal sobre verde e, en reforço se alternavam com 3 minutos de verde cor
tão, gradualmente, remover ou esvanecer as cores relacionado com a extinção. Cada pombo tratado
(Terrace, 1963b). (Um pouco de esvanecimento dessa maneira bicava o disco de extinção menos
grosseiro vem sendo programado neste capítulo, do que 10 vezes durante todo o treino; o bicar ocor
pela substituição da expressão completa intervalo ria, quase sem exceção, no disco vermelho, e não
variável, em favor de sua abreviatura, VI, depois no verde. Pombos expostos a este procedimento
que ambas apareceram juntas mais de uma vez.) mais tarde, depois de um treino inicial ou para os
O estabelecimento de controle de estímulo quais o verde foi introduzido abruptamente, com
por meio da alteração gradual de estímulo geral duração e intensidade plenas, bicaram no disco
mente é bastante efetivo (p. ex., Sidman & Stod verde de extinção centenas e mesmo milhares de
dard, 1967) mas, como no caso da modelagem, vezes durante períodos equivalentes de treino.
não há regras simples para determinar quão ra A introdução gradual do verde foi suficiente
pidamente os estímulos devem ser gradualmen porque, entre outras coisas, escurecer o disco
te introduzidos (fading in) ou removidos (fading vermelho logo no início do treino impedia o pom
out) em diferentes situações. Por exemplo, se bo de bicar por uns poucos segundos (qualquer
superpomos o vertical sobre o vermelho e o ho mudança de estímulo abmpta poderia ter tido tal
rizontal sobre o verde e, então, esvanecemos par efeito). Era pouco provável que o bicar recome
cialmente as cores, podemos descobrir mais tar çasse antes do término dos 5 segundos do estí
de, após remover completamente as cores, que o mulo de extinção. Assim, uma diferença no res
pombo aprendeu a discriminar entre o vertical e ponder aos dois estímulos foi estabelecida des
o horizontal. Por outro lado, o esvanecimento pode de o início, e as mudanças graduais na duração e
ser mal sucedido; se o pombo atenta apenas para intensidade do estímulo de extinção foram esta
as cores, mesmo quando elas se tomam muito fra belecidas a partir dessa diferença. Depois de uma
cas, podemos descobrir que o responder discrimi história como essa, podemos mudar o estímulo
nado desaparece toda vez que enfraquecemos as de extinção para reforço e pode ser que o pombo
cores abaixo de certos níveis de limiar. nunca responda durante aquele estímulo para
Do mesmo modo que a modelagem requer chegar a descobrir que fizemos isso. Em que sen
que algum comportamento esteja disponível para tido este é um desempenho sem erro não é ób
ser modelado, o esvanecimento requer que al vio. Devemos ter cuidado com a linguagem de
gum comportamento sob controle discriminati erros; o termo erro implica um julgamento sobre o
vo esteja disponível para ser mudado no contro valor do responder e pode ser inapropriado a uma
le de uma nova dimensão de estímulo. Conside análise do comportamento. O procedimento de es
remos, por exemplo, a aprendizagem de discri vanecimento não tem interesse apenas teórico; suas
minação sem erro (Terrace, 1963a). Logo depois possíveis aplicações à educação conferem a ele
que as bicadas de um pombo em um disco ver uma importância prática (p. ex., ver Capítulo 17).
melho foram modeladas com reforço alimentar,
o reforço durante o vermelho passou a ser pro
gramado de acordo com um esquema de inter A TERMINOLOGIA DO REFORÇO
valo variável. Períodos de três minutos de ver DIFERENCIAL
melho se alternavam com um outro estímulo,
durante o qual as bicadas não eram reforçadas. Tanto a diferenciação quanto a discrimina
De início, este outro estímulo era um disco es ção envolvem o reforço diferencial. A principal
A p r e n d iz a g e m 157
diferença está em se o reforço diferencial é im distinguir entre outras (p. ex., linhas retas ver
posto sobre as propriedades do responder ou so sus linhas curvas são importantes para distinguir
bre as propriedades do estímulo em cuja presen entre U e V, mas não entre V e N), e distinções
ça o responder ocorre. A principal implicação diferentes são importantes para letras minúscu
dessa diferença diz respeito ao procedimento: em las e maiúsculas (p. ex., nenhum par de letras
estudos de diferenciação, o experimentador deve maiúsculas tem as reversões para cima e para
esperar pelas respostas do organismo, enquanto baixo ou para a esquerda e a direita que devem
em estudos de discriminação o experimentador ser dominadas para a leitura de b, p, d, e q). A
controla a ordem e a duração das apresentações maneira pela qual uma criança aprende a distin
do estímulo. A terminologia da diferenciação e guir as letras do alfabeto depende da relação en
da discriminação está resumida na Tabela 8.1. tre as propriedades dos estímulos como a sime
O reforço diferencial pode ser baseado em tria, a curvatura e o fechamento. As proprieda
dimensões simples de estímulos, como a inten des essenciais para discriminar as letras diferen
sidade ou a localização. A questão experimental tes são chamadas de características críticas (p.
é se o responder se conforma às conseqüências ex., Gibson, 1965).
diferenciais, de modo que mais respostas ocor Não é suficiente, porém, enumerar caracte
ram na presença dos estímulos correlacionados rísticas críticas. Para algumas letras, as formas
ao reforço do que na presença daqueles correla maiúscula e minúscula diferem mais entre si do
cionados com a ausência de reforço. As impli que diferem de outras letras (p. ex., e, E e F, ou
cações são profundas. O que aprendemos a par h, n, e N). Dada a multiplicidade de formas, o
tir do treino de discriminações simples com ra que então define uma classe de estímulos que
tos e pombos têm sido empregado para desen ocasiona a resposta de dizer A, ou B, ou C? Essa
volver métodos para treinar primatas a discrimi é uma pergunta sobre a estrutura de estímulo das
nar entre os diferentes tipos de drogas que lhes letras do alfabeto. O problema pode ser ainda
são administradas (p. ex., Schuster & Balster, mais complicado quando se consideram diferen
1977), para ensinar pais jovens a discriminar tes contextos. Por exemplo, a letra O poderia ser
doenças em suas crianças (p. ex., Delgado & uma letra ou um zero, e a letra I poderia ser uma
Lutzger, 1988) e para instruir mulheres na reali letra ou um numeral romano. O conceito de um
zação do auto-exame da mama (p. ex., Pennypa X, Y ou Z é definido pela classe de estímulos a
cker & Iwata, 1990), só para mencionar algu que respondemos com o nome da letra corres
mas das inúmeras aplicações bem-sucedidas. pondente, mas veremos que essas classes são ba
Como ilustrado por essas aplicações, o reforço seadas no comportamento, não em propriedades
diferencial pode ser programado para proprie físicas comuns (cf. Capítulo 14).
dades complexas dos estímulos que não são fa Os operantes discriminados são classes de
cilmente quantificáveis. Por exemplo, crianças comportamento definidas pelos estímulos que
que estão aprendendo a ler devem ser capazes ocasionam o responder. Tais classes são freqüen
de nomear as letras do alfabeto. Mas as proprie temente identificadas em nosso vocabulário co
dades importantes para distinguir entre algumas tidiano, por exemplo, quando falamos de parar
letras são diferentes das que são importantes para em um semáforo vermelho ou de atender ao te-
158 A. C harles C a t a n ia
lefone. A luz vermelha pode variar em brilho e to do organismo (p. ex., Shimp, Sabuslky, &
tamanho e o toque do telefone em altura e tim Childers, 1989) para mencionar apenas alguns.
bre, mas o responder é razoavelmente indepen Muitos exemplos de pesquisas sobre a cogni
dente de variações ao longo de tais dimensões, e ção animal são apresentados em outros trechos
assim falamos em termos dessas classes de even neste livro, assim esta seção apresenta apenas
tos, e não de casos particulares. uma amostra altamente seletiva.
Freqüentemente, tratamos os estímulos como Consideremos um pombo que observa o mos
se fossem restritos a objetos concretos ou a even trador de um relógio de pulso projetado no disco
tos ambientais. Mas, embora possamos apren do centro de três discos para pombos (Neiworth
der a responder consistentemente a objetos ou & Rilling, 1987). O ponteiro longo começa na
eventos em nosso ambiente, também discrimi vertical e gira até os 90°; então ele desaparece.
namos entre as características, às vezes, chama Um pouco mais tarde ele reaparece mais longe,
das de abstratas ou de relacionais que são inde em 135° ou em 180°. O momento de seu reapa
pendentes dos objetos ou dos eventos particula recimento é consistente ou inconsistente com
res. O termo estímulo, geralmente, funciona des uma taxa constante de rotação, enquanto ele está
se modo mais geral, no sentido de alguma pro invisível. Depois de uma tentativa consistente
priedade de eventos ambientais. Por exemplo, com uma taxa de rotação constante, as bicadas
podemos dizer que uma cadeira foi colocada à no disco da esquerda são reforçadas; depois de
direita de uma mesa. Embora a cadeira e a mesa uma tentativa inconsistente, as bicadas no disco
sejam objetos concretos, estar-à-direita-de não da direita são reforçadas. Sob condições como
é, e ainda assim podemos discriminar entre esta essas, os pombos aprenderam a discriminar as
relação e estar-à-esquerda-de. Portanto, em alguns tentativas consistentes com uma taxa de rotação
experimentos de discriminação, as relações entre constante daquelas em que a taxa constante era
estímulos têm sido as dimensões de interesse. violada, mesmo que o estímulo em rotação esti
vesse ausente por algum tempo; a discriminação
também se transferiu para novas localizações do
reaparecimento do mostrador do relógio. Esse
Seção B Cognição Animal desempenho não estava baseado em durações das
tentativas ou em localizações específicas do mos
O campo da cognição animal interessa-se por trador do relógio. Ele demonstra, assim, o ras-
aquilo que os animais sabem. O campo aborda treamento visual na ausência do estímulo visual;
esse problema identificando os eventos e as re tal rastreamento é chamado de representação (ou
lações que podem ser discriminados por dife imaginação) visual (imagery, cf. Capítulo 20).
rentes espécies. Os estudos da cognição animal Coloquialmente, podemos dizer que o pombo
têm examinado uma variedade de desempenhos sabia onde o estímulo estava, mesmo enquanto
discriminativos e apresentam especial quando ele estava invisível (uma habilidade útil, quan
envolvem discriminações de propriedades rela do, por exemplo, um inseto comestível passa por
cionais complexas do ambiente. Certos exem trás de uma obstrução, e o pássaro espera que
plos incluem o julgamento de simetria visual (p. ele surja do outro lado).
ex., Delius & Nowak, 1982); discriminação de Os estudos sobre cognição animal estão in
numerosidade (p. ex., Davis & Pérusse, 1988); teressados no que os organismos sabem, e as ex
busca visual (Blough, 1989); controle discrimi plicações, geralmente, estão vinculadas à estru
nativo por contingências de reforço ou por estí tura dos estímulos relevantes (cf. Capítulo 1,
mulos correlacionados com tais contingências sobre linguagem estrutural e funcional). Por
(p. ex., Washburn, Hopkins, & Rumbaugh, exemplo, se um organismo discrimina entre cer
1991); a organização do comportamento dentro tos estímulos com base em alguma característi
de uma seqüência discriminada sequencialmen ca crítica, um cognitivista pode dizer que o or
te (Terrace & Chen, 1991); e o responder sob ganismo representa os estímulos para si mesmo
controle de estímulo do próprio comportamen com base naquela característica (p. ex., no exem-
A p r e n d iz a g e m 159
pio do mostrador de relógio, diria que o pombo te equivalentes à navegação celeste. Os organis
representa ou imagina seu movimento constante mos que deixam seu território natal, devem ser
ou no caso da busca da presa, o predador com capazes de retomar a ele; quanto mais precisa
para o alvo potencial com uma imagem de bus mente puderem fazer isso, mais amplamente
ca). Discutimos o papel da representação nas te podem forragear. Os organismos que armazenam
orias biológicas, no contexto da seleção natural, alimento no invemo devem ser capazes de loca
no Capítulo 3. A questão será retomada no con lizar o alimento mais tarde; quanto mais variá
texto da memória e da recordação, como em re veis seus locais de armazenagem e quanto mais
construir e então “reapresentar” (no sentido lite locais eles puderem rastrear, menor a probabili
ral de apresentar de novo) as características de dade de que percam o que armazenaram para seus
eventos que já ocorreram, e no contexto das teo competidores (p. ex., Balda, Kamil, & Grim,
rias comportamentais e cognitivas, no Capítulo 1986). Os organismos que se evadem de preda
20, onde argumentaremos que o imaginar pode dores devem ser capazes de localizar rotas de
ser apropriadamente tratado como um tipo de fuga; os que se deixam perseguir para becos sem-
comportamento. saída não sobrevivem.
Consideramos algumas questões relevantes
à orientação espacial, quando discutimos a apren
MAPAS COGNITIVOS dizagem de lugar versus a aprendizagem de res
posta. Os dois tipos de comportamento foram
Sempre que os ambientes locais têm proprie distinguidos, principalmente, com base em se ha
dades diferentes, é vantajoso para um organis via estímulos disponíveis para o rato fora do la
mo ser capaz de encontrar sua rota de um lugar birinto. Se havia, o rato podia orientar-se no com
para o outro. Um ambiente com um suprimento plexo mais amplo de estímulo, a sala em que o
de alimento rico e estável é preferível a um em labirinto estava localizado; e assim ele aprendia
que existe o mesmo alimento, mas ele está me os lugares. Se não, ele dominava apenas as vira
nos acessível; um ambiente com áreas seguras das específicas dentro do labirinto e aprendia res
para procriar e para cuidar da prole é preferível postas. Complexidades adicionais foram intro
a um que seja mais perigoso, e assim por diante. duzidas em outros experimentos em labirintos
(O argumento vale para a maioria dos grupos ani (cf. Olton, 1979). Por exemplo, demonstrou-se
mais. Seria ir longe demais considerar as variá que um rato, às vezes, escolhe a rota mais curta
veis fílogenéticas que operaram na evolução das disponível no labirinto, quando uma outra rota
plantas, mas é apropriado notar que muitas plan preferida anteriormente é bloqueada ou que, às
tas dispersam suas sementes; os animais estão fre vezes, ele segue atalhos apropriados, que acaba
qüentemente envolvidos nesta dispersão, por ram de ser acrescentados ao labirinto, mesmo que
exemplo, quando as abelhas polinizam as flores). nunca tenha percorrido aqueles atalhos antes. Os
Uma vez que algum tipo de orientação tenha resultados justificam falar de mapas cognitivos
emergido, a seleção natural tende a acentuá-la (Tolman, 1948); a descoberta de que os organis
ao longo do tempo filogenético (cf. Capítulo 3). mos podem localizar uma área mesmo quando
Assim, não é de se surpreender que muitas espé se aproximam dela por uma nova direção de
cies animais encontrem prontamente sua dire monstra que eles podem aprender as relações es
ção no mundo. Algumas de suas habilidades de paciais além das, ou talvez em vez de, trilhas
“navegação” são aprendidas, e outras são não- específicas.
aprendidas. Gallistel (1990) elaborou um trata Os problemas para determinar as caracterís
mento detalhado que trata do forrageio em for ticas ambientais às quais os organismos prestam
migas, à localização pelo eco (ecolocação) em atenção, emergem em uma escala maior na ha
morcegos e à escolha de rotas pelos chimpan bitação e na migração animal à medida que se
zés, e que vai da orientação baseada em dimen deslocam de um lugar para outro. As vespas re
sões simples do estímulo, como os gradientes de tomam a seus ninhos, as abelhas retomam a suas
odor ou luz, a variedades que são funcionalmen colméias, os salmões retomam a seus rios de ori
160 A. C harles C a t a n ia
gem, e os pássaros retomam a ninhos sazonais. nação de propriedades que inclui necessariamen
Entre as características ambientais que são im te um ponto de referência e um estímulo à es
portantes podem estar os marcos geográficos, querda daquele ponto de referência.)
como a localização e o movimento do sol e das Já comentamos que é difícil definir os e s tí
estrelas, a luz polarizada, os gradientes quími mulos discriminativos por dimensões físicas. Por
cos e os campos magnéticos (p. ex., Tinbergen, exemplo, as propriedades que definem a letra A
1972; Walcott, Gould, & Kirshvink, 1979). Em variam dependendo se ela é maiúscula ou mi
alguns casos, os organismos navegam isolada núscula ou se aparece em letra de forma ou ma
mente para regiões que nunca visitaram antes; nuscrita. A capacidade de discriminar entre tais
em outros eles o fazem em companhia de outros estímulos existe em animais, assim como em
membros de suas espécies. Ambos os casos de humanos (p. ex., discriminações entre várias for
vem envolver substanciais componentes filoge- mas da letra A e do dígito 2 foram estabelecidas
néticos, com relação a importantes propriedades em pombos: Morgan e col., 1976). Mas a difi
do ambiente ou com relação a contingências que culdade de definir os estímulos com base em pro
levam à migração em gmpo (ou ambos). Em re priedades físicas mensuráveis não se limita a
lação a migrações de longas distâncias, as con classes arbitrárias estabelecidas por humanos, tais
tingências filogenéticas podem ter envolvido a como letras e números. Elas existem também com
seleção daqueles capazes de manter a orienta objetos e eventos do cotidiano. O que distingue os
ção no curso de jornadas cada vez mais longas, à cachorros dos outros animais? Com base em que
medida que os continentes foram lentamente se se generalizamos entre chihuahuas e huskies, cha
parando ao longo do tempo geológico (Skinner, mando-os de cachorros, enquanto discriminamos
1975). Um tratamento mais detalhado desse fenô entre huskies e lobos, embora eles pareçam mais
meno está além do escopo deste livro, mas ele ilus semelhantes entre si que huskies e chihuahuasl
tra que uma análise das propriedades do estímulo Pombos foram ensinados a discriminar entre
que determinam o comportamento é relevante tanto certas figuras que continham uma forma huma
para a fílogenia quanto para a ontogenia. na e figuras que não continham tal forma (p. ex.,
Herrnstein & Loveland, 1975). Essas discrimi
nações foram denominadas conceitos naturais.
CONCEITOS NATURAIS E CLASSES Em um estudo (Herrnstein, Loveland, & Cable,
DE ESTÍM ULOS PROBABILÍSTICAS 1976), diapositivos eram projetados em uma tela
próxima ao disco de um pombo, e suas bicadas
Podemos falar de conceitos como generali eram reforçadas na presença de algumas figu
zação, dentro de uma classe de estímulos, e dis ras, mas não na presença de outras. Alguns pom
criminação, entre classes de estímulos (Keller & bos aprenderam discriminações entre algumas fi
Schoenfeld, 1950). Assim, nosso conceito de guras com e sem árvores; outros aprenderam a
vermelho deve envolver a generalização entre discriminar entre figuras com e sem água; ou
todos os estímulos a que chamamos de verme tros ainda aprenderam discriminações entre fi
lho, e a discriminação entre esses estímulos e guras com e sem uma pessoa. Após treino com
todos os outros a que não chamamos de verme um conjunto de figuras (p. ex., figuras com e sem
lho. Então, os conceitos estão para as classes de árvores), os pombos discriminaram entre figu
estímulos como os operantes estão para as clas ras da mesma classe de estímulos que não ha
ses de respostas. (O responder com base em al viam sido apresentadas até então. As novas fi
guma propriedade singular de estímul os é deno guras, às vezes, eram discriminadas mais preci
minado abstração, e a linguagem de conceitos, samente do que as empregadas no treino. As
às vezes, restringe-se ao responder baseado em implicações delineadas foram que:
alguma combinação de propriedades. Mas essas
são distinções ambíguas. Por exemplo, estar-à- ...não podemos começar a esboçar uma lista de ele
mentos comuns. Para reconhecerem uma árvore, os
esquerda-de pode ser tratado como uma propri pombos não requeriam que ela fosse verde, repleta
edade relacional singular ou como uma combi de folhas, vertical, composta de madeira, tivesse
A p r e n d iz a g e m 161
tronco grosso, muitos galhos, e assim por diante (dei son, 1978; ver Glossário) e as classes de equi
xando de lado o problema de elementos em comum valência (que serão abordadas no próximo capítu
subjacentes a termos como repleto de folhas, verti
cal, tronco grosso, etc). Além do mais, para ser re
lo). De fato, a classe de classes de estímulo é, ela
conhecível como uma não-árvore, uma figura não própria, uma classe de estímulo probabilística, no
tinha que deixar de conter elementos como a cor sentido de que sua definição muda à medida que
verde, aparência de madeira, ramificações, traçados expandimos os limites de pesquisa relevante.
verticais, e assim por diante. Também não pudemos
identificar elementos em comum nos outros dois ex
perimentos. Se não existem elementos em comum,
DEFINIÇÃO DE CLASSES DE ESTÍMULOS
então qual a base para o responder? Nenhuma outra
teoria é tão facilmente caracterizável, embora uma al
ternativa se imponha, ainda que em termos amplos. O problema de definir as classes de estímu
Os pombos respondem a agrupamentos de traços los é generalizado. Ele não será resolvido por
mais ou menos isomórficos como os agrupamentos meio do apelo a procedimentos de mensuração
a que nós mesmos respondemos. O verde deveria física, porque a leitura de instrumentos de medi
estar nas folhas, caso a cor verde ou as folhas este
jam presentes. Contudo, nenhum deles é necessário
da também é um comportamento discriminativo.
ou suficiente. As partes verticais ou as ramificações Como veremos no próximo capítulo, as classes de
de galhos deveriam ser as partes da madeira, embo comportamento dependem das contingências co
ra nenhum desses traços seja necessário ou suficien muns que as estabeleceram, e não de suas proprie
te. O que vemos como árvores engloba uma lista dades físicas. Mesmo o comportamento do cien
complexa de conjunções e disjunções probabilísticas,
tista depende de discriminações aprendidas no la
cuja descoberta requereria muito mais esforço do que
pareceria justificado por qualquer benefício possível. boratório. Como já vimos, as distinções entre re
(Hermstein, Loveland, & Cable, 1976, pp. 298-299) forço, punição, eliciação e outros processos com-
portamentais são baseadas em tais discriminações.
Os conceitos naturais são exemplos de classes Elas são o ponto de partida para nossa taxonomia.
de estímulo probabilísticas, classes em que cada O controle de estímulos é um fundamento (um ele
membro contém algum subconjunto de caracterís mento básico) no que diz respeito a nosso próprio
ticas, mas nenhum é comum a todos os membros. comportamento científico, tanto quanto no que
O número de características no subconjunto pode concerne ao comportamento dos organismos que
variar de um membro da classe para outro. As ve estudamos. Assim, qualquer filosofia da ciência
zes, estas classes denominadas conjuntos impreci efetiva deve levá-lo em consideração.
sos ou indefinidos (fuzzy sets) não têm limites bem Começamos este capítulo explorando os pa
definidos, embora membros da classe possam ter ralelos entre diferenciação e indução, de um lado,
semelhanças de famílias (Rosch, 1973). e discriminação e generalização, de outro. Os
Algumas classes de estímulo probabilísticas quatro processos são resultado do reforço dife
são definidas por referência a um protótipo. Um rencial; eles diferem, principalmente, se o refor
protótipo é um membro típico de uma classe pro- ço diferencial é programado para as proprieda
babilística; é derivado de uma média ponderada des de estímulo ou de resposta. Tratamos os as
de todas as características de todos os membros pectos funcionais de controle de estímulo no
da classe. Por exemplo, os pássaros constituem contexto de experimentos sobre a atenção, sobre
uma classe de estímulo probabilística; a maioria os gradientes de controle de estímulo e sobre os
deles voa, mas os avestruzes e os pingüins não. procedimentos de esvanecimento. Ao lidar com
Na produção de um pássaro prototípico, as pe as propriedades discrimináveis do ambiente no
nas devem ter um peso maior do que os pés, com contexto da cognição animal, consideramos de que
membranas interdigitais, porque os pássaros têm modo as características relacionais complexas do
mais penas do que pés com membranas. Assim, ambiente poderiam definir as classes de estímulo.
um tordo é mais prototípico do que um pato, Os mapas cognitivos e os conceitos naturais for
porque o tordo partilha mais características com neceram os exemplos relevantes. No próximo ca
outros pássaros do que o pato. pítulo, iremos explorar melhor as classes de estí
Outros tipos de classes de estímulo incluem mulo complexas e verificar como elas são rele
as classes de estímulo polimorfas (Lea & Harri- vantes para julgamentos humanos importantes.
162 A . C harles C a t a n ia
Discriminação Condicional e
Classes de Ordem Superior
9
A. Dimensões Relacionais de Estímulos Como contingências, as discriminações po
Emparelhamento com o Modelo e Emparelhamento por dem ser efetivas sob algumas condições, mas não
Singularidade sob outras. Por exemplo, sua resposta a uma luz
Comportamento Simbólico: Classes de Equivalência verde em um cruzamento dependerá de que lado
você está, se de frente para a luz ou olhando para
B. Classes de Comportamento de Ordem Superior
Aprender a Aprender (Leaming Set) ela do outro lado da rua. Tais discriminações,
Propriedades de Classes de Ordem Superior em que o papel de um estímulo depende de ou
Origens da Estrutura tros que forneçam o contexto para ele, são deno
minadas discriminações condicionais. Conside
C. Fontes do Comportamento Novo remos o caso da atenção em relação ao pombo,
discutida no Capítulo 8 (Figura 8.2). Os estímu
A palavra matching (emparelhamento) tem sua los disponíveis são triângulos ou círculos, sobre
origem no inglês arcaico do indo-europeu mag- ou um fundo vermelho ou verde. Suponhamos que
mak-, to knead (trabalho manual) ou fashion (moda); acrescentemos uma lâmpada sobre o disco e que
está relacionada a to make (fazer), among (em com reforcemos as bicadas na presença de triângulos
panhia de) e mass (massa). A palavra sample (amos
tra ou modelo) pode ser relacionada à raiz indo-eu-
quando ela estiver acesa e bicadas na presença
ropéia em-, to take (tomar) ou distribute (distribuir). do vermelho quando ela estiver apagada. Sob
Como example (exemplo), esta palavra combina a essas circunstâncias, quando a lâmpada está ace
raiz latina ex-, fo rt (forte), e emere, to buy (com sa o pombo passa a bicar os triângulos, mas não
prar) ou obtain (obter); ela está relacionada a exempt os círculos, independente da cor; quando ela está
(livre de uma obrigação), prompt (pista) e consume
(consumo). Comparison (comparação) é derivada
apagada, ele passa a bicar os discos vermelhos,
do latim com-, with (com), mais par, equal (igual); mas não os verdes, independente da forma. Em
está relacionada a part (parte), pair (par) e, talvez outras palavras, se o pombo discrimina a forma
também a repertory (repertório). Oddity (singular ou a cor é condicional a se a lâmpada está acesa.
ou diferente) tem mais do que uma etimologia; é Neste capítulo iremos considerar diversos
derivado do antigo escandinavo odtdi, um ponto ou
um triângulo.
procedimentos experimentais em que as contin
O conceito de classes está implícito na etimolo gências discriminativas dependem do contexto
gia de symbolic (simbólico), que ao combinar o ter em que elas são programadas. Veremos que es
mo grego sym-, together (junto), e ballein, to throw ses procedimentos geram classes de comporta
(lançar), sugere a criação de uma unidade de partes mento de ordem superior, no sentido de que as
separadas. Combinado com dia-, across (de um lado
classes são definidas não por estímulos ou por
para o outro), a palavra ballein fornece, através de
diabolic (diabólico), a raiz para devil (demônio), e respostas particulares, mas por relações que in
combinado com pro-, before (antes de), fornece a cluem tais estímulos e respostas como casos es
raiz para problema. peciais (cf. Capítulo 7). Serão revistos os pro
cedimentos de emparelhamento com o modelo,
de emparelhamento por singularidade (oddity), 1
•••
de emparelhamento arbitrário e o de aprendiza
gem de séries de problemas sucessivos (lear íntervaio entre
as tentativas
ning set). Eles formam um contexto dentro do
qual poderemos explorar as condições sob as Ts
quais um estímulo pode tornar-se o equivalente
• Ç)•
funcional de um outro estímulo (quando, por 1
Oo0
í ”
1 Resposta de
Muitas discriminações condicionais envol Bicada Bicada emparelhar
vem relações arbitrárias entre um estímulo dis 1
Sem comida Comida j Conseqüência
criminativo condicional e as discriminações para
as quais ele estabelece a ocasião. Alguns casos
em que tais relações não são arbitrárias são de
interesse especial. Por exemplo, se em uma si FIGURA 9.1 Diagrama de uma tentativa de empare
lhamento com o modelo em uma câmara para pombos,
tuação um estímulo é comparável a um ou a vá com três discos. Depois de um intervalo entre as tenta
rios outros ou é um estímulo singular, depende tivas, de ts, um estímulo - modelo ou amostra (verde:
do, ou é condicional ao, contexto no qual ele é G) aparece no disco do centro. Uma bicada no disco do
apresentado. Por exemplo, se os estímulos A e centro ilumina os dois discos laterais. Um estímulo de
B são azuis e o estímulo C é amarelo, então, em comparação é igual ao modelo; o outro (vermelho: R)
não é. Uma bicada no estímulo de comparação igual
relação a A, B é um estímulo igual e C é um
produz alimento, e inicia o próximo intervalo entre ten
estímulo diferente. Consideraremos, a seguir, tativas; uma bicada no estímulo de comparação dife
algumas propriedades de tais discriminações rente dá início ao próximo intervalo entre tentativas,
condicionais. sem a apresentação de comida. O estímulo modelo e as
posições direita-esquerda dos comparações variam de
tentativa a tentativa.
EMPARELHAMENTO COM O
M ODELO E EM PARELHAM ENTO
POR SINGULARIDADE dade de que o pombo olhe para o modelo (cf.
discussão de respostas de observação nos Capí
O procedimento de emparelhamento com o tulos 8 e 11). Os dois estímulos laterais produzi
modelo é ilustrado na Figura 9.1, como poderia dos pela resposta no disco do centro são deno
ser programado em um câmara para pombos, minados estímulos de comparação (ou de esco
com três discos (cf. Skinner, 1950; Ferster, 1960). lha)', um deles é igual ao modelo e o outro não é.
Durante um intervalo entre as tentativas, todos Uma bicada no disco igual produz um reforça-
os discos estão escuros. Uma tentativa começa dor, seguido por um novo intervalo entre as ten
quando o disco do centro é iluminado, apresen tativas, mas uma bicada no disco com um estí
tando um estímulo modelo. Uma bicada é, en mulo diferente é seguida diretamente pelo inter
tão, requerida no disco do centro. Essa bicada, valo entre as tentativas, sem o reforçador (às ve
denominada resposta de observação, produz zes, respostas de não-emparelhamento também
novos estímulos e também aumenta a probabili- produzem um intervalo entre as tentativas mais
164 A . C harles C a t a n ia
prolongado, que talvez funcione como um estí De qualquer modo, suponhamos agora que
mulo punitivo leve; cf. Holt & Shafer, 1973). um pombo esteja respondendo acuradamente
Geralmente, tanto o estímulo modelo como dado o vermelho ( R) ou o verde (G), em um
a posição do estímulo de comparação correto procedimento de emparelhamento com o mode
mudam ao longo das tentativas. Uma caracterís lo. Como poderíamos descrever esse desempe
tica comum do emparelhamento com o modelo nho? Ele aprendeu apenas a bicar na esquerda,
é um procedimento de correção que repete o dadas as configurações RRG e GGR e à direita
mesmo modelo e os estímulos de comparação dadas as configurações GRR e RGG? Ou ele
na tentativa seguinte, se uma tentativa termina aprendeu a emparelhar de modo geral, isto é,
com uma bicada no disco com o estímulo não- aprendeu a relação de identidade? Se agora apre
emparelhado. Esse procedimento impede o de sentarmos a cor azul ou a cor amarela, e o pom
senvolvimento do responder restrito a apenas um bo faz o emparelhamento com as novas cores
disco ou a uma cor (mas como veremos no Ca modelo, teremos mais confiança em falar de em
pítulo 10, ele também garante que erros sejam parelhamento generalizado (de fato, o empare
freqüentemente seguidos de perto pelos reforça- lhamento em pombos não se transfere facilmen
dores produzidos por respostas corretas). te para as novas cores, embora a probabilidade
Suponhamos que um pombo bique apenas no dessa transferência dependa de detalhes do trei
estímulo de comparação à esquerda. Se o disco no). Mesmo se vemos o emparelhamento com
com o estímulo emparelhado se alterna irregular as novas cores, o que dizer se não obtemos o
mente entre a esquerda e a direita, essas bicadas emparelhamento com figuras geom étricas?
serão reforçadas apenas na metade das tentativas Podemos dizer apenas que o pombo aprendeu
(aquelas em que o estímulo emparelhado estiver à o emparelhamento de cor, mas não o de for
esquerda). O reforço em metade das tentativas, pro ma, notando que o conceito humano de em
vavelmente, será suficiente para manter indefini parelhamento não parece tão limitado por di
damente as bicadas no disco da esquerda. No en mensões específicas dos estímulos. O empa
tanto, com um procedimento de correção, o pom relhamento com o modelo também tem sido de
bo terá que mudar para o disco da direita mais cedo nominado de emparelhamento por identidade,
ou mais tarde, porque uma tentativa com um estí mas devemos reservar esse termo para os casos
mulo emparelhado na direita será repetida até que em que o emparelhamento se generaliza para
uma resposta ocorra no disco da direita e seja re novos estímulos modelo e de comparação, como
forçada. Do mesmo modo, se um pombo sempre o emparelhamento de forma, depois do treino
bica as comparações vermelhas, essas bicadas se com cores. Com um conjunto limitado de estí
rão reforçadas em metade das tentativas, a menos mulos, o que parece emparelhamento de identi
que um procedimento de correção force o pombo dade freqüentemente nada mais é do que um em
a mudar ocasionalmente para o verde. parelhamento baseado em configurações espe
Um outro refinamento do procedimento con cíficas de estímulos.
siste em aumentar a atenção do pombo ao modelo, Há muitas variações de emparelhamento com
modificando as contingências programadas para o modelo. Se o reforço é programado para que
as bicadas no disco do modelo. Por exemplo, se a haja bicadas no estímulo não-emparelhado, e não
produção dos estímulos de comparação depende para o estímulo emparelhado, o procedimento
de diferentes padrões de responder a cada modelo toma-se um caso de emparelhamento por singu
(p. ex., diferentes taxas de respostas), os padrões laridade (oddity), porque esse disco é necessa
de respostas que o pombo produz podem nos in riamente o diferente, dentre os três discos. Essa
formar se ele está discriminando entre os mode versão de emparelhamento por singularidade
los. Tais procedimentos, às vezes, produzem uma requer um mínimo de duas bicadas por tentati
aquisição mais rápida do emparelhamento, mas va, uma no modelo e outra na comparação não-
infelizmente o aumento da atenção ao modelo, emparelhada. Em outras versões de emparelha
às vezes, também reduz a atenção aos estímulos mento por singularidade, nenhum modelo é apre
de comparação (p. ex., Urcuioli, 1985). sentado; com pombos em uma câmara de três
A p r e n d iz a g e m 165
discos, por exemplo, cada tentativa consiste em COMPORTAMENTO SIMBÓLICO:
iluminar todos os três discos, com o estímulo CLASSES DE EQUIVALÊNCIA
diferente em um deles. Esse procedimento re
quer apenas uma bicada por tentativa. Se as bicadas de um pombo são reforçadas
As relações entre os estímulos também po na presença do verde, mas não do vermelho, não
dem implicar no emparelhamento arbitrário. Por consideraríamos a possibilidade de que o pom
exemplo, poderíamos treinar o pombo a bicar em bo “esverdeasse” na presença das bicadas. Tal
um disco verde, dado um quadrado como mode reversão não teria sentido como comportamen
lo, e a bicar em um disco vermelho dado um cír to. Mas isso não ocorre assim no emparelhamen
culo como modelo. Poderíamos, então, pergun to. Tanto o estímulo modelo como a resposta de
tar se o pombo poderia bicar em um quadrado, comparação são definidos pelos estímulos apre
dado o verde como modelo, e em um círculo, sentados nos discos. Poderíamos perguntar so
dado o vermelho como modelo. Geralmente es bre uma resposta vermelha ao estímulo verme
peramos essa reversibilidade quando lidamos lho, ou sobre a reversibilidade de uma resposta
com palavras e objetos, por exemplo, quando vertical a um estímulo diagonal, ou sobre se res
uma criança que aprendeu a apontar para a figu postas redondas a estímulos esmaecidos podem
ra de um carro ao ver a palavra carro, pode apon ser criadas pelo treino de respostas redondas a
tar para a palavra ao ver a figura. Esta reversibi estímulos grandes e depois de respostas grandes
lidade, uma propriedade do comportamento sim a estímulos esmaecidos.
bólico, não pode ser tida como certa. Por exem Estes casos ilustram as propriedades de rela
plo, uma criança pode mostrar tal reversibilida ções denominadas reflexividade, simetria e tran
de sem treino explícito, mas um pombo, não. O sitividade. As propriedades reflexivas são aque
emparelhamento arbitrário também pode ser es las que se mantêm entre um termo e ele mesmo
tendido a casos em que a mesma resposta de em (p. ex., A = A); as propriedades simétricas são
parelhar é treinada com mais de uma compara aquelas em que a ordem dos termos é reversível
ção (p. ex., bicar uma comparação verde, dado (p. ex., se A = B, então B = A); e as proprieda
um círculo ou uma elipse como modelo, e bicar des transitivas são aquelas em que os termos co
uma vermelha, dado um quadrado ou um triân muns em dois pares ordenados determinam um
gulo; cf. Zentall & Urcuioli, 1993, sobre o em terceiro par ordenado (p. ex., se A = B e B = C,
parelhamento de muitos-para-um e de um-para- então A = C). As relações de equivalência são
muitos). aquelas que têm todas as três propriedades, e os
As várias tarefas que acabamos de conside termos que entram nelas (aqui, A, B e C) são
rar envolvem, todas elas, relações entre diferen considerados membros de uma classe de equi
tes classes de estímulo. Algumas são arbitrári valência (Sidman, 1994).
as, como quando designamos bicadas ao verde Outras relações partilham apenas algumas
como corretas, dado um quadrado como mode dessas propriedades. Por exemplo, a relação de
lo, e bicadas no vermelho como corretas, dado oposição é simétrica (se D é o oposto de E, E é o
um círculo como modelo; mas outras, tais como oposto de D), mas não é reflexiva (D não é o
o emparelhamento por identidade e por singu oposto de si mesmo) nem transitiva (se D é o
laridade, parecem envolver dimensões mais fun oposto de E e E é o oposto de F, D não é o oposto
damentais. Como, então, deveríamos lidar com de F; pelo contrário, D é o mesmo que F). E uma
relações como: o mesmo que, diferente de, e o relação de magnitude como maior que é transitiva
oposto de; e o que podemos dizer sobre as con (se G é maior que H e H é maior que I, então G é
tingências que as criaram (cf. Hayes, 1994, so maior que I), mas não é reflexiva nem simétrica.
bre molduras relacionais)? Questões sobre a es A Figura 9.2 ilustra como os procedimentos
trutura do estímulo parecem estar inevitavelmen de emparelhamento de identidade e emparelha
te interligadas com questões sobre a estrutura do mento arbitrário podem ser usados para demons
comportamento (p. ex., Fujita, 1983; Lamb & Ri trar a reflexividade, a simetria e a transitividade.
ley. 1981; Wasserman, Kiedinger, &Bhatt, 1988). Cada procedimento inclui dois estímulos mode
166 A. C harles C a t a n ia
Disco de Disco de Disco de Disco de
comparação Modelo comparação comparação Modelo comparação
correto A incorreto correto B incorreto
© © © © © ©
REFLEXIVIDADE
Emparelhamento de
cor
Emparelhamento de
forma
© © © © © ©
SIMETRIA
©©
©©
©©
©©
©©
©©
Emparelhamento
arbitrário (cor-forma)
Teste de reversão
(forma-cor)
© © © © © ©
TRANSITIVIDADE
Emparelhamento ar
bitrário 1 (cor-forma)
Emparelhamento ar
bitrário 2 (forma-in-
O © • • © o
• © o
tensidade)
Teste de transitivida
de (cor-intensidade) o © •
Teste combinado de
reversão-transitivida-
de (intensidade-cor) © o © © • ©
FIGURA 9.2 Procedimentos de emparelhamento para estudar as três propriedades de relações de equivalência:
reflexividade (emparelhamento por identidade), simetria (reversão do emparelhamento arbitrário) e transitividade
(transferência entre pares ordenados, de emparelhamentos arbitrários). Cada matriz de três discos é mostrada em
apenas um dos dois arranjos possíveis, com o estímulo de comparação correto à esquerda. Os estímulos incluem as
cores vermelho (R) e verde (G), triângulos, círculos, disco iluminado e apagado.
lo, mostrados como em A, na matriz de três dis de cores como comparações. As duas linhas de
cos à esquerda, e como B, na matriz da direita. baixo (transitividade) mostram como os estímu
Por conveniência, o estímulo de comparação los comuns nos dois procedimentos de empare
correto é sempre mostrado à esquerda na matriz lhamento simbólico (cor emparelhada à forma e
de três discos, embora na prática as posições la forma emparelhada à intensidade) podem ser
terais dos estímulos de comparação variem de combinados em um teste de transitividade (cor e
tentativa a tentativa. Como na Figura 9.1, uma intensidade). Um teste alternativo, ilustrado na
bicada no estímulo-modelo produz compara última linha, combina os testes de reversão e de
ções, e uma bicada no estímulo de compara transitividade (intensidade e cor); ele é denomi
ção correto produz comida, enquanto uma bi nado de teste de equivalência, e a relação entre
cada no estímulo de comparação incorreto não os estímulos do teste de equivalência é denomi
produz. nada uma relação de equivalência. As relações
As duas linhas superiores na Figura 9.2 (re dos testes de reversão e de equivalência nunca
flexividade) ilustram os procedimentos padrão foram explicitamente ensinadas. Se ocorre um
de emparelhamento com cor e com forma. As emparelhamento apropriado nesses testes, as
duas linhas seguintes (simetria) ilustram o em novas relações demonstradas por esse compor
parelhamento simbólico com as cores como mo tamento são denominadas relações emergentes,
delos e as formas como comparações e, depois, no sentido de que emergiram sem treino explíci
um teste de reversão de formas como modelos e to; elas são exemplos de comportamento novo,
A p r e n d iz a g e m 167
produzido por contingências de emparelhamen As relações de equivalência são facilmente
to arbitrário. geradas em humanos. Por exemplo, jovens re
Quando dizemos que um pombo que bica em tardados que já haviam mostrado reflexividade
presença de verde não pode “esverdear” na pre (emparelhamento de identidade) foram ensina
sença de bicadas, estamos dizendo que as rela dos a fazer emparelhamentos envolvendo (A) pa
ções entre os estímulos antecedentes e as res lavras ditadas, (B) figuras correspondentes àque
postas que eles ocasionam em uma contingência las palavras e (C) as palavras impressas corres
de três termos não são simétricas. Isso significa pondentes (p. ex., carro, cachorro, menino: Sid
que não podemos reduzir as classes de equiva man, Cressom, & Wilson-Morris, 1974). Inicial
lência a classes de estímulos discriminativos. As mente dado um grupo de 20 palavras ditadas, a
relações de equivalência são simétricas, mas as tarefa consistia em selecionar a figura correspon
relações entre os termos de uma contingência de dente, dentre um conjunto de comparações (AB).
três termos não são. Então, dado o mesmo conjunto de 20 palavras
Já questionamos se o desempenho do pombo ditadas, os jovens aprenderam a selecionar as pa
no procedimento padrão de emparelhamento lavras impressas correspondentes, dentre um
depende da relação de identidade em geral ou conjunto de comparações (AC). Para todas as 20
somente das relações entre os estímulos especí palavras, esses dois tipos de emparelhamento (fi
ficos. Poderíamos supor que a relação de identi guras com palavras ditadas e palavras impressas
dade entre os estímulos modelo e os de compa com palavras ditadas) também geraram quatro
ração tomaria o emparelhamento por identidade outras relações sem treino adicional: duas novas
mais fácil do que o emparelhamento arbitrário. relações através da simetria (BA, dada uma fi
Para os pombos, no entanto, a aquisição do em gura, dizer seu nome; e CA, dada uma palavra
parelhamento depende mais das dimensões de impressa, dizer a palavra) e duas através da tran
estímulo escolhidas para os modelos e compara sitividade (BC, dada uma figura, selecionar a pa
ções do que do tipo de procedimento, se se tratar lavra impressa correspondente; e CB, dada uma
de um emparelhamento por identidade ou de um palavra impressa, selecionar a figura correspon
emparelhamento arbitrário. Por exemplo, o de dente). Quarenta relações foram ensinadas (20
sempenho nos dois tipos de procedimento de de cada em AB e em AC), e outras 80 emergi
senvolve-se mais rapidamente com modelos ver ram indiretamente (em BA, CA, BC e CB). O
melhos e verdes do que com modelos verticais e reforço de emparelhamento arbitrário criou o
horizontais (p. ex., Carter & Werner, 1978). A início de um repertório de leitura nesses jovens.
simetria e a transitividade têm sido demonstra As relações emergentes justificam chamar seus
das de maneira limitada com pombos, mas os desempenhos de emparelhamento simbólico, e
efeitos geralmente não têm sido robustos (p. ex., não apenas de emparelhamento arbitrário. Cada
D’Amato e col., 1985; Richards, 1988). Além uma das 20 classes de equivalência consistia em
disso, existem certas armadilhas técnicas e lógi uma figura, a palavra falada e a palavra impres
cas a serem evitadas na análise de relações de sa correspondentes. Novas classes poderiam ter
equivalência através dos testes de transferência, sido adicionadas, com novas figuras e as pala
tais como se as discriminações condicionais re vras correspondentes, e o número de equivalên-
levantes foram aprendidas como a seleção do cias poderia ter sido expandido pela adição de
comparação correto ou como a exclusão ou a re novas relações (p. ex., palavras impressas e pa
jeição do estímulo incorreto (p. ex., Carrigan & lavras escritas em letras cursivas ou figuras e
Sidman, 1992). Assim, a evidência de relações objetos reais). Não há limites óbvios para o nú
de equivalência no comportamento de empare mero de classes que podem ser criadas ou para o
lhamento do pombo é, no mínimo, pouco con número de estímulos que podem ser incluídos
vincente (provavelmente todas as relações com em cada classe. O status desses tipos de classes
ponentes poderiam ser explicitamente ensinadas, no comportamento de não-humanos permanece
mas esse resultado teria interesse apenas do ponto como objeto de controvérsias (p. ex., Dube e col.,
de vista do procedimento). 1993; Home & Lowe, 1996; Schusterman &
168 A. C h a r le s C a ta n ia
Kastak, 1993; Zentall & Urcuioli, 1993). Mas (Catania, Home, & Lowe, 1989; cf. de Rose e
as classes de equivalência definem comporta col., 1988).
mento simbólico, e assim, pode ser que elas se
jam uma propriedade exclusiva do comporta
mento humano, ou pode ser que partilhemos essa
propriedade apenas com nossos parentes mais Seção B Classes de Comportamento de
próximos, os primatas. De fato, o grande inte Ordem Superior
resse nas classes de equivalência deriva de sua
possível relevância para os fenômenos da lin Em nossos exemplos de procedimentos de
guagem, que iremos considerar nos Capítulos 14 emparelhamento com o modelo e outros proce
a 16. Os membros de uma classe de equivalên dimentos relacionados, descrevemos desempe
cia são equivalentes no sentido de que podem nhos em mais de um nível de análise. Descreve
ser permutáveis uns pelos outros no contexto de mos respostas de bicar em um estímulo de com
procedimentos de emparelhamento arbitrário. paração vermelho, dado um modelo vermelho,
Mas isso não significa necessariamente que eles como discriminação condicional, mas também
sejam funcionalmente equivalentes, no sentido perguntamos se poderíamos caracterizar esse de
de que um seja substituível pelos outros em ou sempenho como um emparelhamento de identi
tros contextos. Em outras palavras, a equivalên dade. Nossa decisão dependia de se havíamos
cia funcional não é o mesmo que ser membro de criado uma classe operante definida por estímu
uma classe de equivalência, e não se pode supor los particulares em um contexto particular ou
que as propriedades lógicas dessas relações se uma classe que se generalizasse por meio de re
jam completamente consistentes com suas pro lações com uma ampla gama de estímulos. Faz
priedades comportamentais (Saunders & Green, diferença se um pombo que emparelha verde ao
1992). A equivalência funcional de membros de verde e vermelho ao vermelho também empare
uma classe de equivalência tem que ser testada lha outras cores, ou se um pombo que empare
experimentalmente. A questão é se uma função lha com uma ampla gama de cores também o
adquirida por um membro de uma classe de equi faça quando apresentamos problemas que envol
valência, como uma função discriminativa, por vam formas ou texturas ou outras dimensões. Da
exemplo, pode se transferir para os outros mem mesma maneira, faz diferença se o desempenho
bros daquela classe (cf. Sidman e col., 1989). de um pombo em emparelhamento arbitrário é
Consideremos um exemplo. Uma criança uma classe operante restrita a um conjunto par
aprendeu a obedecer às palavras de um pai, vá e ticular de modelos e comparações ou se inclui
pare, quando está em um cruzamento com o pai. todas as relações reflexivas, simétricas e transi
Em uma situação separada, a criança é ensinada tivas que definem as classes de equivalência.
que ir e luz verde são equivalentes e que parar e Esses exemplos apresentam classes embuti
luz vermelha são equivalentes (em outras pala das em outras classes. Se demonstramos empa
vras, ir e luz verde tomam-se membros de uma relhamento por identidade, cada emparelhamento
classe de equivalência, e parar e vermelho tor específico define uma classe, mas o emparelha
nam-se membros de outra classe). Se as funções mento de identidade é, então, uma classe de or
discriminativas das palavras vá e pare se trans dem superior que inclui, como seus componen
ferem para as respectivas luzes de tráfego, a tes, todos os emparelhamentos específicos. No
criança obedecerá às luzes, sem necessidade de emparelhamento com o modelo, o emparelha
instrução adicional. Um tipo análogo de transfe mento de verde ao verde ou de vermelho ao ver
rência foi experimentalmente documentado com melho podem existir como operantes separados.
crianças: taxas de respostas altas e baixas, oca Eles podem ser tratados como instâncias de em
sionadas cada uma por um conjunto de estímu parelhamento por identidade somente se puder
los, transferiram-se para outros conjuntos quan ser demonstrado que são componentes de um
do os estímulos nos conjuntos foram estabeleci único operante de ordem superior, definido pela
dos como membros de classes de equivalência relação de identidade entre modelo e compara
A p r e n d iz a g e m 169
ção. Um teste para o operante de ordem superior de um certo número de tentativas, o macaco do
é se relações novas podem ser demonstradas, minava a discriminação. Então, um novo pro
como o emparelhamento de novas cores (p. ex., blema, com um novo par de objetos, era apre
azul a azul, ou amarelo a amarelo); um outro teste sentado, com o reforço diferencial novamente
é se todas as subclasses de emparelhamento se programado para selecionar apenas um dos dois
mantêm juntas como classe, caso mudemos as objetos. Novamente, uma discriminação emer
contingências somente para um subconjunto de gia. Um novo problema, com outro novo par, era
las. Examinaremos, a seguir, algumas classes de então apresentado e mais tarde um outro, e as
ordem superior, faremos uma revisão de suas pro sim por diante. Dados médios de oito sujeitos
priedades e consideraremos algumas implicações são mostrados na Figura 9.3. Cada conjunto de
que podem ser tiradas das mesmas. pontos mostra a porcentagem de respostas cor
retas às seis primeiras tentativas ao longo de blo
cos sucessivos de problemas. Com os oito pri
APRENDER A APRENDER meiros problemas (1-8), as respostas corretas au
cLEARNING SET) mentaram gradualmente ao longo das tentativas;
pela sexta tentativa, elas ainda não haviam atin
A aprendizagem de uma nova discriminação gido 80%. No bloco seguinte de oito problemas
pode depender daquilo que o organismo já apren (9-16), as respostas corretas aumentaram mais
deu (às vezes chamamos o que foi aprendido no rapidamente ao longo das tentativas. Ao longo
laboratório d&história experimental). Como ilus de blocos sucessivos, o responder correto aumen
trado pelo fenômeno conhecido como leaming tou mais e mais rapidamente a cada tentativa,
set (Harlow, 1949), o responder pode depender até que, no último bloco (tentativas 289-344), o
das relações entre as propriedades do estímulo, responder atingiu aproximadamente 100 % de
independentes de estímulos específicos. Nos es acurácia na segunda tentativa de cada novo pro
tudos de Harlow, dois objetos diferentes eram blema. Em outras palavras, quanto mais proble
apresentados a um macaco privado de comida, mas o macaco havia aprendido, mais rapidamente
em tentativas sucessivas. Suas posições varia ele aprendia um novo.
vam de tentativa a tentativa. A comida era colo Nesse procedimento, não podemos descrever
cada apenas sob um deles e assim, selecionar o operante discriminado apenas com base em um
aquele era diferencialmente reforçado. Depois par de estímulos. Quando um macaco adquire
100 r-
C 289-344
- 133-232
233-288
33-132
17-32
9-16
FIGURA 9.3 Leaming set ou aprender
o
O a aprender. Oito macacos aprenderam
uma variedade de problemas de discri
minação de duas escolhas. Cada con
junto de pontos mostra a porcentagem
de respostas corretas ao longo das seis
primeiras tentativas de cada problema,
para blocos de problemas sucessivos (o
eixo y começa em 50%, o nível do aca
so). A taxa de aprendizagem aumentou
ao longo de problemas sucessivos. No
último bloco de problemas (problemas
289-344), o responder apresentava qua
se 100% de acurácia na segunda tenta
3 4 5
tiva de cada novo problema. (Adaptada
de Harlow, 1949, Figura 2)
Tentativas em Cada Problema
170 A. C harles C a t a n ia
discriminações sucessivas tão rapidamente que quando esta se torna disponível em uma nova
ele consistentemente seleciona o estímulo cor situação, ao contrário dos ratos que nunca foram
relacionado com o reforço, depois de uma única expostos a choques inescapáveis e inevitáveis (cf.
tentativa com um novo par, seu desempenho de Maier, Albin, & Testa, 1973). Aqui, novamente,
pende de relações entre os estímulos e suas con é difícil definir a classe de respostas, exceto se
seqüências correlacionadas, ao longo de proble notarmos que os ratos que receberam choques
mas sucessivos, e não de pares particulares de inevitáveis e inescapáveis aparentemente apren
estímulos que aparecem dentro de problemas par deram que suas respostas não tinham conseqüên
ticulares. Em cada problema inicial, o macaco cias importantes; o comportamento gerado por
tinha que aprender muitas outras características essas contingências se transfere para situações
do procedimento, além de qual era o estímulo nas quais o responder poderia ter conseqüências.
correlacionado com a comida. Ele devia apren Talvez o desamparo aprendido, como uma clas
der que a comida era correlacionada apenas com se de ordem superior, pudesse ser colocado sob
um dos dois estímulos, e não com a posição nem controle de estímulos discriminativos, por meio
com outras dimensões da situação e que esta cor de contingências diferenciais.
relação não mudava dentro de um mesmo pro O learning set ilustra a amplitude e a com
blema, assim como não havia reforço para pe plexidade do que os organismos podem apren
gar, simultaneamente, os dois estímulos e assim der; esse fenômeno também mostra que não po
por diante. Durante os primeiros problemas, a demos tratar como um caso simples o que acon
aprendizagem ocorreu lentamente, porque o ma tece quando introduzimos um organismo expe
caco estava aprendendo muitas coisas como estas; rimentalmente ingênuo na situação de laborató
finalmente, quando o macaco tinha aprendido es rio (cf. Capítulo 5, sobre a aquisição). Para estu
tas outras coisas, tudo o que ele tinha que apren dar a aprendizagem, alguns investigadores têm,
der em qualquer novo problema, qual era o estí então, voltado-se para a aquisição repetida de dis
mulo que estava correlacionado ao reforço. criminações simples ou de seqüências simples
Nesse ponto, podemos definir o operante dis de respostas. Paradoxalmente, eles têm passado
criminado como segue: se a resposta de selecio a estudar a aprendizagem, definida como mu
nar um dos objetos é reforçada na primeira ten danças no desempenho, no contexto de procedi
tativa de um novo problema, selecione aquele mentos de estado estável, definidos pela estabi
objeto em todas as tentativas subseqüentes; se a lidade no desempenho. Por exemplo, em uma câ
resposta não é reforçada, mude para o outro ob mara de macacos, com quatro grupos de três bar
jeto nas tentativas subseqüentes. Na aprendiza ras em cada um, somente uma seqüência parti
gem de problemas sucessivos, esse é o desem cular de pressões era reforçada dentro de uma
penho que é reforçado e é nisso que o comporta mesma sessão (p. ex., barra da esquerda, do gru
mento do organismo se transforma. Assim, a po 1; barra da direita do grupo 2; barra do meio,
correspondência entre as contingências de refor do grupo 3, e barra da direita, do grupo 4), mas a
ço e o comportamento gerado por essas contin seqüência mudava de sessão para sessão (Boren
gências permanece como um critério apropria & Devine, 1968). Quando a taxa de aprendiza
do para essa classe operante. Aprender a apren gem do macaco para um novo problema a cada
der qualifica-se como uma classe de ordem su dia se tornava estável, essas aquisições repeti
perior, porque é definida por essas relações, e das tornavam-se uma linha de base para o estu
não pelos estímulos e pelas respostas a qualquer do de uma variedade de fenômenos: efeitos de
problema particular. diferentes procedimentos de esvanecimento;
Um fenômeno que pode ser visto como uma efeitos de drogas sobre a aprendizagem; efeitos
variação de leaming set é o desamparo aprendi de diferentes tipos de conseqüências para as res
do (Maier, Seligman, & Solomon, 1969). Por postas em várias posições da seqüência; efeitos
exemplo, ratos que receberam choques elétricos da criação de uma seqüência como um todo, em
inescapáveis e inevitáveis em uma situação ten oposição a construí-la pelo começo ou pelo fi
dem a não aprender uma resposta de esquiva nal, e assim por diante.
A p r e n d iz a g e m 171
PROPRIEDADES DAS CLASSES DE danças nas contingências que são program a
ORDEM SUPERIOR das para elas.
Quando programamos novas contingências
Uma propriedade significativa das classes de para as subclasses das classes de ordem supe
ordem superior estava implícita no tratamento rior, geralmente, esperamos que aquelas subclas
do comportamento autolesivo no Capítulo 7. ses, eventualmente, sejam diferenciadas das ou
Naquele exemplo, o comportamento autolesivo tras. Mas se as subclasses se superpõem de di
mantido pela atenção não foi facilmente reduzi versas maneiras com outras classes que partilham
do pela extinção, na medida em que ele perma de outras contingências, isso pode não aconte
necia como parte de uma classe mais ampla (a cer. Por exemplo, imitar o que alguém disse par
de obter atenção), cuja maioria dos membros tilha a participação na classe com outras imita
continuava efetiva na obtenção de conseqüên ções, mas também pode participar de contingên
cias. Sempre que as contingências que mantêm cias sociais que não envolvem a imitação. Isso
uma classe de ordem superior são diferentes das pode ser suficiente para manter o comportamen
que mantêm uma ou mais de suas subclasses, to como uma subclasse, quando as contingênci
podemos nos perguntar quais das contingências as mudam para ele, mas não para outros tipos de
prevalecerão. Por exemplo, imaginemos uma imitação. Essas complexidades estão implícitas
classe de ordem superior que consista nas imita na seguinte explicação da seleção ontogenética
ções, por uma criança, das ações apresentadas em que “regras, princípios, estratégias e simila
como modelo por um boneco. Quando o boneco res” correspondem ao que temos chamado de
bate palmas, a criança bate palmas; quando o bo classes de ordem superior:
neco ri, a criança ri; quando o boneco pula, a
criança pula, e assim por diante. Vamos identifi Em seres humanos mais maduros, uma grande par
te do comportamento instrumental e, mais especial
car uma dezena de imitações diferentes com as mente, do comportamento verbal está organizado
letras de A a L. Uma vez que tenhamos reforça em rotinas de ordem superior e é, em muitas ins
do essas imitações, uma maneira pela qual pode tâncias, melhor entendido em termos da operação
mos dizer se criamos uma classe de ordem supe de regras, princípios, estratégias e similares, do que
rior é verificar se a criança também imita novas em termos de sucessões de respostas a estímulos
particulares.... Nessas situações, é a seleção de es
ações que o boneco nunca tenha modelado antes. tratégias, mais do que a seleção de reações particu
Agora suponhamos que paremos de reforçar lares a estímulos, que é modificada pela experiên
a G, enquanto continuamos a reforçar todas as cia passada com conseqüências reforçadoras ou pu
outras imitações, de A a F e de H a L. Se as imi nitivas.
tações de G irão decrescer ou se elas persistirão Se alguém que está tentando descrever e predi
zer o comportamento de um aprendiz humano adul
por muito tempo depois de terem sido excluídas to deixa de levar em conta essas organizações com-
das contingências de reforço é uma questão ex portamentais e tenta construir uma explicação com
perimental. Se elas diminuírem, teremos demons base somente nas unidades estímulo-resposta indi
trado que podemos separar G dos outros mem viduais, os princípios de operação de reforçadores e
bros da classe de ordem superior. Caso contrá punidores podem parecer muito diferentes daqueles
revelados em experimentos mais simples com ani
rio, teremos que supor que ainda está funcionan mais ou com aprendizes humanos menos am adu
do como membro da classe de ordem superior recidos. De fato, pode ser que os princípios de
chamada de imitação, que é definida pelas cor operação desses fatores sejam os mesmos em to
respondências entre o que o boneco faz e o que a dos os casos e que a diferença resida na natureza
criança faz. Enquanto a classe de ordem supe das unidades comportamentais, cujas probabili
dades estão sendo modificadas como resultado
rior mantém sua integridade, suas subclasses são da experiência com vários tipos de resultados.
mantidas juntamente com os outros membros, (Estes, 1971, p. 23)
mesmo que não estejam consistentemente en
volvidas nas contingências que mantém as Vimos considerando as classes de ordem su
outras. Quando isso acontece, as subclasses perior potenciais no emparelhamento com o mo
de ordem inferior parecerão insensíveis às mu delo, nas aprendizagens sucessivas e na imita
172 A. C harles C a t a n ia
ção. Nestes e em outros casos, o treino com mui des do conjunto, o comportamento mudava de
tas instâncias específicas, às vezes, pode ser pré- modo apropriado para todos eles. Essa equiva
requisito suficiente para as classes de ordem su lência funcional emergiu porque as mesmas con
perior ou classes generalizadas (p. ex., o treino seqüências foram programadas para as respos
com muitos problemas de simetria pode produ tas na presença de todos os estímulos, dentro de
zir simetria generalizada, o treino com muitos um mesmo conjunto.
problemas de transitividade pode produzir tran Esse procedimento criou dois operantes dis
sitividade generalizada, e etc.; tais classes gene criminados arbitrários, bicar um conjunto de sli
ralizadas também têm sido denominadas moldu des e bicar outro conjunto de slides, pela pro
ras (ou quadros) relacionais: Hayes, 1994). gramação de contingências para os membros
Encontraremos muitos exemplos de classes de dentro de cada conjunto. A correlação com as
ordem superior em outros contextos, como quan bicadas reforçadas era a única coisa que distin
do lidamos com a aprendizagem social e o com guia uma classe da outra. E provável que pense
portamento verbal. Por exemplo, iremos retor mos sobre classes de modo diferente, quando
nar à imitação generalizada no Capítulo 13 e con seus constituintes são arbitrários, como no estu
sideraremos as classes de respostas verbais, como do de Vaughan, do que quando os constituintes
a nomeação, no Capítulo 14, e o seguimento de têm coerência natural (p. ex., quando são seleci
instruções, no Capítulo 15. onados de uma faixa estreita do espectro de estí
mulos ou são todos instâncias de algumas cate
gorias naturais: cf. Capítulo 8). Mas o ponto cen
ORIGENS DA ESTRUTURA tral do argumento é que as contingências comuns
selecionam os membros de classes operantes. As
A maioria das classes que consideramos até pressões à barra por um rato com a pata esquer
aqui tem sido as classes estruturais. As proprie da, com a pata direita e com ambas as patas tam
dades que as definem não eram arbitrárias, mas bém são arbitrárias, até que partilhem as contin
sim derivadas de relações sistemáticas entre as gências comuns no deslocamento da barra. Po
propriedades de eventos ambientais (p. ex., o demos ver o experimento de Vaughan apenas
emparelhamento, a singularidade, a simetria). Va como um outro exemplo do emprego de contin
mos agora examinar algumas classes arbitrárias, gências comuns para criar um operante discri
como as criadas em um experimento por Vau minado; ele difere dos outros, principalmente,
ghan (1988). Um grupo de slides de fotografias nas classes particulares que criou. Então, qual
foi arbitrariamente dividido em dois subconjun quer estrutura existente nos dois conjuntos de
tos de 20 slides cada. Os slides eram apresenta slides foi imposta pelos dois conjuntos de con
dos um por vez, no disco de uma câmara para tingências comuns (reforço para um e extinção
pombos, e as bicadas do pombo eram reforçadas para o outro).
na presença dos slides de um conjunto, mas não Uma expressão do problema de como a es
na presença dos slides do outro conjunto. De trutura emerge a partir de um início indiferen
pois de vários blocos de sessões com um desem ciado é familiar aos psicólogos na forma da des
penho bastante consistente, a correlação entre os crição metafórica de William James, das respos
conjuntos à&slides e o reforço era ocasionalmen tas de um recém-nascido ao mundo como “uma
te revertida. Depois de várias reversões, os pom grande e explosiva confusão” (James, 1890, p.
bos começaram a mudar o responder de um con 488). James apelou para as primeiras discrimi
junto de slides para outro depois que somente nações da criança como a base para que ela or
alguns dos slides haviam sido mostrados. Em ganizasse o que começava como desorganizado.
outras palavras, as contingências comuns pro Atualmente sabemos muito mais sobre discrimi
gramadas para os 20 slides em um conjunto fi nação do que estava disponível para James. Ele
zeram com que eles se tomassem funcionalmente não teve o benefício da pesquisa de Thomdike
equivalentes, no sentido de que uma vez que as sobre as conseqüências do responder ou da de
contingências mudavam para apenas alguns sli Pavlov, sobre as funções sinalizadoras de estí-
A p r e n d iz a g e m 173
mulos, ou da de Skinner sobre as classes ope bitrárias podem emergir, não por causa dos efei
rantes e as contingências de três termos. tos diretos daquelas propriedades partilhadas,
Para atacar o problema de James, podemos mas porque, devido a elas, todos os membros da
começar por considerar como os operantes dis classe estão necessariamente envolvidos em con
criminados são criados pelas contingências. Os tingências comuns. Por exemplo, passar a mão
operantes, definidos com base nas propriedades por uma esfera difere de passar a mão sobre um
de suas respostas e dos estímulos na presença cubo; somente no segundo caso, encontra-se uma
dos quais elas ocorrem, são selecionados por suas extremidade angulosa. Essas contingências na
conseqüências. Mas devemos distinguir entre turais podem, então, ser a base para se poder dis
contingências comuns e conseqüências comuns. criminar entre esferas e cubos. Em outras pala
As conseqüências comuns não são suficientes vras, é bem possível que as categorias que pare
para criar classes diferenciadas, porque um úni ciam ser categorias naturais não-arbitrárias pos
co reforçador pode manter duas ou mais classes sam ser criadas da mesma maneira que as arbi
diferentes. Por exemplo, quando as bicadas de trárias, ao longo de uma vida de experiência com
um pombo à esquerda produzem comida de acor as contingências comuns que elas engendram (cf.
do com um esquema de intervalo, ao passo que a discussão das conseqüências sensoriais no Ca
suas bicadas à direita produzem a mesma comi pítulo 5). Não é verdade que qualquer coisa que
da de acordo com um esquema de intervalo di seja significativa envolva contingências de al
ferente, as bicadas à esquerda e à direita são clas gum tipo e esteja plena de oportunidades para
ses diferentes, embora elas produzam a mesma aquelas contingências que tragam ordem, na for
conseqüência, a comida. ma de operantes discriminados, a partir de “uma
Em outras palavras, cada operante é criado grande e explosiva confusão” ?
não apenas por conseqüências comuns, mas por Sem dúvida, alguns aspectos da seleção ope
conseqüências comuns que dependem de con rante devem ser limitados pelas propriedades dos
tingências comuns. As contingências operantes sistemas sensoriais e motores e das organizações
tomam todos os membros de um operante fun neurais que foram selecionadas filogeneticamen-
cionalmente equivalentes e o experimento de te (exploraremos alguns desses limites e restri
Vaughan demonstrou um operante discriminado ções no Capítulo 12). Skinner falou desses tipos
totalmente arbitrário, baseado apenas em con de limitações como “as linhas naturais de fratu
tingências comuns. Mas as explicações de dis ra ao longo das quais o comportamento e o am
criminação complexa freqüentemente apelam biente de fato se quebram” (Skinner, 1935a, p.
para a contribuição relativa do estímulo e do or 40); “Nós dividimos o comportamento em clas
ganismo, sem incluir as contingências (p. ex., ses fortes e rápidas e então nos surpreendemos
Fetterman, 1996). Consideramos algumas des ao descobrir que o organismo desconsidera os
sas questões no Capítulo 8, no contexto de con limites que estabelecemos” (Skinner, 1953, p.
ceitos naturais. Quando os membros da classe 94). Mas as contingências ontogenéticas são tão
não têm características físicas comuns, então pervasivas que nunca devemos desconsiderá-las,
qualquer abordagem que olhe para as proprie quando estamos tentando identificar as origens
dades do estímulo para definir como tal classe do comportamento. A estrutura do comportamen
foi formada pode fracassar (Lakoff, 1987). É ne to é determinada por contingências, mas as con
cessário, em vez disso, olhar para os processos tingências são determinadas, por sua vez, pela
que criaram essas classes, e a única característi estrutura ambiental.
ca consistentemente comum de seus membros
são as contingências nas quais eles se inserem.
Acabamos de argumentar que contingências
comuns podem criar as classes funcionais arbi Seção C Fontes do Comportamento Novo
trárias denominadas operantes. Mas quando
membros da classe de fato partilham as mesmas Um tema presente nas discussões de muitos
propriedades físicas, classes funcionais não-ar- dos exemplos que consideramos é de onde vem
174 A . C harles C a t a n ia
o comportamento novo. A seleção ontogenética Consideremos o seguinte exemplo (cf. Esper,
deve dispor de variações sobre as quais realizar 1973, e ver Capítulo 15). Suponhamos que ar
seu trabalho e, assim, é de especial interesse iden ranjamos uma matriz de três por três discos pró
tificar as fontes da novidade e da variação. ximos a uma janela, na qual podemos projetar,
Identificamos um método para produzir o para um pombo, estímulos de diferentes cores,
comportamento novo, quando examinamos a mo formas e tamanhos. Primeiro restringimos o bi
delagem no Capítulo 7, e um outro quando exa car do pombo à linha do meio dos discos na
minamos o esvanecimento no Capítulo 8. Tam matriz, e fazemos o alimento ser contingente a
bém vimos que a novidade e a variabilidade eram, bicadas na esquerda, se o estímulo na janela for
por si mesmas, propriedades do comportamento vermelho, a bicadas no disco do meio, se o estí
que podem ser reforçadas (p. ex., Neuringer, mulo for azul, e a bicadas na direita, se o estí
1986; Page & Neuringer, 1985; Pryor, Haag, & mulo for verde. Depois que o desempenho do
O’Reilly, 1969). Mas essas não são as únicas pos pombo tiver se tomado acurado em relação à cor,
sibilidades, como descobrimos quando explora restringimos as bicadas do pombo à coluna do meio
mos as classes de equivalência e as classes de dos discos e agora tomamos a comida contingente
ordem superior. Os testes de equivalência têm a uma bicada em cima, se o estímulo for um círcu
demonstrado relações emergentes, relações que lo azul, a uma bicada no meio, se for um quadrado
emergem sem treino explícito. Por exemplo, de azul, e a uma bicada em baixo, se for um triângulo
pois dos emparelhamentos arbitrários AB e AC, azul. E depois que o desempenho do pombo tiver
crianças de modo geral desempenharam acura se tomado acurado com respeito à forma, restrin
damente emparelhamentos envolvendo outras re gimos suas bicadas apenas ao disco do meio da
lações que nunca haviam visto antes, como BA, matriz e reforçamos o bicar rápido, se o estímulo
AC ou CA. E um de nossos critérios para cha for um quadrado azul grande, o bicar moderado,
mar uma classe de um operante de ordem supe se for um quadrado azul médio, e o bicar devagar,
rior era a emergência de novas instâncias. Por se for um quadrado azul pequeno.
exemplo, uma maneira de dizer se um desempe Teremos criado três classes de operantes dis
nho de emparelhamento com o modelo se quali criminados, baseados, respectivamente, na cor,
fica como um emparelhamento de identidade é na forma e no tamanho. Agora a questão é o que
verificar se o emparelhar se generaliza para no acontecerá quando deixarmos todos os discos da
vos estímulos, como no emparelhamento de for matriz disponíveis e apresentarmos combinações
mas, depois do treino com cores. De modo se de cor, forma e tamanho que o pombo nunca viu
melhante, uma maneira de dizer se as imitações antes. Se apresentarmos um círculo azul peque
de uma criança aos comportamentos apresentados no, o pombo bicará devagar, no disco do meio,
como modelo se qualificam como uma classe de da linha de cima? Se apresentarmos um quadra
ordem superior é verificar se a criança imita ações do grande verde, o pombo bicará depressa, no
que nunca foram modeladas antes. disco do meio, da coluna da direita? E se apre
Muitos exemplos de comportamento novo sentarmos um triângulo médio vermelho, o pom
envolvem implicitamente a combinação nova de bo bicará com uma taxa moderada, no disco da
classes já existentes. Nosso exemplo da transfe esquerda, na linha de baixo?
rência de função entre os membros de classes de O exemplo é hipotético e, se a adução ocorre
equivalência envolveu a combinação de operan com qualquer nova combinação de dimensões
tes discriminados (atravessar a rua diante da pa de estímulos em particular, isso dependerá dos
lavra falada vá e parar diante da palavra falada detalhes do treino, da seqüência dos vários está
pare) com classes engendradas por relações de gios do procedimento, da acurácia do desempe
equivalência (vá e luzes verdes nos semáforos, e nho do pombo no momento em que os testes são
pare e luzes vermelhas nos semáforos). A novi conduzidos e de outros detalhes. Por exemplo,
dade que tem origem na junção de operantes se provavelmente ajudaria, depois do teste de cada
parados tem sido denominada adução (Andro- nova combinação de estímulo, adicionar esta di
nis, 1983; Johnson & Laying, 1992). mensão ao conjunto de estímulos envolvidos no
A p r e n d iz a g e m 175
treino por algum tempo, antes de prosseguir para pombos, poderíamos ser capazes de encontrá-la
um novo teste. As condições acima envolvem em outros contextos. Por exemplo, uma criança
27 possíveis combinações de estímulos e as con que tenha aprendido a identificar as cores e que
dições de treino envolveram apenas 7 delas; a possa distinguir um cavalo de outros animais,
transferência para uma nova combinação, pro certamente, será capaz de identificar um cavalo
vavelmente, seria muito mais efetiva depois que de cor diferente ao vê-lo pela primeira vez. De
o pombo tivesse dominado 20 ou mais das com fato, veremos nos Capítulos 14 e 15 que a ocor
binações de estímulo do que apenas depois das rência conjunta de diferentes dimensões de res
7 originais. É possível, também, que a transfe posta, dadas novas combinações de estímulos
rência para as novas combinações tome-se mais discriminativos, é uma propriedade importante
provável à medida que os níveis de acurácia se do comportamento verbal humano. Além disso,
tomem mais elevados no treino (cf. Johnson & o que temos considerado até aqui pode consti
Laying, 1992, sobre fluência). tuir apenas uma parcela das fontes de comporta
Em qualquer caso, tal treino ao longo dessas mento novo. De fato, nossos vários exemplos
três dimensões de estímulos e de respostas é cer sugerem que a taxonomia dos processos que
tamente exeqüível (cf. Catania & Cerutti, 1986). podem gerar o comportamento novo ainda não
Mas mesmo que, com esses procedimentos, não foi esgotada.
fôssemos capazes de demonstrar a adução em
176 A. C harles C a t a n ia
Esquemas de Reforço
1 0
A. Esquemas de Razão Variável e de Intervalo é o reforço de cada resposta dentro da classe ope
Variável rante, é a exceção mais do que a regra. Por isso,
Esquemas Acoplados devemos examinar os efeitos dos esquemas de
Contenção Limitada (Limited Hold) reforço, arranjos que especificam que respostas,
Esquemas de Reforço e Causação dentro de uma classe operante, serão reforçadas.
B. Esquemas de Razão Fixa e de Intervalo Fixo Os três tipos mais básicos de esquemas são
Atraso de Reforço (1) aqueles que permitem que uma resposta seja
reforçada depois de algum número de respostas
C. A Terminologia dos Esquemas de Reforço (Esquemas de razão); (2) os que permitem que
uma resposta seja reforçada depois de um tempo
transcorrido, desde algum evento anterior (Es
A palavra schedule (esquema) é derivada do inglês quemas de intervalo); e (3) aqueles que permi
medieval sedule, um pedaço de pergaminho ou pa
pel, que, por sua vez, é derivado do latim scheda, tem que uma resposta seja reforçada, dependen
folha de papiro e do grego skhizein, to split (divi do da taxa ou do espaçamento temporal das res
dir). A raiz indo-européia skei-, to cut (cortar) ou to postas prévias (esquemas que reforçam diferen-
split (dividir), relaciona schedule a schizo-, como cialmente a taxa ou tempos entre as respostas).
em schizofrenia (esquizofrenia) e a Science (ciên As exigências de número, taxa e tempo também
cia) e conscious (consciência), do latim scire, to
know (saber), saber no sentido de ser capaz de sepa podem ser combinadas de diversas maneiras,
rar uma coisa da outra. para produzir esquemas mais complexos. Con
sideramos os esquemas de intervalo no Capítulo
Nem todas as classes de respostas têm con 8 e os esquemas de reforço diferencial no Capí
seqüências consistentes. O reforço de algumas tulo 7. Neste capítulo nos concentraremos nos
respostas, mas não de outras, chamado de Re esquemas de razão e em algumas propriedades
forço intermitente ou parcial, é uma caracterís dos esquemas de intervalo que estavam além do
tica geral do comportamento. Encontrar um pro escopo do Capítulo 8. Vamos nos preocupar com
duto particular não é conseqüência invariável de os efeitos dos esquemas de reforço não apenas
ir a um supermercado; obter uma resposta nem como instrumentos experimentais valiosos, mas
sempre é uma conseqüência de se fazer uma per também como propriedades ubíquas do compor
gunta. Pense em fazer uma ligação telefônica tamento em si mesmo (cf. Ferster & Skinner,
para um amigo. Algumas vezes, essa resposta é 1957; Schoenfeld & Cole, 1972).
reforçada pela oportunidade de falar com o ami Voltemos ao exemplo do telefone. Suponha
go; outras vezes o amigo não atende, a linha está mos que você telefone para um amigo que não
ocupada ou a chamada é atendida pela secretá tem secretária eletrônica e não obtenha respos
ria eletrônica. O reforço contínuo ou regular, que ta. A probabilidade de obter uma resposta mais
tarde vai depender do momento e não do núme tes pessoas, a fim de obter fundos para uma obra
ro de vezes que você ligar. Seu amigo irá aten de caridade ou para uma campanha política. Se
der somente se você ligar quando ele estiver no alguma chamada em particular é respondida, isso
local; se seu amigo não estiver, não faz qualquer depende de quando você liga, mas o número de
diferença o número de vezes que você tenta li doações que será obtido dependerá do número
gar. Da mesma maneira, suponhamos que a liga de ligações feitas. Do ponto de vista de se uma
ção receba um sinal de ocupado. O fato de ligar chamada é respondida, as contingências são
de novo não vai interferir na duração do sinal de aquelas de esquemas de intervalo; mas, se con
ocupado. Vai passar um período variável de tem sideramos a obtenção de doações, as contingên
po, que depende de quanto o amigo utiliza o te cias são as de esquemas de razão. Além disso,
lefone. Para obter uma resposta, você tem que quando se está fazendo as chamadas telefônicas,
ligar na hora certa. Esses casos são aproxima faz diferença se sua última ligação teve como
ções dos esquemas de reforço em Intervalo Va resultado não obter uma resposta ou se a linha
riável ou VI (yariable interval) na vida quotidi estava ocupada; telefonar para alguém que man
ana. Esses esquemas reforçam uma única res tém um esquema irregular difere de ligar para
posta que ocorre após a passagem de um perío um endereço comercial que abra, impreterivel
do determinado de tempo, e este período varia mente, em um determinado horário; ligar depois
de uma ocorrência para outra; as respostas que de um sinal de ocupado, para alguém que deixa
ocorrem antes do término do intervalo não têm efei a linha livre, difere de ligar para um número ati
to. Um esquema de VI é designado pelo tempo vo, no qual a linha não permanece aberta por
médio para a disponibilidade de um reforçador. muito tempo.
Vejamos agora uma situação diferente. Te
mos que fazer uma ligação de um telefone pú
blico, mas não temos ficha. Podemos tentar com
prar uma ficha com alguém que passa e conse Seção A Esquemas de Razão Variável e
guir. Nesse caso, obter a ficha não depende de de Intervalo Variável
quando você faz isso. De fato, somente algumas
poucas pessoas estarão dispostas a vender a fi Em um esquema de razão variável ou VR, a
cha. Teremos que continuar perguntando, até en apresentação de um reforçador depende da emis
contrarmos uma dessas pessoas. Podemos ter su são de um número variável de respostas, inde
cesso depois de solicitar à primeira pessoa ou pendentemente da passagem de tempo. Em um
pode ser necessário pedir a duas pessoas ou mais. esquema de intervalo variável ou VI, a apresen
Em outras palavras, conseguir a ficha depende tação de um reforçador depende da passagem de
do número de vezes que você pede, e esse nú um período variável de tempo e da emissão de
mero varia de uma ocasião para outra. Tais es uma única resposta; as respostas que ocorrem
quemas são chamados de razão variável ou VR. antes do final do intervalo não têm efeito. Algu
São designados pelo número médio de respos mas propriedades das contingências programa
tas exigidas por reforçador ou, em outras pala das por esquemas de VI e VR são ilustradas pe
vras, a razão média de respostas por reforçador. los registros cumulativos hipotéticos da Figura
Na revisão que se segue, iremos nos concen 10.1. Três curvas que poderiam ter sido produ
trar em respostas simples, como as bicadas de zidas por um esquema de razão variável de 100
um pombo no disco, e em reforçadores simples, respostas (VR 100) são mostradas à esquerda (A,
como as apresentações de alimento. É importante B e C); três curvas que poderiam ter sido produ
lembrar, porém, que a aplicação precisa da lin zidas por um esquema de intervalo variável de
guagem dos esquemas de reforço a situações fora lmin (VI lmin) são mostradas à direita (D, E e
do laboratório requer que especifiquemos cui F).
dadosamente as repostas e os reforçadores que Geralmente, um esquema de razão variável é
entram em tais contingências. Por exemplo, con programado por um computador que seleciona
sideremos a resposta de telefonar para diferen aleatoriamente as respostas a serem reforçadas;
178 A . C harles C a t a n ia
Tempo (Minutos) ------ ►
FIGURA 10.1 Segmentos hipotéticos de registros cumulativos do responder mantido por um esquema de razão
variável de 100 respostas (VR 100) e por um esquema de intervalo variável 1 minuto (VI lmin). A tira vertical à
esquerda da escala de respostas para VR e a tira horizontal abaixo da escala de tempo para VI representam partes
de fitas perfuradas, empregadas para selecionar as respostas a serem reforçadas (mas, os laboratórios modernos
usariam computadores para programar esses esquemas). Os três registros à esquerda (A B C) mostram que a taxa
de respostas em VR afeta a taxa de reforço, mas não o número de respostas por reforçador; os três registros à
direita (D E F) mostram que a taxa de respostas em VI afetam o número de respostas por reforço, mas não a taxa
de reforços.
A p r e n d iz a g e m 179
arranjos possibilitavam que as respostas fossem um esquema que pode ser usado para estudar os
reforçadas após algum tempo ter transcorrido, e efeitos de outras variáveis, como drogas ou po
não depois de algum número de respostas. Uma luentes químicos (cf. Capítulo 8, sobre gradien
porção de uma dessas fitas é apresentada acima tes de controle de estímulo). Um esquema real
da escala do tempo, à direita da Figura 10.1. Mais de VI lmin, com um pombo bicando um disco,
uma vez, a figura mostra a correspondência en provavelmente, produz um desempenho com a
tre os orifícios da fita e as respostas reforçadas, taxa de respostas moderadas similar ao visto no
indicadas pelas marcas nos registros. registro D. Note-se que a taxa moderada do re
Sempre que o interruptor era operado em um gistro em D não é muito diferente daquela taxa
esquema de VI, a fita parava até o reforço ser observada no registro do esquema de VR, no re
apresentado; neste ponto, dizia-se que o reforço gistro C. Um esquema de DRL 10 s, como dis
estava disponível, no sentido de que a próxima cutido no Capítulo 7, provavelmente produziria
resposta seria elegível para produzir um refor- um registro com taxa baixa, como no registro de
çador. Um método alternativo, agora utilizado esquema de VI, no registro F. O ponto importante
quando os esquemas de VI são programados em é que os vários registros apresentados nesta figura
computador, consite em gerar pulsos com taxa mostram como diferentes taxas de respostas afe
constante e selecionar, aleatoriamente, uma cer tam as taxas de reforços, dados os esquemas de
ta proporção deles para programar um reforça- VR ou VI; eles não representam desempenhos tí
dor para a próxima resposta; por exemplo, se picos produzidos por cada um dos esquemas.
pulsos a uma taxa de l/s são selecionados com Taxas de respostas mantidas por esquemas
uma probabilidade de 0,1, a disponibilidade do de VI e VR são ilustradas nas Figuras 10.2 e 10.3.
reforço iria ser criada uma vez a cada 10 s em Ambas as figuras mostram os dados obtidos com
média, programando dessa forma um esquema as respostas de bicar o disco, por pombos, refor
de V I 10 s. Esquemas programados deste modo çadas por comida. Na Figura 10.2, a taxa de bi
são chamados esquemas de Intervalo Randômi- car é representada como uma função da razão,
co ou esquemas de R I . programada por um esquema de VR, ou seja, do
Os registros de D a F, da Figura 10.1 ilus número de respostas por reforçador. Em VR1
tram uma importante propriedade dos esquemas (ponto mais à esquerda) todas as respostas são
de VI: mesmo que as taxas de respostas nos três reforçadas. Mesmo excluindo-se a duração do
registros sejam consideravelmente diferentes, reforço, o responder é pouco maior que 25 res
todos eles incluem o mesmo número de reforça- postas por minuto. A taxa de respostas é subs
dores. Esse esquema fornece uma taxa de refor tancialmente maior em VR 10 (segundo ponto)
ço relativamente constante para uma variedade e atinge o máximo, mais de 200 respostas por
substancial de possíveis taxas de respostas. Con minuto, em VR 50. A taxa de respostas, a se
tudo, os reforçadores não são apresentados a não guir, diminui gradualmente, com aumentos no
ser que as respostas ocorram. Desta forma, a fre tamanho da VR.
qüência de reforçadores produzidos por respos Na Figura 10.3, a taxa de bicar é representa
tas será menor do que a especificada pelo esque da como uma função da taxa de reforços forne
ma de VI se o intervalo entre as respostas suces cida por um esquema de VI (p. ex., VI 1 min
sivas se tornar longo em relação ao intervalo fornece, no máximo, 60 reforços por hora). A
entre os reforçadores programados. taxa de bicar aumentou em função da taxa de re
Na prática, com classes de respostas como forços, mas a função foi negativamente acelerada;
as bicadas de um pombo, as diferenças entre as a mudança na taxa de respostas produzida por uma
taxas de reforços programadas e as taxas reais dada mudança na taxa de reforços tomou-se me
obtidas, geralmente, são pequenas. Essa indepen nor à medida que a taxa de reforços aumentou.
dência relativa entre a taxa de reforços e de res As duas figuras mostram que os esquemas
postas, associada à taxa de respostas relativamen de VR e VI diferem consideravelmente. Por
te constante que ele produz, faz com que o es exemplo, as diferentes escalas, no eixo das or
quema de VI seja o preferido como linha de base, denadas de ambas figuras, mostram que as taxas
180 A. C harles C a t a n ia
Respostas por minuto
A p r e n d iz a g e m 181
de respostas em VR são maiores que em VI, ao reforço em VR, em geral, também produz tran
longo da maior parte dos valores de cada esque sições abruptas de taxas altas de respostas para
ma; as taxas em VR freqüentemente ultrapassam períodos sem respostas (um padrão de acelera
200 respostas/min, enquanto as taxas sob esque ção de respostas seguido por uma pausa e nova
ma de VI raramente excedem 100 respostas/min. mente por aceleração das respostas - break-and-
Mesmo assim, os efeitos detalhados de cada es rurí). Com os esquemas de VI, por outro lado,
quema podem variar com outras condições. Por uma taxa alta de reforços produz um responder
exemplo, as formas das funções podem ser afe mais alto do que um VI com uma baixa taxa de
tadas pelo fato do organismo receber toda sua reforços (cf., V I 1 min e V I 15 min) mas, em am
comida exclusivamente durante as sessões expe bos os casos, o responder se distribui de uma ma
rimentais ou se recebe algum alimento fora das neira razoavelmente uniforme ao longo do tempo.
sessões (essas duas situações têm sido denomina Além disso, a extinção após o reforço em VI pro
das economias fechadas e abertas: Hursh, 1980). duz decréscimos graduais na taxa de respostas, di
Os esquemas de razão e de intervalo também ferente do padrão de pausas e de aceleração obser
diferem na maneira como o desempenho é afe vado na extinção depois do reforço em VR.
tado quando o reforço é reduzido ou interrompi Quais são as propriedades dos esquemas de
do. Os registros acumulados idealizados da Fi VI e de VR responsáveis pelas diferenças nos
gura 10.4 ilustram o responder mantido por es desempenhos que eles geram? Parece razoável
quemas de VR e de VI e o responder durante a que os esquemas de VR deveriam produzir ta
extinção, após o reforço em VR ou em VI. No xas mais altas de respostas do que os esquemas
reforço em VR, a taxa de respostas diminuiu com de VI; as apresentações do reforçador tomam-
razões maiores (cf. VR50 e VR1000). Esse de se mais freqüentes quando o responder em VR
créscimo em razões altas ocorre, em parte, por aumenta, o que não ocorre com o responder em
que o responder começa a ser interrompido por VI. Porém, em ambos os esquemas, a separação
longas pausas (o aparecimento de pausas longas entre os reforçadores sucessivos é variável, então,
durante o desempenho em razão, às vezes, é cha como essas relações diferentes entre o responder e
mado de distensão da razão). A extinção após o os reforçadores afetam o comportamento?
182 A. C harles C a t a n ia
ESQUEMAS ACOPLADOS De forma inversa, o número de respostas por
reforçador pode ser igualado para os dois esque
O procedimento de câmaras acopladas (Fers- mas, fazendo com que o número de respostas
ter & Skinner, 1957) permite o estudo de algu emitidas para cada reforçador, por um pombo,
mas variáveis que atuam nos esquemas. Em câ determine as razões de um esquema de VR para
maras acopladas, o desempenho de um organis um segundo pombo. Nesse caso, as bicadas do
mo em uma caixa determina os eventos que ocor segundo pombo são mantidas por um esquema
rerão na caixa de um segundo organismo. O pro de VR, no qual as razões sucessivas são iguala
cedimento pode ser usado para igualar as taxas das àquelas produzidas pelo desempenho em VI,
de reforços em esquemas de VR e de VI: cada do primeiro pombo.
reforçador produzido pelas bicadas de um pom Registros acumulados de ambos os tipos de
bo em VR, programa um reforçador em VI para acoplamento são mostrados na Figura 10.5 (Ca
a próxima bicada, para um segundo pombo. Em tania e col., 1977). Com um grupo de pombos,
outras palavras, as bicadas do segundo pombo pares de sujeitos eram atribuídos a esquemas
são mantidas por um esquema de VI, no qual os acoplados nos quais o número de bicadas de um
intervalos sucessivos entre os reforços igualam- pombo, por reforçador, em um esquema de VI
se àqueles produzidos pelo desempenho em VR, 30 s, gerava um esquema de VR para um segun
do primeiro pombo. Nessas circunstâncias, o dois do pombo, conforme ilustrado pelos pombos 402
esquemas diferem quanto ao número de respos e 410. Para um outro grupo, pares eram atribuí
tas por reforçador, mas não quanto ao intervalo dos a esquemas acoplados nos quais os interva
de tempo entre os reforçadores sucessivos. los entre os reforços de um pombo em esquema
FIGURA 10.5 Registros acumulados da terceira sessão do procedimento acoplado para dois pares de pombos. As
respostas por reforço em VI, para o pombo 402, produziam um esquema acoplado de VR para as bicadas do pombo
410. Os intervalos entre os reforços em VR, para o pombo 414, produziam um esquema acoplado de VI para as
bicadas do pombo 406. Ai setas horizontais que ligam os registros da esquerda mostram a correspondência entre
o número de respostas por reforço para aquele par de esquemas; as setas verticais que ligam o par de registros da
direita mostram a correspondência de intervalos entre os reforços. Em ambos os casos, a taxa de respostas em VR
fo i maior do que em VI. (Catania, Mattews, Silverman, & Yohalem, 1977, Figura 1)
A p r e n d iz a g e m 183
le VR 25 geravam um esquema de VI para um quemas de DRL programam explicitamente o re
segundo pombo, como ilustrado pelos pombos 414 forço diferencial de longos IRTs, desenvolve-se,
e 406. Os esquemas de VR produzem taxas mais de maneira relativamente lenta, um responder
altas que os esquemas de VI, independentemente temporalmente espaçado, que não é consistente
de estar o VR acoplado ao VI ou o VI ao VR. Mais com a separação rápida das taxas de resposta nos
ainda, a diferença aparece rapidamente: os regis esquemas de VR e VI acoplados.
tros são da última de apenas três sessões de 50
reforços cada. O fenômeno é tão fidedigno que os
registros das Figura 10.5 foram obtidos em um Contenção Lim itada (Limited Hold)
exercício rotineiro de laboratório, em um curso de
graduação de Psicologia Experimental. Uma contingência temporal freqüentemente
O experimento de caixas acopladas mostra acrescentada aos esquemas é a chamada de con
que a diferença de taxas entre os esquemas de tenção limitada (limited hold ou LH). Com a con
VR e VI não pode ser atribuída, exclusivamen tenção limitada, um reforçador programado per
te, às respostas por reforçador ou ao tempo por manece disponível apenas por um período limi
reforçador, uma vez que a diferença entre as ta tado de tempo; se nenhuma resposta ocorrer neste
xas permanece, mesmo quando essas variáveis período, o reforçador é perdido. Novamente, a
são as mesmas em ambos os esquemas. Uma ação de telefonar serve como ilustração. Se ob
outra possibilidade é que, mesmo com o acopla tivermos um sinal de ocupado em uma linha so
mento, a taxa de reforços, em média, mude com brecarregada, é possível que não consigamos
a taxa de respostas em esquemas de VR, mas mais completar a chamada e sermos atendidos à
não nos de VI. Pode-se argumentar que o orga medida que o tempo passa, porque a linha nunca
nismo simplesmente aprende que responder mais permanece livre por muito tempo. Se a linha des
rápido produz reforço mais rápido em VR, mas te tronco sobrecarregado tornar-se ocupada no
não em esquemas de VI. vamente apenas uns poucos segundos após al
Uma outra possibilidade deriva de uma rela guém desligar, o esquema será um VI com uma
ção entre os intervalos entre as respostas (IRTs) contenção limitada. A probabilidade de se con
e a probabilidade de reforço (Anger, 1956). O seguir a ligação será maior se a pessoa que cha
intervalo entre as respostas ou IRT é apenas o ma desligar imediatamente após ouvir o sinal de
tempo entre duas respostas sucessivas (cf. esque ocupado e discar de novo. Nesse exemplo do te
mas de DRL, no Capítulo 7). Nos esquemas de lefone, a contenção limitada irá variar em dura
VR, a probabilidade de uma resposta ser refor ção; no laboratório, ela geralmente é constante.
çada depende apenas da razão; não varia com o Uma contenção limitada tipicamente produz au
tempo decorrido desde a resposta anterior. Por mentos nas taxas de respostas, mas uma conten
outro lado, em esquemas de VI, quanto mais tem ção muito curta pode permitir tão poucas res
po tiver transcorrido desde a última resposta, postas reforçadas que o esquema deixa de man
maior a probabilidade de que o intervalo tenha ter o responder (Hearst, 1958).
passado e, portanto, de que a próxima resposta
seja reforçada. Em outras palavras, uma propor
ção relativamente maior de IRTs longos é refor ESQUEMAS DE REFORÇO E
çada em esquemas de VI do que em esquemas CAUSAÇÃO
de VR; e, assim, os esquemas de VI reforçam
diferencialmente os IRTs longos, em relação aos Os efeitos dos reforçadores dependem das
esquemas de VR. Um aumento nestes intervalos respostas às quais se seguem, mas eventos re
maiores entre as respostas implica, necessaria forçadores podem se seguir a respostas quando
mente, em taxas mais baixas de respostas. Em produzidos por respostas ou quando apresenta
bora possa contribuir para o desempenho em es dos independentemente delas. O responder muda
quemas, o reforço diferencial de IRTs não pode da mesma maneira quando ele produz um refor
ser a história completa. Por exemplo, quando es çador ou quando é seguido acidentalmente por
184 A. C harles C a t a n ia
um evento que funciona como reforçador quan mais ou menos a cada 2 s. Por que, então, essas
do é contingente a respostas? Consideramos essa contigüidades temporais acidentais entre as res
questão quando examinamos brevemente o fe postas e os reforçadores não mantinham o res
nômeno chamado superstição (Capítulo 5). A ponder a uma taxa próxima daquela que ocorria,
citação seguinte sugere que a relação entre as quando todos os reforçadores eram produzidos
respostas e o reforçador pode ser afetada de ma por respostas?
neira diferente por contigüidades resposta-refor- Quando os reforçadores são apresentados in
çador causais ou acidentais: dependentemente das respostas, é provável que
o intervalo entre a resposta mais recente e o re
E possível que as correlações acidentais no tempo forçador varie de um reforçador para outro. Os
entre as respostas, os estímulos e os reforçadores dados de Lattal sugerem que essa variabilidade
não exerçam controle sobre o comportamento?... se contrapõe ao responder supersticioso. Mas, o
Uma das características das correlações acidentais
entre os eventos comportamentais e ambientais é a
que ocorre nos casos em que o intervalo entre a
variabilidade. Cada aspecto do comportamento pode resposta mais recente e o reforçador varia, mesmo
variar e, contudo, ser contíguo com um reforçador que o reforçador seja produzido pela resposta? Isso
independente do comportamento. Por outro lado, o ocorre, por exemplo, quando um atraso de reforço
comportamento que é instrumental deve ter ao me é acrescentado a um esquema (Dews, 1960).
nos um aspecto correlacionado mais ou menos cons
tantemente com o reforçador. Se os animais forem
Um caso é ilustrado no registro de eventos
sensíveis a essa diferença, eles poderão detectar da Figura 10.6 (à esquerda). As linhas verticais
aqueles eventos sobre os quais seu comportamento representam as respostas; as setas, os reforçado
não tem controle real. (Hermstein, 1966, pp. 42-43) res. O registro superior mostra um segmento de
um esquema padrão de VI: o intervalo termina
Em um experimento (Lattal, 1974), as bica na linha pontilhada e a próxima resposta, a, é
das de um pombo em um disco eram reforçadas seguida imediatamente por um reforçador. Um
de acordo com um esquema de VI. Quando o segmento de um esquema de VI, ao qual foi
desempenho em VI estava bem-estabelecido, o acrescentado um atraso de reforço de 3 s, é mos
esquema foi mudado: ao final de alguns interva trado no registro do meio: o intervalo termina na
los, o reforçador era apresentado imediatamen linha pontilhada, e a resposta b produz um re
te, sem se considerar o responder. A taxa de res forçador 3 segundos mais tarde. O intervalo en
postas diminuiu com a diminuição da porcenta tre a última resposta e o reforçador, c, é menor
gem de reforçadores produzidos pelo responder. do que o período de atraso, d, porque outras res
Quando a porcentagem de reforços produzidos postas ocorrem durante esse período; o interva
pelas respostas era zero, de modo que toda a co lo entre a resposta e o reforçador varia depen
mida era completamente independente do com dendo do espaçamento de respostas durante o
portamento, as taxas de respostas se aproxima atraso. O registro inferior mostra um trecho de
ram de zero. Essa diminuição na taxa de respos um esquema que fornece reforçadores indepen
tas tem implicações interessantes. Por exemplo, dentemente da respostas (tecnicamente, esse é
quando 33% dos reforçadores eram produzidos um esquema de Tempo Variável ou VT): quando
por respostas, a taxa de respostas era aproxima o intervalo termina, na linha pontilhada, o refor
damente a metade daquela quando todos os re çador é apresentado, e o intervalo (e) entre a úl
forçadores eram produzidos pela resposta; mas tima resposta e o reforçador varia porque este é
mesmo o pombo com a menor taxa de respostas apresentado independentemente da resposta.
respondia cerca de 30 vezes por minuto ou a uma O gráfico de barras, na Figura 10.6 mostra
taxa de uma resposta a cada 2 s. Um terço dos dados de três pombos, obtidos com esses esque
reforçadores (reforçadores produzidos por res mas (Sizemore & Lattal, 1977). As taxas de bi
postas) seguiam imediatamente as respostas, e car mantidas pelo VI com atraso ficaram entre
todos os outros tinham uma probabilidade de as taxas moderadas mantidas pelo esquema de
seguir a última resposta dentro de um ou dois VI, e as taxas baixas, mantidas pelos reforçado
segundos, se as respostas estivessem ocorrendo res independentes da resposta do esquema de VT.
A p r e n d iz a g e m 185
□ vi
VI
VI com atraso
1 i.l
■ VT
VI com atraso c
\*>
I I hl i r i i
~d T
VT e !
1 1 i 11 t 11 1
Segundos-
4
I 'll
Pombo 33 Pombo 61
(atraso de 6s) (atraso de 3s) (atraso de 3s)
FIGURA 10.6 Segmentos hipotéticos de registros de eventos de esquemas de reforço em VI, VI com atraso e VT
(esquerda); e taxas de respostas de bicar o disco, para três pombos, mantidas por esses esquemas (direita). Aí
taxas de respostas mais altas foram mantidas pelo reforço em VI e as mais baixas pelo VT. (Adaptado de Sizemore
& Lattal, 1977, Tabela 1)
Acabamos por concluir que a diferença entre VI a causalidade dependem não de conjunções cons
e VT deve depender, de alguma forma, dos in tantes de eventos, mas de uma amostragem de con
tervalos variáveis entre a última resposta e o re- tingências que, às vezes, são muito complexas.
forçador (c e e). Então, por que as taxas produ A pesquisa sobre os efeitos de contingências
zidas por reforço em VI com atraso são maiores mostra o quanto os organismos são sensíveis às
do que aquelas produzidas por reforço em VT? conseqüências de seu próprio comportamento.
Essas questões permanecem abertas à análi Essa sensibilidade pode depender das relações
se experimental. Os diferentes efeitos dos refor- detalhadas ou moleculares entre as respostas e
çadores dependentes e independentes das respos os reforçadores ou das propriedades globais ou
tas dependem, de uma forma complexa, de como molares de taxas de respostas e de reforçadores,
as correlações entre os eventos são integradas e mesmo de ambas em combinação (cf. Capítulo
no tempo. A complexidade talvez seja melhor 6). A distinção entre os eventos causados pelo
ilustrada por uma analogia humana (cf. Catania comportamento e os eventos acidentalmente cor
& Keller, 1981).Senaportade um elevador não relacionados com o comportamento é central
existe uma indicação do andar, a única conse para os nossos conceitos de causação. Por esse
qüência de nosso comportamento de apertar o motivo, o estudo dos esquemas de reforço é es
botão para chamar o elevador pode ser a sua che sencial. As demonstrações de que seres huma
gada, após um período de atraso. Mas o eleva nos são igualmente sensíveis às conseqüências
dor pode chegar também porque, antes de nós, de seu próprio comportamento podem ter signi
alguém apertou o botão e depois subiu pela es ficado não apenas prático, mas também teórico.
cada; ou porque alguém, dentro do elevador, Por exemplo, em tarefas de vigilância, como ob
apertou o botão para aquele andar; ou porque o servar uma tela de radar, a detecção e o relato de
elevador sempre retorna àquele pavimento após um sinal podem ser usados para reforçar o com
ter atendido a outros chamados. Um dia, a porta portamento de observar a tela. Uma taxa alta de
do elevador pode se abrir exatamente no momen observação é mantida se um observador tem um
to em que alcançamos o botão para apertá-lo; botão que ilumina a tela e sinais detectáveis são
em outra ocasião, ele pode chegar, ir embora e apresentados, em esquema de VR, após as pres
chegar de novo, mesmo que, por algum motivo, sões a este botão; este observador vai detectar
não tenhamos apertado o botão durante esse pe com mais precisão alvos reais, não programados
ríodo. Quando o elevador chega, podemos não pelo experimentador, do que um observador sen
ter certeza se isso se deve à nossa chamada. Con tado em frente a uma tela de radar continuamente
tudo, provavelmente continuaremos a apertar o iluminada, na ausência de um esquema semelhan
botão de elevadores. Nossos julgamentos sobre te (Holland, 1958; ver também Capítulo 15).
186 A. C harles C a t a n ia
aumenta com aumentos no valor da FR (Felton
Seção B Esquemas de Razão Fixa e de
& Lyon, 1966). A pausa é chamada pausa pós-
Intervalo Fixo
reforço ou PRP, mas pode ser mais apropriado
pensar nela como uma pausa pré-responder: por
Se a probabilidade de uma resposta ser re exemplo, as pausas em FR ocorrem tão consis -
forçada for maior em alguns momentos do que tentemente quando uma razão começa depois de
em outros, é provável que a taxa de respostas um estímulo, como quando ela começa depois de
seja maior nestes momentos do que nos outros um reforço ser produzido ao fim da última razão.
(Catania & Reynolds, 1968). Suponhamos, por Uma vez começado, após a pausa pós-refor
exemplo, que a maioria dos intervalos em um ço, o responder ocorre, tipicamente, em uma taxa
esquema de VI seja de 10 segundos e que os in alta e sem interrupção, até que o reforçador seja
tervalos restantes estejam entre 50 e 100 segun apresentado (pausas e taxas altas em FR são ou
dos. Provavelmente, a taxa de respostas será tro exemplo do responder alternado com pau
maior cerca de 10 segundos após o reforço e, se sas; cf. esquemas de VR). O grau de coesão com
uma resposta não for reforçada, a taxa pode en o qual o responder em FR se mantém, uma vez
tão decair pelos próximos 20 ou 30 segundos, iniciado, sugere que uma seqüência de FR deve
antes de aumentar novamente. Falamos, princi ser encarada como uma unidade comportamen-
palmente, de esquemas de VI e VR planejados tal em si mesma e não apenas como uma suces
para manter a probabilidade de reforço aproxi são de respostas.
madamente constante ao longo do tempo (no VI) O tratamento do desempenho nos esquemas
ou do número de respostas (no VR). Mas, po como unidades de respostas em si mesmas le
dem-se programar esquemas nos quais o núme vou ao desenvolvimento de esquemas de refor
ro de respostas por reforçador ou o intervalo para ço de ordem superior. Por exemplo, se o reforço
disponibilidade de um reforçador seja constante depende de se completar um número variável de
de um reforço para outro; tais esquemas são cha razões fixas, a programação consite em um es
mados, respectivamente, de razão fixa ou FR e quema de segunda ordem no qual esquemas de
de intervalo fixo ou FI (além desses, esquemas FR sucessivas são reforçados de acordo com um
nos quais o intervalo entre as apresentações su esquema em VR (p. ex., Findley, 1962). Uma
cessivas de reforçadores independentes da res análise do desempenho no componente em tais
posta é constante são chamados de tempo fixo esquemas está relacionado com a estrutura do
ou FT). Uma propriedade importante dos esque comportamento e é análogo ao exame das pro
mas fixos é que eles introduzem períodos discri priedades que definem uma classe operante (c.f.
mináveis, durante os quais não ocorrem reforça Capítulos 7 e 11).
dores. Em geral, o desenvolvimento do responder
Vamos ver primeiramente os esquemas de em FR ocorre tão rapidamente que seus detalhes
razão fixa ou FR. Nesses esquemas, a última res não podem ser vistos com facilidade. A Figura
posta de uma série fixa é reforçada. Por exem 10.7, entretanto, mostra um exemplo de desen
plo, se uma máquina de refrigerante funciona volvimento gradual do responder em FR. Em
apenas com moedas de 25 centavos, e o refrige uma caixa de condicionamento para pombos
rante que se quer custa R$ 1,00, ao inserir a quar equipada com dois discos, as bicadas do pombo
ta moeda você completa uma razão fixa de exa em um disco eram reforçadas de acordo com um
tamente quatro respostas (supondo que a máqui esquema de FR 100, enquanto um esquema de
na esteja funcionando bem). Cada razão fixa ter VI vigorava concorrentemente na outra chave.
mina com um reforçador. A contagem não reco O esquema de VI em vigor neste disco retardou
meça se o responder em FR é interrompido. A o desenvolvimento de um desempenho típico de
primeira resposta da razão nunca é reforçada; FR e tomou possível examiná-lo em câmara len
assim o responder em FR consiste tipicamente ta; a mudança no padrão temporal, que geral
de uma pausa, seguida por uma alta taxa de res mente emerge em duas ou três sessões, deman
postas. A duração média das pausas pós-reforço dou mais de 150 sessões. Nas primeiras sessões,
A p r e n d iz a g e m 187
FIGURA 10.7 Desenvolvimento do desempenho em FR 100para bicadas de um pombo reforçadas por comida. O
desenvolvimento comumente rápido do responder em FR fo i retardado pela operação concorrente de um esquema
de reforço em VI (não mostrado), que operava para bicadas em um segundo disco. Os segmentos dos registros
cumulativos são do início das sessões numeradas para reforço em FR.
o responder era espaçado uniformemente entre andar mais depressa. Uma característica do res
os reforçadores. Com a exposição continuada ao ponder em FI é o fato de ocorrer com taxa baixa
esquema, após os reforçadores começaram a ou zero no começo do intervalo e de aumentar à
ocorrer taxas mais baixas e, finalmente aparece medida que se aproxima o final do mesmo. De
ram as pausas. A parte da razão que consistia modo que esperaríamos que você olhasse rara
em um responder ininterrupto, em taxa alta, tor mente para o relógio no início da aula e muito
nou-se gradualmente mais longa, de modo que mais freqüentemente à medida que ela se apro
nas sessões subseqüentes, o responder continuou ximasse do final (obviamente, é possível dizer
com pouca ou nenhuma interrupção após cada outras coisas sobre os reforços envolvidos em
pausa. À medida que as sessões se sucediam, a uma aula, se ela mantém o ouvinte tão interessa
série de FRs pareceu se construir de trás para do que ele nunca olha para o relógio até que a
frente, a partir do reforçador. mesma tenha terminado).
Agora retomemos ao esquema de Intervalo Duas amostras de registros cumulativos do
Fixo ou FI: uma resposta é reforçada apenas após desempenho em FI são mostradas no Capítulo 5
a passagem de um período constante de tempo, (ver B e C , na Figura 5.6). Cada registro mostra
a partir de algum evento ambiental; as respostas uma seqüência de intervalos fixos. O padrão côn
que ocorrem antes deste momento não têm qual cavo, voltado para cima, desses registros é cha
quer efeito. Um exemplo é olhar para o relógio à mado de curvatura do FI ou padrão meia-lua.
medida que se aproxima o final de uma aula; Dependendo da quantidade de sessões de expo
neste caso, estamos supondo que o reforçador sição ao esquema FI e de outras variáveis, as
seja ver que chegou o momento de sair da classe curvaturas do FI podem mostrar transições re
sem chamar muito a atenção. Olhar para o reló lativamente abruptas de ausência de respostas
gio em momentos anteriores não faz o tempo para um responder relativamente constante,
188 A. C harles C a t a n ia
como em B, ou um aumento gradual da taxa sempenho em FI não era interrompido durante o
depois que começa o responder, como em C. O intervalo.
padrão de respostas em FI tende a ser consis Descobertas como estas levantaram questões
tente ao longo da posição relativa de cada mo sobre as contribuições relativas, para a curvatu
mento dentro do intervalo, e não da passagem ra de FI, de um gradiente de discriminação tem
de tempo em termos absolutos. Por exemplo, se poral de FI (em que as taxas de respostas dife
o responder atinge metade de sua taxa final ou rentes de um organismo, em momentos diferen
terminal em 40 s dentro de um intervalo fixo de tes do intervalo, implicariam na discriminação
100s, é provável que o mesmo ocorra em 20 s e do tempo decorrido) e um gradiente de atraso do
não em 40 s, dentro de um intervalo fixo de 50 s. reforço (no qual respostas em vários momentos
Qualquer modelo teórico do desempenho em do intervalo são consistentemente seguidas pelo
FI deve levar em consideração o fato de que a reforçador no final do intervalo). Os dois gradi
curvatura de FI se mantém, apesar das interrup entes podem existir juntos, porque responder a
ções repetidas. O fenômeno é ilustrado na Figu qualquer tempo de um intervalo depende do que
ra 10.8 (Dews, 1962). As bicadas ao disco, emi aconteceu depois daquele tempo no intervalo
tidas por 4 pombos, eram reforçadas de acordo anterior; ele não pode depender do reforço no
com um esquema de FI 500 s. O gráfico à es fim do intervalo atual, uma vez que esse reforço
querda mostra a taxa média de bicar em segmen ainda não foi apresentado.
tos sucessivos de intervalos de 50 s. Em outro
procedimento, a luz da caixa, que fornecia uma
iluminação difusa, era ligada e desligada em seg ATRASO DE REFORÇO
mentos sucessivos de 50 s ao longo do interva
lo; após o último segmento de 50 s, a luz perma A sugestão de que a curvatura de FI envolve
necia acesa até que uma bicada no final do inter algum tipo de gradiente de atraso do reforço
valo fosse reforçada. A ação de bicar não era implica que o reforço produzido pela última de
reforçada na ausência de luz, e a taxa desta res uma seqüência de respostas tem efeitos que de
posta diminuiu nestes períodos (barras escuras pendem de sua relação com todas as respostas
na Figura 10.8). Entretanto, o aumento no res precedentes, e não simplesmente com aquela que
ponder, em períodos sucessivos, quando a luz o produziu. Nos primeiros estudos sobre os es
estava acesa (barras sombreadas) tinha forma se quemas de reforço, os efeitos dos esquemas eram
melhante ao aumento que ocorria quando o de discutidos como reforço parcial e era visto como
um paradoxo que mais comportamentos pudes-
Fl e Estímulos
Adicionados
FIGURA 10.8 Taxas de bicar em períodos de 50 segundos, durante um esquema padrão de reforço em FI 500 s
(FI, esquerda) e em um esquema de FI 500 segundos no qual uma luz e sua ausência se alternavam a cada 50 s (FI
e estímulos adicionados, direita), para 4 pombos. Nos períodos em que a luz estava apagada, a taxa de respostas
era baixa e, portanto, interrompia o responder no FI. Porém, quando a luz estava acesa, a taxa aumentava de
modo exatamente igual ao do FI padrão. (Adaptado de Dews, 1962, Figura 2)
A p r e n d iz a g e m 189
sem ser gerados pelo reforço de cada fração do Algumas implicações práticas podem ser
total de respostas do que pelo reforço de cada mais importantes do que esses problemas técni
resposta especificamente. Olhar os esquemas com cos. Sabemos que os efeitos do reforço atrasado
base no atraso de reforço de todas as respostas que sobre as respostas que precedem aquela que pro
precederam a resposta reforçada, contudo, sugere duz um reforçador não se restringem a respostas
que o reforço parcial ou intermitente funciona como em uma única classe operante. Por exemplo, as
tal porque permite que cada conseqüência re bicadas de um pombo em um disco podem ser
force muitas respostas, e não apenas uma. mantidas porque elas são seguidas, posteriormen
As respostas iniciais em uma seqüência que te, por bicadas reforçadas em um outro disco
termina com um reforço contribuem menos para (Catania, 1971). Vamos considerar uma tarefa
o responder futuro do que aquelas emitidas pos que envolve respostas corretas e erros em tenta
teriormente, devido aos atrasos mais longos que tivas sucessivas (p. ex., um experimento sobre
as separam do reforço (Dews, 1962). Isso signi conceitos naturais: cf Capítulo 8). Podemos usar
fica que ao interpretar os efeitos dos esquemas, um procedimento em que todas as respostas cor
precisamos conhecer a forma do gradiente de retas serão reforçadas, e toda tentativa com erro
atraso. O gradiente de atraso tem sido descrito será repetida, até que o pombo possa responder
com sucesso com alguns modelos matemáticos de forma correta. Com esse procedimento, po
do comportamento operante (p. ex., Killeen, rém, garantimos que qualquer seqüência de er
1994), mas, certos problemas técnicos compli ros será seguida, depois de algum atraso, por uma
cam sua determinação experimental. Por exem resposta correta reforçada. As respostas corre
plo, se programamos reforçadores atrasados em tas finalmente passarão a ser dominantes, por
pregando um tempo fixo depois de uma respos que elas são seguidas mais de perto pelo refor
ta, devemos permitir que respostas adicionais çador, mas os erros podem diminuir mais lenta
ocorram neste ínterim, em cujo caso o tempo real mente e podem, até mesmo, persistir em um ní
entre a última resposta e o reforço será, freqüente vel modesto, embora eles nunca realmente pro
mente, mais curto do que aquele programado ou duzam o reforçador, porque são sistematicamente
podemos, ainda, reiniciar o atraso a cada resposta seguidos, depois de um atraso, por uma resposta
subseqüente, caso em que o reiniciar do tempo irá correta reforçada. (Os procedimentos de apren
reforçar diferencialmente pausas pelo menos tão dizagem sem erro podem ser efetivos, porque er
longas quanto o atraso do intervalo e esta diferen ros que nunca ocorrem nunca são seguidos de
ciação será confundida com os efeitos atrasados perto por um reforçador subseqüente para res
do reforçador (p. ex., Catania & Keller, 1981). E postas corretas: cf. Capítulo 8).
não podemos evitar esses problemas apresentan A moral dessa história é que os professores
do um estímulo durante o atraso, porque então es devem estar atentos para as seqüências nas quais
taremos, simplesmente, substituindo um reforça os erros dos estudantes são seguidos por corre
dor condicionado imediato por um atrasado. ções, de forma que eles não fortaleçam as res
Mais do que isso, sob muitas circunstâncias postas incorretas juntamente com as respostas
não podemos atribuir um determinado respon corretas que estão fortalecendo. Provavelmente,
der mais tardio inequivocamente a uma relação um reforçador que segue uma seqüência de res
entre respostas e reforçadores particulares. Ima postas corretas funcionará melhor do que aque
ginemos que a segunda resposta de bicar um dis le que segue uma única resposta correta depois
co, emitida por um pombo, produza um reforça de vários erros. O melhor professor será aquele
dor e, então, várias bicadas adicionais ocorrem que puder julgar se as respostas corretas são tão
em seguida. Esse responder adicional ocorreu infreqüentes que deveriam ser reforçadas, mesmo
porque o bicar foi reforçado, mas quantas des se precedidas por erros ou se são freqüentes o su
sas respostas ocorreram porque a segunda res ficiente para que o reforçador possa esperar até
posta produziu um reforço e quantas ocorreram que o estudante tenha apresentado várias respos
porque o primeiro bicar, depois de um atraso, tas corretas em uma série. Exemplos como esses
foi seguido pelo reforçador? deveriam nos lembrar que a modelagem é freqüen-
1 9 0 A . C h a r l e s C a t a n ia
temente, muito mais uma arte do que uma ciência tos da terminologia dos esquemas são lógicos,
(mas ver Galbicka, Kautz, & Jagers, 1993). mas outros são admitidamente idiossincráticos.
Por exemplo, os nomes dos esquemas de FI e VI
versus FT e VT são arbitrários (cada par pode
ria, com igual facilidade, ser denominado dura
Seção C A Terminologia dos Esquemas de ção fixa e duração variável, supostamente abre
Reforço viadas com o FD e VD). Além disso, nomes di
ferentes são correlacionados com contingências
Consideramos, até esse momento, uma va muito diferentes. Embora os esquemas de FI,
riedade de esquemas de reforço. Alguns elemen DRL e FT requeiram igualmente a passagem de
A p r e n d iz a g e m 191
um tempo constante, o que as respostas podem dor mas, se outros eventos forem programados
produzir é diferente em cada um deles. Um es entre os intervalos sucessivos, a contagem do
quema de FI não impõe restrições sobre o res tempo pode começar com a apresentação de al
ponder durante o intervalo, mas uma resposta gum estímulo, como uma cor, projetada no dis
deve ocorrer no final dele. Passa-se algum tem co do pombo). O glossário oferece detalhes adi
po, durante o qual as respostas não têm efeito e, cionais sobre os esquemas.
então, a próxima resposta é reforçada. Um es As duas primeiras colunas da Tabela 10.1
quema de DRL exige que se passe um tempo apresentam os nomes dos esquemas e suas abre
específico sem que ocorram respostas e, então, viações padronizadas. Na prática, as designações
a próxima resposta é reforçada. As respostas que de tempo ou número, geralmente, acompanham
ocorrem muito cedo têm algum efeito: elas rei as abreviações (p. ex., V I30 s, LH 5 s, DRL 10 s
niciam a contagem de tempo. Finalmente, em um e FR 50). A terceira coluna descreve as contin
esquema de FT, o reforçador é apresentado ao gências do esquema, as condições sob as quais
final do intervalo especificado, quer as respos as respostas são elegíveis para produzir reforça
tas tenham ocorrido, quer não. Nesse esquema, dores (cf., FI versus FT e DRL versus DRO). A
as respostas nunca têm efeito. Estes nomes de última coluna mostra comentários breves sobre
esquemas emergiram incidentalmente, à medida cada esquema. O vocabulário dessa tabela, apre
que a pesquisa evoluiu, e agora estão tão bem sentado com base em esquemas de reforço, tam
estabelecidos que seria difícil mudá-los. bém pode ser estendido a esquemas de punição
Das várias tentativas importantes que foram (p. ex., Azrin, 1956). A simetria entre o reforço
feitas para classificar os esquemas de reforço de e a punição, ilustrada no Capítulo 6 (na Figura
forma mais sistemática (p. ex., Schoenfeld & 6.1), aplica-se também aos efeitos dos esquemas.
Cole, 1972; Snapper, Kadden, & Inglis, 1982), Por exemplo, a superposição de um esquema de
nenhuma conseguiu passar a ter um uso geral. A punição em FI sobre o responder mantido pro
Tabela 10.1 resume alguns dos principais esque duz uma curvatura invertida, uma taxa de res
mas. As definições de esquemas aplicam-se, quer postas gradualmente decrescente, à medida que
os reforçadores sejam programados sucessiva se aproxima o final do intervalo, e não a taxa
mente e sem interrupção, quer ocorram em ten crescente que um esquema de reforço em FI ge
tativas separadas (p. ex., geralmente, o intervalo ralmente produz.
em um FI é contado a partir do último reforça
192 A. C harles C a t a n ia
Combinações de Esquemas:
Síntese Comportamental
ii
conjugado está relacionada a to juxtapose (justapor),
A. Esquem as M últiplos e Mistos
a to conjugate (conjugar), yoga (ioga) e a to yoke
Respostas de Observação
(unir, acoplar).
Interações entre Esquemas: Contraste Comportamental
194 A. C harles C a t a n ia
bo não pára de bicar durante a EXT, quando o ângulo é a característica distintiva desses estí
disco está sempre branco, mas pára quando ele mulos, e um pombo, provavelmente, adquirirá
fica vermelho). A questão pode ser colocada em essa discriminação mais rapidamente se o triân
termos de se a resposta de observação é manti gulo estiver correlacionado ao reforço (caracte
da, porque estímulos discriminativos são reforça rística positiva) do que se estiver correlaciona
dores condicionados ou porque são informativos. do com a extinção (característica negativa), por
Se a informação está envolvida, então os dois que olhar para um estímulo é uma resposta de
estímulos discriminativos deveriam ser igual observação. O pombo tenderá a olhar mais para
mente informativos, mesmo que um esteja cor o triângulo no primeiro caso do que no segundo.
relacionado com a extinção e outro com o refor (Jenkins & Sainsbury, 1970, e Capítulo 8, sobre
ço. Suponhamos que as respostas de observação discriminação de características positivas).
simplesmente iniciem o vermelho durante a EXT Nós humanos não estamos imunes a tais con
e não o façam durante o VR. Se as respostas de tingências. Por exemplo, suponhamos que al
observação ocorrem, porque permitem ao pom guém mostre a você alguns cartões com letras
bo se comportar mais eficientemente com rela de um lado e números do outro, e diga-lhe que
ção aos esquemas componentes, ligar unicamente cada carta com uma vogal em um dos lados tem
a luz vermelha neste novo procedimento é tão um número ímpar do outro. Quatro cartas são
útil quanto ligar ambas as luzes. Mas foi verifi apresentadas com A, 8, X e 7 voltados para cima
cado que o comportamento de observar é clara e você é solicitado a virar o número mínimo de
mente mantido quando produz apenas o estímu cartas para verificar a regra: se forem vogais, en
lo correlacionado com o esquema de VR, mas tão, teremos números ímpares (cf. Wason & Jo-
não quando produz unicamente o estímulo cor hnson-Laird, 1970). Quantas cartas você viraria
relacionado com a extinção (Dinsmoor, 1983). para examinar e quais seriam elas? Muitas pes
Da mesma forma, estímulos correlacionados com soas irão virar a carta contendo o A, para ver se
punição diferencial (reforço em um componen há um número ímpar do outro lado. Aqueles que
te e reforço mais punição no outro) não mantêm viram uma segunda carta geralmente tentam o
bem as respostas de observação; se existem 7, para confirmar a vogal do outro lado. Mas a
quaisquer efeitos informativos, eles são sobre regra não será negada se eles encontrarem uma
pujados pela aversividade do estímulo correla consoante, porque a regra não diz que consoan
cionado com reforço e punição, mesmo quando tes não podem ter números ímpares também.
este estímulo permitiria ao pombo responder Você precisa virar duas cartas, mas a outra carta
mais eficientemente, diminuindo o responder a ser examinada é o 8, que negará a regra se exis
somente quando o mesmo aparece (Dinsmoor, tir uma vogal do outro lado. Somente um núme
1983). ro pequeno de pessoas escolhe esta carta.
Em outras palavras, a efetividade reforçado- Por quê? O ponto é que as pessoas estão, pro
ra de um estímulo discriminativo não depende vavelmente, procurando mais confirmar do
do caráter informativo, mas, muito mais das con que negar suas hipóteses. Virar uma carta é uma
seqüências particulares com as quais está corre resposta de observação, e todos temos longas his
lacionado. Assim, um problema central na apren tórias de verificar nossas suposições sobre as
dizagem da discriminação pode ser simplesmente coisas. Presumivelmente checamos coisas que
o de levar o organismo a observar os estímulos são importantes para nós, então, no passado terá
relevantes. Por exemplo, os organismos estão sido muito mais agradável ter tido nossas supo
provavelmente mais atentos às características dos sições confirmadas do que negadas. Com o tem
estímulos correlacionadas com um esquema de po, provavelmente, aprendemos que alguns ti
reforço do que com aquelas correlacionadas com pos de suposições podem somente ser confirma
a extinção. Suponhamos que os estímulos de uma das e que outras podem unicamente ser negadas,
discriminação reforço-extinção consistem em e fazemos suposições de acordo com isso. Se não
uma matriz de círculos ou a mesma matriz com é verdade, infelizmente significa que algumas
um triângulo substituindo um dos círculos. O tri vezes pensamos ter confirmado alguma coisa
A p r e n d iz a g e m 195
quando não confirmamos; talvez então a verda do bicar o disco na presença do primeiro estí
de fosse alguma coisa que não queríamos saber. mulo é freqüentemente acompanhada de aumento
A efetividade de uma mensagem depende em presença do segundo, mesmo que o esquema
mais de se seu conteúdo é reforçador ou aversi- programado durante o segundo se mantenha inal
vo, do que se está correta ou completa. E consis terado. O fenômeno, chamado de contraste com-
tente com esta descoberta, por exemplo, que pes portamental, é ilustrado na Figura 11.1 (Reynol
soas freqüentemente hesitam em procurar diag ds, 1961b). Um esquema múltiplo V I3 min V I3
nósticos médicos para certos sintomas. O fenô min estava programado para as respostas de um
meno tem sido longamente reconhecido na sa pombo, de bicar o disco tanto em presença da
bedoria popular, como naquelas histórias sobre luz vermelha quanto da luz verde. O esquema
o tratamento infeliz dado aos mensageiros que em verde foi mudado de esquema de VI para.
traziam más notícias. Que os organismos traba EXT e então foi mudado novamente para VI,
lham mais por informações correlacionadas com enquanto o reforço em VI foi mantido na pre
reforçadores do que por informações em si mes sença do vermelho. A taxa de respostas no ver
mas, é simplesmente mais um fato do comporta melho aumentou enquanto vigorava EXT em pre
mento que tem sido derivado da análise do com sença do verde, mesmo não tendo havido mu
portamento, e algumas vezes é um fato contra o dança no VI em presença da luz vermelha; am
qual resistimos. Quando isso acontece, é um fato bas as taxas retomaram a seus valores anteriores,
que ilustra a si mesmo. quando o esquema de VI foi reinstalado no verde.
Efeitos de contraste variam com as respos
tas, os reforçadores e os organismos (p. ex., Hem-
INTERAÇÕES ENTRE ESQUEMAS: mes, 1973), variando desde aumentos prolonga
CONTRASTE COMPORTAMENTAL dos até aumentos que duram apenas segundos
ou minutos após a mudança do esquema (p. ex.,
Em esquemas múltiplos, o comportamento Catania & Gill, 1964). Esses efeitos têm sido in
em um componente é freqüentemente afetado terpretados como a somatória de dois tipos de
pelo que acontece no outro componente. Por bicar: o bicar operante mantido pelo reforço ali
exemplo, se o esquema que mantém o compor mentar, e o bicar respondente produzido pela
tamento de um pombo de bicar o disco em pre correlação de estímulos discriminativos com re
sença de um estímulo é alterado de Reforço em forçadores (p. ex., a apresentação de reforçado
VI, para Extinção, enquanto o Reforço em VI res durante o VI, mas não durante o estímulo em
continua durante o segundo estímulo, a redução EXT do múltiplo VI EXT: cf. o tópico de auto-