Você está na página 1de 459

J. R.

MILLENSON

p r in c p io s d e

ANLISE DO
COMPORTAMENTO
A mais moderna e sistemtica coleo de princpios elementares
universais que existem para a modificao do comportamento

Obtura-

dor

Retculo de difrao

* tf) 1__
4

k l :

\
\

Monocromador

HesbiirU

Fonte de Luz

PRINCPIOS DE ANLISE
DO COMPORTAMENTO

J.R. MILLENSON

PRINCPIOS DE ANLISE
DO COMPORTAMENTO

T ra d u o de
A lin a de A lm e id a Souza
D io u e tie K ezende

COORDENADA

THESAURUS

Copyright, J. R. Milleonson, 1967


Ttulo original: Principles-of Behavior Analysis
THI MACMILLAN COMPANY, NLW YORK

Library of Congress catalog card number: 67 15540

Montagem: Afonso Rocha


Fotomontagem de : Joo Pinto
Composio de: Antonio Carlos da Silva e Clemente Silva l 'ilho
Capa: Paulo Magalhes

MCMLXXV
Todos os direitos, em lngua portuguesa no Brasil, reservados de acordo com a lei. Nenhuma parte
deste livro pode ser reproduzida ou transmitida de qualquer forma ou por qualquer meio, incluindo
fotocpia, gravao ou informao computadorizada, sem permisso por escrito da editora
COORDENADA / THESAURUS EDITORA DE BRASLIA LTDA. SIG Q. 08 LOTE 2356 FONE: (061) 344 3738 - FAX: (061) 344 2353 - Braslia - DF.

Para
VIVIENNE

PREFCI O EDI O BRAS I LEI RA

A maior parte do livro PRINCPIO S DE A N L IS E DO C O M PO R TAM EN TO fo i


escrita durante o ano acadmico de 1964, enquanto eu era um jovem professor assistente
de Psicologia no In stitu to de Tecnologia Carnegie (agora Universidade Carnegie-Mellon),
em Pittsburgh, Pensylvania. Eu o concebi como um te x to sistemtico de introduo dos
estudantes, em nvel elementar e avanado, queles princpios conhecidos de m odificao
do com portam ento que devem servir de base grande poro da conduta adaptativa do
homem e de organismos relacionados com ele. Em sua maior parte, escrever este livro fo i
um trabalho de amor. Eu ensinava Psicologia a iniciantes, para quem eu a interpretava
como a cincia que se preocupa com as interaes do com portam ento com o meio
ambiente e para quem havia tantas coisas que desejava dizer (e que o fiz muitas e muitas
vezes!) que no se encontravam em qualquer dos livros textos existentes, que decidi
desenvolv-los por escrito. Aquela poca existia apenas um livro te x to sistemtico e
elementar sobre esse campo de estudo que, embora suportando majestosamente a sua
idade, m uita coisa tinha acontecido desde a sua publicao em 1950.
Parece-me claro agora, como o fo i ento, que a Psicologia um campo c ie n tfic o a
mover-se rapidamente de seu estgio pr-paradigmtico para a explorao sistemtica de
um conjunto unificado de com portam entos. Gosto de pensar que em sua d im in u ta trilh a ,
o livro PRINCPIOS DE A N L IS E DO CO M PO RTAM ENTO continua a dar uma
contribuio permanente pc.ra o estabelecimento desse novo paradigma da Psicologia.
Agor.i, olhando para trs, uma dcada desde que esse livro apareceu, posso ver mais
claramente as suas virtudes e falhas. certo que nessa cincia de desenvolvimento to
rpido qualquer livro te x to logo se desatualiza. Novos processos im portantes, como a
^uto-modelagcm, o com portam ento adjuntivo e o biofeedback entraram em cena; outros
processos familiares, como o da punio e do condicionam ento clssico, foram
consideravelmente relorm ulados. Por o utro lado, enquanto em 1964 no tinham os quase
nenhuma teoria que merecesse esse nome, os anos de 70 testemunharam a chegada de
modelos quantitativos tanto na teoria do reforo como na do condicionam ento clssico.
Esses modelos, embora deliberadamente restritos rea que cobrem, tm uma certa aura
de a u te n tic id a d e que alta totalm ente nas grandiosas teorias prim itivas sobre
aprendizagem da era anterior. As descobertas complementares de que as atividades
autnomas reflexas so reorcveis e nue os com portam entos em itidos nodem ser

excitados por contingncias associadas/ colocam em questo nossa distino fechada


entre operantes e respondentes. m u ito cedo para dizer quo drasticamente essas
descobertas vo abalar nossos fundam entos tericos, mas certo que maiores

modificaes esto no ar.


H dez anos atrs, como reao s prematuras teorizaes das dcadas de 1940 e
1950, a disposio dos que trabalhavam nesse campo era fortemente descritiva. A anlise
que B.F. Skinner fez do com portam ento proposital, sua preocupao com o organismo
individual e sua nfase no controle pelo reforam ento de contingncias eram as bases do
cultivo em prico vigoroso dos princpios de reforam ento positivo. A lei do efeito de
T horndike estava no seu znite e este livro um p ro d u to daquele clm ax. Porm algumas
mudanas sutis esto acontecendo no Zeitgeist. O controle de contingncias pervasivo
e im portante como comeou a ceder lugar a um conjunto de efeitos perplexantes
que, mesmo parecendo intim am ente ligados ao reforo, vo alem da lei do efeito. Por
outro lado, o condicionam ento clssico, a outra face da moeda do determ inism o na
Psicologia, acha-se menos e menos seguro de seu papel como o segundo maior p rin c p io
de m odificao do com portam ento. Suspeito mesmo que devemos logo nos preparar para
aceitar a idia de que as modificaes das respostas no condicionam ento clssico pode ser
grandemente reduzido a uma forma de aprendizagem instrum ental. Naturalm ente que,
quando e se, essa integrao vier, ela certamente no eliminar Pavlov. Pelo contrrio, os
diques sero finalm ente eliminados para a explorao das descobertas do grande fisilogo
Russo, em sua rea mais apropriada: a modulao do com portam ento corrente pelos
efeitos Pavlovianos sobre a motivao, a emoo e a criao de reforadores.
O livro PRINCPIOS DE A N L IS E DO COM PORTAM ENTO guarda um silncio
virtual sobre as contribuies dos bilogos com portam entais s fontes evolucionistas da
variao do com portam ento; fator este no facilm ente manipulvel mas no facilm ente
ignorado. Enquanto eu sempre senti a negligncia s contribuies dos etologisias s
caractersticas com portam entais das espcies, como a m aior omisso de meu livro, e o
enfoque no meio-ambientalism o (que poderia ter sido d ifc il conseguir com uma
apresentao balanceada de biologia e psicologia) fo i e a sua m aior fora. Porquanto a
sua preocupao com as variveis do meio ambiente do passado e do presente
perm itiram -me aplicar a teoria do reforo de maneira criativa a um amplo espectro de
c o m p o rta m e n to s humanos complexos, incluindo a aprendizagem de conceitos,
significado e compreenso, soluo de problemas, motivao e emoo, de tal modo que
ainda hoje parece-me que retm um sabor moderno. Assim, por todas as mudanas e
ferm entos que ocorreram desde o seu aparecimento e por todas as suas omisses, pode
m uito bem ser qe o livro PRINCPIOS DE A N L IS E DO CO M PO RTAM ENTO ainda
contenha a mais noderna e sistemtica coleo de princpios elementares universais que
existem para a jodificao do com portam ento. Certamente eu creio que minha ateno
meticulosa para a elaborao e a aplicao de conceitos fundamentais, minha presso
neste livro na descrio form al de contingncias de reforam ento, a preocupao no
te xto com os detalhes ntim os, em profundidade, de um nmero lim itado de processos
fundamentais do com portam ento, seu com prom etim ento em compreender, opondo-se a
uma ( obertura superficial dos temas, sua natureza programada e, finalm ente, sua f em
que a teoria psicolgica pode e deve ser desenvolvida a um nvel com portam ental so,
todos eles, caractersticas que permanecem distintas e perenes.
Tornando este livro disponvel numa edio em Portugus a, talvez, uma audincia
bem maior, esta poder ser introduzida aos recentes insights e s promessas conceituais
dessa cincia do sculo XX

PREFACIO

O objetivo deste livro fornecer uma introduo rigorosa Psicologia Experimental


orientada para os dados. Ele se dirige principalmente ao estudante do primeiro curso em
Psicologia e contm material adequado para dois semestres consecutivos ou um perodo
de um ano. Embora o texto atinja um grau incomum de sistematizao para
o nvel introdutrio, o material que ele contm no necessariamente mais difcil do que
o encontrado na maioria dos textos de abordagem geral no campo. Com um grupo
limitado de conceitos gerais, tentei construir uma estrutura razovel de modo que o
estudante tenha, se este fr o seu primeiro, nico ou ltimo curso em cincia, os meios
para interpretar e ordenar uma ampla variedade de fenmenos psicolgicos.
No fiz tentativa alguma para rever todas as atividades variadas dos psiclogos em
geral na metade do sculo vinte. Na maior parte mantive o caminho direto e estrito da
Psicologia Experimental. Dentro desses limites, concentrei-me no que, em termos tradi
cionais, seria chamado aprendizagem e condicionamento, motivao e emoo e, em
menor extenso, Psicofsica, percepo e resoluo de problemas. Os correlatos fisio
lgicos do comportamento so apresentados nas discusses sobre motivao e emoo.
As desordens do comportamento so estruturadas como fenmenos emocionais patol>s. No h um captulo com ttulos como os de Percepo e Psicofsica, mas seus
1'miiTilns bsicos e alguns dados representativos so considerados no texto, nos captulos
h*>lic* controle de estmulo, discriminao e aquisio de conceitos, e em outras partes. A
aluminum na rea feita em termos da anlise funcional do comportamento, um ponto
do visla h muito tempo associado com B. F. Skinnei. Embora a maioria dos prin
cpios* dosciilos tenham suas origens no laboratrio de pesquisa animal,sua relevncia
para as atividades humanas repetidamente enfatizada.
Algumas nooes de Estatstica elementar so apresentadas, principalmente para
fornecei algum sabor variabilidade dos dados e para apontar a utilidade de instrumentos
estatsticos no losumo e interpretao dos resultados. Utilizei o mtodo de anexar alguns
captulos com seoes sobre anlise de dados, muitos dos quais descrevem conceitos
estatsticos simples. Embora estas sees estejam organizadas de modo a incorporar os
dados empricos citados nos captulos em que aparecem, eles fornecem seqncia
independente colocada narte do c o rn o d o textn

Um sistema de notao de R e S para descrever os procedimentos comportamentais


uma parte integral do texto. Os procedimentos no campo esto se tornando cada vez
mais complexos e algum esquema formal para reduz-los aos seus elementos parece dese
jvel se se quer que o estudante aprecie diferenas e similaridades de procedimento. 0
problema de se a notao particular, aqui elaborada, h de encontrar um lugar permanente
na cincia no ser resolvido aqui. Mas, com sua incluso, desejo enfatizar que uma
representao simblica da lgica de nossos procedimentos est se tornando obrigatria
para uma exposio e comun icao e ficientes.
Espero que o instrutor encontre dificuldade para modificar a seqncia dos captulos
ou omitir qualquer um completamente. (As sees que podem ser omitidas sem destruir a
continuidade esto em tipo pequeno.) Os conceitos se constroem uns sobre os outros e o
livro uma unidade. O nvel de dificuldade parece-me ser uma funo direta do nmero
do captulo. Ao usar o material com estudantes de vrios nveis, o principal grau de
liberdade parece ser a velocidade em que o instrutor pode progredir. Mantendo o prin
cpio de Bruner1, que qualquer assunto pode ser ensinado, de modo efetivo e de uma
forma intelectualmente honesta, a qualquer indivduo em qualquer estgio de desenvol
vimento , espera que o livro seja til para diversos nveis: talvez, como um
texto auxiliar para o curso de aprendizagem em graduao, ou mesmo como um livro de
consulta para cursos de ps-graduao em anlise experimental do comportamento.
Um laboratrio seria um complemento valioso para um curso tal como este e a
seqncia do texto tal que facilita uma ordem lgica de tpicos experimentais para o
laboratrio.
Meus agradecimentos so para muitos dos meus ex-alunos da Columbia University,
Birkbeck College (University of London) e Carnegie Institute of Technology que,
durante anos, estabeleceram as condies para escrever o livro e que modelaram
amplamente a sua estrutura. A Susan Alcott, Nancy Innes, Mary Carol Perrott, e par
ticularmente Isabelle Alter, tenho uma dvida pela leitura crtica, releitura, e edio dos
rascunhos preliminares. As sugestes dos meus colegas Daryl Bem, John Boren, Derek
Hendry, Dennis Kelly, Bernard Migler e do editor dessa serie, Melvin Marx, que entre eles
ieu cada c a p tu lo do livro, esclareceram , apreciavelmente, a verso final.
Evalyn Segai, genero sam ente, realizou o rduo trabalho de reler todo o manuscritc
durante as frias de vero, e seus comentrios detalhados ajudaram a melhorar o livro de
muitas maneiras. W. N. Schoenfeld e Francis Mechner merecem o crdito por aquilo que
de valor original aqui for encontrado. No seria necessrio dizer que eles no so de
modo algum responsveis pelos defeitos e deficincias e espero que eles perdoem quais
quer distores de suas idias que eu possa ter, inadvertidamente, criado.
J. R. M.

J. S. Bruner, The process of education. Cambridge: Harvard llnivrr Press 196^ n ^

SU M RIO

NOTA AOS ESTUDANTES.........................................................................................

19

PRIMEIRA PARTE: A REGULARIDADE DO COMPORTAMENTO.....................

21

CAPTULO 1 -

1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9

UM BACKGROUND PARA A ABORDAGEM CIENTFICA AO


COMPORTAMENTO.......................................................................

23

Primeiras tentativas para explicar e classificar o comportamento hum ano.....


A ao reflexa........................................................................................................
Reflexos condicionados ou adquiridos...............................................................
A teoria da evoluo e o comportamento adaptativo.......................................
Os primeiros experimentos sobre o comportamento voluntrio ..................
O Zeitgeist..............................................................................................................
A psicologia perde a sua m ente............................................................................
O firme estabelecimento de uma anlise experimental do comportamento ....
Reviso....................................................................................................................

23
25
25
26
27
29
30
32
34

CAPTULO 2 2.1
2.2
2.3
2.4
2.5
2.6

COMPORTAMENTO REFLEXO (ELICIADO)...........................

37

A frmula S - R ....................................................................................................
Leis do reflexo prim rio........................................................................................
Leis secundrias do reflexo...................................................................................
Fora do reflexo: um constructo hipottico.......................................................
Exemplos comuns de reflexos..............................................................................
Variabilidade nas medidas; resumo de dados em distribuio de freqncia;
estatstica bsica; a curva norm al........................................................................

37
39
41
42
44

CAPTULO 3 -

45

CONDICIONAMENTO PAVLOVIANO .......................................

53

3.1 Reflexos condicionados e a natureza de um experim ento.................................


3.2 O paradigma Pavloviano: um mtodo esquemtico de representar ocondi
cionamento
3.3 Relaes temporais nos paradigmas de condicionamento.................................
3.4 A extenso do condicionamento clssico................................ ...........................

53
56
62
64

3.5 O mtodo experimental ........................................................................................


3.6 Introduo aos conceitos elementares de probabilidade...................................

66
70

CAPTULO 4 -

FORTALECIMENTO OPERANTE...............................................

75

Introduo ao comportamento proposital..........................................................


Um experimento p rottipo..................................................................................
Mudanas na taxa absoluta...................................................................................
Mudanas na taxa relativa....................................................................................
Mudanas seqenciais no responder....................................................................
Mudanas na variabilidade....................................................................................
Operantes e estmulos reforadores.....................................................................
O paradigma do fortalecimento operante...........................................................
Operantes vocais.....................................................................................................
A extenso do fortalecimento operante.............................................................
Superstio.............................................................................................................
Condicionamento operante ..................................................................................

75
77
79
84
85
86
87
89
90
92
94
95

4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12

CAPTULO 5 -

EXTINO E RECONDICIONAMENTO DO OPERANTE.......

99

Mudanas na taxa de resposta durante a extino..............................................


Mudanas topogrficas e estruturais na extino...............................................
Resistncia extino...........................................................................................
Recuperao espontnea .......................................................................................
Condicionamento e extino sucessivos.............................................................
Esquecimento e extino......................................................................................
Uma definio compreensiva de extino operante...........................................
A extenso dos conceitos de extino.................................................................
Representaes grficas dos resultados de experimentos nos quais muitas
variveis independentes so estudadas em conjunto........................................

100
101
102
106
107
108
112
112

SEGUNDA PARTE: AS UNIDADES FUNDAMENTAIS DE ANLISE...............

121

5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9

CAPTULO 6 -

6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8

116

NOTAO DE CONTINGNCIA DE RESPOSTA E EST


MULO................................................................................................ 123

Respostas e eventos ambientais............................................................................


Situaes e eventos ambientais.............................................................................
A noo de uma contingncia comportamental................................................
A situao inicial (Sa ) ..........................................................................................
Contingncias mltiplas na mesma situao.......................................................
A contingncia n u la ..............................................................................................
A durao das situaes e das contingncias.......................................................
Mais de uma resposta exigida para a conseqncia S .......................................

124
126
127
129
130
132
133
134

6.9
6.10
6.11
6.12
6.13
6.14
6.15

Contingncias repetitivas......................................................................... ...........


Facilitao.............................................................................................................
ontingncias negativas.......................................................................................
Contingncias probabilsticas.............................................................................
Discriminaes......................................................................................................
R e S funcionalmente dependentes...................................................................
Contingncias agrupadas......................................................................................

CAPTULO 7 7.1
7.2
7.3
7.4
7.5
7.6

REFORAMENTO INTERMITENTE.........................................

143

Contingncia de intervalo....................................................................................
Probabilidade de reforam ento..........................................................................
Notas tericas sobre esquemas de reforam ento..............................................
Os efeitos do reforamento intermitente naresistncia extino.................
Outros efeitos comportamentais do reforamento interm itente....................
Estados estveis do com portam ento..................................................................

144
149
152
153
155
155

CAPITULO 8 8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9

A ESPECIFICAO DA RESPOSTA..........................................

159

A definio de classes de resposta............................................... .....................


Uma definio de resposta operante emtermos da teoria dos conjuntos.......
O paradigma da diferenciao............................................................................
Aproximao sucessiva........................................................................................
Extenso do conceito de operante....................................................................
Diferenciao de ta x a ..........................................................................................
Reforamento do responder contnuo..............................................................
Sumrio.................................................................................................................
A linguagem e lgica dos conjuntos...................................................................

159
163
164
169
170
176
178
179
180

CAPTULO 9 9.1
9.2
9.3
9.4
9.5

135
136
137
138
139
140
141

CONTROLE AMBIENTAL............................................................

185

Dimenses do estm ulo.......................................................................................


Generalizao de estm ulo...................................................................................
Generalizao da extino...................................................................................
Algumas implicaes da generalizao...............................................................
Notas sobre o delineamento de experimentosem psicologia usando sujeitos
anim ais...................................................................................................................

185
190
197
199
201

TERCEIRA PARTE: UNIDADES COMPONENTES DO COMPORTAMENTO .... 203


CAPTULO 10 - DISCRIMINAO........................................................................... 205
10.1 Duas condies do estmulo, uma classe deresposta.........................................
10.2 O paradigma da discriminao............................................................................

206
210

10.3 Duas condies do estmulo, duas classes de resposta.....................................


10.4 m Condies do estmulo, n classes de resposta...............................................
10.5 Mudanas contnuas no comportamento em funo de mudanas contnuas
numa dimenso do estm ulo...............................................................................
10.6 Discriminao sem respostas em S^ ..................................................................
10.7 Tempos de reao discriminativos.....................................................................
10.8 As implicaes do controle de estmulo operante...........................................
10.9 A significncia das diferenas entre duas m atrias...........................................

215
217
219
220
221

CAPITULO 11 -

REFORADORES ADQUIRIDOS................................

227

As propriedades reforadoras dos estmulos discriminativos positivos..........


Como aumentar a durabilidade de reforadores condicionados.....................
Recompensas token .........................................................................................
Reforadores generalizados .................................................................................
Respostas de observao .....................................................................................
As condies necessrias e suficientes para se criar reforadores condi
cionados .................................................................................................................
11.7 O reforamento secundrio no comportamento social...................................

228
229
233
234
235

CAPTULO 12 -

ENCADEAMENTO...........................................................

245

Os elementos de cadeias comportamentais............................................. .........


O desenvolvimento de uma cadeia com plexa...................................................
A aprendizagem de labirinto como um encadeamento...................................
Os efeitos da extino seletiva em pontos diferentes na cadeia.....................
Esquemas encadeados..........................................................................................
O comportamento humano cotidiano como encadeamento...........................
Cadeias vocais.......................................................................................................
Cadeias ramificadas e representao do diagrama de fluxo............................
Cadeias de comportamento encoberto..............................................................

245
247
251
252
255
257
260
263
267

QUARTA PARTE: CONTINGNCIAS COMPLEXAS..............................................

271

11.1
11.2
11.3
11.4
11.5
11.6

12.1
12.2
12.3
12.4
12.5
12.6
12.7
12.8
12.9

CAPTULO 13 -

21 i
213

237
239

AQUISIO DE CONCEITO ......................................... 273

13.1 Dispc' o para aprender (simples)...................................................................


13.2 Algumas variveis que interferem na aquisio da disposio para aprender
(L -S E T ).................................................................................................................
13.3 L-SETS mais com plexos....................................................................................
13.4 Experimentos simples sobre formao de conceito em sujeitos hum anos.....
13.5 Estudos sobre formao de conceito em animais............................................
13.6 Classes arbitrrias de S^; conceitos disjuntivos...............................................
13.7 Significado e compreenso considerados como interrelaes entre conceitos

274
278
278
280
284
288
291

13.8 A aquisio de conceito atravs da instruo programada.............................


13.9 As constncias perceptivas..................................................................................

298
305

CAPTULO 14 - SOLUO DE PROBLEMA E INTELIGNCIA........................

311

14.1
14.2
14.3
14.4
14.5

A estrutura de um problema e a natureza de uma soluo............................


Quebra-cabeas.....................................................................................................
Estratgias de procura de heursticas................................................................
Identificao do conceito....................................................................................
A mensurao de habilidades para solucionar problema: testes de inteli
gncia .....................................................................................................................
14.6 Correlao, teste de confiabilidade e validade..................................................

311
315
318
321

QUINTA PARTE: DINMICA DO REFORO.........................................................

335

CAPTULO 15 - MOTIVAO I ................................................................................

337

15.1 Causa e efeito e a noo de lei cientfica.........................................................


15.2 Causas fictcias do comportamento ..................................................................
15.3 Histria passada com contingncias de condicionamento e extino como
causas do com portam ento...................................................................................
15.4 Motivos e reforadores................................................................... .....................
15.5 Operaes de impulso .........................................................................................
15.6 Periodicidades no valor do reforam ento.........................................................
15.7 Paradigmas de privao e saciao....................................................................
15.8 A mensurao dos impulsos................................................................................

337
339
340
342
343
344
346
348

CAPTULO 16 - MOTIVAO I I ...............................................................................

361

16.1
16.2
16.3
16.4
16.5

361
365
366
371
377

Ativao e aspectos direcionais da motivao..................................................


Incentivo ...............................................................................................................
Fatores fisiolgicos na motivao ......................................................................
Reforadores primrios adicionais......................................................................
Drives adquiridos..................................................................................................

323
327

CAPTULO 17 - CONTINGNCIAS AVERSIVAS................................................... 383


17.1
17.2
17.3
17.4
17.5
17.6
17.7

Reforadores negativos........................................................................................
Condicionamento de fuga ...................................................................................
Parmetros de S'"..................................................................................................
Estmulos aversivos condicionados.....................................................................
Condicionamento de esquiva..............................................................................
Punio...................................................................................................................
Masoquismo...........................................................................................................

383
384
385
390
392
398
402

CAPfrULO 18 - COMPORTAMENTO EMOCIONAL.............................. P................

405

18.1
18.2
18.3
18.4
18.5
18.6
18.7
18.8
18.9

a emoo uma causa do comportamento ou um efeito comportamental? ..


Trs conceitos de em oo..................................................................................
O paradigma da ansiedade..................................................................................
R aiva......................................................................................................................
Elao.....................................................................................................................
Um modelo para representar einterrelacionar fenmenos emocionais..........
Medicina psicossomtica......................................................................................
O sistema nervoso autnom o.................................................................... i........
Controle emocional, maturidade emocional e comportamento emocional
patolgico...............................................................................................................
18.10Um ndice de mudana emocional.....................................................................

405
407
412
416
418
421
425
427

NDICE ANALTICO..........................................................................................................

437

431
434

NOTAS AOS ESTUDANTES

UMA PSICOLOGIA INTRODUTRIA PODE SER INTERPRETADA COMO UMA


introduo aos mtodos e princpios da anlise cientfica do comportamento. Embora as
definies antigas de Psicologia enfatizassem os processos mentais, por razes que
sero esclarecidas atravs deste texto, uma abordagem moderna Psicologia toma o
comportamento dos seres humanos assim como dos animais inferiores como seu objeto
de estudo. Apoiando-se firmemente no canone de que apenas o que pode ser observado
pode ser cientificamente estudado, este ponto de vista moderno ataca problemas da
Psicologia tradicional atravs da anlise do comportamento. No decorrer deste texto
encontrar-nos-emos estudando e representando na linguagem do comportamento, tpicos
tais como aprendizagem e memria, soluo de problema e inteligncia, sensao e per
cepo, emoo e motivao.
A organizao deste livro permitir que voc chegue a uma compreenso preliminar
dos princpios bsicos do comportamento humano. Embora muitos dos paradigmas e
conceitos fundamentais, que so tratados com detalhes, tenham sido derivados origi
nalmente de experimentos de laboratrio com sujeitos animais, eles no so de modo
algum limitados aos animais. Empregamos sujeitos animais na pesquisa psicolgica por
razes pragmticas: o ser humano do sculo vinte provavelmente no se submeteria
livremente a uma faixa ampla de controle ambiental necessria para um estudo cientfico;
e mesmo que se submetesse, a sociedade no o permitiria.
Para chegar a uma compreenso das causas do comportamento humano e animal,
ser necessrio que voc adquira primeiro um vocabulrio tcnico e uma familiaridade
completa com os conceitos bsicos da Psicologia. No se conhece um caminho mais curto
para se chegar a tal vocabulrio. Voc dever aprend-lo do mesmo modo que, ao se
preparar para uma partida de xadrez, necessrio aprender os nomes e movimentos
permissveis das peas, as sadas mais comuns e os princpios bsicos de ataque e defesa.
Ao estudar Psicologia, voc pode ter uma desvantagem peculiar que no existe na
aprendizagem inicial de xadrez. Certas opinies e pontos de vista pr-concebidos sobre as
causas do comportamento, os quais so uma parte padro da interpretao do mundo
dada pelo bom senso, devem primeiro ser esquecidas. Infelizmente, esta viso do bom
senso da natureza humana no sempre a mais til para a formulao de uma cincia

-1 9 -

sistemtica das relaes entre o comportamento e suas variveis controladoras. Por essa
razo, ser melhor que voc tente colocar de lado seus preconceitos sobre as aes das
pessoas e, em particular, seu sistema de representao dos assim chamados processos
mentais internos. Tente, assim, abordar a matria com um ponto de vista novo, conten
tando-se, inicialmente, em fazer perguntas ingnuas tais como O que o organismo
observado estava fazendo? e O que se relaciona consistentemente com o que ele
fazia? No incio, seu progresso pode parecer lento mas ele ser sempre seguro.

J. R. M.

- 20-

PRIMEIRA PARTE
A REGULARIDADE DO COMPORTAMENTO
1.
2.
3.
4.
5.

UM BACKGROUND PARA A ABORDAGEM


CIENTIFICA AO COMPORTAMENTO
COMPORTAMENTO REFLEXO (EL1CIADO)
CONDICIONAMENTO PAVLOV1ANO
FORTALECIMENTO OPERANTE
EXTINO E RECONDICIONAMENTO DO OPERANTE

Captulo 1

UM BACKGROUND PARA A ABORDAGEM CIENTIFICA AO COM


PORTAMENTO

Quando Scrates ouviu falar das novas descobertas no campo da anatomia, que se
propunham a provar que as causas dos movimentos corporais eram derivadas de um
engenhoso arranjo mecnico dos msculos, ossos e articulaes, disse: Isto dificilmente
explica porque estou sentado aqui, numa posio recurvada... falando com vocs
(Kantor, 1963). Passaram-se 2.300 anos desde este comentrio de Scrates e nos sculos
subsequentes, as causas do comportamento humano foram atribudas a mars, espirito
divino, posio das estrelas e, com freqncia, simplesmente ao capricho. Nos ltimos
cem anos, surgiu uma cincia do comportamento trazendo um conceito estrutural novo,
com novas atitudes em relao s causas do comportamento. Uma breve histria dos
eventos que levaram ao desenvolvimento desta cincia uma introduo apropriada para
seu estudo. Assim como no existe um modo melhor de entender as atividades presentes
de uma pessoa do que estando a par de sua histria passada, tambm no h melhor meio
de entender as atividades presentes de uma cincia do que atravs do conhecimento do
seu passado.
1.1

PRIMEIRAS TENTATIVAS PARA EXPLICAR E CLASSIFICAR O COMPORTA


MENTO HUMANO

As origens precisas da cincia do comportamento, como aquelas


todos os campos
do conhecimento, esto perdidas na obscuridade dos tempos. Mesmo assim, sabemos que
pelo ano 325 a.C., na Grcia antiga, Aristteles combinou a observao e a interpretao
num sistema naturalstico de comportamento, ainda que primitivo. Aristteles procurou
as causas (1) do movimento dos corpos, e (2) das discriminaes feitas pelos organismos.
Descreveu muitas categorias de comportamento tais como a percepo dos sentidos,
viso, olfato, audio, bom senso, pensamento simples e complexo, apetite, memria,
sono e sonho..Seus tpicos soam-nos familiares, atualmente, e eles ro ainda encontrados
de uma forma ou de outra, em quase todos os textos de Psicologia. Aristteles estava
menos interessado na previso e controle da natureza do que estamos atualmente e, desta
torma, suas explicaes do comportamento tm um sabor mais antiquado. Aristteles
estava preocupado em explicar as vrias atividades de um indivduo, mostrando serem
eias padres especficos de qualidades gerais, tais como apetite, paixo, razo, vontade
e habilidade sensorial (Toulmin e Goodfield, 1962).
- 23 -

As observaes e classificaes de Aristteles e dos estudiosos gregos que o seguiram


foram um incio substancial na tentativa naturalstica de entender as causas do compor-'
tamento humano. Mas a nova cincia declinou com o desaparecimento da civilizao
helnica. O incio da Era Crist e da Idade Mdia produziu um clima intelectual pobre
para o desenvolvimento da observao e pesquisa: o homem voltou sua ateno para os
problemas metafsicos. Os Padres da Igreja iniciaram e os telogos medievais comple
taram uma transformao conceituai de uma das qualidades puramente abstratas de
Aristteles numa alma sobrenatural a quem as causas do comportamento humano eram
atribudas. Encarando esta alma como imaterial, insubstancial, e sobrenatural, um
dualismo definitivo foi estabelecido entre alma e corpo. Colocando as causas do compor
tamento numa regio no observvel do esprito, este dualismo inibiu o estudo naturalstico do comportamento. Ento, por um longo perodo de tempo, as cincias do
comportamento permaneceram adormecidas. Temos que pular adiante para o sculo
dezessete, no tempo de Galileu e o surgimento da fsica moderna para retomar os fios
que eventualmente, deram-lhes uma estrutura cientfica.
As teorias do filsofo e matemtico Ren Descartes (1596-1650), contemporneo
francs de Galileu, representam uma quebra parcial da explicao metafsica do compor
tamento. Tomando como modelo as figuras mecnicas dos jardins reais de Versailles que
se moviam e produziam sons, Descartes sugeriu que o movimento corporal era o
resultado de causas mecnicas semelhantes.
As mquinas nos nrdins reais operavam baseadas em princpios hidrulicos. A gua
era bombeada em tubos fechados para impulsionar os membros das figuras, produzindo
movimentos, ou era conduzida atravs de aparelhos que emitiam palavras ou msicas
quando a gua passava. Descartes imaginou que animais e homens eram, na realidade, um
tipo de mquina complicada, analogamente construda. Ele substituiu a gua das figuras
reais pelos espritos animais, um tipo de substncia intangvel, elstica e invisvel; e sups
que os espritos flussem nos nervos de tal modo que entravam nos msculos causando,
assim, sua expanso e contrao e, por sua vez, fazendo os membros se movimentarem.
Algumas das Figuras Reais estavam arrumadas de maneira que, se os visitantes
passassem por cima de ladrilhos escondidos, o mecanismo hidrulico atuante fazia as
figuras se aproximarem ou se afastarem. Descartes tomou essa resposta mecnica como
modelo para explicar como um estmulo ambiental externo poderia causar um movimento
corporal. Uma ilustrao (ver la. Parte, p.21) num dos seus trabalhos, mostra o retraimentc
de um membro de um homem prximo de uma chama. De acordo com Descartes, a m
quina do nosso corpo assim formada de tal modo que o calor de uma chama excita
um nervo que conduz essa excitao ao crebro. Do crebro, os espritos animais so
transmitidos ou refletidos de volta ao membro, atravs do nervo, aumentando o msculo
e causando assim a contrao e retraimento (Fearing 1930).
O desejo de Descartes de encarar o comportamento humano como determinado por
oras naturais foi somente parcial. Hle limitou sua hiptese mecnica para certos com
portamentos involuntrios e sups que o resto era governado pela alma, localizada no
crebro. A alma guiava inclusive os mecanismos dos comportamentos involuntrios ,
mais ou menos do mesmo modo que uma mquina poderia dirigir as Figuras Reais. A
despeito deste dualismo e a despeito de sua escolha de um princpio hidrulico, as
formulaes de Descartes representaram um avano no pensamento inicial sobre o com
portamento. A teoria do corpo como um tipo especfico de mquina poderia ser testada
por observao e experimentao. Hsta foi a propriedade seriamente omitida nas
- 24

explicaes medievais. Ao'restabelecer a idia de que, pelo menos, algumas das causas do
comportamento humano e animal poderiaim ser encontradas no ambiente observvel,
Descartes estabeleceu as bases filosficas que eventualmente iriam justificar uma
abordagem experimental do comportamento.
1 .2 - A AO REFLEXA
O ponto de vista de Descartes simboliza o novo interesse num mecanismo que
conduziu experimentao sobre a ao reflexa do animal. Em 1750, um psiclogo
escocs, Robert Whytt, redescobriu e expandiu experimentalmente o princpio do
estmulo, de Descartes. Pela observao da contrao sistemtica da pupila luz,
salivao a irritantes e vrios outros reflexos, Whytt foi capaz de estabelecer uma relao
necessria entre dois eventos separados: um estmulo externo (por exemplo, a luz), e uma
resposta corporal (por exemplo, a contrao da pupila). Alm disso, a demonstrao de
Whytt que um nmero de comportamentos reflexos poderia ser eliciado numa r decapi
tada, enfraqueceu a atratividade de uma explicao em termos de alma. Contudo, no foi
possvel, ainda no sculo dezoito, olhar o estmulo isoladamente como uma causa sufi
ciente do comportamento. A alma, pensou Whytt, provavelmente se difunde atravs da
medula e do crebro, retendo, consequentemente, o controle mestre dos reflexos.
Nos 150 anos seguintes, mais e mais relaes reflexas foram descobertas e elaboradas
e o conceito de estmulo adquiriu mais fora. Ao mesmo tempo, a ao do nervo passou
a ser compreendida como um sistema eltrico ao invs de hidrulico. No inicio do sculo
XIX, a tendncia espiritual tomou-se suprflua para explicar a ao involuntria e Sir
Charles Sherrington, clebre fisiologista ingls, pde resumir as causas do comportamento
reflexo em leis quantitativas de estmulo-resposta. Essas leis relacionavam a velocidade,
magnitude e probabilidade da resposta reflexa intensidade, freqncia e outras
propriedades mensurveis do estmulo. A cincia havia anexado inteiramente o reflexo.
Mesmo assim, uma grande proporo do comportamento humano e dos animais
superiores permaneceu ligada a foras sobrenaturais.
1.3 - REFLEXOS CONDICIONADOS OU ADQUIRIDOS
Pouco antes do incio do sculo XX, Ivan Pavlov, fisiologista russo, estava
pesquisando as secrees digestivas de ces. No curso desses experimentos, notou que
enquanto a introduo de alimento ou cido, na bca, resultava num fluxo de saliva, a
mera apario do experimentador trazendo alimento poderia tambm eliciar um fluxo
similar. Pavlov no foi, de modo algum, o primeiro homem a fazer observaes deste
tipo. Mas parece ter sido o primeiro a suspeitar de que seu estudo detalhado poderia
fornecer um indcio para a compreenso do comportamento ajustado e adaptado dos
organismos. Foi esta viso que o ievou ao estudo sistemtico desses reflexos, os quais
chamou de reflexos condicionais, porque eles dependiam ou eram condicionais a um
evento prvio na vida do organismo. A apario do experimentador no eliciava origi
nalmente a saliva. Somente depois que sua apario era frequentemente associada com
alimento ou cido, ela apresentava esse efeito. A contribuio particular de Pavlov foi
mostrar experimentalmente como os reflexos condicionais eram adquiridos, como
poderiam ser removidos (extintos) e que faixa de energias do ambiente era efetiva em sua
produo. Pavlov, em tempo, apontou uma lei geral de condicionamento: depois de uma

-2 5 -

associao temporal repetida de dois estmulos, aquele que ocorre primeiro, eventual
mente, passa a eliciar a resposta que, normalmente, eliciada pelo segundo estmulo.'
Esta lei continua conosco at hoje, ligeiramente modificada.
Trs aspectos gerais do trabalho de Pavlov merecem nossa ateno. Primeiro, ele no
estava satisfeito em observar simplesmente os aspectos gerais do condicionamento, como
muitos outros fizeram antes dele (c. f. Hall e Hodge, 1890). E^m vez disso, ele prosseguiu
para verificar a generalidade do fenmeno usando muitos estmulos e muitos ces. Foi
somente depois de numerosas demonstraes que ele codificou numa lei o que havia
descoberto -- lei esta aplicvel, pensou ele, a todos os estmulos e a todos os organismos
superiores. Segundo, Pavlov, preocupou-se com os aspectos mensurveis ou quantitativos
do fenmeno. Essas quantidades mensurveis, tais como a quantidade de saliva e o
nmero de emparelhamentos do retlexo, foram teis por permitirem uma anlise deta
lhada do condicionamento. Um terceiro aspecto do trabalho de Pavlov foi sua natureza
sistemtica. Limitando seus estudos aos efeitos de numerosas condies sobre uma nica
grandeza (quantidade de saliva), Pavlov assegurou que suas descobertas experimentais
pudessem ser interrelacionadas e, consequentemente, mais significativas.
Pavlov viu claramente como se deve proceder na explicao do comportamento.
o naturalista deve considerar somente uma coisa: qual a relao desta ou daquela
reao extema do animal com os fenmenos do mundo externo? Esta resposta pode
ser extremamente complicada em comparao com a reao de qualquer objeto
inanimado, mas o princpio envolvido permanece o mesmo.
Estritamente falando, a cincia natural tem por obrigao determinar somente a
conexo precisa que existe entre um dado fenmeno natural e a resposta do organis
mo vivo a este fenmeno (Pavlov, 1928, p. 82) .
Contudo, apesar de seu prprio interesse declarado na relao meio e resposta,
Pavlov gradativamente passou a encarar o condicionamento como um estudo da funo
do crebro. Suas explicaes tendiam a ser em termos de processos cerebrais hipotticos.
Mas, na verdade, Pavlov raramente mediu qualquer relao real entre crebro e compor
tamento. Assim, estas explicaes eram to fictcias como as primeiras explicaes em
termos da alma. Tentando explicar o comportamento atravs de funes desconhecidas
do crebro, ele evitava uma descrio direta do prprio comportamento violando, deste
modo, uma das suas prprias afirmaes de que uma cincia do comportamento necessita
determinar somente a "conexo precisa que existe entre um dado fenmeno natural e a
resposta do organismo vivo a este fenmeno .
L4 - A TEORIA DA EVOLUO E O COMPORTAMENTO ADAPT ATIVO
De certo modo, o trabalho de Pavlov representa o auge da doutrina mecanicista de
Descartes sobre o comportamento reflexo. Com respeito ao comportamento que
tradicionalmente era colocado sob o controle do desejo ou volio, Descartes seguiu os
preconceitos de seu tempo, atribuindo-o ao controle de uma alma no observvel. Tal
soluo , todavia, apenas adiou a investigao cientfica, uma vez que o problema
original de explicar o comportamento foi simplesmente transferido para um outro mais
difcil, o de explicar o comportamento da alma postulada. Em 1859, ocorreu um grande
evento cientfico que alterou o clima intelectual tornando-o favorvel para um
estudo
-26 -

naturalistic*) do comportamento voluntrio. Naquele ano, Charles Darwin props a teoria


da evoluo, dizendo que o homem era membro do reino animal e que diferenas entre o
homem e outros animais eram quantitativas e somente uma questo de graus. Assim um
conhecido historiador da Psicologia colocou a questo;
A teoria da evoluo levantou o problema da Psicologia animal porque ela exige
uma continuidade entre diferentes formas animais e entre o homem e os animais. De
uma maneira vaga, a noo Cartesiana [de Descartes] ainda prevalecia. O homem
possuia uma alma e os animais eram considerados sem alma, e havia, alm disso,
pouca distino entre uma alma e uma mente. A oposio teoria da evoluo era
baseada principalmente na suposio que fazia de haver continuidade entre homens e
feras e a rplica bvia para a crtica foi demonstrar a continuidade. A existncia de
mente nos animais e a continuidade entre a mente humana e animal, deste modo,
tornou-se crucial para a sobrevivncia da nova teoria (Boring, 1929, p. 462-463) .
A teoria de Darwin era baseada em muitas observaes cuidadosas que ele havia feito de
fsseis e da estrutura da flora e fauna vivas, em reas isoladas da Terra. Alm disso, ele
pesquisou o comportamento atravs do qual os animais se adaptavam aos seus meios. As
observaes comportamentais de Darwin foram to amplas e detalhadas que marcam a
primeira tentativa sistemtica de uma Psicologia Animal Comparativa (ver Darwin, 1873).
O interesse de Darwin no comportamento foi, como observou o professor Boring,
baseado naquilo que tal comportamento revelaria sobre a mente. Assim, a demonstrao
da complexidade e variedade nos comportamentos adaptativos de animais em relao a
seus ambientes mutveis, pareceria provar que eles, como o homem, deviam tambm
pensar, ter idias, e sentir desejos. Consequentemente, Darwin foi criticado por seu
antropomorfismo, isto , por tentar explicar o comportamento animal em termos de
conceitos mentalistas. Mas pouco se pensou neste tempo em levantar a questo meto
dolgica mais radicai; se os conceitos mentalistas tradicionais (pensamento, idia,
desejos) tm valor explicativo mesmo para o comportamento humano.
George John Romanes, amigo de Darwin, escritor ingls e popularizador da cincia
escreveu um livro sobre a inteligncia animal (Romanes, 1886) no qual comparou o
comportamento de vrias espcies de animais. Romanes colheu material da observao
cuidadosa de animais, mas, tambm levou em considerao evidncias de cunho popular
sobre animais de estimao e de circo. Por esta razo, seu mtodo veio a ser chamado
aned tico. Os mtodos, antropomrfico e anedtico de Darwin e Romanes,
respectivamente, marcaram uma renovao no interesse pelo comportamento adaptativo
do animal e pela relao deste com o comportamento humano. Consequentemente, eles
representam importantes precursores histricos de uma verdadeira anlise experimental
do comportamento.
1 .5 - O S PRIM EIR O S EXPERIM EN TO S SOBRE O COMPORTAMENTO
VOLUNTRIO
Em 1898, Edward L. Thorndike, da Universidade de Columbia, publicou os
resultados de alguns estudos de laboratrio com gatos, ces e pintos. Seus mtodos eram
radicalmente opostos queles da observao casual que o haviam precedido. A
aparelhagem utilizada por Thorndike mostrada na Fig. 1-1.0 comportamento estudado
foi a fuga de um ambiente fechado e atos, tais como, puxar um cordo, mover um trinco,
- 27 -

pressionar uma barra ou abrir uma porta erguendo uma tramela, foram escolhidos por sua
co n v en in cia e ex atid o de observao. Uma vez que qualquer um destes
comportamentos podia ser organizado de modo a servir como instrumento que
produziria a fuga da caixa, Thorndike os chamou de comportamentos instrumentais.

I igura 1-1. A caixa quebra-cabeas utilizada por Thorndike para estudar a


aprendizagem instrumental de animais (Garret, 1951).

Quatro elementos do trabalho de Thorndike sobre o comportamento instrumental


demonstram uma qualidade moderna no vista nas pesquisas comportamentais antes de
sua poca. (1) Ele reconheceu a importncia de se fazer observaes de animais cujas
histrias passadas fossem conhecidas e mais ou menos uniformes. Logo, criou seus
animais no laboratrio onde poderiam obter condies ambientais semelhantes antes do
experimento. (2) Thorndike compreendeu a necessidade de se fazer observaes repetidas
de um mesmo animal e de se fazer observaes em mais de um animal e em mais de uma
espcie. Somente deste modo poderia estar certo de que os resultados que ele obtinha
eram aplicveis aos animais em geral. (3) Thorndike viu que, a menos que considerasse
mais do que um ato particular do comportamento, suas concluses, seriam vlidas apenas
para o nico aspecto do comportamento que ele escolhesse. Logo, empregou diversos
comportamentos em vrios aparelhos diferentes. (4) Ainda outra qualidade do trabalho
de Thorndike, caracteristicamente cientfica, foi sua tentativa de fazer uma apresentao
quantitativa dos resultados.
De seus trabalhos com animais nas caixas quebra-cabea, Thorndike apresentou um
conjunto de princpios ou leis gerais do comportamento que acreditava serem vlidas
para muitas espcies e muitos tipos de comportamento. Um desses, princpios, embora

-2 8 -

modificado chegou at nossos dias. Thorndike notou que, quando os animais eram
inicialmente colocados na caixa quebra-cabea, eles apresentavam muitas respostas difusas
de debater-se. Eventualmente, um desses comportamentos difusos poderia, por acaso, fazer
funcionar o mecanismo de fuga. A porta, ento, abrir-se-ia, permitindo ao animal sair da
caixa e o b te r um a pequena quantidade de alimento. Thorndike observou que o
comportamento, que inicialmente permitia ao animal sair, era apenas um dos muitos que ele
executava na situao. Assim, medida que o animal era repetidamente submetido
situ a o , ele passava a a p re s e n ta r menos comportamentos suprfluos, at que
eventualmente no apresentasse, praticamente, nenhum daqueles mal sucedidos.
Thorndike concluiu disto que os resultados bem sucedidos do passado, ou efeitos do
comportamento, deveriam ter uma influncia importante na determinao das tendncias
comportamentais presentes do animal. Thorndike chamou isto a capacidade dos efeitos
passados do comportamento modificarem os padres do comportamento animal a lei
do efeito. Esta lei sobrevive ainda hoje como um princpio fundamental na anlise
fundamental e controle do comportamento adaptativo.
1 .6- O ZEITGEIST
Thorndike forneceu um novo mtodo experimental e com sua ajuda formulou o que
logo seria aceito como uma lei bsica do comportamento adaptativo. Do mesmo modo
que Whytt, 1 50 anos antes, deixou o conceito de reflexos parcialmente no estado de fato
observado e parcialmente no estado de interpretao suprflua, assim tambmThrndike
deixou a lei do efeito. Na sua proposio do princpio, Thorndike no estava satisfeito em
considerar o efeito como uma mera fuga do confinamento ou mero acesso ao
alimento. Mas em vez disso, sentiu necessidade de inferir que o sucesso levava ao prazer e
a satisfao, e que estas eram as causas verdadeiras das mudanas observadas no compor
tamento. Deste modo, ele deixou a explicao a cargo de estados mentais hipotticos,
prazer e satisfao, os quais no eram mais reais do que a alma de Descartes. Para
Thorndike, como para seus contemporneos, o comportamento de um gato escapar de
uma caixa quebra-cabea no era importante como comportamento, mas somente como
um meio de esclarecer os processos mentais e associaes de idias do animal.
T h o rn d ik e foi, ento, fiel sua poca e suas tradies considerando o
comportamento principalmente interessante pelo que podia revelar sobre algum outro
sistema. O que as pocas e as tradies impem aos mais originais pensadores so
frequentemente denominadas de Zeigeist. Os grandes homens de uma era erguer-se-o
acima de Zeitgeist de algumas maneiras mas, mesmo assim, sero por ele acorrentados de
outras maneiras. Descartes superou-o quando props uma teoria mecanicista original
sobre o movimento do corpo. Que ele foi acorrentado pelo Zeitgeist, evidente, pela sua
permanncia no dualismo mente-corpo . Vimos o Zeitgeist em Whytt, que redescobriu
o princpio do estmulo, mas no foi capaz de eliminar a alma como a causa final dos
reflexos que observou. Pavlov estudou os reflexos condicionados, um fenmeno cuja
importncia foi negligenciada durante sculos. Mesmo assim, vimos que Pavlov estava
preso pelo Zeitgeist; ele manteve o ponto de vista de que os reflexos condicionados,
embora, claramente, um fenmeno comportamental, eram de interesse para a
compreenso do crebro ao invs do comportamento. Agora, vemos o Zeitgeist em
Thorndike, que realizou alguns dos primeiros experimentos sobre o comportamento
voluntrio , mas explicou suas descobertas atravs da associao de idias. De fato, o

-2 9 -

princpio do Zeitgeist penetra de tal forma todas as cincias que podemos tomar como
regra geral que todo trabalho humano ser colorido pelas teorias e ponlos de vistas
aceitos em sua poca. Assim, embora a grandeza de um homem consista em libertar-se de
certas maneiras de pensar estabelecidas e ver o que ningum antes dele viu claramente,
ou, do mesmo modo, ele no escapar completamente do clima social, filosfico e 1
cultural no qual trabalha.
1.7 - A PSICOLOGIA PERDE A SUA MENTE
Thorndike introduziu o comportamento adaptativo no laboratrio e, assim fazendo,
descobriu a importncia da le i do efeito. Os estudos de Thorndike sobre o compor
tamento surgiram do seu interesse, como Psiclogo, nos processos mentais. Ser instru
tivo, neste ponto, examinar a disciplina da Psicologia que, na primeira metade do
sculo vin te, fundir-se-ia com outras contribuies histricas da cincia do
comportamento. A pesquisa psicolgica experimental iniciou-se em meados do sculo
dezenove como uma disciplina derivada da fisiologia dos rgos dos sentidos. De fato, os
pioneiros Herman Helmholtz, Johannes Mller e Wilhelm Wundt eram todos fsicos e
fisiologistas. Estes primeiros psiclogos experimentais adotaram as categorias de
comportamento descritas por Aristteles mas, de um modo diferente deste, eles estavam
interessados no comportamento, apenas, na medida em que esclarecia os processos
mentais. Logo, o trabalho dos primeiros psicologistas representava uma tentativa para
tornar os mtodos experimentais naturalsticos, introduzidos por Galileu, compatveis
com as doutrinas metafsicas da Idade Mdia.
Foi Wundt que, em 1879, fundou o primeiro laboratrio de Psicologia em Leipzig.
Podemos considerar o seu sistema como representativo das atividades desta nova
disciplina, a qual tinha menos de vinte anos quando Thorndike estava fazendo seus
experimentos com gatos e pintos na Colmbia. Wundt advogou que a psicologia era a
cincia da experincia; e, como tal%seu objeto de estudo abrangia sentimentos,
pensamentos e sensao. Ele formulou a doutrina de que o mtodo da Psicologia era
introspectivo, um exame dos processos conscientes do organismo em experiencia. Logo,
Wundt esquematizou o problema da Psicologia como (1) a anlise dos elementos dos
processos conscientes, (2) a determinao de como esses elementos so conectados e (3)
a determinao das leis de conexo (Boring, 1929, p. 328, ital. omitidos). Os expe
rimentos que Wundt e seus seguidores realizaram do uma imagem melhor do contedo
da psicologia do que as definies fornecidas por Wundt. A maioria dos trabalhos foi
classificada sob o ttulo de sensao humana e dizia respeito ao sentido visual em
particular. Numerosos experimentos mediam as intensidades mnimas de luz que um ob
servador poderia detectar sob vrias condies. Outros estavam voltados para as menores
mudanas ambientais necessrias para um observador relatar diferenas apenas percebidas
m luminosidade, cor e distncia dos objetos. Tais pesquisas vieram a ser chamadas de
experimentos de limiares em Psicofsica. Psico porque as sensaes eram consideradas
estar sob estudo; fsica - porque mudanas fsicas no ambiente eram manipuladas e
medidas experimentalmente. Audio, tato, gosto, olfato e o sentido do tempo tambm
foram pesquisados, assim como o tempo de reao, ateno e sentimento. A memorizao
de vrios tipos de slabas sem sentido era um mtodo para tratar a associao de idias e
deduzir as propriedades da memria.
Embora se afirmasse ser a psicologia uma cincia dos contedos, processos e atos
mentais, o que de fato ela investigava era o comportamento. Associaes de idias eram

30-

inferidas a partir da aprendizagem de slabas sem sentido; sensaes idnticas eram inferi
das de observaes do comportamento quando um sujeito humano agrupava dois objetos
ambientais diferentes em contextos diferentes (por exemplo, duas amostras de papel
cinza sob diferentes condies de iluminao); a velocidade do processo mental era
inferida do tempo de reao do indivduo. Assim, no foi paradoxo algum o fato de que
quando Thorndike veio a fazer uma observao mais detalhada da associao de idias,
estivesse livre para escolher animais como sujeitos.
Se o comportamento dos
organismos humanos poderia levar inferncia sobre o processo mental, por que no o
comportamento animal? Logo, aconteceu que o trabalho de Thorndike ajudou a intro
duzir os mtodos de pesquisa animal na Psicologia. A eles pejmanecem ao lado dos
descendentes metodolgicos da psicologia sensorial clssica e da Psicologia introspect iva
do sculo dezenove.
Mas, talvez o homem que mais contribuiu para esclarecer a relao entre o
comportamento e Psicologia foi John B. Watson. O primeiro trabalho deste psicologista
americano dizia respeito s modalidades sensoriais que o rato usa na aprendizagem de um
labirinto. medida que Watson continuava seus estudos com animais, tornava-se mais e
mais preocupado com o ponto de vista predominante de que o comportamento era
significativo somente quando esclarecia processos mentais ou conscientes. Ocorreu a
Watson que os dados do comportamento tinham valor em si mesmos e que os problemas
tradicionais da Psicologia imaginao, sensao, sentimento, associao de idias
poderiam ser todos estudados estritamento por mtodos comportamentais.
Em 1913, Watson publicou um trabalho, atualmente clssico, definindo a psicologia
como cincia do comportamento e chamando esta nova Psicologia de behaviorismo .
Watson argumentava, neste trabalho, que o estudo do comportamento poderia chegar a
u m status independente dentro da cincia. O objetivo de tal cincia seria a previso e
controle do comportamento de todos os animais, sem nenhuma preferncia especial para
os seres humanos. O behaviorista, dizia Watson, deve relacionar seus estudos de ratos e
gatos com o comportamento humano no mais (no menos) do que o zoologista deve
relacionar suas dissecaes de sapos e vermes anatomia humana. Atravs de sua
doutrina, Watson estava destruindo a teoria homocntrica da importncia do homem no
mundo do comportamento to eficazmente como Coprnico, quatrocentos anos antes,
havia destrudo a teoria do universo geocntrico (terra no centro).
O ponto crtico de Watson era o de que a psicologia deveria ser objetiva isto , ela
deveria ter um objeto de estudo que, como nas outras cincias, fosse independente do
observador. A Psicologia clssica, tentando estabelecer como seu objeto a autoobservao, carecia de um observador independente, localizado fora do sistema em
considerao. A adoo do comportamento como objeto a ser observado deu nova
psicologia o observador independente necessrio.
O programa de Watson tinha um grande alcance e era para sua poca, notavelmente
sofisticado. Ao enfatizar o comportamento como um objeto independente de uma
cincia dirigida para a previso e controle do comportamento e a anlise microscpica
do ambiente e comportamento em termos de estmulo e resposta como a maneira para a
compreenso eventual de padres complexos do comportamento, o programa de Watson
preparou a base para nossos pontos de vista modernos.
- 31 -

1 . 8 - 0 FIRME ESTABELECIMENTO DE UMA ANLISE EXPERIMENTAL DO


COMPORTAMENTO
Os primeiros experimentos de Thorndike sobre o comportamento animal e a
definio de Psicologia dada por Watson, como uma cincia do comportamento,
introduziram a pesquisa animal na Psicologia,Mesmo assim, o status cientfico da nova
Psicologia era precrio. No princpio dos reflexos condicionados formulado por Pavlov,
Watson pensou ter encontrado um mecanismo explicativo para muitos dos ajustamentos
complexos e sutis de organismos adultos, inclusive o homem, aos seus ambientes. Mas a
tentativa de forar todos os comportamentos no modelo do reflexo foi um fracasso.
Watson no soube apreciar a importncia daJei do efeito de Thorndike, principalmente,
pode-se supor, devido ao excesso de bagagem conceituai com que Thorndike envolvera a
questo. O ponto de vista de Watson de que a tarefa de uma cincia preditiva do
comportamento fosse a compilao de todas as correlaes estmulo-resposta hereditrias
e adquiridas que um dado organismo exibisse, desviou a ateno da procura de leis gerais
do comportamento. Neste vcuo terico, conceitos mentalistas tradicionais continuaram
a sobreviver. O rigor experimental do behaviorismo estava fora de questo, mas sua meto
dologia corria o risco de ser estril.
Vinte anos de mtodo de cincia natural sustentados pelo behaviorismo fracas
saram em fornecer uma formulao sistemtica consistente e til. Os dados experi
mentais refletiam muitas propriedades arbitrrias dos aparelhos. Concluses acei
tveis com qualquer grau de generalidade referiam-se a aspectos, caractersticas ou
capacidades limitantes. Enquanto muitas dessas eram bastantes vlidas, poucas eram
logicamente convincentes e preferncias pessoais levavam a muitas cincias
individuais do comportamento (Skinner, 1944; p. 276).
Numa srie de publicaes iniciadas em 1930, B. F. Skinner props uma formulao
do comportamento que surgiu de observaes feitas num nico organismo respondendo
numa situao experimental artificial, cuidadosamente controlada e altamente padro
nizada. O organismo que Skinner usou foi o rato branco, e a aparelhagem consistia numa
caixa contendo uma pequena barra que, se pressionada pelo rato, fornecia uma pequena
pelota de alimento em um recipiente localizado diretamente abaixo da barra

Figura 1-2. A caixa de Skinner


para o estudo do comportamen
to operante de pequenos animais
(Skinner, 1938).

-3 2 -

Sob essas condies experimentais, um rato faminto deixado s na caixa, logo viria a
pressionar a barra com uma taxa constante e moderada at que um dado nmero de
pelotas de alimento liberadas comeasse a saciar o animal. A situao experimental
utilizada por Skinner e sua abordagem aos problemas do comportamento foram nicas
em muitos aspectos. Skinner viu a necessidade de encontrar uma varivel dependente
sensvel e exata. Isto , algum aspecto quantitativo do comportamento que pudesse variar
numa ampla faixa e ter uma relao ordenada e regular com as variveis ambientais
passadas e presentes, relao esta que pudesse ser formulada em termos de uma lei. Sua
descoberta de que a freqncia de ocorrncia da resposta de pressionar a barra durante
um intervalo de tempo (sua taxa) satisfazia essas condies, foi o principal avano em
direo a uma anlise sofisticada do comportamento individual.
A abordagem de Skinner aos problemas do comportamento diferia, de certo modo,
daquelas dos seus precursores assim como de seus contemporneos que trabalhavam com
a psicologia animal. Como proposio fundamental, ele sustentou que uma cincia do
comportamento poderia ser o que chamou de descritiva ou funcional; isto , poderia
limitar-se a descobertas de relaes ou correlaes entre variveis mensurveis. Skinner
tambm argumentou que as pesquisas deveriam ser sistemticas, no sentido de que as
relaes obtidas estivessem ligadas por um ponto comum. Limitando suas observaes s
formas pelas quais uma nica varivel dependente (a freqncia por unidade de tempo de
um ato arbitrrio mas, mesmo assim, representativo) mudavam com as condies
ambientais variadas, Skinner manteve seu prprio trabalho altamente sistemtico.
Um objeto de estudo, frequentemente, espera instrumentos para colocar o
observador em melhor contato com ele. Skinner inventou um registrador que realiza um
registro visual das respostas sucessivas atravs de um ligeiro deslocamento vertical de uma
pena, movendo-se horizontalmente no tempo. medida que o experimento progride, um
grfico de respostas acumuladas desenhado em funo do tempo. Esse registrador
cumulativo de respostas torna possvel um registro de alta qualidade do processo
comportamental para inspeo imediata que funciona para os behavioristas de uma
maneira no diferente da que o microscpio funciona para o biologista.
As contribuies metodolgicas reais de Skinner para a cincia moderna do
comportamento so numerosas e podemos apresentar, aqui, somente um esboo de
algumas das mais importantes. Ele reconheceu a antiga dicotomia entre aes reflexas e
voluntrias ou, como chamou mais tarde, operantes. Mas mostrando que o princpio de
Pavlov se aplicava ao fortalecimento dos reflexos, enquanto a lei do efeito de Thorndike
descrevia o fortalecimento de operantes, ele colocou ambos os tipos em perspectiva
harmoniosa. Formulou, tambrq um vocabulrio preciso cujos termos foram definidos
com referncia aos fatores observveis que ele media e manipulava. Nessa terminologia
est a base do nosso quadro conceituai moderno.
Desde o inicio, Skinner enfatizou a importncia da predio e controle detalhados
do comportamento individual, ao invs de diferenas gerais entre grupos de animais. Suas
prprias pesquisas foram invariavelmente caracterizadas por um grande nmero de
medidas em poucos organismos, sendo a reprodutibilidade do processo sob estudo o teste
de sua validade. O enfoque de Skinner na taxa de uma resposta operante representativa
evitou muitos dos problemas associados com as medidas mais indiretas do compor
tamento. Thorndike observou o nmero de erros cometidos e o tempo gasto para
alcanar o sucesso no seu quebra-cabea, mas nenhuma dessas era, na realidade, uma
propriedade real do comportamento instrumental que estava sendo adquirido. Se dese
jamos treinar um co a pular atravs de um aro, por exemplo, no estamos interessados
- 33-

nos erros que ele comete, mas no seu comportamento de pular atravs do aro. Os erros so
medidas de comportamentos outros que no aqueles que estamos investigando. Questes
interessantes sobre se um dado ato ocorrer ou no, ou com que freqncia ocorrer,
nunca poderiam ser respondidas em termos de erros ou escores de tempo. O dado bsico
de Skinner, a taxa de respostas, est relacionado de perto com a probabilidade de
ocorrncia do comportamento e tem sido especialmente til em fornecer respostas a
questes sobre a probabilidade da resposta.
Com o passar dos tempos, Skinner ampliou sua base emprica. Combinaes de
respostas e organismos outras que no o pressionar a barra por ratos tm sido estudadas.
A expectativa original de que este ato seria caracterstico do comportamento operante,
de um modo geral, tem sido aparentemente confirmada. Alm disso, as relaes que
Skinner obteve garantem, em muitos casos, o ttulo de princpios comportamentais, j
que elas parecem manter-se para um grande nmero de organismos, incluindo o homem,
e para todas as respostas que podem ser classificadas como operantes.
O trabalho de B.F. Skinner nos leva a um ponto prximo da nossa conceituao
moderna de cincia do comportamento. Estamos ainda muito perto desse perodo his
trico, muito envolvidos em nosso prprio Zeitgeist, para termos a perspectiva necessria
para determinar os pontos fracos no sistema de Skinner. Nos captulos que se seguem,
todavia, veremos que a cincia do comportamento, atualmente restabelecida de um modo
firme como uma cincia natural, est se expandindo em muitas reas de pesquisas. Talvez,
a prova mais convincente de que essa cincia se desenvolveu encontra-se no surgimento
recente de uma tecnologia do comportamento esboada diretamente a partir dela. Como
veremos, as aplicaes de tcnicas do comportamento esto sendo ampliadas a pesquisas
de drogas, treino de animais, guerras, tratamento do comportamento humano anormal e
educao.
1.9 - REVISO
A histria da cincia do comportamento comea com a classificao naturalstica do
comportamento feita por Aristteles. Logo foi sucedida por uma Filosofia Teolgica e a
anlise do comportamento permaneceu adormecida por quase dois mil anos. Mas no
sculo XVII, surge novamente com a concepo de Descartes de que o corpo animal
uma mquina, e alguns dos seus movimentos so ordenados e regulares. Robert Whytt e
vrias geraes de fisiologistas posteriores mostraram que estes movimentos de
caracterstica automtica se relacionavam, de forma precisa, a eventos particulares nc
ambiente do animal. Essa relao entre um evento ambiental e um movimento particular
torna- e a primeira unidade organizada de anlise para a cincia do comportamento. o
reflexo. Eventualmente, Pavlov amplia o conceito de reflexo para incluir relaes
ambiente-comportamento que so condicionais a operaes anteriores na histria do
animal. Esses reflexos condicionais tornam possvel uma anlise de alguns dos
comportamentos que um organismo adquire durante sua vida. Thorndike o primeiro a
mostrar que o comportamento que possui uma espontaneidade no observada nos
reflexos obedece a certas leis qualitativas que diferem das leis do reflexo. Nessa poca,
John Watson inicia a sua campanha para convencer a Psicologia, o estudo da mente, de
que a mente , em grande parte, comportamento. Com a descoberta de B. F. Skinner de
um objeto de estudo fidedigno, a taxa de respostas operante, o comportamento
espontaneamente emitido comea a desenvolver leis prprias, sendo cada ocorrncia to

-34-

geral e previsvel como aquelas do reflexo. Aiiistria da anlise do comportamento revela


que os homens esto bastante enclinados a adotar interpretaes suprfluas sobre o
com portam ento, ao invs de aceitar a realidade das descries do prprio
comportamento. Quase todo contribuinte da cincia compartilhou de algumas
supersties da sua poca sobre o comportamento que estava pesquisando.
REFERNCIAS PARA O CAPITULO 1.

Boring, E. G. A history of experimental psychology. New York: The


Century Company, 1929.
Darwin, C. R. The expression of the emotions in man and animals.
London: Murray, 1873.
Dennis, W. Readings in the history of psychology. New York: AppletonCentury, 1948. (Chapters 3, 45, 48, and 50.)
Fearing, F. Reflex action: a study in the history of physiological psy
chology. Baltimore: Williams and Wilkins, 1930.
Garrett, H. Great experiments in psychology, New York: AppletonCentury-Crofts, 1951.
Hall, G. S., and Hodge, C. F. A sketch of the history of reflex action.
Am er. J. Psychol., 1890, 3, 71-86; 149-173; 343-363.
Kantor, J. R. The scientific evolution of psychology. Vol. 1. Chicago:
Principia Press, 1963.
Pavlov, I. P. Lectures on conditioned reflexes. New York: International
Publishers, 1928.
Romanes, G. J. Anim al intelligence. (4th ed.) London: Kegan Paul,
1886.
Skinner, B. F. A review of C. L. Hulls Principles of behavior. Am er.
J. Psychol., 1944, 57, 276-281.
Skinner, B. F. The concept of the reflex in the description of behavior.
/. gen. P s y c h o l 1931, 5, 4 27-458.
Thorndike, E. L. Animal intelligence. Psychol. R e v . Monogr. Suppl.
1898, No. 8.
Toulmin, S., and Goodfield, June. The architecture of matter. New York:
Harper and Row, 1962.
Watson, J. B. Psychology as the behaviorist views it. Psychol. R ev.f
1913, 20, 158-177.

-3 5 -

Captulo 2 - COMPORTAMENTO REFLEXO (ELICIADO)

Seria consistente com a nossa argumentao histrica sobre a cincia do compor*


tamento afirmar que a Psicologia a cincia que se preocupa com o modo pelo qual o
comportamento de um organismo est relacionado com o seu ambiente. Talvez a mais
simples dessas relaes comportamento-ambiente seja o reflexo.
Para o fisiologista, o reflexo um fenmeno a ser explicado. Isto , o fisiologista
est interessado nas estruturas anatmicas subjacentes ao reflexo e os eventos corporais
que ocorrem entre o estmulo eliciador e a resposta. Seu interesse baseia-se na compo
sio ou anlise do reflexo. Para o Psiclogo, por outro lado, o reflexo um fenmeno a
ser empregado para explicar outros comportamentos. Isto , o Psiclogo est interessado
em mostrar que padres complexos de comportamento so compostos de, ou podem ser
sintetizados a partir dos reflexos. A distino anlise-sntese mostra de uma vez o ponto
comum e o ponto de partida das duas cincias. A partir do reflexo, as duas disciplinas
movem-se em direes diferentes. Como Psiclogos, desejamos usar o reflexo como um
princpio explanatrio ou como uma unidade de anlise do comportamento mais com
plexo. Portanto, devemos entender algumas das propriedades quantitativas e conceituais
dos reflexos.
2.1 - A FRMULA S - R
Como vimos ao considerar o comportamento reflexo no captulo 1, Descartes e
Whytt representaram o ambiente com o conceito de estmulo. E representaram o com
portamento em termos dos movimentos do organismo ou resposta a este estmulo. Esses
conceitos continuam a ser teis para a descrio de relaes ordenadas entre ambiente e
comportamento. Neste captulo, designaremos o estmulo na relao reflexa pelo
smbolo S e a resposta pelo smbolo R. A regularidade existente na relao entre eventos
ambientais e aes reflexas podem ser resumidas pela frmula.
R 2 = / ( S2)
^ssa frmula diz que uma certa resposta reflexa, R 2 (chamada um respondente). uma
funo de (isto , depende de) um evento estmulo S2 (chamado um eliciador)1. Essa
1. Os n d ices n u m rico s sero esclarecidos no C a p tu lo 3.
-37 -

frmula expressa uma relao ou correlao importante, entre dois eventos. No de


correr deste captulo, examinaremos esta correlao em detalhe.
Um dos experim entos de Sherrington serve de ilustrao. Ele conectou um
msculo da perna de um gato a um aparelho para medir a contrao deste msculo.
Anteriormente, sob anestesia, o crebro do gato havia sido desconectado da medula. (No
estudo dos reflexos, as influncias que no esto sob o controle direto do experimentador so frequentemente removidas cirurgicamente. Neste caso, separar o crebro
da medula espinhal remove qualquer efeito possvel que o crebro possa ter sobre o
msculo em estudo.) Choques eltricos breves de vrias intensidades foram, ento, apli
cados a um nervo sensorial que se sabia estar envolvido em um arco reflexo neste
msculo.
A Fig. 2. 1 ilustra os resultados hipotticos do tipo que Sherrington poderia ter
obtido, medida que aumentasse gradualmente a intensidade do choque em sete tenta
tivas sucessivas. Algumas das propriedades de um reflexo tpico esto representadas: por
exemplo, se observarmos, na Fig. 2.1, que a linha relativa ao tempo se desloca da esquerda
para a direita, observaremos primeiramente que o choque mais fraco (o choque mais fraco e
localizado na extrema esquerda) no elicia um respondente. Valores de choque no
suficientes para eliciar uma resposta . Mas para estarmos certos, apresentamos o mesmo
valor do choque novamente na tentativa 3. Desta vez, obtemos uma resposta. Este valor
do choque se encontra no que chamaremos a regio de penumbra ou limiar: o bastante
forte para, algumas vezes, eliciar um respondente e outras vezes no. Continuando nossas
apresentaes de choque de maior intensidade observamos um nmero de efeitos inte
ressantes: (1) cada apresentao de choque seguida por (elicia) um respondente, (2)
choques eliciadores mais fortes so seguidos por respondentes mais fortes, (3) os respondentes ocorrem mais rapidamente aps eliciadores mais fortes; isto , o tempo entre o
eliciador e o respondente, chamado latncia, menor quando o eliciador mais forte.

latncia longa

r*
i
A

Respondente

regio de penumbra
Choques eltricos
no msculo

T em p o

JL

latncia curta

.k A A h

JL

- ----- 1-----1-----1-----1---- J-----1-----1-----1-----1-----1----- 1J----- Li---------- 1------------- l

Figura 2 1
Seqncia temporal esquemtica de apresentaes repetidas de um
eliciador e a ocorrncia de respondentes associados. A altura dos respondentes indica sua
magnitude. A altura dos eliciadores indica sua intensidade. A distncia entre o aprecimento do eliciador e o aparecimento do respondente representa a latncia. A linha do
tempo feita por um marcador peridico que marca intervalos de tempo iguais e
arbitrrios.
-3 8 -

A descoberta de relaes e propriedades como essas ilustradas na Fig. 2. 1 um dos


objetivos permanentes da cincia. Quando relaes qu se mantm entre os valores de um
evento (tais como intensidades de choque) e valores de outro evento (tais como a mag
nitude ou rapidez de movimento do msculo) podem ser isoladas ou reproduzidas dia
aps dia, experimento aps experimento, frequentemente falamos da regularidade da
natureza. De um modo figurado, estamos dizendo que a natureza parece ser limitada por
certas leis cuja descoberta o principal objetivo da pesquisa cientfica.
Devemos qualificar cuidadosamente essa ltima proposio * todavia, porque parece
certo que as relaes ou leis da natureza no so como conchas numa praia, esperando
por ns para ajunt-las numa cesta cientfica.
Antes de podermos estabelecer leis relacionando nossos conceitos, preciso termos
formulado, pelo menos numa primeira aproximao, os nossos conceitos. A descoberta
das leis do reflexo foram precedidas por quase trezentos anos de uma evoluo gradual
do conceito de estmulo, iniciando-se com Descartes. Ento, a cincia uma operao
similar ao funcionamento de uma armadilha. Em estgios pr-cientficos, nossa intuio e
experincia ingnua levam-nos a suspeitar que uma certa ordem existe na natureza a
especulamos qual a natureza desta ordem. (Por exemplo, consideremos a suposio de
Descartes de que o comportamento involuntrio era como uma mquina.) Ento,
comeamos a perturbar um pouco a natureza, isto , a fazer experimentos e, assim,
mudar o curso natural dos eventos de modo que possamos obter uma idia melhor do
que pode acontecer com um fenmeno particular.
Mas mesmo para fazer um primeiro experimento exploratrio, necessitamos,
geralmente, definir nosso fenmeno de um modo mais preciso, bem como decidir sobre
o que alterar e onde procurar pelos efeitos de nossa alterao experimental. Os resultados
do nosso primeiro experimento permitir-nos-o definir nossos termos ainda mais preci
samente. Deste modo, modificamos continuamente os nossos conceitos. Ao mesmo
tempo, enriquecemo-los, relacionando-os a outras coisas que so conhecidas. Alm disso,
tendo refinado nossos conceitos na base de experimentos, somos levados a novos experi
mentos. Diz-se, s vezes, que um bom experimento responde uma velha questo e levanta
duas novas. No h um ponto final para esse processo (o qual a cincia) uma vez que
estamos continuamente refinando e redefinindo os nossos conceitos e continuamente
relacionando uns aos outros.
2.2 - LEIS DO REFLEXO PRIMRIO
A ordem ou regularidade ilustrada pela Fig. 2-1 est ao nvel de uma das unidades
mais simples do comportamento, o reflexo. Devido ao fato de que esta regularidade
envolve o comportamento dos organismos como a propriedade que sujeita a, ou
sensvel a mudanas no estmulo eliciador, chamamos essas leis de leis do
comportamento.
Os cientistas tentam formular suas leis de um modo to geral quanto possvel. No
estariam satisfeitos em ter uma lei para o efeito de choques eltricos' sobre o msculo da
perna, outra para os efeitos de cidos na boca sobre a salivao e ainda outra para o
reflexo pupilar. Eles preferem expressar suas leis em termos de certas propriedades
comuns a todas essas relaes, de modo que possam abranger uma faixa de fenmenos
to ampla quanto possvel. Assim, quando Sherrington estudou os reflexos, ele fez um
estudo de muitos reflexos envolvendo eliciadores e respondentes diferentes. A partir de
experimentos deste tipo, ele formulou trs leis que podemos chamar as trs leis
-3 9 -

primrias do reflexo. Essas leis no so deformuladas em termos de qualquer eliciador


particular como o choque eltrico, ou de qualquer respondente particular como um
determinado movimento muscular. Elas so, ao invs disso, formuladas genericamente
em termos de estmulos eliciadores (qualquer eliciador) e respostas (qualquer res
pondente). Formulando-as assim, obtemos uma generalidade adequada, mas com sacri
fcios de detalhes particulares. Por exemplo, a relao exata entre a intensidade do
estmulo e a magnitude do respondente varia de reflexo para reflexo. Algumas vezes, a
relao quase diretamente proporcional, de modo que numa ampla faixa de intensidade
de estmulos, dobrando-se a intensidade do estmulo, a magnitude do respondente ser
dobrada, e assim por diante. Em outros reflexos, um aumento de dez vezes na inten
sidade do estmulo seria
necessrio para produzir o dobro da magnitude do res
pondente. Nossas leis do reflexo primrio so expressas de tal forma que essas diferenas
ficam encobertas.
Os eliciadores sempre podem ser especificados por uma dimenso de intensidade.
E n t o , eliciadores do tipo do choque podem ser fracos, moderados, ou de maior
intensidade. Eliciadores do tipo da luz para respostas pupilares podem variar de intensidades
to fracas, que mal podemos ver, a intensidades to altas que a luz torna-se dolorosa. Como
notamos, energias abaixo de um certo nvel na dimenso da intensidade so insuficientes
para eliciar qualquer resposta. medida que a intensidade gradativamente aumentada,
encontramos uma regio em torno da qual valores da intensidade podem ou no eliciar
um movimento. Essa regio de indeterminao onde a intensidade pode ou no ser o
bastante forte para eliciar um respondente a regio de penumbra do limiar. Podemos
formular essa informao mais especificamente numa lei:
1. Lei do limiar. Existe uma faixa de intensidade abaixo da qual nenhuma resposta
ocorrer e acima da qual uma resposta sempre ocorrer. Dentro dessa faixa as respos
tas ocorrero com alguma incerteza. Um ponto arbitrrio, nessa regio de incerteza
(digamos, aquela intensidade que elicia a resposta 50 por cento das vezes) chamado
de limiar, intensidade acima desse ponto so chamados estmulos eliciadores.
medida que a intensidade do estmulo aumentada a resposta ocorre sempre e
graduada em relao ao estmulo. Ento, eliciadores fortes eliciam rapidamente respondentes fortes e de longa durao. Eliciadores fracos so seguidos mais lentamente por
respostas fracas e de curta durao. A maior parte dessa informao pode ser represen
tada por duas leis do reflexo:
2. Lei da Intensidade-Magnitude. A medida que a intensidade de um estmulo eli
ciador aumentada, a magnitude do respondente eliciado tambm aumenta.
3. Lei da latncia. medida que a intensidade do estmulo eliciador aumentada, o
tempo (latncia) entre o aparecimento do estmulo eliciador e o aparecimento do
respondente diminui.
As leis do reflexo so importantes para definir o conceito de reflexo. Pode-se dizer
que um reflexo uma correlao entre uma mudana em parte do ambiente e uma
propriedade comportamental, tal que as trs leis muito especiais que descrevemos
acima sejam vlidas. Esquematicainente, um
reflexo pode ser representado assim
S2 ^ R-2
- 40 -

onde S2 representa um eliciador, > representa causa pelas leis do reflexo e R2


representa a mudana comportamental produzida. Nessa frmula vazia nada dito sobre
como R 2 depende de S2 . Tal frmula pode ser considerada extremamente geral (ela
descreve toda ao reflexa) e muito pouco precisa (ela no especifica os detalhes de
qualquer ao reflexa particular). A seta > pode ser lida elicia, onde elicia defini
do como 'conduz , pelas leis do reflexo . O termo elicia de alguma importncia na
cincia do comportamento porque denota um grupo muito especfico de leis causais
entre ambiente e comportamento, isto , as leis do reflexo. Ento, S2 pode ser dito um
estmulo eliciador, uma mudana no ambiente que est correlacionada com o compor
tamento atravs das leis do reflexo. Similarmente, R 2 *o respondente, definido como
uma resposta eliciada. E til reservar a palavra eliciar para a definio precisa formulada
acima. Nos captulos subseqentes empregaremos o termo estmulo repetidamente em
conjuno com um tipo diferente de controle sobre o comportamento. Mas distinguiremos tal controle pela omisso cuidadosa do qualificador "eliciar" naquele contexto.
2.3 - LEIS SECUNDRIAS DO REFLEXO
Certas leis, chamadas leis secundrias do reflexo, codificam uma informao adicio
nal. Uma delas a lei da fadiga do reflexo. Quando um respondente repetidamente
eliciado muitas vezes por segundo, por uma intensidade de estmulo constante, a mag
nitude do respondente declina gradualmente, e eventualmente a resposta pode cessar de
todo. Esse fenmeno chamado faiiga do reflexo e visto esquematicamente na Fig.
2- 2 .

Pf llririnnnnnri-------------- ------------------

s 2n n n n n n n n n n n n n n n n n n nr i n . n - - - -

Figura2-2. Fadiga do Renexo.

T em po __ 1------1------ 1------ 1------ 1------1------1------1------1------

Um erro comum cometido ao se dizer que o declnio do respondente a zero


devido fadiga. Isto um exemplo de uma explicao inteiramente vazia e deveria ser

evitado. Um fenmeno, (y), parcialmente explicado quando pode ser relacionado a


outro fenmeno, (x), que ocorre anteriormente no tempo. A chuva, (y), parcialmente
explicada quando pode ser relacionada condensao de vapor de gua que ocorre
quando uma nuvem quente rapidamente esfriada, (x). A febre tifide, (y), par
cialmente explicada quando pode ser relacionada s atividades, (x), de um pequeno
microorganismo, a Salmonella typhosa. Mas para explicar que o declnio do respondente,
(y) da Fig. 2-2, devido fadiga, a que (x) o estamos relacionando? A fadiga, usada
neste sentido, uma entidade no observvel - sem qualquer propriedade independente
a ser relacionada ao fenmeno observvel. Esse declnio do respondente a fadiga, e no
devido fadiga.
Outra lei secundria do reflexo a lei da Somao Temporal de Subliminares.
Lembremo-nos de que na Lei do Limiar, apresentaes muito fracas de energias apropria
-41 -

das no eliciam respondentes. Diz-se que esses valores baixos de energia esto abaixo do
limiar, e so chamados subliminares. Todavia, se apresentarmos dois ou mais desses
subliminares em sucesso rpida podemos, sob certas condies, produzir um respondente. Esse fenmeno visto esquematicamente na Fig. 2-3. como se as duas
intensidades subliminares se somassem para formar um nico eliciador. A somao tem
poral, vista na Fig. 2-3, define exatamente o que queremos dizer por esses conceitos que
chamamos de reflexos, estmulos eliciadores e respostas eliciadas.

Figura 2-3. Somao Temporal.

-----* ------------ m --------------------- -------------------

Tempo ------ 1------ 1____i____i------ 1------1____i----- j------ 1------

Podemos notar em relao a isto que a palavra eliciar frequentemente tomada sem
crtica, como sendo idntica a causar. (Por exemplo um estmulo luminoso pode ser
dito causa, de um comportamento pupilar.) O termo causa uma palavra antiga
usada, s vezes, na histria da filosifia e da cincia para denotar uma relao necessria e
suficiente entre eventos. A palavra parece ter sido empregada para descrever um evento
X, sempre que X se relaciona a um evento Y, de tal forma que se h o evento X ento o
evento Y ocorrer; e se no Yf ento no X. Tente essa frmula. Faa de Y um
respondente, digamos uma contrao muscular, causada por um estmulo-choque que
chamamos X. Logicamente, certo que: se o choque, ento a contrao. tambm certo
que, se no observarmos a contrao (no Y ), ento no ter havido um dado estmulo, o
choque (no X). , ento, evidente que, logicamente, um estmulo eliciador pode ser dito
causar uma resposta na ao reflexa, mas tambm claro que essa proposio oferece
pouca informao sobre a natureza exata da relao causai. Em geral necessitaremos de
uma descrio mais detalhada da relao entre o comportamento e suas causas do que
possvel por uma mera proposio da sua sucesso lgica na frmula X e Y. Logo, o
termo eliciar prefervel ao termo causar no presente contexto no porque seja algo
mais objetivo ou lgico que a palavra causar mas porque eliciar contm uma
grande proporo de todas as leis primrias e secundrias do reflexo. Evidentemente,
quando chutamos uma bola causamos sua resposta de viajar no ar. Mas as leis que
governam essa resposta so as leis do movimento, de Galileu eno as leis do reflexo, de
Sherrington.
2.4 -

FORA DO REFLEXO: UM CONSTRUCTO HIPOTTICO

Consideremos uir. dado reflexo, digamos, flexionar o joelho a uma pancada no


mesmo. Em qualquer momento, esse reflexo ter um certo limiar, indicado pela menor
intensidade da pancada necessria para eliciar algum movimento da perna. Alm disso,
em qualquer momento, uma pancada com uma intensidade fixa eliciar um movimento
de uma determinada magnitude, com uma dada latncia entre S2 e R 2 . E ainda, no
mesmo momento podemos conceber que um dado nmero de pancadas ser necessrio
-4 2 -

para fatigar o reflexo. Uma caracterstica importante dos reflexos encontrada na o dservao de que, nos momentos em que o limiar baixp (uma pancada muito fraca
efetiva) a magnitude de R.2 para um dado valor de S2 (padro) ser alta, a latncia ser
curta e o nmero de S2 sucessivos necessrios para fatigar o reflexo ser grande. Ao
contrrio, naqueles momentos em que o limiar alto (uma pancada forte necessria
para qualquer movimento), a magnitude de R2 para um valor padro de S2 ser baixa, a
latncia ser longa e apenas poucos S2 sucessivos sero necessrios para fatigar o reflexo.
Essa associao sistemtica ou co-varincia das propriedades do reflexo (limiar, mag
nitude, latncia, etc.) levaaurna
interessante construo lgica. Somos levados a
identificar essa co-varincia e inferir que existe uma entidade hipottica que intervm
entre o estrtiulo e o respondente. Deduz-se que esta entidade, a ser designada como fora
do reflexo, determina a variao sistemtica, ou co-varincia de cada propriedade do
respondente. No caso do reflexo, o cons true to fora do reflexo definido por essa
co-varincia de tal modo que grandes magnitudes, latncias curtas, limiares baixos, R 2
fatigadas lentamente, etc; representam reflexos fortes. Ao contrrio, pequenas mag
nitudes, latncias longas, limiares altos, R2 rapidamente fatigadas, etc. constituem refle
xos fracos. Note que o constructo no definido exclusivamente em termos dos valores
respondente. Ele incorpora (no limiar) tambm o valor do eliciador. Ento, uma R2 de
graitde magnitude no precisa necessariamente representar um reflexo forte. Ela pode
bem ser o resultado de um reflexo fraco sendo testado com um S2 intenso. O construto
fora do reflexo representado na Fig. 2.4.
Magnitude

Figura 2-4. O construto fora do

Limiar

Diz-se que o construto da Fig. 2-4 hipottico, simplesmente porque no dire


tamente observado. Ningum viu a fora de um reflexo; o que vemos so meramente as
mudanas no comportamento. Mas o fato de mudanas comportamentais estarem corre
lacionadas umas s outras induz-nos a agrup-las como reflexes de uma entidade
nica subjacente. O formar construtos como a ora do reflexo apresenta certos riscos,
particularmente ao se determinar propriedades para o construto hipottico que vo
muito alm das observaes que lhe do origem. Ainda assim a construo hipottica
um tipo importante e persistente de formao de conceito em todas as cincias e sua
justificao encontra-se na sua utilidade. No caso particular da fora do reflexo, ela entra
como um conceito til na formao de outras leis num sistema de comportamento.
(Lembre-se, primeiro devemos ter nossos conceitos, ento, chegar s nossas leis.) Por
exemplo, drogas, doenas do sistema nervoso central e eliciao simultnea de outros
reflexos todos causam mudanas concorrentes nas grandezas que definem a fora do
reflexo. Ento, conveniente representar essas leis correlacionadas por um nico termo,
fora do reflexo. Veremos outros exemplos desse tipo de representao e composio de
relaes em captulos seguintes.
-4 3 -

2.5 - EXEMPLOS COMUNS DE REFLEXOS


s observaes que so resumidas como leis do reflexo so mais facilmente feitas em
msculos cirurgicamente isolados de influncias outras que no aquelas do eliciador em
estudo. Embora estudemos reflexos em msculos cirurgicamente preparados para obter
mos preciso de controle, os reflexos so facilmente vistos em formas qualitativa no
comportamento intacto de todos os animais, desde o homem s espcies mais inferiores. A
ilustrao de Descartes relativa ao retraimento do membro de um homem de uma chama
(ver p. 1) um reflexo humano intacto. Outros so as eliciaes de lgrimas pelo sumo de
cebola, espirro devido pimenta no nariz, flexo do joelho devido a uma pancada no
tendo patelar, descarga de saliva quando alimento colocado na boca, mudana no
batimento cardaco devido a um som alto,e assim por diante. Todos esses reflexos estlo
de acordo com o nosso modelo fundamental, ou paradigma,
S2 > R 2
onde algum S2 elicia algum respondente R 2 ; e se o reflexo pudesse ser apropriadamente
isolado, uma relao como aquela na Fig. 2-1 seria obtida. Alguns exemplos de seqn
cias eliciador-respondente so vistos na Tabela 2.1. Todas as correlaes na Tabela 2.1
so reflexos. Alguns envolvem msculos do esqueleto (espirro, flexionar o joelho, tremo
res), alguns envolvem msculos cardacos (mudanas na taxa cardaca), outros envolvem
glndulas (salivao, lgrimas) e outros envolvem msculos lisos (palidez da pele, mudan
as pupil ares).
Tabela 2.1
SEQNCIA COMUM DE REFLEXOS

NOME DO
REFLEXO

ELICIADOR S2

Lacrimal
Espirrar

sumo de cebola
nos olhos
Pena no nariz,

Patelar

Pancada no joelho

Espirro
Flexo do joelho

Salivar

Alimento na bca

Salivao

Sobressalto

Barulho alto

Taxa cardaca aumenta, mscu


los do esqueleto contraem-se,
pupila dilata-se, :tc.

Tiritar

F rio

Tremor, palidez t

Pupilar

Luz no olho

Contrao pupila

- 44 -

PELAS LEIS DO
REFLEXO CONDUZ

RESPONDRNTE R-,

Lacrimejar

pele

Uma vez ou outra, esses reflexos tm sido chamados de involuntrios, involuntrio um


termo histrico empregado para expressar grosseiramente a natureza automtica e
eliciada de certos comportamentos. Desde a anlise quantitativa de Sherrington sobre o
reflexo, o conceito original de eliciao tem sido bastante refinado. Parece criterioso,
assim, substituir.o mais velho e o mais vulgar dos termos involuntrio pelo mais exato
eliciado , que compreende todas as leis do reflexo em sua definio. Essa substituio
eventual de um termo pobremente especificado, que, com freqncia, foi associado a um
quadro pr-cientfico de referncia, uma ocorrncia comum e tpica na cincia. Por
outro lado, algumas vezes, uma anlise cientfica retem a velha palavra mas imprime-lhe
um significado novo e preciso. A cincia reteve do vernculo as palavras fora em fsica,
elemento em qumica e motivo em psicologia, mas tem mudado e expandido bastante os
seus significados. Mas no sempre fcil separar as conotaes de conceitos prcientficos e, algumas vezes, uma nova palavra ajuda na mudana conceituai. A velha
palavra, ento, ser deixada de lado para morrer lentamente pelo desuso. Tal o caso da
palavra involuntrio em psicologia.
2.6 - VARIABILIDADE NAS MEDIDAS: RESUMO DOS DADOS COM DISTRIBUI
ES DE FREQUNCIA; ESTATSTICA BSICA; A CURVA NORMAL
Um importante passo em direo anlise de qualquer fenmeno natural ocorre
quando certos aspectos deste fenmeno podem ser medidos. Medidas implicam em
nmeros e os nmeros que so registrados pelos pesquisadores sob vrias condies de
observao so o que chamamos de dados quantiativos brutos. Um nmero prodigioso de
medidas ou dados so geralmente coletados no curso de um nicn experimento. Mesmo
uma demonstrao muito casual de uma das leis do reflexo poderia facilmente requerer
at 250 medidas da magnitude do respondente. As numerosas medidas que constituem os
dados brutos de um experimento so inconvenientes. Seu grande volume torna-se de
difcil compreenso, mesmo para o pesquisador que as coletou. Certamente, elas dificil
mente poderiam ser comunicadas em sua forma bruta a uma comunidade cientfica como
um todo. Sob tais presses, desenvolveram-se mtodos de resumir os dados e caracterizlos por alguns de seus aspectos proeminentes. Estas caracterizaes sumrias e descritivas
constituem o que chamamos estatstica descritiva. No restante desta seo, considerare
mos brevemente certos conceitos estatsticos simples considerados teis pelos experimentalistas na descrio e resumo de seus dados.
Suponha que estejamos com a tarefa de determinar a magnitude do respondente
patelar eliciado por uma pancada com uma fora de 70,00 g aplicada no joelho.
Iniciamos sentando nosso sujeito confortavelmente, colocando suas pernas numa posio
padro e aplicando, ento, nossa pancada de 70,00 g num ponto determinado to
precisamente quanto possvel. Prosseguimos, medindo a extenso resultante da flexo do
joelho, anotando a altura mxima (excurso) que a perna alcana, digamos o ponto que o
tornozelo atinge antes de voltar posio original. Suponha que nossa medida da
extenso da perna seja feita com uma rgua comum e que observamos, neste caso, que a
perna percorreu uma distncia de 4,25 cm. Neste ponto, podemos ser inclinados a dizer
que a magnitude do flexionar o joelho para um eliciador de 70,00 g de fora e 4,25 cm.
A cincia, geralmente, nunca se contenta com observaes no replicveis e, desta
forma, somos levados a repetir nossas operaes simples. Podemos, ento, voltar a eliciar
o reflexo e medir novamente a magnitude do respondente por vrias vezes, anotando

45-

cada vez o resultado numnco das nossas operaes de medida. Embora tenhamos siao
cuidadosos em bater no mesmo ponto cada vez, em chegar a posio original da perna e
em dar ao sujeito um descanso breve entre as pancadas, observamos contudo, que a
magnitude do respondente 4,25 cm numa tentativa, 4,12 cm em outra, e 431 numa
terceira. Ficamos um tanto perdidos em relao a qual medida particular devemos relatar
como sendo o valor verdadeiro da magnitude do respondente a uma pancada de 70,00 g.
O que foi iniciado como uma simples tarefa tomou-se mais complicado do que
supnhamos originalmente.
Suponha agora que decidamos fazer algum tipo de mdia de nossas medidas e chamar
essa mdia a magnitude do respondente a uma pancada de 70,00 g. Somamos nossos
valores
4,25
4,12
4,31
12,68
e, ento, para dar a cada medida uma representao igual na mdia, dividimos pelo
nmero de medidas que temos, neste caso, 3. Obtemos o seguinte nmero 4.2266... uma
vez que no era possvel originalmente ler nossa rgua mais do que 0,10 arredondamos
nossa resposta para duas casas decimais, relatando a magnitude da flexo do joelho como
4,23 centmetros.
Mas considere agora o que realmente foi feito atravs de uma coisa simples como tirar
a m dia das m edidas. Com que base -nos permitido somar os nossos valores
e dividir pelo nmero de medidas e chamar isso o valor verdadeiro? Descobriremos
que a questo no facilmente respondida. Porque no escolhemos, por exemplo, o
resultado intermedirio entre todas as medidas como o "verdadeiro", neste caso 4,25 ?
Uma dificuldade ainda mais importante apresenta-se quando tentamos medir
novamente a flexo do joelho no dia seguinte e descobrimos que, embora nossas medidas
sejam novamente prximas umas das outras (digamos, 4,00, 4,25, 4,19), elas no so
exatamente os mesmos valores que os do dia anterior. Que nmeros tomaremos agora
como o valor verdadeiro do respondente para 70,00 g? . No somente os erros de medida
presentes, mas condies no controladas tais como temperatura, umidade e o quanto
nosso sujeito dormiu na noite anterior podem estar afetando nossas medidas. No
provvel que possamos sempre controlar completamente todas as influncias que tm um
efeito perturbador em nossas medidas. Somos forados, por fim,a concluir que o valor
verdadeiro do respondente apenas fictcio e que no existe nenhuma operao para
descobr-lo.
Na prtica, naturalmente, a situao no to ruim quanto a tornamos aqui. De fato,
nossas medidas so todas razoavelmente prximas uma das outras e frequentemente
podemos computar apenas tal mdia, ou mdia aritmtica. Uma vez tendo essa mdia
aritmtica computada, podemos tom-la como nossa melhor estimativa da magnitude do
respondente e considerar como irreal nossa procura de um e somente um valor
verdadeiro.
A mdia ou mdia aritmtica um dos conceitos mais primitivos da estatstica
embora comum em todas as cincias. Este conceito torna possvel a abstrao de um
valor, a partir de um nmero de medidas repetidas, o qual tomado para representar
todo o grupo de medidas. Ento, podemos medir vrias vezes o ponto de ebulio do

46-

lcool etlico e concluir que o ponto mdio de ebulio igual a 78C. Ou, podemos
observar, durante uma hora, a freqncia de carros que atravessam uma ponte em
intervalos de 5 minutos sucessivos e concluir que a taxa mdia igual a 31 carros por 5
min. Justificamos esta mdia apelando para certas propriedades gerais das medidas que
examinaremos agora.
A justificativa para o uso de uma mdia melhor observada olhando-se de perto
algumas propriedades das medidas repetidas de R2- Suponha que obtivemos 20 valores
para a magnitude de R 2 , em centmetros, que so registrados na Tabela 2-2.
Tabela 2-2
MAGNITUDE DE RESPONDENTES DE FLEXIONAR O JOELHO, EM CENTME
TROS, EM 20 APLICAES SUCESSIVAS DE UMA PANCADA NO JOELHO
TENTATIVA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

EXCURSO R2 EM CENTlkETROS
4,25
4,12
4,31
4,00
4,25
4,19
3,96
4,05
4,12
4; 19
3,88
4,25
4,19
4,19
4,12
4,05
4,31
4,44
4,20
3,92

Desejamos agora apresentar ou representar esses dados brutos numa forma que
revelar algumas de suas propriedades, primeira vista. Para esse objetivo, a primeira
manipulao que frequentemente se mostra til agrupar as medidas em classes mais
amplas do que aquelas nas quais so originalmente dadas. Suponha que agrupemos os
resultados da Tabela 2-2 em categorias de dcimos de centmetro. Ento, poderamos
estabelecer o grupo de categorias mostrado no lado esquerdo da Tabela 2-3. Essas
categorias tm uma faixa de um dcimo de centmetro. Na Tabela 2-3 os nmeros das
tentativas em que o respondente ocorreu numa dada categoria so colocados na coluna
do lado direito.
-4 7 -

A Tabela 2-3 reduz nossos dados a 7 categorias de 3,80 a 4,49. As 20 medidas


individuais iniciais foram reduzidas a 7 categorias de medidas. Perdemos alguma preciso
(4,00 no pode mais ser distinguido de 4,05 na Tabela 2-3), mas ganhamos alguma
economia na representao. O ganho no grande com apenas 20 medidas originais, mas
seria muito grande se tivssemos comeado com 20.000.
Tabela 2-3
REAGRUPAMENTO DAS MEDIDAS DA TABELA 2-2 EM CATEGORIAS MAIS
AMPLAS
(1/10 cm)
CATEGORIA
3,50
3,60
3,70
3,80
3,90
4,00
4,10
4,20
430
4,40
4,50
4,60

-3 ,5 9
-3 ,6 9
-3 ,7 9
- 3 ,8 9
- 3 ,9 9
-4 ,0 9
-4 ,1 9
- 4 ,2 9
-4 3 9
- 4 ,4 9
-4 ,5 9
-4 ,6 9

TENTATIVAS NAS QUAIS O RESPONDENTE


CAI NUMA CATEGORIA PARTICULAR

11
7 ,2 0
4 ,8 ,1 6
2,6,9,10,13,14,15
1,5,12,19
3,17
18

Um outro sumrio til poderia ser feito se nossos dados fossem mostrados
graficamente. Um nmero de esquemas visuais tem sido sugerido como auxilio na
representao de dados do tipo que temos aqui. Consideremos uma classe deles.
possvel, em primeiro lugar, espaar regularmente os vrios valores de nossos grupos de
medidas numa linha horizontal, chamada o eixo do x ou abscissa. Segundo, podemos
colocar uma linha vertical que intercepta a abscissa (chamada o eixo do V, ou ordenada)
para representar o nmero ou freqncia de medidas. Dessa maneira, se colocamos um x
para cada uma de nossas medidas em tal referncia (chamada um sistema de coordenada
Cartesiana ou retangular) obteremos a representao pictorial da distribuio dos valores
vista na Fig. 2-5.
Alguns aspectos da Fig. 2-5 so de interesse particular. Primeiro, notamos que exis
tem exatamente 20 X. Ento, cada medida aparece como um nico X na Fig. 2-5 e o
nmero total de X o nmero de medidas tomadas.
Um segundo aspecto da Fig. 2-5 a sua forma. Parece avolumar-se em volta de um
valor central e ser grosseiramente simtrica. Essa caracterstica de muitas medidas
repetidas justifica o uso de um nico valor mdio para resumir todo o grupo de medidas.
Atrs desse valor mdio , tacitamente se esconde uma figura mais ou menos como a
Fig. 2-5. Diz-se que o nmero que indica o valor prevalente de uma distribuio de
freqncia, tal como a Fig. 2-5, representa um ndice da chamada tendncia central da
distribuio. Mas podemos notar que existem vrias possibilidades de escolha para ndices
-

48-

de tendncia central. Dessas, uma simples seria escolher a categoria contendo maior
freqncia (maior nmero de X). Quando se escolhe o valor da tendncia central dessa
Ordenada

TItJ
t

Figura 2-5. Medidas hipotticas da


flexo do joelho (categorizadas em
dcimos de centm etro) representa
das como uma distribuio de fre
qncia num sistema de coordenadas
retangulares.

10

.o
o
n

Moda

X
X
X
XX

XXX

XX XXX
X X X X X X X.
1.0

- Abscissa

2.0

Magnitude da flexo do joelho


(centmetros)

maneira diz-se que se encontra a moda da distribuio. No presente caso, a moda a


categoria 4,10 4,19, porque contm 7 medidas, nmero este maior do que qualquer
outra categoria (ver Fig. 2-5). Um segundo tipo de ndice de tendncia central obtido,
isolando-se a categoria de medida particular que tem o mesmo nmero de medidas abaixo
e acima dela. Tal estatstica de tendncia central chamada o valor mediano da
distribuio. A categoria mediana dos dados presentes est na categoria 4,10 4,19,
porque pode ser encontrado um valor nesta categoria que seria maior do que os 10
valores inferiores e menor do que os 10 superiores.
O terceiro tipo, conhecido como mdia, o que calculamos previamente somando as
medidas e dividindo pelo nmero total de medidas. No caso presente, esse ndice, ou
mdia aritmtica, cerca de 4,15.
Qual desses trs ndices representa o mais prximo da magnitude real do
respondente? Nenhuma resposta geral possvel para esta questo porque a magnitude
real do respondente uma quantidade fictcia. A nica maneira disponvel para se
avaliar a magnitude do respondente obter-se medidas repetidas dele sob condies to
constantes quanto possveis.
Essas medidas seriam como aquelas representadas pela Fig. 2-5. Se precisssemos de
um nico nmero para resumi-las, o melhor que poderamos fazer seria calcular um ou
mais ndices de tendncia central. No caso presente, a forma simtrica nos assegura que
qualquer desses trs ndices concordar aproximadamente, mas, em algumas distribuies
contendo umas poucas medidas muito distantes da moda (tal como na distribuio de
rendas nos Estados Unidos onde poucas pessoas so muito ricas mas a maioria do povo
est agrupada em torno de um ponto central), a mdia aritmtica deslocada em
direo s poucas enquanto a mediana menos afetada e a moda no perturbada.
A distribuio da Fig. 2-5 convenientemente representada por (A) ou(B )daFig.
2-6. Em (A) os X foram substitudos por barras cujas alturas so proporcionais
frequncia real, f. A parte (A) chamada um histograma e ser empregada com
freqncia na descrio de dados comportamentais nos captulos subseqentes. Em(B),
os X foram substitudos por linhas retas conectando a altura de cada categoria. A parte
(B) chamada um polgono de freqncia. Ambas as respresentaes vistas na Fig. 2-6
so apenas maneiras alternativas de representar distribuies de frequncia.
Em todas as distribuies de freqncia, os ndices de tendncia central assumem
grande importncia.
-49 -

3,50
4 ,5 0
Magnitude da flexo do joelho
(centmetros)
Figura 2-6. Mais duas representaes de
distribuies de freqncia (A) como
histogram a e (B) como polgono de
freqncia. Os dados so derivados da
Figura 2-5.

Magnitude da flexo do joelho


(centmetros)
(B) Polgono de Freqncia

Mas outra propriedade importante das distribuies de frequncia o espalhamento das


medidas, tecnicamente chamado sua disperso. Consideremos as duas distribuies de
magnitude do respondente da Fig. 2-7. tomadas, digamos, de dois sujeitos diferentes.
Ambas as distribuies tm medidas de tendncia central idnticas (mdias, medianas e
modas). Mesmo assim, elas diferem de maneira to bvia que seria interessante ter-se um
ndice sumrio para caracterizar esse tipo de diferena. Notemos, antes de tudo, que a
diferena entre as duas curvas da Fig. 2-7 grosseiramente a de "espalhamento. Mas,
logicamente, o espalhamento de uma distribuio est relacionada com a variabilidade
das medidas que contm. Quanto mais variveis nossas medidas e mais elas diferirem umas
das outras, maior ser o espalhamento. Uma estatstica simpes, embora grosseira, para
resumir o espalhamento ou disperso de medidas

Figura 2-7. Distribuies de duas


freqncias com tendncias centrais
idnticas e disperses diferentes.

Magnitude de R 2

pode ser calculada, descobrindo-se a maior (em nossos dados originais do reflexo 4,44) e
subtraindo desta o menor escore obtido, 3,88. Com tais dados mo, a operao resulta
num valor 4,44 3,88 = 0, 56. Tal estatstica chamada amplitude da distribuio. A
amplitude fcil de ser calculada, mas no to til como desejaramos. Sua dificuldade
que uma nica medida muito extrema muda-a drasticamente. Por essa razo, preferimos
dizer que a amplitude uma estatstica que no tem estabilidade.
Outra medida mais sofisticada da disperso de uma distribuio possvel,
aproximando-se, em primeiro lugar, os dados resumidos pelas Figs. 2-5 e 2-6 com o tipo
de curvas matematicamente suaves, em forma de sino, vistas na Fig. 2-7. Essas curvas
suaves so simtricas e so chamadas curvas normais. O estudante curioso pode muito
bem estar interessado em saber como essas curvas suaves da Fig. 2-7 foram descobertas,
mas infelizmente sua derivao matemtica no pode ser tratada aqui. Devemos nos
contentar em dizer que elas parecem aproximar, razoavelmente bem, muitos tipos de
medidas repetidas, das quais nossa magnitude do respondente uma. Um ndice
adequado para a disperso ou variabilidade pode ser encontrado atravs do exame
acurado da forma das duas curvas da Fig. 2-7. Se iniciamos no extremo mais esquerda
de cada curva, devemos observar que, inicialmente, a curva cncava crescente. Ento,
para ambas as distribuies, a curva passa atravs de uma regio em que quase uma
linha reta. Finalmente, continuando em direo direita, as curvas adquirem uma forma
cncava decrescente, alcanando eventualmente, um mximo no ponto rotulado de
mdia. J que essas curvas normais so simtricas, uma anlise correspondente pode ser
feita iniciando-se na extremidade direita e movendo-se para a esquerda. Os dois pontos
simtricos em que as curvas mudam de concavidade crescente para concavidade
decrescente so chamados os pontos de inflexo e esto localizados nas setas horizontais
na Fig. 2-7. Esses pontos localizados tomam-se bons marcos para caracterizar a disperso
das distribuies (compare a distncia entre os dois grupos de setas da Fig. 2-7 colocados
nesses pontos). E, embora sejam difcies para um julgamento a lho n, no difcil
calcul-los a partir de medidas reais.
Deveria ser notado que os pontos de inflexo esto relacionados mdia da
distribuio, tal que quanto maior disperso de uma curva normal, tanto mais dis
tante da mdia esto esses pontos. Em outras palavras, quanto maior a disperso, mais
os pontos de inflexo sero desviados da mdia. Essa idia de desvio est includa
no nome usualmente dado aos pontos de inflexo da curva normal, os pontos de
desvio padro. O desvio padro (abreviado 0 , ou sigma) a distncia da mdia a qual
quer um dos pontos de inflexo. A grande vantagem desses pontos como ndices de
disperso da distribuio sobre outras medidas (por exemplo a amplitude) que eles
dividem a distribuio normal de uma maneira extremamente til, como visto na
Fig. 2-8. Em particular, o resultado que para dados que podem ser aproximados
por uma curva normal, cerca de 34 por cento das medidas cairo na regio entre
1 O e a mdia; e cerca de 34 por cento cairo na regio + 1 O e a mdia. Assim, cerca,
de 68 por cento das medidas estaro contidas dentro da mdia de 1 10. Similarmente,
cerca de 95 por cento estaro contidas dentro de _ 2 Qe acima de 99 por cento dentro
de 3Q. Ento, existe uma relao bastante exata entre o desvio padro e a percentagem
de medidas a serem encontradas nas diferentes regies da curva, um fato no verdadeiro
para a amplitude ou outras medidas comuns de variabilidade. Mtodos de computao
para estimar qualquer grupo de medidas so encontrados em numerosos textos ele
mentares de estatsticas e no sero descritos aqui.
- 51 -

Figura 2-8. Curva normal dividida por seu desvio padro, mostrando a porcentagem de
medidas contidas em cada regio.

Transformaes para distribuies de freqncia relativa. Uma transformao muito


til e simples frequentemente feita nas medidas originais quando se lida com
distribuies. Em vez de se fazer diretamente grficos do nmero real de eventos numa
dada categoria, frequentemente divide-se o nmero observado numa dada categoria pelo
nmero total de medidas que se tem. O resultado dessa operao sempre um nmero
menor do que ou igual a 1, que chamado a freqncia relativa desta categoria. Por
exemplo, com referncia Tabela 2-3, podemos dividir o nmero total de medidas na
categoria 4,20 - 4,29 (4) pelo nmero total de medidas (20) e obteremos 4/20 - 0,2, a
freqncia relativa nessa categoria particular. Uma maneira til de pensar sobre a
freqncia relativa consider-la como a proporo das medidas totais que ocorrem
numa dada categoia. Se multiplicarmos este nmero por 100, obtemos a percentagem de
todas as medidas que caem na categoria particular. Um grupo de tais percentagens, ou
freqncias relativas, fornece-nos uma maneira conveniente para comparar duas
distribuies quando o nmero total de medidas em cada uma no necessariamente o
mesmo. Note que a curva da distribuio de freqincia relativa ou de distribuio de
percentagem tem o mesmo modelo, ou forma, que a curva de distribuio das freqncias
reais observadas da qual ela foi derivada.

EXERCCIO 1:

-52 -

Transforme a distribuio da Fig. 2-5 numa distribuio de freqncia


relativa.

Captulo 3 -

CONDICIONAMENTO PAVLOVIANO

Por volta de 1903, PAVLOV, fisiologista russo, interessou-se pelo fenmeno que
primeiro chamou de secrees psquicas.. Pavlov descreve o ponto de partida de suas
pesquisas na seguinte citao:
Se alimento ou alguma substncia rejeitvel colocada na boca, uma secreo de
saliva produzida. O objetivo dessa secreo , no caso de alimento, alter-lo
quimicamente, e no caso de uma substncia rejeitvel, dilu-la e remov-la da boca.
Este um exemplo de um reflexo que ocorre devido s propriedades fsicas e
qumicas de uma substncia quando ela entra em contato com a membrana mucosa
da boca e lngua. Mas, alm disto, uma secreo reflexa semelhante evocada quan
do essas substncias so colocadas a uma distncia do co e os rgos receptores
afetados so apenas aqueles do olfato e da viso. Mesmo o recipiente no qual o
alimento dado suficiente para evocar um reflexo alimentar completo em todos os
seus detalhes; e, alm disto, a secreo pode ser provocada mesmo pela viso da
pessoa que trouxe o recipiente, ou pelo rudo de seus passos . (Pavlov, 1927, p. 13).
Desde o incio, estava claro para Pavlov que algum tipo de associao entre o reflexo
salivar S2 > R 2 e eventos arbitrrios como vasilhas de alimento e rudo de passos era
responsvel pela capacidade destes evocarem secrees psquicas . A primeira e mais
importante contribuio de Pavlov para a cincia do comportamento foi sua descrio e
elaborao das condies necessrias e suficientes para essa associao. Atravs de um
estudo sistemtico do respondente salivar de ces, Pavlov descobriu que, se qualquer
mudana ambiental arbitrria (digamos. S j) precedia direta e exatamente o reflexo
eliciador de salivao, S] poderia por si s vir a produzir a salivao.
3 1 - REFLEXOS CONDICIONADOS E A NATUREZA DE UM EXPERIMENTO
Examinaremos com detalhes um experimento realizado por um dos discpulos de
Pavlov (Anrep, 1920) como exemplo do mtodo Pavloviano e os resultados que levaram a
essa concluso importante. A Fig. 3-1 mostra a situao experimental empregada por
Pavlov e seus colegas no Instituto de Medicina Experimental em Petrogrado (hoje Leningrado). Ele bem descrito por Keller e Shoenfeld:

-5 3 -

Figura 3-1. Representao de uma situao Pavloviana para


condicionar a resposta salivar num co (Paviov, 1928).

Em primeiro lugar, familiariza-se um co normal com a situao experimental at


que no apresente nenhum distrbio quando colocado em arreios e deixado sozinho
numa sala especialmente construda para eliminar estmulos indesejveis externos.
Uma pequena abertura ou fistula feita na pele da mandbula, perto do conduto de
uma das glndulas salivares. Quando a fistula cicatriza, um tubo de vidro cuidado
samente cimentado externamente na fistula de modo a drenar a saliva sempre que a
glndula for ativada. Do funil, a saliva ento flui para um vidro ou cai, gota a gota,
numa plataforma de registro levemente equilibrada. A magnitude das respostas aos
vrios estmulos pode ser medida pelo volume total ou nmero de gotas secretadas
num dada unidade de tempo. O experimentador, que fica sentado numa sala ad
jacente, pode fazer suas medidas, aplicar os estmulos desejados (incluindo alimento)
e observar o comportamento do co atravs de uma janela (Keller e Schoenfeld,
1950, pp. 16-17).
O experimentador tem, ento, condies para medir precisamente o reflexo salivar.
tambm capaz de controlar cuidadosamente a apresentao de vrios eventos estmulo
para o organismo.
Num experimento realizado por Anrep (1920), um tom soava na sala do animal por
5 seg. Dois ou trs seg mais tarde um pouco de alimento era dado ao co. Esse empareIhamento de tom com alimento foi repetido depois de intervalos que variavam de 5 a 35
min. A fim de observar o efeito de um tom sozinho, o experimentador ocasionalmente,
apresentava-o por 30 seg. desemparelhado do alimento. No curso de 16 dias, foram feitas
50 associaes alimento-tom e 6 testes do tom. Os principais dados do experimento de
Anrep foram obtidos durante os 6 testes apenas com o tom. Durante esses testes, ele
mediu cuidadosamente o total de gotas de saliva e o tempo entre o aparecimento do tom
de 30 seg. e a primeira gota de saliva. A Tabela 3-1 apresenta os dados.
- 54 -

Tahela 3-1
AQUISIO DE UM RESPONDENTE SALIVAR A UM TOM
(DADOS DE ANREP, 1920)

NMERO DE EMPARELHAMENTOS
PRVIOS DE ALIMENTO-TOM

TEMPO DECORRIDO
ENTRE O APARECIMENTO
DO TOM E A
GOTAS DE SALIVAO SUBSEQUENTE
(SEGUNDOS)
SALIVA

1
10
20
30
40
50

0
6
20
60
62
59

18
9
2
1
2

V-se na Tabela que, depois de um emparelhamento alimento-tom, a apresentao do


tom sozinho no produziu salivao. Depois de 10 emparelhamentos, todavia, 6 gotas
apareceram no teste com o tom sozinho, e a primeira dessas 6 gotas apareceu 18 se
gundos depois do aparecimento do tom do teste. Depois de 20 de tais emparelhamentos,
20 gotas foram produzidas e a primeira gota demorou s 9 seg. para aparecer. De 30
emparelhamentos em diante, aproximadamente 60 gotas de saliva foram obtidas para
cada teste e, ento, elas comearam a aparecer um ou dois segundos depois do apareci
mento do tom do teste. Os resultados do experimento so claros. A salivao ocorre
exatamente a um tom selecionado, arbitrariamente, depois que este emparelhado 30
vezes com alimento.
O processo pelo qual um tom adquire a capacidade de produzir uma resposta salivar
por si mesmo, medida que os emparelhamentos com alimento aumentam, chamado
condicionamento. Pavlov viu uma semelhana prxima entre essa nova correlao de
tom com salivao e a ao reflexa comum e foi levado, assim, a chamar essa nova
correlao de reflexo condicional (pobremente traduzido como um reflexo con
dicionado). Vemos nas palavras seguintes porque ele fez isto:
Denominei esses novos reflexos, reflexos c o n d i c i o n a d o s , para distingu-los dos inatos
ou reflexos incondicionados. O emprego do termo condicionadocada vez mais
torna-se generalizado e penso que seu uso totalmente justificado. Isto porque,
comparado com os reflexos inatos, esses novos reflexos realmente dependem- de
muitas condies, (ital. adicionados) tanto sua formao como na manuteno de
sua atividade fisiolgica. Naturalmente, os termos condicionado e incondicionado
poderiam ser substitudos por outros de igual mrito. Ento, por exemplo, podemos
conservar o termo reflexos inatos e chamar o novo tipo de reflexos adquiridos; ou
-5 5 -

chamar os primeiros de reflexos da espcie", uma vez que so caractersticos das


espcies e os ltimos de reflexos do indivduo, j que eles variam de animal para
animal numa mesma espcie, e no mesmo animal variam em ocasies diferentes e sob
diferentes condies (Pavlov, 1927, p. 25).
3.2 - O PARADIGMA PAVLOVIANO: UM MTODO ESQUEMTICO DE REPRE
SENTAR O CONDICIONAMENTO.
O princpio do reflexo condicionado convenientemente resumido por um modelo
simples de estmulo-resposta, ou paradigma. Os elementos do paradigma so os dois
reflexos iniciais e um novo reflexo condicionado desenvolvido.
Representemos os reflexos nos quais o condicionamento est baseado como
Si -> Ri e S2 > R2- No procedimento de Pavlov, Si precede S2 . Se ignorarmos
0 respondente a S i , esse emparelhamento pode ser representado como
Si
S2 -> R 2
De acordo com o princpio de Pavlov, depois de um nmero de emparelhamentos
(S1 )S2; S 1,S 2; S 1,S 2 ;...)
Sj passa a evocar uma nova resposta, a resposta con
dicionada (CR) no diagrama f 3.11*

CR

[3-11

O diagrama [3.1] conhecido como o paradigma pavloviano, e representa esquematicamente o procedimento e os resultados do condicionamento pavloviano ou
dssco
O Diagrama [3:11d uma descrio esquemtica ou simblica de certos aspectos do
paradigma, mas podemos desejar uma especificao mais completa. Como um guia til
para resumir o paradigma pavloviano, assim como muitos outros paradigmas comportamentais que sero descritos em captulos subsequentes, introduziremos uma repre
sentao estrutural, de quatro partes, de tais paradigmas. Em geral, todo paradigma
coinportamental consistir de um Dado, um Procedimento, um Processo e um Resultado.
Neste quadro de referncia, o paradigma pavloviano funciona como se segue:
DADOS: dois eliciadores S\ e S2
PROCEDIMENTO: emparelhamento repetido de S\ com S2 , sempre na ordem S 1 ,
$2>^1 ^25
PROCESSO: S \ passa gradualmente a controlar a nova resposta (CR), que pode se
assemelhar R 2 de S2 .
RESULTADO: Si elicia seguramente uma CR.

- 56-

Note certas caractersticas de tal paradigma. O Dado frequentemente contm umo


descrio do estado comportamental anterior ao Procedimento. Aqui, necessrio ter-se
dois eliciadores, ou dois reflexos intactos, antes que se possa comear. O Procedimento
uma descrio suscinta do que os experimentadores fazem. (Notaremos, com freqncia,
que til representar o aspecto do procedimento de nossos paradigmas comportamentais
atravs de smbolos). O Processo diz brevemente o que acontece no tempo com os
aspectos significativos do comportamento, medida que aplicamos o nosso proce
dimento. Uma descrio de um processo compor tamental adquire, tipicamente, a forma
de um grfico, com o tempo no eixo horizontal (X) e alguma propriedade do compor
tamento do organismo no eixo vertical (Y). Discutiremos isso mais completamente numa
seo posterior. Finalmente, o Resultado o estado final do processo. Quando o compor
tamento cessou de mudar significantemente sob o determinado procedimento, o resul
tado foi alcanado. Nas subsees seguintes, elaboraremos alguns dos mais importantes
aspectos do paradigma pavloviano.
A reiao de CR com R2. Podemos considerar um acidente histrico o fato de Pavlov
iniciar sua pesquisa sobre o condicionamento com um reflexo que gerava uma CR muito
semelhante R2,incondicionada. Tanto CR como R 2 envolvem a produo de secreo
das glndulas salivares. Realmente, no provvel que o observador casual detecte qual
quer diferena entre a salivao condicionada e a incondicionada. A similaridade entre
CR e R 2 no reflexo salivar , provavelmente, responsvel pela crena geral, perpetuada
at aos tempos modernos, de que CR R2- Mas Pavlov sabia que isto no era verdade.
No somente a magnitude de CR era diferente de R 2 , mas a composio qumica real da
saliva diferia entre CR e R 2 . Pavlov preferiu ignorar as diferenas entre CR e R2 e se
concentrar nas similaridades. Isto frequentemente uma estrategia segura na pesquisa
cientfica preliminar Foi o gnio de Galileu que o permitiu ignorar as pequenas dife
renas na velocidade de queda de objetos leves e pesados em favor de uma teoria que os
idealizava caindo na mesma velocidade. Ele fez isso em face de uma teoria bem esta
belecida da natureza que exigia exatamente a concluso oposta. Ao formular um
princpio terico que afirmava ser CR = R 2 , Pavlov estava empregando a estratgia de
Galileu de ignorar pequenas diferenas. S i,ele sups, passa a eliciar o respondente de S2
como um resultado de seu emparelhamento com S2P^sse princpio, conhecido como o princpio de substituio de estmulo (Sj substitui
S2 ), tinhauma grande atrao em termos de suas aparentes (1) generalidade, (2) sim
plicidade, e (3) capacidade para explicar outros fenmenos. Uma vez que estes aspectos
so caractersticos dos nossos melhores conceitos na cincia, no surpreendente que o
princpiode substituio de estmulo fosse adotado por John Watson e outros primeiros
behavioristascomo base paraexplicar todo comportamento. Na substituio de estmulo
eles pensavam ver o mecanismo subjacente aos padres complexos de comportamentos
aprendidos e hbitos compostos. Consideremos o programa arrojado de Watson para'uma
anlise experimental do comportamento: dado o estmulo, podemos predizer a resposta;
iada a resposta, podemos predizer o estmulo .Neste quadro de referncia era natural
considerar a ligao dos novos estmulos com as velhas respostas (substituio de
estmulo) como um princpio poderoso para criar novas seqncias de comportamento.
Watson acreditava que o comportamento complexo humano e animal representava o
embasamento e a composio de reflexos condicionados. Devido importncia terica da
substituio de estmulo nas teorias de Pavlov e Watson, os pesquisadores posteriores
ignoraram as diferenas entre CRs e &2S Por algum tempo. Contudo, por duas razes, o
princpio da substituio, de Pavlov, no resistiu ao teste do tempo.
-5 7 -

(1) Embora Watson propusesse que todo comportamento poderia ser visto como
uma interao e composio de reflexos condicionados, a proposio no conduziu a
novas formas poderosas de prever e controlar o comportamento. O teste de todos os
conceitos cientficos o seu emprego na previso, controle e organizao da matria prima
da natureza. No incio, a substituio de estmulo parecia ser til para ordenar o
comportamento, mas medida que os anos se passavam ela permanecia estril na previso
e controle. Mesmo os homens que o haviam empregado muito entusiasticamente
comearam a duvidar de sua natureza fundamental. Eventualmente, com uma nova ex
plorao da lei do efeito de Thorndike, tornou-se claro que grande parte do com
portamento no cabia dentro do modelo Pavloviano. Mas esta uma histria que fica
para o prximo captulo.
(2): medida que dispunha de mais e mais informaes sobre o condicionamento
descobriram-se casos em que a CR era apenas ligeiramente diferente de R2 mas, em
alguns casos era exatamente o oposto. Um experimento realizado por Notterman,
Schoenfeld e Bersh (1952) empregando sujeitos humanos ilustrativo. No seu estudo, S]
era um tom audvel e S2 um choque eltrico suave, liberado na mo esquerda do sujeito.
Esses pesquisadores mediram a taxa cardaca respondente com um aparelho um pouco
diferente do conhecido como um eletrocardigrafo familiar em muitos consultrios
mdicos. Em vez de manter seus sujeitos numa situao pavloviana (Fig. 3-1), eles
sentaram-nos em cadeiras comuns, instruindo-os para permanecerem to quietos quanto
possvel por cerca de 90 min. Durante este perodo, os experimentadores registravam a
taxa cardaca de seus sujeitos enquanto apresentavam tons e choques. Notterman,
Schoenfeld e Bersh encontraram evidncia clara de uma taxa cardaca (CR) depois de 11
emparelhamentos de choque e tom. Todavia, enquanto a resposta incondicionada ao
choque (R 2 ) era uma acelerao da taxa cardaca, a resposta condicionada (CR) envolvia
uma diminuio dessa taxa. Embora um trabalho posterior (Zeaman e Smith, 1965)
mostre que as diferenas entre CR e R2 na taxa cardaca esto estritamente relacionadas
a diferenas respiratrias correspondentes, a disparidade entre as formas dos
comportamentos condicionado e incondicionado permanece.
Exemplos extremos como este levaram-nos a ver de uma forma diferente o
condicionamento pavloviano ou clssico. Em quase todos os casos de uma suposta
substituio de estmulo, existem diferenas marcantes entre CR e R2- Em muitos casos,
elas estavam ocultas devido as medidas grosseiras tomadas quando os pesquisadores
estavam somente interessados no condicionamento como um fenmeno de substituio.
Abreve histria da substituio de estmulo exemplo interessante do crescimento
contnuo da cincia. Um conceito pode influenciar por alguns anos ou dcadas porque
parece fornecer comorto intelectual e prometer a ordem da natureza. Mas, a menos que
cumpra a sua promessa, eventualmente, ele dar lugar ao peso da evidencia experimental.
Durante seus dias de glria, todavia, tal conceito pode dirigir pesquisas de maneiras que
efetivamente colocam vendas nos cientistas em relao a fraqueza do conceito. quase
como se, para dar ao conceito uma chance, ignoremos por um tempo, certas discrepncias, certa indeterminao em sua definio. Essa permissividade temporria no
estgio inicial da explorao justificada a longo prazo porque muitos de nossos con
ceitos bem estabelecidos passaram atravs de tal iniciao e emergiram fortes e lgicos
por causa dela. O prprio reflexo um bom exemplo disso, e assim so muitos conceitos
da cincia fsica que sobreviveram ao teste do tempo.
58

A importncia do Reflexo S \ ---- > R i Pavlov sugeriu que S \ -----> R \ deveria ser
um reflexo biologicamente mais fraco do que S2 ---- > R2 para que o con
dicionamento clssico ocorresse. A noo de fraqueza biolgica no est inteiramente
clara. Presumivelmente, uma maneira de dizer que, se as energias de S \ e S2 fossem de
algum modo igualadas, ento R \ seria sempre menor ou ocorreria menos frequentemente
do que R 2 . Um fato relacionado que Pavlov enfatizou foi que o condicionamento mai
fcil de ser observado (embora no necessariamente mais fcil de ser obtido) quando S]
no elicia inicialmente R2 - Deveria estar claro que, se S \ elicia R2 antes do condiciona
mento, ento o efeito do emparelhamento de Sj e S2 pode ficar obscuro. Assim, na
maioria dos experimentos de condicionamento, toma-se o cuidado de selecionar um Si
que no tenha a capacidade original de eliciar R 2 - Diz-se que tal S] neutro com
respeito a R 2 - Um S \ neutro especialmente desejvel se, durante o condicionamento,
vamos procurar pela CR no mesmo lugar onde observamos R 2 . Contudo, a neutralidade
inicial de S\ em relao a R2 no um aspecto necessrio para a ocorrncia do condi
cionamento clssico, como Long (1941) demonstrou algum tempo atrs. Num dos ex
perimentos de Long, um tom de 1/7 seg. de durao foi usado como S\ e um breve
flash de luz como S2 . Em ambos os casos, o respondente de piscar os olhos em sujei
tos humanos foi medido. Tanto a luz como o tom eliciava o piscar desde o inicia Mas
depois dos emparelhamentos, o S] tom sozinho, passou a eliciar duas piscadas suces
sivas. A Fig. 3-2 d um exemplo de um dos registros de Long quando S] era
apresentado.

Figura 3-2. Resposta de piscar a um tom de 1/7 seg. depois de 30 emparelhamentos


tom-luz (segundo Long, 1941)

Ainda mais impressionante foi um experimento realizado por Long no qual S\ e S2


eram tons idnticos. Neste experimento um resultado semelhante foi obtido: o primeiro
tom passou a produzir dois movimentos das plpebras depois dos emparelhamentos.
Assim, o caso especial do paradigma Pavloviano com Si = S2 produz resultados
condizentes com o paradigma geral.
Os resultados de Long tm
um significado adicional. Se antes do
condicio
namento, um estmulo elicia Ri e depois do condicionamento evoca Ri e CR podemos
generalizar isto para casos em que um nico estmulo pode vir a controlar uma variedade
- 59 -

de comportamentos diferentes, dependendo das vrias histrias passadas de emparelhamento com S2 s diferentes. Este resultado pode ser representado diagramaticamente
como
R
CR'
CR

S,

[3.2]

CR
\

etc.

Assim, um tom emparelhado independentemente com um choque, uma luz e alimento


pode simultaneamente evocar CRs de mudanas na taxa cardaca, piscar de olho e
salivao, respectivamente. Essa constelao inteira de comportamentos evocados por um
unico estimulo pode ter importncia para o nosso estudo da emoo como veremos num
captulo posterior. Naturalmente, deveria ser enfatizado que, no Diagrama 13-21 Rj
um sumrio de todos os comportamentos inicialmente eliciados por Si - Embora fre
quentemente limitemos nossas discusses sobre o condicionamento a uma ou duas res
postas, o condicionamento um fenmeno que invade todo o sistema compor tamental
de um indivduo. Quando examinamos uma nica resposta em detalhe, assim o fazemos
porque julgamo-la representativa do que est ocorrendo em geral no sistema de resposta e
no porque seja tudo o que est ocorrendo. Tentar pesquisar o sistema total de uma vez
nos sobrecarregaria com detalhes no controlveis. Tomamos uma amostra representativa
e tentamos explor-la em profundidade. Essa outra estratgia de pesquisa que tem tido
sucesso na pesquisa cientfica embora tal sucesso evidentemente, dependa de quanta sorte
temos ao escolher uma amostra que seja realmente representativa de um fenmeno em
geral. O fato de que a CR e R 2 salivar sejam tao semelhantes e to dominantes no caso
de Pavlov sugere a possibilidade de que a sua amostra no fosse to representativa como
ele poderia t-lo desejado.
S -|-----> CR um "Novo Reflexo"? No velho princpio de substituio,
S] ---- > R 2 era visto como o novo reflexo condicionado . Embora possamos preferir
representar os efeitos do condicionamento clssico como a formao de uma CR para S 1
ainda temos de encarar a questo sistemtica de se S \ > CR um reflexo, ou um outro
tipo de correlao estmulo resposta. Existe muito pouca evidncia experimental dispo
nvel que trata do assunto, mas o pouco que temos indica que ele no de fato um
reflexo verdadeiro.
Em primeiro lugar, aumentos na intensidade de S\ no resultam em aumentos na
magnitude de CR, ou em decrscimos na sua latncia. Ao contrrio, o mximo de
magnitude de CR e sua latncia mnima so obtidos com o valor exato de S\ empregado
no condicionamerto (Mostofsky, 1965). Valores mais ou menos intensos resultam em
CRs mais fracas. Por outio lado, lembremo-nos do Captulo 2 onde foi dito que as leis de
magnitude *: latncia do reflexo especificam uma simples proporcionalidade entre a
intensidade de S2 e a fora de R 2 - 60 -

Segundo, a latncia da CR adquirida para S \ geralmente mais longa do que a


latncia dos respondentes (R is) associados com aquele mesmo S i . Isto pode ser demons
trado atrave's do emparelhamento de uma luz (S \) com uma corrente de ar na plpebra
(S2 ). Originalmente, tanto Si como S2 eliciam o piscar de olho. Como resultado do
emparelhamento, Si passa a evocar duas piscadas de olho distintas, uma R i seguida por
uma CR. Usando esse procedimento com sujeitos humanos, Grant e Norris (1947) iden
tificaram vrias regies modais de latncia, como mostra o histograma da Fig. 3-3. Esses

Latncia (milisegundos)

Figura 3-3. Distribuio da latncia de todas as respostas de piscar o olho eliciadas por
uma luz forte no curso de um experimento de condicionamento com sujeitos humanos
(segundo Grant e Norris, 1947).

pesquisadores chamaram a regio entre 50 e 110 mil segundos (1 mseg.


S 3 se^
= 1/1000 seg.) a faixa do reflexo verdadeiro; a regio entre 260 e 450 mseg representa a
faixa de CR.
Terceiro, se S \ CR um reflexo verdadeiro, deveria ser possvel construir mais
reflexos condicionados a partir dele. O prprio Pavlov viu as possibilidades dessa
acumulao de condicionamentos, assim como as implicaes disso para o comportamen
to humano. Por exemplo, num experimento realizado por Frolov (citado por Pavlov
1927, pp. 33-34). um metrnomo foi primeiro utilizado como S\ no paradigma, onde
Alimento > Saliva era o reflexo incondicionado. Depois de alguns emparelhamentos
o resultado usual foi obtido: o metrnomo sozinho evocava uma CR salivar. Frolov
ento, tentou usar a nova correlao S \ ------ CR como a base para um reflexo con
dicionado de segunda ordem. Ele colocou um quadrado preto no campo visual do co
por 10 seg. Ento, esperou 15 seg mais e, finalmente, soou o metrnomo por 30 seg.
Essa uma variao do emparelhamento simultneo1 discutido acima e, de acordo com
Pavlov, ele seria necessrio para se chegar a um condicionamento de segunda ordem.
Depois de 10 de tais tentativas, o quadrado preto passou a evocar alguma salivao
embora nunca tivesse sido emparelhado com alimento. Representamos esse exemplo de
condicionamento de ordem superior como uma operao de dois esteios na Fig. 3 4 .
61

Este reflexo foi omtido aps


s S i ----- CR ter sido formado.
j
Figura 3-4. Procedimento de
Frolov para estabelecer o
condicionamento de segunda
ordem.

Ordem

................

s2

------------ *-

R*

---------------------- J

I)

S i -------- R|

^C R '
II)

S0 ^

-------- - R 0

Tipicamente, a CR de ordem superior era pequena em magnitude, longa em latncia,


varivel em ocorrncia e de pouca durao. As tentativas para se chegar alm do condicio
namento de segunda ordem sem o emprego do S2 > ^ 2 original no foram bem
sucedidas com respondentes salivares. A importncia do condicionamento de superior
desse tipo ainda est em discusso entre os psiclogos. Seu carter transitrio (se o S2
omitido por vrias tentativas, ele desaparece de todo)a dificuldade em estabelec-lo e
sua incapacidade para se estender a muitas ordens,levaram alguns autores a comentar que
dificilmente poder-se-ia esperar que a influncia do condicionamento de ordem superior
fosse muito grande no comportamento cotidiano dos organismos (Keller e Shoenfeld
1950, p. 32). Por outro lado, suas possibilidades tericas como um princpio explanatrio, tm impressionado favoravelmente outros autores, tais como C.E. Osgood
(1953) que considera que *esse processo certamente se estende de maneira ampla na
aprendizagem humana, especialmente na rea da linguagem (Osgood, 1953, p. 316)
Em resumo, parece que as relaes S \ CR estabelecidas pelo condicionamento
so, provavelmente, bastante diferentes dos reflexos verdadeiros, o que justifica agruplas separadamente.
3.3

RELAES TEMPORAIS NOS PARADIGMAS DE CONDICIONAMENTO

O condicionamento Pavloviano ou clssico pode convenientemente ser considerado


como o efeito caracterstico da apresentao de estmulos em certas relaes temporais,
isto , numa certa ordem no tempo. At agora, content amo-nos em colocar a operao
fundamental do condicionamento Pavloviano como um "emparelhamento" de dois es
tmulos eliciadores. J tempo de considerar com mais detalhes a natureza desta
operao de emparelhamento. Na Fig. 3-5, so apresentadas quatro maneiras diferentes
em que Sj pode ser emparelhado no tempo com S2
S,
S,

XI

JZL
(A) Sim ultneo

Si
S,

rz L

S,

Figura 3-5. Algumas relaes


temporais possveis entre S j
e S 2 no condicionamento
clssico.

(B) Retardo

s,

___EL_

St

(C) Trao
-6 2 -

S,

(D) Retroativo

O primeiro caso (A) talvez seja o tipo mais comum e referido na literatura de
condicionamento como condicionamento simultneo . O S i curto e seu aparecimento
ocorre cerca de 1/2 seg. antes de S2 . Na Fig. 3-5A, S\ termina antes de S2 ; todavia Si
pode ultrapassar S2 sem alterar os resultados. Outro procedimento temporal empregado
no condicionamento clssico visto na Fig. 3-5B. O Si iniciado antes de S2 e per
manece por um intervalo de tempo considervel. Quase no final de S j, S 2 apresentado.
Este chamado um procedimento de retardo.tambm possvel, sob as condies de
Pavlov, obter-se CRs com retardos at de vrios minutos. O caso ilustrado na Fig. 3-5C
semelhante ao condicionamento simultneo exceto que S\ apresentado mais cedo e
termina antes da apresentao de S2 . Este o procedimento que Frolov usou em seu
experimento de segunda ordem. Este caso referido como um procedimento de trao, na
suposio de que um trao de S\ permanece no sistema nervoso do organismo depois
que S] termina. Se o tempo entre S\ e S2 no for muito grande (uns poucos minutos)
possvel se formar CRs para S\ atravs do procedimento de trao.
Quo longo pode ser o tempo entre S] e S2 antes que o condicionamento se torne
impossvel? Nenhum resposta geral possvel, pois isto depende do reflexo particular
S2
R2 , das intensidades de S\ e $2 e de muitos outros fatores. Uma questo
relacionada mais fcil de ser respondida: qual o intervalo timo entre o aparecimento
de S\ e o aparecimento de S2 ? Isto , que intervalo permite asCRsmais consistentes?Um
estudo realizado por Wolfle (1932) usando a retrao do dedo a um choque eltrico
como S2 ---- ^ -R 2 gerou a curva vista na Fig 3-6. Note que a percentagem mxima de
CRs ocorreu em

8 I
c O

Intervalo S i ---- S 2 (seg)


Figura 3-6. Condicionabilidade relativa em funo do intervalo Sj
Wolfle, 1932).

S 2 (segundo

(Xca de 1/2 segundo e esse valor frequentemente tido como sendo o intervalo timo de
S i ------ S2 . Poucas CRs foram registradas em 0 seg. (simultaneidade verdadeira). Os
valores negativos do intervalo S i ----- S2 (aqueles a esquerda de 0 na Fig. 3-6) apresen
tam algum interesse terico. Eles representam o caso (visto na Fig. 3-5D) em que S\ vem
-6 3 -

depois (!) de S2 - Esse o procedimento chamado de condicionamento retroativo. Con


corda-se atualmente que o procedimento de condicic. jnento retroativo no resulta na
formao de uma nova CR para S\ e a Fig. 3-6 apoia este ponto de vista. Da nossa anlise
na seo anterior, poderamos esperar, todavia, que S2 (agora o primeiro estmulo)
adquirisse uma CR. Embora tal resultado no seja consistente com a noo de Pavlov de
que o estmulo anterior deva pertencer a um reflexo biologicamente mais fraco ele seria
compatvel com uma anlise do condicionamento clssico puramente em termos de
relaes temporais entre estmulos.
Um procedimento final, no visto na Fig. 3-5, ocorre quando S2 apresentado
periodicamente sozinho, sem qualquer Si . Num experimento, Pavlov alimentou um co
regularmente em cada 30 min. Nenhuma mudana de estmulo precedia a alimentao.
Quando esta rotina de alimentao estava bem estabelecida, o alimento foi totalmente
retirado, medindo-se os efeitos. Sob essas condies observou-se que a salivao
comeava aproximadamente no fim do perodo de 30 min, o perodo em que o alimento
normalmente viria. Pavlov chamou esse procedimento de condicionamento de temporal
com base na analogia de que o intervalo de tempo desde a alimentao anterior
passava a atuar, de alguma forma, como um S\.

3.4 - A EXTENSO DO CONDICIONAMENTO CLSSICO


O leitor deve sair dessa introduo ao condicionamento clssico com uma compreen
so clara da natureza invariante de um aspecto do fenmeno. Sempre que dois eliciadores
so associados no tempo atravs das regras apresentadas em nossa discusso sobre
emparelhamento um resultado inevitvel obtido. O primeiro eliciador passa,
eventualmente, a evocar algum novo conjunto de comportamento no organismo. Isto
verdadeiro, caso o emparelhamento seja realizado ou por um experimentador num
la b o ra t rio cuidadosam ente construdo ou pela ao da natureza na selva.
Frequentemente, algum novo comportamento assim evocado o condicionado
assemelhar-se- a alguns dos respondentes do segundo eliciador, mas isso no
necessariamente verdadeiro.
Esse fenmeno parece ser bastante geral, estendendo-se em todo reino animal. J se
obteve CRs em vermes, caranguejos, peixes, rpteis, pombos, galinhas, carneiros, ces,
macacos e fetos humanos de sete meses de idade ainda no tero materno (Hilgard e
Marquis, 1940).
Na histria inicial da pesquisa sobre o condicionamento clssico, quando o paradig
ma era tido como Sj 5* R2 >pensava-se que qualquer reflexo poderia ser condiciona
do . Isto , qualquer respondente (R 2) poderia ser transferido por substituio de
estmulo para novos Sis. Com a queda da substituio de estmulo e a aceitao geral de
que a CR pode no ser idntica a R 2 , essa posio foi enfraquecida. Alguns insucessos na
obteno de condicionamento so esclarecedores. Numa srie de experimentos
cuidadosos com o ernprego de S]s e S 2 S diferentes e vrios intervalos Si S2 , F.A.
Young (1958) foi incapaz de obter uma transferncia do respondente pupilar para S j.
Young resume a literatura dos ltimos trinta anos sobre um suposto condicionamento
desse respondente e conclui que a evidncia indica que nenhum pesquisador demonstrou
inequivocamente o condicionamento desse respondente. Schlosberg (1928) indica que
condicionamento da flexo do joelho pode ser um artefato devido aos processos que
veremos no Captulo 4. Reinwald (citado em Keller e Schoenfeld, 1950) no foi capaz de
obter uma CR de flexo do joelho em mais de 1.000 emparelhamentos de uma iuz com
-6 4 -

uma pancada no tendo patelar. possvel que esses pesquisadores estivessem procuran
do por uma CR muito parecida com a R2 , original. O condicionamento clssico pode ter
sido algo distorcido por muitos anos devido a procura de CRs somente ao longo de
dimenses mais bvias de R 2 - O fato que podem existir CRs em dimenses comportamentais diferentes de R2 - Realmente, bem conhecido que o condicionamento clssico
um fenmeno que invade muitos aspectos do sistema comportamental de resposta do
organismo. Moore e Marcuse (1945) mostraram que quando vrios sistemas comportamentais so examinados, as CRs so vistas mais claramente em alguns desses (como
respirao, salivao e taxa cardaca) do que em outros (atividade motora ou geral). A
Fig 3-7, um dos registros de Moore e Marcuse, tomados de um porco colocado num
arreio Pavloviano e previamente sujeito a tons (S i) emparelhados com biscoitos (S 2 )
ilustrativa.
Cabea ____

Salivao (1/60 cc)


Corao

____

________________________
__________________________________________

A lim entao________________________ ___________________


Tom (480 )
A lim e n to ----------------------------------------*-------------------------------------------- ----- .
Tempo (seg.^.................. - ............... -...... -.....-............................ -........ Figura 3-7. Respostas de um porco em um nmero de sistemascomportamentaisa um
sinal sonoro que havia sido previamente emparelhado com alimento (segundo Moore e
Marcuse, 1945).

As CRs parecem mais convincentemente formadas em respondentes que dependem das


funes do sistema nervoso autnomo. Como Keller e Shoenfeld em (1950) salientam:
Estes envolvem as aes de glndulas e msculos lisos (e.g. a secreo de suor e a
contrao das veias). Desde que a ao de tais 7efetores' frequentemente associada
com estados de emoo (no'm edo" a saliva seca, o suor excretado, a pele esfria, ar
pupilas dos olhos se dilatam, etc.) no seria surpresa.... saber-se que esses estados
podem ser condicionados maneira Pavloviana (Keller eSchoenfeld, 1950 pp. 27-28).
Com a no confirmao da expectativa de Watson de que a substituio de estmulo
seria a pedra fundamental para construir uma teoria geral de todo comportamento
aprendido, a pesquisa bsica sobre o condicionamento clssico tem sido, at recentemente,
pouco enfatizada nos Estados. Unidos. (Prokasy, 1965). Os russos por outro lado,
nunca estiveram to interessados no condicionamento como um instrumento para a
anlise psicolgica. Por essa razo, talvez, a pesquisa sobre reflexos condicionados nunca
entrou em declnio naquele pas. Embora o condicionamento clssico nunca possa atuar
como seus entusisticos adeptos esperavam a 30 ou 40 anos atrs, parece provvel que ele
ainda possa emergir, se bem que numa forma diferente como um conceito importante
65

para a compreenso do comportamento. O fato de que nossas emoes paream seguir as


leis de Pavlov, ao invs ua lei do efeito de Thorndike fornece um indcio da possvel
importncia do condicionamento clssico. Em vez de serem as unidades de compor
tamento aprendido como Watson concebeu,
pode ser que os estados emocionais
classicamente condicionados acompanhem e sejam mesmo essenciais para a manuteno
de muitos de nossos padres de comportamento. Mas, no momento, isso uma mera
especularo e uma apresentao mais detalhada deve esperar um capitulo posterior.
3.5

O MTODO EXPERIMENTAL

A partir daqui, faremos uso recorrente de certos conceitos bsicos da cincia


experimental. Na presente seo comearemos a introduzir alguns princpios simples do
mtodo experimental como so usados na psicologia, motivando a discusso atravs de
referncias a experimentos de Pavlov e seus colaboradores.
Em todo experimento, o cientista procura estudar certos aspectos do mundo natural
na medida em que se relacionam a outros aspectos. Uma das primeiras tarefas do cientista
tentar eliminar as influncias sobre o objeto de seu estudo nas quais ele no est
diretamente interessado, na ocasio do seu experimento. Assim, ao estudar como a
magnitude do respondente variava com mudanas da intensidade do estmulo,
Sherrington separou o crebro da medula para eliminar as influncias desconhecidas que
o crebro pudesse ter sobre a magnitude do respondente. De um modo similar, Pavlov
rotineiramente colocava os ces numa sala especial onde eram isolados do mundo
exterior. Ele diz:
Pensvamos, no incio de nossa pesquisa, que seria suficiente simplesmente isolar o
experimentador na cmara de pesquisa com o co a sua frente e impedir a entrada de
qualquer pessoa durante o curso de um experimento. Mas essa precauo mostrou-se
ser completamente inadequada, uma vez que o experimentador, por mais que
tentasse ficar quieto, era uma fonte constante de um grande nmero de estmulos.
Seus menores movimentos o piscar o olho ou o movimento dos olhos, a postura,
respirao e assim por diante todos agiam como estmulos que, chegando at ao
co, eram suficientes para viciar os experimentos, tornando a interpretao exata dos
resultados extremamente difcil. A fim de excluir essa influncia imprpria do
experimentador tanto quanto possvel, ele deveria ficar localizado fora da sala em
que o co estivesse colocado, e mesmo essa precauo provou-se insatisfatria em
lab o ra t rio s no construdos especialmente para o estudo desses reflexos
particulares. O ambiente do animal, mesmo quando fechado numa sala, est sempre
mudando. Os passos de uma pessoa que passa, conversas ocasionais nas salas vizinhas,
o bater de uma porta ou a vibrao de um furgo passando, vozes da rua, bondes e
mesmo sombras que penetram atravs da janela para dentro da sala, qualquer desses
estmulos casuais, no controlados, que chega aos receptores do animal... vicia os
experimentos (Pavlov, 1927), p. 20).
Fica claro a partir do relato de Pavlov que os cientistas se esmeram para
controlar as influncias indesejveis nos seus experimentos. Este o sentido que damos

sxpresso experimento controlado . Algumas vezes todavia, impossvel eliminar uma


temperatura e umidade da sala onde fica o animal no podem ser alteradas. Se estas
-6 6 -

mudam drasticamente, elas alteram as propriedades do reflexo. A idade do animal, sua


sade e o grau de privao de alimento so influncias semelhantes. O melhor que
podemos fazer mant-las to constantes quanto possvel durante o curso do experi
mento. Este , ento, um segundo significado de um experimento controlado: mantemos
constantes muitas influncias no nosso fenmeno em questo.
Tendo controlado as influncias indesejveis, removendo-as ou mantendo-as
constantes, prosseguimos na execuo de um experimento. Mas o que isso impe? Em
cada experimento, no importa em que cincia, h certos ingredientes bsicos na sua
preparao. Em primeiro lugar, uma vez que cada experimento uma tentativa de
relacionar duas ou mais coisas entre si, ele trata com pelo menos duas grandezas que
possam assumir valores diferentes. (Nos experimentos de Pavlov, duas de tais grandezas
eram frequentemente o nmero de emparelhamentos e a magnitude da resposta.) As
grandezas que podem adquirir valores diferentes receberam dos matemticos o nome de
variveis. Adotaremos esse nome, empregando-o frequentemente atravs do restante
deste texto. Ambas as variveis num experimento devem ser mensurveis e uma delas
deve ser controlvel ou manipulvel pelo experimentador. Isto , ele deve ser capaz de
mudar ao menos uma delas como desejar.
No experimento de Anrep (ver seo 3.1) existem trs variveis, trs grandezas que
assumem valores diferentes: o nmero de emparelhamentos prvios alimento-tom gotas
de saliva e o tempo passado entre o aparecimento do tom e a salivao subsequente
(Tabela 3-1). Para simplificar, limitemos nossa ateno a somente duas delas: nmero de
emparelhamentos e gotas de saliva. Ambas as variveis foram medidas pelo Dr. Anrep.
Todavia, somente uma foi manipulada por ele. Isto , ele determinava diretamente o
valor de s uma delas. Essa varivel foi o nmero de emparelhamentos. Uma varivel que
medida e manipulada num experimento chamada de varivel independente. Qualquer
outra varivel que for concorrentemente medida neste experimento mas no manipulada,
chamada varivel dependente. Anrep, assim tinha duas variveis dependentes: gotas de
saliva e o tempo para a primeira gota aparecer. Consideremos, por um momento, somente
a primeira delas.
80 r Y

ct
5

60-

40 -

BO
O

200 ---------- 1---------- 1_______i_______i_______i_______ Y


10

20

30

40

50

Nmero de emparelhamentos sucessivos de X


Figura 3-8. Representao da varivel independente de Anrep (1920) e uma de suas
variveis dependentes num sistema de coordenada retangular.
-6 7 -

Suponha que tentemos representar nossas variveis e nossos resultados num sistema
de coordenada retangular bidimensional como na Fig. 3-8. Designamos a varivel
independente para o eixo horizontal (eixo do X) e a varivel dependente para o eixo
vertical (eixo do Y). (Essa localizao da varivel dependente exatamente oposta aquela
de um histograma. Ver Fig. 2-6.) Vrias propriedades da Fig. 3-8 so interessantes de se
notar. (1) Sempre damos aos nossos eixos rtulos informativos descrevendo nossas
variveis. (2) Marcamos distncias iguais nos eixos e fazemos com que essas distncias
representem aumentos iguais de nossas variveis. (3) As escalas dos eixos (X) e (Y) no
precisam ser as mesmas. (4) O zero coincide para ambos os eixos onde as linhas
coordenadas se encontram no ponto chamado de origem.
80

>< 60

a
13

.fe

40

20

10

20

30

40

50

Nmero de emparelhamentos sucessivos X


Figura 3-9. Os dados de Anrep (1920) sobre gotas de saliva e nmero de
emparelhamentos indicados como pontos bidimensionais num sistema de coordenada
retangular.

Prosseguimos representando os dados de Anrep no sistema de coordenada retangular.


Utilizamos as colunas 1 e 2 da Tabela 3-1 para colocar os pontos nos locais apropriados
dentro do quadro de referncias. Cada ponto representa um par de nmeros: o nmero
de gotas de saliva associado com o nmero de um dado emparelhamento. Ao fazermos
isso, obtemos a Fig 8-9.
O ltimo passo conectar os pontos com linhas retas. Com esta operao, obtemos a
Fig. 3-10, que chamamos a curva ou funo que relaciona o nmero de gotas de saliva ao
nmero de emparelhamentos prvios alimento-tom, numa faixa da varivel independente
que varia de 0 a 60 emparelhamentos. A forma de tais curvas ou funes de algum
in tere sse . No p re sen te caso, vemos que alm do ponto que representa 30
emparelhamentos no ocorre muita mudana na varivel dependente. Quando uma
funo alcana um valor limite em torno do qual flutua da em diante, dizemos que
alcanou a assntota. Presumivelmente, mesmo que quisssemos continuar com milhares
de emparelhamentos adicionais, obteramos, aproximadamente, apenas 60 gotas em cada
teste.

-6 8 -

Linha assinttica

>
73
oo
a>
T3

OD

Figura 3-10. A funo de Anrep (1920) relacionando gotas de saliva e numero de


emparelhamentos, mostrando sua assntota.

Estamos agora, em condies de definir um experimento como a medida e manipulao


de uma varivel e a medida concorrente e no manipulao de outra. Estritamente falando,
essa d e fin i o vale apenas para os experimentos mais simples, aqueles com
uma varivel independente e uma varivel dependente. Experimentos mais complicados
podem ter muitas variveis dependentes e independentes, mas aqui suficiente
compreender que um acrscimo de variveis no contm novos princpios.
O experimento de Anrep serve ainda para ilustrar uma caracterstica especial dos
experimentos em Psicologia. Num experimento psicolgico, a varivel dependente inevi
tavelmente algum aspecto do comportamento do organismo, a varivel independente
inevitavelmente algum aspecto do ambiente imediato ou anterior do organismo. Aqui por
exemplo, gotas de saliva uma grandeza comportamental; o nmero de emparelhamentos
refere-se freqncia de algum estado anterior do ambiente do animal. Note
cuidadosamente que nem saliva nem tom so variveis segundo nossa definio. Gotas de
saliva e nmero de tons apresentados que so variveis. Assim, uma varivel a
grandeza que pode assumir valores diferentes (variveis); aquilo que medimos e
registramos.
Agora que temos os instrumentos para compreender e representar os experimentos
seus resultados, estamos numa posio muito melhor para compreender os dados obtidos
por Anrep e resultados semelhantes. A funo da Fig. 3-10 representa o nosso primeiro
exemplo de um processo comportamental. Um processo comportamental pode ser
definido como uma mudana no comportamento no tempo (ou tentativas no tempo) em
que um procedimento constante mantido em efeito. Podemos verificar que o experi
mento de Anrep preenche essas condies. Ele seguiu o mesmo procedimentoemparelhamento de tom com alimento tentativa aps tentativa, testando ocasional
mente o efeito do tom sozinho. Em nenhum ponto de suas cinqenta tentativas ele
desviou e instituiu um procedimento novo e diferente. Foi sempre o mesmo:
tom-alimento, esperar um pouco, tom-alimento, ... e assim por diante. Ento, a curva da
Fig. 3-10 que cresce at alcanar assntota, o processo atravs do qual um tom passa,
gradualmente, medida que a u r v ;,am os emparelhamentos, a adquirir a habilidade de
produzir uma resposta de saliva p* >i mesmo.
- 69 -

3.6 - INTRODUO AOS CONCEITOS ELEMENTARES DE PROBABILIDADE


Muitas das coisas que os psiclogos registram e observam ocorrem aqum da certeza
perfeita, mesmo quando todas as condies de experimentao e observao so to
cuidadosamente controladas quanto possvel. Por exemplo, em qualquer tentativa teste
antes de assntota de aquisio ser atingida, a apresentao do S\ no experimento de
Anrep (ver figura 3-4) poderia no ter gerado nenhuma CR. Se imaginarmos qualquer
tentativa teste realizada antes da assntota, teramos de admitir que haveria uma
incerteza muito real ligada predio de se ou no qualquer CR ocorreria para S\.
Naturalmente, medida que o nmero de tentativas prossegue, a incerteza diminui
Diz-se que um respondente condicionado est complementamente adquirido quando suas
chances de ocorrer depois de S\ tom aram-se certas ao mximo. O que verdadeiro para
os reflexos condicionados verdadeiro para muitos outros eventos comportamentais e
no comportamentais. Algumas vezes, uma pessoa comer o que colocado diante dela,
outras vezes no. Algumas vezes, um trem chegar atrasado; algumas vezes, chegar
pontualmente. O que gostaramos de ter seria uma rgua ou um instrumento de medida
com o qual pudessemos representar e comparar, de uma maneira precisa, a certeza de
eventos tais como CRs, comer sobremesas, chegada de trem. Felizmente, encontramos
este instrumento no conceito matemtico de probabilidade. Para o presente objetivo,
consideraremos a probabilidade de um evento como um nmero que podemos associar a
este evento, um nmero que caracterizar a certeza relativa do evento sob condies bem
definidas de observao.
A fim de determinar esse nmero para um evento, devemos primeiro estabelecer um
grupo de condies padro sob o qual iremos procurar pelo evento. Um dos tipos de
condies padro envolve uma certa operao (procedimento) que executamos tal como
jogar uma moeda, apresentar um S{ ou ordenhar uma vaca. Num segundo tipo as
condies padro so estabelecidas pela natureza e meramente fazemos nossas obser
vaes em ocasies definidas. Assim, podemos observar se o trem local das 7h34min.
chega ou no pontualmente, ou podemos observar o nmero de carros que cruza a ponte
George Washington numa determinada hora. Por convenincia, daqui em diante referirnos-emos a qualquer tipo de condies padro de observao simplesmente como a
observao padro.

Denominaremos de resultados os eventos de interesse que surgem quando fazemos as


observaes padro. Por exemplo, ao apresentar um estmulo e procurar por um res
pondente (uma observao padro), podemos observar a ocorrncia de uma flexo do
joelho (um resultado). Ao atirar uma moeda, podemos estar interessados na ocorrncia
de cara (um resultado). Em geral, sempre que a ocorrncia de um determinado evento
ou resultado no perfeitamente certa, isto pode significar que, ao se fazer a observao
padro algum outro evento ocorreu, evento este diferente daquele no qual estvamos
principalmente interessados. Assim, se estivssemos interessados no evento cara ao
jogar uma moeda, o evento coroa seria aquele que ocorre sempre que o evento cara
no ocorre. Para aplicar as noes de probabilidade deveremos classificar todos os resul
tados possveis de uma observao padro.
No caso de uma moeda de dois lados, os resultados possveis so bvios. Mas quantos
resultados possveis poderiam resultar da observao de carros ou da ordenhao de uma
vaca? Nesses casos, seria til classificar o grande nmero de possibilidades em um

-7 0 -

nmero fixo e pequeno de categorias. Por exemplo, ao medir a produo de leite


podemos achar conveniente preocuparmo-nos apenas com o fato de se Mimosa dar 0
0 21, 2 41 ou mais do que 41 toda manh, ao ser ordenhada. A ordenha a
observao padro e quebramos arbitrariamente os eventos possveis em apenas trs
resultados. Parece que esse um procedimento arbitrrio e que poderamos ter escolhido
dois (algum leite ou nenhum leite), ou mais do que trs resultados, estabelecendo mais
categorias. Nos experimentos de condicionamento, quase sempre perguntamos se uma
resposta condicionada ou no observada aps cada apresentao de um estmulo. Aqui,
a observao padro a apresentao de um estmulo e existem dois resultados uma
resposta de nenhuma resposta. Mas poderamos escolher uma caracterstica da resposta
para examinar (digamos, sua magnitude) e categoriz-la tal como fizemos com a
quantidade de leite produzido pela manh. O ponto importante de todas essas
classificaes que elas nos permitem tomar cada resultado real da observao padro e
classific-lo em uma ou outra categoria de resultado.
Uma vez fixadas quais as categorias de resultado que nossa observao padro deve
ter, seguimos adiante. Nosso prximo passo para medir a certeza de qualquer resultado
particular pode consistir em se fazer a observao padro algumas vezes a fim de se obter
uma idia de quo frequentemente o resultado em questo ocorrer em relao a outros

Figura 3-11. Razo de freqncia de caras numa seqncia de atirar uma moeda.
Note a escala comprimida (logartmica) do eixo horizontal. (Cramr, 1955).

resultados possveis. Esse um procedimento fundamental na estimativa de


probabilidades. Por exemplo, podemos jogar uma moeda 100 vezes e obtermos 53 caras e
47 coroas. Ou podemos notar que, em 50 apresentaes de um S j , observa-se uma CR 45
- 71

vezes. Se tomarmos agora a razo entre a freqncia dos resultados observados do evento
em questo, e a freqncia total de resultados observados, obteremos um nmero entre 0
e 1. Este nmero dos d alguma noo da certeza do evento em questo. Assim, a
razo da freqncia de caras no total de eventos de atirar moedas 53/100 = 0,53.
Analogamente, a razo da freqncia de CRs nas apresentaes de S\ 45/50 = 0,90.
Desses exemplos deveria ficar claro que as razes de freqncia podem ser calculadas
sempre que tivermos obtido freqncias de determinados eventos e freqncias de
todos os eventos.
A idia de uma razo de freqncia nos aproxima muito do nosso
ndice desejado de certeza. Mas uma outra caracterstica da razo de freqncia deve ser
notada. Uma razo de freqncia est sujeita aos erros usuais de medidas discutidas na
seo 2.6. Isto , as razes de freqncia observadas variaro de algum modo em blocos
diferentes de observaes padro. Mas, a medida que fazemos mais e mais observaes
padro, algo interessante ocorre com a razo de freqncia: ela tende assintoticamente a
se aproximar de um valor limite. A Fig. 3-11 mostra como isto acontece quando jogamos
uma moeda e observamos os valores da razo de freqncia de caras , medida que se
faz mais e mais observaes padro. Evidentemente, estamos chegando cada vez mais
perto de uma assntota^ neste caso 0,50. A assntota de uma razo de freqncia
definida como a probabilidade do evento.

A faixa de variao desse nmero que chamamos probabilidade de 0 a 1. Uma


probabilidade 0 indica que nunca em qualquer observao padro anterior, o evento em
questo foi observado. Geralmente probabilidades prximas de 0 esto associadas com a
previso de que improvvel que um resultado do tipo em questo ocorra em qualquer
tentativa determinada da observao padro e que em muitas tentativas no futuro, ele
ocorrer apenas algumas vezes. Probabilidades prximas de 0,5 significam que o resultado
em questo ocorre aproximadamente metade das vezes que a observao padro feita e
em conseqncia, essa a nossa previso para o futuro. medida que a probabilidade se
aproxima de 1 ficamos cada vez mais certos de que deveremos observar o resultado em
questo. Finalmente em 1, dizemos que estamos certos de que o resultado ocorrer.
Assim, a nossa convico de que o sol nascer amanh recebe uma expresso quantitativa
dada por uma probabilidade igual a 1 ,0 , j que toda observao no passado resultou em
o sol aparece . O resultado o sol no aparece , todavia, tem at agora uma freqncia
igual a 0 e, ento, uma probabilidade 0. Esse valor expressa nossa falta de confiana em
prever esse resultado. Uma maneira til de representar a escala de probabilidade vista na
Fig. 3-12.
N unca
aconteceu
.

Pode ou no
acontecer

Baixa

Perfeitamente
certo

Alta

Probabilidade
Figura 3-12. A escala de p ro b ab ilid a d e.

REFERNCIAS PARA O CAPITULO 3.


Anrep, G. V. Pitch discrimination in the dog. / . Physiol., 1920, 53,
3 6 7 -3 8 "
- 72 -

Cramr, H. 77:./ elements of probability theory. Wiley: New York, 1955.


Dashiell, J. F. Fundamentals of general psychology. (3rd ed.) Boston:
Houghton Mifflin, 1949.
Grant, D. A., and Norris, E. B. Eyelid conditioning as influenced by the
presence of sensitized Beta-responses. / . exp. P sychol, 1947, 37,
423-433.
Hilgard, E. R., and Marquis, D. G. Conditioning and learning. New
York: Appleton-Century-Crofts, 1940.
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New Y ork:
Appleton-Century-Crofts, 1950.
Long, Lillian D. An investigation of the original response to the condi
tioned stimulus. A rch . Psychol., (New Y ork) 1941, No. 259.
Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.
Moore, A. U., and Marcuse, F. L. Salivary, cardiac, and motor indices of
conditioning in two sows. J. comp. Psychol., 1945, 38* 1-16.
Mostofsky, D. (E d .) Stimulus generalization. Stanford: Stanford Univer.
Press, 1965.
Notterman, J., Schoenfeld, W. N., and Bersh, P. J. Conditioned heart rate
response in human beings during experimental anxiety. /. comp,
physiol. Psychol., 1952, 45, 1-8.
Osgood, C. E. M ethod and theory in experimental psychology. New
York: Oxford Univer. Press, 1953.
Pavlov, I. P. Conditioned reflexes. London: Oxford Univer. Press, 1927.
Pavlov, I. P. Lectures on conditioned reflexes. New Y ork: International
Publishers, 1928.
Prokasy, W. F. (E d .) Classical conditioning: a symposium. New Y ork:
Appleton-Century-Crofts, 1965.
Schlosberg, H. A study of the conditioned patellar reflex. J. exp. Psychol
1928, 1 1 ,4 6 8 -4 9 4 .
Wolfle, H. M. Conditioning as a function of the interval between the
conditioned and the original stimulus. J. gen. Psychol., 1932, 7,

80-103.
Young, F. A. Studies of pupillary conditioning. J. exp. Psychol., 1958,
55, 97 -1 1 0 .
Zeaman, D., and Smith, R. W. Review of some recent findings in human
cardiac conditioning. Chap. 19 in W. F. Prokasy (E d .), Classical
r *in'nning. New York: Appleton-Century-Crofts, 1965.

-7 3 -

Captulo 4 - FORTALECIMENTO OPERANTE

A regularidade demonstrada nos fenmenos reflexos tanto incondicionado como


condicionado - ilustra o tipo de ordem a ser encontrada entre comportamento e
ambiente. Todavia, muitas das atividades dos organismos superiores no parecem
enquadrar-se num modelo reflexo de comportamento. Essas incluem as aes humanas
que foram descritas^ntes de Descartes como voluntrias, espontneas intencionais e
propositais, e que resistiram anlise experimental at o incio do sculo vinte. Uma
ilu stra o esclarecedora sobre onde terminam os reflexos e comeam esses
comportamentos encontrada na seguinte passagem:
quando um gato ouve um rato, volta-se para a fonte do som,v o rato, corre em
sua direo e lana-se sobre ele. Sua postura em cada estgio, mesmo na seleo do
p que dar o primeiro passo, determinada por reflexos que podem ser
demonstrados um a um em condies experimentais. Tudo que o gato tem a fazer
decidir se persegue ou no, todo o resto est preparado para isso pelos seus reflexos
posturais e locomotores (Skinner, 1957, p. 343).
Por trs da proposio ilusoriamente simples de tudo que o gato tem a fazer e
decidir encontra-se o ponto de partida para uma cincia daqueles comportamentos cujas

ocorrncias no esto relacionadas reflexamente presena imediata de um eliciador ou a


uma histria de emparelhamento de dois eliciadores.
4.1 - INTRODUO AO COMPORTAMENTO PROPOSITAL
No estudo dos reflexos e respostas condicionadas vimos que a explicao e
compreenso cientficas surgiram atravs da descoberta progressiva e da elaborao de
relaes entre certos aspectos do comportamento (as respostas, variveis dependentes)
e certos aspectos do ambiente (as variveis independentes, estmulo e histria passada).
C ada descoberta de uma nova relao ou lei do comportamento foi um evento
importante na histria do reflexo. medida que nossas leis comeam a se empilhar e
se misturar, sentimo-nos justificados em falar acerca de uma compreenso parcial do
comportamento reflexo.
A nlise ex p e rim en tal tem procedimento similar com os comportamentos

- 75

que chamaremos, por enquanto, propositais . Desde o trabalho pioneiro de Thorndike


com gatos e pintos sobre aprendizagem, os psiclogos tm, progressivamente, persistido
na procura de relaes entre o comportamento proposital e outros eventos.
Em geral, a procura dessas relaes no nos conduziu ao longo dos mesmos caminhos do
reflexo. Contudo, uma abordagem funcional j foi iniciada. Considere o problema no
desenvolvimento de tal abordagem: como procedemos para encontrar as variveis ou
eventos aos quais o comportamento proposital possa estar significantemente
relacionado?
Inicialmente, devemos proceder por intuio e observao grosseira. Se tivermos sorte,
podemos cumprir nossa tarefa ajudados por uma especulao filosfica avanada. Vinte e
cinco anos antes de Thorndike,o filsofo britnico Herbert Spencer escreveu o seguinte.
Suponha, agora, que ao estender sua cabea para apanhar uma presa de difcil
alcance, uma criatura falhe rapidamente. Suponha que, ao lado do grupo de aes
motoras aproximadamente adaptadas para alcanar a presa a esta distncia... um
pequeno movimento do corpo para a frente (ocorre). O sucesso, ao invs do fracasso,
ser alcanado... Quando as circunstncias se repetem, esses movimentos musculares
que foram seguidos por sucesso so provavelmente repetidos: o que foi inicialmente
uma combinao acidental de movimentos ser agora uma combinao que tem
probabilidade considervel (Spencer, 1878).
Na proposio de que aqueles movimentos musculares que foram seguidos por
sucesso so provavelmente repetidos , Spencer estava enfatizando que o que um or
ganismos faz agora est, de algum modo, relacionado com as conseqncias do que o
organismo fez no passado. Aqui, ento, est a deixa que Thorndike, e mais tarde Skinner,
deveriam seguir extensivamente.
O comportamento proposital aquele que quase totalmente definido por suas
conseqncias. Considere a Tabela 4.1. Em cada ato ali citado, o objetivo do compor
tamento est relacionado de perto com as conseqncias. Dizemos que amarramos um
Tabela 4.1
ALGUNS COMPORTAMENTOS PROPOSITAIS DOS ANIMAIS E HOMENS, SEUS
ASSIM CHAMADOS PROPSITOS, E SUAS CONSEQNCIAS PASSADAS REAIS.
COMPORTAMENTO
Amarrar um sapato
Comprar uma capa de chuva
Entrar em um restaurante
Abrir uma torneira
Escrever uma carta
Cavar um buraco

PROPSITO
Para manter o sapato
Para no molhar
Para almoar
Para obter gua
Para assegurar uma resposta
Para escapar do frio

CONSEQNCIAS

0 sapato fica no p
A chuva no molha
Voc almoca
Aparece a gua
A resposta obtida
Obtm-se calor

sapato para manter nosso sapato no p, mas uma proposio equivalente que
amarramos nosso sapato e, ontem quando o amarramos, ele ficou no p. Aproposiode
que os ratos se refugiam em buracos para escapar do frio pode equivalentemente ser
expressa com a proposio de que os ratos frequentemente, no passado, refugiaram-se em
buracos e encontraram temperaturas mais elevadas.
-7 6 -

EXERCCIO 2.
Transforme cada um dos comportamentos e propsitos da Tabela 4.1 em propo
sies equivalentes que expressem simplesmente o comportamento presente e o com
portamento passado com suas conseqncias.

Aparentemente, temos duas maneiras de representar o mesmo comportamento, na


nossa lngua: 1 ), o proposital no qual empregamos o termo para (ou de modo a) e que
implica no tempo futuro; 2 ), o descritivo, no qual especificamos o comportamento
presente e o associamos com o que aconteceu no passado. A redundncia na repre
sentao desperdcio e usualmente evitada pelos cientistas. Na presente argu
mentao, deveremos rejeitar a linguagem proposital e adotar a linguagem mais descritiva
por uma razo lgica. O comportamento no pode ser relacionado com eventos futuros,
isto , eventos qu ainda no aconteceram. Um lembrete algo desagradvel pode ser
retirado da seguinte ilstrao:
Durante a guerra, os russos usaram ces para bombardear tanques. Um co era
treinado para se esconder atrs de uma rvore, arbustos ou outro esconderijo
qualquer. Quando um tanque se aproximava e passava, o co corria ao seu lado e
uma pequena mina magntica, presa s suas costas era suficiente para danificar o
tanque ou incendi-lo. O co, naturalmente, tinha que ser substitudo (Skinner,
1956, p. 228).
Apenas uma das duas possveis descries satisfatria aqui. O co corre na direo
ao tanque devido a certas conseqncias passadas de correr na direo de tanques.
(Presumivelmente eles eram ali alimentados ou acariciados, etc.) Nesse exemplo extremo
fcil rejeitar a proposio alternativa de que
os ces corriam na direo dos tanques
para serem explodidos. Mesmo assim, a ilustrao til para estabelecer o princpio geral
de que o futuro no determina o comportamento.
Em resumo, uma classe muito real e importante de comportamentos surgida de
situaes que parecem envolver escolha ou deciso, chamada comportamento
proposital. Esse comportamento, deve ficar claro de uma vez, inclui-se na categoria de
Descartes de 'voluntrio e constitui a ao que os antigos chamavam intencional .
Nossa anlise presente, indica que esse comportamento est de algum modo relacionado
com suas conseqncias controlado por elas. Por essa razo, daqui por diante, deveremos
substituir o antigo termo proposital pelo termo instrumental de Thorndike, ou ope
rante de Skinner. Chamar o comportamento de instrumental ou de operante sugere
que, operando no ambiente, o comportamento instrumental na obteno de conseqn
cias. Nenhum desses termos implica o mesmo quadro conceituai indesejvel que o termo
proposital , mesmo assim ambos tentam aprender a noo fundamental de que as
conseqncias passadas de tal comportamento so um de seus determinadores impor
tantes.

4.2

UM EXPERIMENTO PROTTIPO

Se um rato de laboratrio, faminto, colocado na caixa ilustrada na Fig. 4-1 e certos


procedimentos so efetuados, um nmero de efeitos comport ame ntais interessantes
podem ser observados.
- 77 -

Para os objetivos da presente anlise, as caractersticas significativas da caixa so ( 1 )


uma bandeja para o fornecimento de uma pequena pelota de alimento para o rato e ( 2 )
uma alavanca ou barra, projetando-se da parede da frente, que, quando pressionada para
baixo com uma fora de cerca de 10 g, fecha um micro-interruptor, permitindo um
registro automtico desse comportamento. Os aspectos significantes do rato so os
seguintes: ( 1 ) sadio e foi acostumado a comer uma refeio por dia, por volta da mesma
hora em que se encontra na caixa. (2) Foi previamente adaptado a essa caixa e, durante
este perodo de adaptao, o alimento era ocasionalmente fornecido na bandeja. Agora,
ele se aproxima prontamente da bandeja de alimento e come-o sempre que este'est
disponvel.

Figura 4.1 - Uma cmara experimental baseada na caixa originalmente usada por B. F.
Skinner para o estudo do comportamento instrumental no rato e outros pequenos
mamferos (Will Rapport).

Considere o seguinte experimento. O rato cuidadosamente observado nessa caixa


por um perodo de 15 minutos. Durante este tempo, nenhum alimento fornecido na
sua bandeja. No ser difcil observar a ocorrncia de comportamentos que chamamos
exploratrios. O rato cheira os cantos, cheira a bandeja, pressiona ocasionalmente a
barra, levanta-se apoiando suas patas dianteiras nas paredes e assim por diante. Alm
disso, o animal frequentemente se engaja em atividades de limpeza e de farejar, e
ocasionalmente permanece quase completamente imveL Todas essas atividades so
exemplos daquilo que os psiclogos usualmente rotulam de respostas. suficiente, no
presente, observar a seguinte precauo: esses comportamentos no so respondentes
(nenhum eliciador especfico pode ser encontrado para eles. Isso no significa que eles

-7 8 -

no dependam, em grande parte, da construo da caixa para que ocorram. No obstante,


eles parecem ser emitidos na ausncia de qualquer estmulo especfico. Por essa razo,
eles so frequentemente referidos como respostas emitidas.
A observao dos comportamentos emitidos por um animal na situao onde
nenhuma conseqncia especial est sendo fornecida para qualquer resposta conhecida
como a observao do nvel operante. Os registros do nvel operante servem como uma
importante linha base em relao qual deveremos, mais tarde, comparar os efeitos da
liberao de conseqncias especiais para uma ou mais respostas emitidas.
Depois de 15 minutos de observao dessas vrias respostas emitidas, iniciamos o se
guinte procedimento. Cada vez que observamos que o rato pressiona a barra, imediatamente
fornecemos uma pelota de alirtiento na bandeja. Agora, pela primeira vez na histria do rato,
o comportamento de pressionar a barra tem a conseqncia especial de produzir
alimento. No ser necessrio esperar muito para ver os efeitos dessa nova contingncia
no com portam ento do rato. Logo o animal estar ativamente ocupado com
comportamentos de pressionar a barra e comer. Algumas mudanas ou modificaes bem
marcantes em seu comportamento ocorrem no espao de poucos minutos.
Na linguagem comum, dizemos que o rato aprendeu a pressionar a barra para obter o
alimento. Tal descrio contribui pouco para a proposio de que o rato est agora
pressionando a barra frequentemente e est obtendo alimento. 0 que desejamos fazer
descrever em detalhe, e to quantitativamente quanto possvel, as mudanas no
comportamento as quais resultam da simples operao de liberar uma conseqncia
especial, para apenas uma das atividades normais do indivduo que ocorre na situao.
Para fazer isso, consideremos quatro maneiras complementares de encarar as mudanas
no comportamento do rato quando, como o foi aqui, um de seus comportamentos
selecionado e recebe uma conseqncia favorvel.
4.3 - MUDANAS NA TAXA ABSOLUTA
O experimento que descrevemos um exemplo dos experimentos prottipos sobre o
comportamento operante realizados por B. F. Skinner em 1930. Uma das mudanas
comportamentais marcantes que ocorre sempre que um comportamento, como o
pressionar uma barra, seguido por alimento, que o comportamento aumenta
grandemente em freqncia. Ser til considerar o aumento que ocorre na freqncia,
quando o comportamento j existente sujeito a uma conseqencia especial, como um
fortalecimento deste comportamento. Ento, o processo que estamos examinando agora
poderia ser chamado de fortalecimento do comportamento operante, ou mais
brevemente, fortalecimento operante.
As mudanas na freqncia de um dado comportamento so vistas mais claramente
no aparelho similar a um quimgrafo, de Skinner, que registra, tinta, as ocorrncias
sucessivas da resposta selecionada e as acumula verticalmente num papel de registro, ao
mesmo tempo que a pena se move continuamente no tempo na direo horizontal. Para
compreender esse aparelho, que pode justificadamente ser chamado de microscpio dos
behavioristas, leia o programa da Tabela 4.2 passo por passo. Escreva suas respostas nos
espaos fornecidos para isso. Prossiga, passo por passo, at chegar ao fim.

- 79

Tabela 4-2 (continuao)


Neste diagrama, a taxa aumenta constantemente de um valor ba
prximo de___________ para um valor alto prximo d e ---------------Um aumento na taxa chamado acelerao positiva. A acelera
positiva vista neste diagrama/no diagrama do quadrado acima (marq
qual).
A acelerao negativa refere-se a um (a )------------------------------------na taxa.
A acelerao negativa vista no diagrama deste quadro/no do qua
acima (marque qual).

Para registrar outros eventos que ocorrem enquanto c animal e


respondendo, a pena move-se rapidamente 4para o sudeste'' e retor
novamente. No diagrama esquerda, a pena traou uma linha d e -para____Nesse ponto, a pena retornar imediatamente para-----------A pequena marca diagonal ("trao ou risco") e m ---------------------____foi feita pelo mesmo movimento da pena como mostrado ein d
A marca ou risco sudeste frequentemente usada para indicar q
uma resposta produziu alguma conseqncia especial.. No diagra
deste quadro, essas respostas foram registradas somente pela mar
vertical e m ---------------- - e -----------------
No diagrama deste quadro, uma resposta recebeu uma conseqnc
especial e m -------------N a p r tic a , o trao vertical feito por uma umca resposta mu
pequeno para ser facilmente identificado. Entretanto, podemos u
a --------------------- da curva em qualquer ponto como um indicador v
do da taxa de resposta.
No diagrama, a taxa foi mais alta entre_____ e ________zero entre
e ------ -- e de um valor intermedirio entre____e _____ ________

T abela 4-2

/ /
| '00
,1' g>50
S
5
10
Sl ------- 1------- L_
M inutos

(continuaao)

Quando os degraus so to pequenos que nao podemos contar a


tas, podemos ainda determinar o nmero de respostas entre doi
no registro usando uma escala.
No diagrama deste quadro, a poro vertical da escala direit
que aproximadamente
respostas foram emitidas en
no registro cumulativo esquerda.
Se o papel se move muito devagar, no ser possvel medir acur
te o tempo entre duas respostas, mas ainda assim podemos dete
tempo passado entre dois pontos escolhidos^
No diagrama deste quadro, a poro horizontal da escala di
diz que as respostas a e b do registro cumulativo esquerda oc
com um intervalo de aproximadamente
minutos.

No diagrama a esquerda, aps completar cerca de 100 resposta


e b , o animal parou por um curto p e r o d o J
"
q
- " ~
e ento emitiu cerca de ---- -- ------------- respostas en

f ----/a
----5------
10
aM M inutos
D
&
s vezes, uma curva cumulativa e usada para registrar a progresso de um automvel em movimento e,
ao indica a velocidade do movimento. Quando uma curva cumulativa usada para registrar o co
nima! a inclinao indica---------------------

de resposta significa o nmero de respostas por unidade de tempo. Num registro acumulativo, o
ostas pode ser determinado pela distncia percorrida pela pena na direo-------------

gistro cumulativo o tempo indicado pela distncia percorrida pela pena na direo---------------------------

TABELA 4-2

UMA SEQNCIA DE INSTRUO PROGRAMADA SOBRE CO


REGISTRO CUMULATIVO DA RESPOSTA (ADAPTADO DE SKIN

Uma larga tira de papel desenrola-se de um rolo. A ponta d


move-se vagarosa e constantemente para a esquerda. Uma p
sobre o papel traou uma linha que comea em __________ e
e m ------------------------- __________________________

O movimento vagaroso do papel sob a pena traou a linha horiz


_a ____________ . Em b a pena moveu-se repenti
percorrendo uma distncia pequena para cima at

No diagrama esquerda, o papel percorreu uma distncia peque


da posio mostrada no diagrama do quadro acima. A pena fix
uma segunda linha horizontal de _____________ a __________

No diagrama deste quadro, a pena j ocupou as quatro posi


c, d.
Ela ocupou a posio____________primeiro e________
ltimo.

No diagrama deste quadro, o tempo que decorreu entre c e d f o


-----do que o tempo que decorreu entre a e b -------------------------------

Tabela 4-2 (continuao)


Ao registrar as respostas emitidas por um organismo, a pena move
cima e traa uma linha vertical curta cada vez que uma resposta
No diagrama esquerda, um experimento comeou quando a pen
em a. A primeira resposta ocorreu em
No diagrama, tres respostas toram emitidas rapidamente e co
taxa constante e m ----------------------- --------------- e ----------------

No diagrama a esquerda, as trs respostas registradas em a


emitidas _____________ rapidamente do que as trs em b,--------

Quanto mais rpido o responder, tanto ---------------- as pausas entre as respostas.


Quanto mais alta a taxa de respostas, tanto .-------------- a linha horizontal traada
pela pena entre respostas sucessivas.
No diagrama do ltimo quadro, quanto mais rpido o responder, tanto_______________
a inclinao da linha em degraus.
A taxa de resposta mostrada p ela____________
de linha em degraus.

As respostas no diagrama a esquerda comeam com um


relativamente alta em a. O tempo entre as respostas sucessivas t
progressivamente_____________ __ ________________________

No diagrama, a inclinao da primeira parte da curva traada p


comeando em a relativamente___________________________

A que se parecem as curvas cumulativas tpicas do processe de fortalecimento instru


mental? As curvas vistas na Fig. 4.2 so os registros de quatro ratos individualmente
submetidos ao procedimento que descrevemos acima. As curvas indicam que o processo
de fortalecimento abrupto.

Tempo (minutos)

Figura 4.2 - Algumas curvas tpicas de respostas acumuladas obtidas de ratos famintos
no dia do fortalecimento de uma resposta de presso a barra pela primeira vez. Como
cada resposta produz uma pelota de alimento, os traos de alimento esto omitidos
(Skinner, 1938).

0
efeito da conseqncia especial de alimento nem sempre ocorre imediatamente,
mas uma vez que ocorre, h uma mudana abrupta para uma nova e alta taxa de resposta
que mantida no restante do experimento.
4.4

MUDANAS NA TAXA RELATIVA

Uma segunda maneira conveniente de observar o processo de fortalecimento da


resposta considerar as mudanas de taxa na resposta selecionada em relao as
mudanas de taxa que ocorrem em todo o substrato das atividades que ocorrem na
situao. Por exemplo, numa demonstrao do fortalecimento da resposta de pressionar
a barra para uma classe de gradua do Cornegie Institute of Technology foram
registrados os seguintes comportament' de um rato, em 15 min, de nvel operante, e 15
min subsequentes de fortalecimento d? ^sso a barra.

Rp =
=
=
Ra =
Rb =

atividades de presso barra.


farejar
Puxar uma pequena corrente pendurada no teto
cheirar a bandeja de alimento
Estender uma pata em direo a um bloco de chumbo colocado em um dos can
tos.

Ri = permanecer imvel por aproxjnvdar\vnre 9 seg contnuos.

-84 -

As freqncias dessas atividades durante o nvel operante e durante o fortalecimento


esto representadas nos histogramas da Fig. 4.3.

Rp

Rf

Rc

Ra

Rb

Ri

COMPORTAMENTOS
Figura 4.3 - Freqncias relativas de vrios comportamentos que ocorrem numa caixa
experimental antes e depois do fortalecimento do comportamento de pressionar a barra

Olhando a Fig. 4.3, vemos claramente que no apenas a taxa de presso a barra
aumentou, mas as taxas das outras atividades no associadas com alimento na situao
diminuram.
4.5 -

MUDANAS SEQENCIAIS NO RESPONDER

As modificaes comportamentais que acompanham o fortalecimento de uma dada


resposta se estendem alm dessa resposta para muitas outras atividades. Em particular,
quando o alimento dado ao animal, todas as atividades envolvidas na obteno de
alimento so tambm fortalecidas. Mas o fortalecimento no se limita simplesmente ao
aumento na sua freqncia. Uma mudana na ordem em que o animal emite certos
comportamentos ocorre no fortalecimento instrumental. Uma ordem particular
rapidamente estabelecida e mantida. No experimento de pressionar a barra, a seqncia
(1) pressionar a barra, (2) aproximar-se da bandeja de alimento, (3) pegar o alimento (4)
inger-lo, (5) aproximar-se da barra. (1) pressionar a barra... Em resumo, um elo contnuo
de comportamento foi formado pela operao de tomar o alimento contingente presso
barra. Esse elo bastante diferente do padro de seqncia de resposta vistas no n'^1
operante. Dois membros do elo estabelecido 1 e 2, serviro para ilustrar este ponto.
Ignoremos, por um momento, todos os outros comportamentos possveis na situao e
limitemos nossa ateno ao ( 1 ) pressionar a barra e ( 2 ) aproximar-se da bandeja (U*
- 8b

alimento. Antes do fortalecimento da pressdo barra, essas duas respostas ocorrem de tal
modo que, quando o animal emite uma delas, provvel que ele repita essa rnesma
resposta novamente em vez de emitir a outra (Frick e Miller, 1951). Assim, uma
seqncia bastante tpica de presso barra (Rp) e respostas de aproximar-se da bandeja
(Ra), no nvel operante, pode ser:
Rp

Rp

Ra

Rp

Rp

Rp

Ra

Ra

Ra . .

Durante o fortalecimento, essa seqencia muda rapidamente para a alternao:


Rp

Ra

Rp

Ra

Rp

Ra . ..

e dificilmente ser visto outro padro (Millenson e Hurwitz, 1961). No se sabe quo
rapidamente esse processo ocorre, mas sob condies favorveis, parece provvel que s ja
quase to instantneo quanto a mudana na taxa absoluta de presso barra.
4.6 - MUDANAS NA VARIABILIDADE
Um indivduo nunca emite um ato duas vezes exatamente da mesma forma. Assim
como cada vez que escrevemos nosso nome, fazemo-lo ligeiramente diferente, assim
tambm cada vez que o rato pressiona a barra, ele o faz de um modo ligeiramente
diferente. Algumas presses so feitas com a pata esquerda, algumas com a direita,
algumas vom o nariz e algumas com o ombro. Mesmo assim, agrupamos todos esses casos
e dizemos que a classe de respostas que chamamos presses barra constituda de todas
as possveis maneiras de pressionar uma barra. Durante o fortalecimento de tal classe de
resposta, estamos realmente fortalecendo esses casos individuais de respostas, cada uma
das quais difere ligeiramente de seus semelhantes.
Esse fortalecimento dos membros da classe de comportamentos que constituem a
presso a barra tem um efeito marcante na forma final em que o comportamento se
estnbelece. Enquanto inicialmente, no nvel operante, o rato tende a pressionai a barra de
muitas maneiras diferentes, depois do fortalecimento, tende a faz-lo de poucas maneiras.
Em outras palavras, os casos individuais tornam-se cada vez mais semelhantes. Expressa
mos este resultado dizendo que a topografia do comportamento se restringe durante o
fortalecimento instrumental. A topografia de uma resposta refere-se maneira pela qual o
animal emite a resposta. Estritamente falando, a topografia parece dizer respeito aos
msculos realmente empregados no momento da ocorrncia da resposta. 0 registro de
tais eventos, todavia, apresenta dificuldades. Como uma tentativa para fazer isso, pode-se
empregar uma cmara para fotografar o animal no momento em que a resposta con
cluda. Guthrie e Horton (1946) tiraram fotografias de gatos e ces quando o comporta
mento que produzia uma conseqncia especial era o de inclinar uma vara que estava no
centro da caixa do animal. A Fig. 4.4 ilustra alguns exemplos extremos da estereotipia do
comportamento depois do fortalecimento. Cada animal adota uma topografia idiossincr
tica e s se afasta dela em qualquer ocasio determinada apenas em detalhes. Um
exemplo surpreendente de estereotipia humana no comportamento instrumental apren
dido visto na Fig. 4.5.
86

' t

Figura 4.4 - Desenhos das respostas de dois gatos e um co em emisses sucessi


vas de uma resposta de inclinar uma vara (Kimble, 1956, segundo Guthrie e Hor
ton, 1946).

4.7 - OPERANTES E ESTMULOS REFOR ADORES


Em resumo, ento, os quatro efeitos do fortalecimento de uma resposta so:
1 aumentar a taxa desta resposta em relao ao seu nvel operante;
2 aumentar a taxa dessa resposta em relao txa de outro comporta
mento que est ocorrendo na situao;
3 transformar num elo, que sempre repetido, o padro ou seqncia das
respostas envolvidas;
4 aumentar a estereotipia da resposta selecionada.
A presso barra, o puxar a corrente, explorar com o nariz, inclinar uma vara e assim
por diante so atos convenientes escolhidos pelos experimentalistas para estudar esses
efeitos. A adequao desses comportamentos para o estudo do fortalecimento operante
depende criticamente da sua capacidade de serem modificados como foi descrito. For
malmente, esses e outros comportamentos, assim fortalecidos, so definidos como
operantes. Os quatro efeitos do fortalecimento constituem o que chamaremos, daqui por
diante, de leis do fortalecimento operante. Presses barra e outros comportamentos
simples dos animais so escolhidos para estudar essas leis porque eles so facilmente
observados e medidos pelo experiinntador e facilmente executados em vrias taxas pelo
organismo. No decorrer deste texto, continuaremos a ampliara aplicabilidade dessas leis
e do termo operante muito alm de presso barra e ratos.

- 87 -

Na sua lei do efeito, Thorndike enfatizou a importncia de certas consequencias


espeicais do comportamento. Eventos que eram satisfatrios , dizia ele, e que seguiam o
comportamento, atuavam de modo a fixar
aquele comportamento. Embora chamar
tais eventos de satisfatrios possa, primeira vista, parecer uma especificao indepen
dente e til das conseqncias especiais, o fato que fornecer uma definio satisfatria
para satisfatria' 1 difcil. No caso do animal, no temos uma maneira de saber se um
evento satisfatrio, salvo pela observao de se ele atua no comportamento de acordo
com as leis do fortalecimento operante. No caso do ser humano podemos pensar que a
satisfao possa ser facilmente identificada, mas tente definir o termo. Coisas satisfa
trias so aquelas das quais gostamos, mas quais so essas coisas? Em ltima instncia, as
coisas de que gostamos so aquelas que trabalharemos para obtr. Mas dizer que trabalha
remos por elas outra maneira de dizer que faremos por elas o que o nosso rato far
por alimento. Somos, ento, levados concluso de que a definio dessas conse
qncias especiais melhor concebida em termos de seus efeitos especiais no comporta
mento.

Figura 4.5 - Ted Williams completando


suas 2.000 rebatidas no primeiro turno e
2.001 rebatidas no quinto turno de um jo
go disputado no Yankee Stadium em 11
de agosto de 1955 (The New York Times
and Patrick A. Burns).

Em resumo, temos um grupo de conseqncias especiais, especiais porque quando


usadas em conexo com operantes, como fizemos na seo 4.2, resultam em mudanas
caractersticas de comportamento.
Uma lista parcial de tais conseqncias conveniente. Para seres humanos e animais
superiores
Alimento
gua
Sexo
Calor
Novidade
funcionam dessa maneira.
-8 8 -

Uma conseqncia sempre uma mudana no ambiente de um indivduo. A apresen


tao de alimento para nosso rato foi uma mudana 110 seu ambiente previamente sem
alimento. A conseqncia de pedir um copo dgua pode ser um novo ambiente onde o
copo dgua aparece na mo de um amigo. A conseqncia de tirar o telefone do gancho
um novo ambiente que agora inclui o sinal de discar. Poderamos estender tais
exemplos indefinidamente. Note, nosso ambiente foram definidas, no contexto dos
reflexos e do condicionamento Pavloviano, como estmulos. , ento, evidente que, ao
falar de um certo grupo especial de conseqncias, nada mais estamos fazendo do que
delimitando, pelos seus efeitos especiais sobre operantes, um certo subconjunto de
estmulos. Podemos convencionalmente definir aqueles estmulos que, ao seguirem o
comportamento operante, atetam-no atravs das leis do fortalecimento operante, como
estmulos reforadores (S+) ou simplesmente reforadores. A operao de apresentar um
reforador denominaremos de reforamento.
Diz-se, algumas vezes, que os tenros operante e reforamento so circulares. Parece
que cada um definido em termos do outro. Reforadores parecem ser definidos como
aqueles eventos que fortalecem operantes; mas operantes parecem ser definidos como
aqueles comportamentos que so suscetveis de fortalecimento pelos reforadores. O
pequeno experimento imaginrio que se segue mostra como a circularidade pode ser
quebrada.
Imagine um experimentador ingnuo diante de um Marciano. Ele observa um orga
nismo que nunca viu antes. O organismo faz alguma coisa. O experimentador, de sua
mala de conseqncias, apresenta uma aleatria. Ser que o organismo executa nova
mente esse comportamento com maior freqncia ou ser que a conseqncia no tem
efeito algum? Se no, talvez o experimentador tente novamente outra conseqncia ou
tente, talvez, a mesma conseqncia, mas selediona outro comportamento. Por um
processo de tentativa e erro, o experimentador pode descobrir certas conseqncias e
certos comportamentos que funcionem das maneiras descritas nas sees 4.3 a 4.6. Tendo
descoberto uma conseqncia especial, ele pode continuar a us-la para descobrir outros
operantes. Tendo encontrado um operante, ele pode continuar a us-lo para descobrir
outras conseqncias. Pouco a pouco, o experimentador persistente construir seus con
ceitos de reforadores para o Marciano e operantes do Marciano apenas atravs de
tais operaes.
4.8 - 0 PARADIGMA DO FORTALECIMENTO OPERANTE
O que temos discutido no fortalecimento operante diversamente mencionado na
literatura de psicologia como suscetiva, de ensaio e rro, aprendizagem de efeito,
aprendizagem instrumental, condicionamento instrumental, aquisio, condicionamento
Tipo R (para resposta), aprendizagem operante e condicionamento operante. Preferimos
restringir o termo fortalecimento operante para as condies em que o comportamento
que reforado j existe com uma certa fora, maior do que zero, no momento em que o
fortalecimento iniciado. Contudo, ao examinarmos outras fontes, til reconhecermos
a equivalncia desses vrios nomes para o processo de fortalecimento.
Estamos agora em condies de dar uma definio compreensiva do paradigma do
fortalecimento operante. Tal como o condicionamento Pavloviano, ele tem quatro
aspectos: um. Dado, um Procedimento, um Processo e um Resultado.
- 89 -

DADO : 1 Uma resposta operante sendo emitida numa freqncia maior


do que zera
2 - Um reforador apropriado.
PROCEDIMENTO: Seguir cada emisso do operante selecionado com o estmulo refor
ador.
til representar o procedimento de fortalecimento operante simbolicamente. O
procedimento pode ser representado simplesmente como:
R ->

S+

Onde R representa uma classe de resposta operante (constituda de r j, r 2 . . . rn), S+


representa um estmulo reforador e a seta lida como produz ou conduz a.
PROCESSO: Um aumento abrupto na taxa do operante, sua incorporao rpida
num elo de comportamento e uma restrio na topografia do ope
rante.
RESULTADO: O mesrrto que no processo.
4.9 - OPERANTES VOCAIS
As atividades humanas que chamamos linguagem constituem possivelmente, o mais
complexo de todos os padres de comportamento humano. At o presente momento, a
linguagem ainda to nica para o organismo humano que pode muito bem ser tomada
como uma das propriedades principais que definem a espcie. Os elementos comuns de
todas as linguas so os sons produzidos pela vibrao do ar que expelido dos pulmes e
que passa atravs de um grupo de msculos na laringe, chamados de cordas vocais. A tenso
desses msculos, medida que o ar passa atravs deles, est sob o mesmo tipo de controle
que governa os movimentos de outras partes do corpo. Conseqentemente, a produo
do som comportamento operante. A regio maxilar, os lbios e a lngua agem em
combinao com a laringe para moldar os sons e produzir mais de quarenta sons humanos
diferentes, conhecidos como fonemas, os quais so usados em vrias combinaes nas
lnguas. Devido ao fato de que os sons dos fonemas so diretamente dependentes dos
movimentos do aparelho vocal, a medida da produo do fonema constitue uma medida
indireta do comportamento, do mesmo modo que a medida da presso a barra constitue
uma medida indireta dos movimentos realizados pelo rato ao pressionar esta barra.
A linguagem humana desenvolve-se a partir de sons no refinados, emitidos pelas
crianas. De um modo surpreendente, um beb, durante os primeiros 5 meses de vida,
emite todos os sons usados em todas as lnguas fiumanas nasais e fricativas francesas,
guturais germnicas, e assim por diante (Osgood, 1953). Esses sons so emitidos indepen
dentemente de estmulos eliciadores e devem ser distinguidos do choro real de um beb.
Durante os primeiros meses de vida, um beb exibe um nvel operante muito alto de
produo de sons. Ele pode ficar horas
produzindo sons de gargarejo estalos com a
lngua, sibilos, gritos e roncos. O termo tcnico balbucio empregado para denotar a
emisso espontnea desses comportamentos. Um progresso importante no balbucio
ocorre por volta de seis meses, quando a estrutura seqencial do balbucio alterado de
modo que a criana tende a repetir sua prpria produo vocal (gu-gu, d-d, l-l, etc).
As mudanas que ocorrem do balbucio fala so complexas e um nico grfico no
-9 0 -

suficiente para descrever completamente o progresso. Todavia, uma mudana impor


tante que ocorre a mudana na freqncia relativa dos diferentes sons pronunciados,
medida que o beb cresce. Assim, na Frana, os fonemas envolvidos no r francs e as
vogais nasais so fortalecidos pela comunidade que refora os pais da criana, seus
companheiros de brinquedos e, eventualmente, seus professores. Em pases de lngua
inglesa, um grupo diferente de fonemas modelado em palavras por uma comunidade
reforadora diferente. O resultado desse fortalecimento pode ser inferido de um grupo de
histogramas semelhantes aos da Fig. 4.3, porm mais complicados. Na Fig. 4.6, so vistos
os histogramas das freqncias relativas de 12 fonemas voclicos (veja o Apndice A
neste captulo, para sua explicao) para crianas de vrias idades e adultos. Podemos
inferir que o reforamento desses sons ajusta a sua freqncia quela da comunidade
adulta.
recm-nacido _

-23-24 meses

cu
<
c60
tf
C
o

<L>
O,

5-6 meses -

A d ulto----

JZ t

i IeAeoDoUu

i I e C s A e o o o U u

Figura 4.6 - Perfis da freqncia


de fonemas vogais, mostrando a mudana gradual
da freqncia relativa em direo a um padro tpico do adulto na comunidade refor
adora das crianas (Irwin, 1952).

Uma prova mais direta dos efeitos de se reforar sons produzidos pela criana surge
de experimentos de laboratrio. Num experimento, o comportamento de bebs de 3
meses de idade foi observado enquanto eles permaneciam em seus beros. Durante duas
sesses de observao, um experimentador adulto recurvava-se sobre o bero a uma
distncia um pouco maior do que 30 cm da criana e permanecia relativamente sem
movimento e sem expresso. Durante esse perodo, um segundo observador registrava a
freqncia de sons produzidos pela criana. Em duas sesses subseqentes, o procedi
mento foi o nesmo, exceto que o primeiro experimentador seguia cada som que no
fosse choro com um^sorriso, trs sons utsk e um leve toque aplicado no abdomen da
criana com os dedos da mo. (Rheingold, Gewirtz e Ross, 1959, p. 28). Isto, natural
mente, apenas:
R(balbucio) >

^(sorrisos, sons, tocar o^abdomen)

O efeito do procedimento foi um aumento da freqncia do balbucio bem acima da sua


taxa ao nvel operante durante essas sesses de fortalecimento.
O experimento demonstra a natureza operante dos sons humanos. Muitos' outros
animais emitem sons, alguns dos quais so reforveis e outros no. Um chimpanz foi
criado, desde o nascimento, com uma famlia que tentou ensin-lo a falar. (Hayes, 1951).
A tarefa foi difcil, porque o macaco, primeira vista, no emitia som operante algum.
Os nicos sons que produzia eram gritos reflexos quando alimento ou outros eliciadores
- 91 -

apareciam, e sons CR aos estmulos que haviam sido previamente emparelhados com
esses eliciadores. Mrs. Hayes tentou seguir o seguinte procedimento
o

1 (viso do alimento)

p PI

(g ri to excitado)

_j_

S (alimento)

[4.1]

na esperana de fortalecer a CR (gritar), reforando-a. 0 procedimento foi seguido por


muitos meses mais no foi efetivo, mostrando que o comportamento respondente con
dicionado no est sob o controle de suas conseqncias. Eventualmente, um som ahhh
emitido apareceu, espontaneamente, num dia e mostrou-se ser reforvel. O macaco
aprendeu, eventualmente, a dizer Mam^ Papa e Cup atravs de procedimentos que
discutiremos num captulo posterior.
interessante especular sobre a importncia da histria de f4.ll para a produo
eventual do operante ahhha. Foi 4.1) um precursor necessrio para esse operante, ou
com a mera passagem do tempo poderia o macaco t-lo desenvolvido, de qualquer
modo, na ausncia de [4.1]? Uma das dificuldades principais para o desenvolvimento da
fala (como a conhecemos) no macaco a ausncia de balbucio. Enquanto um beb
balbucia para si mesmo por horas sem fim, num estgio comparvel de desenvolvimento,
o beb chimpanz permanece quieto. Em geral, por vrios dias, o chimpanz no pro
nuncia um nico som. Logicamente, um nvel operante maior que zero um requisito
para fortalecimento, pois alguma coisa deve existir para se reforar.
Em experimentos com outros animais, verificou-se que o ladrar de ces, o miar de
gatos e alguns dos sons das aves so reforveis. Nestes casos, a freqncia da produo
de sons pode ser aumentada marcadamente, atravs de suas conseqncias especiais.
4.10 - A EXTENSO DO FORTALECIMENTO OPERANTE
O fortalecimento operante um fenmeno que, de algum modo, limitado aos
comportamentos simples de animais e crianas que discutimos at agora. Estudamos o
animal porque podemos controlar rigorosamente seu ambiente passado e presente. Mas o
comportamento operante
isto , o comportamento que pode ser fortalecido por suas
conseqncias constitui uma grande proporo das atividades cotidianas dos homens
Quando chutamos uma bola de futebol, cozinhamos uma galinha, discutimos a ltima
moda, lamentamos o tempo e lavamos os pratos, estamos constantemente emitindo
muitos operantes. Com efeito, estamos emitindo algum operante em cada momento de
nossa vida. Na verdade, nossos operantes so freqentemente arranjados em seqncias
mais complicadas do que a simples cadeia repetitiva do rato na seo 4.2 *Mas como
veremos em captulos posteriores, uma complexidade surpreendente pode ser tambm
gerada ao nvel do rato, gato, pombo e macaco.
No difcil demonstrar o fortalecimento operante em seres humanos. Dadas as
condies do paradigma do fortalecimento operante, podemos realizar demonstraes em
nossos amigos sem grandes dificuldades. A principal considerao adicional que
acharemos a demonstrao mais drstica e convincente se impedirmos nosso sujeito
humano de tornar cnscio de que estamos realizando um experimento de fortaleci
mento. O tornar-se cnscio uma maneira dedizer que o sujeito capaz de verbalizar o
procedimento que est sendo efetuado. Este estar cnscio verbal um ndice seguro de
que o comportamento que estamos tentando fortalecer estar agora sob o controle
poderoso de anos de histria passada, com o qual a aplicao de um paradigma de
- 92 -

fortalecimento de, digamos, 30 min. com um reforador fraco ter pouca possibilidade
de competir.
Num delineamento experimental interessante, baseado nos trabalhos iniciais de W.
Verplanck (1955) um assistente de pesquisa de graduao foi usado como um ( ator**
para tentar fortalecer certo comportamento de conversa em alunos de graduao
(Centers, 1963). O assistente e o sujeito eram colocados numa sala, ambos esperando
ostensivamente serem chamados para um experimento de psicologia. Na verdade, este era
o experimento. Durante esse tempo, o assistente estabelecia uma conversa com o sujeito
que de nada suspeitava e, em vrios perodos, reforava diversos tipos de contedo de
conversa, tais como demonstrao de opinio, fornecimento de informao e perguntas,
com concordncia -e ateno especial. Enquanto isso, sem conhecimento do sujeito, a
conversa estava sendo gravada e observada atravs de um espelho unidirecional.
A conversa experimental durava 30 min. sendo dividida em trs perodos de 10
min. Durante o primeiro perodo, ou nvel operante, o assistente procurava no demons
trar concordncia ou fornecer respostas informativas s opinies e perguntas do sujeito.
Durante os 10 minutos seguintes, o perodo de fortalecimento comportamental o assis
tente concordava com, ou parafraseava favoravelmente, todas as demonstraes de
opinio emitidas pelo sujeito. Alm disso, ele expressava ateno, simpatia, e compreen
so para todas as informaes propostas e reforava todas as perguntas ou dando a
informao solicitada ou concordando e aprovando, se era isto o que a pergunta indicava
desejar. Durante os 10 min. finais, o assistente ou discordava das opinies do sujeito ou
permanecia silencioso depois que elas eram verbalizadas. Ele ignorava as informaes
fornecidas e era o mais alheio possvel s questes.
Os resultados do reforamento de concordar (fortalecimento) indicaram claramente
que a freqncia de demonstrao de opinio e fornecimento de informao, em relao a
todas as proposies, aumentou. Alm disso, nenhum sujeito notou este condiciona
mento de seu comportamento. Por razes desconhecidas aos experimentadores, o fazer
perguntas no mostrou qualquer fortalecimento e assim, de acordo com a nossa defi
nio, ele no constitui uma classe operante.
Num nvel diferente de desenvolvimento, Brackbill (1958) fortaleceu com sucesso
uma resposta de sorrir em bebs de 4 meses de idade, utilizando o contato fsico como
reforamento.
O prprio cientista est empenhado num empreendimento que exige, frequente
mente, a emisso de muitos operantes, poucos dos quais so reforados. Comporta
mentos que levam proposio de novas relaes, ou de uma nova ordem entre os
conceitos, uma descoberta de um novo fenmeno e assim por diante, so reforados pela
comunidade cientfica. Entre os reforadores proeminentes para os behavioristas, est a
ordem observada quando se v que algum comportamento de um indivduo est regular
mente relacionado s suas conseqncias, como no caso da presso a barra pelo rato da
seo 4.2. Essa lembrana de que o prprio pesquisador um organismo que se com
porta, sujeito s leis do fortalecimento operante, caracteriza o desenho visto na Fig. 4.7.
A verificao das leis do fortalecimento operante no comportamento humano
importante, porque isto mostra que apesar das diferenas aparentes muito grandes entre
homem e animal existem certas similaridades funcionais. So essas similaridades que, em
tima instncia, justificam o nosso estudo da psicologia atravs do comportamento de
organismos inferiores. Afinal de contas, o Psiclogo est principalmente interessado no
comportamento humano, o a mais exatamente dos comportamentos, que so cornparti93 -

Figura 4.7 - Rapaz, este cara est condicionado. Cada vez que eu pressiono a barra, ele joga
uma pelota aqui dentro . (Adaptado com permisso de Jester Columbia College).

lhados por ambos, seres humanos e animais superiores. Frequentemente, utilizamos


sujeitos animais em nosso trabalho experimental por razes pragmticas. Podemos con
trolar mais facilmente o ambiente imediato e passado do animal. Podemos priv-lo de
agentes tais como alimento e gua, de modo a utiliz-los mais tarde como reforadores
poderosos. Finalmente, podemos observar continuamente o animal por perodos longos
de confinamento.
O uso de animais na pesquisa em psicologia segue uma tradio longa e respeitada na
cincia, a de controlar e isolar condies relevantes, de modo a revelar a regularidade
bsica na natureza. Talvez, a classe mais importante de variveis independentes em psico
logia diga respeito histria passada do indivduo. Um sujeito humano chega at ns com
uma histria passada longa, complicada e incompletamente conhecida. 0 fato de que
mais ou menos uma hora de reforamento fraco de operantes apenas parcialmente especi
ficados possa resultar numa modificao comportamental detectvel, como no experi
mento de Centers (1963), deve ser tomado como um tributo natureza fundamental dos
processos que isolamos a partir do estudo animal.
4.11 - SUPERSTIO
Dizer que o reforamento contingente a uma resposta pode significar apenas que
ele segue a resposta e no implica necessariamente numa ligao fsica direta entre a
resposta e o reforador. O reforamento pode ser mediado pelo comportamento de um
experimentador, ou por algum outro aparelho automtico. 0 efeito do reforamento no
comportamento indiferente aos meios pelos quais a correlao temporal entre R e S+
efetuada. O poder automtico do reforamento em fortalecer o comportamento nos
lembra que, do mesmo modo que o condicionamento Pavloviano, sempre que as condi
es temporais para o procedimento de fortalecimento operante so alcanados (na selva,
no lar, no laboratrio), provvel a ocorrncia de modificaes no comportamento.
Quando nos lembramos de que o processo de fortalecimento quase sempre virtual
mente instantneo, no nos surpreenderamos ao descobrir que o fortalecimento do
comportamento pode ocorrer mesmo em situaes onde existe apenas uma coincidncia
fortuita entre uma dada R e a ocorrncia do S+. No experimento realizado por Skinner
(1948), um pombo faminto foi colocado numa caixa no diferente daquela vista na Fig.

- 94 -

4.1. No havia, no entanto, uma barra nesta caixa e o alimento consistia dc pequenas
pores de gros misturados que poderiam ser fornecidos atravs do alimentador. Cada
15 segundos, o alimento era automaticamente apresentado ao pombo, no importando o
que ele estivesse fazendo no momento. Sob essas condies, 6 entre 8 pombos rapida
mente desenvolveram respostas caracteristicamente diferentes mas estereotipadas. Um
pombo desenvolveu um movimento circular contrrio aos ponteiros do relgio, comple
tando duas ou trs voltas entre os reframentos. Um segundo pombo repetidamente
estendia sua cabea em direo a um dos cantos superiores da gaiola. Outro apresentou
um movimento de balanar a cabea' no plano vertical. Os outros trs pombos desen
volveram uma variedade de outros movimentos bizarros da cabea e do corpo,
caractersticos.
O processo de fortalecimento casual , em geral, aparente. Por acaso, o animal estava
executando alguma resposta no momento em que o alimento era fornecido. Essa coinci
dncia fortalece essa resposta e, assim, torna-a mais provvel de reaparecer novamente e
ser reforada uma segunda vez. Uma vez iniciado, o processo se perpetua. Como Skinner
salientou, pode-se dizer que o experimento demonstra um tipo de superstio.
O animal comporta-se como se existisse uma relao causai entre seu compor
tamento e a apresentao do alimento, embora tal relao no seja real. Existem
muitas analogias no comportamento humano. Os rituais para mudar a sorte de
algum com cartas so bons exemplos. Poucas conexes acidentais entre um ritual e
as conseqncias favorveis so suficientes para estabelecer e manter o comporta
mento, apesar dos muitos casos no reforados. Um outro exemplo o do jogador de
boliche que lana a bola fora da pista, mas continua a se comportar como se estivesse
controlando-a atravs da curvatura e torso de seu brao e ombro. Esses comporta
mentos no tm, naturalmente, efeito real algum sobre a sorte de algum ou sobre a
bola a meio caminho fora da pista, tal como, no presente caso, o alimento apareceria
com a mesma freqncia se o pombo nada fizesse ou, estritamente falando, se ele
fizesse outra coisa qualquer (Skinner, 1948, p. 171).
4.12 - CONDICIONAMENTO OPERANTE
O fortalecimento operante um caso especial do que chamaremos mais tarde de um
modo mais geral de condicionamento operante. O termo condicionamento algo
infeliz neste contexto porque ele lembra a natureza eliciada do comportamento respon
dente. Contudo, o fortalecimento operante e o condicionamento Pavloviano tm certas
similaridades importantes. Em particular, as modificaes do comportamento observadas
em ambos os paradigmas so condicionais a alguma histria passada anterior. Num caso, a
histria um emparelhamento de um S ^co m um S2 - No outro, a histria de uma
determinada R que ocorre imediatamente antes de um S+. essa natureza condicional
das mudanas comportamentais que justifica o uso do termo condicionamento para
ambos. Na medida em que as diferenas importantes entre os dois fenmenos sejam
sempre lembradas, no h perigo algum em empregar o termo condicionamento , quali
ficado que seu adjetivo apiopriado, Pavloviano ou operante. Todavia para evitar o perigo
que advem de se negligenciar essas diferenas, limitamos geralmente o termo condiciona
mento para o paradigma Pavloviano e utilizaremos outros termos (por exemplo, fortaleci
mento) para nos referirmos s vrias modificaes operantes que estudaremos nos captu
los que se seguem. A Tabela 4.3 apresenta algumas comparaes diretas entre os dois

tipos de modificaes comportamentais que so frequentemente chamadas de condicio


namento.
Tabela 4.3
COMPARAO ENTRE O CONDICIONAMENTO PAVLOVIANO E OPERANTE

CONDICIONAMENTO
PAVLOVIANO

CONDICIONAMENTO
OPERANTE

Sr
PARADIGMA OU

CR

R - S ^

PROCEDIMENTO

NATUREZA DA

CR est sob o controle de


S\ (CR pode ter elemen
tos em comum R 2 )

R emitida

A ____________

PROCESSO

RESULTADO

Fortalecimento de uma R
Formao de alguns com
j existente no repertrio
portamentos novos (CR) a
comportamental.
Sl

Probabilidade da CR a S\
COMO MEDIDO magnitude da CR, latncia
da CR.

Taxa de R, forma de R or
dem seqencial relativa a
outras Rs que ocorrem

Em geral envolve msculos


lisos e glndulas.

Em geral envolve msculos


do esqueleto.

CORRELATOS
FISIOLGICOS

Envolvido na emoo. Pos


IMPORTNCIA PA sivelmente, parte do subs
RA A PSICOLOGIA trato motivacional.

-9 6 -

R aumenta em freqncia sua


topografia reduzida e ela
incorporada a um elo de
comportamento.

CR gradualmente evocada
por S\

Pedra fundamental para


aquisio de atividades
complexas de soluo de
problemas.

APNDICE A
A tabela seguinte a chave para os fonemas apresentados na abscissa da Fig. 4-6.

SMBOLO

EXEMPLO

o i na palavra fria

1
e

o i na palavra fcil
/
o a n/ palavra mesa

o da palavra f, seguido do a de rua

intermedirio entre o de j e o em f

primeiro a da palavra cama

som aberto do na palavra f

o a da palavra caro, um pouco mais demorado

o o na palavra n

como em vou

o o da palavra porque

como o u na palavra uva

REFERNCIAS PARA O CAPITULO 4.


Brackbill, Yvonne. Extinction of the smiling responses in infants as a
function of the reinforcement schedule. Child Develpm., 1958, 29,
115-124.
Centers, R. A laboratory adaptation of the conversational procedure for
the conditioning of verbal operants. /. abnorm. soc. Psychol., 1963,
67, 334-339.
Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. NTew York:
Appleton-Century-Crofts, 1957.
Frick, F. C., and Miller, G. A. A statistical description of operant condi
tioning Am er. /. Psychol.. 195 1, 64, 20-36.
Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New York: Rine
hart, 1946.
-9 7 -

Hayes, C. The ope in ourM ause ifevv Y ork H arper and Row, 1951.
Irwin, O. C. Infant spcech: development of vowel sounds. / . speech
hearing Disorders, 1952, 1 7 ,2 6 9 -2 7 9 .
Mednick, S. A. Learning. Englewood ClifTs: Prentice-Hall, 1964.
Millenson, J. R., and Hurwitz, H. M. B. Some tem poral and sequential
properties of behavior during conditioning and extinction. /. ex p .
Anal. Behav., 1 9 6 1 ,4 ,9 7 -1 0 5 .
Osgood, C. E. M ethod and theory in experimental psychology. New
York: Oxford Univcr. Press, 1953.
Rhcingold, II. L., Gewirtz, J. L., and Ross, H. W. Social conditioning of
vocalizations in the infant. /. comp, physiol. Psychol., 1959, 52,
68 -7 3 .
Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938.
Skinner, B. F. Superstition in the pigeon. / . exp. Psychol., 1948, 38,
168-172.
Skinner, B. F. Walden two. New York: Appleton-Century-Crofts, 1948.
Skinner, B. F. A case history in scientific method. A m e r. Psychologist,
1 9 5 6 ,1 1 ,2 2 1 -2 3 3 .
Skinner, B. F. The experimental analysis of behavior. Am er. 5c/., 1957,
45, 343-371.
Skinner, B. F. Cumulative Record. New Y ork: Appleton-Century-Crofts,
1959.
Spencer, H. The principles of psychology. New Y ork: D. Appleton,
18/78.
Verplanck, W. S. The cntrol of the content of conversation. / . abnorm.
soc. Psychol., 1955, 51, 668-676.

-9 8 -

Captulo 5 - EXTINO E RECONDICIONAMENTO DO OPERANTE

Quando a conexo entre uma resposta operante e seu reforador abruptamente


desfeita, o resultado um processo comportamental caracterstico. As caractersticas
deste processo, que chamado extino, representam uma parte importante na instalao
e manuteno de padres comportamentais complexos, sendo por isso examinadas com
alguns detalhes neste captulo.
Historicamen te, o conceito de extino tem tido uma evoluo vagarosa e difcil. O
enfraquecimento caracterstico do comportamento (isto , o declnio em sua freqncia)
visto sob o procedimento de extino foi considerado pelos primeiros pesquisadores
como um mero artefato do fortalecimento concorrente de outros comportamentos
competitivos . A suposio de que a extino no poderia ser explicada em termos de
uma operao de fortalecimento concomitante em qualquer outra parte na corrente de
comportamento veio somente com a descoberta de que a extino acarreta mais do que o
enfraquecimento (diminuio na freqncia) de uma nica classe de resposta.
Quando se permite que um operante, previamente reforado, ocorra sem a conse
qncia usual de reforamento, numerosas respostas no reforadas ocorrem. Essas
respostas so, no incio, emitidas com uma alta freqncia, maior mesmo do que quando
elas estavam sendo reforadas. Esse aumento imediato na taxa de resposta est correlacio
nado com mudanas na topografia e magnitude do comportamento que o implicam como
emocional. Um rato, treinado anteriormente a pressionar uma barra por alimento, atacar
vigorosamente e morder a barra quando o reforamento for omitido. O rato, tal como
um homem incapaz de achar suas chaves no bolso, onde ele, usualmente,as encontrava,
mostra efeitos que podem ser designados como raiva. Alm dessas mudanas compor
tamentais na taxa e topografia, o elo de comportamento, anteriormente bem estabeleci
do, degenera-se, voltando aos padres de atividades vistos antes do fortalecimento. Ao
mesmo tempo, medida que a extino
continua, os comportamentos previamente
suprimidos pelo fortalecimento da resposta selecionada comeam a retornar sua proeminncia antiga no repertrio de resposta do animal. Muitas dessas mudanas ocorrem
gradualmente, estendendo-se por um perodo de muitas horas. De fato, o processo de
extino to demorado, mesmo seguindo uns poucos reforamentos, que seguro dizer
que provavelmente nenhum estudo delineou o processo em todos os seus aspectos, at
seu ponto final.

-9 9 -

5.1

MUDANAS NA TAXA DE RESPOSTA DURANTE A EXTINO

O declnio na taxa de uma resposta anteriormente reforada o efeito mais claio da


extino. As mudanas na taxa so claramente vistas numa curva cumulativa, onde elas
nparecem como flutuaes ondulatrias superpostas numa acelerao negativa geral. A
Fig. 5-1, ilustra a curva de extino a resposta de presso barra de um rato,
anteriormente acostumado a receber uma pelota de alimento para cada presso a barra. A
taxa de resposta mais alta no incio (imediatamente aps a retirada do reforamento) e
diminui gradualmente durante o perodo de uma hora e meia. Ao fim de 90 min. o rato
est respondendo numa taxa apenas ligeiramente maior do que a do seu nvel operante.
omo a Fig. 5-1 mostra, a curva de extino muito irregular e contm muitos perodos
l alta atividade intercalados com perodos de pouca atividade
(as pores planas da
curva). Esses ltimos tornam-se mais proeminentes prximo ao fim da extino. Alguns

Figura 5-1. Uma curva de extino para uma resposta de presso a barra anteriormente
reforada (De Skinner, 1938 dados de 7. S. Keller e A. Kerr).

p v.iisadores supuseram que o processo de extino devido principalmente a um


aumento gradual no nmero desses perodos inativos no decorrer do tempo e que>
qua ido o organismo responde, ele o faz na sua taxa alta usual. Hurwitz (1 9 5 7 ) apresen
tou dados sugestivos que suportam essa noo. Ele analisou um nmero de curvas simila
res as da Fig. 5-1, dividindo-as em intervalos sucessivos de tempo de 2 min. Dividiu,
ento, os intervalos em duas classes, dependendo de quantas respostas eles continham.
Aqueles que continham zero ou somente uma resposta, ele chamou de silenciosos .
aqueles que continham duas ou mais, ele chamou de "ativos". Hurwitz descobriu que o
nmero de respostas nos perodos kativos no declinava a medida que a extino
progredia, mas que mais e mais intervalos tornavam-se "silenciosos". Seus resultados para
trupo de animais esto resumidos na Fig. 5-2.

10

Intervalos sucessivos de 2 min.


(A)

20

30

40

50

60

Intervalos sucessivos de 2 min.


(B)

Figura 5-2. Anlise do responder durnnte a extino. (Segundo Hurwitz, 1957).

/ 5.2 - MUDANAS T0P0GJRAFICAS E ESTRUTURAIS NA EXTINO


Os efeitos da extino no se limitam a mudanas na freqncia de uma determinada
resposta. Ocorrem, em particular, mudanas marcantes na form a do comportamento
durante a extino. Num estudo de Antonitis (1951), onde foi estudado o operante do
rato de introduzir o focinho por entre uma fenda de uma das paredes, mediu-se os efeitos
de vrias sesses de extino intercaladas com fortalecimento. Uma parede da gaiola
utilizada por Antonitis continha uma fenda horizontal de 50 cm de comprimento.
Sempre que o rato introduzia o focinho dentro da fenda, um raio de luz era
interrompido, sendo tirada uma fotografia do rato no momento exato em que a resposta
era dada. Media-se a posio em que o rato estava ao longo da fenda, naquele momento, e
o ngulo que seu crpo formava com uma linha perpendicular fenda. A Fig. 5-3 ilustra
o aparelho.

Figura 5-3. Representao pictorial da resposta estudada por Antonitis (195 1 ).

- 101 -

Reforando, com aliipento, a colocao do focinho na fenda, a freqncia desse


comportamento foi primeiro aumentada acima do nvel operante. Subsequentemente, o
colocar o nariz na fenda foi extinguido, refortalecido, reextinguido e refortalecido nova
mente. Confirmando os resultados de Guthrie e Horton (1946) com a resposta de inclinai
uma vara em gatos e ces, Antonitis notou que o ngulo e a posio da resposta tendiam
a se tornar estereotipados durante o fortalecimento: o animal limitava suas respostas a
uma regio restrita da fenda. A extino, entretanto, produziu uma variabilidade no
comportamento de colocar o focinho na fenda pelo menos to grande quanto a que foi
observada durante o nvel operante: o animal variou suas respostas sobre o comprimento
inteiro da fenda. Finalmente, o refortalecimento resultou em maior estereotipia (respos
tas mais restritas) do que o fortalecimento original havia produzido.
Resultados similares foram obtidos por Notterman (1959), que estudou a fora com
que um rato pressionava a barra durante o nvel operante, fortalecimento e extino.
Uma descoberta adicional emergiu dos dados de Notterman. Os registros individuais
revelaram foras ocasionais, emitidas durante a extino, que excediam qualquer obser
vao anterior, tanto no nvel operante como no fortalecimento. Retornaremos a essa
descoberta mais tarde, nas discusses de diferenciao e habilidades.
O elo ou cadeia de comportamento estabelecida pelo reforamento degenera-se
quando se retira o reforamento para os operantes. Frick e Miller (1951) forneceram a
ratos 300 reforamentos espaados durante 5 sesses pelo pressionar uma barra, no
aparelho mostrado na Fig. 5-4. (Note que a bandeja de alimento, neste aparelho, est um
pouco mais distante da barra do que na caixa-prottipo usada por Skinner, j descrita).
Aps o 300^ reforamento, obteve-se um registro de 24 horas de extino para cada
rato. Durante a extino, Miller e Frick observaram a degenerao da cadeia... Rp Ra Rp
Ra . . . fortalecida. medida que a extino progredia, comeavam a suceder-se presses
barra (Rp Rp, etc.) e idas bandeja (Ra Ra etc.). Houve pouca tendncia para o padro
se tornar aleatrio durante a extino. Ao contrrio, o padro fortalecido de Rp Ra Rp
Ra . . . gradualmente, deu lugar ao padro do nvel operante, o de ocorrncias repetidas
da mesma resposta. Talvez deva ser enfatizado que este resultado no foi, de modo
algum, forado logicamente. O elo de comportamento poderia ter simplesmente dimi
nudo em freqncia durante a extino, embora permanecendo intacto.
Em resumo, o efeito do procedimento de extino induzir um processo gradual de
comportamento cujas mudanas incluem diminuio na freqncia da resposta,
aumento na variabilidade da forma e intensidade da resposta e quebra estrutural da
seqncia do comportamento. Estas so todas propriedades importantes da extino e
sero mencionadas frequentemente, daqui por diante, como mecanismos explicativos.
5.3

RESISTNCIA EXTINO

Se se peimitisse que o processo de extino se completasse, os estados de nvel


operante poderiam eventualmente ser alcanados. O tempo para que isso*ocorra aparen
temente um ndice da persistncia do indivduo em face extino. Em experimentos
reais, uma volta ao nvel operante raramente, se alguma vez alcanada.
Consequentemente, medidas mais convenientes e prticas da persistncia ecto
baseadas na rapidez com que a taxa de resposta diminui durante a extino. Por exemplo,
o nmero de respostas emitidas ou a quantidade de tempo at o ponto em que algum
critrio de taxa baixa alcanado, so chamados medidas de resistncia extino.
- 102 -

Foto clula

Figura 5-4. Aparelho usado pra estudar as mudanas na seqncia do comportamento


durante o fortalecimento e extino (Frick e Miller, 1951).

A maneira pela qual os valores reais dessas medidas so obtidos ilustrada na Fig
5-5, onde a curva de extino da Fig. 5-1 reaparece.

Figura 5-5. Uma curva de extino da presso barra aps o fortalecimento. No ponto a
nenhuma resposta havia sido emitida por cinco minutos consecutivos (segundo Skinner,
1938, dados de F.S. Keiler e A. Kerr).

Suponha que adotemos o critrio arbitrrio de qu, se em qualquer momento durante a


extino, mais de 5 min decorram sem uma ocorrncia da resposta selecionada, a extin
o deve ser considerada completa para todos os objetivos prticos e devemos, ento,
terminar nosso experimento. Examinando, ento a Fig. 5-5, nosso experimento terminar
em a. Neste ponto, nenhuma resposta ocorreu por 5 min, 130 respostas foram emitidas e
32 min se passaram. Qualquer um desses dois ltimos valores, juntamente com a especifi-

cao do critrio de taxa baixa (nenhuma resposta durante 5min), serve como um ndice
da resistncia extino.
Um critrio diferente pode afetar o resultado da resistncia a extino. Na Fig. 5-5,
por exemplo, um critrio de 5 minutos sem resposta teria sido bastante frouxo, j que
muito mais respostas, bem acima da taxa no nvel operante, ainda seriam emitidas. Por
outro lado, se tivssemos escolhido 10 minutos sem resposta, os 90 minutos do experi
mento de Keller e Kerr no seriam suficientes para alcanar o nosso critrio, uma vez que
nenhuma pausa de tal durao ocorreu. A fim de evitar a natureza arbitrria de um
critrio de extino, muitos pesquisadores prosseguem com o procedimento de extino
at que a inclinao geral da curva indique que a funo est prxima de sua assntota.
Ento, o nmero de respostas emitidas em qualquer tempo arbitrariamente conveniente,
da em diante, pode facilmente ser lido no registro cumulativo como a resistncia
extino. Esse procedimento ilustrado no ponto b da Fig. 5-5 onde, em 1 hora, a
resistncia extino definida como 190 respostas.
A resistncia extino fornece um ndice comportamental quantitativo cuja relao
com um nmero de operaes experimentais de interesse. Oportunamente, referirnos-emos a estudos em que a resistncia extino a principal varivel dependente
comportamental. Na vida real, estamos frequentemente interessados em saber o quo
persistente ser uma pessoa face a nenhuma recompensa. Diz-se que um homem, cuja
resistncia extino baixa, "desiste muito f acilmente ou "no tem perseverana'
diante de uma tarefa difcil. Por outro lado, muita resistncia extino algumas vezes
indesejvel. O homem que passa muito tempo, improdutivamente, tentando restabelecer
uma relao amorosa interrompida, pode perder uma boa chance de uma relao nova e
melhor.
Uma das variveis que inicialmente se suspeitava afetar a resistncia extino era a
quantidade de fortalecimento anterior. Parecia plausvel que, se muitos reforamentos
fortalecedores fossem dados, a resistncia extino poderia ser maior do que se apenas
poucos fossem fornecidos. Essa hiptese geral foi confirmada por vrios experimentos
(Williams, 1938; Perin, 1942 ; Hearst, 1961) que indicaram que a resistncia extino
de um operante baixa quando apenas alguns reforamentos so dados no fortaleci
mento, aumentando, gradativamente at alcanar um mximo depois de 50 e 80
reforamentos.
Outra varivel que provavelmente afetaria a persistncia de uma resposta extino
seria o esforo despendido na resposta Mowrer e Jones (4943) levantaram a hiptese de
que as respostas que exigem grande esforo so mais rapidamente extinguidas do que as
que requerem menos esforo. Esta previso foi confirmada num estudo realizado por
Capehart, Viney e Hulicka (1958) que treinaram ratos a pressionar uma barra para obter
alimento. Eles variaram a fora necessria para pressionar a barra durante o fortaleci
mento, de modo que, em algumas sesses, uma barra pesada era apresentada e, em outras,
uma leve ou uma intermediria Os animais foram, ento, divididos em trs grupos, um
dos quais foi extinguido na barra pesada, outro na barra leve e o ltimo, na barra
intermediria. Usando um critrio de nenhuma resposta em 5 minutos como ndice de
resistncia extino, eles obtiveram a funo vista na Fig. 5-6.
O delineamento desse experimento bem diferente daqueles que consideramos at
aqui. Nas representaes grficas dos efeitos comportamentais neste e em captulos
anteriores, apresentamos dados obtidos com
um s sujeito.
Algumas vezes, a re
presentao grfica consistiu de mdias de vrios sujeitos mas, em todos os casos, cada
- 104-

Peso da barra (gramas)

sujeito foi submetido a um procedimento idntico e completo. Por completo,queremos


dizer que o comportamento dq sujeito foi medido em cada valor empregado para a
varivel independente. Ouso dei vrios sujeitos e a mdia dos resultados apenas uma
tentativa de eliminar erros aleatrios de medidas, que perturbam todo experimento.Em
certos estudos comportamentais, contudo, impossvel sujeitar o mesmo indivduo a
mais do que um valor da varivel independente sem introduzir novas variveis pertur
badoras. Este geralmente o caso quando a resistncia extino a varivel dependen
te. Para medir os valores da resistncia extino para cada um dos vrios valores de
nossa varivel independente, teramos que obter vrias curvas de extino do organismo.
Mas, aps o fortalecimento original num valor determinado da varivel independente,
existe apenas uma curva de extino. Para obter outra deveramos, ou fortalecer c
comportamento ou usar outro sujeito. 0 primeiro caso justificado somente se ascurvas
sucessivas de extino depois do fortalecimento e refortalecimentos repetidos fererridnticas. Acontece, contudo (ver seo 5.6) que elas no o so. Na verdade, elas so
sistematicamente diferentes. Ento, no temos outro recurso para adotar seno o de usar
um sujeito diferente ou grupo de sujeitos para cada condio experimental.
Consequentemente, Capehart, Viney e Hulicka extinguiram a resposta de um rate
numa barra de 5 gramas, outro numa de 40 gramas e um terceiro numa de 70 gramas.
Deste modo, eles evitaram o problema de como obter curvas de extino inicial para
o mesmo rato em todos os trs pesos da barra. Mas, ao fazerem isso, eles introduziram
uma nova fonte de erro de medida: as diferenas individuais entre os sujeitos devido a
outros fatores como diferenas genticas ou diferenas no controladas na histria pas
sada. Para fazer uma mdia dessas diferenas individuais entre os sujeitos, mdia esta que
poderia obscurecer qualquer efeito que o esforo da resposta pudesse ter, os pesquisado
res replicaram essencialmente o experimento 9 vezes mais e fizeram uma mdia de seus
resultados, usando, ao todo, um total de 27 sujeitos (9 ratos para cada uma das trs
condies diferentes). Embora a suavidade da sua funo que relaciona a resistncia
extino ao peso da barra ateste o sucesso de sua estratgia, seus resultados (e todos os
resultados simillares) devem ser interpretados com cautela. Em seu experimento, nenhum
sujeito experimentou os trs valores da varivel independente na extino. Logo, a gene
ralizao do resultado para qualquer organismo individual depende da suposio de que,
se fosse possvel obter uma curva de extino inicial para os trs valores diferentes da
varivel independente num nico indivduo, os resultados de tal procedimento correspon
deriam aos resultados obtidos ao se sujeitar indivduos diferentes s diferentes condies
experimentais. Em geral, procuramos evitar essa suposio sempre que possvel e recor
-105-

remos a tais funes de grupo (das quais a Fig. 5-6 um exemplo) somente quando,
como neste caso, aparentemente no tivermos outra escdha. Sempre que tivermos uma
escolha, prefervel realizar um experimento completo com um s sujeito, expondo-o a
todas as condies em que estamos interessados. A confiabilidade de nossos resultados
pode, ento, ser avaliada atravs de replicaes completas de nosso experimento com
sujeitos adicionais.
Exerccio: Sem consultar a literatura de psicologia, veja se voc pode delinear um
experimento para testar o efeito do nmero de reforamentos durante o fortaleci
mento na resistncia extino. Voc teve que usar um delineamento de grupo
(como Capehart, Viney e Hulicka) ou foi capaz de usar um delineamento individual
(como a funo de Anrep na Fig. 3-10).?

5.4 - RECUPERAO ESPONTNEA


A extino pode ser prolongada at que a taxa de um operante anteriormente for
talecido tenha alcanado um nvel baixo. Se o sujeito (por exemplo, um rato numa caixa
de Skinner) , ento, retirado da situao e colocado de volta um pouco mais tarde, outra,
curva de extino (menor) ser obtida (ver Fig. 5-7).

Figura 5-7. Recuperao espontnea da extino de uma resposta de presso barra de


um rato. As pores da curva direita e esquerda da linha vertical foram separadas
por 47 horas durante as quais o organismo esteve fora da situao (Skinner, 1938).

Mesmo que nenhum fortalecimento tenha ocorrido entre as duas sesses de extino,
ocorre uma certa quantidade de aumento espontneo na fora da resposta.
A quantidade de recuperao espontnea (quando medida pela resistncia extino
da segunda curva de extino) depende, at certo ponto, do intervalo de tempo entre o
fim da primeira extino e o incio da segunda. Os efeitos da recuperao espontnea
podem ser vistos num intervalo to pequeno quanto 15 min entre as duas sesses de
extino, na situao de pressionar a barra. O efeito aumenta at cerca de 2 horas de
intervalo, depois do que nenhum aumento adicional na recuperao espontnea ocorre.
Os fenmenos da recuperao espontnea tm sido assunto para muitas especulaes,
mas seus pressupostos mecanismos esto alm da perspectiva de uma proposio intro
dutria.

- 106 -

5.5

CONDICIONAMENTO E EXTINO SUCESSIVOS

Na seo 5.4, dissemos que a primeira extino aps o fortalecimento original um


fenmeno nico. Extines posteriores (depois de refortalecimentos) diferem da primeira
extino porque so mais rpidas e contm um total menor de respostas. O efeito
documentado pelos dados de Bullock e Smith (1953). Eles expuseram ratos a 10 sesses
dirias de um procedimento onde se reforava as 40 primeiras respostas
barra,
seguindo-se diretamente 1 hora de extino. Quando as curvas de extino foram exami
nadas, notou-se que elas tornavam progressivamente menores da sesso 1 a 10 . O efeito
visto na Fig. 5-8. Enquanto que, na sesso 1, a mdia da resistncia extino em 1 hora
foi 50 respostas, na sesso 10 isto havia cado para 10 respostas apenas.

Figura 5-8. Curvas medias de respostas


acumuladas durante 1 hora de extino
Os nmeros direita de cada curva iden
tificam a sesso (segundo Bullock e Smith,
1953).
5

10

10

20

30
Minutos

40

50

60

Esses resultados podem ser extrapolados para alm de dez sesses. Parece que apenas
poucas sesses a mais seriam necessrias para que o animal alcanasse o que chamado
extino numa tentativa. Na extino numa tentativa, apenas uma nica resposta
emitida aps a retirada do reforamento. A mudana no comportamento torna-se
abrupta e parece razovel concluir que o organismo passa a discriminar o procedimento
de extino como tal. Poucas respostas em extino a regra, no nvel humano. Muitas
de nossas prprias respostas mostram uma diminuio rpida, quando cessa o refora
mento. No continuamos a inserir moedas numa mquina de cigarros ou de doces
quebrada, quando no obtemos aquilo que pagamos. Ouando abrimos a caixa do correio
e descobrimos que est vazia, no continuamos a abri-la. Como os ratos de Bullock e
Smith, aprendemos a esperar pelo nosso reforamento.
Resultados tais como os de Bullock e Smith no deixam dvidas de que os processosde extino sucessiva so diferentes. De fato, eles formam um subprocesso progressivo,
medida que tendem a uma assntota de uma resposta por perodo de extino O que
acontece, contudo, se cada perodo de extino prolongado at alcanar a taxa de nvel
operante? Ser cada extino sucessiva ou pouco mais rpida, que a precedente? Pouca
informao existe para responder questo com autoridade, mas dados no publicados
coletados por J. L. Kerr e J. R. Mlenson (1957) mostraram que, quando a presso
barra de um rato era extinta at ao ponto onde duas sesses consecutivas fossem iguais
ou menores do que a taxa ao nvel operante, um efeito similar ao de Bullock e Smith era

- 107 -

jLinda obtido. A Fig. 5-9 mostra o resultado desse procedimento para um animal efetuado
em quatio desses ciclos de condicionamento e extino.
50

*8 40
Figura 5-9. Resistncia extino num rato
em funo de procedimentos sucessivos de
condicionamento e extines com volta ao
nvel operante (dados no publicados de
Kerr e xMillenson
1957)

30
3
c
g
8 20

H
>

o* 10

5.6

ESQUECIMENTO E EXTINO
Nmeros de ciclos de condicionamento-extino
Devido ao fato de que o esquecimento e a extino esto ambos associados a um
enfraquecimento do comportamento, eles so frequentemente confundidos. Na extino,
o enfraquecimento est associado emisso de respostas no reforadas na situao
previamente associada com reforamento. No esquecimento, o efeito do reforamento
enfraquecido pela simples passagem do tempo, durante o qual o indivduo no est
na situao previamente associada com o condicionamento. O esquecimento pode ser
estudado, fortalecendo-se, em primeiro lugar, um operante e, ento, permitindo que se
passe um tempo considervel e, finalmente,extinguindo esse operante. Quando isso feito
nas condies controladas da caixa de Skinner, a curva de extino resultante muito
semelhante aquelas obtidas logo aps o fortalecimento. A Fig. 5-10 mostra uma compara
o entre duas curvas mdias de respostas acumuladas, uma obtida de um grupo de ratos
extinguidos 1 dia depois do fortalecimento original e a outra obtida de ratos extinguidos
45 dias depois do fortalecimento original. Os 44 dias de diferena de tempo parecem ter
tido apenas um efeito muito pequeno em comparao com o efeito do procedimento de
extino real.

Figura 5-10. Curvas de extino obtidas 1


dia aps o fortalecimeno oiiginal e 45 dias
aps o fortalecimento original (Skinner,
1938)

30

108-

Minutos

60

Existem' ainda resultados mais surpreendentes que apoiam a noo de que a mera
passagem do tempo entre o condicionamento e a extino tem, espantosamente, pouco
efeito. Um grupo de pombos foi treinado, no aparelho visto na Fig. 5-11, a bicar uma
chave ou disco iluminado, obtendo alimento. Depois do fortalecimento da resposta de
bicar a chave, os animais foram transferidos para o biotrio. Quatro anos mais tarde.
retomaram ao aparelho e foram testados no procedimento de extino. Embora os
pombos no tivessem visto o disco por mais de 1.400 dias, eles comearam a bic-lo,
imediatamente e deram centenas de respostas em extino (Skinner, 1950).
Existe uma vasta literatura sobre o esquecimento do comportamento verbal humano.
Antes do incio do sculo vinte, Ebbinghaus memorizou listas das chamadas slabas sem

Figura 5-11. Aparelhagem usada para o estudo do comportamento operante


de pombos.

sentido (Ver Fig. 5-12) e registrou a perceniagem de


slabas das quais ele se lem
brava em vrios perodos de tempo. O uso de slabas sem sentido ao invs de palavras foi
uma tentativa de eliminar fatores de significado e familiaridade que poderiam influenciar
os resultados, caso fossem usadas palavras comuns. Ebbinghaus observou (ver Fig. 5-13)
que uma queda marcante na reteno ocorria durante as primeiras 8 horas depois de
aprendidas as listas. Depois disso, o processo de esquecimento aproximava-se muito
lentamente de uma assntota. Quase a mesma quantidade podia ser relembrada 31 dias ou
2 dias depois da aprendizagem.
- 109-

Figura 5-12. Uma lista de slabas sem sentido para o estudo da aprendizagem
verbal e esquecimento.

BIK
ZUR
JEK
ZOT
YIN

NAX
KIB
VOD
MEF
BEW

Figura 5-13. Curva de esquecimento, de Ebbinghaus para slabas sem


sentido (segundo Ebbinghaus, 1885, de Keller e Schoenfeld, 1950).

Slabas sem sentido so facilmente esquecidas. Outros materiais verbais no so to


rapidamente perdidos. A Fig. 5-14 mostra curvas de esquecimento para trs tipos de
materiais: poesia, prosa e slabas sem sentido.
Porque as curvas de extino de animais mostram efeitos to pequenos depois de
passado longo tempo, enquanto um homem pode esquecer mais da metade do que ele
aprende em poucas horas? essa uma superioridade no esperada do rato e do pombo
em relao ao homem? Talvez seja, mas encontramos uma explicao mais conveniente
ao considerarmos a atividade que interve'm duranie a passagem do tempo nos dois tipos
de experimentos. Nos experimentos com animais, o animal removido da situao ex
perimental e tem pouca chance de emitir respostas que se assemelhem ao operante

Figura 5-14. Curvas de esquecimento mostrando a reteno para


diferentes tipos de materiais (segundo Guilford, 1938 e Kendler,
1963).
-110-

fortalecido. No biotrio, os animais no experimentam quaisquer situaes muito seme


lhantes s de sua caixa de treinamento. O homem, por outro lado. aps memorizar
trechos de palavras - sejam palavras sem sentido, prosa ou poesia - no abruptamente
removido de seu ambiente verbal. Ao contrrio, ele continua a usar palavras (aprendidas)
e a experimentar situaes com um certo grau de similaridade com o ambiente onde a
memorizaov/'riginal foi feita. Sempre que as situaes mudam radicalmente depois da
aquisio, o esquecimento no to grande. As habilidades de datilografia so apenas um
pouco afetadas depois de um ano ou mais sem se praticar. Longe da mquina de escrever,
as chances de uma pessoa executar respostas similares datilografia so pequenas. Nadar
e andar de bicicleta so duas ilustraes adicionais de habilidades que so retidas por
]ongos perodos sem prtica.
Sempre que uma resposta especial fortalecida num novo ambiente, diferente de
qualquer um encontrado na situao cotidiana, o esquecimento reduzido. Isto verda
deiro tanto para o homem como para j animal. difcil transportar um homem, abrup
tamente, de uma situao de aprendizagem para um outro ambiente completamente
diferente. Jenkins e Dallenbach (1924) tentaram fazer isso. Seus sujeitos aprenderam
uma lista de slabas sem sentido logo antes de dormir. Os sujeitos foram, ento, acorda
dos em vrios intervalos aps a aprendizagem e solicitados a se recordarem da lista que

Horas dcsdc a aprendizagem

Figura 5-15. Curvas mostrando o nmero de slabas relembradas aps


dormir ou ficar acordado (adaptado de Jenkins e Dallenbach, 1924)

haviam aprendido anteriormente. Os resultados (Fig. 5-15) foram comparados com


aqueles obtidos de um grupo de sujeitos que no foram dormir aps terem aprendido a
lista, mas continuaram com suas atividades cotidianas usuais. Aparentemente, o que
feito durante a passsagem do tempo crtico na determinao de quanto esquecimento
ocorre. Podemos convenientemente considerar que, no caso mais extremo de esqueci
mento , ocorre extino normal e completa, isto , a resposta emitida repetidamente,
mas sem reforamento, at que pare de ocorrer. Em outros casos reais, algum enfraqueci
- 111 -

mento ocorre devido similaridade de outros comportamentos com o comportamento


aprendido e similaridade dos ambientes durante o fortalecimento e o esquecimento.
5.7 - UMA DEFINIO COMPREENSIVA DE EXTINO OPERANTE
O procedimento de extino faz surgir o processo de extino. Como vimos o
processo de extino consiste, em parte, de um declnio na taxa de resposta. Um nmero
de outros processos comportamentais tais como fadiga, habituao e saciao envolve um
declnio similar e devemos ser cuidadosos ao distingu- los. Se um declnio na taxa de
resposta tudo o que observamos, provavelmente, encontraremos dificuldades para dizer
qual processo est envolvido. Ao teorizar posteriormente, podemos atribuir um declnio
na taxa de resposta extino de certas outras respostas, as quais no esto sendo
medidas, mas apenas supostas. Esse um exemplo de como os conceitos bem conhecidos
(por exemplo, extino) so usados como pedras fundamentais para erigir um edifcio
explanatrio para um processo mais complexo e menos compreendido. Mas devemos
estar atentos ao atribuir todos os declnios de taxa a uma presumvel extino. Quando
possvel, recorra definio compreensiva de extino:
DADO: uma resposta ooerame pieviamente lortalecid.
PROCEDIMENTO: i'etjra<ia do reloram em o para o operante.

Em notao simblica:
R, ou R -fr
PROCESSO: 1 - um declnio gradual, algo irregular, na taxa, marcado por aumentos
progressivos na freqncia de perodos relativamente longos de noresposta.
2 _ um aumento na variabilidade da forma (topografia) e da magnitude
da resposta.
3 um rompimento gradual no elo ordenado do comportamento for
talecido.
RESULTADO: os processos comportameniais aproximam-se dos estados do nvel
operante como valores limitantes.
5.8 - A EXTENSO DOS CONCEITOS DE EXTINO
A diminuio da fora da resposta vista na extino experimental no se limita a
ratos e pombos de laboratrio. Isto demonstrado pela pesquisa original relatada por C.
D. Williams, aqui reproduzida integralmente do Journal of Abnormal and Social
Psychology.
A ELIM INAO DO COMPORTAMENTO DE BIRRA ATRAVS DF
PROCEDIMENTOS DE EXTINO.
Carl D. Williams, University of Miami.
Este trabalho relata o tratamento bem sucedido do comportamento de birra numa
criana do sexo masculino, pela retirada do reforamento. O sujeito (S) tinha
aproximadamente 2 1 meses de idade. Havia estado seriamente doente durante os
- 112 -

primeiros 18 meses de vida. Sua sade melhorou, ento, consideravelmente e ele


adquiriu peso e vigor.
O S, agora exigia o cuidado e a ateno especiais que lhes haviam sido dados
durante os meses crticos. Ele impunha alguns de seus desejos, especialmente na hora
de dormir, atravs de um comportamento de birra para controlar as aes de seus
pais.
Os pais e uma tia revezavam-se para coloc-lo na cama noite e tarde, na hora
da sesta. Se o pai (ou a me) deixava o quarto depois de colocar o S na cama, elo
gritava a esperneava at que o pai (ou a me) voltasse ao quarto. Assim, no se podia
deixar o quarto at que S dormisse. Se o pai (ou a me) comeava a ler enquanto
estava no quarto, S gritava at que o material de leitura fosse posto parte. Os pais
sentiam que S gostava deste controle sobre eles e que se esforava durante o tempo
mais longo possvel para no dormir. Em qualquer ocasio, os pais estavam gastando
de meia hora a duas horas, cada vez que colocavam a criana para dormir, esperando
no quarto at que dormisse.
^
Aps um parecer mdico a respeito da condio fsica de S, foi decidido retirar
o reforamento desse comportamento de birra. Consistente com o princpio de
aprendizagem de que, em geral, o comportamento que no reforado ser extinto,
um dos pais ou a tia colocava o S na cama d uma maneira agradvel e relaxada.
Depois dos agrados caractersticos da hora de dormir, deixava-se o quarto e se
fechava a porta. O S gritava e chorava, mas o pai (ou a me) no voltava ao quarto. A
durao dos gritos e do choro era medida a partir do momento em que a porta era
fechada.
Os resultados so vistos na Fig. 5-16. Pode ser observado que S continuou gritando
por 45 min na primeira vez em que foi colocado na cama, na primeira srie de extino.

1
O

55
50
45
40
35
30
25

.S
_ 20
O"O

5
1

!0

Vezes 'm que a criana foi colocada para dormir


Figura 5-16. Durao d< . oro em duas se'rires de extino em funo d; ocasies
sucessivas de ser colocado na c.-una (Williams. 1
- 113

O S no chorou a segunda vez que oi posto na cama. Isso talvez seja atribuvel sua
fadiga de chorar na ocasio 1. Pela dcima sesso, o S no mais choramingava, esperneava
ou chorava quando os pais deixavam o quarto. Em vez disso, ele sorria quando eles
saiam. Os pais notaram que ele emitia sons alegres at cair no sono.
Cerca de uma semana mais tarde, o S gritou e esperneou aps a tia t-lo colocado na
jama, provavelmente refletindo uma recuperao espontnea do comportamento de
birra. A tia reforou, ento, o comportamento de birra, voltando ao quarto do S e l
permanecendo at que ele dormisse. Foi, ento, necessrio extinguir o comportamento
uma segunda vez.
A Fig. 5-16 mostra que a segunda curva de extino semelhante a primeira. Ambas
as curvas so similares s curvas de extino obtidas com sujeitos subhumanos. A segunda
srie de extino atingiu o zero na nona ocasio. Nenhuma birra posterior, na hora de
dormir, foi relatada durante os dois anos seguintes.
Deve ser enfatizado que o tratamento, neste caso, no envolveu punio. Tudo o que
se fez foi suspender o reforamento. Ocorreu, ento, extino do comportamento de
birra.
Nenhum ps-eeito ou efeito colateral indesejvel desse tratamento foi observado.
Aos trs anos e 9 meses de idade, S parecia ser uma criana cordial, expressivae esperta.
O uso do procedimento de extino geral, ento, para enfraquecer a fora de
qualquer operante. Em captulos posteriores, veremos outras numerosas maneiras de
manipular a fora do comportamento. Mas apenas com a aplicao simples de duas
operaes principais reforamento e extino podemos variar amplamente a fora do
comportamento. A fora do comportamento um conceito importante na psicologia
devido a sua relao estrita com a probabilidade de ocorrncia do comportamento.
Quando uma resposta existe com alta tora, sua freqncia alta e a probabilidade de que
seja emitida em qualquer tempo determinado tambm alta. Estas so, simplesmente,
maneiras diferentes de dizer a mesma coisa. Essa afirmao verdadeira para homens e
animais. A anlise do comportamento operante , de modo geral, o estudo da forma e,
mais particularmente, da probabilidade de ocorrncias de tais comportamentos. Se admi
timos que os conceitos do reflexo possam explicar os mecanismos simples da execuo de
comportamentos tais como postura, caminhar e correr, ento o territrio que resta para a
explorao psicolgica parecer ser o inicio dos operantes. Logo, nosso interesse cen
traliza-se em situaes que proporcionem uma escolha de comportamentos. Mesmo na
simples caixa de Skinner, onde frequentemente uma nica resposta medida, a escolha
est presente na liberdade aparente do animal de responder ou no responder. Em
geral, nossa preocupao com as causas do comportamento ou, em termos mais tc
nicos, com os controles sobre a emisso de respostas. Embora uma seqncia de compor
tamento possa estar integrada, de um modo reflexo, do inicio at o fim podemos ainda
estar interessados em saber porque ela comeou. Embora todo este livro consista numa
srie de respostas propostas a esta questo, j podemos perceber que as operaes de
condicionamento e extino fornecem dois princpios explanatrios poderosos. Uma
resposta pode no ocorrer, por exemplo, porque foi extinta.
Um aspirante a escritor que tenha enviado vrios originais aos editores, tendo-os
todos rejeitados, pode dizer que no consegue escrever nem mais uma palavra'. Ele
pode estar parcialmente paralisado com o que chamado cimbra de escritor. Ele
pode ainda insistir que deseja escrever e podemos concordar parafraseando-o: sua
- 114 -

probabilidade extremamente baixa de resposta devida principalmente extino.


Outras variveis continuam efetivas e, se a extino no houvesse ocorrido, elas
produziriam uma alta probabilidade (Skinner, 1953, pp. 71-72).
A noo de freqncia ou fora de resposta fundamental para a Psicologia, prin
cipalmente porque muitos comportamentos parecem ser explicveis em termos da fre
qncia com que as unidades de comportamento ocorrem.
Dizemos que algum um entusiasta do bridge quando observamos que ele joga e
fala frequentemente sobre bridge. Estar bastante interessado' em msica tocar, ouvir e
falar muito sobre msica. O jogador inveterado aquele que joga frequentemente. O f
da fotografia est sempre tirando fotografias revelando-as e olhando as fotos feitas por

Figura 5-17. O poder da extino. (Desenhado por Opie, 1961, The New Yorker
Magazine, Inc.).
-11 5-

ele e por outros. O erotomaiuaco' frequentemente se ocupa com comportamento sexual


O dipsomanaco bebe frequentemente" (Skinner, 1953 p. 62)
Embora nossa anlise sobre c Mino esteja muito longe de ser completa neste
captulo, ela ilustra alguns dos principais efeitos conhecidos da retirada do reforamento
na fora do comportamento.
5.9 - REPRESENTAES GRFICAS DOS RESULTADOS DE EXPERIMENTOS
NOS QUAIS MUITAS VARIVEIS INDEPENDENTES SO ESTUDADAS EM
CONJUNTO.
Neste texto, o principal dispositivo para representar os resultados de experimentos
o grfico bi-dimensional. Nos casos mais simples, tal grfico construdo de uma tabela
que contm pares de valores de x e y (ver Tabelas 2-2 e 3-1). Nas tabelas, cada valor da
varivel independente forma um par com um nico valor da varivel dependente (em
geral, uma mdia de muitos valores observados). Num grfico simples tal como o da Fig.
5.6, trs valores da varivel independente (peso da barra) formam um par com as respec
tivas mdias observadas da varivel dependente - resistncia extino e so indicados
como pontos. Ento, traam-se linhas retas conectando (isto , interpolando-as entre) os
pontos. A curva resultante permite-nos ver os resultados num quadro nico, relacio
nando, assim, os dados de um modo que a tabela no faz. Os registros cumulativos so
mais sofisticados. Na Fig. 5-1, a varivel independente (tempo) contnua e a interpolao desnecessria j que o registrador cumulativo marca a ocorrncia ou no ocorrncia
de uma resposta (a varivel dependente) em cada momento no tempo e no em poucos
pontos selecionados.
Algumas vezes um pesquisador deseja num nico experimento estudar os efeitos de
mais do que uma varivel independente. O mtodo comum de representar os resultados
quantitativos de tais experimentos ainda o grfico, mas a forma algo generalizada.
Considere as duas funes da Fig. 5-18. Uma delas (A) simplesmente a Fig. 5-6 reprodu
zida aqui por convenincia. A outra a funo de Perin (1942) Williams (1938)
cl acionando
150

i-

70
40
Peso da barra (gramas)
(A)

10

20 30 40 50 60 70 80 90
N mero dc reforamentos
( 8)

Figura 5-18. (A) Resistncia extino em funo do peso da barra (Capehart. Viney, e
Hulicka, 1958). (B) Resistncia extino em funo do nmero de reforamentos
prvios (adaptado de Perin, 1942, e Williams, 1938).

-116-

a resistncia extino da presso, barra, no rato, com o nmero de reforamentos


prvios, que fortaleceram a resposta. Poderamos supor, para o objetivo da presente
discusso que o experimento representado por (A) e (B) na Fig. 5-18 tivessem sido
efetuados no mesmo laboratrio, com o mesmo aparelho e com as condies controladas
de modo que as nicas diferenas entre (A) e (B) consistissem das manipulaes da
varivel independente indicada.
Podemos iniciar nossa anlise com a observao de que ambos os grficos corres
pondem a nossa frmula simples de um experimento: uma varivel independente ligada a
uma varivel dependente. H, contudo, uma relao interessante entre os dois exemplos
da Fig. 5-18. Ambos (A) e (B) apresentam a mesma varivel dependente, resistncia
extino. Alm disso, um exame mais detalhado revela que (A) e (B) tm um ponto em
comum. Para ver isso, considere a noo, implcita em (A), de que muitas variveis foram
mantidas constantes; somente o peso da barra foi variado. Analogamente, implcita em
(B) est a noo de que muitas variveis foram mantidas constantes; somente o nmero
de reforamentos foi variado. Contudo, em (A) uma das variveis mantidas constantes a
varivel independente de (B) e uma das variveis mantidas constantes em (B) a varivel
independente de (A). Especificamente, todos os sujeitos em (A) receberam 90 refora
mentos, enquanto que todos os sujeitos em (B) tinham uma barra que pesava 15 gramas.
Portanto, tem um ponto em comum: o ponto que representa 90 reforamentos com uma
barra de 15 gramas.
O elo entre (A) e (B) da Fig. 5-18 torna-se mais claro com a representao grfica de
ambas as funes num mesmo sistema de coordenadas. Ser til empregar um sistema de
coordenadas tridimensional, uma vez que h duas variveis independentes e uma varivel
dependente. Examine a representao tridimensional de (A) e (B) na Fig. 5-19. Nesta
figura, a Fig. 5-18A mostrada como um polgono sombreado no plano xy enquanto
que a Fig. 5-18B mostrada como uma seo cnica traada no plano zy.
Z

Figura 5-19. Representao das duas funes da Fig. 5-18 como duas superfcies num
sistema de coordenadas tridimensional.

-117-

As duas superfcies interceptam-se nos seus pontos comuns x = 15,2 90. (O fato de que
os limites das curvas das duas superfcies no coincidam precisamente pode ser explicado
pelas vrias diferenas nos dois experimentos alm das duas variveis em considerao).
A Fig. 5-19 um mapa que mostra o territrio da resistncia extino limitado por
essas duas variveis independentes. O mapa mostra que as duas funes da Fig. 5-18
fornecem informao compor tamental acerca dos efeitos do peso da barra e nmero de
reforamentos somente numa pequena regio do espao possvel.
A representao espacial da Fig. 5-19 sugere que o territrio pode ser mais eficiente
mente estudado num experimento onde ambas as variveis independentes sejam manipu
ladas juntamente de modo a cobrir uma poro maior do espao experimental. Uma
manipulao desse tipo poderia ser uma extenso do experimento de Capehart, Viney e
Hulicka (1958) onde o nmero de reforamentos fosse manipulado juntamente com o
peso da barra. A especificao dos grupos para as vrias combinaes das variveis inde
pendentes pode ser feita de acordo com o esquema que vem descrito na Tabela 5-1.

Tabela 5-1.
Especificao dos grupos de um Experimento para Estudar os Efeitos conjuntos do
Nmero de Reforamentos Anteriores e Peso da Barra sobre a Resistncia Extino.

GRUPOS
A
B
C
D
E
F
G
H
I

NMERO DE REFORAMENTOS
DADOS NO FORTALECIMENTO
50
50
50

100
100
100
300
300
300

PESO DA BARRA
5
15
30
5
15
30
5
15
30

As curvas hipotticas da Fig. 5-20 sugerem que tipo de resultado pode ser obtido se
os grupos que recebem 30, 90, e 270 reforamentos fossem estudados, usando-se os trs
pesos da barra. Na Fig. 5-20, a representao bi-dimensional, sendo que o valor de uma
das variveis independentes (nmero de reforamentos) mostrado simplesmente como
um numeral pequeno direita de cada curva. Essa representao uma alternativa para a
Fig. 5-19. Representaes bi-dimensionais como a da Fig. 5-20 so frequentemente en
contradas na literatura e so conhecidos como famlias de curvas, ou a forma paramtrica
da representao funcional. Essa ltima terminologia uma forma aceita de se mencionar
as variveis independentes que se sabe ou se acredita serem relacionadas a uma dada
varivel dependente. Parmetro virtualmente sinnimo de varivel independente
embora seja empregado especificamente para denotar as variveis independentes
relacionadas a uma varivel dependente comum.Os parmetros da resistncia extino
mostrados na Fig. 5-20, so, portanto, peso da barra e nmero de reforamentos
-118-

200

150-

Peso da barra (gramas).


Figur 5-20. Representao bidimensional dos resultados hipotticos da manipulao
do peso da barra juntamente com a manipulao do nmero de reforamentos. Os
pontos em 90 so de Capehart, Viney e Hulicka ( 1 9 5 8 ) Os outros pontos indicados so
hipotticos.

antes da e.Uino. Evidentemente, o nmero de parmetros de qualquer varivel de


pendente pode ser bem grande. Em qualquer experimento particular, contudo, raramente
estudamos mais do que um ou dois deles ao mesmo tempo.
EXERCCIO 4
Desenhe uma representao paramtrica (bidimensional) de possveis resultados de
um experimento similar ao de H.M. Wolfle (Fig. 3-6). usando quatro valores diferentes de
intensidade de S2 - Utilize os dados de Wolfle como uma das suas quatro curvas.
REFERNCIA PARA O CAPITULO 5
Antonitis, J. J. Variability of response in the white rat during condition
ing and succecding extinction and reconditioning. Unpublished
doctoral dissertation, Columbia Univer., 1950.
Antoni,tis, J. J. Response variability in the white rat during conditioning,
extinction, and reconditioning. J. exp. P s y c h o l 1951, 42, 273-281.
Bullock, D. H., and Smith, W. C. An effect of repeated conditioniiigcxtinction upon operant strength. J. exp. Psychol., 1953, 46, 349
352.
-119-

Capehart, J., Viney, W., and Hulicka, I. M. The efcct of effort upon
extinction. J . comp, physiol, Psychol., 1958, 51, 505-507.
Ebbinghaus, H. Memory (Translated by H. A. Ruger and C. E. Bussenius). New York: Teachers College, 1913.
Frick, F. S., and Miller, G. A. A statistical description of operant condi
tioning. Amer. J. Psychol., 1951, 64, 20-36.
Guilford, J. P. General psychology. P rinceton: ,D. Van Nostrand, 1939.
Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New Y ork: Rine
hart, 1946.
Hearst, E. Resistance-to-extinction functions in the single organism.
J. exp. Anal. Behav., 1961, 4, 133-144
Hurwitz, H. M. B. Periodicity of response in operant extinction. Quart.
J. exp. Psychol., 1957, 9, 177-184.
Jenkins, J. G., and Dallenbach, K. M. Oblivcsccnce during sleep and
waking. Amer. J. Psychol., 1924, 35, 605-612.
Keller, F /S ., and Schoenfeld, W. N. Principles oj psychology. New Y ork.
Appleton-Century-Crofts, 1950.
Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts,
1963.
Kimble, G. A. Principles of general psychology. New York: Ronald
Press, 1956.
Mowrer, O. H., and Jones, H. M. Extinction and behavior variability as
functions of effortfulness of task. J. exp. Psychol., 1943, 33, 3 6 9
386.
Notterman, J. M. Force emission during bar pressing. J. exp. Psychol.,
1959, 58, 341-347.
Perin, C. T. Behavior potentiality as a joint function of the amount of
training and the degree of hunger at the time of extinction. J. exp.
Psychol., 1942, 3 0 ,9 3 -1 1 3 .
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950,
57, 193-216.
Skinner, B. F. Science and human behavior. New York: Macmillan,
1953.
Williams, C. D. The elimination of tantrum behavior by extinction
procedures. /. abnorm. soc. Psychol., 1959, 59, 269.
Williams, S. B. Resistance to extinction as a function of the num ber of
reinforcements. J. exp. Psychol., 1938, 23, 506-522.

-120-

SEGUNDA PARTE
AS UNIDADES FUNDAMENTAIS DE ANLISE

6 . NOTAO DE CONTINGNCIA DE RESPOSTA E ESTMULO


7. REFORAMENTO INTERMITENTE
8 . A ESPECIFICAAO DA RESPOSTA
9. CONTROLE AMBIENTAL

Captulo 6 NOTAO DE CONTINGNCIA DE RESPOSTA E ESTIMULO

Sistemas elaborados de notao abreviada que expressam as relaes entre procedi


mentos, conceitos e eventos so, comumente desenvolvidos pela cincia. Tais sistemas de
notao podem ser convenientes para descrever as operaes. Como um meio analtico, a
notao pode ajudar a reconhecer as similaridades e diferenas entre procedimentos e
simplificar sua classificao, foijando uma maneira para sua eventual integrao terica.
Um sistema desse tipo, altamente desenvolvido e bem conhecido, existe na qumica.
Indicando um elemento particular por um smbolo e definindo as relaes entre os
elementos (por exemplo, + para combinao; > produz; A para aplicao de calor),
uma descrio parcimoniosa de um procedimento e alguns de seus resultados podem ser
rapidamente dados e a relao .sse procedimento com outros procedimentos seme
lhantes facilmente vista. Deve-se salientar, todavia, que em todas as notaes usadas
com o objetivo de resumir, perde-se alguma informao. Quando o sdio, por exemplo,
adicionado gua, o hidrognio liberado e forma-se o hidrxido de sdio. Este procedi
mento e seus resultados so conveniente e quantitativamente expressados assim
2Na + 2H O H ---- > 2NaOH + H 2
Esta expresso omite grande quantidade de detalhes pelo fato de representar certas
relaes fundamentais de uma maneira simples e concisa. Ela no informa por exemplo,
que esta reao gera calor, no d qualquer informao a respeito do tempo gasto pela
reao e no diz sobre o estado (slido, lquido, gasoso), em que o produto se apresen
tar. Apesar dessas limitaes, a notao tem se mostrado bastante til para justificar sua
incluso contnua na qumica, porque ela descreve convenientemente inmeros eventos
com grande generalidade. Por exemplo, a representao verdadeira para muitas formas
diferentes de sdio (p, slido, granular, cristalino), em qualquer hora do dia, numa
enorme faixa de temperatura e presses atmosfricas. Como a maioria das generalizaes
cientficas, todavia, ela no vlida universalmente. Se a temperatura for muito baixa e a
presso atmosfrica muito alta, a reao no ocorrer A representao tambm no
informa que o Na no um material unitrio, mas realmente um nmero de materiais
relacionados (istopos). Todos eles comportam-se de uma forma muito semelhante para a
maioria dos objetivos, o que permite que o rtulo Na seja aplicado a todos como ,na
aproximao.
- 123-

Os psiclogos esto principalmente interessados nas relaes entre as atividades dos


organismos e outros eventos no mundo. Um sistema de notao que emprega eventos
ambientais e eventos comportamentais como termos fundamentais seria conveniente para
descrever inmeros procedimentos psicolgicos e, como veremos, tomaria possvel uma
comparao analtica das operaes. O esquema de notao esboado em detalhe neste
captulo derivado de um sistema descrito inicialmente por F. Mechner (1959) e elabo
rado por Vicki Mechner (1963). Ao contrrio do exemplo qumico, a notao
comportamental que esboaremos esquematiza somente aspectos de procedimento da
experimentao. Nesse sentido ele se assemelha notao da eletrnica. Nesta, um
circuito representado por smbolos e o resultado de tal circuito, quando uma voltagem
lhe aplicada, deve ser descrito por funes que relacionam as variveis independentes e
dependentes que operam no circuito. Ao ser usada, a presente notao poderia igual
mente ser suplementada com funes que relacionem as variveis independentes
(mudanas em eventos ambientais) com as medidas do comportamento.
Ao nvel da presente considerao, no tentaremos dar definies formais ou
rigorosas para as unidades que empregaremos para descrever os procedimentos
comportamentais: estas podem ser encontradas em outros captulos. O nosso interesse
aqui somente fornecer de uma maneira concisa e com o mnimo de comentrios, vrios
instrumentos de notao atravs de exemplos e problemas que ilustram os poderes,
caractersticas e limitaes principais da notao R e S que amplamente usada no
decorrer deste texto,
6.1. RESPOSTAS E EVENTOS AMBIENTAIS
A notao incorpora eventos comportamentais sob a fo m a de respostas instru
mentais (operantes), abreviadas como R. Estas so, naturalmente, comportamentos que
so controlados por suas conseqncias. Para os objetivos presentes, podemos definir o
comportamento como qualquer coisa que um organismo individual faz. Ento, podemos
ainda identificar uma resposta como uma unidade de comportamento. A palavra chave na
especificao do comportamento o verbo fazer. Um organismo, para se comportar,
deve fazer alguma coisa, deve agir. Assim, temos abaixo exemplos de comportamento e
tambm exemplos daquilo que chamaremos de respostas.
( 1 ) Joo rebateu a bola.
(2) O Sr. Mitty engrenou o carro.
(3) Eu levei minha bandeja para a mesa.
(4) O rato pressionou a barra.
(5) O macaco coou suas costas.
( 6 ) Jorge esperou pelo nibus.
Em todos esses exemplos, algum organismo fez alguma ;oisa. De modo geral,
..entamos especificar a resposta em termos dos movimentos que o organismo faz, ao invs
de em termos das conseqncias desses movimentos. Ento. Joo rebatei a bola
implica e que Joo levantou os braos de uma certa maneira e em corespondncia com a
direo em que a bola vinha e, como uma conseqncia, a bola rebatida. impor;ante,
ao princpio, separar os eventos com portam entais de suas conseqncias.Portanto, ( 1 )
escrito melhor assim: Joao levantou o basto : e (3) ('sciito melhor Eu movi minhas
-124-

pemas em tal e tal direo, segurando uma bandeja em minhas mos e, eventualmente,
cheguei mesa. Chegar mesa foi uma conseqncia do comportamento de mover as
pemas.
Note-se que, em cada exemplo, um organismo foi identificado. Seguiremos a
conveno de que cada especificao de uma R identificar o organismo para o qual o
evento e uma R. Deste modo, evitaremos confundir a R de um organismo com aquelas de
um outro.
Uma regra simples para identificar eventos respostas num texto de linguagem comum
selecionar os verbos de ao. J que uma resposta um ato, os verbos de ao esto em
geral (embora no invariavelmente) associados a eventos resposta.
Os seguintes exemplos ilustram alguns eventos que no so eventos resposta.
(7) A bola rebateu em Joo
( 8 ) 0 furaco assolou o pas.
(9) O governo sofreu um colapso.
(10) A Sra. Brown morreu.
( 1 1 ) 0 macaco adormeceu.
(12) Jorge ficou cansado de esperar.
Em (7), Joo nada fez. Houve uma ao sobre ele. Em ( 8 ), o furaco no um orga
nismo, ento no pode emitir respostas, tal como as conceituamos. Em (9), o governo
no consiste de um organismo individual que sofreu o colapso. O comportamento de um
indivduo no est sendo descrito pelo colapso do governo. Rejeitamos (10) porque
morrer um evento comportamental nico para cada organismo e as respostas devem ser
eventos repetveis. Em (11), o dormir, embora um fenmeno comportamental interes
sante, no deve ser interpretado como um evento resposta. Finalmente, a proposio que
diz Jorge ficou cansado uma especificao grosseira de algum estado interior de
Jorge, mas no uma descrio de algo que ele esteja fazendo e, assim, no um evento de
resposta.
Escreveremos os eventos resposta de vrias maneiras. Podemos represent-los com
um R maisculo com um ndice numrico ou em forma de letra e especificar, parte,
ima chave com sua identidade verdadeira, como no exemplo

onde R^= Joo ergueu o basto


Rb = Joo correu para a primeira base

Este exemplo simples mostra algumas caractersticas importantes da notao. Em


primeiro lugar, cada R, em qualquer exemplo particular, deve ser uma R do mesmo
organismo. Ento,
no poderia ser um exemplo de alguma coisa que Joo fez e Rg
um exemplo de alguma coisa que Jorge fez. Outra maneira de dizer isso, salientar que
somente podemos discutir o comportamento de um organismo de cada vez.
Uma alternativa para indicar a identidade verdadeira de R subscrever, abreviando o
comportamento com uma palavra como
-125-

^(levantou)
e
^(correu)

Ambas as formas sero usadas.


6.2 SITUAES E EVENTOS AMBIENTAIS
Qualquer indivduo que se comporta cercado e bombardeado por uma multi
plicidade de energias. Alguma dessa energia est muito longe para afetar o organismo.
Assim, um sinal luminoso do trfego em Tquio no ter efeito em nosso comportamen
to em Nova York. Um homem atirando contra ns a oito quilmetros de distncia no
ir, similarmente, ter efeito sobre ns, a menos que o vejamos. Outro tipo de energia
pode no ter efeito porque o organismo no possui receptores especializados para captla. Ondas de rdio e radiao csmica rodeiam-nos constantemente mas no detetamos
estas energias a menos que estejamos equipados com instrumentos especiais para
traduzi-las em sons e deflexes de ponteiros energias que podemos detetar. O organis
mo construdo de modo a detetar uma amostra de energias sua volta e todas elas
constituem seu ambiente. Um ambiente, num dado momento, pode ser muito complexo,
consistindo de sons, padres de luz, odores e todas as configuraes daquilo que chama
mos objetos.
Frequentemente, notaremos que necessrio especificar apenas as mudanas que
ocorrem em nossos ambientes. Quando Joo rebateu a bola, esta viajou na direo geral
do campo externo. O restante do seu ambiente permaneceu relativamente constante mas
a parte que envolvia a bola mudou. As idias que se seguem se mostraro teis. Uma
descrio do ambiente de um organismo em qualquer tempo e lugar determinados e em
referncia a ele, ser designada uma situao, abreviada por S. Alm disso, chamaremos
uma mudana numa parte ou em todo o ambiente deste organismo de um estmulo. Uma
vez que um estmulo apenas um caso especial da situao, no precisamos de um
smbolo especial para ele. Podemos usar o S de situao. Eis algumas s i t u a e s para vrios
organismos:
(13)
(14)
(15)
(16)
(17)
(18)

A bola veio em direo a Joo...


Walter Mitty no seu Volkswagen 1962 cinza, sob a chuva, com o p na
embreagem, o motorista do carro de trs buzinando...
Minha bandeja contendo o almoo...
0 rato na caixa de Skinner, uma barra na parede da frente, nenhuma comida
presente.,..
Uma pulga picando o macaco...
Jorge no ponto de nibus...

Note que trs pontos seguem cada uma dessas situaes descritas. Isto porque
qualquer situao pode sempre ser descrita indefinidamente com maiores detalhes. Feliz
mente, precisamos descrever apenas os aspectos da situao nos quais estamos interes
sados. Na maioria das vezes, estes sero as mudanas no ambiente e que ocorrem de

-126-

uma situao para outra. Note tambm a ausncia de quaisquer verbos de ao na


descrio de situaes ambientais. A penltima (17), parece ser uma exceo. Contudo, a
picada uma situao (S) para o macaco (embora seja uma resposta da pulga). Esta
ilustrao enfatiza a importncia de se identificar sempre para cada evento R ou cada
evento S a que organismo Rs e Ss esto se referindo.
As situaes (Ss) so escritas de forma semelhante s Rs. Podemos subscrever um nmero
ou uma letra como em
S l 6 bla dirigindo-se para Joo
Sb = Walter Mitty no seu carro
ou subscrever o quanto da situao real julgarmos necessrio:
S(rato na caixa, alimento ausente)
importante notar que as situaes podem ser simples como a situao
S24 = bomba caiu + a rua
foi destruda + povo gritando + sirenes de ataque areo soando + fogo ardendo
minha volta...
Embora muitas mudanas ocorram no ambiente num determinado momento, elas todas
constituem uma e somente uma situao: uma situao com muitas mudanas. Deve-se
depreender dessas consideraes que, logicamente, s uma situao, em cada momento,
pode existir para qualquer organismo. Ser conveniente usar o sinal + para combinar
mudanas separadas no mesmo evento S.
6.3 A NOO DE UMA CONTINGNCIA COMPORTAMENTAL
O fazer alguma coisa frequentemente produz algumas conseqncias importantes. Na
linguagem de eventos resposta e estmulo, essa proposio significa que a R frequente
mente conduzir a um S de alguma conseqncia. A presente notao fundamen
talmente uma notao das conseqncias de estmulo do comportamento. Sempre que
observamos que um evento comportamental produziu repetidamente, no passado, alguma
conseqncia especfica no ambiente, estamos diante de uma contingncia comportamen
tal. Formalmente, uma contingncia comportamental definida como uma regra que
especifica uma relao condicional entre uma resposta e suas conseqncias. Examine
alguns exemplos dessas regras.
(19)
(20)
(21)
(22)
(23)

Pressionar o boto de partida faz o motor funcionar.


Se voc disser mais uma palavra, ser mandado para a cama sem o jantai.
Gire a maaneta para a esquerda, para abrir a porta.
Beba seu leite e voc ganhar a sobremesa.
Sempre que o macaco pressiona a barra ele recebe um amendoim.

Cada um desses cinco exemplos especifica um evento resposta e uma conseqncia de


- 127 -

estmulo para esse evento R. Considere (19). Se voc pressionar, R, o boto de partida,
ento, o motor funcionar, S (funcionar). Em (20): Se voc disser uma palavra, R, ento,
voc estar na cama sem o jantar, S(na cama + sem o jantar). Note que mudamos voc
ser mandado em (20) para a forma voc estar . A mudana acentua a idia crtica de
que os eventos ambientais acontecem para o organismo. Em (20), o mand-lo para a
cama poder envolver eventos resposta da parte de outro indivduo (por exemplo, sua
me) mas desde que estamos discutindo voc, este um evento S para voc. muito
importante manter um quadro de referncia consistente na notao de contingncias. No
momento, vamos supor que podemos notar os eventos R e S de um e somente um
organismo de cada vez. Assim, no podemos misturar os eventos comportamentais de
dois organismos no mesmo diagrama e cham-los Rs. No exemplo (21), se a maaneta
girada para a esquerda, R(girar para a esquerda), ento a porta se abre S(porta se abre).
Os exemplos (22) e (23) tambm cabem na forma se R, ento S.
De um modo geral, uma contingncia especifica a dependncia de uma mudana
ambiental de um evento anterior de comportamento. Embora as contingncias sejam
muito frequentemente especificadas no tempo futuro (veja os exemplos prvios) deve
estar claro que elas so regras baseadas em observaes feitas no passado. Podemos
usualmente ler a dependncia dada por uma contingncia com: se Rf ento S. Uma
maneira equivalente de descrever essa dependncia de S sobre R observar que, numa
contingncia comportamental R conduz a S, ou R produz S. Estas ltimas formas tem
uma utilidade to geral que existe um smbolo especial, -> , cujo significado conduz a
ou produz. Ento, podemos escrever os exemplos de contingncias de (19) a (23) como
se segue.
(19a) R (pressionar)-----> S (m otor funciona)
(20a) R a -----> S a

onde R a " dizer uma palavra e Sa ~ na cama


(21a) R( 16)---- > S i
onde R(] 6) vixar a m aaneta para a esquerda e S\

= p o rta aberta

(22a) R (beber leite)----- > ^(sobrem esa)


(23a) R (pressionar a barra) ->S(amendoim)

Cada um desses cinco casos convenientemente lido como R conduz a S.


A noo de uma contingncia comportamental no difcil, mas importante notar
alguns de seus aspectos caractersticos. Primeiro, a contingncia descreve as conse
qncias de S para dar uma R. Ela no descreve a ocorrncia do comportamento. Isto
, no diz que R ocorrer. Apenas diz que S condicional (dependente) a R, isto , que
R ocorreu no passado e foi, ento, seguida por S. Segundo, a contingncia comporta
mental especifica apenas as conseqncias ambientais para o comportamento. H um
nmero de outros tipos de contingncias que a notao no se destina a manejar. Vrios
destes esto ilustrados nos seguintes exemplos:
(24)
(25)
(26)

-123-

Os selvagens executaram a dana da chuva e no dia seguinte choveu.


Se houver sol, irei ao pique-nique.
Se ele abrir o livro, comear a ler.

(27)
(28)

Quando acordei, podia ouvir Joseila j movimentando-se na cozinha.


Se continuar a chover, a lavoura ser destruda.

Em (24), estamos diante de uma pseudo-contingncia. R(dana) realmente conduziu a


(-----*) S(chuva)* Todavia, a proposio no implica que, no passado, tal dana tambm
tenha produzido chuva. O exemplo (24) meramente uma especificao de uma
seqncia nica de R e S e a noo crtica de regra est ausente. Em (25), temos a idia
de que algum evento comportamental, R(jr ao pique-nique), ^ condicional a algum
evento ambientei S(se houver sol)- Mas isto o oposto da nossa idia de contingncia
comportamental, que prope a dependncia de S a uma R anterior. Em (26) temos
R(ler) dependente de R (abrir o livro)- Mas, novamente, isto no uma conseqncia de
estmulo para o emitir uma R. uma conseqncia comportamental do emitir uma R. Q
exemplo (27) meramente uma proposio descritiva de algum evento e nem especifica,
nem implica em qualquer regra. Finalmente, (28) descreve dois eventos ambientais. O
segundo, S(colheita destruda), dependente do primeiro, S(chover mais)- Tal contingn
cia S---- S no se enquadra no modelo bsico R3*S de uma contingncia comporta
mental.
A noo de que as conseqncias de S so dependentes de R fundamental nas
contingncias comportamentais. A notao equipada apenas para representar tais con
tingncias. Isto simplesmente porque, como o texto deixa claro, controlar as conseqn
cias passadas do comportamento um dos meios mais poderosos que o psiclogo tem
para controlar eficientemente o comportamento que se lhe apresenta no momento. Logo,
no ser surpreendente que ur^a notao tenha sido desenvolvida para representar o
padro dessas conseqncias em relao ao comportamento, tanto no laboratrio como
fora dele.
6.4 A SITUAO INICIAL (SA)
Logicamente, toda contingncia comportamental faz parte de algum ambiente. Outra
maneira de dizer isso que as contingncias so geralmente possveis apenas em alguma
situao determinada. Assim, no exemplo (19), pressionar o boto de partida possvel
somente quando voc est em seu carro, com o boto ao alcance e assim por diante. Em
( 20 ), a contingncia permanece somente quando uma segunda pessoa est presente para
escut-lo e mand-lo para a cama sem o jantar. Consideraes, similares podem ser feitas
para o restante dos exemplos de contingncia. Em geral, uma determinada situao
prevalece num momento em que uma determinada contingncia est em efeito. Uma vez
que a situao mudada com a ocorrncia de R (R produz uma nova situao, a
conseqncia S) frequentemente desejvel, por questes de comparao, indicar essa
situao inicial, de pr-conseqncia. Na notao, isto feito escrevendo-se a situao
inicial (abreviada frequentemente por Sa) verticalmente acima de R. Coloca-se, ento,
um colchete abrangendo os dois termos, S \ e R, para indicar que a situao e a contin
gncia associadas a R ocorrem simultaneamente. Considere:
S,

[ 6. 1]

- 129 -

onde Sa = leite sua frente


R = beber
Sb - sobremesa
O diagrama [ 6 . 1 1 lido: quando o copo de leite estiver sua frente e, se voc o beber,
ento ganhar a sobremesa. O diagrama [ 6.1 | o tipo mais simples possvel de diagrama
de contingncia a ser escrito na notao. Ele mostra duas situaes, uma inicial e uma
segunda as conseqncias de R. Ele especifica um evento resposta. Embora os diagra
mas que se sucedem sejam mais complicados, todos eles contm como elementos a idia
expressa em [ 6 .1 1 Isto , em alguma Sa, se uma R emitida, entio Sg ocorrer. As
contingncias que se adaptam ao diagrama [ 6.1 j so melhores lidas como:
quando ou
enquanto ou
durante ou
logo aps

----->

SB

SA
se

ento

Se esta fraseologia for adotada, haver pouca possibilidade de interpretao errnea de


qualquer problema.
6.5 CONTINGNCIAS MLTIPJ AS NA MESMA SITUAO
Raramente encontramo-nos numa situao onde possamos fazer apenas uma coisa
que tenha conseqncias. Normalmente, existem diversos comportamentos que podera
mos desempenhar em cada situao, muitos dos quais poderiam produzir mudanas
significantes no ambiente, ou conseqncias. Por exemplo, ao estar sentado diante da
mquina de escrever, l esto quarenta ou mais teclas que podem ser batidas, cada uma
produzindo uma conseqncia diferente. Poderamos tambm colocar e tirar o papel,
apagar as letras com a borracha, mudar a fita, etc. Alm disso, se o telefone estiver perto,
poderemos telefonar. Se uma segunda pessoa estiver prxima, podemos solicitar seus
prstimos e sermos atendidos. Pode-se continuai enumerando indefinidamente vrias
atividades possveis nessa situao, todas com conseqncias distintas. Resolvemos este
problema na notao escrevendo somente quantas dessas contingncias desejarmos notar
e isto feito com a simples adio de Rs nos colchetes. Assim, se estivermos interessados
em notar as contingncias do bater em qualquer tecla de uma mquina de escrever e
produzir uma letra, ou do discar um nmero num telefone, ou do pedir um copo de gua,
poderamos escrever:
Sa (na mquina de escrever, perto do telefone, amigo prximo)
Rl (bater na tecla)
S(ietra)
^ 2\
R2 (discar o nmero) - S (aiguem responde)
R3 (pedir gua) > S(um copo com gua trazido)

Em geral, podemos escrever tantas contingncias de R quantas desejarmos, simplesmente


pela adio de Rs e suas conseqncias dentro de um colchete.

-130-

SA
Ri

SB

R 2 >
R .3 SD
R4
sE

[6.3]

Os trs pontos na vertical significam kke assim por diante .


Note, cuidadosamente, que |6 .2 |e | 6.3 | no so representaes dos comportamentos
que sero realizados quando estivermos sentados maquina de escrever. So represen
taes do que acontecer se qualquer uma das Rs ocorrer. Os diagramas \6.2\ e 16.3 |no
asseguram que alguma dessas Rs seja, na realidade, efetivada ou que algum comporta
mento ocorra. O mximo que a notao pretende c mostrar quais conseqencias ocor
rero se alguns comportamentos ocorrerem. Este um ponto fundamental que deve ser
con st an temente lembrado sempre que Se examinar diagramas de R c S.
Um caso especial de contingncia mltipla ocorre quando mais de uma R pode
produzir as mesmas conseqncias S. Na expresso h mais de uma maneira de tirar o
couro de um gato , temos um conjunto de contingncias do tipo visto no diagrama 6 .4 :

SA

R{ ----r> Sb
R2 1
R a- 1

onde

S\
S[3
R]
F*2
R3

[6.4]

- gato intacto
gato sem couro
= um modo de tirar o couro do gato
- outro modo
= ainda outro modo

Para um exemplo mais especfico, considere as maneiras pelas quais podemos chamar um
garo nossa mesa. Podemos chamar garo , podemos fazer um sinal ao garo mais
prximo com as mos ou podemos meramente olhar na direo do garo, fixando
nossos olhos nos dele.

- 131 -

(nao lu garao nossa mesa)


(cli am a r o ga r o)
_____

S(o garo vem)

[6.5]

R(olhar o garo)
0 diagrama | 6.5 | ilustra um mtodo til de especificar Sa, a situao inicial. Para produ
zir o diagrama 16.5 [ escrevemos primeiro todos os com portam ento* envolvidos. Ento,
escrevemos a conseqncia principal, o garo vem at ns\ Finalmente, para d eter
minar o melhor mtodo de especificar Sa, verificamos apenas qual seria o oposto da
conseqncia. Neste caso, simplesmente nenhum garo nossa mesa . Quando
casos,complexos, contm muitos Ss, frequentemente til obter o oposto de cada S, pois
o oposto pode dar uma pista de como iniciar o diagrama.

6.6 A CONTINGNCIA NULA


Nos diagramas 6.1 a 6.5, Rs produziram Ss. Sempre que uma R conduzia a uma nova
situao, esta era includa num colchete vertical ao longo da situao em vigor. Mas,
nesses diagramas, a conseqncia S foi escrita sozinha, fora do colchete. Um S fora de um
colchete usualmente indica que nenhuma contingncia especial (em que estamos interes
sados) se mantm nessa situao. Ento, o significado de Sg sozinho em 16.1 J o mesmo
que:

Aqui se infere que a R em questo, R (beber) n^ m a*s tem quaisquer conseqncias


especiais uma vez o organismo alcance Sg. Assim, a ausncia de qualquer R detenninada,
num colchete, implica que se esta R fr emitida durante aquele S, nenhuma conseqncia
especial ocorrer. A ausncia de quaisquer conseqncias especiais para uma R define um
caso especial de uma contingncia e chamada de contingncia nula. Assim, a ausncia
de qualquer R determinada em qualquer colchete implica que a contingncia nula est
em ao para esta R durante o S deste colchete. Alm disso, o aparecimento implica na
contingncia nula de um S fora de um colchete nesta situao para todas as Rs em con
siderao.
Ocasionalmente, em alguma situao, digamos S, desejamos enfatizar que uma R que
anteriormente tinha uma conseqencia, no a tem mais. Uma maneira de fazer isto seria
simplesmente omitir a R do colchete que inclui Sa ^ mas para enfaiizar, pode ser ade
quado escrever:
S*
R

os quais so ambos lidos: durante Sa, R no mais produz quaisquer conseqncias espe
ciais. Ambos so equivalentes a
Sa
*

ou

[S

todas as q u atro form as ilustram m aneiras diferentes de escrever a contingncia nula.

- 132 -

6.7 A DURAO DAS SITUAES E DAS CONTINGNCIAS


As situaes no duram indefinidamente, faamos ou no alguma coisa para muda
las. Podemos subir num nibus somente enquanto ele permanece no ponto. Podemos
acenar para o garo enquanto ele est vista, mas eventualmente ele desaparece e
nossos sinais no so eficazes. As crianas frequentemente tm um limite de tempo para
beber o leite. Depois disso, no haver sobremesa, independentemente do que elas faam.
O fato de que muitas situaes e contingncias tenham uma durao de tempo definida a
elas associada, leva introduo do smbolo T que representa a durao dc tempt'). O uso
de T direto. A situao (S j), que dura um tempo T, e escrita:

Vrios pontos devem set levantados a respeito da interpretao de [6 .6 .| Primeiro, T c a


durao de Sj. Segundo, em T h sempre uma seta que nele se origina. Se uma situao
dura um tempo T, ento uma nova situao deve substitu-la. Esta nova situao ser
encontrada na ponta da seta que se origina em T. Terceiro, T e sua seta so usados para
representar ao fim de T unidades de tempo''. Ento, T sempre uma determinada
durao dc tempo. Temos alguns exemplos do uso dc T, a seguir: (29). A pea dura duar
horas, mas h um intervalo de 10 minutos entre o primeiro e o segundo ato. O primeiro
ato dura 45 minutos.

S (ato 1 )
Z(45 min)
(30)

S (intervalo)
> ZOOm in)

S (ato II)
X(65 min)

S(Hm da pena)
*

o rato ficar na caixa por uma hora.

SA
T -* S n
onde Sy\ rato na caixa
T - 1 hora
Sg
rato fora da caixa
Nenhuma contingncia foi escrita nesses colchetes j que nenhuma conseqncia para
quaisquer comportamentos foi especificada. Se houvesse sido especificada alguma, ento
as Rs teriam sido colocadas nos colchetes.
Algumas vezes, apenas um valor aproximado de T conhecido. Ento, se estamos
esperando que algum saia da cabine telefnica para que possamos fazer uma chamada,
no podemos estar certos de quanto tempo a situao de S(cabine tejefnica ocupada)

- 133-

durar- O mximo de que somos capazes, nessas condies, seria estimar uma media do
tempo de espera, digamos 5 minutos, em media. Uma mdia de T, assim especificada,
escrita T, onde o - indica em media. T usado exatamente da mesma maneira que
T. Por exemplo:
1(5 min) > S(cabine livre >
S(cabine ocupada)

[6.7 1

O diagrama 6.7 ilustra mais duas caractersticas da notao. Primeiro, as setas sempre se
originam nos Ts (ou Rs), nunca nos Ss. Quando um S sucede outro, a seta deve vir de um
T (ou de- R). Segundo, a posio vertical de T e S, num colchete, irrelevante. Um pode
estar abaixo ou acima do outro. Os eventos dentro de um colchete entram em ao
simultaneamente.

6.8 MAIS DE UMA RESPOSTA EXIGIDA PARA A CONSEQNCIA S.


Quando mais de uma ocorrncia de uma dada resposta necessria para produzir
alguma conseqncia S, este fato pode ser indicado de uma ou duas maneiras. Antes de
tudo, o evento, comportamental associado com a contingncia pode ser definido em
termos do nmero de elementos requeridos. Ento, o exemplo escreva uma palavra no
quadro negro 100 vezes e, ento, voc pode ir para casa , poderia ser notado assim:
Ra

Sa

Si
onde

Sj = dentro da sala de aula


Ra ~ escrever uma palavra 100 vezes
Sa = permisso para sair

Aqui, o nmero de elementos requerido est envolvido na definio de Ra. Alternati


vamente, este caso poderia ser notado assim:
Rn.a ^ Sa
S,
on de s j = dent ro da sa1a de au 1a
Ra = escrever uma palavra
Sa = permisso para sair
n = 100

Assim como o T, algumas vezes pode-se conhecer apenas o valor mdio de a. Quando
somente o nmero mdio de respostas requeridas para uma mudana S conhecido,
escrevemos n.

-134-

6.9 CONTINGNCIAS REPETITIVA.


Nos diagramas [6.1 | a [6.5 [ as respostas produziram consequencias ambientais.
Mesmo assim, todas essas contingncias poderiam ser descritas de uma vez. Isto , uma
vez que a R especificada ocorreu, apareceu uma nova situao e a contingncia nula
entrou, ento, em efeito para todas as Rs enumeradas no colchete seguinte. Todavia, esta
uma condioque nem sempre verdadeira. Em 6.2, por exemplo, uma simplificao
grosseira foi feita, desde que est claro que, quase que imediatamente depois de bater
numa tecla, podemos bater em outra e produzir uma letra. Evidentemente, necessitamos de
alguma maneira para descrever a natureza repetitiva de certas contingncias.
Talvez a contingncia repetitiva mais comum seja aquela que a mquina de escrever
ilustra. Depois de fazer alguma coisa obtemos uma conseqncia, mas podemos fazer a
mesma coisa novamente, se desejarmos, e ainda obtermos uma conseqncia e assim
indefinidamente. A maneira mais simples de descrever este caso seria diagram-lo de modo
a indicar que a contingncia antiga est novamente em efeito logo depois da
conseqncia. Esta seria uma representao exata, porque certo que no podeipos
datilografar uma nova letra no momento em que a tecla est batendo no rolo. Se
fizermos assim, teremos a sobreposio de tipos e outros efeitos indesejveis. A idia
principal que devemos esperar um pouquinho, apenas uma frao de um segundo.
Assim, a contingncia nula que est em efeito no momento da conseqncia dura
somente uma pequena frao de segundo, depois do que voltamos nosssa contingncia
original. Na seo 6.7, discutimos como o tempo pode produzir novas situaes.
Precisamos apenas ampliar este conceito para permitir que o tempo conduza de volta s
situaes antigas e tambm s antigas contingncias. Essa ampliao de nossas idias
permitir uma representao exata de muitas contingncias repetitivas. No caso da
mquina de escrever, podemos notar:

onde

SA

Sb

Ra

|T 2

,
S a " mquina de escrever, teclado em repouso.
Ra - ^ater numa tecla
S[}
a letra aparece
j
pequena frao de segundo.

16.8|

No diagrama 16.8 | representamos o fato de que numa situao S^, podemos bater numa
tecla e produzir uma marca na pgina e na outra S b , no podemos obter esse efeito
batendo na tecla. Para nos referirmos s duas contingncias distintas (uma das quais,
naturalmente, o caso nulo) subscrevemos os numerais 1 e 2 embaixo dos colchetes.
Outros exemplos de contingncias repetitivas simples so:

- 135 -

(31)A ave recebe uma apresentao de 3 seg de alimento cada vez que bica o disco.
(32)Voc pode encher sua caneta tintoiro colocando-a no tinteircr e empurrando o
mbolo. (Aqui, o T da contingncia 2 bem longo, dependendo do quanto voc
escreve).
(33)Cada presso no gatilho faz a arma disparar um tiro.
Um segundo tipo de contingncia repetitiva ocorre quando uma segunda resposta,
em vez da mera passagem do tempo, faz voltar s condies da primeira situao e suas
contingncias. Quando um rato reforado com uma gota de leite cada vez que pressiona
a barra, um?. segunda presso barra no p ro d u z ir uma segunda gota de leite at que a
primeira seja consumida. Assim,

onde S a
leite ausente
S r - gota de leite
RA
presso barra
RB - beber o leite
representa aquelas condies. Este tipo de reciclagem comportamental muito comum
Algumas armas de fogo pequenas so construdas para atirar somente quando reguladas
entre cada tiro.
S(arma regulada) _______ ^
R(puxar o gatilho)

|S(fogo)
[R(regular)

________

Similarmente, voc pode obter muitas garrafas de uma mquina de Coca-Cola, inserindo
as moedas, mas voc deve remover cada garrafa para que a prxima moeda seja eficiente.
Em resumo, h dois modos principais de reciclar uma contingncia repetitiva: atravs
da passagem de tempo (indicado por T ^ ) } no por meio de um evento resposta (indicado
por R -----1 )

6.10 FAC1LITAO
Ocasionalmente, acontece que a emisso de uma resposta, embora no altere o
ambiente, torna possvel que uma segunda resposta produza um estmulo. Assim, quando
chegamos ao final de uma linha com a nossa mquina de escrever, o teclado no mais
opera. Se pressionarmos o soltador de margem, as teclas no operam, mas esta resposta
no muda nosso ambiente
de um modo aprecivel. A mquina de escrever parece
exatamente a mesma antes e depois de ter sido pressionada a tecla de soltar a margem. As
mudanas ocorrem, naturalmente, dentro da mquina de escrever e so reveladas pela
possibilidade, de gora, se produzir letras,batendo nas teclas. Notamos es.se caso, assim:

136-

onde

S24
$23
Ra
Rb
T

=trmino da linha
- a letra aparece
= pressionar o soltador de margem
= bater na tecla
- pequena frao de segundo

Assim, o aparecimento de
no colchete, 2, sem um S, implica em que o S do colchete
precedente, S2 4 , est ainda em vigor. E realmente isto correto. Casos tais como [6.9]
so indicados esquematicamente
Rj -----> R 2

e so lidos: Se R j, ento se R 2 -.

0 comportamento verbal humano frequentemente configura-se numa representao


semelhante a [6.9 j. Quase sempre prefaciamos os nossos comentrios com Escute isso ,
ou Ouviu falar desta? . Estas proposies introdutrias tm o efeito de captar a
ateno, embora a ateno nem sempre seja revelada por qualquer mudana aparente na
face da nossa audincia, isto , no nosso ambiente. 0 que acontece, todavia, que os
nossos comentrios subsequentes certamente sero mais observados (isto , produziro
conseqncias) se forem prefaciados por tis proposies.
Para assar um bolo somos aconselhados a untar levemente o fundo da forma. Assim,
o bolo no ficar agarrado fornia quando formos remov-lo. No podemos ver
diretamente os efeitos do untar a forma uma vez que tenhamos colocado o bolo, mas
podemos observar que a resposta de untar torna possvel a resposta de remov-lo.
Em termos mais tcnicos, a facilitao a produo de uma contingncia
comportamental atravs da ocorrncia de uma resposta que por si mesrna no produz
qualquer conseqncia ambiental direta.
6.11 CONTINGNCIAS NEGATIVAS
As contingncias de comportamento so, muitas vezes, especificadas de maneira
negativa. A menos que voc beba seu leite, ser mandado para cama. Se voc no pagar
sua conta de telefone, eles cortaro o seu telefone. Todos os que no votarem sero
severamente repreendidos. Um erro comum considerar o no beber , no pagar.,
no votar , como Rs. Desde que o comportamento alguma coisa que o organismo faz,
tais assertivas so claramente uma violao de nossas definies. Uma soluo para a
especificao da R est na observao de que o tempo, invariavelmente, tem um
im p o rta n te p apel, em bora frequentem ente camuflado, nessas contingncias.
Logicamente, se uma conseqncia ocorrer para 0 no fazer algo, o administrador da
conseqncia tem que decidir quanto tempo de no fazer constitui o no fazer . Assim.

- 137-

o tempo est intimamente ligaao s contingncias negativas, porque sempre alguma


durao de inatividade que produz as conseqencias.
Ao considerar as contingncias negativas, til levar em conta todos os
comportamentos possveis, exceto a R determinada, como uma classe nica de
comportamentos. Embora essa classe seja, em geral, muito diversa e no bem
especificada, podemos estar certos de que, pelo menos, no incluir R como membro.
Para indicar esse conjunto complementar de comportamentos que no inclui R comc
membro, empregamos o smbolo R (l-se R barra) para referirmo-nos a todos os
comportamentos, exceto R. Desde que, como notamos, sempre uma certa durao de R
(no executar R) que produz as conseqncias, devemos sempre subscrever um T para R.
Assim, a menos que paguemos nossa conta de telefone dentro de duas semanas, a partir
do momento em que a recebemos, o telefone ser cortado diagramado assim

[6.10]
on(^e Sa
R
T
Sb

= recebimento da conta
= pagar a conta
= 1 4 dias
= telefone cortado

Note que R no est representada na chave como qualquer comportamento especfico.


Todavia, sua R complementar est especificada na chave, embora aparea no diagrama
real apenas por implicao (isto , se a quantidade de T de R no ocorre, ento fT deve
ocorrer). Assim, R sempre definida em relao a R de modo que uma ou outra deve
ocorrer, mas, evidentemente, ambas no podem ocorrer. Em [6.10 [ se a quantidade T de
R ocorrer, ento, o telefone ser cortado, mas se.R ocorrer, ento nada de especial
acontecer. Uma vez que R no est representada em [6.10,] isto significa que R est
numa contingncia nula com relao a S a e Sg e, realmente, isto verdadeiro. No
pag-la (duas semanas de qualquer coisa, exceto pag-la) resulta nas conseqncias.
Como um guia geral, observar-se-, frequentemente, que Sg nessas contingncias
negativas, um evento aversivo ou indesejvel. Logo, 6.10 pode ser tido como uma
prescrio para a produo de eventos aversivos. Logicamente, isto significa que
tambm uma prescrio para evit-los e isto precisamente o que desejvamos notar
quando introduzimos este tipo de exemplo.
6.12 CONTINGNCIAS PROBABILISTIC AS
Algumas vezes, as conseqncias S de uma resposta variam. Quando atiramos uma
moeda, nem sempre obtemos o mesmo resultado. Metade das vezes obtemos cara, metade
das vezes, coroa. Este caso notado pela incluso de mais de uma seta originando em R e
colocando os valores da probabilidade sobre cada seta. Quando mais de uma seta com
origem em R empregada desta m a n e ira d o s v a lo re s especificados da probabilidade devem
som ar l. Na moeda no viciada, temos:
- 138-

Em geral, quando o comportamento pode ter um nmero de conseqncias possveis,


devemos escrever

indicando a probabilidade de cada conseqncia S sobre sua seta correspondente.


Naturalmente p + q + r + s+...deve somar 1 .
As situaes dc estmulo podem tambm se suceder probabilisticamente. Quando
chove rui segunda-feira, c provvel que chova tambm na tera-feira mas, algumas vezes, o
tempo podo mudar em 24 horas, e, na tera-feira, o sol brilhar:

onde S\

= chuva

T24 = 24 horas
5 2 = dia de sol
5 3 = mais chuva

6.13 DISCRIMINAES
Em todos os diagramas apresentados sups-se que o tempo corresse da esquerda para
a direita. Isto , a sucesso temporal de Ss e contingncias era da esquerda para a direita.
(As contingncias que reciclam no so excees, porque a seta que recicla da direita para
a esquerda meramente uma abreviao para escrever uma srie infinita de smbolos
direita.) A dimenso vertical foi empregada para indicar que os eventos escritos no
mesmo colchete entram em efeito simultaneamente. Em algumas ocasies, til consi
derar vrias contingncias que poderiam estar em efeito simultaneamente. Assim-,
podemos pretender discutir as contingncias que surgem de discriminaes simples de
laboratrio. Se a luz for vermelha, o macaco deve pressionar a barra para conseguir
alimento; mas se a luz fr alaranjada, o macaco deve girar uma roda para conseguir o
alimento:

-139-


R(vermelha)
y(pressionar)
S"
R(alaranjado)
(girar a roda)

-r S
4(alimento)
[6. 11]

Em 16.11] nenhuma regra dada para a ordem do vermelho e alaranjado. Portanto,


nenhuma reciclagem apresentada. O aparecimento de dois colchetes, um acima do
outro, implica em que., antes do reforamento, ambas as contingncias estaro em efeito.
O diagrama [6.11] tambm ilustra o fato bvio de que mais de uma R pode produzir a
mesma situao.
6.14 R e S FUNCIONALMENTE DEPENDENTES
Os casos complexos de contingncias repetitivas podem envolver mais do que uma
simples reciclagem para a situao original. Frequentemente, a situao original modifi
cada por cada ocorrncia do evento resposta. Quando inflamos uma cmara de bicicleta,
cada bombada infla a cmara um pouco mais. Para notar isso, usamos as ltimas letras do
alfabeto (u, v, x, y, z) como ndices de S, querendo implicar a natureza varivel e
inconstante de S. Assim, em

onde Sx = pneu inflado com uma quantidade x


x = uma funo de nR
R = inflar

vemos que a quantidade de ar na cmara uma funo do nmero de Rs que ocorreu. O


diagrama 6.12 ilusoriamente simples mas um nmero de casos comuns usam-no como
um elemento. Quando cortamos uma rvore, batemos creme e corremos 100 metros,
cada resposta que executamos, modifica um pouco a situao. To logo seja dada uma R,
modificando a situao, outra R pode ser emitida imediatamente modificando-a uin
pouco mais, e assim por diante. Eventualmente, no final, um novo conjunto de contin
gncias estar em efeito: podemos colocar a rvore cada num caminho, o creme em
cima de um pedao de bolo e podemos receber uma medalha pela nossa velocidade na
corrida.
Algumas vezes, a resposta que produzir as conseqncias uma funo de algum
aspecto da situao existente. No captulo 1 discutiremos um caso no qual o comporta
mento de procurar resulta na descoberta de um objeto. Mas a direo em que a procura
efetiva uma funo da localizao espacial do objeto. Este um caso simples onde
tanto a R como o S no mesmo colchete requerem ndices variveis. A forma correta de R
- 140 -

depende de S, mas, a mjios que o objeto seja encontrado sempre no mesmo lugar, S sera
varivel. O diagrama [6.13 (representa este caso
Sc
Rj,

[6.13J
* S2

onde S2 = objeto na mo
R = procurar
y = direo no espao
x posio do objeto
S = objeto a alguma distncia de nos
e
y = f(x)
6.15 CONTINGNCIAS AGRUPADAS
0 tempo (T) tem sido usado como referncia durao de situaes e contingncias.
Algumas vezes, til representar por um nico T a durao de um conjunto inteiro de
contingncias. Para indicar essa possibilidade, uma nova facilidade notacional deve ser
desenvolvida. Considere que a poca dos morangos v de maro a setembro, isto , 7
meses. Se voc vai mercearia durante esta poca, encontrar morangos anunciados e em
exposio. Se voc perguntar se h morangos para vender, receber uma afirmativa.
Naturalmente, a mercearia no permanece aberta 0 dia todo. A loja abre s 9 horas e fecha
s 18 horas. Aqui, temos dois ciclos de tempo independentes. Primeiro, temos a poca
dos morangos que dura 7 meses e a poca em que no h morangos, que dura 5 meses.
S(na poca)
T(7 meses)

S(fora de poca)
T(cinco meses)

zi

Mas tambm temos o horrio de 9 horas por dia de trabalho da mercearia. Isto
(9 horas)
[ (mercearia aberta)

T( 15 horas)
__
S(mercearia fechada)

Precisamos conseguir uma maneira de combinar as situaes e ciclos de tempo. O diagra


ma 6.14 mostra esta representao. Aqui, os colchetes aparecem agrupados dentro de
colchetes.

- 141 -

0 T 7 meses e o T 5 meses aplicam-se durao de todas as contingncias neles includas.


T 2 includo apenas para permitir a reciclagem do seu pedido de morangos. Provavel
mente, leva um certo tempo para que voc profira as palavras e tenha a primeira caixa em
suas mos. Ento, voc pode pedir novamente e receber outra caixa. O exemplo mostra
um agrupamento trplice. Uma vez que uma e somente uma situao pode estar presente
em qualquer tempo, Sg inclui muitos dos elementos de S\
REFERNCIAS PARA O CAPITULO 6
M echner, F. A notation system for the description of behavioral pro
ced u res./ . exp. A n a l Behav., 1959, 2 , 133-150.
Mechner, Vicki. A notation system jor behavioral contingencies: an
instructional program. New York: Basic Systems, 1963.

- 142-

Captulo 7 REFORAMENTO INTERMITENTE

No paradigma do fortalecimento operante, cada membro de uma classe de resposta


selecionada emitido tipicamente seguido por um estmulo reforador. Esse paradigma
pode ser efetuado por cientistas do comportamento, pais, professores, amigos ou pela
prpria natureza. Sempre que o procedimento de fortalecimento operante iniciado, o
resultado tpico um aumento na probabilidade da resposta. O reforamento de cada
membro de uma classe selecionada de resposta, nesse paradigma, chamado de refora
mento contnuo (daqui por diante, abreviado por crf). O termo no significa que o
reforamento esteja continuamente disponvel. Ele simplesmente significa que uma con
tingncia do tipo R
S+ prevalece /Continuamente entre a resposta e o reforamento.
No mundo civilizado e na selva, as relaes entre os comportamentos emitidos e as
mudanas subsequentes no ambiente so frequentemente mais complexas do que o crf.
Em certos dias, muitas vezes por razes obscuras ou desconhecidas, o mesmo comporta
mento que teve xito em outras ocasies no o ter. Este carter fortuito da relao entre
operantes e conseqncias subsequente s.pode ser evitado no laboratrio. A, controlando
explicitamente o reforamento dos comportamentos, podemos decidir para os nossos
sujeitos humanos e animais exatamente quais comportamentos de uma srie emitida
sero bem sucedidos. De um modo tpico, tal controle descrito na forma de regras.
Essas regras especificam em detalhes as relaes que existem entre certas respostas ope
rantes e os estmulos reforadores subsequentes. As regras so apenas casos especiais das
contingncias comportamentais do Captulo 6 , mas elas incorporam como eventos S
crticos as conseqncias especiais que j denominam os reforadores.
Os comportamentos humanos nas situaes cotidianas revelam ambas as contin
gncias: reforamento contnuo e intermitente. Sob circunstncias normais, muito do
nosso comportamento reforado continuamente. Os interruptores acendem e apagam a
luz com regularidade. Quando ouvimos uma voz e olhamos na direo em que ela vem,
normalmente vemos a face de outra pessoa. Quando perguntamos a um amigo quantas
horas so, regularmente obtemos uma resposta. Excees ocorrem, mas so to infre*
quentes que causam surpresa e perplexidade quando acontecem. Em outras situaes,
todavia, o reforamento intermitente a regra. A pacincia do pescador em lanar e
retirar o anzol da gua por horas a fio, sem a ocorrncia de uma mordiscada, desen
volve-se atravs de uma histria de reforamento intermitente. No basebol, o refor
amento sob a forma de uma rebatida considerado adequado quando em ste entre dez

- 143-

ou mais tentativas o jogador perde a vez. O cinemeiro inveterado, talvez raramente vcj
um bom filme, mas seu comportamento de ir ao cinema semanalmente permanece forte.
Neste capitulo, analisaremos alguns dos princpios do reforamento intermitente que
foram isolados no laboratrio com sujeitos animais e humanos e mostraremos alguns dos
muitos procedimentos possveis. ( 1 )
7.1 CONTINGNCIAS DE INTERVALO
Como ponto de partida, lembre-se do procedimento de condicionamento e extino
sucessivos (ver seo 5.5). Tipicamente, este procedimento proporcionava n refora
mentos contnuos para uma resposta, seguindo-se T horas de extino. Este ciclo caracte
rstico, consistindo de uns poucos reforamentos c, depois, uma extino prolongada,
estendia-se por uma ou mais sesses experimentais. Quando a extino havia resultado
numa reduTo acentuada do responder, o ciclo era repetido. Considere agora uma
variao desse procedimento, consistindo do reforamento de uma nica resposta,
seguido por apenas um minuto de extino, novamente um segundo reforamento e
assim por diante. Nessa variao, muitos ciclos de condicionamento e extino so con
densados em uma nica sesso de uma hora. Depois de efetuar este procedimento, surge
um efeito comportamental caracterstico, que se v estilizada da Fig. 7-1.
Inicialmente, curvas condensadas de extino, negativamente aceleradas, seguem
cada reforamento (Fig. 7-1), (parte a). A resposta que produz o reforamento freqen
te mente a ltima de uma srie de respostas cm taxa baixa. Esse quadro, no entanto,
transitrio e depois de um certo nmero de reforamentos ter ocorrido, desenvolve-se
uma taxa moderada e estvel (parte b). Esta tambm uma fase evanescentc, que d
lugar a uma terceira fase (c), caracterizada por uma pausa depois de cada reforamento,
pausa esta que seguida por uma mudana gradual ou abrupta para uma taxa de resposta
aoderadamente alta, mantida at ao final do intervalo de 1 minuto.
As fases transitrias b c c so ilustradas com dados reais na Fig. 7-2. Esta figura repre
senta as sesses 2, 3 c 4 da resposta de bicar o disco (chave) de um pombo, que recebia
alimento de acordo com o procedimento condicionamcnto-cxtino descrito acima. As
curvas da Fig. 7-2 foram empilhadas ; isto c, foram tiradas do seu sistema de coorde
nadas usual e colocadas horizontalmente mais prximas, para economizar espao e faci
litar a comparao. As taxas reais de resposta em qualquer momento e tambm o nmero
de respostas acumuladas emitidas cm qualquer momento podem ser estimados por com
parao com a pequena chave inserida na parte inferior direita da figura.
O
procedimento descrito uma das vrias maneiras possveis em que um experimentador pode programar contingncias de reforamento em relao ao tempo. No caso
em questo, o experimentador estabeleceu um intervalo fixo de tempo entre o ltimo
reforamento c o restabelecimento da contingncia de reforamento. At que esse inter
valo fixo tenha passado, nenhuma resposta pode ser reforada. Tal procedimento fixa o
tempo entre o reforamento e a prxima contingncia de reforamento e, por isso,
apropriadamente denominado um esquema de Intervalo Fixo (abreviado por IF). Note,
todavia, queo intervalo de tempo entre o recebimento de quaisquer dos reforamentos
reais nao c fixo.
- 144-

Reforamento (tempo)
Figuro 7-1.. Curva estilizada da transio do crf para reforamento intermitente em
intervalos peridicos fixos. O uso de ti para rotular a abeissa sugere que os segmentos
sucessivos de resposta devem estar associados no com reforamentos sucessivos, mas,

(1) Faz-se necessria uma palavra a respeito do delineamento dos experimentos sobre
reforam ento interm itente discutidos neste captulo. tp ic o desses experimentos que os
sujeitos sejam inicialm ente treinados num esquema c rf de reforam ento. Somente
q u a n d o uma taxa estvel de resposta estabelecida sob as condies c rf o
e x p e r im e n ta d o r in tr o d u z as in te rm it n c ia s desejadas.

- 145-

Embora o valor mnimo deste intervalo seja o tempo fixo entre um reforamento e o
estabelecimento de uma contingncia, seu valor real depende de quo rpido a resposta
ocorre depois que a contingncia entra em efeito. O elemento bsico aparece em notao,
assim
(fixo) > R > S*
Os eteitos principais de um esquema em intervalo fixo (IE ), imposto aps um crf
podem ser resumidos da seguinte maneira:
1 . O comportamento do indivduo mostra um ajustamento gradual ao procedi
mento, que se nota atravs das mudanas no padro da taxa de resposta. J discutimos
este efeito.
2 . O padro que emerge no final tem a forma de ondas (ondulado). Num esquema
IF, o reforamento c seguido por um perodo subsequente de no reforamento. Uma
longa histria passada neste estado de coisas faz com que o animal pause por um tempo
aprecivel aps um reforamento. Essa cessao do responder uma conseqncia
natural do fato de que, no passado, uma resposta aps o reforamento numea foi refor
ada. uma forma de extino discriminada, que ser esclarecida mais tarde, quando
discutirmos o processo comportamental da discriminao.
3. O comportamento pode ser mantido indefinidamente em IFs de apenas poucos
segundos at IFs de vrias horas de durao.
DIA
24

68

144

Figura 7-3. t-stgios no desenvolvimento do comportamento num esquema 11* 30 min.


Dados de int 'rretoramento selecionados so apresentados para os dias indicados. O
nmero esquerda de cada segmento indica o nmero ordinal do reforamento que
termina este segmento (segundo Cummine e Schoenfeld, 1958).

-146-

Num experimento, pombos famintos foram expostos 16 horas por dia a contin
gncias de reforamento com alimento em IF -3 0 min, em 144 dias consecutivos, repre
sentando uma histria experimental dc mais de 1.300 horas. O comportamento de bicar a
chaye foi mantido atravs do experimento e verificou-se a natureza transitria de certos
efeitos de IF Na Fig. 7-3, as mudanas no padro de resposta so ilustradas atravs do
registro de comportamento de um animal durante intervalos interreforamento selecio
nados, obtido nas sesses 24, 68 e 144. A mudana progressiva de uma ondulao gradual
para uma ondulao abrupta evidente.
IR 4 min

Figura 7-4. Registros cumulativos de animais em IR 4 min, obtidos nas sesses iniciais
(4a. ou 5a.) e Finais (15a., 17a. ou 20a.) (Millenson, 1963).

Contingncias em IF no so raras na vida cotidiana. O contedo de uma panela


ferve, aproximadamente, aps um certo tempo fixo que o calor aplicado. Os nibus que
andam no horrio reforam a espera dos passageiros no ponto em intervalos fixos. O fato
dc o IF no manter um nvel constante de comportamento num perodo de tempo ,
com freqncia, um obstculo importante para o seu uso no controle prtico do compor
tamento. Em cursos universitrios, onde a principal contingncia estabelecida um
exame final, muitos estudantes trabalham muito pouco durante o curso. Poucos dias
antes do exame final, ocorre um frenesi de atividades.
Suponha que os intervalos de tempo entre o reforamento e a prxima contingncia de
reforamento tenham duraes aleatrias e sejam imprevisveis. O resultado um novo
tipo de procedimento chamado esquema de Intervalo Randmico (IR). Este esquema
pode ser especificado apenas pelo intervalo mdio entre o reforamento e o restabele
cimento da contingncia. Para dar alguma indicao da variao em intervalos que pode
ser encontrada, num esquema de IR 1 min, por exemplo, cerca dc 95% dos intervalos
entre o reforamento e as contingncias de reforamento cairo na faixa de 0 a 2
minutos. A exposio inicial a um procedimento IR aps uma histria em crf, produz
somente os dois primeiros estgios de transio descritos para a IF na Fig. 7-1. O resul-

- 147 -

tado final em IR uma taxa de resposta estvel e uniforme, cujo registro cumulativo no
apresenta desvios sistemticos de uma linha reta (ver Fig. 7-4).

Figura 7-5. Registros cumulativos de respostas para esquemas IV de deflexes de


ponteiro, com intervalos mdios, de 15 seg, 30 seg, 1 min e 2 min, respectivamente.
Todos os registros so do mesmo sujeito. Km cada caso, o registro apresentado foi feito
depois de sesses prvias no esquema (Holland, 1958).

Aproximaes de esquemas IR so frequentemente encontrados fora do laboratrio.


Os operadores de radar que observam o osciloscpio para detectar sinais infrequentes
encontram-se numa intermitnciasimilar ao esquema IR, Sua resposta o comportamento
de observar; o reforamento a descoberta de um sinal. Um caso similar ocorre quando
um operador tem de observar o marcador para detectar deflexes infrequentes, mas
crticas. Nesses exemplos, pode-se pressupor que o comportamento visvel de observar
- 148 -

segue as leis do comportamento operante, mas ele nem sempre facilmente medido. No
procedimento de Holland (1958), sujeitos humanos foram instrudos a examinar um
marcador e relatar (pela presso de uma chave telegrfica) cada deflexo observada a
partir de um ponto zero. Ambos, marcador e sujeito, todavia, estavam num quarto escuro
e o marcador podia ser visto somente aps a presso de uma segunda chave telegrfica
que fornecia iluminao por uma frao de segundo. Deste modo, Holland estabeleceu
um operante convenientemente mensurvel que se correlacionava com o comportamento
de observar do sujeito; para olhar o marcador, o sujeito tinha que pressionar uma
chave. Para colocar o comportamento de pressionar a chave sob um esquema similar ao
de intervalo randmico, o experimentador programou deflexes no ponteiro (refora
mentos) separadas por diferentes intervalos de tempo. Os intervalos no eram propria
mente randmicos, mas tinham duraes variadas. O procedimento um exemplo do que
chamado um esquema de Intervalo Varivel (TV). Sob as condies de Holland, o
esquema manteve taxas de pressionar a chave (resposta de observao) superiores a uma
resposta por segundo. Holland pesquisou os efeitos da mudana do intervalo mdio entre
asdeflexes programadas do ponteiro. Comeando com um intervalo mdio de 15 seg,
ele aumentou progressivamente o intervalo mdio para 30 seg, 1 min e, finalmente, 2
min, em vrias sesses consecutivas. A fig. 7-5 mostra os resultados obtidos com um de
seus sujeitos, um homem alistado ha Marinha dos Estados Unidos. Os padres de taxa
observados esto de acordo com qs estudos animais sobre os efeitos comportamentais
deste esquema (Ferster e Skinner, 1957). Os resultados de Holland na Fig. 7-5 indicam,
alm disso, que o IV produz uma taxa de resposta que tende a aumentar medida que o
intervalo mdio entre as deflexes (reforamentos) diminui. Uma implicao interessante
desta descoberta que, se as deflexes forem transitrias (isto , se durarem apenas
pouco tempo), ento menos deflexes sero perdidas (isto , mais sero observadas)
quando o intervalo mdio entre elas for pequeno. Ento, um homem que observa uma
tela de radar onde os sinais raramente ocorrem tem uma boa chance de perder um sinal
transitrio crtico quando este aparece , porque provvel que sua taxa de observao
seja baixa. Os resultados da Fig. 7-5 sugerem a possibilidade de se inserir sinais artificiais
suplementares para manter a taxa de observao alta, ao nvel que assegurar a deteco
de todos os sinais crticos.
7.2 PROBABILIDADE DE REFORAMENTO
Um esquema de reforamento pode ser provisoriamente definido como um procedi
mento ou plano que determina quando e por quanto tempo uma contingncia de refora
mento estar em efeito. Como tal, ele deve ser estabelecido e mantido por um experi
mentador. Um esquema de reforamento , assim, um fenmeno de laboratrio. Embora
haja esquemas que se assemelhem a algumas intermitncias de reforamento vistas na
natureza, o conceito de esquema independente dessas comparaes e tem implicaes
que vo muito alm delas. Um esquema de reforamento pode ser considerado um caso
idealizado de uma intermitencia de reforamento.
Um esquema de reforamento fundamentalmente uma especificao da probabi
lidade 'de reforamento para uma resposta selecionada em determinadas ocasies. Na
seo anterior, apresentamos contingncias que programavam muoaiias apartir de, epan
valores extremos de probabilidade, 0 e 1. Evidentemente, extino outro nome para o
valor extremo, probabilidade de reforamento = 1. Nos esquemas de intervalo discu
tidos acima, foram estabelecidas contingncias que especificavam uma probabilidade de
- 149 -

reforamento
1 , aps intervalos fixos, randmicos e variveis, durante os quais essa
probabilidade era 0. Mas o campo dos esquemas dc refo.amento no , de modo algum,
restrito a misturas temporais, embora complexas, dos extremos superiores e inferiores da
probabilidade de reforamento.
possvel, por exemplo, construir um esquema no qual a probabilidade de refora
mento para uma determinada resposta seja a mesma o tempo todo. Certas situaes da
vida real aproximam-se desses esquemas de probabilidade constante ou uniforme de
reforamento.
Os resultados de se atirar uma moeda no viciada ocorrem em tais
bases probabilsticas. Numa aposta, por exemplo, uma srie de lanamentos pode ser
feita e eventualmente obtm-se o reforador desejado, digamos, cara. Todavia, a cara
pode no aparecer em um grande nmero de lanamentos, embora a probabilidade de se
obter cara, em qualquer lanamento, seja uniformemente constante e igual a 1/2. A

Tempo (minutos)
Figura 7-6. Taxas dc respostas acumuladas quando o bicar c reforado num esquema dc
probabilidade* uniforme (dados de J. Farmer).

- 150 -

imprevisibilidade de um lanamento de moeda caracterstica da probabilidade uniforme


dc contingncias de reforamento. Apostar e jogar, em geral, so realmente probabilsticos deste modo. Se o bom tempo tido como um reforador e o comportamento de ir
ao piquenique efetuado, o reforamento ocorre probabilisticamente. Podemos
consultar o departamento de meteorologia para confirmar o nmero de dias bons previs
tos para junho. Mas, embora a probabilidade de que faa bom tempo possa ser muito
alta, nosso comportamento de ir ao piquenique pode, ainda assim, no ser re fo r a d o com
um dia bom.
Geralmente, partimos do princpio de que, em qualquer perodo de tempo determi
nado, vantajoso para o indivduo ganhar tantos reforamentos quanto possvel. Na
extenso em que esta generalizao verdadeira, diante de um esquema de probabilidade
uniforme a melhor estratgia responder to frequentemente quanto possvel. Se somos
pagos para achar conchas bonitas numa praia, quanto mais conchas examinarmos, mais
conchas bonitas encontraremos. Isto verdadeiro seja qual fr a probabilidade de encon
trar conchas bonitas. Algumas praias podem permitir-nos uma probabilidade mais alta do
que outras, mas, em qualquer praia, ser vantajoso para ns examinar tantos espcimes
quanto possvel . Outro modo de dizer isto seria afirmar que vantajoso que o nosso
comportamento de examinar/tenha a mxima taxa possvel.
Um pombo faminto, exposto a um esquema de probabilidade uniforme de refora
mento com alimento desta natureza, rapidamente se ajustar a uma estratgia tima, se a
probabilidade fixada no foi muito baixa. O esquema gera taxas de resposta extrema
mente altas ("Brandauer, 1958).
A figura 7-6 uma amostra de alguns resultados tpicos obtidos neste esquema, onde
a probabilidade de receber alimento por bicar era de 1/25. Em alguns momentos na Fig.
7-6, o pombo estava bicando a uma taxa de trs por quatro respostas por segundo p o r
oerodos consecutivos. Quando Sidley e Schoenfled (1964) expuseram pombos a vrios
valores de probabilidade dc reforamento variando de 1 at 1/160, obtiveram a interes
sante funo da Fig. 7-7. Fm seu estudo, a taxa total de respostas foi maior quando a

2.50-

fz.oo1
I

1.50-

8 1.0 0 -

od

0.50
0 V 10

l' * ~

0.1000

0.0500

0.0250

00125

0 0068

1 igura 7-7. 1'axas totais dc resposta em funo da probabilidade de reforamento


(segundo Sidley e Sclioenfeld, 1964).

probabilidade dc reforamento era 1/10. Probabilidades de reforamentos superiores c


inferiores a 1 / 10 , levaram a uma reduo na produo, o que no representa uma estra
tgia t ima.

- 151 -

1.3 NOTAS TERICAS SOBRE ESQUEMAS DE REFORAMENTO


Podemos resumir a importancia sistemtica das sees 7.1 e 7.2 pela observao de
que um esquema um conjunto de regras que especificam: ( 1 ) quando estabelecer uma
contingncia de reforamento; (2) quanto tempo mant-la em vigor; (3) qual valor da
probabilidade de reforamento atribuir a ela. Quando as variaes nessas trs condies
so permutadas com os diversos parmetros de resporta a serem discutidos no prximo
captulo, as possveis variaes de procedimento para manter operantes tornam-se
enormes. Pressionados no sentido de economizar representaes, os tericos tm desen
volvido representaes tais como as da Fig. 7-8 para descrever e relacionar os vrios

Probabilidade uniforme
^ de 1/5___________

j___ ___ t___ j___ I___ |


Figura 7-8. Probabilidade dc reforamento para uma resposta em funo do tempo
desde o reforamento anterior.

esquemas. Na Fig. 7-8, a probabilidade de reforamento para uma resposta dada em


funo do intervalo ps-reforamento para cinco dos esquemas que consideramos.
(Devemos notar, entre parnteses, que um acordo universal sobre qual a melhor repre
sentao de esquemas ainda no foi conseguido entre os pesquisadores neste campo. Ao
consultar a literatura, o estudante avanado deve, assim, estar preparado para encontrar
outras maneiras de conceituao dos procedimentos deste captulo e do Captulo 8 ).
A tareia de descrever ou especificar um vasto nmero de procedimentos de refora
mento em termos de poucas variveis manipulveis um de dois problemas relacionados
na anlise terica de esquemas. O outro problema est na explicao de como os
esquemas geram seus efeitos caractersticos na taxa de resposta. Skinner (1953) salientou
que os esquemas so apenas maneiras aproximadas de reforar taxas de resposta. Isto .

- 152-

os esquemas trequentemente so programados de modo a liberar reforamentos numa


ocasio cm que o indivduo, provavelmente, estaria respondendo como um certo tipo de
taxa, alta ou baixa, dependendo do esquema particular, Dc acordo com a lei familiar do
fortalecimento operante, o comportamento que ocorre imediatamente antes do refora
mento tem sua probabilidade aumentada ou mantida. Nossa analogia com a concha
levou-nos concluso dc que, num esquema de probabilidade uniforme, por exemplo,
quanto mais alta a taxa dc resposta, tanto mais provvel torna-se um reforamento num
determinado intervalo curto dc tempo. Neste tipo de esquema, ento, uma taxa alta de
resposta frequentemente preceder o reforamento.
Os esquemas de intervalo, logicamente, apresentam, no conjunto, uma contigurao
diferente. Nestes, admitindo-se que o organismo responda pelo menos uma vez por
intervalo, taxas mais altas no aumentam a probabilidade do reforamento. Isto porque o
restabelecimento da contingncia dc reforamento no intervalo independente do com
portamento do animal. Ela estabelecida por um relgio no caso de um esquema IF, e
por um contador Geiger ou outra fonte aleatria no caso do esquema IR.
Nada que o animal faa pode apressar a liberao do reforamento. De fato, quanto
mais tempo o organismo esperar antes dc responder, maior a probabilidade de refora
mento quando finalmente ele responder. Num esquema IF por exemplo, a probabilidade
de reforamento c igual a 1 /se o organismo esperar todo o perodo de IF^ antes de
responder (veja o painel IF, Fig. 7 -8 ). Essas relaes entre esperar c, ento, responder,
sugerem que os esquemas dc intervalo agem dc modo a retardar a taxa dc resposta.
7.4

OS EFEITOS DO REFORAMENTO INTERMITENTE NA RESISTNCIA


EXTINO

O
reforamento intermitente, quando comparado ao crf, leva a um aumento substan
cial na resistcncia extino da resposta selecionada. Assim,os esquemas de reforamento
fornecem uma tcnica importante para aumentar a persistncia comportamental. Depois
do reforamento contnuo da presso barra ou do bicar uma chave, a curva tpica de
extino alcana os critrios dc extino comumente empregados por volta de uma hora,
durante a qual, na maioria dos casos, apenas poucas centenas de respostas so emitidas.
Por outro lado, na Fig. 7-9, os registros dc um animal aps uma histria dc intervalo
varivel .(IV) dc reforamento indicam que uma assntota de mais que 3.000 respostas
esl sendo gradualmente alcanada depois dc 8 horas.

Figura 7-9. Fxtino aps IV (Skinner 1 5 0 )


- 153-

Os esquemas de probabilidade uniforme de reforamento tambm produzem maior


resistncia extino do que crf. Um experimento feito por Weinstock (1954) dizia
respeito extino do comportamento aps valores diferentes de probabilidade de reforamento no treinamento. Um aparelho com uma pista, semelhante ao visto na Fig. 7-10
Porta que fecha

foi empregado. Em tal aparelho, um animal colocado na caixa de partida, a porta


aberta no momento apropriado e um cronmetro comea a funcionar. Quando o animal
entra na caixa objetivo, onde pode encontrar alimento, o cronmetro para e o animal
removido quando se deseja. Essa seqncia de eventos chamada uma tentativa. Uma
vez que a tntativa realmente continua at que o animal, finalmente, v at a caixa
objetivo, a freqncia de resposta no uma medida adequada do comportamento
nestas circunstncias. O tempo que gasto para o animal ir do incio at a caixa
objetivo, todavia, relevante e facilmente mensurvel. Essa medida um caso do que
chamaremos tempo de reao. Ela contm certas similaridades com a latncia, uma vez
que o tempo entre uma mudana ambiental (a porta aberta) e uma
resposta
(entrada na caixa objetivo). Mas, a latncia reservada para uma descrio de
respondentes e o tempo de reao reservado para a descriao de operantes
Weinstock (1954) treinou 4 grupos de ratos a correrem num aparelho similar ao da
Fig. 7-10. A cada grupo foi dada uma de quatro probabilidades fixas diferentes de
encontrar alimento na caixa objetivo, p - 1,0: 0,8; 0,5 e 0,3. Assim, o grupo 1,0 encon
trava alimento em cada tentativa (crf), o grupo 0.8 encontrava-o em 80? das tentativas, c
assim por diante. Depois que todos os animais haviam sido treinados a correr, aparente
mente, na sua velocidade mxima, iniciou-se a extino, retirando-se o alimento da caixa
objetivo. Apenas uma tentativa era efetuada por dia. Os resultados indicam que o grupo
1,0 foi o mais rpido para extinguir, isto , aps poucas tentativas(4 ou 5), esses animais
passaram a gastar muito tempo para atravessar a pista, se que chegavam a faz-lo. A
ordem da extino seguiu a ordem inversa da probabilidade. Quanto menor a probabili
dade, mais tempo persistiu o comportamento condicionado de correr. O grupo 0,3 foi o
-154-

que levou mais tempo para que seu comportamento de correr fosse enfraquecido pela
extino. Na faixa das probabilidades pesquisadas, portanto, a diminuio da probabili
dade de reforamento aumentou a resistncia extino, medida pela volta da veloci
dade do correr ao nvel operante. Note que esta proporcionalidade inversa no pode ser
mantida abaixo de algum valor mnimo de probabilidade porque, se a probabilidade de
reforamento se torna muito pequena (aproximando-se de 0 ), o fortalecimento original
ser impossvel.
Por que as contingncias intermitentes aumentam a resistncia extino? Uma
explicao prende-se observao de que, depois de uma histria de reforamento inter
mitente, a extino no parece muito diferente do procedimento de fortalecimento real.
Durante um reforamento intermitente de qualquer tipo, ocorrero perodos de extino
quando nenhum reforamento estiver disponvel para a resposta. Nesse sentido, toda a
histria de reforamento intermitente do animal lhe diz que um perodo de extino
leva, eventualmente, ao reforamento. Na verdade, o esquema ensinou perseverana ao
animal.
7.5 OUTROS EFEITOS COMPORTAMENTAIS DO REFORAMENTO INTERMI
TENTE
/
Os esquemas de reforamento so, obviamente, procedimentos que manipulam taxas
de resposta. bastante surpreendente que a maioria de nossas informaes sobre seus
efeitos comportamentais seja derivada de anlises de taxas de resposta durante e em
seguida exposio a eles. Ainda assim, vlida a questo de como tais procedimentos
afetam a constelao total de comportamentos de um indivduo. Uma resposta parcial
poderia ser na forma de proposies que descrevem como os esquemas afetam proprie
dades do comportamento tais como a topografia da resposta, a magnitude da resposta a
ordem seqencial do responder, etc.
Lane e Shinkman (1963) estudaram os efeitos de um esquema IVsobre a amplitude
e durao do p ia r no pinto.
Este operante foi inicialmente fortalecido pelo refora
mento de cada piar no pinto, por um pintinho faminto, com uma breve apresentao de
alimento. Seguindo-se esse treino, o piar foi reforado intermitentemente num esquema
de IV 100 segundos. Na fase final do experimento, o piar foi extinto. Os resultados
mostraram que a durao e amplitude da resposta de piar eram altamente estereotipadas
durante o crf, tomando-se significativamente mais variveis durante o procedimento IV
Mas a extino produziu um nvel ainda mais alto de variabilidade nas medidas das
respostas.
Quando a durao da presso barra de um rato foi analisada sob esquemas de
probabilidade uniforme, notou-se que ela era extremamente estereotipada sob crf, algo
mais varivel durante contingncias de probabilidade uniforme e extremamente varivel
na extino (Millenson, Hurwitz e Nixon, 1963).
Os dados parecem apoiar a generalizao de que a variabilidade de comportamento
parece aumentar progressivamente sob condies de crf, esquemas intermitentes e extin
o, nesta ordem.
7 6 ESTADOS ESTVEIS DO COMPORTAMENTO
Na maior parte de nossa anlise precedente do comportamento, enfatizamos a impor
tncia de certos procedimentos comportamentais e dos processos comportamentais carac

-155-

tersticos associados a eles. Desta maneira, examinamos os processos de condicionamento


Pavloviano e operante e da extino. Neste captulo vimos que os estados transitrios
que so os produtos iniciais da exposio a esquemas de reforamento constituem um
conjunto distinto de processos comportamentais. Embora tais processos sejam impor
tantes no estudo do comportamento, seus pontos finais so, pelo menos, de igual impor
tncia. Assim, um reforador definido tanto em termos de sua capacidade de manter
0 compoitamento nos padres caractersticos do esquema como em termos de sua capa
cidade de aumentar as taxas de respostas durante o processo de fortalecimento operante.
A manuteno do comportamento por contingncias intermitentes aproxima-nos dos
nossos prprios comportamentos cotidianos, muitos dos quais foram fortalecidos ou
adquiridos no passado remoto e mantidos, da em diante, por reforamento intermitente.
No laboratrio, esta manuteno permanente do comportamento pode ser melhor
descrita pelos chamados estados estveis. As medidas comportamentais atingem estados
estveis ao final de seu processo' ou aspecto transitrio. Por exemplo, as curvas da
sesso 144 da Fig. 7-3, provavelmente, representam um estado estvel do comportamento
sob as contingncias de IF Similarmente, as curvas de IV da Fig. 7-5 parecem ser
representativas do desempenho final nesses tipos de esquemas. Um esquema IV ou IR
pode gerar taxas estveis moderadas de resposta por longas sesses, dia aps dia, indefini
damente.
O fato de que os esquemas podem levar a estados estveis de comportamento, que
podem ser mantidos indefinidamente, sugere que esses estados podem servir como
linhas-base adequadas, a partir das quais pode-se avaliar os efeitos de numerosas variveis
sobre o comportamento. A noo de uma linha-base bastante familiar. O nvel operante
foi usado como linha-base para determinar se o fortalecimento de uma resposta ocorreu.
Podemos usar um desempenho que est sendo mantido no momento por um esquema
como uma linha-base. Em captulos posteriores, os efeitos das mudanas de estmulo,
contingncias interpoladas e de outros procedimentos em tais linhas-base ajudaro a
definir muitos conceitos psicolgicos importantes. Como uma ilustrao da tcnica geral,
devemos nos contentar, no momento, com uma demonstrao do efeito de uma droga
tranquilizante sobre o comportamento estvel. Dews (1955) estudou o efeito do pento
barbital no responder estvel de pombos em IF Depois de ter exposto os pombos s
contingncias IF 15 minutos o bastante para o surgimento de um padro estvel, Dews
injetou pequenas quantidades de droga nos animais durante certas sesses. Observou,
ento, os efeitos no padro de IF Neste experimento, a varivel independente foi a
quantidade de droga injetada e a varivel dependente foi a mudana no comportamento a
partir do estado normal cm IF (ver Figs. 7-2 e 7-3). Para estar certo de que qualquer
efeito observado pudesse ser atribudo apenas droga e no ao distrbio causado pela
propria injeo, uma soluo salina foi injetada nos animais em outras sesses At um
certo nvel de concentrao de droga, Dews no observou efeitos no comportamento o
desempenho continuou semelhante aquele sob o IF normal. Com concentraes acima de
1 mg de pentobarbital, ocorreu uma mudana significativa. A taxa total foi reduzida em
cerca de 75%, e a ondulao caracterstica do IF foi praticamente perdida, sendo substi
tuda por uma taxa de resposta constante e muito baixa atravs do intervalo fixo.
Este um exemplo relativamente simples dc uma sub-areada cincia do compor
tamento aplicada muito ampla e em expanso, conhecida como psicofarmacologia o
estudo da ao de drogas no comportamento. Muitas firmas farmacuticas mantm atual
mente laboratrios comportamentais exclusivamente para o estudo dos eteitos de novas
-156-

drogas no comportamento animal. Na explorao de uma nova droga, muitas linhas-base


devem ser usadas. Uma droga no afetar todos os padres de comportamento da mesma
forma. At aqui, no mencionamos muitos estados de lnha-base, mas os seguintes pro
cessos que estudamos terminam em estados estveis estatsticos, que podem ser usados
como linhas-base:
L
2.
3.
4.
5.
6.

Esquemas de intervalo
Esquemas probabilsticos
Condicionamento e extino sucessivos
A prpria extino
A seqncia comportamental vista em elos simples de comportamento
A topografia e magnitude do comportamento sob crf.

REFERNCIAS PARA O CAPTULO 7


Brandaucr, C. M. The effects of uniform probabilities of reinforcement
on the response rate of the pigeon. Unpublished doctoral disserta
tion, Columbia Univer.,/1958.
Cumming, W. W., and Schpenfeld, W. N. Behavior under extended ex
posure to a high-value fixed interval reinforcement schedule. /. exp.
Anal. Behav., 1958, 1, 245-263*.
Dews, P. B. Studies on behavior. I. Differential sensitivity to pentobarbital
of pecking perform ance in pigeons depending on the schedule of
reward. J. Pharmacol, exp. Ther., 1955, 113, 393-401.
Ferster, C. B., and Skinner, B, F. Schedules of reinforcement. New Y ork:
A ppleton-Century-Crofts, 1957.
Holland, J. G. H um an vigilance. Science, 1958, 128, 6 1-67.
Lane, H. L., and Shinkman, P. G. Methods and findings in an analysis
of a vocal operant. J. exp. Anal. Behav., 1963, 6 , 179-188.
Millenson, J. R. Random interval schedules of reinforcement. J. exp.
Anal. Behav., 1963, 6 , 437-443.
Millenson, J. R., Hurwitz, H. M. B., and Nixon, W. L. B. Influence of
reinforcement schedules on response duration. J. exp. Anal. Behav.,
19ul, 4, 243250.
Sidley. N. A., and Schoenfeld, W. N* Behavior stability and response
rate as functions of reinforcement probability on random ratio
schedules. J . exp. Anal. Behav., 1964, 7, 281-283.
Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950,
57, 193-216.
~
Skinner, B. F. Science and human behavior. New Y ork: M acmillan, 1953.
Weinstock, S. Resistance to extinction of a running response following
partial reinforcement under widely spaced trials. J . comp, physiol.
Psychol., 1 9 5 4 ,4 7 ,5 1 -5 6 .

- 157-

Captulo 8 A ESPECIFICAO DA RESPOSTA

Nas sees precedentes, limitamos nossa anlise sobre a modificao comportamental


quelas mudanas dos comportamentos que j existiam com alguma fora maior que zero
antes do condicionamento. Agora o momento de abandonar esta restrio simplificadora e arbitrria do paradigma de condicionamento operante, verificando como um novo
comportamento, no existente antes no repertrio do indivduo, adquirido. Antes de
proceder ao estudo deste processo de aquisio, entretanto, necessrio uma explicao
adicional do termo resposta operante e seus componentes.
8.1 A DEFINIO DE CLASSES DE RESPOSTA
Uma das razes pelas quais a cincia do comportamento demorou a se desenvolver,
baseia-se na prpria natureza de seu objeto. Ao contrrio do tecido renal, cristais jde sais,
baterias, o comportamento no pode ser facilmente retido para observao. Em vez disso,
os movimentos e aes dos organismos parecem fluir numa corrente contnua, sem incio
e fim definidos. Quando um rato se move da frente para o fundo de sua gaiola, quando
voc dirige seu carro 400 km sem parar, quando voc prega um boto, difcil identificar
pontos na correnie comportamental contnua, onde as unidades naturais do comporta
mento possam ser consideradas fracionadas. Uma complicao adicional que noh
duas aes de um organismo que sejam exatamente iguais, porque nenhum comporta
mento repetido exatamente.
O problema da conceituao das unidades fundamentais de uma corrente comporta
mental contnua, no repetitiva, baseia-se na prpria estrutura da cincia. Para submeter
o comportamento a uma anlise cientfica isto , de modo a ser possvel prediz-lo e
control-lo precisamos dividir nosso objeto de estudo de tal modo que alguma coisa
fixa e reproduzvel possa ser conceituada. Os mtodos da cincia so reservados para
eventos reproduzveis. Tanto o termo evento como seu qualificador reproduzvel so
conceitos cientficos bsicos. Temporais, cargas eltricas, fluidos, molculas, planetas,
instituies sociais, etc; so a matria prima das cincias. Embora dois temporais e dois
governos democrticos no sejam exatamente iguais, necessrio agrupar eventos seme
lhantes, embora no idnticos, numa nica classe e cham-los temporais ou governos
democrticos . Atravs do uso de tais artifcios, no somente a meteorologia e a cincia
poltica, mas todas as cincias, estabelecem conceitos em termos dos quais se enquadram
- 159 -

suas leis, generalizaes e, previses. A conceituao dc comportamento em termos de


tais classes, anlogas aos conceitos de classe dc outras cincias, , assim,
uin
pr-requisito para uma cincia do comportamento capaz de
descobrir leis, fazer
generalizaes e previses.
Em se tratando do comportamento, podemos algumas vezes iniciar, classificando
numa nica categoria um conjunto de comportamentos que so correlacionados com o
mesmo estmulo. Assim, podemos observar as flexes sucessivas da perna, em resposta a
um toque bem definido no joelho e, embora notando suas diferenas, decidir chamar de
resposta patelar classe (conjunto) de todos os movimentos que ocorrem com uma
durao entre os limites de 1/5 a 1 seg. e que caem numa faixa de ngulos ( a ) de 5 a 30
graus (ver Fig. 8-1). Ao admitirmos essa classe, nossa esperana incluir todos, ou quase
todos os comportamentos que esto de fato correlacionados com este eliciador parti
cular. Obtivemos os movimentos sucessivos atravs da eliciao repetida, usando o
mesmo estmulo eliciador com intensidade, durao e localizao fixas, e assim por
diante Embora a classe, que assim formada, parea ser um agrupamento de movi
mentos aparentemente semelhantes, sua definio formal apenas a classe de movi
mentos que ocorre a um dado estmulo.

Figura 8-1. Diagrama esquemtico da faixa de movimentos que inclui todos os compor
tamentos que so chamados Reflexos Patelares .

Tal classe , naturalmente, um respondente e, neste caso, ela define o respondente


patelar.
Para definir estas classes de comportamento, necessrio conceituar certas dimen
ses atravs das quais os comportamentos possam ser descritos e medidos. Da mesma
forma que uma mesa exaustivamente descrita atravs da medida de sua largura, compri
mento, altura, nmero de ps, cor, peso, densidade da madeira, nmero de gavetas e
assim por diante, assim tambm uma amostra de comportamento pode ser exausti
vamente descrita pela medida da posio e. orientao do organismo em referncia a
partes de seu ambiente, os movimentos que esto ocorrendo, o perodo de tempo que
eles preenchem, a intensidade e freqncia com que ocorrem e assim por diante. Mesas
particulares e amostras particulares de comportamento podem, ento, ser descritas por
sua configurao nica de valores dimensionais. Parece, assim, que as classes de mesas e
de amostras comportamentais do tipo X so determinadas pelo estabelecimento de
- 160 -

restries, limites e condies ao longo de certas dimenses, de modo que todas as


coisas que desejarmos chamar mesas e comportamentos do tipo X, respectivamente,
incluir-se-o, com certeza, nessas classes. Assim, as mesas deveriam ter, digamos, um ou
mais ps (uma condio), deveriam ser feitas de material slido, ao invs de lquido ou
gasoso (uma restrio), ter uma superfcie plana (uma restrio), ter um comprimento
maior que 30 cm e menor que 35 m (um limite), e assim por diante. Da mesma forma, os
comportamentos do tipo X poderiam incluir, digamos, qualquer movimento para baixo
(uma restrio) do brao esquerdo (uma condio) que esteja entre 15 a 100 gramas de
fora (um limite) e que no exceda a 1/2 seg. de durao (uma restrio) e assim por
diante.
Mencionamos exemplos de dimenses do comportamento tais como posio,
durao e fora da resposta, em sees anteriores. Essas dimenses foram usadas para
descrever a variabilidade de comportamento no nvel operante, fortalecimento, extino
e esquemas de reforamento. Algumas dimenses como posio, ngulo, localizao e
orientao do comportamento so chamadas dimenses topogrficas, uma vez que uma
relao de seus valores em qualquer momento determinado especificar a forma exata do
comportamento. A especificao do valor dessas dimenses, em qualquer momento
determinado, d o tipo de informao fornecida por uma fotografia do organismo surpre
endido em ao. Tendo apreendido a forma esttica do comportamento atravs das
variveis topogrficas, podemos usar as dimenses dinmicas tais como a velocidade,
fora, durao e taxa de repetio do comportamento para descrever, ainda mais, uma
amostra particular do comportamento. Em princpio, uma amostra de comportamento
poderia ser completamente descrita por uma especificao dos valores de todas as
dimenses pertinentes ao comportamento. Esta descrio, em relaio a uma e-xplicao
mais completa, estaria, sem dvida, precisamente na mesma relao que h entre um
instantneo e um filme. Na prtica, uma descrio exaustiva do comportamento rara
mente tentada. Quando a topografia ou forma de interesse principal, deve-se recorrer
ao uso de dispositivos para fotografar o comportamento, mas uma anlise quantitativa de
uma ou duas dimenses comportamentais representativas ser, em geral, preferida. No
caso do reflexo patelar, a especificao da classe de comportamento em termos de apenas
duas dimenses parece suficiente para uma aproximao adequada. Uma dessas
dimenses constitui o ngulo da perna em relao posio de descanso; a outra
dimenso a durao do movimento. Em geral, a especificao experimental de um
fragmento do comportamento nunca mais que parcial, sendo que os valores de muitas
dimenses ficam indeterminados.
Para formar as classes ou unidades para expressar as leis, generalizaes e previses
do comportamento emitido, uma estratgia diferente daquela usada para definir respon
dentes deve ser adotada. No comportamento no eliciado, podemos iniciar pela definio
de um conjunto algo arbitrrio de comportamentos que preenchem certas restries e
condies e que caem dentro de certos limites ao longo das dimenses especificadas da
resposta. Nossos critrios originais para agrupar certas amostras de comportamento
podem estar baseados em pouco mais do que a observao superficial de que o conjunto
de comportamentos, que cai no que descrevemos como tipo X, poderia ser uma classe de
algum interesse. Tendo formado essa classe arbitrria, deve-se solicitar agora - no um
eliciador, porque no existe um - mas um reforador, para a confirmao de que a classe
que arbitrariamente selecionamos funcionar realmente como uma unidade. Isto , pros
seguimos aplicando a operao de reforamento em fragmentos sucessivos do comporta
- 161 -

mento tipo X, como definido. Cada membro da classe ser, sem dvida, um pouco
diferente de qualquer outro e, por essa razo, chamado uma variante. Preparamo-nos
para tais diferenas ao especificar os limites (e no valores exatos) dentro dos quais
reforaramos. Se o reforamento, agora, afeta o comportamento de modo a fortalecer
seletivamente uma classe de comportamentos, estamos certos ao referirmo-nos a esta
classe como uma classe de resposta operante, ou mais simplesmente como um operante.
Considere alguns exemplos. Poderamos definir os limites de uma certa classe de
movimentos e tentar reforar todos os movimentos dentro dos limites. O reforamento
de uma classe de extenses do brao ocorre nos movimentos de pegar. As palavras so
exemplos proeminentes da formao de classes arbitrrias de resposta. Todos os sons que
caem dentro de certos limites aceitveis (portanto, so produzidos pela ao muscular
dentro de certos limites aceitveis), constituem as palavras faladas "por favor". Quando
uma criana enuncia e pronuncia as palavras corretamente (isto , emite uma variante que
cai na classe desejada), o reforamento liberado e a classe de movimentos que produz
por favor fortalecida.
Na natureza, parece pouco provvel que o reforamento seja sempre contingente
um conjunto restrito de limites do modo descrito acima. No laboratrio, o reforamento
poderia ser tornado contingente a um subconjunto restrito de comportamentos definidos
pelas limitaes dimensionais. Mas, mesmo a, as unidades so estimadas de modo mais
geral, classificando juntos todos os movimentos que atuam, pelas leis da mecnica
simples, para produzir uma mudana especfica no ambiente. Portanto, todos os movi
mentos que pressionam uma barra, ou um disco, ou uma chave telegrfica, ou que
conduzem um rato do incio ao fim de uma pista, giram uma roda, ou colocam acar
numa chcara de caf, servem para limitar efetivamente a topografia do organismo de tal
modo que se consegue uma estimativa da classe topogrfica especificada. Isto verdade,
simplesmente porque h limites nas maneiras possveis de se fazer todas essas coisas. Se
construmos nosso aparelho com cuidado, os comportamentos possiveis que poderiam
produzir as mudanas ambientais especificadas sero bastante limitados e, portanto, for
ados a terem uma forma razoavelmente semelhante. (Os comportamentos de enfiar linha
numa agulha so mais limitados que os de fechar uma porta). Na medida em que restrin
gimos nossas dimenses, os comportamentos que constituem a classe tero semelhanas
topogrficas da mesma forma que os respondentes tem naturalmente. Todavia, a nica
exigncia formal para um operante que ele seja uma classe de comportamento susce
tvel, como classe, de reforamento. Se especificamos uma classe que no pode ser

fortalecida ou mantida pelo reforamento de seus membros, tal classe no constitui uma
resposta operante, seus membros no so variantes da resposta e, presumivelmente, no
se presta para o uso no estudo do comportamento operante. Isto verdade se uma
especificao dos limites do comportamento fr feita em termos de limitaes dimensio
nais ou de alguma mudana ambiental necessria que o comportamento deva produzir.
Operantes, ou respostas operantes (respostas, para simplificar, se voc se lembra de que
respostas no significam responder a ), ento, so as classes de comportamento, suscet
veis ao reforamento, que formam as unidades fundamentais de anlise de uma grande
parte das aes humanas c animais.
Na definio de operantes como uma classe de comportamentos sensveis de refora
mento, nenhuma lgica exclui a definio de subclasses ou superclasses de operantes
contidos em
ou que contem
qualquer classe operante particular, previamente
definida. Esta flexibilidade no modo pelo qual os conjuntos comportamentais bsicos
- 162-

podem ser subdivididos em conjuntos menorjs, ou combinados para formar conjuntos


maiores, ser de grande importncia quando examinarmos os limites extremos aos quais
os conceitos de operante podem ser estendidos. Portanto, a definio de um operante,
em si mesma, no coloca qualquer restrio 3obre a amplitude de uma classe de resposta,
em termos da quantidade de comportamento abrangida por ela. Como veremos na seo
8.5, classes que consistem de contraes musculares muito breves para serem observveis
pelo sujeito que as emite, podem vir a funcionar como operantes. No outro extremo,
seqncias longas de aes parecem funcionar como classes nicas de operantes. Sob
algumas condies, ser possvel falar de tricotar um suter, escrever um livro, ou caminhar
para o trabalho, como operantes. Extenses do conceito de operante a tais operantes de
grande escala s agora esto sendo exploradas no laboratrio.
8.2

UMA DEFINIO DE RESPOSTA OPERANTE EM TERMOS DA TEORIA DOS


CONJUNTOS

Uma definio alternativa do operante, compatvel com a exposio precedente,


iOrnecida, aqui, na notao da teoria dos conjuntos (ver seo 8.9).
Considere o conjunto de todas as amostras de comportamentos possveis.

U
Neste conjunto U, vamos definir o subconjunto de comportamentos, B, que est dentro
dos limites preestabelecidos La Lb, Mc - Md,-- , e tem restries ou condies tais
que a forma do comportamento deve ser N, O, ..., onde as letras maisculas L, M, N, O,
significam as dimenses do comportamento e os ndices especificam os limites supe
riores e inferiores dessas dimenses. Ento, este subconjunto pode ser representado por

Como um meio alternativo de definir B, podemos considerar todos os comporta


mentos que completam um determinado resultado ambiental, S, para constituir o sub
conjunto B.
Considere uma tentativa de reforar amostras sucessivas do subconjunto B. Se o
fortalecimento dos membros do subconjunto, R, de comportamentos, agora, ocorre
( como evidenciado por um aumento seletivo na sua freqncia, uma mudana na sua
ordem seqencial em relao a outros comportamentos, e assim por diante), ento, este
subconjunto R ser conhecido como um operante e os membros observados de R sero
identificados como variantes da resposta operante. Se nenhum fortalecimento de um
subconjunto R ocorre, ento B c considerado apenas um subconjunto especfico de
comportamentos, destitudo de importncia emprica para a anlise do comportamento.
Dado um operante R, possvel definir um subconjunto, r, tal que cada membro em
r seja tambm um membro de R.
- 163-

Na prtica, pude-se verificar que muitos desses subconjuntos r ^ r j podem ser operan
tes em si mesmos, pela definio anterior. Desde que, todavia, a definio de um
operante depende de se observar o fortalecimento pelo reforamento e desde que o*
fortalecimento definido em relao a outros comportamentos (ver seo 4.4), o limite
at o qual o fracionamento e/ ou subdiviso da classe R pode ser ampliado estabelecido
pelo ponto no qual no possvel fortalecer um dado subconjunto ri sem igual fortaleci
mento de qualquer outro ij. Evidentemente, isto determina o limite inferior da definio
de uma classe de operante.
Uma operao oposta admissvel. Dado o operante R, possvel descobrir (ou
criar) um superconjunto R de ordem superior, que contm todos os membros de R, alm
de outros comportamentos.

\ssim, embora os movimentos para pressionar uma barra possam funcionar como um
operante, os movimentos de pressionar uma barra vinte e cinco vezes podem funcionar
como um operante de orc1em superior, R. Da mesma forma, os movimentos de pressionar
uma barra, seguidos pelos movimentos de puxar uma corrente, podem funcionar como
um operante de ordem superior. Novamente, os limites aos quais os operantes podem ser
estendidos dessa maneira so estabelecidos apenas pelos limites da suscetibilidade com
portamental ao reforamento.
8.3 O PARADIGMA DA DIFERENCIAO
O reforamento exclusivo daqueles fragmentos de comportamento que esto dentro
dos limites e que tm as restries e condies estabelecidas pelas dimenses comporta mentais conhecido como o procedimento de diferenciao de resposta. Assim, o forta
lecimento de comportamentos tais como bicar o disco por pombos, pressionar a barri
por ratos, pegar os brinquedos pela criana, envolvem diferenciao de resposta. O que
chamamos at aqui de fortalecimento operante um caso especial de diferenciao .de
resposta. Para avaliar os vrios aspectos quantitativos da diferenciao de resposta, til
examinar um caso em que a especificao da classe comportamental a ser reforada
feita cm termos de uma nica dimenso comportamental.
Na definio do pressionar a barra por um rato, a fora mnima requerida para que a
barra seja pressionada pode quase sempre ser especificada. Essa fora mnima um
exemplo do limite inferior de uma dimenso comportamental. Se a fora mnima fr
bastante baixa, o nvel operante dc pressionar a barra ser maior que zero e o fortalecl-

- 164-

(A)

1
^3

17

21

25

29

33

37

1l

1i

21

25

29

33

37

41

45495357

(B)

13

17

41

45

49

53

57

Intensidade das presses, em gramas


Figura 8-2. Distribuio de fora de resposta, quando todas as foras acima de
21g (A) e acima de 36 g (B) eram reforadas ( segundo Hays e Woodbury, cita
do em Hull, 1943).

mento da classe operante de pressionar a barra proceder exatamente como descrito no


Capitulo 4. Hays e Woodbury (citados em Hull, 1943) realizaram um experimento de
fortalecimento semelhante, empregando uma fora mnima de 21 gramas. Depois que o
processo de fortalecimento havia estabilizado, eles obtiveram respostas distribudas ao
longo da dimenso fora, como visto no histograma superior da Fig. 8-2. A Fig. 8-2A
mostra nada mais que a variabilidade familiar que caracteriza o comportamento, mesmo
quando este reforado em condies de crf.
Em (A), as foras emitidas esto distribudas quase simetricamente em torno de um
ponto cerca de 8 g acima do limite inferior da classe de resposta operante. Note que
poucas presses (representadas por crculos vazios na Fig. 8-2) no alcanam adequada
mente o critrio de uma resposta e, portanto, no so reforadas. Quando os experimentadores estavam convencidos de que a Fig. 8-2 representava o estado final estvel do
comportamento sob suas condies, eles aumentaram a fora mnima requerida para 36 g
O resultado dessa mudana na classe de resposta foi o ajustamento do comportamento
do rato mostrado no histograma da Fig. 8-2B. A distribuio de foras deslocou-se para
os valores maiores e centralizou-se em aproximadamente 41-45 g. O condicionamento
desta nova classe de comportamento foi bem sucedido; a condio necessria para
conferir classe o 'status' de uma resposta operante foi alcanada. Houve uma outra
conseqncia importante desse condicionamento. Novas foras emitidas, nunca antes
vistas no repertrio do animal (aquelas alm de 45 g), ocorrem agora com freqncia
moderada.

- 165-

O procedimento dc diferenciao resultou no aparecimento e estabilizao de um


conjunto de novos comportamentos. Como isto ocorreu? Dois processos com piemen ta
res parecem ser responsveis. Primeiro,observe que, no momento em que foi colocada em
efeito, a nova condio de 36 g incorporava algumas foras existentes (veja a extremidade
direita da Fig. 8-2A). Esperar-se-ia que o fortalecimento desses comportamentos com
foras maiores que 36 gramas os manteria. Se esta condio no tivesse sido alcanada,
quase que certamente teria ocorrido a extino normal. Ento, em segundo lugar, o
mnimo de 36 g excluiu muitas foras anteriormente reforadas. Quando presses barra
com essas foras anteriormente reforadas foram emitidas sob o procedimento de 36 g no
mnimo, elas foram extintas. Lembre-se que um dos resultados do procedimento de
extino um aumento na variabilidade do comportamento (seo 5.2). A extino das
foras de 21-36 gr anteriormente reforadas, tenderia, assim, a produzir novas foras,
tanto superiores quanto inferiores quelas usualmente emitidas.A emisso de foras muito
baixas no teria conseqncias no experimento presente, mas a emisso de foras muito
altas teria conseqncias reforadoras e, logo, seria fortalecida. Eventualmente, esses dois
processos ( 1 ) extino diferencial e ( 2 ) fortalecimento diferencial que interagiam ao
longo da dimenso fora, conduziram estabilizao comportamental na forma do histograma (B) da Fig. 8-2.
A extino teve um papel duplo, crucial nessa diferenciao de presses barra mais
fortes. (1) Agiu de modo a trazer novas e excepcionais variantes da resposta, algumas das
quais com possibilidades de serem reforadas. (2) Agiu de modo a enfraquecer o compor
tamento ao longo da poro da dimenso onde o reforamento havia sido suspenso.
Como outros paradigmas comportamentais, a diferenciao tem uma definio
completa apenas na especificao de seu dado, procedimento, processo e resultado.
DADA:
PROCEDIMENTO:

PROCESSO:

RESULTADO:

uma classe de comportamento sendo emitida com alguma


fora maior que zero.
aplicar o reforamento a* um subconjunto de variantes
dessa classe e submeter o resto ao procedimento de
extino.
fortalecimento gradual das variantes reforadas e o
e n fraq u e cim e n to gradua! do grupo dc variantes
submetidas a extino.
uma distribuio estabilizada das variantes reforadas cuja
fora excede aquela das variantes no reforadas.

O procedimento de diferenciao no precisa ser necessariamente aplicado como o foi no


experimento de Hays-Woodbury. Tudo o que necessrio, pela nossa definio, que um
subconjunto de variantes seja reforado e um segundo subconjunto extinto e que,juntas,
essas duas possibilidades esgotem todas as variantes. Na Fig. 8-3, vrias possibilidades so
vistas esquematicamente. Somente (A) corresponde ao caso de Hays-Woodbury.

Lxcrccio 5.
Prediga os efeitos do procedimento de diferenciao aplicado, da manei
ra mostrada, em cada um dos casos da Fig. 8-3, esboando novas distribuies de vari
antes da resposta.
- 166 -

Dimenso comportamental
Figura 8-3. Algumas aplicaes possveis de reforamento e extino
a variantes de R. As regies reforadas esto sombreadas.

Um caso semelhante au da Fig. 8-3D foi descrito por Keller e Schoenfeld (1950).
Uma mquina de jogo foi modificada para permitir uma medida precisa de quanto o
mbolo era puxdo antes de ser solto. Variaes nos limites inferiores superiores da
resposta foram exploradas e o reforamento para as variantes corretas era um 1flash?'de luz
aps a liberao do mbolo. Pode-se selecionar uma faixa de variantes qual os refora
mentos sero aplicados, to estreita que um fortalecimento seletivo dessa faixa particular
no obtido. Pelo contrrio, as variantes mais prximas da faixa de reforamento
manter-se-o com foras iguais 'aquelas da faixa reforada. Nessa situao, o experimen
tador atingiu as restries mnimas para a definio de uma classe de resposta. Acima
desses limites, os resultados confirmam, todavia, a lei: tudo o que reforado tambm
fortalecido.

Herrick (1963) projetou a barra vista na Fig. 8-4 para estudar o deslocamento da
presso barra. As presses realizadas por um rato moviam uma barra em T descrevendo
um arco, enquanto um circuito eletrnico registrava o deslocamento mximo de cada
presso. A distncia mxima que a barra percorria em cad.: presso foi classificada em
uma de oito zonas. A barra foi planejada de um modo que, quanto maior o nmero da
zona, maior a quantidade de trabalho exigida do rato.

Figura 8-4. Barra usada para estudar o deslocamento da resoost*

Num experimento, Herrick (1964) primeiro reforou as presses includas em qualquer


zona de 1 a 8 . Os resultados de um rato so vistos na Fig. 8-5A. Uma ampla faixa de
deslocamentos foi obtida. A faixa das posies reforadas foi, ento, progressivamente,
limitada. Quando somente as posies 3-6 eram reforadas, obteve-se o histograma da
Fig. 8-5B. A distribuio dos deslocamentos foi um pouco mais estreita; no obstante, o
rato manteve a maior parte de suas presses dentro dos limites reforados. Mais alm, nas
sries experimentais, os nicos deslocamentos reforados foram aqueles na zona 5. Os
resultados so vistos na Fig. 8-5C. As presses na faixa reforada foram muito freqentes
mas ocorreram numerosas presses nas zonas no reforadas. Um efeito interessante visto
no histograma da Fig. 8-5B que as zonas prximas dos limites inferiores de refora
mento (zonas 3 e 4) incluem mais
comportamentos do que as zonas prximas dos
36

18

r-n
1 2

(A)

co 54
36

18

E
0>

1 2

4
(B)

(C)
Zona da barra
I'igura 8-5. Distribuio dos deslocamentos da barra em funo do tamanho da regio reforada. s
sombreadas do histograma indicam as zonas da barra nas regies reforadas (segundo Herrick, 1964)

- 168-

limites superiores da zona de reforamento (zonas 5 e 6 ). Este fenmeno pode ser


interpretado como uma tendncia do rato de dlspender menos esforo : dadas duas
zonas de reforamento, aquela que exigir a menor condio de trabalho ser a mais
fortalecida.
8.4 APROXIMAO SUCESSIVA

O maior poder do procedimento de diferenciao consiste na sua habilidade para


criar e, ento, manter comportamentos ainda no observados no repertrio do animal.
Este poder estende-se mais alm nos casos em que diferenciaes progressivas e graduais
podem ser feitas no decorrer do tempo. No exemplo de Hays-Woodbury e nos exemplos
da Fig. 8-3, uma diferenciao com um passo foi pretendida. Mas um segundo procedi
mento de diferenciao pode ser feito a partir dos resultados da primeira, e assim sucessi
vamente, de modo a produzir, eventualmente, comportamentos qu podem ser muito
diferentes das formas originais. A menos que a histria de diferenciao sucessiva fosse
conhecida, seria difcil explicar o aparecimento desses comportamentos. Um beb inicia a
vida com um repertrio de todos os sons bsicos usados nas vrias lnguas, mas seu
balbucio e murmrio so muito diferentes da pronncia adulta de uma frase em portu
gus. Ainda mais, o aparecimento de sentenas precedido pelo de palavras, palavras pelo
de sons silbicos e estes so diferenciados a partir da corrente de sons rudes emitidos pelo
recm-nascido. As diferenciaes progressivas e graduais que se fazem sobre os resultados
de cada diferenciao prvia e que, gradualmente, conduzem o comportamento a alguma
forma final desejada, so conhecidas como aproximaes sucessivas do comportamento,
final ou de modo mais simples modelagem do comportamento. O processo represen
tado esquematicamente na Fig. 8 -6 . Pela ensima diferenciao, a distribuio de
variantes obtida parece, para o observador casual, no ter relao alguma com a distri
buio original da resposta. Contudo, as origens da ensima distribuio baseiam-se no
fortalecimento c extino sucessivos dos predecessores dessas variantes. Sem esta histria
causal a distribuio final na Fig. 8-6 nunca teria surgido

Dimenso da R
Figura 8-6. Representao esquemtica de diferenciaes progressivas (aproximaes
sucessivas) ao longo de uma dimenso quantitativa da resposta. As reas sombreadas
representam as variantes reforadas.
- 169-

A diferenciao sucessiva deve ter um limite superior, determinado pela capacidade


do organismo. Mas, dentro dos limites dessas restries de capacidade, a aproximao
sucessiva de uma forma final de comportamento um mtodo extremamente poderoso
para produzir comportamento. Atravs deste processo de aproximao -sucessiva na
dimenso fora da barra, Skinner (1938) foi capaz de treinar um rato de 200 g a realizar
o feito hercleo de pressionar uma barra que requeria o mnimo de 100 g de fora.
Nem a diferenciao nem a aproximao sucessiva esto limitadas a mudanas ao
longo de uma dimenso quantitativa da resposta. Mesmo que a topografia, ou forma do
comportamento seja de difcil mensurao, sua modelagem se d de forma anloga
aproximao sucessiva ao longo de uma dimenso quantitativa. Anteriormente, fez-se
referncia ao operante de bicar o disco do pombo. Essa resposta, quase sempre, tem uma
freqncia igual a zero, no nvel operante e, assim, precisa ser modelada. Neste caso, o
experimentador aproxima-se sucessivamente da forma desejada do comportamento,
iniciando com uma forma que pode se parecer em nada com o bicar uma chave. O
experimentador pode reforar primeiro todos os movimentos do animal que ocorrem na
vizinhana da parede que contm o disco. O efeito deste procedimento de diferenciao
fortalecer os movimentos do animal nas proximidades do disco. Ento, o reforamento
tornado contingente aos movimentos da cabea prximos ao disco. Quando essa contin
gncia tiver tido efeito de aumentar tais movimentos, o reforamento ser condicional ao
tocar o disco com o bico. Neste exemplo, a mudana dos requisitos para o reforamento
combina-se com as mudanas progressivas do comportamento para modelar um novo ato.
O aparecimento do bicar o disco devido a uma histria de diferenciao progressiva de
antecedentes comportamentais remotos, com relao ao,s quais o bicar o disco contm
uma pequena semelhana superficial. este o processo atravs do qual muitas de nossas
prprias habilidades so modeladas. interessante notar que, embora a natureza fornea
muitas situaes de reforamento seletivo (a corrida do coelho reforada somente se fr
bastante rpida para iludir a raposa; a corrida da raposa reforada apenas se fr mais
rpida que a do coelho), parece que a aproximao sucessiva um arranjo de contingncias
estritamente humano. Professores, pais e amigos seguem tal procedimento, embora raras
vezes to sistematicamente como deveria ser. Talvez seja no laboratrio que o maior
poder do procedimento possa ser explorado, porque l que podemos controlar e mank
pular melhor os muitos parmetros, sugeridos pelas Figs. 8-3 c 8 -6 , cujos efeitos no
processo so ainda bastante desconhecidos.
8.5 EXTENSO DO CONCEITO DE OPERAOTE
Uma histria de diferenciao e aproximao sucessiva pode tornar classes de compor
tamento suscetveis ao reforamento, classes estas que, de outra maneira, poderiam
permanecer indisponveis. Neste sentido, os procedimentos de diferenciao e aproxi
mao sucessiva so, adequadamente, considerados mtodos de criar operantes. Estamos
agora em condies de entender porque a maioria dos operantes que observamos fora do
laboratrio, tais como o abrir e fechar portas, dizer por'favor , operar mquinas, assar
bolos, e n v ia r mensagens pelo cdigo morse, chutar bolas de futebol, parecem ter uma
estrutura mais unitria, como se fossem um nico evento, do que sugerimos, anterior
mente, ser caracterstico da corrente de comportamento.O statusde evento desses atos
lhes c o n f e r id o pelo lato de eles serem produtos da diferenciao.Diferencialmente refor

- 170 -

ados, de incio na forma de classes arbitrrias, esses operantes tornam-se unidades fun
cionais atravs da ao do reforamento seletivo de seus membros e extino concorrente
dos membros de todas as outra classes de comportamento.
Uma classe importante desses operantes criados o conjunto cujos membros so cons
titudos de elementos que foram previamente modelados como operantes. No caso mais
simples, o reforamento contingente emisso de n repeties sucessivas de um
operante anteriormente reforado. Esse procedimento especifica um novo operante de
ordem superior, constitudo de n ocorrncias sucessivas da classe de comportamento
anteriormente reforacfa. Quando descrevemos tal operante de ordem superior, referimo-nos aos membros da classe anteriormente reforada que o constituem como seus
seus elementos ( r i , r 2 , r3 , ..., rn). Embora os elementos por si ss constitussem,
inicialmente, classes unitrias de resposta, eles so tratados agora como componentes de
uma classe de resposta de ordem superior (Findley, 1962). A especificao de um
operante em termos de um nmero fixo de tais elementos repetidos conhecida como
operante de Razo Fixa (RF). O termo razo refere-se ao nmero fixo de elementos
repetidos por reforamento. Por exemplo, depois de ter fortalecido o operante de pres
sionar a chave telegrfica num macaco, o reforamento pode ser tornado contingente a
30 presses consecutivas chave telegrfica. Depois de modelar o bicar o disco num
pombo, pode se tornar o reforamento contingente a cada 50 bicadas no disco. Esses
casos so denotados RF 30 e RF 50, respectivamente. Tais operantes de ordem superior,
sendo constitudos de componentes facilmente observveis e experimentalmente criados,
so teis por permitirem uma micro-anlise compreensiva da estrutura do comporta
mento operante. Os elementos dos operantes RF so estudados tipicamente do mesmo
modo que as respostas so estudadas em esquemas de reforamento intermitente. Assim, os
registros cumulativos dos elementos de operantes RF constituem um mtodo de obser
vao das caractersticas temporais de classes de resposta altamente ampliadas.
A transio do reforamento de uma classe que tem somente um elemento para uma
Classe contendo n elementos, representa um tipo de aproximao sucessiva, ao longo da
dimenso do nmero (n) de elementos. Antes de mudar a condio para o reforamento
de um nico elemento para n elementos, no h, todavia, qualquer informao sobre as
variantes acessveis ao longo das n dimenses. O nico valor de n previamente examinado
(reforado) em crf foi sempre 1. Assim, a diferenciao , em grande parte, um problema
de tentativa e erro. Usando o bicar o disco (chave) por pombos, Ferster e Skinner (1957)
foram capazes de passar diretamente de um elemento por reforamento para razes de
reforamento de 40 e 50 elementos sem que a extino ocorresse. Quando a diferen
ciao do novo operante havia estabilizado (umaspoucasdziasdehoras).o padro da taxa
dos elementos era tal que taxas altas e uniformeseram freqentese uma pequena pausa
ocorria depois de cada reforamento. A diferenciao de razes ainda mais altas requer
uma aproximao sucessiva pelo aumento gradual de n. A razo e aumentada de 5 ou 10 c
mantida no novo valor por vrias sesses. Uma curva cumulativa tpica, mostrando-um
desempenho estvel cm RF 120 por um pombo modelado desse modo, vista na Fig.
8-7. A curva mostra a uniformidade marcante do comportamento, no tempo, sob especi
ficaes RF. O reforamento e seguido caracteristicamentc por pausas que duram 5 ou 6
min, depois do que o animal comea a bicar com uma taxa uniforme e alta que mantida
ate o reoramento. A pausa ps-reforamento est relacionada de perto com o tamanho
da razo. Razes grandes so marcadas por pausas longas. Em razes pequenas, a paus;(
pode desaparecer totalmente. O limite superior da diferenciao da razo taivez seja

- 171

desconhecido. Skinner (1957) relata dados de Morse e Herrnstein nos quais um operante
RF contendo 900 elementos foi estabilizado atravs de diferenciao progressiva.

Figura 8-7. Curva cumulativa do bicar a cliave, por um pombo reforado aps cada
120 bicadas (Ferster e Skinner, 1957).

noo de que o procedimento dc razo define um operante dc ordem superior


baseada em estudos que verificaram que este operante, como outros, pode ser submetido a
um esquema de reforamento e mantido indefinidamente nos moldes caractersticos dc
um esquema particular. Ferster e Skinner (1957) reforaram operantes em RF 30 sob um
esquema de probabilidade uniforme. Isto ,

onde

172

R
= 3 0 bicadas na chave
SA = iluminao normal
S3 = diminuio da iluminao

O fim de uma RF no reforada era sinalizado no experimento de Skinner e Fe rs ter, por


uma breve mudana na iluminao (colchete 3 no diagrama). Probabilidade de refora
mento (p) para o comportamento de bicar a chave em RF 30, de 0,85 ate 0,50, manti
veram o comportamento. Em 0,50, houve quase sempre uma tendnciaparaaocorrncia
de longas pausas entre os operantes RF (no entre os elementos) caracterstica de um
resultado encontrado por Brandauer (1958), que usou valores de p muito pequenos com
um operante mais siipplcs, uma bicada na chave. Uma vez que Brandauer teve que chegar
a probabilidades de 1/600 para obter o efeito que aqui foi obtido com 0,50 parece que a
quantidade de comportamento envolvida num operante modifica sua suscetibilidade a
um esquerna.
A funo que relaciona a resistncia extino ao tamanho da RF recebeu alguma
ateno experimental. RFs grandes podem exigir um trabalho substancial do indivduo e,
por essa razo, pode se esperar que ela acarrete uma menor persistncia, face extino,
do que RFs pequenas. Boren (1961) e Weissman e Crossman (1966) apresentaram dados
que mostram que na faixa entre RF 1 e RF 64, a presso barra em ratos e o bicar a
chave em pombos parecem apresentar tal efeito. Apesar desta diminuio na persistncia
do operante em funo do seu tamanho, muito mais elementos so, na realidade,
emitidos na extino de grandes RFs. De fato, dentro de certos limites, quanto maior a
RF no treinamento, tanto maior ser o nmero de elementos individuais emitidos
durante a extino.
Uma concluso importante segue-se. Sc estamos interessados cm aumentar a persis
tncia do comportamento face extino, a especificao de RF fornece um mtodo
altenativo para um esquema produzir perseverana. Podemos incorporar o comporta
mento como um elemento de um operante RF dc ordem superior.
Em contraste com os operantes de ordem superior criados pela combinao de
elementos que se demonstrou anteriormente serem operantes, Hefferline e Keenan
(1963) pesquisaram um operante miniatura , to pequeno que uma amplificao eletr
nica precisa ser empregada para detet-lo. Essespesquisadores generalizaram, com xito, u
conceito de classe de resposta operante para comportamentos to pequenos em aplitude
que o sujeito, geralmente, no capaz de dizer ter observado suas prprias respostas.
Num experimento, potenciais de contrao muscular do polegar de sujeitos humanos
foram registrados. Eletrodos simulados foram colocados em outros pontos do corpo do
sujeito para desviar sua ateno da resposta do polegar. Os sujeitos eram conforta
velmente sentados em um cubculo triangular, com ar condicionado e prova de som e
eram instrudos, apenas para se relaxarem. Eles foram avisados de que ocorreria refora
mento na forma de pontos, registrados num contador localizado perto deles, e que cada
ponto valeria 5 cents . Mas no foi dito aos sujeitos como eles poderiam produzir os
pontos. Num sujeito, as contraes do polegar que geravam potenciais na amplitude de
25-30 microvolts eram reforadas e, depois, extintas. Os histogramas para os 10 min de
nvel operante, seguidos por 6 blocos sucessivos de 10 min dc fortalecimentQ, seguidos
por 10 min finais de extino, so vistos na Fig. 8-8 . Os histogramas de condicionamento
mostram que o procedimento de diferenciao foi bem sucedido no fortalecimento sele
tivo da classe reforada de comportamento e que os 10 min de extino causaram um
enfraquecimento marcante na classe. Os registros cumulativos da contrao muscular
reforada mostram uma taxa tpica dc aumento da classe reforada, mas - como deve ser
esperado de um operante com dimenses to limitadas
o processo gradual, esten-173-

150 -

2 0 -3 0

150 -

100

100 -

50 0

Extino

__ ,
.

50 1---- 1

10 15 20 25 30 35 40 45

10 15 20 25 30 35 40 45

Microvolts
Figura 8-8. Histogramas de frequncia de respostas para vrias categorias de contraes do
polegar, medidas em microvolts, durante o nvel operante (NO), condicionamento e ex
tino. A categoria reforada est sombreada (Segundo Hefferline e Keenan, 1963).

dendo-sepor 60 minutos de condicionamento. Isto difere, assim, das curvas abruptas de


fortalecimento da presso barra no rato (Fig. 4-2).
Os resultados de Hefferline e Keenan so importantes na nossa anlise do comporta
mento por vrias razes. Primeiro, eles mostram os limites inferiores a que o nosso
conceito de operantes pode ser levado e ainda denotam uma unidade funcional de com
portamento. wSegundo, demonstram que a inabilidade do sujeito para verbalizar as contin
gncias de reforamento de modo algum afeta a regularidade do condicionamento e

-174-

extino. Um terceiro fenmeno emprico tpico do comportamento operante em


geral demonstrado. No operante de contrair o msculo a classe de resposta foi
definida como c o n tra c ts entre 25 e 30 microvolts. Mas uma inspeo mais detalhada
dos histogramas da Fig. 8-8 mostra que as classes vizinhas de comportamento, embora
no realmente reforadas, foram tambm algo fortalecidas. O fortalecimento incidental
induzido em comportamentos que realmente no participam das contingncias de refor
amento chamado induo de resposta. A induo de resposta ocorre durante o fortale
cimento de qualquer operante, mas nem sempre fcil verific-la. Embora o experimen
tador possa desejar limitar o reforamento a uma classe especfica de comportamento, o
fortalecimento pode se estender, atravs de induo, muito alm dos limites estabe
lecidos. Ratos que aprendem os movimentos necessrios para atravessar uma pista
complexa, so capazes de nadar na pista, eficientemente, quando esta est alagada,
embora o nadar requeira um grupo de movimentos bastante diferentes. Aprender a
escrever com a mo direita treina a mo esquerda no usada, embora em grau menor.
Aprender a falar o italiano torna mais fcil aprender a falar espanhol. A induo de
resposta estudada no laboratrio com ajuda do aparelho para desenhar, que inclui um
espelho, visto na Fig. 8-9. O sujeito recebe a tarefa de desenhar uma figura vendo, no
espelho, a imagem desta. Uma vez que as relaes usuais entre mo e olho so invertidas
as primeiras tentativas so reprodues ruins. Gradualmente, o sujeito passa a desem
penhar melhor a tarefa. A induo de resposta pode ser medida em qualquer momento,
no processo de aquisio, testando-se a quantidade de melhora mostrada pela me
esquerda, com a qual o sujeito no praticou.

F ig u ra 8-9. D iagram a e sq u em tico de u m ap a re lh o de d e sen h ar, co m espelho. O su jeito


se se n ta fre n te a u m a estrela que lh e vfsivel so m e n te no espelho (M ednick. 1 964)

-1 7 5 -

8.6 DIFERENCIAO DE TAXA


Ao se considerar os efeitos de certos esquemas de reforamento, recorre-se sempre ao
fato de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com
o reforamento. Assim, esquemas de intervalo randmico tendem a fornecer refora
mento diferencial aps taxas baixas e esquemas de probabilidade uniforme tendem a for
necer reforamento diferencial depois de taxas altas. Uma vez que o efeito do refora
mento fortalecer qualquer que seja o comportamento que vem antes dele, esses
esquemas agem indiretamente no fortalecimento de certas taxas de comportamento. Se
desejarmos, poderemos fazer surgir uma diferenciao maisdireta e invariante pela especi
ficao dos limites, condies ou restries da taxa do operante que deve ser reforado.
No reforamento diferencial de taxas baixas (drl), um operante R primeiro especi
ficado e fortalecido. Quando R tiver sido suficientemente fortalecido, ele tomado um
elemento numa nova especificao de resposta de ordem superior: somente os elementos
de resposta que esto espaados entre si pelo mnimo de uma certa quantidade de tempo
so agora reforados. Assim, o procedimento drl refora um certo comportamento
somente quando precedido de uma pausa. Wilson e Keller (1953) efetuaram este procedi
mento de drl, exigindo que os ratos espaassem suas respostas de presso barra de
determinados retardos mnimos, para que o alimento fosse liberado. A especificao do
tempo mnimo para o operante foi aumentada gradualmente, em passos de 5 seg, de 10
para 30 seg, num perodo de 30 sesses. A Fig. 8-10 mostra que as diferentes pausas
exigidas, estabelecidas pelas especificaes, produziram taxas diferentes de presso a
barra.

Intervalo de Retardo (seg)


F ig u ra 8-10 . T ax a m d ia de presso b a rra , d u ra n te a ltim a sesso, em cad a um dos cin
co v alores d ife re n te s d e um intervalo de r e ta rd o m n im o necessrio e n tr e presses re fo r ad as ( seg u n d o W ilson e K eller, 19 5 3 ).

- 176-

Quando a especificao da pausa do d rl foi aumentada, ocorreu um declnio sistemtico


na taxa dos elementos da presso barra. Outra maneira de dizer isso que, quando se
exige um aumento no retardo, ocorre um aumento sistemtico na durao mdia das
pausas entre as presses barra.
A especificao do d rl um operador poderoso para fortalecer e manter taxas baixas
de algum comportamento especificado. Curvas cumulativas do bicar a chave mantido em
taxa baixa, em pombos, quando somente bicadas precedidas por pausas de 3 minutos ou
mais eram reforadas, so vistas na Fig. 8-11. Atravs de um ajustamento adequado da
especificao do d r l, manteve-se os pombos trabalhando lenta, mas estavelmente, 24
horas por dia, durante dois meses.
O operante de ordem superior fortalecido pelo procedimento drl consiste de
uma topografia bem especificada (por exemplo, uma bicada ou uma presso) precedida
por uma topografia problemente especificada (por exemplo, qualquer coisa exceto uma
bicada ou presso). A classe qualquer coisa exceto , em geral, o suficientimente ampla
para que os sujeitos individuais venham a formar comportamentos idiossincrticos, su
persticiosamente reforados durante a pausa forada Wilson e Keller relatam que cada

F igura 8-11. T ax as de b icar a chave q u a n d o so m e n te b icad as p reced id as p o r um a pausa de


3 m in o u m ais eram re fo r a d a s (S k in n e r, 1957).

rato desenvolveu uma forma de comportamento colateral, facilmente reconhecvel e


previsvel, constituida ritualmente de limpar-se, farejar e andar em vrias partes da
cmara experimental durante os intervalos de retardo.
A especificao do operante drl convenientemente expressada como uma amostra
de comportamento que inclui, por um certo tempo,qualquer comportamento outro que
no o selecionado, seguido pelo comportamento sejecionado. Fm notao de conjunto,
defininmwnicialmente, em U , o operante R. A poro de )J no incluida em R
chamada R e inclui quaisquer comportamentos, exceto aqueles que caem na classe R.
Evidentemente, R e R esgotam o espao comportamental, ]J Sob o d rl, o novo
operante, 0, definido como consistindo de: pelo menos T min de R, + R.

O operante drl foi mantido com sucesso em esquemas de intervalo por Angei (1956)
e Ferster e Skinner (1957).

-177 -

Em contraste com o d ri, taxas muito altas de comportamento podem ser geradas,
tornando-se o reforamento contingente completaao dos elementos de uma razo
operante dentro de um intervalo de tempo especificado. Se este intervalo fr progressiva
mente diminudo, ou a razo progressivamente aumentada, ocorrer uma modelagem de
taxas extremamente altas dos comportamentos componentes. Este procedimento
conhecido como reforamento diferencial de taxas altas (d r h ) .
8.7 REFORAMENTO DO RESPONDER CONTNUO
Como vimos, a criao de operantes atravs do processo de diferenciao age, tipica
mente,
impondo um incio e um fim arbitrrios ao comportamento. A criao de uni
dades discretas desta natureza til para se medir os efeitos comportamentais, pois as
unidades prestam-se contagem. A contagem, naturalmente, toma possvel o clculo de
uma taxa de resposta e, consequentemente, da probabilidade da resposta, com todas as
vantagens adicionais dessas variveis.
Todavia, esta separao de operantes em eventos discretos com incio e fim
definidos no uma condio necessria para sua definio. Se o fosse, a anlise de
comportamentos interessantes tais como ficar parado e o seu inverso, mover-se
continuamente, estariam fora do mbito do comportamento operante. Que esses
co m p o rtam en to s so to suscetveis ao reforamento, como as unidades
comportamentais mais bvias, demonstrado pelo reforamento de uma resposta
contnua de correr, num rato. O aparelho para estudar o correr uma gaiola rotatria,
semelhante que vista na Fig. 8-12, mas modificada pela adio de um comedouro
para liberar automaticamente uma pelota de alimento, quando necessrio. Com o

F ig u ra 8-12. G aio la ro ta t ria e reg istrad o r a u to m tic o . A ro d a gira a p en as n o se n tid o


a n ti-h o rrio .

-1 7 8 -

objetivo de estabelecer uma classe de comportamento, uma volta de 360 graus fornece
uma unidade conveniente, embora perfeitamente arbitrria, do comportamento a ni
reforado. Se o correr (definido como uma volta completa) reforado num intervalo
fixo de 5 min ( IF 5 min), somente a primeira volta depois de decorridos os 5 min ser
reforada. Os efeitos do reforamento consistem em fortalecer um padro de corrur,
caracterstico do responder em esquemas IF (ver Figs 7-2 e 74 ). O rato para por
vrios minutos logo aps um reforamento e, ento, corre numa taxa alt at o
prximo reforamento, e assim por diante (Skinner e Morse, 1958). Aqui o
desenvolvimento do padro da IF serve para verificar a natureza operante do correr.

8.8 SUMRIO
Os procedimentos de diferenciao e aproximao sucessiva aumentam
fcrandemente o nosso controle experimental sobre o comportamento. Eles so
procedimentos que permitem selecionar os aspectos do comportamento que desejamos
reforar e, realmente, tornar os comportamentos desejados disponveis para o
fortalecimento. A combinao de esquemas de reforamento com vrias especificaes
de resposta (incluindo as especificaes de ordem superior compostas de operantes
condicionados anteriormente) permite que grandes amostras do comportamento de um
organismo, no laboratrio, sejam mantidas e estudadas por longos perodos de tempo.
Os procedimentos de razo permitem o estudo de como a quantidade dc trabalho
necessria para o reforamento pode afetar o comportamento. Os procedimentos dc
d rl e d rh tornam possvel o estudo de uma ampla faixa de taxas de comportamento.
No pombo, por exemplo, esses procedimentos produzem uma faixa estabilizvel do
taxas de bicar a chave de menos de 100 respostas por hora at 20.000 respostas poi
hora. Frequentemente, especificaes de respostas engenhosas podem ser usadas pani
estabelecer linhas-base comportamentais, anlogas s linhas-base de esquemas, a parlii
das quais podem ser estudados os efeitos tpicos de drogas e outras operaes.
Um nmero de atividades humanas caractersticas so correlacionadas com vria
especificaes operantes pesquisadas no laboratrio. O trabalho por pea, no qual um
trabalhador pago para produzir um nmero fixo de artigos, c uma especificao RF clara.
Assim tambm so atividades como datilografar um grande nmero de pginas, preparar
longos exerccios ou bater um prego na madeira. Em muitas dessas, se a quantidade de
comportamento envolvida substancial,uma pausa antes dc voltar ao trabalho vista
com freqncia. Podemos observar comportamentos em d rh nas atividades onde um
prmio e dado pela execuo rpida do trabalho em pouco tempo - isto pode ser visto
em garons, na hora de movimento ou, no basebol, os movimentos de um jogador
correndo para a primeira base. Tipos de comportamento mais intelectuais tambm sc
ajustam aos paradigmas de diferenciao. Numa discusso verbal, por exemplo, h comu*
mente um premio em d rh para pensar rpido e replicar. Por outro lado,numa briga,h
frequentemente um premio em d rl para o no responder muito precipitadamente e dizer
coisas de que nos arrependeremos mais tarde .
Segue-se uma nota sobre as similaridades entre os efeitos de certas especificaes de
resposta e os efeitos de certos esquemas. A Razo Fixa, por exemplo, no difere do IF
em seus efeitos sobre o comportamento (compare a Fig. 8-7 e a Fig 7-3 ). Essas seme
lhanas tm levado os tericos a tentarem reduzir esquemas e diferenciao a uma estru
tura comum, enfatizando os parmetros de probabilidade de reforamento^e no enfati-17 9-

/.ando variveis de especificao de resposta, ou vice-versa. O sucesso de tal empreendi


mento ainda no est assegurado e, para os objetivos presentes preferimos considerar um
esquema como um procedimento de especificao de contingncias probabilistic as de
reforamento no tempo, dada a classe de R. Por outro lado, consideraremos a diferen
ciao como um procedimento para especificar em que classe de comportamento se deve
agir com um esquema dc reforamento. A observao de que uma certa definio de R
sob um esquema pode produzir efeitos semelhantes,ou mesmo idnticos outra definio
sob um esquema diferente, pode realmente ser interessante. Todavia, tais correspon
dncias comportamentais no significam necessariamente que, em geral, cada especifi
cao ou esquema seja redutvel ao outro.
8.9A LINGUAGEM E LGICA DOS CONJUNTOS
Um conjunto qualquer coleo bem definida de objetos ou entidades conceituais.
O termo objetos ou entidades conceituais" tomado num sentido amplo, significando
coisas tais como rvores, pessoas, mesas de cozinha, resultados do atirar uma moeda, cor de
cabelo, respostas ou nmeros. Dizer que um conjunto uma coleo bem definida
significa o fato dc que, para qualquer objeto ou entidade conceituai, podemos dar uma
resposta definida -- sim ou no - no que se refere a se esse objeto est numa coleo
particular. Alguns exemplos de conjuntos so:

(1)
(2)
(3)
(4)
(5)

Todas as pessoas da cidade de Kansas com cabelo vermelho.


Os filmes onde Alec Guinness aparece.
Os nmeros mpares.
Os pases do mundo com parlamentos eleitos.
Todos os comportamentos que abrem uma porta.

Para cada um desses conjuntos, podemos dar uma resposta sim ou no no que se refere
a se uma dada pessoa, ou filme, o nmero,ou pas, ou comportamento, respectivamente,
poderia ser incluido na coleo. Na terminologia dos conjuntos, os itens individuais que
compem a coleo so chamados os membros, ou elementos do conjunto.
Os conjuntos so quase sempre simbolizados por letras maisculas. Assim, os inteiros
mpares menores que 10 , tomados como um conjunto, podem ser simbolizados pela letra
I, c o conjunto das vogais comuns na lngua inglesa, pela letra V. Suponha que desejamos
indicar os membros de um conjunto. Um mtodo para escrever as colees que chama
mos conjuntos enumerar cada um dos membros do conjunto, separando cada um por
vrgulas e colocando-os em chaves. Assim, o conjunto dos inteiros mpares menores que
10 escrito.
/ = { 1 ,3 ,5 ,7 ,9 }
e o conjunto das vogais comuns da lngua inglesa escrito
V = {a, e, i, o, u)

Algumas vezes o conjunto ou coleo muito amplo para que possamos conveniente
mente escrever todos os seus membros ou elementos. Ento, podemos usar trs pontos

- 180 -

aps escrever um nmero de membros suficiente para sugerir a regra que d e t e n m n a ;


filiao. Por exemplo, poderamos escrever o conjunto dos governos com a s s e m b l i a s
legislativas eleitas, P, como
P

{Canad, Inglaterra, Frana, Estados Unidos, Islndia...}

Dois conjuntos especiais, so de interesse. Um o conjunto universal, s i m b o l i z a d o


por y . O conjunto universal, y , contm todos os elementos aos quais f a z e m o s
qualquer referncia numa dada discusso.Em termos de nossos exemplos anteriores,
todos os seguintes seriam conjuntos universais apropriados:
(1)

(2)
(3)
(4)
(5)

todas as pessoas da cidade de


Kansas.
todos os filmes feitos.
- todos os nmeros.
todos os pases do inundo.
todos os comportamentos do indivduo.

O y serve simplesmente para delimitar qualquer discusso particular, estabelecer seus


limites c definir o tpico ou regio a partir da qual as vrias colees podem, ento, sei
feitas.
Um segundo conjunto especial aquele que no tem membro algum. Tal conjunto
chamado conjunto vazio, <p . Todos os nmeros mpares com um nico dgito acima de
10 , todos os pases do mundo que tm dinossauros vivos, todas as pessoas da cidade de
Kansas com cabelo verde so presumivelmente exemplos do conjunto vazio, $ . Note que
h somente um $ , ao passo que h tantos conjuntos universais diferentes quantos
quadros de referncia houverem para qualquer discusso determinada.
Embora um conjunto se componha de elementos, alguns ou todos os elementos
podem ser, por si ss, considerados conjuntos. Considere o conjunto universal, y , de
todos os livros, sentenas, palavras e letras. Um elemento desse conjunto este livro. Mas
este livro contem uma coleo de sentenas. Essas sentenas compem um conjunto: o
conjunto das sentenas deste livro. A anlise pode ser levada ainda mais longe para
palavras c, ento, para letras. As sentenas contm os elementos palavras; as palavras
contm, ainda, como elementos, as letras. Nessa conexo, importante notar que, ao se
enumerarmos elementos de um conjunto, incluimos apenas os elementos diferentes.
Assim, os elementos do conjunto L das letras que constituem a palavra agradvel sao
escritos
L {a, g, r, d, v, e, 1}
No duplicamos o a que ocorre mais de uma vez na palavra porque um e l e m e n t o
idntico. Naturalmente, se a palavra Agradvel fosse escrita em letra maiscula, e n t a o
deveramos incluir o A, assim como o a, como elementos, dependendo se t iv s s e m o s
tomado o nosso conjunto universal como o conjunto de todas as letras, ou s o m e n l e o
conjunto das letras minsculas.
A noo de que os conjuntos podem ser divididos em conjuntos est contida n o
conceito de um subconjunto. Um subconjunto, B, de A, um conjunto tal que iada
membro de B tambm um membro de A. O contrrio no necessariamente ver d a

i Ri

deiro. Assim, se o conjunto de todas as pessoas que vivem nos Estados Unidos um
conjunto universal, ento o conjunto das pessoas da cidade ae Kansas um subconjunto.
Alm disso, o conjunto das pessoas de cabelo vermelho da cidade de Kansas um outro
subconjunto. Suponha que todas as pessoas sejam um conjunto universal, y . Ento, o
conjunto dos homens um subconjunto deste conjunto universal. Mas o conjunto de
meninos ainda um outro subconjunto. Todos os meninos so do sexo masculino, nias
nem todas as pessoas do sexo masculino so meninos.
Para representar o fato de que todos os membros ae um dado conjunto B so
tambm do conjunto A, escrevemos
B C A

o que significa que cada elemento de B tambm um elemento de A.


Para representar estas noes e para ajudar nossa intuio sobre as vrias manipu
laes e combinaes simples dos conjuntos que desejarmos fazer, os diagramas conhe
cidos como diagramas Venn so teis. Num diagrama Venn, o Conjunto P- represen
tado por urn retngulo e os vrios conjuntos e subconjuntos de y so representados poi
crculos, figuras oblongas, ou outras figuras irregulares. Assim, na ilustrao anterior a
relativa ao conjunto das pessoas da cidade de Kansas, desenhamos

[8 .1]

(Hide K so as pessoas da cidade de Kansas. Se desejamos indicar as pessoas de cabelos


vermelhos da cidade de Kansas podemos desenhar dois crculos, deixando-os parcialmen
te sobrepostos, como em:

[8.2]

onde os crculos K e V representam, respectivamente, as pessoas da cidade de Kansas e as


pessoas de cabelo vermelho. Nem todas as pessoas de cabelo vermelho vivem na cidade de
Kansas, mas aquelas que vivem esto representadas pela regio superposta sombreada em
18 .2 1 chamada a intersecao dos dois conjuntos V e K 0 smbolo a usado para
denotar a intersecao de dois conjuntos. Logo, [8 .2 1 pode ser escrito como V A K.
Suponha que desejamos nos referir aos dois conjuntos de animais, ratos, R, e gatos,
G. Ento, se o conjunto universal P consiste de todos os animais conhecidos, temos .

[8.3]

- 182-

Em [8.3], nenhum elemento membro de ambos, R e G. Isto , no h animal algum


que seja, ao mesmo tempo, um rato e um gato. Evidentemente, ento, R a G =
Corjuntos que nao tm regies de superposio como em [8.3] so ditos conjuntos
m u tu a m e n te e x c lu s iv o s . Se ou no dois conjuntos se sobrepem, freqentemente temos
ocasio de aludir aos membros de ambos os conjuntos, tomados simultaneamente, como
um grupo. Se estivssemos interessados em animais peludos, ento ratos e gatos pode
riam ser classificados juntos. Em diagramas Venn, para nos referirmos a essa coleo,
poderamos escrever:

onde P o grupo de animais peludos.


Um conjunto X tal que qualquer elemento x ou um gato ou um rato chamado
a u n i o dos dois conjuntos R e G e escrito: X "RUG. O conjunto X o que est
representado pelas reas sombreadas em |8.4).
Um conceito final ser til. Frequentemente, desejamos discutir o co m p le m e n to de
um conjunto S, simbolizado porS,>S. O complemento de um dado conjunto aquele
conjunto que contem todos os n o membros do conjunto dado. Assim, os conjunto*
complement ares de cada um dos nossos exemplos originais so dados por:
(1) U - Todas as pessoas que no tm cabelos vermelhos na cidade de Kansas.
(2)U -Todos os filmes que no apresentam Guinness
(3)U -Todos os nmeros exceto os mpares
(4)U -Todos os pases do mundo que no tm parlamentos eleito e
(5)U -Todos os comportamentos que no abrem portas.
Note que o complemento e formado pela comparao do conjunto original com o
conjunto universal, escrevendo-sc como complemento o que est fora. Assim, o comple
mento de nosso conjunto K em 18 .1 1c convenientemente representado pela rea som
breada em [8.5j

[8.5]

Exerccio 6 .
D e m o n stre que

S U

11 e qu e S A S = c>.

REFERNCIAS PARA OCAPTUI O 8


Anger, D. The dependence of interresponse times upon the relative rein
forcement of different interresponse times. J. exp. Psychol., 1956,
52, 145-161.
- 183

Boren, J. J. Resistance to extinction as a function of the fixed ratio. / . exp.


P s y c h o l 1961, 61, 304-308.
Brandauer, C. M. The effects of uniform probabilities of reinforcement on
the response rate of the pigeon. Unpublished doctoral dissertation,
Columbia Univer., 1958.
Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New Y ork:
Appleton-Century-Crofts, 1957.
Findley, J. D. An experimental outline for building and exploring multi
operant behavior repertoires. J. exp. Anal. Behav., 1962, 5, 113
166.
Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a
small-scale (covert) operant. J. exp. Anal. Behav., 1963, 6 , 307
315.
Herrick, R. M. Lever displacement during continuous reinforcement and
during a discrimination. J. comp. Physiol. Psychol., 1963, 56,
700-707.
Herrick, R. M. The successive differentiation of a lever displacement
response. J. exp. Anal. Behav., 1964, 7, 211-215.
Hull, C. L. Principles of behavior. New York: Appleton-Century-Crofts,
1943.
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York:
Appleton-Century-Crofts, 1950.
Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
Skinner, B. F. The experimental analysis of behavior. Am er. Sci.f 1957,
45, 343-371.
Skinner, B. F., and Morse, W. H. Fixed-interval reinforcement of running
in a wheel. J. exp. Anal. Behav., 1958, 1, 371-379.
Weissman, N. W., and Crossman, E. K. A comparison of two types of
extinction following fixed-ratio training. J. exp. Anal. Behav., 1966,
9 ,4 1 -4 6 .
Wilson, M. P., and Keller, F. S. On the selective reinforcement of spaced
responses. J. comp, physiol. Psychol., 1953, 46, 190-193.

-1 8 4 -

Captulo 9: CONTROLE AMBIENTAL

Ao discutir os procedimentos de fortalecimento operante, esquemas e diferenciao,


dedicamos pouca ateno ao ambiente predominante. Durante o fortalecimento da
presso barra de um rato, do choro de um beb, do bicar de um pombo e da expresso
de opinio de um estudante, nosso interesse no ambiente se limitou verificao de que
o operante era possvel (isto , que barras, discos, e uma histria passada com a lngua
inglesa existissem quando necessrios) e que o reforamento poderia ser introduzido
quando se desejasse. Contudo, visvel, ao se considerar o comportamento de qualquer
organismo, que essa negligncia das condies predominantes do meio deve resultar
numa imagem muito inadequada do comportamento. Em geral, os organismos emitem
respostas seletivamente, de acordo com o estado de seus ambientes presentes ou
passados. Uma criana aprende a chorar somente quando um dos pais est em casa para
reforar o choro. Um co no pedir alimento na ausncia de um ser humano. Dificil
mente pediremos gua quando ningum estiver na sala para ouvir (e ento nos reforar).
Todos esses casos ilustram um tipo de controle do comportamento exercido pelo meio,
mas um tipo de controle que difere em vrios modos da maneira pela qual os estmulos
eliciadores controlam seus respondentes. Exemplificando,no gritamos nosso pedido no
restaurante, mais e mais alto quanto mais alto for o garo. Por outro lado, um aviso
sussurrado pode gerar uma atividade intensa, se aquilo que se diz justifica tal tipo de
atividade. Numa palavra, as leis do reflexo so inaplicveis ao controle ambiental de
operantes. Um grupo de leis bem diferentes, expressas em termos da histria passada de
reforamento do organismo, governa a emisso seletiva de operantes. Para formular essas
leis,, todavia, precisamos conceituar um nmero de dimenses para especificar, analisar e ,
em geral, descrever quantitativamente o ambiente dos organismos.
9.1 DIMENSES DO ESTIMULO
O ambiente prevalente de um organismo pode ser considerado como o padro ou a
configurao de todas as energias, presentes num determinado momento, que so capazes
jde entrar em relao funcional com o comportamento. Essas energias so apena^ um
pequeno subconjunto das energias estudadas pelos fsicos. Elas se limitam, namaiona,
quelas que podem ser detectadas por estruturas anatmicas especializadas, receptores,
que os organismos tm para receber certas energias e transform-las em impulsos eltricos
- 185 -

nervosos. 0 olho especializado para a recepo de uma faixa limitada de radiao eletro
magntica, o ouvido para uma faixa limitada da presso do ar causada por vibraes, a
lngua e o nariz para certas energias qumicas. Existem receptores na pele que detetam a
presso mecnica, mudanas trmicas, etc. H receptores nos msculos e articulaes do
corpo que detetam o movimento dos msculos e articulaesf, aos quais esto incorpo
rados. Uma especificao completa dos padres de energia eletromagnticas, mecnicas,
qumicas e trmicas que atingem os receptores dos organismos em qualquer momento
dificilmente ser feita. Felizmente, isto nem sempre necessrio. Uma vez que o compor
tamento pode estar sob o controle seletivo de partes ou aspectos limitados de configu
raes de energia que constituem o que chamamos ambiente, somente uma pequena
parte selecionada ou aspecto nico de energia do ambiente variada no trabalho experi
mental. O restante do ambiente mantido to constante quanto possvel. Esses aspectos
ou partes do meio, experimentalmente manipulveis, so o que chamamos mais comumente estmulos. De todas as leis do comportamento em que os estmulos participam,
at agora vimos somente as leis do reforamento e da eliciao; outras comporo o
contedo deste captulo e do seguinte.
O estmulo uma unidade ambiental arbitrria. Quando manipulamos ou mudamos
aspectos limitados do meio e os correlacionamos com o comportamento, estamos mani
pulando essas unidades. Na manipulao do meio visual, por exemplo, frequentemente
restringimos nossas mudanas experimentais a uma das dimenses fundamentais pelas
quais os fsicos descrevem a luz. Para os nossos objetivos, a luz pode ser considerada
como uma faixa limitada de perturbao eletromagntica, irradiada a 300.000 km/seg,
em forma de ondas. As ondas de luz podem ser representadas como na Fig. 9-1. O
comprimento de onda (X , Fig. 9-1, l-se lambda ) uma dimenso importante do
estmulo, qual foram correlacionadas respostas diferentes chamadas nomes das cores.
Os comprimentos de onda que constituem a luz formam apenas uma pequena poro de
todo o espectro eletromagntico.
Comprimento

F igura 9-1. A n a tu re z a o n d u la t ria reg u lar da luz p u ra . O c o m p rim e n to de o n d a ( ),


isto , a d iferen a e n tre cristas de o n d as sucessivas, inversam ente p ro p o rc io n a l
freq n cia das o n d as n o te m p o e co rre la cio n ad o com o que ch am am o s de co r, ou
m atiz, d a luz. A am p litu d e est relacio n ad a com a inten sid ad e de luz.

Na Fig. 9-2, v-se uma dimenso eletromagtica mais completa de X .


Quase todos os organismos respondem a diferenas na amplitude ou intensidade das
ondas de luz,mas somente um nmero limitado de espcies tem receptores especializados
para detetar mudanas em X Pombos, homens,serpentes e macacos so exemplos de orga
nismos que detetam tais mudanas. Outros, tais como o rato e o co so ditos cegos a
cores porque diferenas em X apenas no controlam o seu responder diferencial. O
receptor que chamamos de olho convenientemente comparado a uma cmara fotogr
fica porque ambos tm similaridades funcionais (ver Fig. 9-3). Ambos recebem a luz
-

as r -

atravs de um diafragma ajustvel. No olho, este diafragma chamado ris. Ambos, olho
e cmara, tm lentes atravs das quais a luz passa e que servem para focalizar a luz numa
superfcie sensvel. Na cmera, essa superfcie constitui a emulso do filme. No olho a
superfcie consiste de clulas nervosas que constituem a retina. Essas clulas retnicas
transformam a luz em impulsos nervosos.
Quando as ondas de luz da Fig. 9-2 incidem sobre o olho, elas so algumas vezes
referidas como luzes espectrais puras. Essas so as luzes que aparecem no arco-ris e
podem ser reproduzidas no laboratrio por um aparelho chamado monocromador. So
ditas puras porque contm apenas um comprimento de onda. A maioria das luzes, inclu
indo aquelas que atingem o olho refletidas de superfcies como mesas, cadeiras, quadros
negros, gramados esto longe de serem puras neste sentido. Geralmente, mesmo a luz de
uma superfcie homogeneamente colorida ou de uma lmpada constituida de uma
grande mistura de comprimento de ondas diferentes. Aqueles comprimentos de onda que
so predominantes determinam, usualmente, a nossa resposta de denominao da cor.
Todavia, algumas misturas de luz no so denominadas por seus comprimentos de onda
predominantes. A palavra prpura nunca usada para n o m e a r uma luz espectral pura de
um comprimento de onda. Purpura o nome de cor para uma mistura de azul e
vermelho. As luzes que chamamos brancas e as superfcies que chamamos cinzas irradiam
misturas heterogneas de quase todos os comprimentos de onda visveis. Nenhum com
primento de onda, isoladamente, predomina em tais luzes, mas o rtulo sem cor que
frequentemente lhes dado parece se. uma designao incorreta.
As dimenses visuais do estmulo no se limitam a distribuies de comprimentos de
onda e intensidades diferentes de feixes de luz isolados. As dimenses relevantes que
podem controlar o comportamento podem ser definidas de modo a incluir combinaes
espaciais das dimenses fundamentais de comprimento de onda e intensidade. Por
exemplo, as intensidades relativas de duas regies de luz adjacentes podem ser uma
dimenso poderosa do estmulo controlador que determina a resposta relativa ao brilho
que um observador dar a uma parte do padro. Olhando a Fig. 9-4, v-se que, quando a
quantidade de luz refletida pelo fundo (background) varia, as respostas ao brilho do
tringulo central mudam embora este ltimo permanea constante. Isto , o observador
relatar brilhos diferentes do tringulo. (Este fenmeno chamado contraste de brilho).
De fato, para produzir uma resposta de relatar que o brilho do tringulo no foi alterado,
teramos de Vari-lO de tal modo que, quando a intensidade do fundo fosse aumentada
(mais luz no fundo) o tringulo seia tambm proporcionalmente aumentado em inten
sidade (tringulo tambm mais intenso). Na situao ilustrada pela Fig. 9-4, uma resposta
de relatar um brilho idntico para os tringulos diferentes obtida somente quando a
ra z o entre as intensidades do tringulo e do fundo a mesma (Wallach, 1948)l O controle
funcional da resposta de relatar o brilho para os tringulos da Fig. 9-4 est claramente
localizado numa varivel ambiental composta. Como esta regularidade entre meio e com
portamento a base sobre a qual atribuimos o status de estmulo aos eventos do meio,
no haveria motivo para no denominar de estmulo esta varivel composta. Essa desig
nao, naturalmente, no exclui o fato de que, com outras contingncias predominantes,
o tringulo apenas, ou o fundo
apenas, possam tambm funcionar como estmulos
individuais.
Outro exemplo de controle de estmulo complexo visto nas linhas da Fig. 9-5,
comumente referido como iluso de Mller-Lyer. Os dois segmentos de linha hori
zontais so julgados de comprimento desigual porque a varivel de estmulo que controla
o julgamento no apenas a simples varivel do comprimento da linha hori-

- 187

Retina

Figura 9-3. O olho comparado Funcional e esquemticamente com urna cmara fotogr
fica (segundo Wald, 1950).
"

Figura 9-4. Um exemplo de como as relaes entre duas partes do campo visual influen
ciam as respostas (Segundo Boring, Langfeld e Weld, 1948).

>----------<
<------->
Figura 9-5. A ilusb de Mller-Lyer.
188-

zontal. Em vez disso, a dimenso relevante do estmulo composta, formada do compri


mento da linha horizontal e ngulo dos dois segmentos das extremidades.
Os estmulos sonoros, como os estmulos luminosos, podem tambm ser analisados
num conjunto de dimenses que os compem. O som tem uma semelhana superficial
com a luz, apresentando certas propriedades de onda. Mas as ondas do som so pertur
baes na presso do ar, propagadas lentamente (213,36 m/seg), mais semelhantes s
ondas do Mar, que so produtos de perturbaes na presso superficial da gua. As
mudanas na amplitude das ondas sonoras constituem mudanas na intensidade da
energia e esto associadas a alturas (de som) diferentes. A Fig. 9-6 indica vrias intensidades de sons em termos de uma escala logartmica chamada de decibel; a figura
fornece alguns exemplos comuns das fontes dessas intensidades.
A dimenso comprimento de onda mostra-se adequada para descrever os estmulos
sonoros. O som, todavia, convencionalmente descrito pelo nmero de cristas ou ciclos
por segundo (cps) em vez de X . O nmero de ciclos por segundo, ou a freqncia do
som, a dimenso em que esto baseadas as respostas de identificar a tonalidade. O
homem capaz de dar respostas diferenciais de tonalidade numa faixa de 20 -20.000 cps.
Outros animais, tais como ces e morcegos, so capazes de detetar freqncias duas ou
trs vezes maiores que nosso limite superior de freqncia. O modo pelo qual as respostas
de identificao da tonalidade variam com a freqncia ilustrado na Fig. 9-7, que d a
principal freqncia das vrias notas do piano.
Tal como uma luz pura contendo apenas um X rara, tambm o um tom puro
contendo somente uma freqncia. Diapases e osciladores de laboratrio so fontes de
tons puros. Os tons de instrumentos musicais contm uma mistura de freqncias e a
tonalidade geralmente determinada pelas freqncias predominantes. Sons comuns tais
como latidos, rudos de trfego, conversa e msica representam misturas muito com
plexas de muitas freqncias audveis em intensidades aproximadamente iguais (tais
como aplausos e esttica de rdio) chamado rudo branco, por analogia com a luz
branca.
As dimenses foram conceituadas para descrever as energias que compem partes do
nosso meio qumico, mecnico e trmico. Respostas relativas a cheiro e gosto esto
baseadas em mudanas diferenciais na concentrao e estrutura molecular de gases no
nariz e solues na lngua, respectivamente. Mudanas na temperatura superficial so
detetadas por certos receptores que esto situados na pele.
Para descrever os estmulos que se originam dos movimentos dos msculos e tendes,
cham ados prop ri ocep tores, surgem problemas experimentais. A mensurao de
mudanas no meio interno difcil sem se invadir cirurgicamente o organismo. A locali
zao dos proprioceptores e seus receptores associados torna tais mudanas no meio
interno relativamente inacessveis, tanto para medir como para manipular. Na prtica, os
estmulos internos so, portanto, quase sempre mais inferidos que realmente observados.
Note que nesta discusso empregamos um grupo de termos para descrever as dimen
ses de estmulo e outro grupo para descrever as respostas comportamentais correspon
dentes. Embora haja correlaes regulares entre esses estmulos e as dimenses da res
posta (descritas extensamente na rea da psicologia chamada psicofsica) as denomina
es dos estmulos e das respostas no devem ser contundidas. Frequncia e intensidade
de energia luminosa so dimenses do estmulo; cor e brilho so dimenses da resposta.
Freqncia e intensidade de energia sonora so dimenses do estmulo; volume e altura
so dimenses da resposta. Cheiro, gosto, temperatura e peso so termos de resposta

- 189-

140

Sistem a dc am pliao de alta p o tn cia


Avio - 1600 rpm . 5,5m
M artelar em ao , 60 cm
T rovo
C aldeira de um a fbrica
M etro, estao local (trem passando)
. Local mais ru id o so em Niagara Falls
^ R ugido do leo
2STrafego m u ito in ten so , 4,5m
^ Rdio m uito alto
- C onversao no rm al, lm
E scritrio ru id o so ou uma loja
E scrit rio m edio
Rua residencial tran q ila
Rua p o u co m ov im entad a
R esidncia m dia
Msica b<m suave

120
100

I 80
4(j>
0
T3
3
s
f 10
c
4>
? 20
z
o
T3

2 3 0

Sussurro suave, l,5 m


R udo m nim o ao ar livre

i
50

100

1,000
1 10 ,0 0 0 1
50Q 2 Q C 1.5 0 Q Q -. 20.0QQ

F re q n cia (ciclos p o r segundo).

Figura 9-6. Intensidade de alguns sons familiares (segundo Lewis, 1963).

associados com as dimenses de estimulo da estrutura qumica, energia trmica,


quantidade de fora, e assim por diante. O reconhecimento da diferena entre os termos
apropriados para descrever os estmulos e aqueles para descrever as respostas impedir
bastante confuso e discusso desnecessria.
9.2 GENERALIZAO DE ESTIMULO
A importncia de se ter dimenses quantitativas disponveis para descrever e manipu
lar os ambientes dos organismos vista claramente na quantificao do fenmeno com
portamental conhecido como generalizao de estmulo. Este fenmeno observado
numa forma grosseira quando uma criana aprendendo a falar se refere a todos os objetos
peludos como gatos e chama todos os homens adultos de papai . Ele exemplificado
em nosso prprio comportamento, quando acenamos a um estranho por engano porque
se assemelha a um amigo. Nestes exemplos a similaridade de estmulos parece estar
claramente envolvida, mas at que possamos especificar as dimenses quantitativas s
quais relacionar objetos tais corno gatos, coelhos e casacos de pele, uma avaliao precisa
do grau de similaridade de duas quaisquer situaes de estmulo difcil. A disponibi
lidade de dimenses de estmulos do tipo descrito na seo 9.1 permite um estudo mais
sistemtico desse tipo de similaridade que pode ser experimentalmente reinterpretada
como se segue. Depois que uma resposta foi fortalecida na presena de uma configurao

- 190 -

C mdio

M iC iW ^ A ^ C D E

T e c la d o d o p ian o

t
A ltu ra p a d r o : 4 4 0 cps
L J ------------------- 1--------------------- 1_____________ I__________________ I______________I_____________ I_____________ L_J

25

50

100

200

500

1000

2000

4000

F re q n c ia em ciclos p o r seg u n d o

F ig u ra 9-7. F re q n c ia s d o som de vrios to n s do p ia n o (seg u n d o B oring, L angfeld e


W eld, 1 9 4 8 ).

particular do meio, ela ocorrer tambm, mas numa extenso menor, quando o meio
estiver ligeiramente alterado de algum modo. A resposta pode desaparecer totalmente
quando a mudana no meio fr grande demais. A importncia dessas proposies
enfatizar os comentrios feitos na introduo deste captulo: o estado particular do
ambiente na ocasio em que o operante fortalecido, um fator importante que
controla a emisso da resposta.
O mtodo para avaliar a importncia do ambiente predominante durante o condicio
namento simples, em princpio. Um determinado operante de algum organismo deve ser
fortalecido com o ambiente num estado ou configurao particular. Aps o processo de
aquisio se completar, podem ser feitas variaes em algum aspecto bem controlado do
ambiente e a fora da resposta pode ser testada na nova configurao ambiental. Na
prtica, o experimento oferece bastante complicao para justificar uma descrio um
pouco mais detalhada.
Um pombo faminto pode ser colocado numa caixa do tipo descrito anteriormente
(Fig. 5-11). A aparelhagem modificada como visto na ilustrao da Parte 2, p. 121
(segundo Guttman, 1956), de modo que o painel de bicar transluminado por uma luz
pura vinda de um monocromador. O monocromador permite a seleo precisa e a apre
sentao de qualquer um de um grande nmero de comprimentos de onda visveis. A
aparelhagem tambm permite mudanas rpidas de um comprimento de onda para outro.
Num experimento executado por Guttman e Kalish (1956), os animais foram modelados
a bicar o disco que era transluminado por uma luz amarelo-esverdeada (ver Fig. 9-2) de
550my (my = milimicron
= 106 cm: uma medida de X . comprimento de onda).
Aps alguns treinamentos em crf, os animais foram colocados num esquema de intervalo
varivel (IV 1 min). Quando o comportamento havia estabilizado em IV, realizou-se
testes para se determinar at que ponto a luz especfica de 550 my- no disco estava
controlando o comportamento. Este teste consistiu de um procedimento de extino no
qual os animais foram expostos a sries aleatrias de apresentaes sucessivas de 30 seg
de 11 comprimentos de onda diferentes, dos quais somente um era o 550 my realmente

- 191 -

no treinamento. Nenhuma outra mudana foi feita no ambiente dos animais. (O


procedimento visto em notao nos diagramas abaixo).

U ia d o

tre in a m e n to

s+
1 ( 3 se g )- ]

T(i min) * IR * |^"+

estab iliza o em I V

T estes em e x tin o

L_

S.">50 m ju

-/-

X<30 seg)

570

[T (3 s e g )j

$510

m fi

-/->

[ (3 0 SCg)- * H(30 seg)

Quando os nmeros de respostas emitidas em extino sob cada um dos estmulos


diferentes foram examinados, eles se apresentaram sob a forma da Fig. 9-8. Essa figura
indica que os animais deram o nmero mximo de respostas em extino apenas na
presena do estmulo de treinamento e deram gradualmente menos respostas aos estmulos-teste localizados progressivamente alm do estmulo de treinamento ao longo da
dimenso X . Esta gradao do responder, observada quando a fora da resposta
avaliada em ambientes algo diferentes daquele em que o fortalecimento original ocorreu,
conhecida como gradiente de generalizao. Em termos tcnicos, o gradiente de
generalizao operacionalmente definido por uma sucesso de decrscimos de um
valor estabelecido de fora da resposta (Guttman. 1956).
A tcnica de Guttman-Kalish ilustra bem como procedimentos tais como esquema de
reforamento e extino podem ser combinados para avaliar certos fenmenos funda
mentais do comportamento. Por exemplo, considere o objetivo do esquema IV no treino.
Reexaminando a Fig. 7-9, v-se que o IV produz uma grande persistncia face extino.
Vrios milhares de respostas podem ocorrer antes que a taxa de extino comece a cair
apreciavelmente. Na generalizao, estamos preocupados com a extenso da fora
da resposta a condies de estmulo outras que no aquelas ern que o reforamento
realmente se efetivou. Para fazer os testes necessrios para se avaliar esse
extenso, nunca devemos reforar na presena das novas e diferentes condies de
estmulo. Caso contrrio qualquer resposta que observssemos podjria ser atribuvel
ao reforamento direto na presena dos novos estmulos. Mas o uso do procedimento
de extino enfraquece o comportamento. Como poderemos testar 1 1 valores
diferentes de estmulo em face desse enfraquecimento? A soluo para esse problema
se encontra em ( 1 ) fazer a apresentao de cada estmulo-teste diferente rapidamente
(cerca de 30 seg), (2) apresentar os estmulos-teste diferentes numa ordem aleatria, e
(3) usar um esquema IV no treino para desenvolver uma persistncia de vrios milhares
de respostas potenciaisem extino, antes que os sinais caractersticos de
enfraquecimento comecem a ocorrer
- 192-

Comprimento dc onda (milimicrons)


Figura 9-8. Respostas em extino, emitidas na presena de 11 comprimentos de onda
diferentes projetados um de cada vez na chave. O treino ocorreu apenas em 500m jj
(Guttman, 1956)

Os resultados da Fig. 9-8 confirmam a vantagem de se representar quantitativamente


os estmulos. Suponhamos que o experimento de Guttman e Kalish tivesse sido execu
tado antes de se saber que a luz poderia ser representada por ondas e medida atravs do
comprimento de onda. Se o pombo tivesse sido treinado a bicar um disco coberto com
papel verde e, ento, testado em extino com papis verdes e de outras cores no disco,
digamos azul, violeta, vermelho, laranja e amarelo, certamente teriam ocorrido diferenas
no responder a essas cores. Mas, considere como um grfico igual ao da Fig. 9-8 poderia
ter sido desenhado. O fato de que nenhuma dimenso quantitativa (numrica) existia
para relacionar as diferentes cores umas s outras, teria excludo tal representao
funcional. No nosso exemplo hipottico, no temos base para interpolar os valores da
fora da resposta entre duas quaisquer cores empregadas. Na funo da Fig. 9-8, fizemos
isso facilmente, conectando as foras da resposta para dois estmulos quantitativamente
adjacentes com uma linha reta. Esta interpolao por linhas retas nos permite prever a
quantidade de generalizao a luzes no usadas no experimento. O mximo que
poderamos fazer com um experimento realizado antes da descoberta de especificaes
numricas da luz por seus cumprimentos de onda, teria sido desenhar um grfico com
barras do tipo visto na Fig. 9-9. Na falta de um mtodo melhor, as cores da Fig. 9-9 esto
distribudas alfabeticamente ao longo da abeissa. O fato de nenhuma varivel
independente ser designado para o eixo do X da Fig. 9-9 mostra quo deficiente esta
representao teria sido. Aqui, temos alguma noo da importncia de dimenses
quantitativas para especificar e relacionar as variveis independentes em qualquer
cincia. Alm disso, o exemplo til para mostrar como uma cincia (no caso,
psicologia), frequentemente toma emprestado os mtodos e descobertas de outra (no
caso, fsica), e os explora para seu prprio uso em contextos inteiramente diferentes
daqueles nos quais os mtodos foram originalmente desenvolvidos.
- 193

A forma real do gradiente de generalizao variar de acordo com as dimenses


particulares do estmulo empregado , o esquema e tipo de reforamento no treino do
organismo em estudo, e mesmo o valor do estmulo particular de treinamento numa dada
dimenso. .Assim, qualquer busca do gradiente de generalizao deve ser abandonada.
Algumas vezes, um gradiente pode mesmo no aparecer e uma curva achatada de
generalizao obtida. Quando a freqncia de som usada num experimento seme
lhante ao de Guttman e Kalish, o grandiente de generalizao do pombo para freqncias
de sons apresenta a forma da Fig. 9-10. As curvas da Fig. 9-10 so essencialmente
achatadas.

Fig 9-9. Respostas hipotticas em extino, emitidas s vrias cores depois de um


treino na presena do verde.

Embora o bicar o disco fosse originalmente fortalecido exclusivamente em 1.000 cps,


todos os tons entre 300 e 3.500 (e tambm nenhum tom) adquiriram igual poder de
controlar a emisso da resposta. No fosse o fato, conhecido atravs de outros experi
mentos, de que o pombo p o d e detetar diferencialmente esses vrios sons, seriamos incli
nados a concluir que a dimenso de freqncia irrelevante em termos comportamentais.
Como tal, seria anloga poro da dimenso X em torno da regio de radiao gama, ou
dimenso que descreve o nvel de trfego numa rua de Tquio em relao a esse animal
se comportando em Nova Jersey. Somos forados a adiar, todavia, uma discusso deta
lhada das variveis responsveis pelas diferenas entre as Figs. 9-8 e 9-10 at que os
princpios do prximo captulo sejam introduzidos.

Freqncia (ciclos por segundo)


Figura 9-10. Gradientes de generalizao ao longo da dimenso de freqncia do som
para trs animais. Um tom de 1.000 cps estava presente durante o fortalecimento da
resposta de bicar o disco (Jenkins e Harrison, 1960).
-1 9 4 -

Mesmo ao longo da prpria dimenso comprimento de onda da luz, o uso de


estmulos de treinamento diferentes de 550m y produz gradientes de formas diferentes.
Blough(1961) obteve os dados apresentados na Fig. 9-11 quando treinou trs grupos de
animais em 530 my, 550my e 570my, respectivamente. Como a figura indica, a forma
real do gradiente obtido varia dependendo de onde o estmulo de treinamento se
encontra na dimenso X .
<u
o
3

30

l igura 9-11. Gradientes dc generalizao em torno de cada um dos trs diferentes


comprimentos de onda de treinamento. Oito animais deram origem s curvas - dois
com 530 my quatro em 5 5 0 m y ,e dois em 570 m y (Blough, 1961).

Em 530 my, a rea maior do gradiente encontra-se esquerda do estmulo dc treina


mento. Em 550 my por outro ho, encontra-se direita. Somente em 570 my aparece
um gradiente simtrico. Note que o gradiente em torno de 550 my, na Fig. 9-11 difere
um pouco do originalmente obtido por Guttman e Kalish em 1956 (visto na Fig. 9-8). A
razo dessa diferena parece estar no fato de que Blough introduziu uma precauo
adicional ao coletar seus dados. Sabendo que o olho do pombo mais sensvel a alguns
comprimentos de onda que a outros, ele usou intensidades ligeiramente diferentes para
cada estmulo-teste. A forma do gradiente obtido por Blough sugere que h regies
circunscritas ao longo do espectro de nas quais a generalizao ocorre mais pronta
mente. Treinado prximo ao centro de tal regio, o animal generalizaria dentro da
regio, produzindo um gradiente simtrico e com o topo achatado. Treinado na extremi
dade de tal regio, o animal generalizaria em direo regio; na outra direo, sua curva
cairia mais rapidamente, produzindo um gradiente assimtrico (Blough, 1961, p. 38).
As trs curvas da Fig. 9-1 1 sugerem que duas dessas regies esto centralizadas em
aproximadamente 515 my e 570 my, respectivamente. tentador igualar a presena
dessas duas regies s bandas de cores que o homem discrimina no espectro. Esses e
outros resultados indicam que o estudo da generalizao comportamental promete
elucidar as propriedades fundamentais do olho de organismos infra-humanos.
O paradigma simples da generalizao pode ser ampliado, examinando*se os efeitos
produzidos quando mais de um estmulo usado no treino. Num experimento de Kalish
e Guttman (1957), luzes alternadas de 530 my e 560 my foram usadas durante o
fortalecimento inicial e a estabilizao subsequente em IV. O teste de generalizao foi
efetuado do modo usual. A curva obtida vista na Fig. 9-12. Parece que este gradiente
um composto de gradientes individuais. Um trabalho posterior (Kalish eGuttm an, 1959)
indicou que ele, provavelmente, representa uma simples superposio de dois gradientes
de generalizao. Um aspecto importante desse procedimento de treino em mais de um
valor do estmulo a sua capacidade para ampliar o gradiente de generalizao. Usando
ainda mais que dois estmulos de treinamento, este gradiente pode ser ampliado o quanto
- 195-

Comprimento de onda (milimicrons).

Figura 9-12. Gradientes de generalizao ao longo da dimenso comprimento de onda,


depois do treino na presena de dois estmulos: 530 my e 560 my (segundo Kalish e
Guttman, 1957).

desejarmos, o que, como veremos mais tarde, e bastante signiticante para o ensino de
conceitos gerais criana.
Fora do laboratrio, naturalmente, a generalizao nunca limitada a uma nica dimenso
ambiental. Quando ocidentais ingnuos observam que todos os orientais se parecem, est
ocorrendo generalizao de um estmulo complexo (o primeiro oriental ou o primeiro
ocidental visto) para outros estmulos teste (outros orientais, ou outros ocidentais).
Um estmulo pode ser dito complexo quando mesmo sua descrio parcial envolve mais
dimenses do que seria prtico enumerar. As generalizaes complexas, como as vistas
fora do laboratrio, podem ser inferidas como sendo baseadas em espalhamentos do tipo
da Fig. 9-8, ao longo de cada dimenso que o estmulo de treinamento e aos estmulosteste compartilham. Podemos tentar verificar esta hiptese, pelo menos parcialmente,
ampliando nossos estmulos-teste experimentais de modo a incluir mudanas feitas simul
taneamente em duas dimenses de um estmulo-teste. Ao se iluminar um disco de um
pombo com luzes puras de vrios comprimentos de onda, estabelece-se uma dimenso de
estmulo bem controlada, X, como j vimos. Na Fig. 9-13, a luz no disco forma uma
espcie de barra. Se este padro de barra girado em torno do centro do disco para
qualquer de vrias posies, adicionamos ao estmulo uma segunda dimenso indepen
dente - orientao angular do padro de luz.

- 196-

Amarelo

Verde

Vermelho

Violeta

Figura 9-13. Estmulos criados pela manipulao independente de duas dimenses


ambientais fisicamente definidas.

Suponhamos que um animal seja treinado e subsequentemente estabilizado em um


esquema IV, na presena de um estmulo que pode ser descrito por um determinado
valor de comprimento de onda (digamos 550 my, 4verde ) e por uma determinada
orientao angular (digamos 0o, vertical). Ento, usando estmulos-teste que difiram
tanto em ngulo como em comprimento de onda durante a extino, um gradiente de
generalizao que se estende sobre duas dimenses, pode ser determinado. O tratamento
detalhado dos resultados quantitativos de um experimento deste tipo est alm do obje
tivo da presente considerao. suficiente notar que uma diminuio ordenada da gene
ralizao ocorre para os estmulos-teste que diferem em duas dimenses do estmulo
original de treinamento. Esta diminuio uma funo complexa da distncia de ambos
os valores dimensionais do estmulo-teste em relao aos valores iniciais do estmulo
original de treinamento (Butter, 1963).
9.3 GENERALIZAO DA EXTINO
Assim como os efeitos fortalecedores do reforamento de uma dada resposta numa
determinada configurao de estimulo difundem-se de modo a incorporar outras configu
raes de estmulo, tambm os efeitos enfraquecedores da extino difundem-se para
condies de estmulos outras que no aquela particular sob a qual a extino foi efe
tuada. Este fenmeno chamado generalizao da extino. Para observ-lo, iniciamos
com um operante que j existe com alta fora na presena de uma faixa de estmulos.
Processa-se, ento, a extino, na presena de apenas um dos estmulos. Quando o
processo de extino se completa para este estmulo, os outros estmulos de toda a faixa
so testados para se verificara extenso em que eles tm ainda o poder de controlar a
emisso da resposta. Este procedimento pode ser resumido em quatro fases:
Fase I.
Fase II.

Fase III.
Fase IV.

Fortalecimento inicial de um operante numa


situao de estmulo.
Manuteno do operante (usualmente com um
esquema IV) na mesma e em outras situaes de
estmulo.
Extino prolongada do operante em apenas uma
das situaes de estmulo previamente usadas.
Testes de extino conduzidos com todos os esti
mulos usados na Fase II.
19/

Homg v l5 o l) executou e:.e experimento e obteve os resultados apresentados na


Fig. 9-14. A poro denominada iinha-base foi obtida na fase II. Nesta fase, pombos

Figura 9-14. Generalizao de extino ao longo do continuum comprimento de onda.


O treino em IV foi efetuado em 1 3 valores, de 510 a 630 mjJ.A extino ocorreu em
570 m y ( segundo Honig, 1961).

famintos bicavam o disco num esquema de reforamento em IV que vigorou para 13


comprimentos de onda diferentes no curso do treinamento. Este procedimento uma
extenso do treinamento empregado por Kalish e Guttman (1957) com dois compri
mentos de onda diferentes (ver Fig. 9-12) e produz uma curva de generalizao aproxima
damente achatada, ao longo de todo o continuum do espectro. Na fase 111, Honig
efetuou a extino exclusivamente em 570 my. Finalmente, o gradiente em forma de U
visto na Fig. 9-14 foi obtido testando-se as taxas de resposta em extino com os outros
12 estmulos. Sob as condies deste experimento, um gradiente de generalizao inver
tido e algo mais achatado produzido, ao invs daqueles da seo 9.2. difcil dizer se a
diferena no achatamento indica uma diferena fundamental entre generalizao de
extino e generalizao de reforamento. Nn estudo de Honig, a extino em 570 mu
- 198-

no foi completada na Fase III; a parte inferior da funo em U da Fig. 9-14 mostra que,
em 570 my, a taxa de resposta no teste est bem acima do nvel operante zero, normal
mente associado com o operante de bicar a chave.
A generalizao de estmulo na extino e a generalizao de
estmulo no
re fo r a m e n to so procedimentos inversos. Um envolve um espalhamento do
enfraquecimento e o outro envolve um espalhamento do fortalecimento. A Tabela 9-1
contrasta seus procedimentos de definio.
Tabela 9-1
UMA COMPARAO DOS PROCEDIMENTOS DE GENERALIZAO DE
ESTIMULO NO REFORAMENTO E GENERALIZAO DE ESTIMULO NA
EXTINO
GENERALIZAO
REFORAMENTO

EXTINO

No iti cio

fora baixa de R numa faixa de Ss

Fora alta de R,
numa faixa de Ss

Operao fundamental

Fortalecimento de R em um valor de S

Enfraquecimento de
R em um valor de S

Teste

Numerosos Ss, ao longo de uma faixa, so apresentados e c


procedimento de extino fica constantemente em efeito.

9.4 ALGUMAS IMPLICAES DA GENERALIZAO


Anteriormente, na seo 9.2, destacamos rapidamente alguns exemplos, fora do
laboratrio, da generalizao de estmulo. Esses exemplos de crianas que confundem
uma situao com outra atravs de respostas indiscriminadas so casos em que a generali
zao parece impedir a adaptao de um organismo a seu mundo. Mas a generalizao .
quase sempre, uma propriedade muito til do comportamento. Por exemplo, as habili
dades aprendidas numa situao ambiental podem ser usadas em novas sistuaes ambien
tais. Tendo aprendido a pegar uma bola jogada a uma distncia dei ,5m, podemos peg-la
tambm a 3,0, 6,0 e talvez at 12,0 m. Os pais que ensinam suas crianas a dizerem
obrigado em casa esto implicitamente contando com a generalizao para que o
obrigado seja emitido fora de casa. Nosso sistema educacional est baseado na supo
sio de que as habilidades adquiridas na escola se difundiro em ambientes fora da
escola. No obstante, o gradiente de generalizao est a para lembrar e acautelar os
educadores de que, quanto mais uma situao de treino se parecer com a situao na qual
o comportamento ser necessrio mais tarde, tanto mais efetivo ser o treino. Escolas c
outras agncias usam este princpio quando fazem a situao de ensino mais prxima
possvel da vida real .
- 199 -

Os resultados vistos nus sees 9.2 e 9.3 fundamentam a concluso inevitvel de que
ambos o reforamento e a extino so um tanto especficos ao estado do ambiente
preciominante quando eles ocorrem. O termo 'um tanto tem uma significao precisa na
forma dos gradientes de generalizao que podem ser observados quando mudanas
controladas numa ou duas dimenses de estmulo, fisicamente especificadas, so feitas.
Generalizao, assim, um conceito esttico. Ao contrrio de muitos dos fenmenos
comportamentais j familiares (condicionamento, extino, diferenciao), a generali
zao, em si mesmaj no um processo. Isto , ela no uma mudana no compor
tamento, no tempo, com um procedimento fixo mantido constante. Em vez disso, ela um
fenmeno que pode ser observado depois do fortalecimento ou enfraquecimento, atravs
do emprego de uma certa seqncia de operaes (por exemplo, as fases da seo 9.3).
Num processo comportamental verdadeiro, o tempo aparece como a varivel indepen
dente. Mas, nos gradientes de generalizao, a diferena entre os estmulos de treino e de
teste a varivel independente. Embora seja esttica neste sentido, veremos no prximo
captulo como a generalizao do enfraquecimento e a do fortalecimento se combinam
no paradigma de discriminao, gerando um dos mais fundamentais processos compor
tamentais conhecidos.
As descobenas de. laboratrio sobre a generalizao trazem certas implicaes para
um velho problema filosfico, o do significado de similaridade. Os comentrios lcidos
de C. E. Osgood ilustram a forma pela qual o mtodo experimental na psicologia pode/
ocasionalmente, fornecer uma re-interpretao moderna de problemas filosficos tradi
cionais.
Suponha que perguntemos (como temos muitas vezes perguntado em aulas introdu
trias de filosofia): O que mais semelhante a um quadrado vermelho
um
quadrado verde ou um crculo vennelho? O psiclogo com uma orientao emprica
cansa-se rapidamente de discutir assuntos como a relao de qualidades nicas e
corre ao laboratrio para averiguar! Aps estabelecer uma reao, qualquer reao,
ao quadrado vennelho, ele testa seu sujeito humano para a generalizao ao quadra
do verde e crculo vermelho. Ir o crculo vennelho mostrar mais generalizao? Se
assim o for, o crculo vennelho est mais perto do quadrado vennelho que o crculo
verde! Isto significa que temos agora uma escala objetiva para m edirsimilaridade'?
Somente quando estamos interessados na similaridade quando definida pelo comporta
mento de um organismo. E este deve ser um tipo especfico de organismo, desde que

a similaridade para o rato, assim definida (ou para o colono australiano, por exem
plo), no seria necessariamente paralela do Homo Sapiens ocidental.
Isto levanta um problema m enor re la tiv o ao jargo psicolgico
ns
tomamos conhecimento peridico mas nunca observamos na totalidade. Seguimos o
mpeto, da nossa linguagem e dizemos que h mais generalizao entre esses dois
estmulos porque eles so mais aproximadamente similares, e ento (como o psic
logo jovem e impetuoso citado acima), afinnamos que 'esses dois estmulos so mais
aproximadamente similares porque h mais generalizao entre eles. Ambas as pro
posies so vlidas,, dependendo da definio particular de similaridade. Utilizando
um analisador de freqncia de onda, podemos medir a similaridade fsica ( proximi
dade no continuum de freqncia) de dois tons e ento medir a generalizao em
funo desta similaridade. Por outro lado, podemos usar um grupo de organismos
como instrumentos de medida da similaridade de tons, como na psicofi' ^a, o que,
na verdade, c medir contnuos fsicos em termos de generalizao e disc run in ao.
- 200 -

Observe cuidadosamente, todavia, que no h garantia de que as duas medidas de


similaridade sero paralelas; de fato, raramente o so. A ilustrao mais clara disto se
encontra no fenmeno de generalizao de oitava. Tanto para o rato como para o
homem, pelo menos, a generalizao de resposta a tons separados por uma oitava
maior que a tons mais prximos no continuum fsico de freqncia, e eles soam mais
aproximadamente similares. Mas, naturalmente, existem aqueles que diriam que o
conceito de similaridade significante apenas em tennos do comportamento dos
organismos. Neste caso, devemos nos contentar com tantos tipos de similaridades
quantas so as especies e culturas dentro das espcies (Osgood, 1953, p. 361).
9.5

NOTAS SOBRE O DELINEAMENTO DE EXPERIMENTOS EM PSICOLOGIA


USANDO ANIMAIS COMO SUJEITOS.

U uso de animais como sujeitos em experimentos de psicologia pode ser conveniente


mente datado a partir dos experimentos iniciais de Thorndike sobre aprendizagem em
tentativa e erro. Os prprios comentrios de Thorndike sobre as vantagens do uso de
sujeitos animais em experimentos de psicologia so uma boa leitura, mesmo atualmente.
Quando desejvel se obter um melhor controle da histria passada e presente de um
organismo do que possvel com um ser humano; quando desejvel investigar faixas
amplas de variveis como choques eltricos intensos, luz forte, e assim por diante; e
quando exigimos um perodo de tempo maior do nosso sujeito do que o horrio de uni
versitrio permita, frequentemente, podemos nos voltar para uma ou outra da grande
variedade de espcies animais disposio, sem muita perda na generalidade dos nossos
resultados. O objetivo das presentes notas no tanto considerar o problema da generali
zao dos resultados de experimentos com animais para seres humanos, mas, mais que
isso, fornecei uma frmula geral para o delineamento de experimentos com animais em
psicologia.
Nota A. Devemos comear com um animal adequado. (Em geral, desejamos que
nossos resultados sejam aplicveis a uma larga faixa de espcies, incluindo o homem). Isto
, primeiro, se o problema psicolgico em investigao um que requer comportamento
de escolha ou comportamento instrumental (e praticamente todos requerem), ento de
vemos escolher um organismo que emita este comportamento. Devemos, em outras pala
vras, escolher um organismo que tenha operantes. De acordo com este critrio, podemos
ento escolher vermes aneldeos, camelos ou delfins e no devemos escolher protozorios, esponjas ou moluscos j que nunca se demonstrou que estes organismos apresentam
comportamentos que seguem as leis do fortalecimento operante. No precisamos, neces
sariamente, escolher um animal prximo ao homem na escala filogentica, a menos que o
nosso experimento pretenda estudar caractersticas comportamentais apresentadas so
mente por esses organismos filogeneticamente superiores . Para muitos problemas em
aprendizagem, discriminao, diferenciao ou encadeamento, animais to modestos
como o rato ou o pombo comum satisfaro.
Nota B. Tendo selecionado nossa espcie, devemos tratar do problema relacionado
ao tipo de experincia passada que os animais particulares tiveram (ou no tiveram), se
queremos que eles sejam sujeitos apropriados. Evidentemente, se estamos delineando um
experimento para examinar o processo de aquisio e o nosso animal j adquiriu a
resposta selecionada ou uma muito semelhante - ele no ser um sujeito adequado.
Similarmente, se estamos interessados em resultados de extino, um animal com histria
prvia de extino da resposta especificada se comportar de um modo bastante diferente
- 201 -

de um que no tenha esta histria. Frequentemente, em vez de manter um registro de


histrias particulares os psiclogos escolhem animais que no tm qualquer histria experi
mental e que foram criados em condies controladas. Esses animais, quando usados pela
primeira vez, so ditos ingnuos experimentalmente. No sempre necessrio usar tais
animais ingnuos; mas devemos nos certificar de que a histria particular de nossos
animais no vai, indevidamente, prejudicar nossos resultados. A uniformidade de nossos
resultados ser a nossa justificao final.
Nota C. Finalmente, devemos motivar nosso animal. Aqui, o problema de controle e
mensurao muito mais fcil que com humanos. Podemos privar nosso pombo de
alimento por, digamos 22 horas, depois do que podemos usar pequenas quantidades de
alimento como um reforador conveniente; ou podemos esfriar o compartimento de
nosso rato at um nvel prximo ao do congelamento, depois do que podemos usar um
breve sopro de ar quente como um reforador.
As notas A, B e C so sugestes para se conseguir um animal representativo que sirva
como uma preparao experimental para o estudo do compolam ento.
REFERNCIAS PARA O CAPITULO 9.
'
Blough, D. The shape of some wavelength generalization gradients. /.
exp. Anal. Behav., 1 9 6 1 ,4 ,3 1 -4 0 .
Boring, E. G., Langfeld, H. W., and Weld, H. P. Foundations of psy
chology. New York: Wiley, 1948.
Butter, C. M. Stimulus generalization along one and two dimensions in
pigeons. J. exp. Psychol., 1963, 65, 339-345.
G uttm an, N. The pigeon and the spectrum and other complexities.
Psychol. Rep., 1956, 2 , 449-460.
Guttm an, N., and Kalish, H. I. Discriminability and stimulus generaliza
tion. J. exp. Psychol., 1956, 51, 7 9-88.
Guttm an, N., and Kalish, H. I. Experiments in discrimination. Sci. Am er.,
Jan. 1958, 1 9 8 ,7 8 -7 9 .
Honig, W. Generalization of extinction on the spectral continuum.
Psychol: Rec., 1 9 6 1 ,1 1 ,2 6 9 -2 7 8 .
Jenkins, H. ML, and Harrison, R. H. Effect of discrimination training on
auditory generalization. J . exp. Psychol., 1960, 59, 246-253.
Kalish, H. I., and Guttm an, N. Stimulus generalization after equal train
ing on two stim uli./. exp. Psychol., 1957,53, 139-144.
Kalish, H. I., and Guttm an, N. Stimulus generalization after training on
three stimuli: a test of the summation hypothesis. J. exp. Psychol.,
1 9 5 9 ,5 7 ,2 6 8 -2 7 2 .
Lewis, D.' J. Scientific principles of psychology. Englewood Cliffs:
Prentice-Hall, 1963.
Osgood, C. E. M ethod and theory in experimental psychology. New
Y ork: Oxford Univer. Press, 1953.
Wald, G. Eye and camera. Sci. Am er., Aug. 1950, 182, 32-41.
Wallach, H. Brightness constancy and the nature of achromatic colors.
. exp. Psychol., 1948, 38, 310-324.
- 202 -

TERCEIRA PARTE
UNIDADES COMPONENTES DO COMPORTAMENTO

10 - DISCRIMINAO
11 - REFORADORES ADQUIRIDOS
12 - ENCADEAMENTOS

Captulo 10 DISCRIMINAO

Uma caracterstica marcante dos organismos a sua habilidade para formar discrimi
naes. Definida como o responder diferencial na presena de situaes diferentes, a
discriminao contrasta com a generalizao, definida como o responder similar em
situaes diferentes.
As discriminaes so demonstradas ao nvel humano pela habilidade de distinguir
uma coisa da outra . Alguns de ns, por exemplo, discriminamos os quadros de Monet
dos de Manet, manteiga de margarina, dois grupos de impresses digitais semelhantes,
dois sinais morse semelhantes. Ao distinguir uma coisa da outra estamos fazendo nada
mais nada menos do que demonstrando um responder diferencial em suas respectivas
presenas.
Para distinguir objetos desta forma, uma certa histria passada especfica parece ser
um pr-requisito. Fazemos estas e outras discriminaes to casual e naturalmente,
todavia, que frequentemente negligenciamos a necessidade desta histria passada.
Lembre-se, do captulo anterior, que, tendo fortalecido uma resposta na presena de um
estmulo, a resposta ocorrer, embora com menor fora, na presena de outros estmulos
relacionados. Se um determinado estmulo muito semelhante ao estmulo de treino, ele
pode controlar a resposta quase to bem quanto o estmulo real de treinamento. O
procedimento de discriminao um mtodo para quebrar o controle generalizado do
responder mantido por uma ampla classe de situaes, de modo que as situaes muito
semelhantes passem a ser associadas com comportamentos muito diferentes.
Em termos de generalizao quantitativa ao longo de uma nica dimenso de
estmulo, esta diviso ou quebra determina o estreitamento de um gradiente particular da
fora da resposta em torno de um valor de estmulo: um animal treinado a bicar apenas
um disco verde e no outros, uma criana treinada a restringir o nome gato para um
nico subconjunto de animais peludos. O procedimento pelo qual tais efeitos so obtidos
direto: o reforamento de um determinado comportamento restrito a uma dada
situao. Embora este procedimento de tornar o reforamento de um operante particular
condicional existncia de uma situao o estmuloparticular seja suficientemente gerai
para incluir todas as discriminaes, h bastante variaes que merecem uma classificao
de discriminaes em termos de complexidade, como indicado pelo nmero de
situaes e estmulos e correlaes de resposta associadas requeridas. Em cada um dos

- 205-

quatro exemplos que se seguem, um comportamento diferencial est associado com


diferentes ambientes.
1 . O cinemeiro que discrimina no vai a todos os filmes que so levados ao cinema da
vizinhana. Ele vai (R) a alguns (Sa), e no vai (ausncia de R) a outros (S r).
2. DizemosquealgunsgruposdcpcssoassK) discriminadas quando elas so tratadas de
am modo diferente que outras pessoas so tratadas. Isto , o grupo discriminado (Sy\^
tratado de um modo (R a ), e outras pessoas (S r ) so tratadas de outro modo (R r )
3. O provador de vinhos profissional pode discriminar uma variedade de vinhos que
tm o mesmo sabor para o iniciante. A discriminao do profissional evidenciada por
sua habilidade em dar um nome particular (Rj R2 , R 3 ........RlOO) Para cada um dc mil
vinhos diferentes ( S j, S2 , S3 , . . S\ .000)4. Nas discriminaes sutis que um relojoeiro deve fazer quando coloca (Ry) cada
uma de uma dzia de pequenas peas no lugar apropriado (Sx), a diferena entre a
posio correta e incorreta medida em fraes de milmetros.
Cada um dos quatro exemplos ilustra um nvel progressivamente mais complexo de
discriminao. Nas discusses tcnicas que se seguem, volte atrs, quando necessrio, ao
exemplo correspondente para uma base intuitiva.
10.1 DUAS CONDIES DE ESTMULO, UMA CLASSE DE RESPOSTA
Ao analisar a mais simples de todas as possveis discriminaes, notamos que um
oiganismo emite um certo comportamento com alta tora numa situao e no emite
este comportamento em outra situao. A operao bsica para estabelecer tal discri
minao entre duas situaes consiste em reforar um determinado operante na presena,
ou depois, de um estmulo (S^), mas no liberar reforamento para este mesmo operante
na presena, ou depois de outro estmulo (SA pronuncia-se esse delta ). Dois estmulos
usados desta maneira so chamados um par de estmulos discriminativos, um positivo
(SD) e outro negativo (S A ).
Na prtica experimental, o procedimento geralmente complicado pela adio de
vrias tcnicas de controle. Algumas destas asseguram que a discriminao formada
entre os dois estmulos desejados e no com relao a outras mudanas esprias do meio.
Outras fornecem maneiras e meios para a mensurao quantitativa e contnua da fora da
resposta durante o processo de discriminao. A necessidade desses refinamentos pode
ser vista no exemplo simples de fornecer um amendoim para cada resposta de puxar a
corrente que o macaco emite, durante um perodo de 3 min, quando uma luz verde est
acesa e, ento, desligar a luz e suspender o reforamento da resposta de puxar a corrente
durante os prximos 3 min . . . . e assim sucessivamente.
1. Se o intervalo de SA mantido constante, pode ocorrer uma discriminao
temporal, permitindo que a resposta venha a ficar sob o controle de um perodo de
tempo fixo de SA . e no das propriedades ambientais de S^ Lembre-se de que os
esquemas de reforamento em FI demonstram que o tempo, correlacionado deste modo
com contingncias de reforamento, passa a controlar o comportamento efetivamente.
2. Neste procedimento, as contingncias de reforamento em S^ s'o crf. Em crf
cada uma ae uma srie de respostas reforada e a taxa de resposta torna-se uma medida
sem significado. Para todos os objetivos prticos, a taxa em crf inteiramente
determinada pela quantidade de tempo que o animal passa comendo cada amendoim.
Ass;m, quaisquer mudanas que possam ocorrer na fora da resposta durante S^ no so
detectadas.
- 206 -

3.
O macaco poderia fechar os olhos, nunca olhar para as luzes, e ainda fazer uma
boa discriminao respondendo apenas esporadicamente. A primeira ocorrncia de
reforamento para uma resposta espordica sinalizaria que todas as outras respostas
seriam reforadas por um momento. Similarmente, a primeira resposta no reforada
sinalizaria que todas as outras seriam por um momento extintas. Assim, o animal poderia
basear a discriminao na presena ou ausncia de reforamento ao invs de na presena
ou ausncia da luz verde.
Herrick, Myers e Korotkin (1959) utilizaram um procedimento instrutivo,
empregando ratos como sujeitos, no estudo da discriminao entre perodos de luz (S^)
escuros (S ^ ), alternados aleatoriamente. Para evitar a falha 1 , eles usaram perodos de
sA de durao varivel (30, 60 ou 90 seg). Para evitar a falha 2 e obter uma medida
significance da taxa de resposta durante a formao da discriminao, eles usaram um
esquema de reforamento VI 30 seg em S^. O esquema VI em S ^ evitou tambm uma
discriminao baseada no reforamento ou no-reforamento (falha 3) j que (i) no
reforado no indicava necessariamente S^ , e (ii) a obteno de um reforamento no
significa que as respostas subsequentes seriam necessariamente reforadas.
Para ajudar a simplificar a inspeo do processo comportamental que resulta de um
procedimento de discriminao desta natureza, as respostas em
c as respostas em
podem ser registradas em registradores cumulativos separados. O registrador de S ^ corre
somente enquanto o SD est em efeito, e o registrado de S^ corre somente em S^ . A
Fig. 10-1 mostra os registros de presso a barra de um rato nas sesses 1 , 6 , 1 1 , 21 e 40
no procedimento de Herrick, Myers e Korotkin. A resposta reforada foi a presso a

Tempo
Figura 10-1. Amostra de registros dirios de um rato durante alguns dos quarenta dias
de treino discriminativo (Herrick, Myers e Korotkin,1959).

barra. O dia 1 essencialmente um teste de generalizao: o rato foi treinado


originalmente em S ^ e ento, no dia 1 , S^ foi introduzido pela primeira vez, alternado
com SD A Fig. 10-1 indica que as taxas em S ^ e S^ foram quase idnticas no dia 1 :
ocorreu uma generalizao completa da taxa de respostas de S ^ para S^ (ver Fig. 9-10,
- 207 -

que e um caso comparvel). A medida que o treino discriminativo continuou, todavia, as


taxas em
e S se diferenciaram. A inclinao em
parece aumentar e a inclinao
diminuir atravs dos 40 dias do procedimento de discriminao.
Vrios comentrios podem ser feitos sobre os dois processos comportamentais
associados a S ^ e S ^ , respectivamente. O aumento na taxa em SD , provavelmente um
exemplo do fato de que a exposio a um esquema de intervalo depois de crf sempre
inicia, entre outras coisas, um aumento gradual na taxa (por exemplo, veja as curvas de
RI na Fig. 7-4), que eventualmente atinge uma assintota. Russell (1960) mostrou que se
19 sesses de treino em IV so efetuadas em SD antes do incio do treino discriminativo,
nenhum aumento na taxa em SD visto durante a discriminao propriamente dita. A
mudana na taxa em
vista na Fig. 10-1, evidentemente, no peculiar ac procedimento
de discriminao.
A segunda mudana comportamental, o declnio da taxa em SA simplesmente o
processo familiar de extino. Em
, a presso barra nunca reforada e, assim, est
sendo continuamente extinta. O processo de extino em SA , sem dvida, prolongado
por causa dos efeitos da generalizao resultantes da manuteno concorrente da fora da
presso barra em S^. A fora da resposta que ocorre em
difunde-se para S de
acordo com os princpios da generalizao. Assim, o processo de discriminao, um
procedimento onde a resposta reforada sob um estmulo (SD) e no sob outro (SA ),
representado pela diferenciao gradual das foras da resposta nas duas situaes de
estmulo.
Para medir o estado do processo de discriminao em qualquer momento
determinado, uma varivel composta conveniente pode ser formada, constituda de
ambas as taxas em
e S A . Podemos definir o ndice de discriminao (ID) como
Taxa em
lD
Taxa em SD + Taxa em
Evidentemente, quando a taxa em SD = taxa em
= K (isto , quando a fora da
resposta se generaliza completamente de S para
), o ndice torna-se

i -Jl -L
D

2A-

A medida que a discriminao prossegue, a taxa em


aproxima-se do nvl operante
(>0) e a taxa em
permanece constante (K), ou aproximadamente constante e o
ndice aproxima-se de
i
k
1
D = j = 1
Assim, a faixa til do ndice de discriminao vai de 0,5 (generalizao perfeita sem
discriminao) a 1,0 (perfeita discriminao, sem generalizao). Valores intermedirios
indicam graus intermedirios de discriminao. Valores menores do 0,5, se confiveis,
indicariam uma preferncia de taxa para a condio SA .
- 208-

Variveis compostas como o ndice dc discriminao tm um papel importante na


construo cientfica de teoria. O fsico define a densidade de uma substncia como
sendo igual a sua massa por unidade de volume (D m/v). A velocidade mdia de um
corpo em movimento uma razo entre a distncia que o corpo percorre e o perodo de
tempo (V = d/t). A prpria taxa de resposta, nmero de respostas/tempo, uma varivel
composta, j que envolve a razo de duas variveis mais simples. A justificativa para se'
formar uma varivel composta a certas outras variveis na cincia so mais simples e
informativas do que aquelas para as variveis componentes tomadas sozinhas, ento, a
varivel composta dita til . No caso do ndice de discriminao, parece claro que
nem a taxa em SD, nem a taxa em
, sozinhas, poderiam dar uma boa aproximao do
nosso conceito de discriminao. Por outro lado, alguma razo dessas duas taxas parece
estar mais estritamente relacionada com os conceitos de discriminao e podemos esperar
que a razo seja til no sentido formal descrito. Por exemplo, a Fig. 10-2 mostra que, no
estudo de Herrick, Myers e Korotkin, o ndice est de fato regularmente relacionado ao
nmero de sesses de treino de discriminao. Somos levados a inferir, pela Fig. 10-2,
que o processo de discriminao est virtualmente completo na sesso 1 5, ocasio em que
o ndice parece ter atingido sua assntota (11) 0,93).

CO

6
<D
Q
d
CO C
X
e +->cd
+
o

CO

6
<D
cd
X
cd

Figura 10-2. Mudanas no ndice de discriminao em quarenta sesses de treino numa


discriminao luz-escuro (segundo Herrick, Myers e Korotkin. 1959).

A discriminao que ilustramos chamada "'simples poique envolve um nmero


mnimo de respostas (uma) c um nmero mnimo de condies de estmulos diferentes
(duas) necessrias para demonstrar uma discriminao. A despeito desta simplicidade, tal
procedimento tem se mostrado til para avaliar habilidades e limitaes discriminativas
nos animais. Pfaffman, Goff e Bare (1958) usaram esta tcnica para medir a habilidade
do rato em detetar odores. Em S^ , uma concentrao controlada de gs odorante era
liberada na caixa de Skinner do rato. Em SD, nenhum odor estava presente. Alm disso
em SD as presses a barra eram reforadas intermitentemente com alimento, enquanto
em
no havia reforamento. Valores altos do ndice de discriminao indicariam que
o ralo estava discriminando o gs experimentalmente introduzido. Valores do ndice
- 209 -

prximos de 0,5 indicariam que pouca ou nenhuma discriminao estava sendo feita.
Com o ndice igual a 0,5, poder-se-ia dizer que o rato no detetava nenhum odor, uma
vez que ele estaria respondendo na situao
como se o gs estivesse ausente. Isto ,
sua taxa em S A seria a mesma que em SD. O lim ia r para a deteo de odor pode ser
definido como a concentrao de odor que produz um valor do ndice de discriminao
significativamente maior que 0,5. Diminuindo-se gradualmente a concentrao de gs ate'
que o Iq caia a um ponto onde no seja mais significativamente diferente de 0 ,5 , o limiar
(mnimo valor detetvel) de qualquer odor experimentalmente introduzido pode ser
determinado (Goff, 1961).
Exerccio 7.
Delineie um experimento para determinar o som mais fraco que um chimpanz pode
ouvir. Use apenas uma classe de respostas e esteja certo de no incorrer em qualquer das
trs falhas indicadas.
10.2 O PARADIGMA DA DISCRIMINAO
O
prottipo de todas as discriminaes o paradigma definido pelo caso mais
simples. Temos
DADOS: 1. Uma classe de resposta
2. Duas condies de estmulo.
PROCEDIMENTO: Reforar a resposta numa das condies de estmulo (S ^)e extinguir
a resposta na outra condio de estmulo (S^ ).
PROCESSO: As foras da resposta em S ^ e S^ se diferenciam gradualmente,
ocorrendo um processo de extino prolongada em S^
RESULTADO:O organismo passa a responder em S^ e no em S^
Ao notar o procedimento dc discriminao, desejamos expressar a
noo de que existe uma contingncia diferente para S ^ e S^ .

S
R P
- s+
i
[ 10. 1]

SA
SA
or
R />
2a

2b

No diagrama [ 10.1 ] a contingncia 1 lida: na presena de SD, se R, ento algumas


vezes S + produzido . As contingncias 2a e 2b (ambas so maneiras de representar a
mesma coisa) so lidas: na presena de S, se R, ento nenhuma mudana no ambiente.*
A contingncia 2b talvez seja lida mais convenientemente como em S^ nenhuma
resposta reforada . Evidentemente, cm termos de notao, o procedimento de
discriminao simples pode ser definido como a alternao de dois tipos de contingncias
e seus estmulos associados, como est representado nos colchetes 1 e 2 de 110 . 1 1.

- 210 -

10.3 DUAS CONDIES DE ESTIMULO, DUAS CLASSES DE RESPOSTA


Com o passar dos anos, os psiclogos projetaram uma variedade de aparelhos para
testar a capacidade discriminativa dos animais. Muitos desses envolvem pelos menos duas
respostas e pelo menos duas condies de estmulo. Um aparelho popular em sua poca
foi a plataforma de saltar de Lashley (Fig. 10-3). Neste aparelho, um rato faminto fica

Figura 10-3. Uma forma da plataforma de saltar paia testar reaes discriminativas em
ratos (segundo Lashley, 1938 ; de Munn, 1950).

sobre uma plataforma elevada de frente para janelas sua direita e sua esquerda, que
esto cobertas por cartes de papelo com desenhos. No treino preliminar, a plataforma
elevada fica perto das janelas que esto abertas, tendo os desenhos sido removidos. O rato
tem apenas que pular da plataforma, atravs de qualquer janela, para alcanar o alimento
localizado atrs do aparelho. Quando o rato acaba de comer, ele pode ser pego
novamente e colocado na plataforma para outra tentativa. Gradualmente, a plataforma
movida para mais longe das janelas, at que uma verdadeira resposta de pular tenha sido
sucessivamente aproximada (modelada). Ento, os cartes, que sero usados como
estmulos discriminativos, so gradualmente inseridos para cobrir as janelas, primeiro
parcialmente- e, depois, completamente. Um carto (algumas vezes chamado carto + )
ser preso levemente por uma mola que o solta se o rato pula em sua direo. Depois do
salto, o rato encontra-se de frente a um delicioso prato de farelo amassado. O outro
carto (chamado as vezes carto ), todavia, esta" preso de modo que, se o rato pula em

- 211 -

sua direo, ele cai na rede localizada abaixo. Essa conseqncia serve como punio para
este pulo, alm de fornecer uma tentativa de extino.
Considere um experimento em que dois cartes sejam usados:

El

Esses cartes sero alternados aleatoriamente nos dois lados, em tentativas sucessivas e a
janela que contiver o + estar destrancada, enquanto que a janela que contiver o estar
fechada. O rato se ajustar a um procedimento desta natureza numas poucas tentativas, o
que pode ser observado no aumento gradual de 0,5 para 1,0 na probabilidade de
respostas ao carto correto.
No difcil descrever as contingncias existentes em tais discriminaes; a chave
avaliar inicialmente todas as situaes de estmulos possveis. Os cartes individuais no
so estmulos por si prprios. Apenas, o seu padro particular e suas posies relativas
ajudam a definir a situao de estmulo em qualquer momento. No presente exemplo h,
antes de saltar, duas possveis situaes de estmulo:

El

sA
%
Uma vez que o experimentador tentar manter todos os outros aspectos do ambiente do
rato constantes, de tentativa para tentativa, no nos preocupamos em incluir esses aspectos
constantes na descrio das duas situaes de estmulo. Chamemos as duas situaes de
Sa e S 3 . Se ignoramos a rede, as contingncias so:
Sa
re

--> s +

RDf*
onde

Sb
R j. f*

[10.2]

R D^ S +

^ = saltar esquerda
RD - saltar direita
S+ = alimento
A comparao das notaes para a discriminao simples de | 10.1] e o presente
caso apresentado em | 10 . 2 | leva concluso de que 110.2 | uma discriminao dupla.
Se considerarmos a relaao dc somente uma resposta num determinado momento ao
reforamento alimentar, vemos que 11 0 . 2 1 se assemelha a [ 10.1 | inteiramente, mas,
em vez de uma contingncia nula prevalecer numa das duas situaes, temos uma
segunda contingncia agindo em conjuno com uma segunda classe de resposta. O
diagrama 11 0 . 2 1 confirma que os termos S^ e S^ so sempre relativos a uma
determinada resposta e devem, portanto, ser cuidadosamente qualificados quando
usados ora do paradigma simples de [10.1|. Aqui em [ 10.2 [, por exemplo, razovel
dizer que SA o S^ para saltar esquerda bem como o SA para saltar direita. Da
mesma forma, S 3 o SD para
eo
para Rp;. Em geral, quando nos referimos a
alguma situao particular como um S^ ou S-A , a classe de resposta qual tal
situao serve desta maneira, deveria ser mostrada ou pelo menos estar implcita 110
con texto.
-212-

Figura 1 04. Aparelho de puxar para macacos. Um dos blocos amarrados com barbante
ter alimento escondido atrs (Harlow, 1948).

Embora o delineamento especfico de um aparelho de discriminao com duas


respostas, dois estmulos varie para cada espcie diferente de animal, dependendo de suas
capacidades de resposta, as contingncias, de discriminao, invariavelmente, obedecem
form a geral de [10.2| . Macacos, chimpanzs, monos e crianas prestam-se
convenientemente ao uso de aparelhos que requerem respostas de manipulao (ver Fig.
10 -4 ). O fato de que a resposta do organismo possa ser dirigida ao aspecto fsico do meio
ao longo do qual o estmulo discriminativo pode ser definido, no deve permitir que se
deixe de levar em conta as contingncias comuns em todas as discriminaes. Na seo
10 . 1 , examinamos um experimento no qual ratos pressionavam uma barra quando uma
luz estava presente, mas, por convenincia experimental, eles poderiam ter apenas que
correr em direo luz. Na Fig. 10-4, o comportamento do animal dirigido a um dos
blocos e, alm disso, certas propriedades do estmulo, associadas aos prprios blocos,
controlam essa resposta. Mas, em ambos os casos, a correlao de comportamentos
diferentes com ambientes diferentes caracterizam-nos como discriminaes.
10.4

m CONDIES DE ESTMULO,
n CLASSES DE RESPOSTA

Aumentando-se o nmero de estmulos discriminativos usados aumenta-se a


complexidade da discriminao. Considere um caso em que um nico carto positivo, + e
dois cartes negativos,F~le | | | possam aparecer. As situaes possveis antes da resposta
(supondo que em cada situao uma, e somente uma, resposta possa ser reforada) so:

b
SA

e
S

B B

B B

S</

S|>
- 213 -

Em S \ e Sb, o pular a esquerda ser reforado, enquanto em Sc e Sd, o pular direita


ser reforado. O uso de cartes adicionais negativos e/ou positivos cria ainda mais
situaes e pode-se dizer que o grau de complexidade da discriminao aumenta
correspondentemente.
As discriminaes podem ser ainda mais complicadas pela especificao de
contingncias para mais de uma ou duas classes de resposta. No Wisconsin General Test
Apparatus (visto na Fig. 10-5) os movimentos de apanhar objetos a direita, esquerda e
centro so frequentemente especificados. Pode-se colocar alimento em recipientes rasos,
localizados debaixo de qualquer de trs objetos. O arranjo desses objetos serve para

Figura 10-5. O Wisconsin General Test Apparatus. As respostas do experimentador se


limitam a apresentar e retirar a bandeja de estmulo, misturar os objetos na bandeja e
colocar alimento nos recipientes que esto debaixo de alguns blocos. As respostas do
sujeito se limitam a afastar qualquer dos blocos e pegar a comida (se alguma) no
recipiente com alimento, debaixo do bloco deslocado <segundo Harlow, 1949).

definir os estmulos discriminativos. Se apresenta ao macaco a tarefa de escolher um


cubo, em vez de uma pirmide ou uma esfera e supondo-se que cada objeto deva ser
apresentado em cada tentativa, ento as possveis situaes de estmulo so arranjadas em

>

&

S.

Sc

&

(S i

Se

&

Sr
Sp
trs grupos, dependendo da localizao espacial do cubo.
- 214 -

>

Sp

10.5

MUDANAS CONTINUAS NO COMPORTAMENTO EM FUNO DE


MUDANAS CONTINUAS NUMA DIMENSO DO ESTIMULO

Ao apanhar corretamente urn objeto localizado em qualquer parte de uma mesa,


empenhamo-nos numa discriminao que no pode ser facilmente descrita por um
nmero fixo de respostas, em relao a um nmero fixo de estmulos discriminativos.
Isto porque, para cada posio do objeto sobre a mesa, um e somente um conjunto de
resposta otimamente reforado. Mas existem muitas posies possveis. Como uma
aproximao, podemos representar uma mesa dividida como um tabuleiro de xadrez,
com fileiras i e colunas j e, desta maneira, designar, artificialmente, um nmero limitado
de classes de resposta e de estmulos discriminativos possveis (ver Fig. 10-6). Suponha
que localizemos cada classe possvel de estmulos discriminativos pelo seu nmero na
fileira (i) e seu nmero na coluna (j).
Coluna j

7/7

Figura 10-6

Ento, o objeto, no momento, repousa na fileira 3 e coluna 4. A classe de estmulo


discriminativo que representa essa condio S3 ?4 e a classe de movimentos de apanhar
que sero reforados pelo contato com o objeto denotada correspondentemente como
R3 ,4 . Essa anlise pode ser generalizada como a contingncia
S,J
Rij

[10.3]

onde S = objeto na posio i, j


R = movimento de apanhar
S+= contato com o objeto
i = nmero de fileira
j = nmero da coluna
Uma vez que i e j so variveis, o Diagrama [10.3] representa um exemplo da
representao funcionai da seo 6.14. As coordenadas espaciais da classe de resposta

715 -

l igura 10-7. Quadros de uma aproximao simulada de um mssil a um alvo estratgico O bicar
de um pombo fornece o sinal de controle (de Swartz, 1963, segundo Skinner, 1960)

~ 216 -

reforada so uma funo contnua das coordenadas espaciais do objeto estmulo. No


presente exemplo, o ngulo e extenso da resposta de apanhar dependem da posio
espacial do objeto. A funo complexa, mas no h razo para se 'suspeitar que o
procedimento bsico de discriminao empregado em cada uma das outras sees deste
captulo no seja o mtodo para formao dessa discriminao, ou melhor, conjunto de
discriminaes. As respostas com determinados valores de ngulo e extenso, que caem
em certos limites pequenos, so reforadas somente quando o objeto est numa certa
posio relativa ao organismo. As respostas cujos valores de ngulo e extenso se desviam
desses limites no so reforados. ( 0 objeto no apanhado)* Tal histria passada e
subseqente controle do comportamento que ela confere posio espacial, c
imediatamente aparente quando tateamos em busca de uma lanterna no escuro, ou
quando procuramos por um lpis que cai debaixo c!e uma mesa, fora da viso.

0 comportamento envolvido quando um operador rastreia um alvo mvel o


exemplo mais sofisticado de tais discriminaes. Ao dirigir um automvel ou apontar
uma arma para um objeto que se move rapidamente, requer-se um conjunto de respostas
que deve variar continuamente com as mudanas constantes das condies de estmulo.
Embora tais discriminaes sejam complexas, elas so adquiridas atravs de uma histria
adequada de contingncias de reforamento. O projeto ORCON (ORganic CONtrol), o
resultado de um projeto de pesquisa da II Guerra Mundial, ilustra as sutilezas
discriminate as que podem ser conferidas a um organismo to pouco ilustre como o
pombo. O objetivo ORCON era treinar pombos para guiar msseis para alvos
selecionados (Skinner, 1960). Os animais eram colocados no nariz, em forma de cone,
de um mssil, frente a uma tela onde era projetada uma imagem simulada de um possvel
alvo inimigo. Presos em jaquetas especiais, os pombos ficavam imobilizados, apenas com
a cabea e o pescoo livres. Um eletrodo de ouro cobria a ponta do bico de cada pombo.
Zomo a tela em que o animal havia sido treinado a bicar era feita de um material
semicondutor, a localizao exata das bicadas podia ser detetada por um curcuito
eletrnico no mssil. A informao assim obtida seria usada para disparar o mssil.
Durante o treino, o reforamento era contingente a bicadas apenas no centro de um
alvo selecionado. Uma vez que um mssil, movendo-se numa velocidade superior a
960 km/h poderia rapidamente mover o alvo na tela enquanto o animal parasse por
alguns segundos, um esquema intermitente foi usado, mantendo uma alta taxa de bicar.
Alguns quadros de uma aproximao simulada so vistos na Fig. 10-7.0 alvo passa a ser
visto no quadro superior e o pombo comea a bicr. O animal continua a manter o mssil
em curso por vrios minutos, como visto nos outros trs quadros. Os pombos foram
treinados, com xito, a ignorar sinais esprios que aparecessem em suas telas, tais como
avies da artilharia antiarea e nuvens, e a manter o curso de apenas um dos vrios alvos
estratgicos particulares que poderiam aparecer no campo de viso.
10.6 DISCRIMINAO SEM RESPOSTAS EM SA
Em trabalhos anteriores com o procedimento de discriminao simples, Skinner
(1938) relatou que o processo de discriminao seria muito mais rpido se o
procedimento de discriminao fosse efetuado simultaneamente com o fortalecimento
original do operante. Em certos casos extremos, Skinner foi capaz de mostrar que ratos
poderiam formar discriminao luz-escuro imediatamente.

- 217 -

Sugere-se a seguinte explicao para se levar em conta este efeito. Um processo de


discriminao, tal como o descrito na seo 1 0 . 1 , prolongado principalmente devido ao
processo de extino que deve ocorrer em S^ . Mas, uma das principais variveis que
afetam a extenso de qualquer processo de extino o nmero de reforamentos
obtidos na aquisio (ver seo 5.9). Se poucos reforamentos so dados antes da
extino, esta ser rpida. No treino discriminativo, a resposta em S^ devida a
generalizao do fortalecimento em S^ * O gradiente de generalizao implica em que o
potencial de respostas em S ^ , gerado pela aquisio, ser menor que ou igual aquele
estabelecido em S^. Nesta anlise, pressupe-se uma famlia hipottica de gradientes de
generalizao, tais como os da Fig. 10-8. O parmetro da Fig. 10-8 o nmero de
reforamentos fortalecedores durante a aquisio. Note que, quanto menor o nmero de
reforamentos administrados, mais prximo S^ pode estar de SD, sem que ocorram
respostas a S A atravs da generalizao.
No procedimento de Skinner, o treino discriminativo comeou com uma luz presente
(SD). A primeira presso a barra emitida, no nvel operante, foi reforada e S^ foi
imediatamente substitudo por um perodo de 5 min de escuro (S ^ ). Depois do
perodo de 5 min em
, o S ^ foi reintroduzido e novamente a primeira resposta
emitida foi reforada, seguida pelo aparecimento do S ^ e suas conseqncias de
extino. Este ciclo foi repetido atravs do treino discriminativo. Sob essas condies, a
generalizao a
negligvel, havendo pouco ou nada para extinguir em sua presena.
Devido ao fato de que o responder em S^
no ocorre na aquisio de tais
discriminaes, elas so apropriadamente denominadas sem erro .
H.
S. Terrace (1963 a, b) estendeu essa tnica para demonstrar discriminaes sem
erro entre pares de estmulos discriminativos muito prximos no gradiente de
generalizao. No trabalho de Terrace, o princpio do mnimo fortalecimento inicial
combinado com a tcnica de usar, inicialmente, estmulos bem diferentes como S ^ e
SA e, ento, progressivamente, reduzir as diferenas fsicas entre eles.

Dimenso do Lstmulo
Figura 10-8. Famlia hipottica de gradientes de generalizao com o parmetrc
nmero de reforamentos no fortalecimento original. Cada curva representa um nmero
diferente de reforamentos no treinamento em S ^ , de 1, 2, 3 ... a n.
- 218-

O treino discriminativo iniciado com um sA bastante


diferente de
para evitar
generalizao (ver Fig. .10-8). medida que se prossegue o treino discriminativo, as
diferenas entre
e
so gradualmente reduzidas, tornando-se o
mais e mais
semelhante a SD. Isto resulta em tornar o S ^
cada vez mais prximo do SD nas suas
dimenses comuns de estmulo.
Num dos procedimentos de Terrace, o bicar um disco vermelho foi modelado e
receber poucos reforamentos. Uma discriminao entre vermelho (S^) e verde (S) foi
estabelecida, virtualmente, com nenhuma bicada em
com o seguinte mtodo:
O bicar a chave condicionado a uma luz vermelha (Sl^). Seguindo cada um dos
cinco primeiros reforamentos, a luz da chave era sempre vermelha. Depois do
quinto reforamento, a chave foi obscurecida por 2 seg, depois do que a luz vermelha
aparecia novamente. Seguindo os 20 prximos reforamentos, o intervalo (escuro)
foi progressivamente aumentado at o intervalo mximo de 30 seg, com uma mdia
de 15 seg, ser alcanado. Neste ponto, o S ^ foi introduzido. Inicialmente, S era
uma luz verde fraca com 1 seg de durao. Durante tentativas sucessivas em SA , sua
durao e intensidade foram aumentadas progressivamente, at que a durao de
S A fosse de 5 seg e os brilhos de SD e S ^ fossem iguais (Terrace, 1963, b, p.
224).
O mtodo de treino discriminativo de fortalecimento mnimo em S&,com reduo
, parece ter um nmero de vantagens. Lm
primeiro lugar, parece que tais discriminaes so formadas bem mais rapidamente do
que aquelas em que se emprega os procedimentos das sees 10.1-10.5. Segundo, o valor
assinttico de Id provavelmente mais prximo de 1 ,0 com esta tcnica. Terceiro, desde
que poucas respostas, ou mesmo nenhuma, ocorrem em S ^ , no h os efeitos
emocionais caractersticos da extino nessas discriminaes sem erros. Os distrbios que
caracterizam esses efeitos emocionais (discutidos mais amplamente no captulo 18) so
geralmente indesejveis na aprendizagem de habilidades e discriminaes cotidianas.
Ento, o mtodo de treinamento de discriminao sem erro pode ter um emprego
importante na tecnologia educacional.
progressiva de diferenas entre

10.7 TEMPOS DE REAO DISCRIMINATIVOS


A histria caracterstica do treino discriminativo S ^ - S A estabelece controle de
estmulo sobre os operantes. A medida que S ^ passa a controlar, progressivamente, seu
operante, o tempo entre o aparecimento de S ^ e a ocorrncia do operante diminui. Este
tempo, anlogo latncia do reflexo S2 > R 2 > chamado tempo de reao
discriminativo (RT). Sob certas condies, o RT discriminativo pode ser um ndice da
fora de uma resposta, ou do estado de um processo de discriminao. Durante o
treinamento SD - S^ do tipo descrito nas sees 10.1 e 10.2, o RT diminui
progressivamente, aproximando-se - no rato - de uma assntota de cerca de 1 seg.
Existe uma vasta literatura sobre RTs assintticos em discriminao humana na
medida em que se relacionam complexidade da situao de estmulo, nmero de
contingncias possveis, dificuldades em discriminar S ^ e S ^ , intensidade de SD,
administrao de drogas, etc. O RT discriminativo do frear quando ocorre uma situao
onde um acidente pode acontecer, tem sido de algum interesse para as ^osquisas de
- 219 -

segurana de estradas. Como se sabe, este RT pode variar de uma pequena frao de
segundo at vrios segundos, dependendo de fatores tais como a concentrao de lcool
no sangue, nmero de horas na direo e presena ou ausncia de cafena no sangue. No
laboratrio, os tempos de reao so frequentemente medidos dando-se instrues a um
sujeito humano para pressionar uma chave telegrfica to rpido quanto possa, depois de
receber um sinal. Tempos de reao da ordem de pequenas fraes de segundo (200
500 milisegundos) so obtidos com tal procedimento, particularmente se o sinal de
Prepare-se precede o sinal verdadeiro para responder .
No comportamento cotidiano, a maioria $e nossas respostas no emitida sob
condies favorveis tais como as do labortrio e a necessidade de uma reao
muito rpida apenas ocasional, como no atletismo, combate militar e controle de
mquinas como o avio e o automvel. Por vrias razes, os valores alcanados em
experimentos humanos de tempo de reao raramente so aproximados, mesmo
nessas circunstncias. Os sinais de aviso frequentemente esto ausentes;pode-se no
saber de que direo est vindo o estimulo; geralmente, a pessoa est empenhada em
fazer outra coisa quando a resposta subitamente requerida; a resposta pode
envolver a ao de grandes grupos de msculos em vez de pequenos grupos; o
estmulo pode ser muito fraco, ou to forte que causa a imobilizao , e assim por
diante. Ento, um grupo de jogadores de futebol americano pode levar em mdia at
400 mseg para desfazer uma formao de jogo a um sinal auditivo; e o tempo de
reao de motoiistas de automvel pode aumentar de vrios segundos quando a
ameaa de um acidente requer uma mudana do p do acelerador para o freio
(Keller e Schoenfeld, 1950, p. 146).
10.8 AS IMPLICAES DO CONTROLE DE ESTIMULO OPERANTE
Passando do simples para o complexo, tentamos mostrar os mtodos pelos quais o
estado do ambiente imediato passa a controlar uma resposta operante. Operantes sob tal
controle so chamados operantes discriminativos. Quando o rato salta para o carto
apropriado, quando o macaco puxa o barbante correto, quando a criana pega um objeto
e quando freamos o carro diante de uma luz vermelha a resposta emitida est sob um
poderoso controle de estmulo. Logo, um operante discriminativo e o controle de
estmulo depender, em cada caso, de uma histria anterior com os tipos de
contingncias de reforamento descritos nas sees de 10.1 a 10.5.
A natureza do controle de estmulo operante tal que, no apenas a ocorrncia da
resposta, mas tambm certas propriedades d? resposta, podem vir a ser controladas pelo
estmulo, dada uma histria passada particular de reforamento. No controle de
respondentes por eliciadores, as propriedades da resposta tais como magnitude, durao e
latncia so uma funo fixa do eliciador, determinada pelas leis do reflexo. No controle
de estmulo operante, no existe uma relao nica entre a intensidade de S ^ e as
propriedades da resposta tais como durao e RT. Por exemplo, a magnitude da resposta
reforada pode ser, dentro de amplos limites, qualquer uma que as contingncias
especifiquem que seja. Assim, poderamos construir um operante discriminativo que
imitasse as leis do reflexo. Reforando-se adequadamente qualquer resposta determinada,
a presso barra ou a expresso por favor , por exemplo, na presena de uma luz ou
um tom, por exemplo, a fora da resposta reforada poderia ser diferenciada de modo a

- 220 -

s+

sr

[10.4]

ser proporciona] intensidade do estmulo prevalecente. Podemos representar isso, em


notao, como onde y a fora da resposta e x a intensidade do estmulo, sendo y
definido como proporcional a x. Um observador, olhando o organismo assim treinado, e
que no conhece sua histria com as contingncias de [10.4] poderia ser inclinado a
chamar a resposta observada, Ry, de um respondente. Note que este erro decorre ao se
negligenciar a histria passada relevante desse organismo. Para evitar estas interpretaes
erradas, deve-se sempre ter cautela ao considerar exemplos de comportamentos fora do
laboratrio. Frequentemente, a histria passada relevante no pode ser descoberta. Nosso
prprio comportamento discriminativo, por exemplo, to familiar, to automtico, que
provavelmente no nos lembramos de como foi adquirido.
Como um exerccio instrutivo, considere uma regra de contingncia em que o inverso
da lei da magnitude do reflexo poderia ser obtido, tornando-se o y de [ 10 .4| = l/x . O
resultado, agora, seria criar uma R cuja magnitude fosse uma funo inversa da
intensidade do estmulo discriminativo na presena do qual ocorreu. Talvez, fique claro,
com este exemplo, porque a magnitude da resposta no uma medida adequada do
fortalecimento operante. A magnitude da resposta pode ser modelada arbitrariamente,
dependendo das contingncias de reforamento.
Uma vez que uma discriminao operante de qualquer tipo tenha sido formada,
controlar a ocorrncia de SP uma forma de controlar a ocorrncia da resposta. Depois de
40 sesses de treino discriminativo, para fazer com que ratos como os de Herrick, Myers
e Korotkin, pressionem uma barra basta somente apresentar a luz. De forma similar, para
fazer com que ratos como os de Pfaffam, Goff e Bare pressionem uma barra,
necessitamos somente retirar o odor de suas cmaras e apresentar ar fresco. Para fazer um
homem se mover, pedimos que ele se mova. Em todos esses casos, a resposta est sob o
controle de um estmulo anterior (a luz, o ar fresco ou o pedido), mas a relao da
resposta com o estmulo difere consideravelmente daquela do respondente com seu
eliciador. Em primeiro lugar, as leis do reflexo no se mantm entre o
e sua R.
Aumentos na intensidade de
diminuiriam a probabilidade de R, de acordo com o
princpio de generalizao. (Tente gritar seus pedidos s pessoas). Em segundo lugar, a
relao entre
e R depende da histria de discriminao. Essa histria dificilmente
pode ser ignorada, porque sem ela um
no poderia obter seu status de varivel
controladora do comportamento. Para distinguir entre o tipo de controle que os
eliciadores tm sobre seus operantes, dizemos que um
estabelece a ocasio para uma
resposta, isto , estabelecida uma ocasio onde a emisso de R produz reforamento.
10.9 A S1GNIFICNC1A DAS DIFERENAS ENTRE DUAS MDIAS
Existem ocasies em que o comportamento em S ^ e SA to semelhante que
assegurar a presena ou ausncia do responder diferencial, o sine qua non de uma
discriminao, pode ser difcil. O responder muito similar em SD e em S A pode ocorrer
quando o organismo no adquiriu o comportamento de observao adequado, quando
SD e SA so muito semelhantes, quando influncias que tiram a ateno esto
presentes, e assim por diante. Se as diferenas entre as taxas de resposta em S^ e S A so

- 221 -

r
pequenas, o experimentador pode ficar inseguro se qualquer discriminao est sendo
feita.
O problema de avaliar pequenas diferenas numricas transcende as discriminaes.
Sempre que dois grupos de medidas de qualquer tipo so muito semelhantes, ou h
bastante variabilidade entre elas de modo que elas se sobreponham apreciavelmente,
aparece uma necessidade de uma avalizao objetiva das diferenas numricas
observadas. So as-diferenas observadas, embora pequenas, atribuveis aos efeitos sutis,
mas possivelmente, teroricamente importantes, de condies experimentais diferentes, ou
so apenas o produto de erros casuais de medida?
Considere os dados da Tabela 10-1, indicados como histogramas na Fig. 10-9. Esses
dados so 60 taxas fictcias de resposta que poderiam ter sido obtidas em 60
apresentaes de um minuto das condies S ^ e SA 5 alternadas ao acaso. Se isto ajuda a
tornar a discusso completa, considere S ^ como perodos de 1 min de ar fresco e S ^
como perodos de 1 min de concentrao muito baixa de gs odorante, e o sujeito
fictcio como um dos sujeitos de Pfaffman, Goff e Bare discutidos na seo 10-1. Os
dados das condies em S ^ e S ^ so claramente semelhantes. H uma superposio
substancial entre os dois histogramas da Fig. 10-9. Muitas respostas so emitidas em SA
Tabela 10-1
NMERO DE RESPOSTAS REGISTRADAS EM 60 PERODOS DE
ALTERNADOS AO ACASO. OS VAI ORES DE
SA ESTO EM NEGRITO (DADOS HIPOTTICOS)

1 MIN DE SD E S A ,
25

21
25

30
27

26
27

11

22

37
26

25

13
25
25

24
23

22

29

15

11
25
8

30
25
27

28

20
20

24
29
28
19
32
31

27

16

23
19

26
27
26
23

6
23
21

29

24
26
23
6

27

26

24

22

25

25
19

16

.5
'5c
ocr
tt>
-H
u,

10

15
20
f25
Nmero de respostas emitidas em
intervalos de teste de 1 min.
1'igura 10-9. Histogramas do nmero de respostas emitidas em 30 perodos de um
minuto de sA (acima) c 30 perodos <te um minuto dcSD (cmbaivo) Dados fictcios

- 222 -

a discriminao entre ar fresco e odor, se existe, mnima. Contudo, existem,insinuaes


de uma diferena entre o responder em
e
.A distribuio em SA est mais
esquerda da discriminao S ^; a distribuio em
contm a taxa mais baixa (0
respostas) enquanto a distribuio em
contm a taxa mais alta (36 respostas); as
modas das duas distribuies no so idnticas; a mdia da distribuio em S A 20,7
respostas/min e a da distribuio em
24,7 respostas/min.
So as diferenas nestas duas distribuies o resultado de erros casuais de medida ou
elas so, de fato, indicaes significantes de uma pequena discriminao? Neste ponto,
til lembrar alguns aspectos pertinentes da assim chamada curva normal, discutida na
seo 2.6 e reproduzida na Fig. 10-10. Em particular, desejamos lembrar que entre mais
ou menos um certo nmero de unidades de desvio padro, 0 do centro, encontra-se
uma certa percentagem de medidas contidas na rea sob tal curva. Para rever, 68 por
cento das medidas se encontram sob a curva entre + 1 O da mdia central. Uma maneira

Figura 10-10. A curva normal.

alternativa de expressar esta propriedade dizer que, se estivssemos retirando


aleatoriamente amostras de medida desta distribuio normal, a probabilidade de se obter
uma medida que se encontre dentro desta regio seria de 0,68 e a probabilidade de se
obter medidas que se encontrem fora desta regio seria de 0,32. Similarmente, 95 por
cento das medidas esto entre . 2 O da mdia. Ento a probabilidade de se obter uma
medida fora desta regio t 2 O apenas de 0,05.
Agora, suponha que as nossas medidas da taxa de resposta em S ^ e S na Fig. 10-9
representem amostras de medidas tiradas de uma populao de dezenas de milhares de
medidas potenciais e cuja distribuio seria parecida com a curva normal na Fig. 10-10.
Esta distribuio normal teria um certo O a ela associado que descreveria sua
variabilidade devido a erros de medidas. Se tivssemos esta distribuio ao nosso alcance
e nos fosse dado ainda uma nica medida da taxa de resposta sobre a qual nada
saberamos, exceto o seu valor e se nos perguntassem, subsequentemente, se tal medida
pertence aquela distribuio, poderamos dar uma resposta significativa em termos de
probabilidade. Precisamos apenas verificar de quantas unidades C esia nova medida se
desvia da mdia da distribuio normal e dizer, ento, qual a probabilidade de que ela
pertena a esta distribuio. Suponha que tal medida se encontre na regio sob a curva
fora da linha limite de exatamente 2 O acima da mdia. Ento, a probabilidade apenas
0,05 de que ela faa parte da distribuio porque 0,95 (95%) dos valores desta
- 223 -

distribuio esto entre + 2 CJ e somente 0,05 (5%) esto ora. Esta proposio no diz
que a medida dissidente no veio desta distribuio; poderia ter vindo. Somente diz que
algo improvvel que ela tenha vindo.
i
Nosso problema presente tem alguns elementos em comum com a avaliao de uma
nica medida nova em referncia a uma distribuio conhecida. Avaliando nossos dados
de discriminao no temos apenas uma comparao de uma medida com uma distri
buio de medidas, mas uma comparao de duas distribuies separadas (S^ e SA) de
medidas. O que gostaramos de saber se a distribuio em S^ difere sistematicamente,
embora pouco da distribuio em S^.
Uma maneira proveitosa de abordar este problema investigar se as mdias das duas
distribuies diferem significativamente uma da outra. Em outras palavras, ser que a
diferena de 4,0 entre 20,7 e 24,7 representa apenas flutuaes ao acaso na taxa de
resposta momento-a-momento que, por acaso, foi detetada na nossa diviso arbitrria da
sesso em perodos de S ^ e S A e, no que diz respeito ao rato, S ^ e S A
constituem tratamentos iguais? Ou, ser essa diferena de 4,0 o resultado das condies
SD realmente terem um efeito diferente de SA sobre a tendncia do responder?
Uma maneira laboriosa de determinar a interpretao mais plausvel seria fazer mais
sesses adicionais e idnticas do nosso experimento, mas usando um valor para SA que
sabemos estar muito prximo de S ^ para ser discriminavelmente diferente dele (por
exemplo, S ^
sA), de modo que quaisquer diferenas nas taxas em S^ e S ^ teriam
que ser devidas apenas ao acaso. Essas sesses adicionais dariani um grande nmero dc
novas mdias de taxas de resposta em S^ e sA . Poderamos subtrair a mdia de
da
mdia de S A para a sesso e obter uma diferena; poderamos subtrair a mdia dc SD da
mdia de SA para a sesso 2 e obter outra diferena e assim, sucessivairente, para todas as
sesses que tivssemos a pacincia de realizar.
Terminaramos com um conjunto de nmeros, as diferenas entre as mdias emSD e
S ^ . Poderamos fazer um grfico da distribuio dessas diferenas entre as mdias (os
estatsticos nos asseguram que resultar numa curva normal) e calcular o desvio padro, o
sigma das diferenas entre as mdias da amostra, O Md. Note que esta distribuio das
diferenas entre as mdias da amostra deve ter o centro em torno de zero se, ao manter
nossas condies experimentais constantes de sesso a sesso, nenhuma discriminao foi
possvel entre S^ e sA . As diferenas observadas entre as mdias obtidas de sesso para
sesso seriam, neste caso, apenas aquelas resultantes de flutuaes no responder, devido a
influncias no controladas, mas presumivelmente no sistemticas, que poderiam ser
tanto positivas quanto negativas em qualquer momento. Com a adio de sesses, elas se
cancelariam mutuamente, deixando-nos uma diferena mdia entre as mdias igual a
zero.
Uma vez com essa distribuio das diferenas entre as taxas mdias de resposta
durante perodos de S ^ e S A no discriminveis, poderamos, ento, comparar o nosso
valor observado de 0,4 com a distribuio das diferenas casuais entre as mdias, para ver
se 4,0 est alm de 2 (T Md unidades do centro em zero. O mtodo seria o mesmo atravs
do qual comparamos uma nica medida com uma distribuio conhecida.
L)e fato, no prtico e nem econmico repetir estes experimentos de controle
ta.nlas vezes para obter uma estimativa razovel de como a distribuio das diferenas
entre as mdias da amostra se apresentaria no caso onde houvssemos arranjado
anteriormente para que as amostras no diferissem consideravelmente, exceto por acaso.
Na prtica, podemos nos valer de uma derivao da estatstica matemtica que mostra
- 224 -

que uma estimativa do desvio padro crtico, O Md, pode ser obtido com um pouco dc
matemtica aplicada s nossas 30 medidas originais em SD e S A.
O que devemos fazer primeiro calcular o desvio padro do conjunto das 30 taxas
observadas em
e o desvio padro do conjunto das 30 taxas observadas em SA dos
dados da Tabela 10-1. Combinamos, ento, esses dois desvios padres obtendo um desvio
padro combinado (chamado cr D para distinguir de outros desvios padres) que para os
dados da Tabela 10-1 =9,15. Neste ponto aplicamos uma frmula estatstica, com cuja
origem no precisamos nos preocupar, para obter uma estimativa de o
o desvio
padro das diferenas entre as mdias da resposta em SD que esperaramos obter se
repetssemos o experimento por muitas sesses. A frmula diz que CTj^ estimado por
cr D /V N - onde N o nmero de pares de medidas que temos, neste caso, 30. O
resltado, 9,15/ V 30 = 1,67, pode ser usado para determinar a probabilidade de que a
nossa diferena mdia particular observada, 4,0, aparece apenas devido a erros envolvidos
ao se medir as taxas de resposta em S^.
Evidentemente, 4,0 maior que duas unidades do tamanho de 1,67. Isto , a
diferena obtida, + 4,00, encontra-se na regio (+ 4,00 / 1,67) a
unidades acima da
mdia da distribuio terica das diferenas esperadas apenas por acaso. (Lembre-se de
que a mdia desta distribuio terica, para o caso onde h somente erros casuais em
para perturbar as medidas da taxa da resposta em
zero). Realmente, uma
diferena to giande como 4,0 entre duas mdias
seria esperada surgir devido ao acaso
menos que 5% das vezes. Uma diferena observada to improvvel de surgir devido a
erros casuais de medida convencionalmente dita estatisticamente significante. neste
sentido tcnico que, quando nos referimos a resultados numricos neste texto, a palavra
significncia empregada.
Iniciamos com uma certa diferena pequena entre duas distribuies de taxa de
resposta. Utilizando certas propriedades da curva normal e certas derivaes da estatstica
matemtica, fomos capazes de encontrar a probabilidade do que uma diferena entre as
mdias de duas distribuies observadas de dados fosse to grande quanto o seria se
atribuda apenas a erros casuais. Ao fazer assim, avaliamos a significncia estatstica da
nossa diferena. A tcnica usada foi encontrar, primeiro, um desvio padro combinado
representando a variabilidade em
e SA e, segundo, desta estatstica derivar o O
O
mtodo supe que nmeros iguais de medidas sejam feitos nas duas condies. Esta
restrio pode ser superada pelo uso de outras frmulas, algo menos intuitivas,
encontradas em qualquer livro elementar de estatstica. Em geral, os mtodos para
stimar a probabilidade de que as diferenas observadas entre duas mdias so devidas a
erros casuais de medida so usados onde ( 1 ) as diferenas observadas so pequenas, ( 2 ) a
variabilidade de medidas alta como um resultado de perturbaes no controladas ou
no controlveis, (3) o tempo no permite a replicao do experimento bastante vezes de
modo a fornecer uma base emprica para estimar a confiabilidade das diferenas
encontradas entre as condies experimentais.
REFERNCIAS PARA O CAPITULO 10
Goff, W. R. Measurement of absolute olfactory sensitivity in rats. Amer.
J. Psychol., 1961, 74, 384-393.
Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews
(E d .), Methods of psychology. New York: Wiley, 1948.

- 225-

Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56,


51-65.

Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in S and


SA rates during the development of 'an operant discrimination. / .
comp, physiol. Psychol, 1959, 52, 3 5 9 - 3 6 3 .
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. N e w York:
Appleton-Century-Crofts, 1950.
Lashley, K. S. The mechanism of vision X V . Preliminary studies of the
rats capacity for detail vision. J. gen. Psychol. 1938, 18, 1 2 3 - 1 9 3 .
Mienson, J. R. Random interval schedules of reinforcement. J. exp.
Anal. Behav., 1963 6, 4 3 7 - 4 4 3 .
Munn, N. L. Handbook of psychological research on the rat. Boston:
Houghton Mifflin, 1950.
Pfaffman, C., Goff, W. R., and Bare, J. K. An olfactometer for the rat.
Science, 1958, 12 8, 1 0 0 7 - 1 0 0 8 .
Russell, I. S. Analysis of the responding during operant discrimination.
Unpublished doctoral dissertation, Indiana Univer., 1960.
Skinner, B. F. The behavior of organisms. Chapter 5. N e w York: A ppleton-Century, 1938.
Skinner, B. F. Pigeons in a pelican. Amer. Psychol., 1960, 15, 2 8 - 3 7 .
Swartz, P. Psychology the study of behavior. Princeton: Van Nostrand,
1963.
Terrace, H. S. Discrimination learning with and without errors. J. exp.
Anal. Behav., 1963a, 6, 1 - 2 7.
Terrace, H. S. Errorless transfer of a discrimination across two continua.
J. exp. Anal. Behav., 1963b, 6, 2 2 4 - 2 3 2 .

- 226 -

Captulo 11 REFORADORES ADQUIRIDOS

fcil notar, mesmo com um exame rpido do mundo que nos cerca, que algumas
das conseqncias especiais que denominamos reforadoras tm uma primazia mais
natural ou biolgica do que outras. Poucos discutiriam que alimento, gua e sexo estar
numa categoria diferente
mais bsica do que livros, dinheiro e automveis. Mesmo
assim, os organismos, uma vez ou outra, trabalham por todos esses. Podemos distinguir
essas duas categorias pelo modo em que o organismo chega a possuir uma suscetibilidade
ao reforamento. Para cada indivduo, existe uma classe de reforadores cujos poderes
so meramente uma conseqncia biolgica da filiao do indivduo a uma certa espcie.
Esses reforadores so uma propriedade das espcies tanto quanto as manchas do
leopardo, a pele do gato a cauda do cachorro. As suscetibilidades ao reforamento que so
c o n stru d as no organismo deste modo definem os reforadores primrios ou
incondicionados. Eles sero discutidos em captulos subsequentes sobre Motivao. Para
o presente, voltamo-nos para um segundo grupo de reforadores, secundrios , que
parecem mais variveis e menos previsveis de indivduo para indivduo, comparados com
os do primeiro grupo.
Dinheiro, carros, lpis, jornais, prestgio, honra e um sem n&mero de outras coisas
arbitrrias que os seres humanos trabalham para obter, constituem uma grande fonte de
reforadores fidedignos e potentes. Mas essas coisas no tm valor algum para ns quando
nascemos. Claramente, elas devem ter adquirido sua capacidade para reforar em alguma
ocasio durante a histria passada de cada indivduo. Uma histria passada individual
um pr-requisito; prova disto aquele adulto ocasional para quem alguns dos refor
adores convencionais parecem no ter valor algum. Neste sentido, o outro tem pouca
importncia para um monge Trapista, um homem primitivo dificilmente lutaria por uma
cpia do New York Times e nem todos gostam de Brahms.
Dinheiro, material impresso e os trabalhos de um compositor particular no tm o
valor universal do alimento, gua e sexo, embora para um dado indivduo sua atrao
possa parecer igualmente forte. Como mostraremos em seguida, os reforadores
adquiridos obtm seu poder para fortalecer e manter o comportamento em virtude de
uma histria passada de associao com reforadores primrios. sua dependncia sobre
essa histria condicional para que tenham poder de reforar que lhes d o nome de
reforadores condicionados.

- 227 -

Os reforadores condicionados parecem ser especialmente difundidos na manutenao


do comportamento humano. Realmente, eles esto ligados com a prpria noo de
cultura humana. Contudo, eles so facilmente cultivados em sujeitos animais no
laboratrio, onde as condies exatas para o seu estabelecimento e a medida precisa de
suas foras relativas podem ser quantitativamente estudadas.
11.1

AS P R O P R I E D A D E S R E F O R A D O R A S
DISCRIMINATIVOS POSITIVOS

DOS

EST MULOS

Antes do fortalecimento da resposta de presso barra de um rato faminto ou o


bicar a chave de um pombo faminto, loma-se, geralmente, cuidado para antecipar cada
instante de fornecimento de alimento por um breve clique e um flash de luz que emanam
do lugar onde o alimento fornecido. Uma vez que o alimento est disposio somente
aps a combinao clique-luz, este procedimento suficiente para tornar o clique-luz um
estmulo discriminativo positivo (S^) para a resposta de aproximao ao comedouro.
Mas, alm de tornar a situao clique-luz um S ^, um produto colateral inevitvel deste
procedimento de discriminao dar ao clique e luz um poder de reforar. Este poder
explorado, permitindo-se que a presso barra ou o bicar da chave produzam o S^.
Deste modo, podem-se fornecer resposta conseqncias mais imediatas do que seria
possvel com o alimento em si. O rato leva algum tempo para mover-se da barra para o
comedouro e comer; mas o estmulo clique-luz pode alcan-lo mesmo antes de ter
retirado as patas da barra. Este tipo de reforamento imediato, proporcionado pelo
reforador secundrio clique-luz, essencial para produzir o fortalecimento rpido do
operante (ver Fig. 4-2).
O procedimento para demonstrar o poder reforador da combinao clique-luz pode
ser representado como uma notao de duas fases: ( 1 ) estabelecer o clique-luz como um
SD pelo mtodo usual de discriminao:
SA
Ri />

R, -+ S +

onde SD =
SA =
S+ =
R, =

clique-luz
ausncia de clique-luz
alimento
aproximao ao comedouro

(2) Ento, em S ^ , permitir que uma resposta no fortalecida anteriormente, por


exemplo, presso a barra, produza o estmulo discriminativo positivo, S ^, retirando-se,
ao mesmo tempo, o reforador primrio final.
SA
[Sn
Ri /"* Rj -f>
R 2 ----->
2

onde R 2 = presso barra.


-2 2 3 -

[111]

Para testar a eficcia do


clique-luz como agente reforador independente, o
reforador primrio deve estar ausente. Na medida em que o alimento ocorrer no final da
seqncia, o fortalecimento de um novo operante (em | 1 1 . 1 | , presso barra) pode ser
inteiramente devido ao do reforador primrio; o clique-luz, por si s, pode ser
irrelevante.
claro que, durante o teste de 111 - 1 1 , a extino da resposta de aproximao ao
comedouro proceder concorrentemente comquaisquer efeitos de fortalecimento que c
procedimento possa estar exercendo sobre a presso barra. Assim mesmo, o resultado
experimental de 111.1| inequvoco. A resposta de presso barra existindo
anteriormente numa taxa baixa no nvel operante, rapidamente forlalccida apenas pelo
SD clique-luz. A resposta barra condicionada a despeito do fato de nenhum alimento
estar sendo apresentado, e*a despeito do fato de a resposta ao comedouro estar,
simultaneamente, em processo de extino. Na Fig. 11-1, so vistas curvas cumulativas de
quatro ratos neste procedimento. Pela primeira vez na histria de condicionamento dos
ratos, cada presso barra produziu uma conseqncia especial - o
para aproximao
ao alimento., Durante o tempo em que a Fig. 11-1 foi registrada, o alimento nunca
apareceu Comprrada* r.nm curvas de fortalecimento com reforamento primrio (por
exemplo, alimento), as curvas so mais variveis e mais negativamente aceleradas (ver Fig.
4-2). Da observao do aumento geral na taxa de presso barra visto na Fig. 11-1,
todavia, no h dvida de que tornar o
contingente a presso barra, serve,
temporariamente, para condicionar o operante. As curvas do fortalecimento apenas pelo
clique-luz tomam a forma geral das curvas de extino. Isto nada tem de surpreendente
porque, simultaneamente com o condicionamento de R2 (presso l\ barra) por SD? Rj
(aproximao ao comedouro) est sendo extinta. Logo, o
est perdendo,
concorrentemente, seu poder para agir como
para Rj e, por inferncia, tambm o
valor reforador adquirido. Esta perda uma conseqncia inevitvel do teste de
reforamento secundrio.
11.2

COMO AUMENTAR A DURABILIDADE DE REFORADORES CONDICIONA


DOS

O princpio do reforamento adquirido foi entusiasticamente recebido pelos


primeiros behavioristas que viram nele a chave para a explicao das atividades sociais
complexas que, no homem , parecem medrar na ausncia de reforamento primrio. O
reforamento condicionado parecia uma explicaco pronta para comportamentos sociais
tais como o gregarismo ou cooperao e valores sociais tais como a conquista de
prestgio, poder ou riqueza. Mas, na investida para contrapolar os conceitos de
aboratrio sobre reforamento condicionado para o campo social, raramente se
esclareceu que permaneciam ainda por realizar demonstraes experimentais poderosas
do reforamento secundrio. As curvas de Skinner (1938) (Fig. 11-1) eram uma
demonstrao bastante genuna de que os S^s tornavam-se realmente reforadores
secundrios. Mas a produo de comportamentos mantidos pelo S ^ como um reforador
condicionado era da ordem de 50 respostas em 45 min uma produo desprezvel e,
certamente, uma demonstrao no muito convincente de que os reforadores
condicionados do laboratrio poderiam, mesmo remotamente, ser a base dos incentivos
sociais da vida humana. Por algum tempo, as tentativas dos pesquisadores, utilizando
pistas, labirintos e barras, para produzir reforadores secundrios mais poderosos, que
pudessem modelar e manter o comportamento por longos perodos sem os reforadores
- 229 -

Tempo (minutos)
Figura 11-1. Fortalecimento de um operante cie presso barra em quatro ratos
famintos, quando o nico reforamento o
que anteriormente determinava a
ocasio para a aproximao ao comedouro (Skinner, 1938).

primrios, obtiveram pouco sucesso. E s recentemente foram descobertas tcnicas para


ampliar a durabilidade de reforadores condicionados a um nvel em que se pudesse
atribuir, de forma razovel, ao conceito experimental um papel importante na teoria da
atividade humana.
A habilidade para demonstrar o reforamento adquirido de uma forma convincente
esperou o desenvolvimento dos procedimentos de reforamento intermitente, isto ,
esquemas de reforamento e as especificaes de operantes de ordem superior. A
intermitncia desempenha dois papis crticos na ampliao dos efeitos dos reforadores
condicionados. (1) Usada para programar o reforamento primrio (por exemplo,
alimento) para um operante discriminativo no treino
, ela pode construir uma
alta resistncia extino do operante discriminativo (Rj na cadeia de 111 -11 \ 0
mtodo consiste simplesmente em se alternar o conjunto de contingncias.
S

[SA
e

|R,

-h

O resultado o de limitar a emisso de R \ a


e, alm disso, j que a contingncia 2
probabilstica, desenvolver uma resistncia potencial extino muito forte de R i em
S^. (2) Usada ao se testar o valor reforador de S^, a intermitncia imposta entre a nova

- 230 -

R a ser condicionada e o SD contingente conserva o poder do reforador secundrio. O


mtodo consiste, simplesmente, em deixar a nova R produzir o
probabilisticamente,
R2 - -> SD, ou alternativamente, incorporar R em um operante de ordem superior, nR
SD Uma intermitncia bem escolhida, aqui, no somente ir conservar o poder de S^,
mas manter tambm uma alta taxa de R2 . A conservao do poder de S^, neste
procedimento, deriva de sua infreqncia de ocorrncia.
no perder seu controle
sobre R] at que R[ tenha ocorrido um certo nmero de vezes(jem reforamento) na
presena de SD. Se SD aparece infrequentemente, Ri temapenas oportunidades
infrequentes para enfraquecer.
Numa variante deste mtodo, empregada por D. W. Zimmerman (1957,1959), ratos
famintos foram treinados a correr numa pista, obtendo alimento na caixa-objetivo, no
final. Uma tentativa na pista iniciava-se quando o rato era colocado na caixa de partida.
Uma campainha soava brevemente, a porta da pista se levantava e o rato podia correr at
a caixa-objetivo. O tempo de reao (RT) entre o som da campainha e a resposta de
entrar na caixa-objetivo foi medido. At aqui este procedimento consiste de
S"D

R , -------> S +
onde SD = som da campainha na raixa de partida e porta aberta
R i = correr para a caixa objetivo
S+ - alimento
Quando o RT havia se tornado assintoticamente pequeno (depois de cerca de 30
tentativas), o alimento era omitido em algumas tentativas. Isto , o operante
discriminativo de correr foi colocado num esquema probabilstico de reforamento:
S
R,

>S '

Nas 60 tentativas seguintes, essa probabilidade foi gradualmente diminuda de 0,5 para
cerca de 0,2. Isto , no final de 90 tentativas do treino de correr, somente cerca de 1
corrida em 5 terminava com alimento. Nas outras quatro corridas, o rato encontrava a
caixa-objetivo vazia. Mesmo assim, o RT de correr campainha permaneceu curto; a
campainha e a abertura da porta continuaram a agir como um S& para uma resposta
vigorosa e veloz na pista. A situao neste ponto reminiscente do nosso prprio
comportamento ao atender ao telefone. Embora somente poucas das chamadas possam
ser realmente dirigidas a ns, o comportamento de atender permanece (como o
comportamento de correr dos ratos de Zimmerman) com alta fora.
Seguindo essas 90 tentativas do treino de correr, o alimento foi permanentemente
removido e instalou-se uma barra na caixa de partida. Uma tentativa iniciava-se com o
rato sendo colocado na caixa de partida como de costume, mas agora a campainha e a
abertura da porta tornaram-se contingentes unicamente presso barra. Usando o S^
campainha-abertura da porta como o nico reforamento, Zimmerman modelou
progressivamente um operante FR de 15 presses barra em trs sesses de 90 min.
Durante as 11 sesses seguintes, a resposta FR 15 foi mantida completamente pelo S^
- 231

contingente, enquanto, em cada tentativa, o comportamento de correr subsequente foi


lentamente enfraquecido em virtude de sua extino. Este estgio representado como
R

R.

[ 11.2]

onde SD= som da campainha na caixa de partida e porta aberta


SA = ausncia do som na caixa de partida, porta fechada
R \ = correr para a caixa-objetivo
t^2~ 15 presses barra
Exceto pelas diferenas em elementos especficos, os procedimentos de [11.2J e
[11.11 so idnticos. Mesmo assim, antes que o poder de reforador condicionado fosse
esgotado, os ratos de Zimmerman tinham emitido milhares de presses barra e
continuaram trabalhando por 20 horas espaadas em vrias sesses. Curvas cumulativas
da presso barra na caixa de partida nas sesses 1 , 5, 11 e 14 so vistas na Fig. 11-2. A
forma dessas curvas indica claramente que o uso do S ^, no procedimento de
Zimmerman, atuou de maneira semelhante ao reforamento primrio, gerando e
mantendo os efeitos caractersticos de uma especificao FR de resposta. Pausas,
seguidas de taxas altas de presso barra, so vistas. A medida que a extino continua,
as pausas se tornam mais longas. Mesmo assim, quando o organismo responde, todo o
operante FR tipicamente efetuado nipida e suavemente.

Figura 11-2. Presso barra em FR- 15 baseada apenas em reforamento condicionado


Os traos oblquos representam a campainha e a porta aberta. O registrador corria
apenas enquanto o animal
estava na caixa de partida, antes de produzir o SD
(Zimmerman, "959).

Os desempenhos apresentados pelos ratos de Ziinmerman devem ser contrastados


com o comportamento dos ratos de Skinner (Fig. 11-1), que emitiram apenas cerca de 50
presses para o S D e, ao fim de 45 min, pararam de responder. A diferena em potncia
entre os reforadores condicionados, nos dois casos, pode ser atribuda dupla
intermitncia usada por Zimmerman no treino e teste. (1) A conexo probabilstica entre
o operante discriminativo (R j) e seu reforamento primrio (alimento) no treinamento
de correr efetuado por Zimmerman, aumentou bastante a resistncia extino da
resposta de correr ao S ^ (campainha-porta aberta). Assim, o S ^ por si s, permaneceu
no controle do comportamento por um perodo de tempo maior que em [ 1 1 . 1 ] e reteve,
portanto, seu poder de reforador condicionado por mais tempo. Os resultados de
Zimmerman implicam em que Skinner poderia ter obtido mais presses barra se tivesse
reforado probabilisticamente a aproximao ao comedouro quando do clique-luz. ( 2 )
Pela incorporao de presses individuais barra num operante de ordem superior
constitudo de 15 elementos, o total da produo comportamental, medido pelo nmero
de elementos de presso barra emitidos, foi grandemente aumentado (Weissman e
Crossman, 1966). Ao mesmo tempo, a infreqncia de ocorrncia do S ^ conservou sua
funo discriminativa no controle do correr.
.
Os resultados de Zimmerman sugerem que, enquanto o reforador condicionado
permanece potente, os efeitos de torn-lo contingente a uma resposta parecem indistintos
dos efeitos de tornar um reforador primrio contingente resposta. Os resultados de
outros experimentos confirmam tal concluso. Kelleher (1961) tornou o clique de um
comedouro um S ^ para o comportamento de aproximao ao comedouro, em pombos.
Quando apenas o clique foi usado como um reforador para o bicar a chave em esquemas
FI e especificaes FR e drl os animais apresentaram padres de resposta tpicos daqueles
procedimentos com reforamento primrio.
11.3 RECOMPENSAS TOKEN
A operao de um tipo de reforamento condicionado, tipicamente humano, de
monstrada em estudos em que fichas de pquer (tokens) foram usadas para reforar
primatas (Wolfe, 1936; Cowles, 1937). As fichas tomaram-se S^s para vrias respostas
manipulativas, incluindo o ato de inser-las na mquina de vender para receber uvas,
laranjas, amendoins e outros reforadores primrios. Foi esta histria de associao com
reforamento primrio que transformou as fichas em tokens (dinheiro) com o poder
de reforar.
Em alguns dos experimentos de Wolfe (1936), chimpanzs foram treinados a inserir
uma ficha branca numa mquina e obter, assim, uma uva. A resposta de insero foi
modelada atravs de aproximao sucessiva. Um token foi inserido parcialmente na
mquina pelo experimentador e qualquer empurro, no nvel operante, dado pelo chim
panz, fazia com que o token acabasse de cair, aparecendo como resultado uma uva. O
procedimento de modelagem continuou at que os animais pegassem fichas brancas no
cho e as inserissem na mquina de vender uva.

Sc
SB
R2 -----> Ri ----- - S '

- 233 -

onde

Sg= ficha branca na mo.


S = ficha branca no cho
- uva
Rl = inserir ficha na mquina
R2 = apanhar a ficha.

Os animais foram, posteriormente, ensinados a puxar uma barra pesada para obter fichas,
uma tarefa que aprenderam facilmente.
Sq
[S-c
SB
Kl -----> 1^2 ----- Rj -----> S +
onde So = nenhuma ficha presente
R 3 = puxar uma barra.
Posteriormente, foi estabelecida uma discriminao adicional entre fichas de metal
que nada valiam isto , no operavam a mquina de vender, se nela inseridas e fichas
brancas. Uma breve histria com este conjunto de contingncias foi suficiente para tomar
os animais indiferentes s fichas de metal.
Em outros experimentos (Cowles, 1937) com um aparelho anlogo plataforma de
saltar de Lashley, na Fig. 10-3, os animais aprenderam discriminaes de padres espe
ciais onde o nico reforamento consistia de ^tokens'. Nos experimentos de Cowles, a
resposta era simplesmente a de empurrar para o lado o carto contendo o padro correto.
As mquinas de vender ficavam em outra sala, onde, depois que a discriminao havia
sido aprendida (Io > 1 ,0 ), as fichas acumuladas podiam ser trocadas.
Nesses vrios experimentos, os chimpanzs adquiriram novos comportamentos quan
do o nico reforamento imediato eram as fichas. As fichas so distintas de qualquer
outro reforador secundrio apenas por suas propriedades fsicas, que as tornam manipu
lveis, estocveis, etc. Naturalmente, um token no apenas o S^ para uma resposta de
insero; ele tambm fornece os verdadeiros meios fsicos atravs dos quais tal resposta
manipulativa pode ser emitida. Uma ficha implica tanto em reforamento para inserir
como torna possvel a insero. Contudo, os tokens, tal como campainhas e cliques,
tornam-se S^s simplesmente porque uma certa resposta reforada em sua presena.
11.4 REFORADORES GENERALIZADOS
Muitos estmulos discriminativos positivos estabelecem a ocasio para mais de um
nico tipo de resposta ser emitido e reforado. Alguns S^s, de fato, controlam numero
sas respostas, cada uma das quais pode levar a um reforador primrio diferente. Fora do
laboratrio, tais situaes so encontradas frequentemente. O dinheiro um exemplo
excelente. Tendo dinheiro, muitas respostas podem ser emitidas, cada uma levando a seu
reforador prprio e distinto.
S(dinheiro)
^(comprar bilhetes de teatro)
St +

R(comprar um casaco novo)


R(pedir uma refeio)

- 234

S2+
S3+

[11.3]

Ateno , algumas vezes, usado como um nome para um tipo semelhante de S^.
De modo a obter reforamento para vrias respostas verbais, <juase sempre necessrio
que uma pessoa obtenha a ateno de uma outra. Quando o Su ateno conseguido,
muitas respostas (pedidos, ordens, etc.) podem, ento, ser emitidas com a chance de
serem reforadas. Na ausncia de ateno , poderamos dizer que tais pedidos no so
ouvidos ou notados, o que equivalente a dizer que eles esto sendo submetidos
extino.
Estmulos disc rim in ativos que podem estabelecer a ocasio para mais de uma seqn
cia resposta-reforamento esto baseados numa histria de associao com mais de um
reforador primrio. No diagrama [ 11.3| por exemplo, o dinheiro foi previamente asso
ciado, atravs de treinamento
- SA+, a entretenimento,calor, alimento, etc. Estmu
los discriminativos associados desta maneira a mais de um reforador primrio e cuja
disponibilidade se torna, ento, contingente a um novo comportamento, so chamados
reforadores generalizados. Embora eles paream ter um importante papel na mediao
do comportamento humano complexo, tais reforadores generalizados no tm sido
estudados extensivamente no laboratrio.
EXERCCIO 8

Descreva um mtodo para criar um reforador generalizado para chimpanzs. Use,


como reforadores primrios, alimento, gua, remoo da situao experimental. Empre
gue um operante discriminativo diferente para cada reforador primrio. Use tokens
como SD generalizado. Uma vez que o animal possua o " token , o que determinar o
operante discrim inativo que ele emitir?
11.5 RESPOSTAS DE OBSERVAO
Diz-se, s vezes que os estmulos discriminativos tm a propriedade de conduzir
informao a respeito do estado das contingncias ambientais efetivas numa dada
ocasio. Assim, quando o pressionar a barra por um rato reforado somente na presena
de uma luz, pode-se dizer que a luz fornece informao de que uma certa contingncia de
reforamento esta em efeito. Similarmente,quando a sirene para de tocar conduz informa
o de que os avies de bombardeio inimigos se retiram e seguro sair. Reforadores
tokens tambm conduzem informaes mas aqui a funo informativa est obscurecida
pelas propriedades fsicas d o s tokens que lorn am possvel a resposta real. Quando a
fechadura automtica da porta de um apartamento soa depois que voc toca a campai
nha, voc informado de que pode abrir a porta e de que, quando o fizer, encontrar
algum em casa.
Um tipo diferente de informao fornecido por sinais indicativos de no fun
ciona e saiu para o almoo , luz vermelha do trfego e sinais de ocupado. Estes so
anncios de que certos comportamentos no sero reforados; como tal eles constituem
S^s para esses comportamentos. Pode a informao sobre reforamento fornecida pelos
S^s e SA s desses exemplos ser encarada como reforadora em si mesma? Pode-se
fornecer uma resposta melhor fazendo-se referncias a experimentos.
No procedimento de discriminao de Herrick, Myers e Korotkin (1959) da seo
10.1 os ratos aprenderam a discriminar entre perodos de luz e escuro alternados aleato
riamente. As contingncias eram reforamento em VI durante S^ (luz) e extino duran
- 235-

te S A (escuro). Imagine que, em vez de se fornecer automaticamente, uma luz brilhante


como SD e o escuro como SA 9 outro grupo de animais fosse treinado numa condio
intermediria de iluminao fraca, que no mudasse quando cada perodo de V I se
iniciava e terminava, nem quando cada perodo de extino se iniciava e terminava. Em
linguagem vernacular, diramos que esses animais no teriam meios de dizer se estariam
em VI ou em extino. Se o perodo de extino no fr muito prolongado, ratos
treinados nessas condies ajustar-se-o, produzindo uma taxa constante de respostas
tanto em VI como em extino.
Suponha que, depois de tal estabilizao, uma nova contingncia seja introduzida
pela primeira vez. Se agora o rato puxasse um cordo localizado em seu compartimento,
a luz fraca seria imediatamente substituda pelo escuro (SA ) ou pela luz clara (S^),
dependendo da contingncia que estivesse em efeito naquele momento. O que fizemos
foi dar ao organismo a opo de produzir estmulos discriminativos. O resultado comportamental de tal opo claro. A contingncia age rapidamente para condicionar a respos
ta de puxar a corda (Wyckoff, 1952).
Quando uma resposta permite a um organismo observar uma situao correlacionada
com o estado de suas contingncias de reforamento, referimo-nos a ela com uma res
posta de observao. Ao observar meramente um aspecto do seu ambiente correlacionado
com certas contingncias de reforamento, o animal no modifica qualquer delas, mas
tem agora a oportunidade de evitar respostas no reforadas.
As respostas de observao esto entre as mais comuns das nossas atividades dirias.
Para discriminar uma nota genuna de uma falsa, certas respostas de observao muito
detalhadas so necessrias. Uma grande parte do treinamento de peritos em notas falsas e
impresses digitais envolve o fortalecimento de respostas de observao que usualmente
permanecem incondicionadas no leigo. O perito deve aprender quais aspectosde uma
situao deve estudar de modo a poder distinguir entre estmulos diferentes que possam
estar presentes do seu ambiente puxando um cordo que produz S ^ o u S A s o perito em
notas falsas pode checar a impresso significante numa nota bancria que a identificar
como genuna ou falsa. Em ambos os casos, a resposta de observao, puxar o cordo ou
examinar a impresso, permite ao organismo fazer uma discriminao que aumenta a
probabilidade de ele ser reforado.
A habilidade do perito em fazer discriminaes, seja entrevinhos, impresses digitais
ou pinturas, frequentemente vista com algum espanto pelo novato. Para este ltimo,
dois casos seguramente discriminados pelo perito parecem, soam ou tm sabor de seme
lhante. O comportamento de observao no iniciante no foi fortalecido, no lhe permi
tindo saber onde procurar as diferenas . Ao fortalecer o comportamento de observa
o em humanos, p o d e m o s muitas vezes apontar , com xito, as diferenas nas situa
es. Ao apontar os aspectos da situao de que dependem as diferenas entre
e SA .
aproveitamo-nos de uma histria passada em que o reforamento foi previamente contin
gente ao olhar na direo em que o dedo aponta.
Contingncias anlogas modelam respostas de escutar, bem como o comportamento
de observao em outras modalidades sensoriais. Em geral, uma caracterstica importante
de uma resposta de observao que ela aumenta a probabilidade de reforamento para o
comportamento. Isto certamente c verdadeiro para o rato que tem a opo de produzir
seus S^s e
s. Se a discriminao do animal boa, apresentaes de S^ e SA iro,
pelo menos, permitir que a resposta seja limitada a SD. Isto tem o efeito de aumentar a
probabilidade geral de reforamento para a resposta, bem acima do que aconteceria se S^

e S^- distintos no estivessem disponveis. No basebol, o batedor que observa um movi


mento rnnimo mas caracterstico do lanador prestes a lanar uma bola que descrever
uma trajetria ci^va tem uma chance meihor de rebat-la do que teria sem tal S^.
Frequentemente, os S^s e
s produzidos pelo comportamento de observao so
cruciais para a ocorrncia de qualquer reforamento. Tente enfiar uma linha na agulha
com os olhos vendados, ou responder a uma questo de prova sem t-la lido antes. Em
ambos os exemplos, a probabidade de reforamento to pequena que pode ser efetiva
mente zero na ausncia de um comportamento de observao apropriado.
O comportamento de observao frequentemente encoberto, tal como quando um
homem se senta silenciosamente na presena de um rdio. Ele est ouvindo ou no? Isto
, ele est observando ou no? Em geral, a resposta a esta questo pode ser obtida apenas
pelo estabelecimento de contingncias de reforamento onde a probabilidade de que o
indivduo emita certas palavras seria insignificantemente pequena na ausncia de um
comportamento de observao anterior. Se perguntarmos o que foi dito no rdio, a
resposta de repetir o que foi dito de fato tida como evidncia prima facie de que o
comportamento de observao deve ter ocorrido.
EXERCCIO 9
Faa a anotao das contingncias que predominam quando um organismo tem a
opo de produzir
e S ^ , como est descrito no incio desta seo. Para tmar o
exerccio mais simples, suponha que um esquema de probabilidade uniforme seja alter
nado com extino.
11.6

AS CONDIES NECESSRIAS E SUFICIENTES PARA SE CRIAR


REFORADORES CONDICIONADOS

O contedo das sees 11.1 11.5 implica em que uma condio suficiente para
tornar um estmulo um reforador condicionado faz-lo um S^ atravs do procedimen
to de discriminao. Existe pouca evidncia de que tornar um estmulo um SD seja uma
condio necessria e suficiente para torn-lo um reforador condicionado. (Myers,
1959; Kelleher e Gollub, 1962). Em vrias ocasies, observamos, que, medida que um
estmulo perde sua funo de SD? ele perde tambm sua potncia como reforador con
dicionado. Dinsmoor (1950) mostrou que a resistncia extino de um operante dis
criminative) era a mesma se o operante fosse extinto na presena de seu SD, ou extinto
com o SDcontingente a ele. Outro experimento (Notterman, 1951) mostrou que, quan
to menor o treino discriminativo que o sujeito receba, menor o valor reforador que o
SD adquiria.' Essas observaes sugerem que as funes discriminativas e reforadoras de
um SD so estreitamente ligadas, se no diretamente paralelas.
Schoenfeld, Antonitis e Bersh (1950) mostraram que a simples associao de um
evento ambiental como um reforador primrio, por si s, insuficiente para tomar o
evento um reforador condicionado. Ratos foram treinados a se aproximarem de seus
comedouros recebendo uma pelota de alimento. Aps o rato ter pegado a pelota e j
estar comendo-a, urna luz breve (1 seg) era apresentada. Cem associaes luz-comida no
conferiu qualquer valor reforador potencial luz porque, em testes subsequentes, o
animal no pressionava a barra para produzir apenas a luz.
Indcios sobre as associaes necessrias e suficientes para produzir reforadores

237

Convencional

S,

S I inefetivo

__ D____ 0-

n n n nn n
1 1 1 .... i i i

st
R-*-S+

Sd re d u n d a n te

I n te rm ite n te

__D____ Q.

s,
s,
R-*-S*

n
n
1

n
n

n .
n

1 ... 1. .

Figura 11-3. Aguns arranjos de emparelhamentos possveis de estmulos neutros com


reforamento.

adquiridos foram fornecidos por Egger e Miller (1962, 1963). A representao


esquemtica, na Fig. 11-3, de trs eventos ambientais, S \, S2 e S+, ser conveniente para
compreender seus resultados. Suponha que o S+ possua o poder de reforar o
comportamento, enquanto S] e S2 no tm originalmente esse poder. Suponha tambm
que a emiso de uma dada R seja necessria para produzir S+. Algumas das associaes na
Fig. 11-3 correspondem de perto a algumas das relaes temporais do condicionamento
Pavloviano, descritos na Fig. 3-5. Logo, esperar-se-ia que elas resultassem no
condicionamento clssico de alguns respondentes, ao lado de qualquer valor reforador
adquirido que elas emprestassem a S \ ou S2 .
O caso da parte superior esquerda da Fig. 11-3 representa o paradigma convencional
para cria r reforadores condicionados. Cada apresentao de S 1 , se sucedida
imediatamente de R, seguida de S+. Quando Si no est presente, as respostas no so
reforadas. Este o caso do exemplo do clique-luz da seo 11-1 e dos tokens e, em
geral, neste caso Si submetido a uma histria de discriminao com relao a R.
No caso da parte inferior esquerda, S+ vem depois de alguns S^s, mas no de todos.
Para que as respostas sejam reforadoras, todavia, elas devem ocorrer depois de S \. Este
o caso intermitente de Zimmerman e tambm estabelece S \ tanto como um S^ quanto
como um reforador condicionado.
Em cima, direita, uma contingncia de reforamento pode ocorrer depois de S j,
mas tambm em certas outras ocasies. Se S+ ocorre com a freqncia de 50 por cento
ou mais das vezes sem S j, este caso po confere poder reforador a Si (Melching, 1954).
Sj no se torna um SD presumivelmente porque algumas respostas so reforadas na sua
ausncia - uma violao do paradigma de discriminao. Note, todavia, que S2 toma-se
um reforador condicionado porque contm a mesma relao a R>S+ que Si no caso
convencional da parte superior esquerda.

- 238-

No caso inferior, direita, os dois eventos neutros so apresentados quase ao mesmo


tempo (separados de poucos segundos), depois do que uma resposta pode produzir
reforamento primrio;este caso conferir valor reforador condicionado a S j,m as no a
S2 (Eggere Miller, 1962, 1963). Parece que S2 redundante, no fornecendo qualquer
informao nova sobre a ocorrncia da contingncia de reforamento. Este resultado
explicaria o insucesso de Schoenfeld, Antonitis e Bersh em tomar a luz um reforador
condicionado. Em seu experimento, a luz era S2 ,j tendo sido precedida de S], a viso da
pelota ou a pelota na boca, etc.
Uma anlise geral dos quatro casos da Fig. 11-3 indica dois fatos relevantes. (1)
Existem vrios paradigmas para estabelecimento de S^s e todos os S^s assim estabele
cidos tambm adquirem o poder de reforador condicionado. (2) Somente quando um
estmul informativo (isto , correlacionado no redundantemente com uma contin
gncia de reforamento) que ele se torna um S ^ ou um reforador condicionado. Os
argumentos discutidos nesta seo devem ser tomados provisoriamente, porque sua gene
ralidade depende da confirmao de paradigmas temporais, respostas e reforadores pri
mrios adicionais.
11.7 O REFORAMENTO SECUNDRIO NO COMPORTAMENTO SOCIAL
Um estmulo que controla o comportamento com um SD ou reforador condicio
nado no precisa originar-sc apenas do ambiente inanimado. Outros organismos (ou, os
estmulos que se originam deles) podem agir desse modo tambm, e a est um fato de
grande significncia para o homem, bem como para outra vida biolgica. O comporta
mento social pode ser descrito como o comportamento para o qual os estmulos refora
dores ou discrimnativos, so, ou foram, mediados pelo comportamento de outro organis
mo. Por mediado queremos dizer que surge de, ou em conexo com e no h
qualquer inteno de forar a conotao da palavra. No poderamos nem (1) incluir
como social a liberao de uma pelota pelo experimentador, ao rato que pressiona a barra
pode ser uma situao social para o experimentador, mas no para o rato. nem ( 2 )
excluir como no-social o comportamento do nufrago que fala para si mesmo ou faz
roupas de peles, j que ambas as atividades foram adquiridas socialmente.
A partir do nascimento, os estmulos sociais atuam em grande parte da vida dos
seres humanos. Muitos cientistas, realmente, pensaram que a prpria sociedade tem sua
origem na dependncia extrema e prolongada da criana. Seja como for, os pais, especial
mente a me, esto entre os primeiros reforadores secundrios do tipo social que
aparecem no crculo visual da criana. Sua potncia disc rim in ativa e reforadora rapida
mente estabelecida pela associao contnua com alimento, calor, alvio da dor, etc. Se,
todavia, a criana criada por uma enfermeira, ento ela se torna o reforador secundrio
sempre presente e comumente se v que a ligao com a Enfermeira substitui a com a
me. Os psiquiatras salientam que, na adolescncia e antes, os primeiros objetos sexual
mente interessantes podem ser os pais, irmos ou irms. Dentro do ambiente social
relativamente restrito da criana, os poucos organismos que servem como estmulos
acompanhadores, quando o reforamento liberado ou retirado, podem adquirir um
controle amplo e vitalcio sobre seu comportamento. Com o aumento da idade, a criana
amplia suas excurses alm do lar, aumentando a faixa de reforadores secundrios que
controlam suas reaes. Escola, amigos, clubes e atividades relacionadas de todos os tipos
levam-na aos estmulos que so os sinais e acompanhamentos, sempre presentes, do

- 139 -

reforamento final, os S^s e os[reforadores condicionados]que so a trama e urdidura


de sua vida na sociedade (Keller e Schoenfeld, 1950, pp. 257-258).
Um rato ensinado a imitar outro rato est demonstrando uma habilidade, social
rudimentar e mostrando a ao de um reforador social. Miller e Dollard (1941) treina
ram ratos famintos a atravessar uma pista elevada em T, vista na Fig. 11-4. Alguns ratos

Figura 11-4. Uma pista elevada, em T, para estudai a imitao no rato (segundo Miller e
Dollard, 1941).

foram treinados a correr para um carto branco ou preto. A posio dos cartes era
distribuda aleatoriamente em tentativas sucessivas. Outros ratos foram treinados simples
mente a correr consistentemente para a direita ou para a esquerda. Quando o rato
executava uma corrida correta, ele encontrava alimento num recipiente colocado na base
do carto. Esses ratos eram chamados de lderes eram treinados at que corressem 20
vezes consecutivas corretamente.
Um segundo grupo de ratos foi treinado para seguir os lderes. Em qualquer tentativa
em que seguiam os ratos lderes, os seguidores encontravam alimento descoberto num
pequeno recipiente no meio do caminho da pista. Em qualquer tentativa em que no

- 240 -

seguiam os lderes, eles eram retirados da pista por um pequeno perodo e mais tarde
fazia-se nova tentativa.
As contingncias foram efetivas na produo de seguidores. Notou-se que os ratos
imitavam os lderes quando estes viravam na presena ou ausncia de cartes brancos ou
pretos, que imitavam os lderes que haviam sido treinados a ir para a direita ou para a
esquerda e que imitavam indiscriminadamente ratos brancos e cinzentos.
A relao social entre um aluno e um professor , provavelmente, vrias ordens de
magnitude mais complexa do que qualquer habilidade social isolada como a imitao,
mas os rudimentos de tal relao prestam-se anlise experimental. Do ponto de vista do
reforamento social, podemos considerar que o comportamento do professor reforado
pelas mudanas no comportamento do aluno. O aluno deve ser quase sempre reforado
diretamente, ou pela promessa de alcanar certas habilidades teis ou por ameaa de
punio.
As contingncias envolvidas na situao educacional comum so complexas e
raramente formalizadas de um modo consistente. Mas a idia fundamental - um organis
mo fortalecendo ou participando do comportamento de outro organismo
pode ser
demonstrada com pombos, de uma maneira que expe o processo crtico envolvido.
Na Fig. 11-5, dois pombos esto separados um do outro por um plstico transpa
rente. Antes da demonstrao, ambos foram treinados a comer nos seus respectivos
alimentadores. Alm disso, o professor foi treinado a bicar o disco plstico em refora
mento internitente com alimento. A demonstrao comea com os animais colocados
juntos pehi primeira vez. Cada vez que o professor bica o disco, liberado alimento para
o aluno . O professor reforado por bicar somente quando o aluno est de p, em
frente ao canto esquerdo. Consoante com sua histria, o professor comea a bicar rpida
e indiscriminadamente com relao posio do aluno. Portanto, no incio, poucas
bicadas do professor so reforadas. Gradualmente, todavia, medida que a demons
trao prossegue, mais e mais vezes que o professor bica o disco, ambos os animais so
alimentados. O comportamento de ambos vai sofrendo modificao pela interao social.
Logo, um desempenho quase cmico evolui. O professor fica olhando para o aluno como
se esperando que ele se mova at o canto esquerdo. Enquanto isso, o aluno imita suas
atividades a uma ida repetitiva do alimentador para o canto esquerdo. To logo o
aluno esteja parado de forma adequada. O professor bica, ambos coiYiem, e o padro
repetido.
Pode-se dizer que o professor manifesta um tipo de discriminao social primitiva.
Seu comportamento reforado somente quando o aluno est desempenhando um certo
ato ficar de p no canto esquerdo. este ato por parte do aluno que fornece o S ^ para
o professor bicar o disco.
Como tal esta situao precisa tambm funcionar como um leforador condicionado
para o professor. Se o professor procura obter alimento, ele deve encontrar um modo de
tomar essa situao possvel, pois, inicialmente, o aluno raramente ir ficar no lugar
favorvel. Uma interao social sutil est presente: qualquer bicada que o professor d
quando o aluno est em outro lugar resulta em alimento apenas para o aluno. 0 b ;car
indiscriminado, ento, provavelmente fortalecer comportamentos do aluno outros que
no o ir para o canto esquerdo. Esperar que o aluno v para o canto esquerdo fica
sendo o nico comportamento que o professor tem disponvel para dirigir as respostas do
seu aluno. O pombo professor rpido em descobrir o valor da pacincia.
241 -

(Herrnstein, 1964).

As demonstraes simples desta seo ilustram a continuidade existente entre o


comportamento social e no-social. Nenhum princpio novo necessrio para explicar os
resultados das contingncias de imitao, ou os resultados da interao dos pombos
professor-aluno. O comportamento imitativo de correr dos ratos seguidores indistin
guvel pela topografia, preciso ou complexidade, de qualquer outro operante de correr
sob controle discriminativo. Do mesmo modo, os comportamentos adquiridos pelos
nombos professor e aluno so apenas os operantes familiares que tratamos em detalhes
no texto. As sutilezas do comportamento socialencontram-se,em grande partenascontingncias controladoras que surgem de uma fonte complexa de estimulao proporcionada
por um outro organismo.
REFERNCIAS PARA O CAPTULO 11
Cowles, J. T. Food- t okcns as incentives for learning by chimpanzees.

Comp. psychol. Motiogr., 1937, 14, 1-96.


Thnsmoor, J. A. A quantitative comparison of the discriminative and
reinforcing functions of a stimulus. J. exp. Psychol., 1950, 40,
458-472."
Egger, M. D., and Miller, N. E. Secondary reinforcement in rats as a
function of information value and reliability of the stimulus. J. exp.

P s y ch ol 1 9 6 2 ,6 4 ,9 7 -1 0 4 .
Egcr, M. D , and Miller, N. E. When is a reward reinforcing? An experi
mental studv of the information hypothesis. J. comp, physiol.

Psychol. , 1963, 56, 132-137.


- 242 -

Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in Sl) and


rates during the development of an operant discrimination. J. com;),
physiol. Psychol., 1959, 52, 359-363.
Ilerrnstein, R. J. Will. Proc. Amer. Phil. Soc., 1964, 108, 455-458.
Kclleher, R. Schedules of conditioned reinforcement during experimental
extinction. /. exp. Anal. Behav., 1961,4, 1-5.
Kelleher, R., and Gollub, L. A review of positive conditioned reinforce
ment. J. exp. Anal. Behav., 1962, 5, 543-597.
Keller, I7. S., and Schoenfeld, W. N. Principles of psychology, New York:
Applcton-Century-Crofts, 1950.
Melching, W. H. The acquired reward value of an intermittently pre
sented neutral stimulus. J. comp, physiol. Psychol., 1954, 47, 3 7 0
374.
Miller, N. E., and Dollard, J. Social learning and imitation. New Haven:
Yale Univer. Press, 1941.
Myers, J. L. Secondary reinforcement: a review of recent experim enta
tion. Psychol. Dull., 1958, 55, 284-301.
Notterm an, J. M. A study of some relations among aperiodic reinforce
ment, discrimination training, and secondary reinforcement. J . exp.
Psychol., 1951,41, 161-169.
Schoenfeld, W. N., Antonitis, J. J., and Bersh, P. J. A preliminary study
of training conditions necessary for secondary reinforcement. J. exp.
Ps y ch ol 1 9 5 0 ,4 0 ,4 0 -4 5 .
Skinner, B. F. The behavior of organisms. New York: Appletn-Century,
1938.
Skinner, B. F. A case history in scientific method. Amer. Psychologist,
1 9 5 6 ,1 1 ,2 2 1 -2 3 3 .
Weissman, N. W., and Crossman, E. K. A comparison of two types of
extinction following fixed-ratio training. J. exp. Anal. Behav., 1966,
9 ,4 1 -4 6 .
Wolfe, J. B. Effectiveness of token-rewards for chimpanzees. Comp.
psychol. Monogr., 1936, 1 2 , 1-72.
WyckofT, L. B., Jr. The role of observing responses in discrimination
learning: Part I. Psychol. Rev., 1952, 59, 431-442.
Zimmerman, D. W. Durable secondary reinforcement: method and
theory. Psychol. Rev., 1957, 64, 373-383.
Zimmerman, D. W. Sustained performance in rats based on secondary
reinforcement. J. comp. physiol. Psychol., 1959, 5 2 , 353-358.

- 243 -

Captulo 12

ENCADEAMENTO

Na seo 11.1 vimos como, atravs do uso de recompensas tokens atuando como
reforadores adquiridos, seqncias ou cadeias simples de comportamento podiam ser
criadas. A mais simples dessas cadeias foi construda a partir de (1) uma resposta nova,
no fortalecida previamente; (2) um
previamente estabelecido; e (3) o operante
controlado por este SP. Em geral, cadeias de qualquer tamanho desejado podem ser
formadas pela incluso indefinida de um nmero sempre maior de elementos.
12.1 OS ELEMENTOS DE CADEIAS COMPORTAMENTAIS
Uma cadeia de comportamento operante suscintamente descrita como uma
seqncia de respostas operantes e estmulos discriminativos tal que cada R produz o SD
para a prxima R. As Rs suscessivas numa cadeia so os seus membros; os S ^s sucessivos
so os elos. Nas cadeias mais simples, o nmero de membros e o nmero de elos so
idnticos. O elo de comportamento que envolve o pressionar a barra e o aproximar-se do
comedouro, nosso prottipo de fortalecimento operante, constitui uma cadeia repetitiva
simples desse tipo. O comportamento do rato estabelecido pelo procedimento

onde S3 = alimento ausente


S2 = clique-luz
S+ = alimento
R3 = presso barra
R 2 = aproximar-se do comedouro
R | = comer

- 245-

O elo de [ 1 2 . 1 | um caso especial de uma cadeia comportamental, aquele em que a


cadeia repetida indefinidamente. Um e b pode ser considerado uma cadeia que est
fechada por permitir que a ltima resposta produza o SD para a primeira . Por
exemplo, no elo de [ 1 2 . 1 ] comer a ltima resposta e produz o S ^ 5 ausncia de
alimento, para a primeira resposta, pressionar a barra.
O elo de [ 1 2 . 1 ) representado como sendo composto de trs membros da resposta.
Por isto, convencionalmente descrito como uma cadeia de trs membros. Mas o nmero
real de membros usados para representar uma cadeia comportamental arbitrrio, sendo
ditado principalmente pela convenincia descritiva. Ao discutir o comportamento obser
vado e reforado, trs membros servem adequadamente para ilustrar a natureza enca
deada do ato. Ao mesmo tempo, trs membros no so muitos para nos assustarem com
uma quantidade de detalhes. Ainda, para outros objetivos, podemos desejar representar o
ato como se formado por mais membros. Por exemplo, para esclarecer tambe'm a topo
grafia, do ato, poderamos duplicar o nmero de membros considerados e expandir
r 1 2 . 1 ] para

[ 12.2]

onde S = alimento ausente


S 5 barra
S4 ~ clique-luz, barra pressionada
S3 = clique-luz, barra solta
S2 - no comedouro
S+ = alimento nas patas
R = levantar-se altura da barra
R 5 = pressionar a barra
r 4- soltar a barra
K3 ~ introduzir-se no comedouro
R 2 = apanhar o alimento
Rj = colocar na boca.

0 diagrama [ 12.2 j representa o mesmo comportamento e o mesmo conjunto de


contingncias que [ 12.11, mas 0 poder de ampliao foi dobrado em [12.2 | Levando-se
em conta ainda detalhes topogrficos mais sutis e mudanas de estmulo mnimas, a
resoluo poderia ser facilmente mais ampliada. Em geral, a composio de uma cadeia
de comportamento pode ser representada como um nmero indefinido de operantes. O
nmero no infinito porque, na subdiviso conceituai sucessiva, ser inevitavelmente
alcanado um ponto onde a especificao de duas classes topogrficas adjacentes ser to
sem elhante que no se poder observar que as duas classes funcionam
independentemente uma da outra. Isto , seus membros se sobreporo completamente
- 246 -

nau ser possvel colocar o animal sob quaisquer condies para diferenci-los. Neste
ponto, teremos alcanado um limite lgico para a resoluo da resposta. Na maior, parte,
o comportamento subdivido a um nvel em que serve melhor para objetivos ilustrativos
de procedimentos. A presso barra e a aproximao ao come douro so facilmente
observadas, medidas e reforadas sem qualquer instrumentao especial. Em ltima
an lise, estas so as consideraes que justificam seu status como unidades
conceitualmente discretas.
Uma cadeia tanto pode ser reduzida quanto ampliada. Em princpio, poderamos
tambm escrever[ 1 2 . l|como
^ (presso barra, ir para comedouro)

------ S +

[1 2 3]

S (alimento ausente)

Os critrios para definir uma classe de resposta so que a classe seja especificvel como
em 112.3] e que possa ser fortalecida ou mantida, como uma classe, pelo reforamento.
A questo de se a R especificada em[ 12.3) reforvel uma questo experimental. Sua
soluo depender de muitos fatores, tais como o peso e altura da barra, sua distncia
espacial at o comedouro, a nitidez de quaisquer deixas intermedirias usadas para
sinalizar a liberao de alimento, as diferenas individuais entre os ratos, e assim por
dainte. Naturalmente, se esta R j foi sucessivamente aproximada e fortalecida, 112.3]
uma maneira perfeitamente plausvel de abreviar as contingncias que iro subsequente
mente, manter este comportamento. Infelizmente, todavia, o diagrama [ 12.3] representa
as contingncias de reforamento frequentemente usadas quando o experimentador tem
pouco tempo para se dedicar a uma modelagem real da resposta. O procedimeto de
1 1 2 .3 ] resulta do colocar o rato na caixa e esperar que o condicionamento ocorra a seu
prprio modo . A criana que vai escola de quem se espera que aprenda meramente
vendo e ouvindo, ou o universitrio que recebe um livro e a ordem para aprender o
captulo 12, so todos vtimas freqentes de contingncias como em [ 12.31 . O resultado
o mesmo tanto para ratos como para humanos alguns indivduos adquirem
o comportamento desejado, outros no. Podemos praticamente dizer, com referncia a
[12.3) quando comparado com um arranjo mais deliberado de contingncias, que o
organismo aprende apesar da conexo no consistente entre os comportamentos reque
ridos e o reforamento fornecido.
12.2 O DESENVOLVIMENTO DE UMA CADEIA COMPLEXA
Os princpios com port am ent ais significantes usados no estabelecimento de cadeias
so ( 1 ) aproximao sucessiva de cada membro, ( 2 ) colocar cada membro sob controle
discriminativo, e (3) uso de estmulos com o duplo papel de deixa discriminai iva e
reforador condicionado, para ligar cada membro ao prximo. Vrias proliferaes desses
princpios podem produzir cadeias de complexidade e tamanho surpreendentes, mesmo
no rato. O comportamento que pode ser adquirido, frequentemente surpreende o leigo,
embora os princpios sejam simplesmente aqueles que operam na aquisio do pressionai
a barra ou bicar o disco. Em geral, uma complexidade grande no comportamento no
resulta de qualquer complexidade na topografia da resposta, nem mesmo das discrimi
naes requeridas, mas das maneiras complexas em que as vrias contingncias podem ser
permutadas.
- 247 -

Considere como um rato faminto pode ser treinado a pegar uma bola de gude na mo
do experimentador, deposit-la num buraco localizado a alguma distncia, depois puxar
um trapzio em miniatura dependurado em sua caixa e, finalmente, pressionar uma barra
(ver Fig. 12-1). til delinear cinco classes de respostas,
R5
R4
R3
R2
Rl

=
=
=
=
=

pegar a bola de gude


carregar a bola de gude e segur-la acima do buraco.
deixar cair a bola
puxar o trapzio
pressionara barra,

e notar que podemos desejar as Rs encadeadas na ordem R5 , R4 , R 3 , R 2 , Rl- As


situaes de estmulo necessrias so mais convenientemente apresentadas no texto. As
seguintes sugestes sero teis.
1.
2.
3.

Fortalecer primeiro os membros que ocorrem mais prximos do reforamento


primrio; isto , construir a cadeira de trs para frente.
Colocar cada operante sob controle de estmulo; isto , tornar cada operante um
operante disc rim in ativo antes de adicionar outro membro cadeia.
Permitir que o
para o operante que foi fortalecido aja como o reforador da
prxima resposta a ser adicionada. Deste modo, adicionar membros cadcia um;
de cada vez.

De acordo
com a sugesto 1,
R \ deve
ser condicionada
pelos
mtodos usuais de fortalecimento operante (ver seo 4.2). Ento, aplicando o
princpio 2 , deve-se converter Rj num operante discriminaiivo, reforando-a na presena
de uma situao (SD) e no na presena de uma segunda situao (S A ). Ser til, como
veremos em seguida, escolher para S ^ uma situao que tenha pelo menos duas
dimenses de estmulo convenientemente manipulveis. Uma pequena luz em combi
nao com uma campainha suave satisfar. Deixe a cigarra continuamente ligada e faa
com que a ausncia de luz sirva comoS A para R \. Quando a discriminao atingir um
ponto onde a luz controla a presso barra disc rim in adam ente, as sugestes 3 e 1 podem
ser usadas para fazer com que o puxar o trapzio (R 2 ) produza a luz. O resultado deste
procedimento ser, naturalmente, o fortalecimento de R 2 - At o momento, a campainha
soou continuamente, no importando o estado de iluminao. Mas, depois que R 2 for
fortalecida, a campainha pode ser ligada e desligada, permitindo-se que R 2 seja efetiva na
produo da luz somente quando a campainha estiver presente. Deste modo, o puxar o
trapzio, R 2 , logo ficar sob o controle disc rim inativo da campainha, embora permanea
sob o controle reforador da luz.
A adio do restante dos membros resposta(R 3 , R4 , R 5 ) feita de forma similar,
embora uma certa quantidade de aproximao sucessiva seja necessria. Comece com a
bola de gude colocada perto do buraco, sendo as condies de estmulo campainha e luz
desligadas. As respostas progressivamente mais prximas da bola de gude so reforadas
imediatamente pela produo do som da campainha e a continuao subsequente da
cadeia. Por aproximao sucessiva, as respostas de tocar a bola de gude, suspend-la e
deix-la cair so estabelecidas, sendo todas reforadas pelo som da campainha. O passo
final a adio de R 5 . Isto feito, levando-se a bola de gude, gradualmente, para mais
- 248-

Figura 12-1. Um rato executando uma cadeia de comportamento (segundo Michael,


1963).

longe do buraco e exigindo respostas de carreg-la com durao cada vez maior. Eventual
mente, a cadeia estar completa. A bola de gude est na mo do experimentador; o rato,
quando colocado na gaiola, vai at o experimentador, pega a bola de gude, carrega-a at o
buraco e deixa-a cair. A campainha soa e, ento, o rato puxa o trapzio. Acende-se a luz,
o raio pressiona a barra, e o alimento liberado. As contingncias.so:
- 249 -

S5

R.,

S4
r4

S3

s2

r,

r2

S|
Ri

-> S H

Onde S5 - bola de gude na mo de experimentador, campainha e luz desligadas


S4 = bola de gude nas patas do rato, campainha e luz desligadas
S3 = bola de gude sobre o buraco, campainha e luz desligadas
S2 = nenhuma bola de gude, campainha ligada, luz desligada
Si = nenhuma bola de gude, campainha ligada, luz ligada
S+ = alim ento .
Depois do treino, a cadeia completa ser executada suavemente sem os solavan:os que sugerem as unidades individuais que foram usadas no seu desenvolvimento.
Dontudo, sem o fracionamento original do comportameento e nessas unidades menores,
a seqncia completa nunca poderia ter sido desenvolvida.
Analisando as cadeias vocais humanas que constituem a linguagem falada, h uma
tendncia de se negligenciar a longa histria passada que torna possvel o desenrolar de
longas sentenas, compostas do que, h muito tempo atrs, eram unidades em si mesmas:
fonemas, slabas, palavras e frases. A continuidade (fluncia) aparente de um episdio de
fala no nos deve distrair do fato de que a fala um produto de uma histria passada de
encadeamento, m princpio, no diferente desta do rato educado que acabamos de
descrever.
Para amarrar o sapato, a criana se empenha numa cadeia, diferente apenas em
detalhes daquela do rato. Cada operante individual, na cadeia de amarrar, serve para
avanar o cordo para uma posio onde uma resposta ligeiramente diferente pode ser
emitida e reforada. O reforameno final um n seguro. No treinamento de uma
criana para amarrar um sapato, operam os mesmos princpios que no treino de um rato
para executar uma cadeia. O melhor seria iniciar a cadeia pelo fim, com o sapato todo
amarrado menos o ltimo aperto do lao. Quando esta resposta estiver fortalecida, o lao
desamarrado ligeiramente e qualquer resposta que produza o S ^ para o lao final
ser forada. As respostas executadas inapropriadamente simplesmente iro afrouxar o
lao e, ento, sero extintas. Na prtica, as crianas raramente so ensinadas da melhor
maneira, mas sim, na forma de [ 1 2.3| Os pais so frequentemente desiludidos pela falta
do que chamam de inteligncia, quando uma criana no domina tarefas simples
rapidamente. A deficincia no est na habilidade da criana em solucionar problemas, mas
sim na apreciao dos princpios de encadeamento pelos pais. Uma criana pode
aprender como amarrar um sapato em questo de minutos, se estes princpios so cuida
dosamente seguidos. O ideal que o processo seja automatizado, com o uso de vrios
sapatos, cada um num estado progressivamente mais desamarrado.
O estudante pode perguntar: onde esto as luzes e campainhas na cadeia de amarrar o
sapato? Por que elas foram necessrias para o rato e no para a criana? A discrepncia
apenas aparente. Ao amarrar um cadaro, cada resposta na cadeia produz, naturalmente,
uma situao de estmulo diferente, um cordo que est mais prximo de ser amarrado.
Na caixa de Skinner, o pressionar a barra ou o puxar uma corda no afeta, naturalmente,
o ambiente desta maneira, de modo que o experimentador e obrigado a acrescentar
mudanas de estmulo algo artificialmente. Mas em ambas as cadeias, os S^s e S ^ s so
as foras unificadoras. Quando o cordo est num estado particular, somente certas
respostas podem avan-lo para o prximo estado. Assim, qualquer estado determinado
- 250 -

do cordo um
para uma classe particular de resposta e um S A para o resto. (Note
que a criana deve aprender a observar o estado atual do cordo para escolher os S ^s
'devantes). Tanto para o comportamento de amarrar os sapatos como para os movi
mentos do rato, o status de encadearqento permanece uma seqncia de respostas
operantes entremeadas com seus S^s.
Pierrel e Sherman (1963) descreveram o treino de uma seqncia extica de compor
tamento do rato. O rato subia uma escada em espiral, atravessava uma ponte estreita e
subia uma escada de mo. Ento, puxava uma corrente ligada a um carro de brinquedo
aberto, subia no carro e pedalava-o at uma segunda escada de mao. Depois de subir esta
escada, ele passava atravs de um tubo e entrava num elevador. O peso dc rato fazia
baixar lentamente o elevador at a plataforma inicial, onde, como um anticlmax, o
animal pressionava uma barra e recebia uma pelota de alimento pelos seus esforos. Depois
de comer, o rato estava em condies de iniciar novamente a seqncia. O observador
casual, provavelmente, ficaria maravilhado pelo desempenho rpido e seguro desta cadeia,
por um organismo to insignificante como o rato. Um exame da histria por trs de tal
desempenho, todavia, revela que apenas os princpios bem estabelecidos dos captulos
4-11 foram empregados. O comportamento do rato foi adquirido pelos princpios de
discriminao e modelagem e encadeado pelo uso criterioso de reforadores condicio
nados.
12.3 A APRENDIZAGEM DE LABIRINTO COMO UM ENCADEAMENTO
O
labirinto tem sido associado com a psicologia h muito tempo. Em experimentos
iniciais que datam da passagem do sculo, animais famintos eram colocados em aparelhos
tais como os vistos na Fig. 12-2, permitindo-se que encontiassem o caminho at o
alimento. O labirinto foi adaptado para sujeitos humanos com os olhos vendados de
modo a permitir que eles traassem seu caminho com um estilete atravs dos caminhos
tortuosos, com muitos pontos de escolha, talhados na madeira ou feitos de metal.
Caixa-objetivo
da esquerda

partida

Caixa-objetivo
da direita

Caixa objetivo

partida

igura 12-2. Labirintos representativos. Cada labirinto tem uma caixa de partida e uma
ou mais caixas-objetivos ou sadas, onde o alimento pode ser encontrado. Um ponto no
labirinto a partir do qual dois caminhos so possveis e chamado ponto de escolha.

A fora da resposta era inferida de mudanas (1) no nmero de erros ou entradas em


becos sem sada, e (2) no tempo de reao (RT), da caixa de partida at a caixa-objetivo.
Depois de um nmero variado de tentativas de treino, os indivduos colocados no ponto

- 251 -

de partida percorriam esses labirintos rapidamente e sem erros. As curvas obtidas quando
erros ou RTs eram representados em funo do nmero de tentativas eram de vrias
formas, dependendo da estrutura particular do labirinto usado.Geralmente, medida que
se realizava mais e mais tentativas, os erros diminuam progressivamente at zero e os
RTs diminuam progressivamente, aproximando-se de uma assntota.
Havia muitas esperanas, originalmente, de que o estudo de animais em labirintos
revelaria os segredos da ao instrumental e forneceria informao fundamental a
respeito do processo de aquisio. Infelizmente, a histria confirmou poucas dessas espe
ranas. Em comparao com a topografia de uma presso barra ou uma bicada na
seqncia do labirinto constitui uma longa e complex a cadeia, cuja aquisio envolve uma
mistura no analisada de discriminao, diferenciao e reforamento condicionado.
Como todos esses aspectos do comportamento estaro inestricavelmente misturados
durante o treino, no surpreendente que a aquisio no labirinto seja gradual em vez de
abrupta. Os labirintos so usados at hoje na pesquisa psicolgica de problemas especiali
zados onde o grau de anlise requerido mnimo; mas, a confuso de um grande nmero
de fatores de aquisio acarreta dificuldades na interpretao de resultados cortiportamentais. O estudante aconselhado a encarar o comportamento no labirinto como uma
cadeia de elementos resposta h e te ro g n e o s (isto , diferentes), que s gradualmente se
tornam ligados em seqncias unitrias de resposta.
12.4

OS EFEITOS DA EXTINO SELETIVA EM PONTOS DIFERENTES DA


CADEIA

Embora
possamos concordar que seqncias complexas de comportamento
operante so adquiridas como cadeiasque crescem gradativamente, ainda relevante per
guntar se, uma vez formada, uma ao retm todos os aspectos encadeados. Por exemplo,
os membros originais da resposta preservam seu status unitrio como respostas? Os
experimentos em que o procedimento de extino aplicado seletivamente aos membros
originais de um ato bem condicionado so instrutivos.
Skinner (1938) encadeou a resposta de presso barra e a resposta de aproximao
ao comedouro no elo usual (fase a )
Fase a:

__

__

__

s+
^(presso barra) S (aproximao

Rao comedouro) R
^(alim ento
Lf (comer
2
3 ausente)

Ouando esta seqncia estava bem condicionada, introduziu-se a extino, no se permi


tindo que a presso barra produzisse o som do alimentador (fase b). Esta operao de
extino quebra a cadeia entre cadeia entre os elos 3 e 2.
Fase b:

^(presso barra)
^(alim ento ausente)

Sob essas condies, os S^s para os dois membros finais (aproximao ao comedouro e
comer) no podiam ser reproduzidos e, naturalmente, a presso bara no elo 3
- 252 -

enfraqueceu. Quando a resposta barra alcanou um nvel baixo, a cadeia foi restabe
lecida para incluir o elo 2 , permitindo-se que a presso barra produzisse o som do
alimentador. Mas nenhuma outra contingncia da cadeia foi restaurada (fase c ).
Fase

c:

^(presso barra)
S(alimento ausente)

S(som do alimentador)
R(aproximao ao comedouro)-f-

Os resultados dessas operaes seletivas de extino aparecem nas curvas duplas de


extino da Fig. 12-3.

Figura 12.3. A extino separada de membros dc uma cadeia. A


extino de R (presso barra) foi conduzida at a seta. Depois da
seta, tanto R (presso barra) como R (aproximao ao comedou.o) foram extintas (segundo Skinner, 1938).

Pela figura, parece que depois da reintroduo do som do comedouro (fase c ) , a


resposta de presso barra readquiriu fora imediatamente e uma segunda curva de
extino foi gerada. A interpretao desse resultado a seguinte. Durante a extino na
fase b , a resposta de presso barra (na ligao 3) enfraqueceu; mas a resposta de
aproximao ao comedouro (na ligao 2 ) no, porque esta ltima estava principalmente
sob o controle do estmulo som do comedouro, que no ocorreu nesta fase. Uma vez
ausente na fase b , o estmulo do comedouro no perdeu suas propriedadas de SD, n e m ,
a p a re n te m e n te , suas p ro p rie d a d e s d e re fo r a d o r c o n d ic io n a d o . Logo, o restabelecimento
da contingncia 3 na fase c restituiu presso barra sua fonte usual de reforamento
condicionado, o som do alimentador. Durante a fasec, a resposta discriminativa de aproxi
mao ao comedouro enfraqueceu gradualmente atravs da extino, e o som do come
douro perdeu, correspondentemente, suas propriedades de S ^, j que no estava sendo
mais emparelhado com alimento (S+).
A demonstrao de Skinnci sugere que, na extino, somente os membros de uma
cadeia at o
ponto de fracionamento diminuem em fora. A fora de membros e S^s alm
desse ponto preservada.
A extino pode ser aplicada de uma forma algo diferente para demonstrar ainda a
natureza encadeada do comportamento estabelecido. Ratos so inicialmente treinados a
percorrei um labirinto em forma de T (Fig. 12-2), obtendo o alimento que colocado
numa das caixas-objetivo (digamos, direita). Quando os ratos vo para o lado direito
consistente e rapidamente, esto prontos para a prxima fase do experimento. O
alimento retirado da caixa-objetivo, os ratos so colocados diretamente na caixaobjetivo agora vazia (onde haviam outrora encontrado alimento depois de percorrer o

- 253 -

labirinto), permanecendo ali por um momento. Numa fase final de teste, os ratos so
colocados na caixa de partida com o alimento ainda no presente na caixa-objetivo. O
tempo requerido para percorrer a distncia entre a caixa de partida e a objetivo medido.
O ato de percorrer o labirinto daqueles ratos que tiveram uma histria passada de serem
colocados na caixa-objetivo vazia mostra uma extino rpida, foradonormal. No teste,
estes ratos percorriam o labirinto mais devagar e cometiam mais erros do que cometeriam
se no tivessem tido a oportunidade de descobrir que sua caixa-objetivo estava agora
vazia,
Esta reduo na fora da resposta define um fenmeno conhecido como extino
latente . A escolha desta expresso para descrever o comportamento baseada numa
interpretao discutvel da fase intermediria do experimento, em que os animais so
colocados diretamente no compartimento vazio. Extino latente implica em que esta
fase intermediria um perodo durante o qual a extino do comportamento de percor
rer o labirinto est ocorrendo de forma implcita, ou latente. tentador dizer que os
ratos param rapidamente de correr no labirinto, em extino, porque, j tendo t*do
bastante tempo para investigar a caixa-objetivo vazia, eles sabem , antes de correr,
que a encontraro vazia. Infelizmente, esta explicao baseia-se no futuro como o fator
controlador do comportamento e contm todas as falhas de tais explicaes , mencio
nadas anteriormente (seo 4.1) Uma interpretao mais simples, embora mais austera,
est baseada na extino manifesta e perdas no reforamento condicionado. No treina
mento, os ratos aprenderam a percorrer o labirinto.
Treino: __
___
S(caixa-objetivo)
S(ponto de escolha)
S(caixa de partida)
R(dirigir-se ao recipiente com
R(virar

direita)
;
R(correr) -----
1
alim ento)-----* S +
2

Na fase intermediria, os ratos estavam na caixa-objetivo, agora vazia, resultando em


alguma extino verdadeira de R \.
S(caixa de partida)
R( dirigir-se ao recipiente com alimento) **

1
No teste, toda a cadeia foi submetida a um procedimento padro de extino.
Teste:
S(caixa de partida)
R(correr)------^

S(ponto de escolha)
R(virar direita)----

~2 '

S(caixa-objetivo)
R(dirigir-se ao recipiente com
1 alimento)

Os membros resposta associados com as contingncias 3 e 2 foram significativamente


enfraquecidos pela fase intermediria. A explicao dessa diminuio na fora encon
trada na reduo drstica do poder reforador da caixa-objetivo que ocorreu nesta fase.
Na extino latente , esta reduo parece regredir por toda a cadeia, diminuindo o
poder reforador de todos os SDs anteriores.
Os resultados da extino latente e do experimento de extino seletiva de
Skinner sugerem a seguinte generalizao composta de duas partes. Todos os membros de
urna cadeia at o ponto em que, nesta cadeia, um membro tenha'sido submetido a
extino, sofrem um enfraquecimento, se ou no estes membros foram realmente emiti
- 254-

dos. Por outro lado, nenhum dos membros alm do ponto de extino enfraquecido. A
generalizao de algum interesse como um mtodo prtico para reduzir o comporta
mento no desejado pela simples extino dos reforadores condicionados dos quais ele
depende. Se o comportamento no desejado consiste de uma seqncia grande e de longa
durao, tal princpio, se que ele se mantm para cadeias de qualquer tamanho, deve ser
bem recebido pelos educadores que acham desejvel extinguir velhos pontos de vista
antes de ensinar os novos.
12.5 ESQUEMAS ENCADEADOS
Nem sempre fcil avaliar as foras das vrias respostas e reforadores condicionados
numa cadeia estabelecida do tipo que descrevemos.
(1) O problema da medida. As respostas nessas cadeias so heterogneas, isto , as
respostas sucessivas na cadeia diferem uma da outra quanto forma Quando um rato
rola uma bola de gude at um buraco, puxa um cordo e pressiona uma barra, pouco
provvel que esses comportamentos ocorram com taxas idnticas. As respostas variam na
topografia, durao e esforo requerido. Assim, seria surpreendente se suas taxas de
ocorncia fossem comparveis. Mas uma cadeia, cujos membros correm com taxas
variadas devido s variaes topogrficas, presta-se pouco como um meio para o estudo
dos efeitos quantitativos que vrias operaes experimentais, tais como drogas, leso
fisiolgica e esquemas de reforamento poderiam exercer no comportamento encadeado.
(2) O problema da sensibilidade. Quando essas cadeias esto bem estabelecidas,elas
funcionam como unidades. Isto o que queremos dizer quando nos referimos aos seus
membros como estando ligados no que eqivale a um operante de ordem superior. A
estrutura unitria dessas cadeias uma conseqncia da manuteno dos membros sob o
controle funcional do reforamento, como fazemos para um operante mais simples.
Embora tenhamos visto que a extino seletiva uma forma de revelar a estrutura
essencialmente encadeada de tais atos, muitas operaes experimentais parecem afetar a
seqncia como uma unidade. A cadeia como um todo pode variar em fora, em funo
dessas diferentes variveis experimentais, mas as foras relativas dos membros individuais
da cadeia permanecem insensveis a essas variveis.
Em contraste com a cadeia simples, o esquema encadeado (Ferster e Skinner, 1957)
fornece uma linha-base quantitativa e sensvel para avaliar as propriedades de cadeias.
Como as cadeias j descritas, os esquemas encadeados consistem de uma sucesso de
contingncias ligadas. Mas, ao contrrio dessas cadeias, os esquemas encadeados especi
ficam que cada membro da resposta produz a contingncia seguinte probabilisticamente.
Assim, em qualquer ligao nica, um nmero de respostas pode ter que ser emitido para
avanar a cadeia para a prxima ligao. A vantagem disso que, em qualquer ligao
probabilstica, a taxa, frequncia ou padro do responder fornece uma varivel depen
dente sensvel que pode ser estudada independentemente da taxa, freqencia ou padro
dos membros resposta numa ligao em qualquer ponto da cadeia. Alm disso, j que os
membros individuais no esquema encadeado podem ser convenientemente especificados
como classes de respostas idnticas (homogneas), o problema de medida associado com
as topografias heterogneas em cadeias mais simples contornado.
Considere um esquema encadeado homogneo com duas ligaes. Lembre-se de
que o termo ligao se refere aosS ^s sucessivos do esquema. Na notao, os colchetes
sucessivos de um diagrama denotam as ligaes. Numa cadeia simples, cada ligao c

255 -

associada com uma e somente uma resposta, mas no esquema encadeado esta
correspondncia um-a-um entre resposta a ligao no est presente.
Um esquema encadeado representativo est abreviado em [ 12A\ .0 bicar a chave de
um pombo na presena de uma luz vermelha produz, num esquema RI, uma luz verde; o
bicar a chave na presena da luz verde produz, num esquema FI, o reforamento com
alimento.
S(vermelho)
R (bicar) RI >

S (verde)
R(bicar) FI ^

[12.4]

g+

0 diagrama [12.4 (descreve uma cadeia de duas ligaes mas uma que gera tipicamente
muitas respostas de bicar a chave por reforamento. Alm disso, padres diferentes de
resposta se desenvolvem nas diferentes ligaes, sendo cada padro apropriado para a
contingncia especfica da ligao em que ocorre. Assim, as curvas na Fig. 12.4A
mostram que efeitos tpicos de RI ocorrem na segunda ligao, a situao luz vermelha;
as curvas naFig 12-4B mostram que efeitos tpicos de FI so gerados na primeira ligao, a
situao luz verde. Dois registradores foram usados para obter a Fig. [ 12-4[.Bicadas na
presena da luz vermelha (ligao 2 ) foram registradas num registrador; bicadas na
presena da luz verde (ligao 1) foram registradas em outro. Quando o animal estava na
situao associada a uma determinada ligao, somente o registrador apropriado para esta
ligao era operado.
O procedimento do esquema encadeado tem aplicao na avaliao, em detalhes
quantitativos, do poder reforador de um reforador condicionado. Na seo 11.2, estvamos preocupados com a durabilidade de um reforador condicionado: isto , quanto
tempo um reforador adquirido retm seu poder de manter comportamentos. Mas a fora
de um reforador condicionado em qualquer momento determinado ,

r
f
' ' f

6 min
(A)

(B)

Figura 12-4. Respostas produzidas num esquema encadeado RI 45 seg - FI 45 seg.


Bicadas na chave so as respostas de pombos famintos. O aparecimento de uma luz
verde associada contingncia FI o reforamento em (A). O alimento o reforamento em (B). (Dados no publicados de J. R. Milienson).

- 256-

frequentemente, de igual interesse. Em linguagem coloquial, a fora de um reforador


porporcional quantidade de trabalho que o animal despender para obter o reforador.
Uma discusso completa sobre a fora de reforadores encontra-se no captulo 15. No
momento, suficiente notar que a taxa em que um organismo trabalha numa situao
(onde seu trabalho tenha, no passado, produzido o reforador) urna medida de tal
fora. Em geral, um homem que deseja algo ardentemente trabalhar muito para
conse^u-lo. Assim tambm o pombo. Quando o EI da primeira ligao em 112.41
aumentado, ou diminudo, a taxa total de bicadas do animal nesta ligao FI dificilmente
afetada. Mas sua taxa de bicadas na ligao RI precedente se altera sistematicamente. A
funo suave e apresentada na Fig. 12-5. A funo foi obtida com um procedimento
igual ao de [ 12.4 1 . Em vrios meses de experimentao diria, quatro valores de FI na
ligao 1 foram estudados. De acordo com a Fig. 12-5, quanto maior o Fl menos o
animal tende a trabalhar para produzir a ligao associada ao FJ e, assim, por inferncia,
menor o valor reforador a ela associado
Os esquemas encadeados podem ser combinados com especificaes de resposta de
ordem superior, formando cadeias tais como V I-R F , V I-drl e F R -F I. O nmero de
ligaes permissveis pode ir alm de dois. Demonstrou-se que cadeias VI-VI-VI-VI-VI
mantm o comportamento (Kelleher e Gollub, 1962). Muitos fenmenos cmportamentais interessantes ocorrem, encadeando-se uma variedade de procedimentos. O estu
dante interessado pode consultar Ferster e Skinner (1957) e Kelleher e Gollub (1962)
para detalhes adicionais.

Figura 12-5. Respostas por m inuto na segunda ligao de um esquema encadeado duas
ligaes em funo do esquema FI na primeira ligao (dados no publicados de J. R.
MilIcYjson).

12.6 O COMPORTAMENTO HUMANO COTIDIANO COMO ENCADEAMENTO


No c o m p o rta m e n to hum ano, quase toda ao ou habilidade, desde o
atravessar uma sala at o assobiar uma cano, tem a forma de uma cadeia operante. Tais
cadeias so compostas da maneira em que as sries de movimentos foram combinadas
pelos r-tos descritos na seo 12.1? Os S^s separam cada movimento simples no desem

- 257 -

penho humano e servem para ligar a seqncia como um todo? A anlise sugere uma
resposta afirmativa para ambas as questes.
No comportamento conhecido como caminhar, uma perna erguida, estendida e
toca o cho. A outra perna, ento, repete um padro semelhante. A cadeia claramente
algo como

[12.5]

onde So =ambas as pernas apoiadas no cho e


ps juntos
S6 =perna esquerda acima do cho
S5 =perna esquerda estendida
S4 =perna esquerda apoiada no cho e p
esquerdo adiante
S3 =perna direita acima do cho
S2 =perna direita estendida
S\ =perna direita apoiada no cho e p direito adiante

R()-erguer a perna esquerda


R6 =estender a perna esquerda
R 5=abaixar a perna esquerda
R4 =erguer a perna direita
R3 = estender a perna direita
R2 = abaixar a perna direita
R \ =eiguer a perna esquerda

Nesta cadeia, as descries dos estmulos podem ser questionadas em termos prticos.
Quando caminhamos, em geral no observamos continuamente a posio de nossas
pernas em uma relao outra. De quajqucr foram, caminhamos adequadamente no
escuro. Evidentemente, existem eventos dentro do organismo que so parte dos Ss em
cada colchete de [ 12 . 5 ]. Estes elementos internos de cada situao de 112.5 | surgem
dos prprios movimentos do corpo. Mencionamos brevemente, na seo 9.1, os
receptores conhecidos como proprioceptores, que se acham localizados nos msculos c
tendes. Esses receptores tm a propriedade de responder diferencialmente a vrios
movimentos de msculs e tendes. Assim, cada S em 11 2.5 | pode ser descrito mais
completamente, notando-se no apenas o estado do membro em referncia ao
ambiente externo como fizemos, mas tambm o estado exato dc tenso dos conjuntos
particulares de msculos usados. No andar comum, esses estados so usados como as
deixas principais para manter uma seqncia dc movimentos bem coordenada.
Contudo, a sensibilidade muscular no sempre suficiente, especialmente na
aquisio de seqncias mais complexas, para a coordenao ideal do comportamento.
Ao aprendermos um novo passo de dana, um instrutor pode ter que nos aconselhar a
no olharmos para nossos ps. Nosso comportamento de observar uma maneira bvia
de assegurar que colocamos nossos ps onde deveriam ser colocados durante a dana.
Mas, o comportamento visual de observar no incentivado pelos mestres de dana
porque ele viola certos padres estticos, retarda a aquisio do controle apropriado pela
propriocepo e torna quase impossvel que duas pessoas dancem juntas. Em certas
doenas ou leses da medula vertebral, os receptores proprioceptivos no operam. Nesles

- 258-

casos, as pessoas continuam a caminhar, mas somente pela observao visual da posio de
suas pernas.
A duplicao de indcios e a superposio informativa comumente encontrada nas
situaes explorada na tcnica conhecida como substituio gradual de controle". As
cadeias so frequentemente formadas utilizando-se elementos bem grosseiros das situa
es como S^s preliminares. Ento, medida que a aquisio prossegue, os controles so
gradualmente transferidos para pores cada vez mais sutis das situaes. Isto pode ser
feito no se liberando o reforamento quando um comportamento grosseiro de observa
o detetado, como no exemplo da dana, ou removendo-se gradualmente certos
aspectos da situao. Por exemplo, ao aprender a dirigir um carro, o novato pode depen
der, inicialmente, de comandos verbais do seu instrutor de direo para manter uma
cadeia suave de comportamento. Esses comandos so vistos entre aspas em 12.6 na
designao dos S^s.
SB

SA
R

>

Rn

---- > Rc

-* SD

[ 12.6]

onde S \ Coloque em marcha lenta+ carro parado


RA = colocar a alavanca de cambio em marcha lenta
Sb =Pise no acelerador * alavanca em marcha lenta
Rg =pisar no acelerador
S ~ Solte a embreagem + motor com rotao moderada
R =soltar a embreagem
Sd = Muito bem! + carro move-se para a frente
O instrutor pode, gradualmente, comear a omitir os elementos verbais das situaes, de
modo que as deixas provenientes do pedal de embreagem e da alavanca de cmbio passem
a atuar diretamente. Os professores, ocasionalmente, se esquecem de que no mundo fora
da sala de aula, deixas verbais faladas e escritas como as instrues de 22.6 so
muitas vezes chamadas raramente esto presentes. Assim, importante que no ensino
formal, as deixas verbais usadas no incio sejam retiradas antes que o estudantes possa ser
considerado treinado. esta eliminao gradual de partes de uma situao de S^,
deixando apenas aspectos mnimos do estmulo em controle, que conhecida como
s u b s t it u i o

gradual de controle.

Outros casos de substituio gradual de controle surgem quando um msico aprende


uma composio musical de cor. Inicialmente, as notas individuais escritas na pauta
fornecem os S^s. Na passagem

1
4

a cadeia R (tocar FA), R (tocar MI), R (tocar SI), R (tocar LA), determinada. Inicialmen
te, os membros individuais da cadeia so controlados pela partitura. Eventualmente, toda
via, a partitura gradualmente removida, as respostas de observar diretamente a partitura no

- 259 -

so incentivadas pelo instrutor e finalmente os prprios sons das notas fornecem todos os
S^s necessrios. Em geral, o
paia tocar uma nota iio ser necessariamente o som da
nota imediatamente procedente, mas, em vez disso, uma combinao dos sons de vrias
notas anteriores
uma passagem. Assim, por exemplo, a deixa para a execuo das nota
E acima, geralmente no ser apenas a nota B anterior, mas tal execuo estar sob o
controle de uma longa srie de notas precedentes, sendo a B apenas a ltima dessas.
Como seria esperado, portanto, as passagens de execuo mais difcil so aquelas que so
semelhantes, isto , aquelas que contm seqncias de notas idnticas terminando numa
nota final diferente. Para tocar a nota correta, o nico
disponvel est localizado a
alguma 'istncia (nas passagens muito semelhantes, talvez uma meia dzia ou mais notas
anteriores) as notas imediatamente precedentes devem, no momento, ser ignoradas.
Uma quebra no encadeamento explica a hesitao que um artista algumas vezes exibe
ao iniciar uma passagem. No h um
nico no incio da partitura. Um problema
semelhante pode ocorrer na memorizao de poesia. Uma vez comeada, cada palavra
falada marca a ocasio para a prxima palavra, mas necessrio alguma deixa verbal para
se iniciar. Quando crianas recitam poesia, frequentemente se observa que elas fazem
uma pausa entre as linhas. Este o resultado de se memorizar linha por linha, de modo
que a ltima palayra da linha anterior no adquire poder suficiente de
para a primeira
palavra da linha seguinte.
12.7 CADEIAS VOCAIS
No somente a poesia, mas todo comportamento verbal humano (comunicativo)
encadeado. A sentena uma cadeia de palavras, sendo que cada palavra falada uma
resposta que produz um S ^ (o som dessa palavra) que marca ocasio para a prxima
palavra. No distinguimos os rudos emitidos por seres humanos como sendo fundamen
talmente diferentes de outros operantec humanos e animais. Num captulo anterior
(sees 4.10 e 4.11) descrevemos experimentos que indicavam que o comportamento
vocal de crianas e estudantes universitrios fortalecido e enfraquecido de acorda com
as contingncias, de reforamento apropriadas. Desejamos ampliar, nesta seo, o que j
explicamos, indicando, ao mesmo tempo, como a linguagem alcana um status tipica
mente encadeado.
Considerando-se que a linguagem to intimamente uma parte aa arte, cincia e
culjura humanas, estudiosos _e cientistas de vrias disciplinas tm sido levados a aplicar
seus diferentes pontos de vista e tcnicas para analisar a linguagem. O corpo de conheci
mento resultante constitui a lingstica. No presente texto, restringimos nosso interesse a
trs problemas psicolgicos da linguagem: ( 1 ) O que constitui uma descrio compor
tamental conveniente da linguagem? (2) Como este comportamento adquirido? (3)
Qual o significado da linguagem? Nesta seo, restringimos nossa ateno aos dois
primeiros problemas, adiando a anlise do significado (que melhor descrito pela
enumerao de condies especficas que controlam as seqncias particulares de lingua
gem) para o captulo posterior sobre aquisio de conceito.
Na seo 4.10 notamos que, bem cedo na vida da criana, a distribuio da freqn
cia relativa de vrios fonemas torna-se semelhante aos histogramas de fonema para a
comunidade em que a criana est sendo criada. A correspondncia presumivelmente o
efeito de contingncias de reforamento seletivo peculiares a essa comunidade. Embora
tais distribuies possam nos dizer quais so os sons bsicos que mais provavelmente

"GO

sero enunciados por um dado indivduo, elas fornecem pouca informao sobre a estru
tura do comportamento verbal. Esta estrutura convenientemente descrita como cadeias
de palavras. Alm disso, as prprias palavras faladas so convenientemente representadas
como cadeias de slabas ou fonemas. Naturalmente, da mesma forma que os membros
resposta no comportamento encadeado do rato relativo presso barra, as unidades de
cadeias verbais tambm desaparecem nas seqncias que fluem suavemente. Sob certas
condies, a natureza encadeada das palavras facilmente demonstrvel. Na aquisio de
uma palavra nova e difcil, de modo a podermos repetir a palavra corretamente. A palavra
Monongahela , dos ndios Delaware, de difcil pronncia para estrangeiros. Quando a
palavra representada como uma cadeia, os S^s dos sons e as Rs de falar so convenien
temente descritos como slabas [12.7.| Inicialmente, os sons podem ser

[12.7]
l < h e >

I < la >

S "la '

produzidos pelo aparelho vocal de um instrutor ou, em princpio, por uma mquina. As
respostas de 112.7Jso aquelas de um organismo aprendendo a pronunciar a palavra. Na
notao, os elementos falados (R) das palavras so colocados entre colchetes oblquos
< > ; enquanto os sons (S) das palavras so colocados entre aspas .
No incio da aquisio, os S^s de qualquer ligao determinada em [12.7 |no tm
controle suficiente sobre as Rs desta ligao para produzir seguramente um comporta
mento. O instrutor pode ter que fornecer uma deixa verbal para a slaba desejada. Por
exemplo, aps o erro comum mongonga , o instrutor pode aconselhar um reinicio e,
depois que o aprendiz responde , mo , ele mesmo pode dizer non . Sob instrues
apropriadas para imitar, o S non provavelmente controlar a R non . Naturalmente,
o instrutor eventualmente remover essas deixas verbais de modo que a pronncia correta
se torne independente da sua presena.
Uma nota sobre imitao aqui inserida entre parnteses. A imitao , inquestio
navelmente, um mtodo valioso para controlar o comportamento. Mas, como uma
maneira rpida para o processo completo de aquisio, ele pode ser muitas vezes superesti
mado. Os professores frequentemente se surpreendem ao observar que, dando ao aluno
um pouco de informao, frequentemente nada ensinam ao estudante. O desempenho
complicado de um danarino, de um acrobata hbil ou de um msico no pode ser
colocado no repertrio de um novato atravs da mera imitao. Observar algum a dirigir
um carro ou pilotar um avio no desenvolve, por si s, estas habilidades no observador.
A imitao quase sempre til para aumentar a fora de respostas previamente adquiri
das, mas no to til para encadear os membros numa seqncia de qualquer tamanho
ou complexidade.
A natureza encadeada das palavras claramente exposta em experimentos que alte
ram a sucesso normal de S^s. Se respostas silbicas do tipo visto em [ 12.7 ]no produ
zem seus S^s caractersticos imediatamente, o padro da fala rompe-se e se torna cati
co, sujeito pode comear a garguejar e, em casos extremos, totalmente incapaz de falar.
No Feedback auditivo com atraso, as relaes normais R -* S^ na fala de cada uma das
suas prprias Rs de falar, por cerca de 1/5 de seg. (Lee, 1950). O termo feedback foi
emprestado da linguagem da eletrnica, onde parte de um sinal de sada out-put
(por exemplo, na sua vitrola, parte da energia amplificada que ordinariamente iria para
261 -

seu altofalante) retornada (feedback) para a entrada input (o lugar onde voc
coloca a tomada de sua vitrola) do mesmo circuito. Por analogia, uma resposta pode ser
considerada uma sada do sistema comportamental; o ambiente pode ser considerado a
entrada deste sistema. Quando um organismo opera em seu ambiente, emitindo operantes, as mudanas no ambiente produzidas pelas prprias respostas do organismo podem
ser consideradas um feedback para o organismo. A palavra feedback , despida de sua
caracterstica eletrnica, anloga quelas conseqncias especiais que chamamos refor
adores primrios e secundrios.
Imagine um sujeito numa sala prova de som. Fones de ouvido confortavelmente
ajustados e paredes e tetos que absorvem sons impedem-no de escutar sua prpria voz
pela propagao normal atravs do ar. (Uma recepo muito reduzida possvel atravs
da propagao nos ossos). Os sons produzidos pelas respostas de falar vo para um
gravador atravs de um microfone. Eles so retardados pelo simples procedimento de
primeiro grav-los e, ento, uma frao de segundo mais tarde, toc-los amplificados para o
sujeito. A amplificao serve para anular quase toda a conduo ssea de S^s. O eteito
obtido um exagero daquele observado quando um orador fala para o pblico, num
sistema de alto-falante, estando o alto-falante localizado a alguma distncia de seu micro
fone.
Num caso tpico de distoro da fala produzida por este tipo de atraso de som, a
pronncia de Monongahela torna-se monongahelala. Considere este efeito em relao
cadeia do diagrama [12.7 |. Na ligao da contingncia 1, o sujeito acabou de pronunciar
R < la > e, em circunstncias normais, ouviria imediatamente S Ia , o
final na cadeia.
Mas, devido ao atraso, ele escuta S he , que ainda controla outra R < la>. O efeito
mais pronunciado no final da cadeia porque, na fala normal, o comportamento no meio
da cadeia da palavra mantm-se ligado pelos movimentos imediatamente antecedentes do
aparelho vocal, em adio aos efeitos sonoros produzidos por esses movimentos. A R
final,uma pausa deliberada, mais dependente do som da slaba terminal. (A maneira mais
segura de voc saber que terminou de falar uma palavra escutar sua ltima slaba).
O mtodo de feedback auditivo com atraso, quando com um atraso fixo, pode no
ser o melhor para quebrar a cadeia da fala. Com a prtica, parece razovel que o sujeito
passe a usar os S^s atrasados, uma vez que eles ainda tm uma relao fixa com o
comportamento anterior (sempre 1/5 seg mais tarde). Se o atraso fosse uma mdia de
intervalos aleatrios igual a 1/5 seg, intervalos esses que variassem de momento a momen
to, esperar-se-ia um rompimento mais completo da cadeia de linguagem falada.
As sentenas podem ser analisadas de forma anloga s palavras. Durante a infncia,
a aquisio de sentenas baseada na ligao de combinaes cada vez mais longas de
palavras. No levando em conta o problema do significado, as cadeias de sentenas
diferem das cadeias de comportamento do rato at aqui consideradas, no sentido em que
seus membros resposta (palavras) so combinados em muitas seqncias diferentes
permissveis. (Isto tambm verdadeiro nas cadeias de slabas que formam as palavras). A
cadeia o cachorro morde o homem controlada por uma situao muito diferente da
cadeia o homem morde o cachorro. Logo, as unidades bsicas das sentenas (palavras)
no podem ser aprendidas em qualquer seqncia fixa da maneira em que o rato da seo
12.2 aprendeu os membros de sua cadeia. A sentena construda pea por pea, empre
gando as palavras como unidades. medida que a criana cresce, a mdia do tamanho de
suas sentenas faladas aumenta, como visto na tabela 12 - 1 .

- 262-

Tabela 12-1
TAMANHO MDIO DE SENTENAS FALADAS EM VRIAS IDADES
( s e g u n d o M c C a r th y , 1954 )
Idade (anos)

1.5

Nmero de
nalavras

1.2

2.0

2.5

3.0

3.5

4.0

4.5

3.1

3.4

4.3

4.4

4.6

Como as unidades de palavras so organizadas em sentenas? O mecanismo parece


ser um encadeamento de operantes discriminativos discretos. Por exemplo, o comporta
mento verbal de uma criana pode ser modelado (de acordo com os princpios dos
Captulos 7 e 8) de tal modo que a palavra bola venha a ser pronunciada, quando
solicitada, na presena de objetos esfricos. Similarmente, pode-se tomar o reforamento
contingente emisso de certos sons pela criana (<azul> <vermelho>,<verde >, etc.),
na presena de objetos apropriadamente coloridos. Finalmente, a criana pode ser treina
da a vocalizar < Eu tenho... > nas circunstncias em que esteja com um certo objeto
para o qual ela tenha aprendido um nome, como aprendeu bola . A chave para esta
anlise que cada palavra ou conjunto de palavras fica sob o controle de uma situao
ambiental e s p e c f i c a , ou, mais exatamente, um conjunto de situaes:
S (bola)
^ ^ b o !a >

*S

S (objeto vermelho)
R< vermelho>----- >-S \

S ( de posse de... )
R < E u tenho... >

s+

Embora a criana nunca possa ter completado esta seqncia, a questo O que voc u il
a? pode produzir a nova cadeia, R < eu tenho > lumajR < bola > R < verme
lha> , se os elementos da seqncia em conjuno com certas regras gramaticais a
respeito de artigos indefinidos e suas posies com relao a outras palavras e as regras
que governam a ordem dos adjetivos e substantivos j existem no repertrio comporta
mental. Naturalmente, no h necessidade de que a criana seja capaz de verbalizar estas
egras; ela precisa apenas empreg-las apropriadamente. Tipicamente, o fortalecimento do
ornportamento de verbalizar regras gramaticais reservado para os professores de Portu
gus.
12.8 CADEIAS RAMIFICADAS E REPRESENTAO DO DIAGRAMA DE FLUXO
No estudo das recompensas tokens com chimpanzs, estabeleceu-se uma discrimi
nao entre fichas brancas com valor e fichas de metal sem valor (seo 11.3) Numa
variao do procedimento, os chimpanzs tinham que puxar uma barra para obter fichas.
Algumas vezes, eles obtinham uma ficha branca pelo seu esforo, mas outras vezes
obtinham uma de metal. Quando recebiam uma ficha branca, eles a colocavam numa
mquina de vender que fornecia uvas ou gomos de laranja. Mas, nas ocasies, em que
recebiam fichas de metal, os animais desprezavam-nas e voltavam barra para uma nova
tentativa. Eles aprenderam que colocar fichas de metal na mquina de vender nunca
produzia o reforamento.

- 263-

As contingncias de puxar a barra para os chimpanzs parecem de alguma forma com


aquelas de um motorista que se aproxima de um cruzamento. O comportamento que o
motorista emite no cruzamento depender de ele encontrar uma luz verde, uma luz
vermelha, um sinal para prosseguir ou um policial de trnsito. As conseqncias de
estimulo do comportamento de aproximao do motorista e do comportamento de
puxar a barra do chimpanz esto sujeitas a um grau de incerteza. Em ambos os casos,
uma determinada resposta puxar a barra ou aproximar-se do cruzamento pode levar
a vrias situaes possveis. E a resposta apropriada que se segue na cadeia(inserir
a ficha ou puxar a barra novamente; parar ou seguir) depender da situao particular em
que de fato ela ocorreu.
Quando uma resposta numa cadeia de comportamento pode, deste modo, levar a
uma de vrias situaes possveis, diz-se que as contingncias naquele ponto se ramificam.
Notamos as contingncias simples, ramificadas, nas sees anteriores, desenhando vrias
setas partindo de uma R e indicando as probabilidades de cada conseqncia de estmulo.
Muitos dos problemas cotidianos so mais complexos que aqueles encontrados pelo
chimpanz e o motorista. Nestes casos, as solues so encontradas apenas cruzando-se
uma cadeia complexa de tais contingncias ramificadas. No problema tpico, as contin
gncias so compostas de modo a formar uma rede complexa de ramos, sub-elos, interconexes, becos sem sada e rotas alternadas.
E conveniente analisar o arranjo de contingncias de reforamento no caso de reso
luo de um problema mais complexo. Ao achar a diferena entre dois nmeros, uma
criana est resolvendo um problema . Para o adulto sofisticado, naturalmente, o
exerccio de subtrao parece uma execuo trivial de uma seqncia comportamental
automtica. O sabor de um problema h muito se perdeu; todavia, por essa razo que
uma anlise dever ser esclarecedor a.De fato, o fracionamento do exerccio simples revela
uma cadeia bastante complexa de contingncias, em que pelo menos trs habilidades
comportamentais participam.
Considere o seguinte problema

60048
152

Para os objetivos de anlise, referir-nos-emos aos inteiros 6 ,0 ,0 ,4 e 8 , que aparecem no


nmero superior, como inteiros superiores, ou simplesmente superiores ; e, aqueles
nmeros 1, 5 e 2, que aparecem no nmero inferior, como inteiros inferiores, ou simples
mente inferiores . Supomos que quaisquer espaos existentes sob um superior (por
exemplo, aqueles sob o 6 e o ltimo zero esquerda do mesmo problema) so conside
rados zeros.
Podemos identificar trs operantes que o repertrio comportamental do invidduo
deve incluir para que ele execute as vrias cadeias que levaro soluo do problema.
1.
Um repertrio de respostas simples de subtrao deve estar presente. Uma criana
treinada para responder trs ao comando subtraia quatro de sete ; a responder
oito ao comando dezessete menos nove ; e assim sucessivamente. Em geral, uma lista
de operantes discrim in ativos adquirida, de modo que a criana pode dar corretamente a
resposta a qualquer subtrao onde o superior no maior que 18 e o inferior no
maior que 9. (Acima desses limites, uma subtrao ser solucionada pelo processo a ser
- 264-

descrito). Esta lista de respostas constitui um conjunto de operantes discriminativos


usualmente adquiridos atravs da aprendizagem de decorar e ditos serem memorizados .
As respostas poderiam, naturalmente, ser rapidamente retiradas de uma tabela, mas elas
so usadas to frequentemente em problemas de aritmtica que o procurar numa tabela
atrasaria drasticamente a execuo da cadeia de soluo.
2.
O comportamento de pedir emprestado deve ter sido previamente adquirido. Dado
um inferior maior que seu superior
60048
152
deve-se ser capaz de examinar o primeiro superior diferente de zero localizado
esquerda (60048), e diminuir 1 dele. Deve-se, ento, transformar quaisquer zeros existen
tes entre os dois superiores em questo em noves (59948), e finalmente adicionar 10
ao superior cujo inferior originalmente o excedia (599 114.81).
3.
O indivduo deve ser capaz de discriminar o maior de dois inteiros. Essa discrimi
nao consiste, primeiro, de uma resposta de observao dirigida para o inferior , e,
ento, para o superior logo acima dele. Se o inferior maior do que o superior ,
ento uma resposta (pedir emprestado) deve atuar; de outro modo, outra resposta
(subtrair) dever atuar.
Quando tentamos representar por Rs, Ss e colchetes, as contingncias que combi
naro essas tres habilidades componentes de tal forma que produzam uma soluo,
encontramos uma dificuldade. Este problema aritmtico relativamente simples quando
comparado com muitos outros problemas numricos e no numricos. Contudo, suas
contingncias compreendem tantos ramos,sub-elos, nterconcxes e rotas alternadas, que
nossa notao sobrecarregada para fornecer uma representao manejvcl. Uma represen
tao menos confusa da estrutura comport am en tal de tais tarefas necessria.
As respostas e discriminaes que o indivduo faz ao solucionar um problema como a
subtrao contm certa semelhana com as operaes que um computador digital realiza
para solucionar problemas similares. A mquina e o homem podem no empregar mto
dos idnticos, mas ambos alcanam uma soluo atravs da aplicao de habilidades
componentes no momento e local apropriados. Os cientistas de computadores desenvol
veram uma notao para descrever o fluxo seqencial das operaes da mquina. Os
elementos desta notao so a caixa de teste (Fig. 12-6) com uma entrada e duas sadas,
correspondendo comportamentalmente a uma discriminao, e a caixa de operao Fig.
12-7) com uma entrada e uma sada, correspondendo comportamentalmente a uma
seqncia fixa de respostas.
entrada

entrada

operaao

sada 2
Figura 12-6

sada
Figura 12-7

- 265-

A Fig. 12-8 um diagrama de fluxo de testes e operaes que descrevem as etapas


que levam soluo do nosso problema de encontrar a diferena entre dois nmeros. Um
sub-elo (visto em pontilhado) descreve o comportamento de observao que precede o
processo real de soluo do problema. O comportamento pode circundar vrias
Incio

Figura 12-8. Diagrama de fluxo comportamental para se encontrar a diferena entre


do::, nmeros

- 266-

vezes esse elo antes de alcanar as condies de


que permitem o avano da cadeia. O
pedir emprestado visto como um caminho que pode ter que ser percorrido, dependendo
dos resultados do teste do inferior mais esquerda do diagrama.
O
arranjo das habilidades componentes na estrutura vista na Fig. 12-8 garante uma
soluo para o problema definido. Comportamentalmente, uma soluo constitui-se
da produo de uma situao (SD) com certas propriedades. No caso presente, este

um nmero que, quando somado a 152 resulta em 60048. Quando um conjunto de


contingncias, testes e operaes pode ser arranjado de modo a dirigir o comportamento
para a produo inevitvel de um
da soluo, referimo-nos cadeia resultante como
um algoritmo. Muitos problemas prticos do cotidiano, desde costurar e cozinhar at
calcular e desenhar, so analisados em termos dessas cadeias algortmicas de comporta
mento.
12.9 CADEIAS DE COMPORTAMENTO ENCOBERTO
Uma das caractersticas principais das cadeias de linguagem a sua capacidade de se
tornarem encobertas, de modo que difcil dizer por observao direta o que a pessoa
est fazendo, se o estiver, quando est resolvendo um problema por si mesma . Como
nos referimos repetidamente ao comportamento como tudo o que se pode observar que
um indivduo fazendo, existe a um problema real de definio. Estamos lidando com o
comportamento quando uma criana resolve um problema de subtrao para si
mesma ? Por inferncia, existe uma razo para se acreditar que uma cadeia ramificada
do tipo da Fig. 12-8 realmente est se processando, embora a observao minuciosa da
criana no revele movimento dos lbios, lngua, olhos ou bca. O valor de tal inferncia,
naturalmente, encontra-se na sua capacidade de prever e explicar outros compor
tamentos.
Uma das teorias mais interessantes de J. B. Watson (1914-1920) foi a reduo do
fenmeno conhecido como pensamento em termos de cadeias de comportamento
encoberto. Watson citou, em apoio a esta teoria, o fato de as crianas, se no punidas por
isto, frequentemente pensarem alto. De fato, uma histria de aproximao sucessiva de
respostas cada vez mais silenciosas necessria para fazer a criana falar para si mesma .
Alm disso, quando os adultos solucionam problemas difceis, seus lbios frequentemen
te se movem e se o problema muito difcil, o indivduo pode comear a falar aber
tamente. Watson sups que a evidncia para a linguagem encoberta, provavelmente,
poderia ser detetada por instrumentos sensveis ligados aos msculos usados na
linguagem. Ele sugeriu que, ao se pensar em atividades tais como andar de bicicleta ou
dirigir um carro, ocorrem respostas de pequena escala nos msculos do corpo
normalmente usados nestas atividades.
A teoria de Watson tinha precedentes histricos. Plato havia observado que o
pensamento e a linguagem estavam intimamente ligados a vrios autores do sculo XIX
chegaram quase a antecipar Watson. Mas ningum antes de Watson atreveu-se a expor a
tese de que todo pensamento era resposta encoberta. Vista com um enfoque moderno, a
posio de Watson pode parecer mais ou menos extrema, dependendo dos preconceitos
filosficos de cada um. Mas, cientificamente falando, a equao proposta entre pensa
mento e contraes musculares desnecessria e, talvez, intestvel. Todavia, a noo de
que as cadeias de comportamento podem tornar-se reduzidas em magnitude at que no
sejam mais observveis a olho nu, permanece como uma proposio cientfica capaz de
- 267 -

gerar experimentos, identificando-se ou no algum ou nenhum pensamento com estas


cadeias. Neste sentido, a hiptese de Watson permanece como um desenvolvimento cria
tivo importante na h istria da cincia comportamental.
Infelizmente, pouca experimentao conclusiva resultou da hiptese de Watson. Em
sua prpria poca, aparelhos de registros sensveis ainda no haviam sido aperfeioados ao
ponto necessrio para se fazer as medidas exigidas. Dois experimentos, entretanto, feitos
em 1930, fornecem alguma evidncia preliminar de que a resposta encoberta ocorre nos
msculos apropriados quando so dadas, aos sujeitos, instrues para pensar .
Num experimento, colocou-se eletrodos em vrias partes do corpo do sujeito (bceps
direito e esquerdo) e o sujeito foi instrudo a imaginar o movimento de um membro
(Jacobson, 1932). As respostas eltricas dos msculos foram registradas num quimgrafo
de movimento rpido (do tipo no cumulativo). Na Fig. 12-9, os registros obtidos do
(A)
(B)

<C>

(A) Imagine-se erguendo um peso de dez


libras com seu brao direito .
(B) Imagine-se erguendo-o com o brao
esquerdo .
(C) Imagine-se martelando um prego
duas vezes, estando o martelo seguro
pela sua mo direita .

Figura 12-9. Potenciais musculares registrados do bceps direito depois de vrios tipos
de instrues (segundo Jacobson, 1932).

bceps direito esto justapostos com as vrias instrues que os precedem. As instrues
claramente tiveram um efeito seletivo na atividade do msculo e, como mostra o registro
(B), o efeito foi localizado no brao direito somente quando a instruo se referia ao
brao direito. Durante o registro de (A), (B) e (C ), o experimentador no foi capaz de
detetar qualquer movimento real do brao, a olho nu.
Noutro experimento, os eletrodos foram colocados nos msculos da lngua e sob os
lbios. Sob instrues de se imaginar contando, ou lembrando poemas ou canes ou
multiplicando nmeros, os potenciais musculares ocorriam na musculatura da fala do
sujeito. A forma da atividade eltrica, embora reduzida em amplitude, era muito parecida
com a atividade eltrica que ocorreu quando a instruo imagine foi substituda pela
instruo de fale em voz baixa .
.
Noutros experimentos independentes, os eletrodos foram colocados nos braos de
sujeitos surdomudos, cuja linguagem consiste de gestos com as mos e dedos. Quando os
mudos eram instrudos a pensarem em palavras ou resolver problemas de multiplicao
de forma encoberta, geralmente apareciam potenciais musculares na regio do antebrao.
Os potenciais musculares de sujeitos que podiam ouvir e falar foram usados como base
para a comparao. Sob instrues semelhantes, ou sujeitos normais no apresentaram
potenciais nas suas regies do antebrao (Max, 1937).
Em concluso, a teoria de Watosn fornece um certo conforto intelectual para o
cientista do comportamento: o pensamento tem um lugar no esquema de eventos comportamentais e pode, ento, ser descartado como outros fantasmas mentais do
passado. Mas os experimentos no fluem imediatamente da posio de Watson, talvez um
pouco devido s dificuldades de se fazer registros musculares. Mesmo as melhores teorias,
frequentemente podem levar a uma complacncia que, em vez de favorecer a
- 268 -

pesquisa, pode atravanc-a. Existem numerosos problemas interessantes a respeito de


cadeias encobertas de resposta, como elas so adquiridas, siia superioridade em eficincia
em relao s cadeias manifestas correspondentes, questes sobre a sua manuteno,
e assim por diante. Mas, enquanto as respostas encobertas forem consideradas apenas
uma explicao para o pensamento , esses problemas pennanecero enterrados.
Neste sentido, o trabalho de Hefferline e Keenan (1963), mencionado na seo 8.5
animador porque fornece o tipo de neutralidade terica que promete esclarecer esses
problemas e reabrir a discusso sobre as respostas encobertas, to audaciosamente intro
duzida por Watson h mais de meio sculo.

REFERNCIAS PARA O CAPITULO 12


Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New York:
Appleton-Century-Crofts, 1957. Chapter 1 2 .
Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a
small-scale (covert) operant. J. exp. Anal. Behcv., 1963, 6 , 307
315.
Jacobson, E. The electrophysiology of mental activities. Amer. J.
Psychol., 1932, 44, 677-694.
Kelleher, R., and Gollub, L. A review of positive conditioned reinforce
ment. /. exp. Anal. Behav., 1962, 5, 543-597.
Lee, B. J. Effects of delayed speech feedback. J. acoust. Soc. Am er.,
1950, 22, 824-826.
M cCarthy, Dorothea. Language development. In L. Carmichael (E d .),
Manual of child psychology. New York: Wiley, 1954.
M ax, L. W. Experimental study of the motor theory of consciousness.
IV. Action-current responses in the deaf during awakening, kinaesthetic imagery and abstract thinking. J. comp. Psychol., 1936, 24,
301-344.
M ichael, J. Laboratory studies in operant behavior. New Y ork: McGrawHill, 1963.
Pierrel, Rosemary, and Sherman, J. G. Train your pet the Barnabus way.
Brown Alum ni M onthly, Feb. 1963, pp. 8-14.
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
W atson, J. B. Behavior, an introduction to comparative psychology. New
York: Holt, 1914.
W atson, J. B. Is thinking merely the action of language mechanisms?
Brit. J. Psychol, 1920, 11, 87-104.

- 269-

QUARTA PARTE
CONTINGNCIAS COMPLEXAS

13. AQUISIO DE CONCEITO


14. SOLUO DE PROBLEMAS E INTELIGNCIA

Captulo 13 AQUISIO DE CONCEITO

Os princpios elaborados nos captulos precedentes permitem-nos descrever e classi


ficar uma grande parte do comportamento aprendido de organismos animais e humanos.
Mas se terminssemos nossa avaliao do comportamento com as operaes aquisio
simples, discriminao, diferenciao, encadeamento, reforamento secundrio e generali
zao, seriamos, ento, forados a admitir que a parte principal do comportamento humano
complexo permaneceu intata. As atividades que podem ser classificadas como comporta
mentos humanos complexos so, naturalmente, muito diversas. Uma caracterstica que
todos eles parecem compartilhar, todavia, uma afiliao ntima com a linguagem. De
fato, uma implicao dos captulos precedentes de que a existncia e o uso da lin
guagem talvez seja o nico atributo comportamental do homem que o distingue dos seus
parentes inferiores. Embora possamos concordar que o comportamento inicial de lingua
gem seja adquirido atravs do processo de aproximao sucessiva e que as palavras tor
nam-se S^s, o significado da linguagem, contudo, parece estar alm dos conceitos
derivados de animais no laboratrio. O prprio termo significado apresenta numerosos
problemas de definio. Mas, os aspectos do comportamento humano a que se refere
constituem fenmenos bastante reais. Alm disso, claro que qualquer cincia do com
portamento que pretenda ser amplamente compreensvel deve, eventualmente, dirigir-se
para a descrio desses fenmenos. No podemos ignorar os comportamentos humanos
complexos simplesmente porque eles so pobremente especificados. Na verdade, a prin
cipal razo pela qual eles so to pobremente especificados que eles aguardam uma
descrio em termos de uma linguagem geral, compreensivae rigorosa. Assim, a descrio
destes comportamentos complexos em termos da estrutura conceituai de fenmenos
comportamentais simples resultaria, simultneamente, na sua compreenso e esclareci
mento.
No presente captulo, portanto, estendemos a anlise comportamental para o campo
do comportamento humano complexo. Escolhemos como nosso ponto de partida a rea
conhecida como formao de conceito. So tantas as atividades caracteristicamente
humanas que tm sido relacionadas a conceitos pensamento, compreenso, significado
de palavras, raciocnio, soluo de problema que podemos estar certos de que, se se
pudermos estabelecer um contato experimental aqui, estaremos numa posio favorvel
para nos dirigir a uma anlise de muitas formas de comportamento humano complexo.
Iniciamos com uma considerao de um tipo de comportamento, desenvolvido no

- 273-

laboratrio animal, que compartilha de certas propriedades importantes com o comporta


mento humano conceituai. Novamente, este comportamento de laboratrio surge de uma
configurao de operaes familiares de aquisio, extino, discriminao e generali
zao. Devido a suas relaes com comportamentos simples e complexos, ele parece
representar uma ligao importante entre as duas classes. A simplicidade relativa dos
fenmenos de laboratrio ajudar-nos- identificar o termo conceito com certas caracte
rsticas precisas de comportamento. Uma vez tenhamos compreendido esta palavra-chave,
alguns experimentos simples com sujeitos humanos, onde os aspectos especiais da lingua
gem no so utilizados, iro elaborar ainda mais a lgica geral do comportamento con
ceituai Finalmente, guiados pelos nossos paradigmas experimentais, poderemos explorar
brevemente os comportamentos humanos complexos associados com termos tais como
compreenso, significado, instruo, percepo e (no prximo captulo) soluo de pro
blemas.
13.1 DISPOSIO PARA APRENDER (SIMPLES)
No captulo 10 (Discriminao), notamos que uma classe de discriminao compre
endia duas situaes e duas respostas e descrevemos os aparelhos experimentais prprios
para o estabelecimento de tais contingncias. Um desses aparelhos, o Wiscosin General
Test Apparatus, foi mostrado na Fig. 10-5. No WGTA, pode-se apresentar a um macaco
ou outro primata vrios objetos numa bandeja mvel, sendo que debaixo de um desses
objetos encontra-se um recipiente contendo um amendoim. Suponha que sejam usados
dois objetos: uma cruz de madeira macia e um objeto em forma de U, tambm de
madeira macia. O amendoim sempre encontrado debaixo da cruz, quer ela aparea
direita ou esquerda. As duas contingncias possveis podem ser diagramadas como 1
[13.1]
R E -* S +

Rd ^

s+

onde a contingncia 1 representa a cruz esquerda e a contingncia 2 representa a cruz


direita. Uma resposta incorreta (isto , R q em 1, o u Re em 2) leva remoo da
bandeja. Depois de um pequeno intervalo, uma das contingncias novamente colocada
em efeito. Uma resposta correta (isto , Rg em 1, ou Rj) em 2) produz um amendoim
(S+). Aps um pequeno intervalo, uma das contingncias novamente estabelecida.
Chamemos de uma tentativa uma nica apresentao, pelo experimentador, de uma ou
outra das situaes e contingncias de fl3 :l|.C o m o que sabemos sobre discriminao,
podemos estar certos de que, dado um nmero de tais tentativas, ocorrer um processo
comportamental. Durante as primeiras tentativas, o comportamento do animal no estar
sob o controle da cruz e, logo, Rs incorretas ocorrero: R p em 1 e/ou Rg em 2.
Eventualmente, todavia, a medida que mais tentativas so realizadas, o comportamento
do animal, gradualmente, passa a ficar sob o controle da localizao da cruz. Uma vez
que este processo gradual, dezenas ou centenas de tentativas, dependendo da espcie e
de diferenas individuais, podem ser necessrias para se atingir um valor assinttico de
aproximadamente 100 por cento de respostas corretas .

1 no decorrer deste captulo, Rg, R e Rq referir-se-o a pegar o objeto esquerda,


no centro e direita.

- 274-

At agora, descrevemos apenas um conjunto de contingncias de discriminaes de


2S 2R. Denominemos um nico conjunto de tais contingncias (como em [13.1]),
um problema de discriminao. Suponha que, uma vez o processo de discriminao tenha
atingido sua assntota, apresentemos uma nova srie de congingncias. Escolhemos o
novo problema de modo que ele difira das contingncias anteriores apenas em relao aos
objetos usados como seus 2 Ss; por exemplo, uma esfera de madeira macia e um cone de
madeira invertido. O problema, com exceo disso, idntico. Qual ser a natureza deste
novo processo de discriminao? De fato, muito semelhante ao primeirc processo. C
animal comea desempenhando pouco melhor do que se e s p e r a r^ pelo acaso. Mas, even
tualmente, ele passa a escolher o objeto correto (agora a esfera)
todas as tentativas.
Uma inspeo mais detalhada destes dois processos pode revelar, todavia, um desloca
mento ligeiramente mais rpido em direo assntota, no segundo caso.
Esta comparao de dois processos sucessivos de discriminao sugere um interes
sante delineamento experimental geral. Evidentemente no estamos limitados a um.
dois, ou mesmo alguns de tais problemas de discriminao. Podemos continua a apre
sentar novos problemas, um depois do outro, enquanto pudermos encontrar objetos
diferentes e nossa pacincia aguentar. Felizmente para o ltimo fator, descobrimos que,
medida que apresentamos mais e mais problemas, os processos de discriminao
tornam-se apreciavelmente mais rpidos. Embora dezenas a centenas de tentativas possam
ter sido necessrias para se chegar ao desempenho assintticonos problemas iniciais, talvez
menos de meia-dzia de tentativas sejarn necessrias para um desempenho sem erro
quando 100 discriminaes tiverem sido aprendidas. Eventualmente, depois de vrias
centenas de problemas, descobrimos um resultado notvel. O macaco, agora, capaz de
solucionar qualquer problema deste tipo, imediatamente. Se, por acaso, ele escolhe c
objeto correto na primeira tentativa, ele continua, da em diante, a escolher o objeto
correto. Sc, por acaso, escolhe o objeto errado na tentativa 1, ele inverte o padro de
resposta imediatamente e escolhe o objeto correto da tentativa 2 em diante. Em ambos
os casos, o desempenho do macaco quase sempre perfeito a partir da tentativa 2. De
fato, a apresentao de uma longa srie problemas semelhantes erradicou o processo
gradual de discriminao. Ficamos com um animal que soluciona novas discrimi aes
imediatamente.
.
O exemplo precedente ilustra o desenvolvimento de uma disposio para aprender
(leaming-set ou L-setj, um paradigma geral estudado extensivamente e assim denominado
por H. F. Harlow. A Fig. 13-1 mostra mais precisamente os resultados obtidos do proce
dimento de disposio para aprender em macacos rhesus. Cada curva da Fig. 13-1 a
mdia de um nmero de processos de discriminao. Os processos so apresentados
apenas nas tentativas de 1-6. A chave logo abaixo do grfico diz exatamente que dis
criminaes so representadas por cada curva. A Fig. 13-1, ento mostra com detalhes as
mudanas mdias na forma dos processos de sicriminao sucessivas. O processo de
discriminao de 1-8 gradual e em forma de / e claro que a sua assntota se encontra
alm da sexta tentativa de aqirsio. O processo mdio para os problemasde 9-16 menos
gradual; a curva mais inclinada e atingir sua assntota mais rapidamente. Os processos
subsequentes so ainda mais inclinados, at o problema 232, depois do que no h um
processo propriamente dito. H somente o resultado: na tentativa 2 o macaco quase
sempre acerta.
1
- 275 -

Tentativas

H i m ii

Discriminaes
|-8
------------- 33-132
9-16
------------- 133 -232
17- 24
*++++++ 23 3 -2 8 8
25-32
------------- 2 8 9 -3 4 4

I igura 13.1. Mudanas cm blocos sucessivos de processos de discriminao de 2S 2 R.


As curvas so os resultados mdios de oito macacos, mas podemos supor que sejam
representativas de um nico sujeito (segundo Harlw, 1949).

este resultado comportamental de se apresentar sucessivamente contingncias de


discriminao semelhantes uma habilidade adquirida para solucionar qualquer um de
uma classe de problemas de discriminao semelhantes com eficincia mxima que
usualmente descrito como uma (L-set). A natureza adquirida de tal habilidade sugere
que ela pode ter um processo caracterstico prprio. E, realmente, a curva que descreve o
desenvolvimento do I^set pode ser derivada da Fig. 13-1, se usarmos o desempenho na
tentativa 2 como um ndice do seu desenvolvimento. A eficincia mxima para solucionar
este tipo de discriminao seria indicada pelo desempenho sem erro na tentativa. 2. Deve
ficar claro que o desempenho na tentativa 1 no pode ser acima de 50 por cento correto.
De imediato, o macaco no tem uma base para discriminar qual dos dois novos objetos
o correto e, assim, ele apanhar o objeto correto ao acaso. A Fig. 13-2 mostra o nvel de
desempenho na tentativa 2 em funo do nmero de problemas previamente apresen
tados. A figura ento, uma descrio conveniente do processo de aquisio do L-set.
Um aspecto importante do processo visto na Fig. 13-2 o seu carter gradual e contnuo.
Assim, a habilidade para solucionar um problema de discriminao numa tentativa
adquirida atravs de um processo gradual.

- 276 -

N mero mdio de discriminaes anteriores.


1'igura 13-2. Um processo de disposio para aprender (L-set), derivado dos dados
da Fig 13-1., baseado no desempenho da tentativa 2.

Ao contrastar o processo de discriminao da Fig. 13-1 e o processo de L-set da Fi<:


13-2, note que na discriminao, a varivel independente: o tempo em relao qual o
comportamento muda com a exposio prolongada a um procedimento constante
chamada de tentativa. No processo de L^set, por outro lado, a varivel independente:
tempo em relao qual o comportamento muda chamada de problemas. Note tambm
que o resultado de cada processo individual da Fig. 13-1 chamado uma discriminao;
mas o resultado do processo da Fig. 13-2 um I^set a habilidade de solucionar um tipo
de discriminao imediatamente.
No devemos supor que a disposio para aprender seja restrita ao tipo particular de
discriminao descrito em nossos exemplos. Nas discriminaes das Figs. 13-1 e 13-2, o
comportamento gradualmente colocado sob o controle de um entre dois objetos o
objeto que cobre o amendoim reforador na tentativa 1. Mas a noo geral de um L-set
consiste de uma habilidade adquirida para solucionar discriminaes de uma determinada
classe ao primeiro contato. Assim, o colocar o comportamento sob o controle do maior
entre dois objetos, o objeto verde ou o de forma triangular entre dois objetos, constitui
outros Insets de 2S 2R simples que podem ser convenientemente estabelecidos por um
procedimento semelhante a este descrito. Em geral, podemos supor que o procedimento
de l^set aplicvel sempre que fr possvel se estabelecer um conjunto de problemas de
discriminao relacionados. Aps o animal ter sido exposto a um subconjunto desses
problemas, ele pode adquirir a habilidade para solucionar todos eles.
Se tentarmos formular o paradigma da (L-set), descobriremos que ele possui um
PROCEDIMENTO
PROCESSO
RESULTADO

Uma srie de discriminaes relacionadas apresentada no


organismo;
: Os processos individuais de discriminao gradualmente
mudam sua forma de lenta e gradual para rpida e abrupta;
: Discriminaes novas, mas relacionadas, so resolvidas com
o mximo de eficincia.

- 277 -

O termo Uset normalmente empregado com referncia ao resultado deste paradig


ma.
13.2 ALGUMAS VARIVEIS QUE INTERFEREM NA AQUISIO DA DISPOSIO
PARA APRENDER (L-SET)
Harlow (1959) fez um resumo das pesquisas sobre a formao do L-set nas quais
usou vrias espcies de organismos, incluindo crianas. As crianas testadas nesses proce
dimentos tipicamente superam chimpanzs e macacos no desempenho geral mas elas
tambm apresentam um processo contnuo de aquisio do L-set. Os primatas inferiores
na escala filogentica ao macaco rhesus micos e saguis, por exemplo mostram um
processo de aquisio de Uset mais gradual que o descrito na Fig. 13-2. Mesmo depois de
1000 ou mais problemas, a assntota de seus processos de L-set significativamente mais
baixa que o desempenho perfeito. Outros animais, como ratos e gatos, mostram um
aumento da inclinao nos processos sucessivos de discriminao, mas nunca alcanam
resultados sofisticados no Lset dentro dos limites dos experimentos que tm sido
executados. Todavia, recomendamos cautela ao se concluir que L-sets verdadeiros so
uma habilidade privilegiada dos primatas, em vista das dificuldades metodolgicas em se
estabelecer ordena omparveis de problemas de discriminao para animais i n f e r i o r e s
O num ero de tentativas destinado para cada problema afeta nitidamente
a aquisio do Lset Uma vez que os processos iniciais de discriminao so os
mais graduais, um grande nmero de tentativas necessrio nos primeiros problemas para
que o comportamento atinja um determinado critrio, digamos um desempenho 70 por
cento correto. medida que so dados mais problemas, o processo de discriminao
acelera-se e menos tentativas so necessrias para se chegar quele mesmo critrio. Esta
diferena foi considerada ao se obter as curvas da Fig. 13-1. Para os primeiros problemas
realizaram-se 50 tentativas e para os ltimos apenas 6 ou 9 tentativas.E interessante notar,
todavia, que mesmo quando poucas tentativas, por exemplo, 6 , so realizadas para todos
os problemas, o L-set ainda emerge. Desta maneira, mais problemas, naturalmente, so
necessrios para compensar o nmero menor de tentativas por problema. A combinao
ideal tentativa-problema tem que ser ainda elaborada.
A taxa de L-set uma funo da dificuldade dos problemas sucessivos de
discriminao. Harlow manteve todos os problemas na mesma srie uniformemente di
fceis. Uma progresso gradual de discriminao fcil para difcil pode produzir o L-set
mais eficientemente.
13.3 L-SETS MAIS COMPLEXOS
Evitamos usar o termo conceito nas discusses precedentes sobre L-set mas parece
natural perguntar se podemos dizer, em relao a um organismo, que possui um L-set
para o maior de dois objetos, ou para o verde entre dois objetos, que ele possui o
conceito o maior de dois ou o verde de dois . Tais especulaes estariam em boa
companhia, porque o prprio Professor Harlow levantou a hiptese de que todos m
conceitos tais como triangularidade, vermelhido, nmero, e lisura surgem somente da
formao de L-set (Harlow, 1959, p. 5 10).

- 278

Adiando, por enquanto, uma definio rigorosa do termo conceito, apenas sugerimos que
o conceito adquirido nas Figs. 13-1 e 13-2 o objeto entre dois debaixo do qual
havia um amendoim na tentativa anterior . Sua descrio verbal maior que a dos
conceitos mencionados por Harlow. Falta uma palavra nica que o identifique, talvez
porque as contingncias que compreendem este conceito so raras 110 mundo fora dos
laboratrios de comportamento dos macacos. Um exemplo de um L-set mais complexo
ser til para esclarecer a relao estreita entre L-set e conceitos.
Uma classe importante de L-sets consiste de discriminaes de singularidade . Nes
sas discriminaes, um grupo de objetos apresentado. O reforamento contingente
escolha de um nico objeto que difira, de algum modo, dos outros objetos do grupo. Tal
discriminao pode consistir das contingncias vistas na Tabela 13-1. Estas contingncias
contm dois tipos de objetos, seis situaes e trs respostas.
Tabela 13-1
UM GRUPO DE CONTINGNCIAS DE SINGULARIDADE
SITUAES

S,
s2
S3
s<
Ss
Sr

O
A
A
O
A
O

RESPOSTA REFORADA

A
O
O
A
A
O

A
O
A
O
O
A

Re
Rc
Rd

Uma vez o sujeito primata tenha adquirido a discriminao a um certo nvel do critrio,
um novo problema apresentado. Dois novos tipos de objetos so usados no novo
problema, mas as contingncias permanecem de tal modo que a posio do objeto singu
lar entre os trs novamente correlacionada com o reforamento. Depois de uma srie de
vrios destes problemas, o macaco adquire uma disposio para aprender que poderia ser
chamada de escolha o objeto singular entre trs. O sujeito bem treinado na ilustrao
da Parte Quatro, p. 271 est demonstrando o comportamento tpico desta L-set. O
desempenho sofisticado do macaco rhesus alcanado somente depois da apresentao
de muitos problemas semelhantes. Estes resultados indicam o grau de sucesso dos proce
dimentos de L-set ao colocar o comportamento operante de animais sob o controle de
relaes bem sutis existentes nas situaes.
Tal controle comportamental em sujeitos humanos frequentemente abase sobre a
qual empregamos a palavra conceito . Por exemplo, concordamos que uma criana tem
o conceito de propriedade quando ela pode discriminar suas prprias possesses daquelas
de qualquer outra pessoa. Dizemos que uma criana tem o conceito de uma frase substan
tiva quando ela pode escolher frases substantivas entre sentenas no familiares. Similar
mente, creditamos-lhe o conceito de igualdade de nmero quando ela pode identificar
quantidades iguais em conjuntos no familiares, por exemplo, quando ela pode equiparar
o nmero de contas numa jarra com o nmero de mas em cima de uma mesa. Todavia
estas ilustraes so apenas sugestivas. Logicamente, precisamos de uma definio mais
- 279 -

rigorosa de conceito se desejamos examinar em detalhes a relao entre L-sets e concei


tos. Ser conveniente, portanto, voltarmos a alguns dos primeiros experimentos sobre
formao de conceitos com sujeitos humanos. aqui que encontramos uma tentativa
explcita para traduzir a formao de conceitos, em sujeitos humanos, em termos comportamentais, com a questo sistemtica. O que uma pessoa faz quando se diz que ela
revela um conceito ? Quando esta questo puder ter uma resposta satisfatria, estare
mos em condies de determinar os procedimenos pelos quais estes comportamentos
conceituais so adquiridos.
13.4

EXPERIMENTOS SIMPLES SOBRE A FORMAO DE CONCEITO EM


SUJEITOS HUMANOS

C.L. Hull (1920) tomou como seu ponto de partida o estudo da formao de concei
to a histria atravs da qual uma criana adquire o conceito de cachorro .
Uma criancinha encontra-se numa certa situao, reage a ela aproximando-se e ouve
dizer que isto se chama cachorro. Depois de um perodo indeterminado de intrveno, ela encontra-se numa situao algo diferente e ouve dizer que aquilo se
chama cachorro . Mais tarde, encontra-se numa situao ainda algo diferente e ouve
dizer aquilo tambm se chama cachorro . Assim o processo continua. As experin
cias de cachorro aparecem em intervalos irregulares (Hull, 1920, p. 5).
Como um resultado dessas experincias , surge um momento em que se diz que a
criana possui o conceito de cachorro. A interpretao dada por Hull a este conceito foi
uma caracterstica mais ou menos comum a todos os cachorros e incomum a gatos,
bonecas e ursinhos (Hull, 1920, p. 6 ).
Se um conceito consiste de uma caracterstica comum a um grupo diverso de situa
es, deve ser possvel estabelecer condies de laboratrio para estudar como o compor
tamento passa a ficar sob o controle das caractersticas comuns de um grupo de situa
es. Como elementos para seus conceitos experimentais, Hull escolheu os 144 caracteres
chineses vistos na Fig. 13-3. A nao familiaridade destes caracteres para seus sujeitos,
universitrios americanos, assegurou que nenhum dos conceitos experimentais havia sido
previamente adquirido. De modo a produzir grupos de situaes contendo uma carac
terstica comum, selecionaram-se grupos de caracteres contendo certos elementos comuns.
Note, por exemplo, que na Fig. 13-3 todos os caracteres na fileira 1 contm em suas
estruturas, de um modo geral diferentes, o trao comum em forma de escova.
Em geral, cada carter numa determinada fileira horizontal est relacionado a todos os
outros nessa mesma fileira por possuir algum elemento comum. No experimento, os
caracteres foram combinados em grupos (colunas verticais da Fig. 13-3) de modo que
cada grupo continha um e somente um dos caracteres com um elemento comum parti
cular. Mostrava-se, ento, aos sujeitos, os caracteres do grupo 1, um de cada vez e
pedia-se-lhes que dessem a resposta de identificao verbal de acordo com o que se v na
coluna esquerda da Fig. 13-3. O nome correto era pronunciado pelo experimentador
poucos segundos depois da apresentao de cada carter. A tarefa do sujeito era nomear
o carter antes que o experimentador o fizesse. A primeira tentativa, naturalmente, era
diferente, pois permitia que o sujeito tomasse conhecimento do grupo de identificadores
verbais. Quando o critrio de duas tentativas perfeitas era alcanado, isto , quando o
sujeito nomeava corretamente todos os caracteres do grupo 1 duas vezes numa fileira, os
- 280 -

Elemento comum

Identificador
verbal

Grupo
1 2

72 caracteres
teste

oo r #
H
s (*& & &
& & & & & & M & & M & .X
f i fa to M
#

yer

deg -ET

mm&wQer

Img i A :

fe ^ rL
vo
na

.3 ? :

Mrn fR&f

chun

M & &J % M M ;m a

X \$ * &

% & Z t t f i i H
m
u
m

Figura 13-3. Os 144 caracteres chineses usados por Hull para estudar a aquisio de
conceito. So mostrados para cada srie a resposta de identificao verbal e o elemento
comum (Hull, 1920).

caracteres do grupo 2 eram apresentados at que todos fossem identificados, ento os do


grupo 3 e assim sucessivamente, at o grupo 6 .
Uma vez que o sujeito tivesse aprendido a identificar estes 72 caracteres chineses (6
grupos x 12 caracteres por grupo), o experimentador fazia um teste de generalizao. Ele
apresentava os restantes 72 caracteres, mas no mais pronunciava o identificador. Seria o
sujeito capaz de identific-los, mesmo iunca os tendo visto antes? Hull descobriu que os
sujeitos identificaram corretamente mais de 70 por cento destes novos caracteres. De
fato, os sujeitos frequentemente faziam identificaes corretas, embora fossem incapazes
de verbalizar a regra para a incluso numa classe particular.
No experimento de Hull, cada membro de uma dada classe de S tinha um certo trao
em comum. Smoke (1932) salientou que os conceitos no mundo real raramente, se
alguma vez, consistem de uma classe de situaes com elementos comuns explcitos. A
formao de conceito, geralmente, envolveria uma resposta sob o controle de relaes
comuns a um grupo de padres de estmulo. Considere, por exemplo, as figuras da Fig.
13-4 geradas por uma relao bastante artificial sugerida por Smoke. Todas as figuras
esquerda da Fig. 13-4 so membros da classe de S^ denominada dax , enquanto que
nenhuma das figuras direita da Fig. 134 dax. A regra para dax um crculo e
dois pontos: um ponto dentro do crculo e outro fora. Smoke descobriu que sujeitos
humanos adquiriam rapidamente o comportamento generalizado de categorizar outros
padres como dax , mesmo quando seu nico treino discriminativo anterior consis
tisse da apresentao de algumas figuras dax e no dax apropriadamente indicadas e
com instrues para se observar as diferenas. Embora fossem frequentemente incapazes
-28 1 -

Figura 13-4. Amostras de S ^ s e S s dax (de Kimble e Garmezy,


segundo Smoke, 1932).

de verbalizar a regra para a incluso na classe, os sujeitos, mesmo assim, podiam identi
ficar corretamente novas figuras dax que no tinham visto antes.
Nos experimentos de Hull e de Smoke, diz-se que os sujeitos adquirem certos con
ceitos. Podemos agora perguntar de que modo estes experimentos demonstram a aprendi
zagem de conceito:
1. Tanto no experimento de Hull como no de Smoke, os sujeitos adquiriram a
habilidade de dar um rtulo verbal comum para qualquer membro de uma classe de
situaes.
2 . O comportamento adquirido generaliza-se para novas situaes s quais o sujeito
no havia sido exposto antes.
3. A classe de situaes determinada por alguma relao comum um trao ou
uma regra geomtrica complicada.
Partindo desses dados, somos levados a duas concluses sobre o comportamento de
conceito. Primeiro, diz-se que um organismo revela um conceito quando ele pode identi
ficar qualquer membro de um conjunto de situaes relacionadas. Segundo, o organismo
adquire esta habilidade atravs de uma histria explicita de reforamento (ou instrues
fundamentadas numa histria de reforamento prvio) na presena de um subconjunto
das situaes.
E stam o s agora em condies de ver a relao do paradigma do Lset
c o m a f o r m a o de c o n c e i t o . O p r o c e d i m e n t o de L s e t
simplesmente uma maneira sistemtica de ordenar a histria de reforamento que conduz
ao comportamento de conceito. Embora os macacos no falem, o comportamento que
eles ad q uirem com os p ro c e d im e n to s de Lset
parece precisamente
anlogo ao que os sujeitos humanos fazem, em experimentos sobre formao de con
ceito, usando respostas verbais. O macaco escolhe o objeto singular de um grupo de
objetos que ele pode nunca tervistG anteriormente. O homem escolhe o dax entre um
grupo de padres que ele pode nunca ter visto anteriormente. Na vida real, parece que
raramente adquirimos nossos conceitos atravz da progresso ordenada de um problema
relacionado para outro, a seqncia caracterstica das disposies para aprender. A
criana na escola, em casa e no parque adquire seus conceitos concorrentemente e muito
mais casualmente do que em quaisquer arranjos de procedimento no laboratrio.
Todavia, quando ela pode identificar um novo cachorro como um cachorro, ou uma nova
situao social como aquela que requer boas manpiras , ela est se empenhando em
comportamentos do tipo produzido pelos vrios procedimentos que descrevemos.
- 282-

Note que o termo conceito, como descrito, no se refere a uma coisa. Como discrimi
nao, condicionamento e extino, o termo refere-se a certos fatos comportamentais e
certas relaes entre comportamento e ambiente. A palavra conceito denota o fato
comportamental de que uma determinada resposta* est sob o controle de uma classe
relacionada de SDs. Um corolrio interessante dessa definio que ela no separa um
conceito de uma discriminyo. Podemos lembrar qiie uma discriminao (Resultado)
um nome para o fato comportamental de que um
passa a controlar uma resposta
operante. Mas sabemos que a generalizao toma impossvel descobrir um caso perfeito
de discriminao onde apenas um
controla a resposta. 0 treino discriminativo prolon
gado pode limitar a classe de eventos ambientais qe estabelecem a ocasio gara a resposta,
mas a classe permanece uma classe. Se tivssemos sido treinados para dizer amarelo
na presena de um certo comprimento de onda da luz a probabilidade da resposta
amarelopermaneceria alta quando pequenas mudanas fossem feitas no comprimento de
onda. Tais resultads, que indicam a persistncia da generalizao mesmo aps um longo
treino discriminativo, expressam as limitaes na capacidade do organismo de fazer dis
criminaes infinitamente refinadas.
Se um conceito tambm se refere a uma classe de S^s que controlam a emisso de
uma resposta, em que ele difere de uma discriminao? Evidentemente, a diferena
apenas de grair nos seus limites, a distino vaga e arbitrria. Logo, plausvel se falar
ou do concr.tc de amarelo ou da discriminao de amarelo. O emprego da palavra nurti
caso particular ser determinado meramente pela extenso da classe de S ^ s controla
dores. Se a classe de S^s parecer relativamente pequena, chamamos o comportamento
uma discriminao; se parecer relativamente ampla mais provvel chamarmos o compor
tamento de um conceito.
Embora a noo de extenso per se seja muito imprecisa para permitir uma distino
rigorosa entre conceitos e discriminaes com base nos comportamentos observados, ela
sugere que a distino entre os dois pode ser feita em termos de procedimento. Suponha
que estivssemos interessados em treinar um organismo a fazer discriminaes cada vez
mais refinadas entre um determinado tringulo (S^) e todos os outros tringulos. Nosso
procedimento consistiria em apresentar tringulos gradualmente mais semelhantes ao
tringulo S^, sem liberar o reforamento na sua presena. Com efeito, melhoramos a
discriminao ampliando a classe de
s experimentados. Na formao do conceito de
triangularidade, por outio lado, apresentaramos e reforaramos respostas a tringulos
semelhantes ao tringulo original, aumentando, assim, a classe de SD. Isto justamente o
que Hull fez oara oo , Smoke fez para dax e Harlov fez para a singularidade. Todas
essas variantes de procedimento servem gradualmente para estabelecer a agregao de S^s
que controlam uma determinada resposta, seja o comportamento dc dizer oo , de dizei
dax ou de selecionar o objeto singular. Os procedimentos para formao de conceitos c
discriminaes iniciam-se similarmente, com reforamento na presena de um nico S^,
mas eles divergem da em diante para alcanar seus efeito diferentes. O treino discrimi
nativo limita a classe de S^s controladores, enquanto a formao de conceito amplia a
classe de S^s controladores. A frase de Keller e Schoenfeld (1950) discriminao inter
classes e generalizao intra-classes adequada para resumir a caracterstica comporta
mental de um conceito e nos lembra os processos que participaram na sua evoluo.

13.3 ESTUDOS SOBRE FORMAO DE CONCEITO EM AN1MAS


De acordo com a anlise apresentada at aqui, um conceito representa o controle
adquirido de um conjunto de situaes relacionadas (Ss) sobre uma determinada res
posta. Na seo precedente, sugerimos que o mtodo geral para estabelecer este controle
era o uso anterior de um subconjunto de Ss como SDs num paradigma de discriminao.
Esta descrio est de acordo com os procedimentos de treinamento especfico de
Harlow e Hull que apresentaram uma srie de contingncias de discriminao relacio
nadas. A descrio tambm est de acordo com o procedimento de Smoke, na medida em
que supusermos que suas instrues permitiram que seus sujeitos se administrassem um
treino discriminativo com os padres de S^ e S A das figuras geomtricas que lhes foram
apresentadas. Esses trs experimentos representam apenas uma pequena amostra dos
procedimentos de treinamento que satisfazem a definio de um procedimento de
aquisio de conceito. Existem vrias maneiras de se arranjar uma histria de discriminao
com um subconjunto dos membros de uma classe ampla de Su s relacionados. Na pre
sente seo, consideraremos alguns desses procedimentos adicionais, chamando a aten
o, ao mesmo tempo, para a variedade de conceitos que tm sido estabelecidos ao nvel
infra-humano.
Kelleher (1958) reforou presses chave telegrfica em chimpanzs famintos (num
esquema probabilstico p= 0,01
de reforamento alimentar) apenas quando certos
padres visuais estavam presentes num arranjo de 3 x 3 de pequenas janelas de plexiglass
acima da chave. Outros padres foram associados com contingncias de extino para a
presso chave. No treinamento do conceito, 13 padres de SD e 13 padres de
foram apresentados numa seqncia aleatria. A Fig. 13-5a apresenta uma amostra de
trs dos padres de SD e trs dos padres de S & . Os registros cumulativos de resposta
abaixo desses padres mostram um desempenho tpico alcanado aps um treinamento
extensivo neste procedimento. As trs amostras dos padres de
mostram que a classe
de Su foi limitada pela regra trs janelas inferiores iluminadas . O comportamento da

dois problemas de conceito. Os quadrados escuros correspondem a janelas iluminadas


Os tras obliquos representam mudanas de um estmulo para outro. Os padres e as
respostas cm S^so indicadas por (+ );o s padres e respostas em S ^ so indicados por
( ) ( Kellenher, 1958).
- 284 -

Fig. 13-5a representa uma discriminao estvel j avanada, com as respostas limitadas
principalmente s ocasies, em que os padres de
estavam presentes. Em (b), foi feito
um teste para o comportamento de conceito, utilizando-se 6 padres de
no fami
liares e 6 novos padres de S ^ na seqncia de estmulo, sem alterar as contingncias de
reforamento. Trs de cada um dos novos padres so vistos na Fig. 13-5b. Como os
registros cumulativos na Fig. 13-5b mostram, o comportamento no foi perturbado,
indicando que a formao de conceito foi obtida. O comportamento estabelecido poi
uma histria de discriminao anterior com um subconjunto de estmulos foi generali
zado para novos membros da classe de
Como no exemplo de Hull com os caracteres chineses, esses padres de
da Fig.
13-5a e b tm elementos comuns iluminao das trcs janelas inferiores. Um resultado
um pouco diferente foi obtido quando o experimentador tentou desenvolver um con
ceito baseado no nmero de janelas iluminadas. Os padres de estmulo na seo superior
da Fig. 13-5c, ilustram as contingncias de treinamento do segundo conceito. Aqui, a
classe de
limitada pela regra iluminao de trs janelas . Por outro lado, os padres
de S^' contem duas ou quatro janelas iluminadas. Os registros cumulativos da Fig. 13.5c
indicam a excelente discriminao alcanada no treino, usando-se a seqncia de 13
padres de SD e 13 padres de
. Todavia, quando 6 novos padres de
e S A foram
introduzidos (Fig. 13-5d), o desempenho deteriorou-se nitidamente. Um nmero substan
cial de respostas ocorreu na presena dos novos padres de SA , enquanto se observou
uma diminuio no nmero de respostas na presena dos novos padres de S^. O teste
crtico para o comportamento de conceito falhou porque no se demonstrou que o
responder do animal estava sob o controle geral da classe de
trs janelas acesas .
Este resultado negativo serve para enfatizar o critrio para a existncia do comporta
mento de conceito. Depois de se estabelecer o controle discriminativo de uma R com um
subconjunto dos membros de uma classe de S, procuramos ver se o controle discrimi
nativo se generalizou de modo a incorporar os membros restantes da classe de S. Os
exemplos descritos nas sees anteriores preencheram o teste requerido; da, sua
designao como comportamento de conceito. Isto no aconteceu com o segundo proble
ma de conceito de Kelleher (Fig. 13-5d). Da, conclumos que o segundo problema
resultou apenas numa discriminao, no num conceito. Todavia, h 9!/3!/6! ~ 84
padres de
possveis de acordo com a regra trs-janelas-acesas, e possvel que o
treino com um subconjunto com mais de 13 padres de
fosse bem sucedido no
estabelecimento do conceito (Ferster, 1964).
conveniente comparar o procedimento do experimento de Kelleher com o para
digm a de Lset p o rq u e am bos p re te n d em ser paradigmas de conceito.
No procedimento de disposio para aprender, o subconjunto de cada
c SA s
arranjado em termos de problemas" cada um dos quais contendo algumas contingncias
repetidas. Um novo problema geralmente no apresentado ate que o anterior tenha sido
adquirido de acordo com o critrio. No procedimento de Kelleher, todo o subconjunto
de cada
e
apresentado num nico problema . Mas seria fcil re-delinear o
ex p e rim e n to de Kelleher, moldando-o na forma de L-sets, atravs do
uso de uma srie de problemas de discriminao de 2S ---- >
IR. Para o conceito 1 ,
podemos apresentar p r im e ir o
Problema 1:

versus


- 285-

at que o ndice de discriminao tenha atingido algum valor arbitrariamente alto. Ento
apresentaramos

Problema 2:

versus

S2A

e assim sucessivamente. Nosso teste da aquisio do conceito feito, automaticamente,


com o incio de cada problema porque neste momento o organismo se defronta com S^s
e SA s nunca visto antes.
Poucos experimentos sistemticos tm sido realizados para testar qual a combinao
de todos os possveis procedimentos treina mais eficientemente o comportamento de
conceito. O paradigma da disposio para aprender tem a virtude de proporcionar um;i
curva da aquisio de conceito (ver Fig. 13-2) que uma estimativa do grau dt*
obteno do conceito em qualquer momento durante o experimento. Mas deve ficar
claro que, na vida real, aprendemos nossos conceitos de maneira similar dos chimpanzs
de Kelleher para quem vrias combinaes de S^s e S ^ s apareceram em ordem aleatria.
O fato de os chimpanzs no terem adquirido o conceito de tres-janelas-acesas sugere
que o tamanho do subconjunto dos membros de
usados no treino uma varivel
imporatnte na aprendizagem de conceito. Isto parece estar bem documentado. Andrew e
Harlow (1948)treinaram macacos a discriminar um nico tringulo de um crculo. Os
macacos foram subsequentemente testados em vrias situaes diferentes que incluam
mudanas na orientao do tringulo original, assim como novos tringulos de tamanhos
e ngulos diferentes. Os macacos apresentaram pouca indicao de terem formado o
conceito tringulo com a sua histria com um nico membro da classe de tringulos.
No estudo de Hull com os caracteres chineses, um grupo de sujeitos aprendeu a identifi
car apenas trs grupos de caracteres, ao invs dos seis usuais. Para contrabalanar sua
exposio a um nmero menor de grupos, os sujeitos tiveram duas vezes mais tentativas
nestes trs grupos. Apesar disso, os sujeitos dos trs grupos mostraram um desempenho
muito pior ao identificar os caracteres que nunca tinham visto. Dentro de limites, parece
que a formao de conceito depende diretamente do nmero ou variedade de S^s
empregados no treino.
A tcnica experimental conhecida por escolha de acordo com o modelo proporciona
um conjunto de contingncias de discriminao bem apropriado para o estudo do com
portamento de conceito em animais, o comportamento de escolha de acordo com o
modelo estudado convenientemente em pombos, usando um aparelho contendo trs
discos para bicar, cada um dos quais pode ser transiluminado por cores ou padres.Para
o estudo de escolha de matiz, a seqncia de eventos est descrita esquematicamente pela
Fig. 13-6. Durante o treino preliminar, as duas chaves laterais so ocasionalmente ilumi
nadas com luzes de cores diferentes. O bicar uma ou outra chave , ento, reforado.
Quando o bicar est seguramente sob o controle das chaves laterais iluminadas, a cadeia
de comportamento pode ser ampliada. As chaves laterais so apagadas e apenas a chave
central fica iluminada com uma luz colorida (Fig. 13-6, parte superior). Quando a chave
central iluminada bicada, ambas as chaves laterais so iluminadas e a chave do centro
apagada. Uma das chaves laterais algumas vezes a esquerda, outras vezes direita
apresentar o mesmo matiz que a chave do centro apresentou no momento anterior (Fig.
-2 8 6 -

i O

r- t
P adro na chave
c e n tra l a t q u e o
anim al o ligue

E sco lha

E scolha
e s q u erd a

d ire ita

Reforamento se a escolha for correta. Ca


so contrio, um breve time-out de todas
as contingncias.
Figura 13-6. A seqncia de eventos na escolha de acordo com o modelo. A
iluminao est indicada pelas chaves pontilhadas ou com linhas transversais.

13-6, centro). O bicar a chave lateral que tem o mesmo matiz reforado. Uma escolha
incorreta, todavia, seguida pelo apagar de todas as luzes e time out de todas as
contingncias por alguns segundos. Aps o reforamento ou o time-out , a luz central
acende-se novamente e uma nova tentativa inicia-se. Experimentos com dois ou trs
matb.es indicam que o pombo pode ser treinado a escolher matizes de acordo com o
padro com uma preciso acima de 90 por cento (Comming e Berryman, 1961). Nenhum
experimento tentou ainda estabelecer um conceito geral de escolha usando muitos
matizes e muitos padres. Para estabelecer o conceito geral de escolha, o comportamento
de bicar a chave lateral teria que ser colocado sob o controle de qualquer padro apresen
tado imediatamente antes na chave central. Quando tais escolhas so feitas com padres
nunca vistos no treino, podemos dizer que o comportamento revela um conceito geral de
escolha.
A escolha apenas um de um nmero de conceitos relacionados sutis que podem ser
estudados experimentalmente atravs desta tcnica de trs chaves. Nas contingncias
indicadas pela Fig. 13-7, requer-se um conceito algo mais complicado. O animal deve
bicar a figura que est girada de 90(- no sentido anti-horrio, em relao figura padro.
O estabelecimento destes conceitos em animais, no laboratrio, est ainda no estgio
preliminar. H razo para se esperar que sua produo aguarde combinaes adequadas
dos procedimentos familiares dc aquisio, discriminao e aproximao sucessiva e no
quaisquer novos princpios de comportamento.
- 287-

OIO
p -.l

+ d

'

'

^ " " ^ p --1

Figura 13-7. Estmulos para o estabelecimento do conceito relacionai de ro


tao de 90^ em sentido anti- horrio. O + indica a chave onde a bicada ser
reforada
(Goldiamond, 1966)

Que tais conceitos no esto, provavelmente, alm do alcance do pombo sugerido por
uma demonstrao interessante feita por Herrnstein e Lovland (1964). Estes pesquisa
dores treinaram pombos a bicar uma chave plstica por alimento apenas quando uma
placa translcida prxima chave estava iluminada. Os pombos adquiriram rapidamente
a discriminao de bicar quando a placa estava acesa e no bicar quando estava apagada. No
procedimento final, a placa foi iluminada com projees de slides coloridos de 35 mm
contendo fotografias de ambientes naturais, incluindo campo, cidades, rios, rvores e
campinas. Cada slide era apresentado por cerca de um minuto. Em metade dos slides,
havia pessoas em vrias posturas e posies e essas projees eram as ocasies para o
reforamento intermitente do bicar a chave. Os outros slides no continham pessoas e
eram SA s para o bicar a chave. Centenas de slides diferentes foram apresentados durante
vrios meses de treino com essas contingncias. Eventualmente, os animais passaram a
iimitar suas bicadas s ocasies em que os slides com pessoas eram projetados. Quando
um novo grupo de slides foi apresentado, os animais continuaram a bicar predominan
temente quando havia pessoas presentes, embora nunca tivessem visto estes slides antes.
Uma vez que os slides que continham pessoas variavam bastante no nmero de pessoas
mostradas, suas roupas, se estavam perto ou longe, se adultos ou crianas, pode-se dizer
que os pombos estavam demonstrando um conceito sofisticado de pessoa . Mesmo s
ocasies em que os pombos erravam eram interessantes. Eles ocasionalmente bicavam
quando os slides mostravam objetos frequentemente associados a pessoas tais como casas,
barcos e automveis.
13.6 CLASSES ARBITRRIAS DE SD: CONCEITOS DISJUNTIVOS
Nas sees anteriores, sugerimos que, quando o comportamento de organismos est
sob o controle discriminativo de membros de uma ampla classe de S^s, esses organismos
esto demonstrando um comportamento conceituai. Indicamos vrios tipos diferentes de
histrias de discriminao que permitem estabelecer-se tal controle complexo. Nos con
ceitos discutidos, as classes de
controlador podem ser descritas como um conjunto de
estmulos ligados por uma relao comum de arranjo espacial ou estrutura topolgica.
Assim, no importando o quo nico seja cada animal que constitui a classe de

- 288-

gato , cada membro desta classe compartilha de certas relaes fsicas em comum com
todos os outros membros. 0 mesmo verdadeiro para os caracteres chineses agrupados
no conceito oo , as figuras dax etc. Em geral, estas relaes comuns caracterizam os
nossos conceitos de objetos tais como casa , livro, mesa e a letra impressa E. Em
outros conceitos como maior que , proveniente de , direita de / um membro de*
e conduz a , as relaes comuns que ligam todos os S^s no so a estrutura espacial
mas outros tipos de relaes que so identificadas pelas prprias respostas verbais que
elas ocasionam . Assim, maior que uma resposta verbal que identifica a relao
compartilhada pelos membros da classe de
controlador.
Deveria ficar claro que os conceitos relacionais so muito difundidos. Apesar disso,
frequentemente pode-se observar que o comportamento est sob o controle de amplas
classes de estmulos cujos membros parecem no ter relaes comuns de estmulo. No
existe, por exemplo, uma relao bvia de estmulo fsico nos S^s para alimento . Uma
cenoura, uma ervilha, uma folha de espinafre e um copo de leite aparecem como objetos
extremamente diversos. Levando-se em conta apenas suas caractersticas visuais, uma
ervilha parece-se mais como uma bola de gude do que com uma folha; uma cenoura
parece-se mais com um basto do que com um copo de leite. Uma heterogeneidade
semelhante encontra-se nos cristais brancos de iodo, no bromo lquido vermelho e no gs
incolor conhecido como cloro que constituem, parcialmente, a classe halogneo. O
conjunto de situaes apresentadas na Fig. 13-8 controla o comportamento de parar,
embora elas tenham pouca semelhana entre si.
a

Figura 13-8. Situaes de estmulo fisicamente diferentes que controlam a mesma


resposta rparar (Goldiamond, 1966)

Evidentemente, a diversidade nos membros de uma classe ampla de SD no prejudica


sua capacidade de controlar uma resposta semelhante. Podemos demonstrar experimentai- 289 -

mente o controle apresentado por uma classe de


ampla, mas heterognea, comum
p ro ced im en to de L set.
Se trein arm o s um m acaco a escolher ou o
tringulo ou a esfera entre dois objetos e nunca apresentarmos um tringulo e uma esfere
juntos, o comportamento do macaco ficar sob o controle de tringulos ou esferas
Alm disso, o controle se generalizar para novos tringulos e novas esferas. Aqui, a classe
de SD controlador consiste de duas subclasses muito diferentes. Os membros triangulares
so agrupados devido sua relao geomtrica comum e os membros esfricos tambm.
Mesmo assim, falta uma relao comum entre tringulos e esferas.
Estendendo o procedimento para diversos SDs adicionais, podemos ampliar a classe
de SD do macaco para uma lista indefinida de objetos heterogneos. Se mantivermos os
novos elementos de SD no relacionados aos antigos, no haver razo para se esperar
que o macaco generalize para qualquer S novo que decidirmos incluir na classe.
Os exemplos das classes heierogneas dc S^ do cotidiano e o comportamento do
macaco citado no ltimo pargrafo ilustram o que conhecido como conceito disjuntivo.
Os membros da classe de S^
ou tringulos ou esferas, ou cenouras ou ervilhas, ou
espinafre ou leite...; ou um guarda de trnsito no cruzamento ou u m a luz vermelha e assim
por diante. Em cada caso, uma resposta est sob o controle de uma ampla classe de S^s
e, portanto, preenche um dos critrios importantes do comportamento de conceitos.
Contudo, a falta de uma nica relao comum, algo que una todos os membros da
classe, impede a generalizao a novos membros, o que tpico de outros conceitos.
A dificuldade em se incluir novos membros de uma classe de S ^ disjuntivo na base
da generalizao pode ser uma das razes pelas quais se diz, algumas vezes, que a humani
dade abomina conceitos disjuntivos (Bruner, Goodnow e Austin 1956). Felizmente,
muitas vezes possvel encontrar uma relao subjacente entre os membros de uma classe
disjuntiva de S^ que pode fornecer a base para a generalizao. Por exemplo, os
alimentos, embora diferentes em aparncia, tm a propriedade comum de serem substn
cias que so ingeridas pelos organismos vivos e transformadas em constituintes vitais do
corpo. Similarmente, o bromo, cloro e iodo tm a propriedade comum de se combinarem
com metais, formando sais cristalinos brancos que, de fato, so intimamente relacionados
um ao outro.
Nestes e em muitos outros conceitos disjuntivos, uma relao subjacente revelada
atravs de uma operao comportamental que transforma os membros de uma classe de
SD, originalmente heterogneas e diversos, em um novo conjunto de membros homog
neos e semelhantes. Essas situaes novas tm uma relao comum e esta relao fornece
a base para a generalizao normal. Algumas vezes, a operao requerida simples. Para
descobrir se certa substncia um alimento , precisamos apenas inger-la e esperar pela
situao transformada resultante. Para descobrir se alguma substncia nova um halogneo, deixamo-la reagir com o sdio e verificamos se um sal cristalino branco halogenado produzido.
Frequentemente, pode ser difcil reduzir classes disjuntivas em conceitos relacionais
subjacentes. Uma parte significante da atividade cientfica consiste em se tentar fazer
operaes em eventos superficialmente diferentes na esperana de transform-los em
situaes que so de fato semelhantes. Grande parte deste livro se dedica elucidao de
relaes subjacentes descobertas nos eventos comportamentais que, superficialmente,
parecem muito diferentes. Por exemplo, um animal bicando um disco e um estudante
opinando apresentam uma relao subjacente.
A procura de relaes subjacentes , de modo algum, limitada cincia. Considere a
-2 9 0 -

longa tentativa de se descobrir o padro absoluto para a arte ou a msica. Tal padro, se
pudesse ser encontrado, seria uma regra para relacionar as ocorrncias extremamente
diversas do que identificamos como boa arte ou boa msica. O fracasso em se encontrai
tais regras pode nos forar, na exasperao, a concluir que boa msica aquela que os
crticos, dizem ser boa; ou, para citar uma ilustrao da psicologia, diz-se, algumas vezes,
que a inteligncia o que os testes de inteligncia medem . Ningum descobriu ainda
uma operao para ser realizada em pinturas ou composies musicais que proporcio
nasse um conjunto de situaes em que o genial e o medocre fssem inequivocamente
distintos. O conceito de genialidade permanece disjuntivo., Quando parar tambm
retem uma certa arbitrariedade. No existe uma operao para transformar os diversos
elementos da Fig. 13.8 em elementos que apresentem uma relao de estmulo comum.
A classe feita pelo homem e a escolha dos elementos de estmulo arbitraria. Por esta
razo, no h uma base para a generalizao quando um novo S introduzido. Tudo o
que se pode fazer testar cada novo exemplo medida que aparece determinando-se a
incluso da classe apenas pelas contingncias de reforamento. Tal classe estabelecida
de um modo similar aquele atravs do qual formamos, no macaco, o conceito de
tringulo-ou-esfera.
Em ltima anlise, a nica relao comum a todos os tipos de conceitos disjuntjvos
que seus membros diferentes controlam a mesma resposta. Alguns conceitos disjuntivos,
por exemplo, alimento e halogneos, tm uma propriedade alm, de modo que seus
membros diferentes podem ser transformados e apresentarem uma relao subjacente
comum. Outros conceitos disjuntivos tais como a boa msica a inteligncia podem ter
uma relao subjacente; outros ainda, tal como o conceito experimental tringulo-ouesfera , permanecem ihteiramente arbitrrios e dissimilares.
13.7

S IG N I F I C A D O E C O M P R E E N S O
INTERRELAES ENTRE CONCEITOS

C O N S ID E R A D O S

COMO

O significado de uma palavra (resposta verbal) h muito tido como relacionado


formao de conceito, mas a ausncia de uma estrutura sistemtica para descrever os
conceitos tem dificultado uma anlie exata da relao. Ao discutir como uma criana
desenvolve o conceito de cachorro, Hull equacionou a formao de conceito com a noo
de significado. Uma criana sabe o significado de cachorro quando pode, apropriada
mente, identificar novos objetos como objetos cachorros. Podemos concordar que o
emprego apropriado de uma resposta verbal para identificar os membros de uma classe de
SD do conceito parte do que tido como saber o significado de uma resposta verbal.
Ao equacionar significado com comportamento discriminativo, sentimos que est fal
tando algo. Considere o conceito de leite. Ser que concordaramos que uma criana sabe
o significado de leite quando pode identificar corretamente garrafas de leite, copos de
leite e leite derramado? Pode-se dizer que a criana sabe um pouco o significado de leite
se tudo o que ela pode fazer identificar membros da classe de S^, mas somos inclinados
a concluir que sua compreenso do conceito no muito profunda. Analogamente, um
chimpanz pode^ser treinado a escolher os tringulos entre qualquer grupo de objetos,
mas poucos psicologos empregariam termos como significado ou compreenso ao descre
ver o comportamento observado. Significado e compreenso so, todavia, coisas que
tentamos ensinar nas escolas. Mesmo a cincia e a arte, algumas vezes, procuram por eles.

Logo, conveniente perguntar que comportamentos a mais podem estar envolvidos


quando se diz que um organismo sabe o significado de, ou comprenede um conceito.
Precisamos primeiro examinar a noo de que um organismo pode adquirir um
conceito que, por sua vez, formado de dois ou mais conceitos. Usando a nossa termino
logia, uma resposta (verbal ou outra qualquer), pode ser controlada por uma ampla classe
de SD que, por sua vez, pode ser dividida em duas ou mais classes de S^, cada uma
controlando sua prnoria resposta particular. Considere, por exemplo, o conceito de
gelo , cujo equivalente gua gelada . A classe de SD para gelo , evidentemente, a
interseo do conjunto de objetos congelados (C) e o grupo de objetos gua (A). Gelo
ento, representado pela regio sombreada no diagrama Venn de [ 13.2| .

[13.2]

Poucos dos nossos conceitos cotidianos so to simples como indica esse diagrama, mas a
maoria dos conceitos adquiridos pelos organismos humanos podem ser analisados em
termos de outros conceitos. Assim, um operante o < conjunto de respostas>que est
sob o < controle de > suas <conseqncias>. Uma enseada uma < poro de gua><
protegida>, com< ancoradouros>. Pai o < progenitor> do <sexo masculino>. Podemos
mesmo inventar tais conceitos, como no exemplo tigleo =o <filho> de um <tigr^><
macho> e um <leq> ^ fm ea^ Muitos desses conceitos so formas generalizadas de

conceito como um conceito c o n ju n t iv o . A natureza composta de um conceito conjuntivo


sugere uma questo experimental, a saber, se uma histria anterior com seus conceitos
componentes afeta a aquisio de tal conceito conjuntivo. Um experimento de Kendler e
Vineberg (1954) indica que quando seus componentes so previamente conceituados, um
conceito baseado na sua conjuno adquirido mais rapidamente. Neste experimento,
cada uma das 32 figuras da Fig. 13-9 foi desenhada num carto e a tarefa dos sujeitos
era arranjar aleatoriamente, os 32 cartes em duas classes. As respostas de arranjar
foram reforadas com certo ou errado de acordo com a regra a qual diferia para os
diferentes grupos de sujeitos.
Dois grupos de sujeitos foram reforados para agrupar todas as figuras curvas numa
pilha e as figuras retilneas em outra. Um terceiro grupo de sujeitos foi reforado para
agrupar todas as figuras acromticas (sem cor) numa pilha e todas as figuras cromticas
(coloridas) em outra. Assim, os trs grupos de sujeitos aprenderam primeiro a classifi
cao em termos de forma ou cor. Quando isto estava bem aprendido, as regras para o
reforamento foram mudadas. Os sujeitos do primeiro grupo eram, agora, reforados para
arranjar todas as figuras grandes num grupo e as figuras pequenas em outro, isto , um
arranjo pelo tamanho. 0 segundo grupo era, agora, reforado para agrupar por cores e o
terceiro grupo para arranjar todos os tringulos e crescentes num grupo e todos os
crculos e quadrados em outro. No fim desse treinamento, todos os grupos haviam1
- 292-

Pequeno

Grande

ei

Acromtica

5G

C ores

o-

C ro m tica ^
*

*c?
d

circulo

crescente quadrado

curvas

trigio

rctiln ea s

A
c A
n A

c m A

circulo crescente quadmdo tm ngub


curvas

retiln eas
F o rm a

F igura 1 3-9c As 32 figuras usadas p o r K endler e V in eb erg (1954)


p a ra e s tu d a r a aq u isio d e c o n c e ito s co n ju n tiv o s.

aprendido dois conceitos, como se v na primeira e segunda coluna de conceito na Tabela


13-2. No procedimento terminal, todos os sujeitos foram reforados para arranjar os
cartes em quatro grupos: curvos pequenos, curvos grandes, retilneo pequeno,
retlineo grande. Tal arranjo feito na base de conceitos conjuntivos que consistem de
conceitos de tamanho e forma. O grupo 1 aprendeu este arranjo final mais rapidamente
que o grupo 2, que por sua vez, foi mais rpido que o grupo 3. Os autores concluiram que
a taxa de aquisio do conceito conjuntivo est diretamente relacionada ao nmero de
conceitos componentes aprendidos previamente.
Tabela 13-2
AS CONDIES DE TREINO USADAS POR KENDLER E VINEBERG (1954) PARA
ESTUDAR A AQUISIO DE CONCEITO CONJUNTIVO
Primeiro Conceito
Grupo 1
Grupo 2
Grupo 3

Forma
Forma
Cor

Segundo Conceito

Terceiro Conceito

Tamanho
Cor

Tamanho e forma
Tamanho e forma
Tamanho e forma

A C vs O

Na tarefa final do conceito, no experimento de Kendler e Vineberg, dois conceitos


componentes (tamanho e forma) foram relacionados, por conjuno, para formar um
novo conceito (tamanho-forma). A conjuno , todavia, apenas uma das muitas
maneiras em que os conceitos podem estar relacionados e uma anlise de tais relaes
inter-conceito e mais pertinente para o significado ou a compreeno de um conceito.
Argumentamos anteriormente, nesta seo que uma criana que podia identificai
exemplos do conceito de leite, ou o macaco que podia pressionar uma barra sempre que
fosse apresentado um tringulo, no exibiram todo comportamento necessrio para que
- 293-

pudssemos dizer que eles estavam demonstrando compreenso. O tipo de comporta


mento adicional que parece ser requerido est representado esquematicamente na Fig.
13-10 para o conceito de leite.
A Fig. 13-10 explicada como se segue. Cada um dos crculos do diagrama refere-se
a uma classe de S^s do tipo descrito previamente. Assim, a criana, para quem pode-se
dizer que a Fig. 13-10 tem uma estrutura significante, pode identificar garrafas deleite
copos de leite, leite derramado, e assim por diante. Mas ela pode tambm identificar
(com respostas verbais diferentes) vacas de vrios tipos, cereais de um tipo ou de outro,
queijos, sorvetes e leiteiros. Se ela for uma aluna de ginsio que estuda nutrio, ento,
ela poder ser capaz de identificar o soro, a nata e o clcio. Mas, igualmente importante,
o organismo humano sofisticado pode dar uma identificao relacionai para uma situao
composta que consiste de um S ^ para o leite e um de qualquer outra classe de S^
indicada. Esta habilidade conceituai est indicada pelas linhas entre os crculos com as
proposies que descrevem a relao. Cada proposio relacionai, todavia, tambm um
conceito; na verdade, o tipo de conceito que encontramos frequentemente nas sees
anteriores. O treino requerido para os conceitos relacionais como proveniente de e
um componente de precisamente anlogo ao treino dado ao macaco quando conceitos
como o singular , o mais alto, 90 graus de rotao foram adquiridos. Dizemos que
uma criana sabe o significado, ou tem uma compreenso mais completa de leite quando
ela pode identificar as relaes entre os membros da classe de SD que formam o leite e os
membros de vrias outras classes de S ^

F ig u ra 13-10. U m a rep re sen tao esq u e m tic a do c o n c e ito de leite e suas relaes
com vrio s o u tro s co n ceito s.

Deve ficar claro que a representao estrutural de significado da Fig. 13-10 est
isolada artificialmente.
De fato, mostramos apenas as relaes entre um nico
- 294 -

conceito e um grupo de outros negligenciando as interrelaes dos conceitos perif


ricos com os outros e com todos os conceitos que o organismo' revela. Uma representa
o completa do repertrio conceituai de qualquer indivduo seria uma tarefa insupe
rvel, embora uma amostra limitada de conceitos e suas interrelaes possa ser,
possivelmente, descrita,(Reitman, 1965, R. Quillian, manuscrito no publicado).
A Fig. 13-10 uma maneira grosseira de representar os vrios graus de com
preenso. Quanto mais densas as interconexes e maior o nmero de classes de
que
possam ser unidas, mais facilmente diremos que um individuo compreende um con
ceito. A compreenso que uma criana tem de leite difere daquela do administrador da
leiteria ou do especialista em nutrio, principalmente no nmero menor de conceitos
aos quais a criana pode relacionar o leite. Minha compreenso do meu carro
incompleta comparada com a do meu mecnico, que pode relacionar a palavra carro a
milhares de outras classes de
incluindo, em particular, o que chamamos as partes
do veculo. Contudo, sua compreenso pode terminar com a mecnica da mquina.
Um caso interessante proporcionado pelo fsico que pode ser capaz de analisar
conceitos tais como frico, acelerao, trabalho e energia a um nvel muito mais
bsico que o mecnico poderia. Mas quando seu carro no d a partida, o fsico no
estar preparado para repar-lo, a menos que possua conceitos tais como feixe de
mola, vela de ignio, cilindro, distribuidor e suas vrias interrelaes. As interrelaes
entre os conceitos, para qualquer indivduo, depende da histria passada deste indi
vduo: as contingncias para o chofer de automvel esto ligadas a certos conjuntos de
situaes, as para o mecnico a um outro e para o fsico ainda a outro. As diferenas
entre seus repertrios conceituais sugerem uma distino de nvel embora, frequen
temente seja muito difcil estabelecer, na prtica, os nveis relativos de conceitos.
Numerosos autores estudaram uma ou outra relao entre conceitos na tentativa
de esclarecer, em geral, a estrutura relacionai entre os conceitos. Muitos de nossos
prprios conceitos mostram uma estrutura hierrquica interessante (Welch, 1947;
Brown, 1958 a, b). Isto , o conceito cachorro, por exemplo, pode conter como seus
membros poodles, dalmatas, ces de caa.
S eres
In a n im a d o s

A n im ad o s
V egetais

Peixes

A nim ais

Aves

Q u ad r p ed es

[13.3]
C avalos

C oelhos

D alm atas

| C ach o rro s]

P oodles

T erriers

O cach o rro
do o u tro la
do da ru a

-2 9 5 -

terriers e assim por diante. Mas Prncipe, meu dlmata tambem um conceito com
pleto. Considere todas as situaes em que podemos usar a palavra Principe para
identifica-las: o Principe em casa, o Principe fora de casa caando gatos Principe acor
dado etc. A estrutura hierrquica se estende a ambas direes o Principe no apenas
um cachorro - um quadrpede , um animal e um ser animado (Brown, 1958a). Eviden
temente, as classes de S ^que formam os nossos conceitos podem ser ou conjuntos con
tendo outros conceitos ou subconjuntos de outros conceitos. Por exemplo, ver o dia grama 13.3 . Adquirir um repertrio verbal que colocar um conceito no seu lugar
apropriado numa hierarquia uma parte importante do que queremos dizer por com
preender um conceito.
n
E por responder s interrelaes entre conceitos, ou classes de Su que as respostas
de linguagem tm uma vantagem especial sobre outras formas de comportamento. Para
ensinar uma criana que o leite proveniente das vacas, no necessrio trazer uma
amostra de leite e uma vaca para a criana e reforara escolha do leite sob uma srie de
contingncias anlogas s contingncias da escolha do acordo com o modelo que
usamos com o pombo. Se a criana j adquiriu os conceitos < vaca >< leiteiros > e<
proveniente de > , isto , ela emprega as palavras vaca, leiteiros e proveniente
de , nas situaes apropriadas, podemos tratar diretamente com o comportamento
verbal. Podemos, primeiro, fornecer uma deixa verbal e, ento, reforar a sentena
composta: o leite proveniente das vacas . A nica vantagem da linguagem que, ao
contrrio de barras, chave e botes, ela proporciona um repertrio de resposta porttil
que o organismo pode carregar alm das situaes originais em que o comportamento foi
modelado. Alm disso, quando as respostas de linguagem de um organismo podem ser
colocadas sob o controle discrim in ativo das situaes arbitrrias que constituem a palavra
impressa, ou as palavras faladas de um segundo organismo, esta vantagemi adquire ainda
mais fora. Mas essa grande flexibilidade no controle e emisso do sistema de
comportamentos que chamamos de linguagem pode ser tambm uma desvantagem por
apresentar a possibilidade de aquisio de cadeias verbais sem o amplo controle de SD
ambiental colateral caracterstico de conceitos. Uma criana pode adquirir o que
chamamos verbalism os vazios. John Dewey, um conhecido teorista da educao, da
gerao de Thorndike, uma vez perguntou a um grupo de crianas escolares o que elas
encontrariam se cavassem profundamente a terra. Foi recebido com olhares vazios. A
professora rapidamente, explicou a Dewey que ele havia feito a pergunta de modo
errado. Qual o estado do centro da terra? ela perguntou. A resposta veio em coro:
Fuso gnea . Aqui, uma seqncia verbal estava sob o controle discriminativo das
palavras faladas por um segundo organismo (a professora), mas parece que nenhuma
criana seria capaz de identificar qualquer dos membros das classes de SD <Jusq> ou <
gnea>, ou relacionar o conceito <centro da terra>com <cavar na superficie>. Estas so
as diferenas principais entre o que muitos educadores chamam de memorizat de cor e
aprendizado significativo. Muitas crianas aprendem o Juramento Bandeira sem
compreender sequer uma palavra dele; isto , sem serem capazes de identificar exemplos
dos conceitos representados pelas vrias palavras do Juramento.
A presente anlise ajuda a esclarecer o papel da definio na linguagem. Considere
a definio familiar de um operante = uma resposta que est sob o controle de suas
conseqncias. Tal definio uma proposio de um conceito composto constitudo
de < resposta > < sob controle de > e < conseqncias - Os estudantes, algumas
vezes, tentam adquirir a cadeia verbal do lado direito do sinal de igualdade, pre

- 296-

parando-se para serem apresentados com apenas o termo do lado esquerdo, num teste.
Mas muitos instrutores tm expectativas maiores. Uma definio dita ser com
preendida quando pode ser analisada gramaticalmente, isto , decomposta em seus
conceitos componentes. Se esta anlise efetuada sucessivamente, conceito por con
ceito, eventualmente, atinge-se um ponto onde os componentes do conceito original
so reduzidos a conceitos simples, em vez de compostos. Cada um desses conceitos
simples so podem ser especificados, fazendo-se uma lista de algumas das situaes reais
do ambiente que constituem sua classe S^. Neste nvel,diz-se, algumas vezes, que o
conceito primitivo. Ilustramos esse tipo de anlise conceituai na Fig. 13-11. Esta
figura, como a Fig. 13-10, apenas uma outra maneira de se representar a estrutura
parcial do significado. Parece que o grande poder de uma definio est na sua
habilidade de codificar um grande nmero de conceitos e suas interrelaes numa
nica unidade de comportamento verbal. A definio tpica seria um exemplo muito
complexo do tipo de conceito estudado por Kendler e Vineberg.
As notas nesta seo fornecem um indcio do que est faltando nas anlises expe
rimentais do comportamento de conceito nas sees anteriores. Nestas, os pesqui
sadores, ao treinarem seus animais atravs da Lset ou de outros procedimentos de
conceito, tm tentado estabelecer apenas um nico conceito. De modo a simular a forma
mais simples de compreenso, pelo menos trs conceitos
Operante = [Resposta]

| S ob o controle de |

ss

[conseqncias]

A classe dc jco m p o i | ^ cst^ sb cn- Urr [:estmulo| que segue uma resposta
r
trole de P quando
Quma funo
de P
J
Qualquer coita que um
organism o | faz |
Correr

Saltar

Dizer da Uma unidade d o | ambientef

Uma j descrio | fsica das energias presentes a qualquer


controlar o comportamento do orgaaismo
tempo dado capaz de

O telefone
alimento
perto de Joo apresentado a
*oca
um pombo

Trs objetos numa


bandeja, diretamente
em frente de um macacc

Figura 12-11. Uma analise parcial da definio da palavra Operante em alguns dos
seus conceitos componentes. Os conceitos comportamentais importantes esto dentro
dos quadvados c alm disso so analisados.

- 297 -

parecem necessrios: duas classes independentes de


e uma classe a mais de
que
conteria, entre seus elementos, situaes compostas consistindo de um elemento de
cada uma das duas primeiras classes de S^. Isso seria equivalente a dois conceitos e
um conceito relacionai unindo seus membros. A tecnologia comportamental precisa
ainda ser desenvolvida ao ponto de se poder colocar um nmero de comportamentos
sob o tipo de controle ilustrado pelas Figuras 13-10 e 13-11, mas um progresso nessa
direo est ilustrado no comportamento do macaco nos dois quadros da Fig. 13-12.
No quadro inferior, o macaco est escolhendo um objeto de forma entre trs e seu
comportamento est parcialmente sob o controle da cor da bandeja. Quando esta cor
mudada, como no quadro superior da Fig. 13-12, o macaco escolhe o objeto de cor
diferente entre os mesmos trs objetos. Aqui, dois conceitos relacionais foram desen
volvidos pelos procedimentos de disposio para aprender: Singularidade de forma e
singularidade de cor e ambos esto sob o controle discriminativo da cor da bandeja.
Mas mesmo estas demonstraes so pequenas para simular as interrelaes complexas
caractersticas da compreenso . Nestes e em outros experimentos com animais
descritos neste captulo, apenas um repertrio limitado de resposta desenvolvido.
Parece que a anlise experimental das relaes de conceitos requer o desenvolvimento
de repertrios de resposta mais amplos que tenham um papel anlogo ao do compor
tamento verbal do organismo humano.
13.8 A AQUISIO DE CONCEITO ATRAVZ DA INSTRUO PROGRAMADA
Uma parte da seo anterior foi especulativa por necessidade, uma vez que a
tecnologia comportamental ainda no alcanou um estgio onde uma avaliao detalha
da da aquisio de conceito complexo e da interao de conceito possa ser feita em
organismos inferiores. Esperamos suplementar nossa informao experimental sobre a
aquisio de conceito atravs da anlise da aprendizagem humana mas, quando nos
voltamos para o lugar onde a aprendizagem humana de conceito mais sistemtica
supostamente ocorre, a escola, encontramos muitas generalizaes amplas mas poucos
princpios. Todos so a favor da aprendizagem significante e contra a memorizao de
cor. Conceitos, concorda-se universalmente, so o que queremos ensinar e no fatos
vazios . Mesmo assim, poucos negariam que, enquanto muitas crianas adquirem os
conceitos bsicos que so os objetivos dos seus cursos na escola muitas outras no o
fazem. Isto dificilmente seria devido falta de material conceituai, pois t) currculo
escolar est impregnado de uma variedade de conceitos isolados. Considere alguns
exemplos adaptados de Brownell e Hendrickson (1950): nao, governo, constituio
cidado (estudos sociais); lei, elemento, im, feagente, clula, osmose, massa, cido,
ion/cincia); eroso, latitude, regio, mapa (geografia); voz, tempo, flexo, sentenas,
pargrafo (linguagem); diviso, frao, expoente, equao, nmero base (aritmtica);
escala, tom, clave, intervalo, harmonia (msica). Entre esta diversidade de material
conceituai seria surpreendente se no consegussemos aproveitar algo de um exame
crtico de como estes conceitos so ensinados. Infelizmente, existe, uma dificuldade
dupla: (1) Nenhum mtodo tradicional de ensino garante a aquisio de conceito, e
mesmo assim ( 2 ) algumas crianas parecem adquirir conceitos, independente de qual
seja o mtodo. Isto mostra a impossibilidade de se extrair dos mtodos tradicionais de
ensino as condies necessrias e suficientes para produzir a aquisio de conceito. Os
mtodos apropriados para as classes heterogneas no permitem um controle adequado

- 298 -

SpSdo13<,cT,Jw'O
lK,,n"rlM9,C0mPlS" P" '"l"'nW* U~

- 299-

das contingncias individuais de reforamento para assegurar o desempenho desejado


em cada organismo
As implicaes deste fato levaram B. F. Skinner (1954, 1958, 1961) a considerar
as possibilidades de um mtodo que permitiria um controle melhor das condies de
aprendizagem de cada estudante individual. Skinner props que se programasse as
contingncias envolvidas no ensino das matrias cm pequenos passos sistemticos e se
fornecesse reforamento imediato para os comportamentos corretos. Skinner notou
que os mtodos tradicionais no garantiam a resposta do estudante. Ao ministrar uma
aula para o estudante, ao lhe dar como tarefa a leitura de um livro ou mesmo com a
ajuda de material audiovisual sofisticado como aulas televisionadas, o professor no
tem meios de estar seguro de que o estudante est ouvindo ou lendo cuidadosamente.
Em termos comportamentais, diramos que o professor no tem meios de estar seguro
de que o aluno est respondendo ativamente.

Figura 13-13. Uma mquina de ensinar. O estudante Ir o quadro e escreve sua


resposta. I.nto. move uma barra para descobrir a resposta correta e compar-la u
resposta secunde' Skinner, 195R).

- 300 -

As contingncias programadas dc Skinner supunham implicitamente os tipos de


habilidades intelectuais adquiridas nas escolas, e tradicionalmente vistas como idias,
compreenso, interesses, associaes, conhecimento e assim por diante, eram compor
tamentos operantes complexos. Assim sendo sua aquisio e manuteno deveriam
seguir todas as leis de comportamento que j descrevemos. Mas o ensino programado,
baseado nos princpios de aproximao sucessiva, discriminao, etc., exige uma
ateno mais sistemtica para as contingncias individuais do que as salas de aula
tradicionais permitem. Skinner props uma soluo para este problema sob a forma de
uma mquina para apresentar seriadamente o material de ensino e para estabelecer as
contingncias de reforamento para o comportamento. A mquina tem trs aspectos
essenciais. ( 1 ) O material apresentado para o estudante em pequenas pores
discretas, chamadas quadros, (2) Este material estabelece a ocasio para algum
operante discriminativo por parte do estudante, tal como escrever uma palavra ou
sentena, preencher uma lacuna ou escolher uma resposta. (3) O comportamento
emitido reforado imediatamente, apresentando-se a resposta correta to logo o
estudante tenha respondido e permitindo-lhe avanar para o prximo quadro. Uma
dessas mquinas usadas por Skinner vista na Fig. 13-13. Nesta verso, os quadros
esto escritos num disco rotativo, e um quadro dc cada vez aparece no centro da
janela. Depois de ler o quadro, o estudante escreve sua resposta numa tira de papel
exposta atravs de uma abertura direita. Ele, ento, levanta uma barra que h na
frente da mquina, movendo o que ele escreveu sob uma cobertura transparente e
revelando a resposta correta na janela central. Os quadros individuais so organizados
em pequenos passos seqenciais. O estudante pode progredir no seu prprio ritmo
atravs da sucesso de quadros, chamada um programa, cometendo muito pouco erro.
Mas a apresentao de progu.mas desse tipo no se limita apenas a mquinas. Os
aspectos crticos pequenos passos seqenciais, resposta ativa e reforamento ime
diato - podem ser organizados na forma de um livro. Uma amostra de um texto
programado encontra-se, neste livro, no Captulo 4.
Muito tem sido escrito a respeito dos mritos e possibilidades da instruo
programada. A elaborao de um programa e uma arte delicada e quando um programa
est perfeito o professor programador poder entrar em contato com um nmero
indefinido de estudantes individuais atravs de contingncias ntimas de reforamento.
Apesar da sua natureza individual que prossegue lenta e metodicamente, procurando
estar seguro de que cada ponto compreendido antes de passar para o prximo. O
teste e reviso repetidos de um programa em estudantes individuais at que ele seja
bem sucedido em ensinar o que pretende, uma caracterstica da programao que.
com freqncia, falta completamente nos mtodos tradicionais de ensino. Essas vanta
gens da instruo programada podem bem ser a base para elevar a qualidade dos
mtodos mais convencionais de ensino. Quando h um programa apropriado para
ensinar os conceitos bsicos, o professor fica l ivre para discutir pontos sutis, levar os
estudantes soluo de problemas criativos e para treinar as habilidades adquiridas
atravs da mquina num contexto algo mais relacionado com a vida. A programao
est ainda num estgio inicial para que possamos estimar com exatidb o quo
radicalmente ela ir mudar nossas prticas educacionais. De qualquer modo, nosso
interesse atual no este. Estamos interessados no programa como um veculo
experimental para a aquisio de conceitos.
conveniente classificar o contedo verbal .que constitui um quadro em dois tipos
- 301 -

de proposies: regras e exemplos (Evans, Holme e Glaser, 1962). Uma regra pode ser
considerada como uma especificao geral ou definio de uma classe de SU, enquanto
um exemplo pode ser considerado como a ocorrncia de um dos membros da classe de
SD. Uma instruo programada pode ser encarada como um arranjo de vrias regras e
exemplos, onde algumas pores de cada regra ou exemplo so omitidas, sendo
necessrio, ento o comportamento por parte do aprendiz para complet-las. Deve
estar claro que uma apresentao de um subconjunto de exemplos associados com um?,
determinada regra anloga apresentao de um subconjunto de Ss individuais de
uma ampla classe de
e o reforamento de uma determinada resposta de identifi
cao, digamos, a palavra leite ou a resposta de apanhar o objeto singular.
Considere os quatro quadros de um programa para ensinar alguns conceitos de
imagem em poesia, vistos na Fig. 13-14. Antes destes quadros, os conceitos de
imagem, objeto e similitude foram ensinados atravs de exemplos. Os quadros 48, 49 e
50 so trs exemplos de uma classe de SD que deve ser identificado como smile.
Note que cada quadro arranjado de modo a permitir que as deixas contextuais
aumentem a probabilidade da resposta requerida. Os trs quadros usados como S^s e
para o smile tm certas similaridades, mas tambm certas diferenas. Uma vez que o
Figura 13-14. Quatro quadros dc um programa delineado para ensinar conceitos
relativos imagem na poesia ( cortesia de Susan Stitt).

48. Uma imagem que expressa uma similitude entre objetos de classes diferentes, mas
que no significa exatamente o que diz, chamado um smile. A imagem a
menina como uma flor u m .......................................................................................
Resposta. Smile

49. Pelo fato de expressar uma similitude entre objetos de classes diferentes mas no
significar exatamente o que diz, a imagem a face do homem iluminou-se como o
sol um ...................................................................................................................... ..
Resposta. Smile.

50. Um smile no introduzido apenas pela palavra como, mas pelas palavras ta!
qual, como se ou como quando. Assim, a imagem o homem est vermelho tal
qual um pimento um ...............................................................................................
Resposta. Smile.

51. Por outro lado, uma frase que expressa a identidade entre dois objeto mas no
significa exatamente o que diz, no um smile. Assim, a imagem seus olhos so
estrelas (/no ) um smile.
Resposta. No _____________

_________________________________________

programador deseja que o conceito de smile seja to amplo quanto possvel, as


contingncias de reforamento so estabelecidas na presena de uma grande variedade
de exemplos da classe de S^. O quadro 51, todavia, um caso de SA . Na aquisio
de conceito em humanos e em animais, importante apresentar situaes onde no
haja membros da classe de
e retirar o reforamento da resposta ou, como neste
caso, reforar uma resposta incompatvel. O quadro 51 ajuda a estabelecer o que o
smile no .
- 302 -

Outro exemplo de rormao de conceito mostrado no quadro da Fig. 13-15.


Posteriormente, neste programa, o estudante encontrar figuras de outros organismos
com e sem seis pernas e com muitos outros aspectos que variam. Mas a palavra inseto
s ter deixas e ser reforada na presena de figuras de organismos com seis pemas.
Eventualmente, o conceito de inseto se generalizar para uma vasta classe de orga
nismos com seis pemas atravs desta histria com um subconjunto dos membros.
Ainda outro exemplo no campo da anlise comportamental fornecido nos
quadros da Fig. 13-16. O conceito a ser adquirido o de evento resposta. Note que os
quatros fornecem SDs e S ^ s para o conceito. Eventualmente, aparecer num quadro
onde se pedir ao aprendiz que induza a definio geral com base na sua histria
passada com numerosos exemplos.

Os exemplos de formao de conceito atravs da instruo programada indicam


que as noes fundamentais da
aquisio de conceito discutidas nas sees
anteriores so aplicveis tambm aprendizagem humana. Os exemplos vistos
representam ilustraes razoavelmente simples de como o controle de uma resposta
verbal (smile, inseto, evento resposta) por uma ampla classe de S^s pode ser
estabelecido atravs da apresentao sistemtica de exemplos, com reforamento 1 para
a resposta verbal desejada. claro que os conceitos desenvolvidos so conceitos
compostos de outros. O smile composto de certas relaes entre os conceitos de
objeto, similitude e imagem; inseto a conjuno de organismos e seis pernas evento
resposta um composto de ao e agente. Num programa completo, cada conceito a
ser adquirido estabelecido atravs de um conjunto de contingncias apropriadas com
um subconjunto de seus membros e muitos dos conceitos adquiridos so, ento,
relacionados entre si atravs de exemplos compostos apropriados. este entrelaa
mento de conceitos que parece ser o carimbo da verdadeira compreenso de um
assunto.
Ao se programar a aquisio de conceito surgem algumas questes sistemticas
relativas ao papel de certas variveis que o programador tem sob o seu controle. O
programador pode controlar o nmero de exemplos de
e S ^ ; pode controlar sua
1

Note que para sujeitos humanos normais '"obter a resposta 'co rre to ' frequen
temente um reforador suficiente. Veja, por exemplo, o programa na seo 4.3.
-3 0 3 -

Figura 13-16. Uma srie de quadres delineados para estabelecer o conceito de eventoresposta. As Rs corretas esto indicadas pelas letras pequenas direita do quadro
(Mecliner, 1963).

1 . Seu nascimento no foi um evento-resposta para voc. Voc jogar seu chocalho
fora do seu bero foi um evento-resposta para voc.
Marque as respostas abaixo que descrevem um evento-resposta para. a pessoa ou
animai nelas indicado (nota: voc pode marcar qualquer nmero de sentenas).
a.
b
c.
d.
e.

Clara pintou o cabelo de vermelho


Herman morreu.
Joo tem uma crie.
Aroldo foi ao dentista.
0 gato miou.

d
e

2 . Quando voc bate em algum, o evento-resposta seu. Quando outra pessoa lhe
bate, o evento-resposta no seu.
Para cada sentena abaixo marque o quadrado se a sentena descrever um eventoresposta para o organismo nela indicado.
a.
b.
c.
d.
e.
f3.

n
n

Marque as proposioes que descrevem eventos-resposta para voc.


a.
b.
c.
d.

4.

Filipe corre depressa


Gregrio foi atropelado.
Alice colou no exame.
Maria foi pega colando.
0 canrio perdeu todas as suas penas.
0 cachorro pegou o doce no primeiro salto

Voc resolveu um problema difcil dematemtica


Seu professor lhe deu uma boa nota.
Voc um dentista.
Voc est estudand.o para ser um dentista.

A sentena Um gato corre refere-se a um evento-resposta.


A sentena Uma pessoa corre refere-se a um evento-resposta.
A sentena O carro corre no se refere a um evento-resposta.
Marque os eventos-respostas abaixo:
a.
b.
c.
d.
e.
f.
g-

- 304-

0 furaco passou ontem aqui (para o furaco)


Tom bateu em Harry, (para Tom)
Tom bateu em Harry, (para Harry)
O relgio bateu dez horas (para o relgio)
Voc come uma cenoura (para voc)
Um mosquito pica voc (para voc)
Um mosquito pica voc (para o mosquito)

diversidade e suas seqncias. o desenvolver alguns conceitos diierentes, ele pode


escolher um exemplo multidimensional concreto, apresentando-o sob vrios pontos de
vista , ou pode usar vrios exemplos mais simples, apresentando cada um sob o nico
ponto de vista. H pouca informao sistemtica disponvel a respeito de qualquer
destas variveis, mas como um meio experimental que a programao tem potenciais
importantes par elucidar relaes fundamentais na aquisio de conceito.
13.9 AS CONSTNCIAS PERCEPTIVAS
A noo de uma coisa como uma entidade imutvel est to fortemente
arraigada que talvez seja uma surpresa que coisas to primitivas como objetos possam
ser descritas como conceitos. Imagine que a face de um amigo no seja um nico
estmulo visual. Algumas vezes, ele aparece na sombra, outras na claridade. s vezes,
ele est sorrindo, s vezes franzindo as sobrancelhas. Algumas vezes, voc o v de
perfil, outras, de frente. Alm disso, perfis e vises frontais so, por sua vez, uma
coleo de perfis e vises frontais, nenhum dos quais , alguma vez, exatamente
repetido. Apesar do fato de que voc nunca veja a mesma face duas vezes, voc no
tem dificuldade para identificar seu amigo. Em linguagem tcnica, seu amigo uma
ampla classe de S^s e voc responde similarmente a todos os membros.
Considere o objeto mostrado na Fig. 13-17. Todos os quatro desenhos represen
tam a mesma porta , contudo, os vrios padres que atingem o olho e que constituem
as quatro situaes que chamamos porta , so bastante diferentes. claro que para
portas, ou qualquer outro objeto que possamos imaginar, o nosso conceito do deter
minado objeto no consiste de uma nica situao, mas de uma ampla classe de
situaes. Os exemplos que acabamos de dar so casos do que pode ser denominado
constncia do objeto. Apesar das mudanas marcantes na situao, ns retemos uma
resposta constante na presena de todas as suas variantes.
Que tipo de conceito representado pela constncia do objeto? Tomados in
dividualmente, os quatro desenhos da Fig. 13-17 sugerem que o conceito de objeto
disjuntivo, j que essas quatro situaes parecem to diferentes. Mas a Fig. 13-17
apenas uma amostra do conjunto infinito de situaes que variam de aberta a fechada,
todas as quais controlam a resposta porta. E todas essas situaes esto mutuamente

- = r

Figura 13-17

Quatro membros da classe de S ^ porta (Gibson, 1950)

- 305-

relacionadas pelo fato de que uma situao Aporta pode ser continuamente trans
formada em outra. Tal srie de transformaes relaciona as situaes de qualquer
objeto particular.
A constncia do objeto apenas uma classe do que geralmente chamado de
constncias perceptivas. Outro exemplo mostrado atravs dos dois pedaos de carvo
colocados sobre o papel branco, na Fig. 13-18. Dizemos que o carvo preto e o
papel branco sem levar em considerao a intensidade absoluta de luz que apenas
ou o carvo ou o papel reflete. sombra, o pedao de carvo no painel esquerda da
Fig. 13-18. reflete somente 1 millilambert de luz, enquanto que o mesmo pedao de
carvo luz do sol (painel direita da Fig. 13-18) reflete 100 vezes mais luz. Ainda

Figura 13-18. Um caso de constncia de cor neutra. Um pedao de carvo colocado


sobre uma tolha de papel branco (Hochberg, 1964).

assim, dizemos que o carvo preto, embora ele agora reflita 10 vezes mais luz que
refletia o papel branco sombra. A resposta cor neutra (cinza) depende da
iluminao relativa do objeto com respeito ao seu fundo ou regio imediatamente
adjacente. Assim, preto um conceito j que a resposta na presena de uma classe
ampla de S^s relacionados: objeto que reflete 1 unidade de luz, fundo que reflete 9
unidades de luz objeto que reflete 10 unidades de luz, fundo que reflete 90 unidades;
objeto que reflete 100, fundo que reflete 900; e assim por diante.
Um exemplo final proporcionado pelo fenmeno conhecido como constncia de
tamanho. medida que uma pessoa caminha em sua direo, voc no capaz de
relatar que sua imagem visual est aumentando de tamanho. Contudo, medida que
ela se aproxima, a imagem aumenta de tamanho na sua retina, de uma maneira
inversamente proporcional sua distncia de voc. Dentro de limites voc diz que ela
est do mesmo tamanho, independentemente do tamanho da imagem na sua retina.
Desse modo, o conceito de tamanho dependente de uma classe de SD onde a regra
para incluso na classe uma funo complexa do tamanho retnico do objeto mais os
valores de muitas outras variveis visuais que variam com a distncia de um objeto. A
Fig. 13-19 mostra que o conceito de tamanho constante no controlado pelo
tamanho retnico constante. Os trs cilindros da Fig. 13-19 so todos os mesmo
tamanho (mea-os) mas tendemos a classific-los como progressivamente maiores da
esquerda para a direita devido s mudanas na perspectiva linear, uma das variveis que
em geral, muda progressivamente com a distncia.
Naturalmente, no por acidente que as constancias de objeto, cor neutra e
tamanho se desenvolvem. Contingncias de reforamento esto frequentemente correla
cionadas com os objetos (um pssaro deve se manter fora de todas as situaes que

- 306 -

Figura 13-19. Resposta ao tamanho quando determinada por variveis de distncia


(Gibson, 1950).

chamamos gato, se quiser viver muito), bem como as variveis de estmulo com
posto que controlam a constncia de cor acromtica e a constncia de tamanho.
Raramente, consideramos que> um objeto est mudando de cor ou tamanho quando
sua iluminao ou distncia muda. Por outro lado, conveniente classificar aquele
animal que est se movendo rapidamente em sua direo como grande, embora o
tamanho de sua imagem seja ainda muito pequeno. Nossos conceitos espelham-se nas
contingncias de reforamento da natureza, embora seja uma especulao interessante

- 307 -

saber se esses conceitos perceptivos so geralmente adquiridos na histria passada de


cada indivduo ou se, tendo sido bem adquiridos pelos seus ancestrais, so agora
uma parte permanente do seu eauioamento de resposta visual.
REFERENCIAS PARA O CAPITULO 13.
Andrew, G., and Harlow, H. F. Performance of macaque monkeys on a
test of the concept of generalized triangularity. Comp, psychol.
Monogr., 1 9 4 8 ,1 9 , 1 -2 0 .
Brown, R. H ow shall a thing be called? Psychol. Rev., 1958a, 65, 1 4 -2 1 .
Brown, R. Words and things. Glencoe, 111.: Free Press, 1958b.
Brownell, W. A ., and Hendrickson, G. How children learn information,
concepts and generalizations. In Learning and instruction, 49th
Yearb., Nat. Soc. Study Ed., 1950, Part I.
Bruner, J., Goodnow, Jacqueline J., and Austin, G. A. A Study of think
ing. N ew York: Wiley, 1956.
Cumming, W. W., and Berryman, R. Some data on matching behavior in
the pigeon. J. exp. Anal. Behav., 1961, 4, 2 8 1 -2 8 4 .
Evans, J. L., Homme, L. E., and Glaser, R. The ruleg system for the
construction of programmed verbal learning sequences. J. educ.
Res., 1962, 5 5 ,5 1 3 - 5 1 8 .
Ferster, C. B. Arithmetic behavior in chimpanzees. Sci. Amer., May
1964, 210, 9 8 -1 0 6 .
Gibson, J. J. The perception of the visual world. Cambridge: The River
side Press, 1950.
Goldiamond, I. Perception, language, and conceptualization rules. In
B. Kleinmuntz (E d .), Carnegie Institute of Technology annual sym
posium on cognition, N ew York: Wiley, 1966.
Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56,
5 1 -6 5 .
Harlow, H. F. Learning set and error factor theory. In S. Koch (E d .),
Psychology: a study of a science, V ol. 2. New York: M cGraw-Hill,
1959.
Harlow, H. F., and Kuenne, M. Learning to think. Sci. Amer., 1949, 181,
3 6 -3 9 .
^
Herrnstein, R. J., and Loveland, D. H. Complex visual concept in the
pigeon. Science, 1964, 146, 5 4 9 -5 5 1 .
Hochberg, J. E. Perception. Englewood Cliffs: Prentice-Hall, 1964.
Hull, C. L. Quantitative aspects of the evolution of concepts. Psychol.
Monogr., 1920, 28, Whole N o. 123.
Kelleher, R. Concept formation in chimpanzees. Science, 1958, 128,
7 7 7 -7 7 8 .
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York:
Appleton-Century-Crofts, 1950.
- 308 -

Kendler, H. H. Basic psychology. N ew York: Appbton-Century-Crofts,


1963.
Kendler, H. H ., and Vineberg, R. The acquisition of compound con
cepts as a function of previous training. / . exp. Psychol. , 1954, 48,
2 5 2 -2 5 8 .
Kimble, G. A ., and Garmezy, N. Principles of general psychology. (2nd
ed .) N ew York: Ronald Press, 1963.
Lysaught, J. P., and Williams, C. M . A guide to programmed instruction.
N ew York: Wiley, 1963.
Mechner, F. Science education and behavioral technology. New York:
Basic Systems, 1963.
Reitman, W. R. Cognition and thought: an information processing ap
proach. New York: Wiley, 1965.
Skinner, B. F. The science of learning and the art of teaching. Harvard
educ. Rev., 1954, 24, 8 6 -9 7 .
Skinner, B. F. Teaching machines. Science , 1 9 5 8 , 128, 9 6 9 -9 7 7 .
Skinner, B. F. Why we need teaching machines. Harvard educ. R e v .t
1 9 6 1 ,3 1 , 3 7 7 -3 9 8 .
Smoke, K. L. A n objective study o f concept formation. Psychol. Monogr.,
1932, 42, Whole N o. 191.
W elch, L. A behaviorist explanation of concept formation. / . genet.
P sych o l , 1 9 4 7 ,7 1 ,2 0 1 - 2 2 2 .

- 309 -

Captulo 14 SOLUO DE PROBLEMA E INTELIGNCIA

O TERMO PROBLEMA SURGIU OCASIONALMENTE nas discusses ante


riores. lhorndike colocou gatos numa caixa quebra-cabea que continha uma tramela
que pode ser aberta atravs de vrios movimentos (Fig. 1-1). Foi dito que os gatos que
no tinham uma histria anterior com as contingncias deste aparelho se defrontavam
com um problema escapar da caixa. Pode-se dizer, assim, que a aquisio de qualquer
comportamento instrumental contem elementos de soluo de problema. Nos pro
cedimento de disposio para aprender do ltimo captulo, descrevemos, conjuntos su
cessivos de contingncias discriminativas apresentadas durante o treino como uma srie
de problemas de discriminao. Os macacos solucionaram estes problemas e como resul
tado adquiriram a habilidade para resolver novos problemas similares como uma eficin
cia maior.
14.1 A ESTRUTURA DE UM PROBLEMA E A NATUREZA DE UMA SOLUO
Os problemas que os gatos de Thorndike e os macacos de Harlow tinham diante
de si diferem em vrios aspectos, mas particularmente nas contingncias existentes. As
contingncias estabelecidas para os gatos eram predominantemehte diferenciaes e
para os macacos, discriminaes. Logo, a notao de um problema no denota
qualquer classe particular de contingncias de reforamento. Discriminaes e diferen
ciaes podem ser problemas. O fato de se um conjunto de contingncias pode ou no
ser interpretado como um problema para um organismo depende dos comportamentos
predominantes quando o organsimo se defronta pela primeira vez com a situao
problema. Os gatos de Thorndike, evidentemente, defrontaram-se com um problema,na
caixa quebra-cabea nas suas primeiras tentativas. Eventualmente, medida que o
comportamento que conduzia abertura da tramela era repetidamente reforado, a
situao perdia sua caracterstica de problema. To logo os gatos eram colocados na
caixa, eles j se encontravam fora dela. Um desenvolvimento semelhante ocorre na
formao da disposio para aprender. O macaco com uma disposio para aprender
de singularidade bem formada resolve imediatamente, qualquer discriminao nova de
singlaridade. A situao de singularidade no pode mais ser descrita como um pro
blema para este organismo.
Essas idias simples no esto limitadas a grupos de problemas artificiais estabe-

- 311 -

lecidos para animais nos laboratrios de psicologia. Para um aluno de segundo ano
primrio
25
-18
constitui um problema, mas um ano ou mais depois isto no ser mais o caso.
Similarmente, voc pode no achar que / e ^x dx seja problema, dependendo de se
voc possui certos comportamentos usualmente ensinados nos textos do primeiro ano
de clculo. No extremo de um continuum, podemos dizer que sabemos como acabar
com as guerras um problema desde que uma soluo universal ainda no existe. Em
resumo, nenhuma classe de contingncias, nem qualquer contingncia em particular,
podem ser descritas como um problema at que saibamos que comportamento o organis
mo vai apresentar na presena daquela contingncia. Tentemos, agora, descrever este
ponto de vista mais rigorosamente. Para isso, veremos que os conceitos sobre encadeamento introduzidos no Captulo 12 so indispensveis.
Numa cadeia de comportamento, um organismo emite operantes numa ordem se
qencial. A ordem particular controlada pelas conseqncias estabelecidas para cada
operante isolado. Para solucionar um problema de diviso, uma criana bem treinada
realiza a multiplicao, subtrao, emprstimo, transporte, etc., numa certa seqncia
que depende do resultado de vrias discriminaes. Uma criana sem as habilidades
componentes no pode executar a cadeia requerida. Esta criana ilustra a possibilidade
de que, em qualquer situao determinada, pode no existir qualquer cadeia que
produzir a situao associada com o reforamento. Isto pode surgir de uma entre
duas maneiras relacionadas. (1) o organismo no adquiriu, no passado, uma parte ou
toda a cadeia necessria para conduzi- lo da situao presente, S^, para a situao
reforadora, Sb , embora tal cadeia possa ser conhecida por outros organismos. (2) No
existe qualquer cadeia conhecida cuja execuo garanta a transformao de Sa em Sb .
Examinemos, agora, vrios problemas representativos.
0 problema na caixa-quebra-cabea revela certos aspectos interessantes da soluo
de problema. Os gatos foram colocados na situao inicial, a caixa fechada, S \ . Alguns
comportamentos foram gerados inicialmente. Os gatos correram, miaram, colocaram
suas patas nas barras, arranharam as bordas dos orifcios maiores, olharam em vrias
direes e assim sucessivamente. Muitos destes comportamentos representam operantes
generalizados de uma histria passada de reforamento em situae similares. No
passado, quando colocados num espao pequeno, os gatos, normalmente, escapavam
olhando ao redor do ambiente, aproximando-se de qualquer orifcio, arranhando as
partes soltas do ambiente, e assim por diante. Alguns outros comportamentos, como
miar, esto indubitavelmente estabelecidos na estrutura do gato. Independentemente
de como foram fortalecidos, certos comportamentos, R i, R2, R 3 , R4 ..., surgem na
situao problema inicial. Alm disso, embora esses comportamentos no sejam
aleatrios, eles no esto ainda arranjados na seqncia bem ordenada que emitida
quando o gato, eventualmente, soluciona o problema. O repertrio inicial do gato
consiste de um conjunto seletivo de comportamentos que ele traz para a situao e
com os quais ele opera nela. Eventualmente, uma dessas Rs pode ser bem sucedida em
abrir a tramela. Quando isto acontecer, o gato transformou a situao de porta
fechada em porta aberta.

- 312-

SA
R,
R2
R 3
R4

S (porta aberta)
R (Sair pela > Sg (fora da caixa)
Porta)

Na nova situao, S(p0rta abertaV 0 Sat0 tem uma secluncia de resposta bem estabele
cida predominante, sair pela poria aberta. Este problema simples ilustra vrios aspectos
importantes de soluo de problema em geral. (1) Um organismo leva um conjunto de
respostas R j, R2 , R 3 ... para a situao, ou devido sua histria passada com situaes
similares ou devido sua estrutura geneticamente determinada. (2) Essas Rs no so
igualmente provveis de ocorrerem; algumas (arranhar as bordas de orifcios, miar), tm
maior fora do que outras (explorar o teto da caixa; ficar de p, parada). (3). Uma vez
que uma determinada resposta seja bem sucedida em transformar a situao numa fami
liar, uma seqncia bem estabelecida pode levar o animal situao reforadora, Sg.
Thorndike, assim como outros antes dele, referiu-se aos dois primeiros aspectos
descritos como responder por tentativa e erro. O animal emite (tenta) muitas
respostas na situao problema, a maioria delas consistindo de erros. Eventualmente,
a R correta ocorre, ao acaso, e o animal atinge o sucesso. Kohler (1925) criticou

- 313 -

esta caracterizao da soluo de problema. Ele argumentou que a situao de


Thorndike no era represencativa de problemas em geral. Os gatos, dizia Kohler, no
podiam, logo no incio, observar a relao entre a tramela e a caixa aberta. Mas muitos
problemas reais, argumentou, permitem ao organismo observar mais aspectos e relaes
na situao do que no caso dessses gatos. Assim, Kohler estabeleceu o seguinte
problema para os animais (Fig. 14-1). Uma banana foi colocada do lado de fora da
gaiola do macaco. Havia duas varas de bambu dentro da gaiola, mas nenhuma delas era
bastante comprida para alcanar a banana.
Uma vara, todavia, tinha um dimetro
menor e podia ser facilmente inserida em qualquer das pontas da outra vara com
pondo, assim, uma nica vara, bastante
comprida para alcanar a banana. Os
macacos de Kohler, quando colocados nesta situao, apresentavam, inicialmente,
comportamentos que haviam sido reforados no passado. Eles estendiam uma ou outra
vara, movendo-as para frente e para trs em direo banana. Depois de certa
quantidade de extino, esta resposta enfraquecia. Neste ponto, alguns animais
sentavam-se calmamente durante um certo tempo, aps o que, de repente, encaixavam
as duas varas e puxavam a banana.
Sulto, antes de tudo, agacha-se indiferentemente na caixa colocada um pouco
atrs da grade. Ento, ele se levanta, pega as duas varas, senta-se novamente na
caixa e brinca descuidadamente com elas. Ao fazer isso, acontece de se encon
trar segurando uma vara em cada mo de modo que elas ficam em linha reta. Ele
empurra a mais fina em direo abertura da mais grossa, pula corre em direo
s grades... e comea a puxar a banana em sua direo com as duas varas
encaixadas (Kohler, 1925, p. 27).
Kohler chamou esta soluo sbita de insight e sugeriu que isto era uma propriedade
tpica da soluo de problema. Ele afirmava que Sulto e outros sujeitos resolviam o
problema porque a estrutura do problema tornava-se clara imediatamente e no porque
o comportamento de encaixar as duas varas fosse um operante que predominasse na
situao. Birch (1945) todavia, demonstrou que uma certa histria passada crtica
para solucionar este tipo de problema. Kohler no especificou com detalhes a histria
passada de seus macacos.
Birch resolveu pesquisar se a manipulao anterior da vara era essencial. Pegou um
grupo de macacos que nunca haviam tido experincias com varas e estabeleceu-lhes
contingncias de um problema idntico. Ao contrrio dos resultados de Kohler,
nenhum desses sujeitos foi capaz de solucionar o problema numa sesso de 30 min.
Birch, ento, realizou vrias sesses em que permitia que os macacos brincassem com
pequenas varas. Ele observou que os animais passavam, gradualmente, a usar as varas
como extenses de seus braos para cutucar, espreitar, revolver, cavoucar e outras
operaes similares. Num segundo teste, todos os animais resolveram o problema das
duas varas em menos de meio minuto. A concluso inevitvel. A manipulao prvia
das varas essencial para a soluo de um problema que requer isto como uma
habilidade componente; a estrutura lgica da situao no ajudar um organismo
que no possua quaisquer habilidades para utilizar esta estrutura.
A natureza encadeada dos comportamentos componentes que constituem a
soluo de um problema nos ajuda a explicar a caracterstica sbita das solues
observadas por Kohler, e outros. Uma vez que o organismo tenha produzido uma

-3 1 4 -

situao que uma deixa para uma seqncia bem estabelecida de corpporamento, o
problema termina. Uma vez que Sulto havia transformado aquelas duas varas
pequenas numa mais longa, o problema chegou a um fim, o que nos permite supor,
razoavelmente, que Sulto possua uma histria anterior de cutucar objetos com varas
de vrios tamanhos.
14.2 QUEBRA-CABEAS
P ara estudar a soluo de problemas em sujeitos humanos, os psicologos atribuem
uma variedade de tarefas aos seus sujeitos. Algumas delas so os quebra-cabeas. Um
quebra-cabea muito conhecido visto na Fig. 14-2. 0 sujeito instrudo a unir os
nove pontos com quatro linhas retas sem tirar o lpis do papel e sem retraar uma
linha. As linhas podem se cruzar, se necessrio. A maioria dos sujeitos tenta resolver o
problema com um grupo de operantes de conectar os pontos, traando as linhas na

Figura 14-2. O quebra-cabea dos nove pontos

periferia. Essa seqncia falha, todavia, e outra resposta emerge com alta fora traado de uma diagonal. Esse novo comportamento de pouca ajuda, j que a
diagonal mais as trs linhas perifricas deixam ainda um ponto isolado. Muito rapi
damente, ento, o sujeito exaure seu repertrio usual para lidar com tais problemas
e, neste ponto, ele concordar que aquilo realmente um quebra-cabea. Uma soluo
para o problema dos nove pontos consiste dos prolongamentos de linhas alm dos limites
da matriz do ponto (veja o apndice deste captulo).
O fato de esta soluo simples requerer algum tempo e, frequentemente, no ser
de todo alcanada, mostra um aspecto importante dos quebra-cabeas. Muitos pro
blemas ou quebra-cabeas so difceis de serem resolvidos porque eles tendem a
controlar respostas muito fortes mas inapropriadas. Os quebra-cabeas, frequen
temente, parecem-se com situaes passadas em que certas respostas eram adequadas e
reforadas. O problema dos nove pontos por exemplo, muito semelhante a uma
situao que contem apenas oito pontos (imagine que o ponto central da Fig. 14-2
no existe) e que poderia ser facilmente resolvida , traando-se quatro linhas na
periferia. A emisso repetida de comportamento inadequado numa situao problema
comumente chamado disposio, usado no sentido em que dizemos que algum est
- 315-

Tabela 14-1
OS PROBLEMAS DA JARPA DE GUA (LUCHINS 1942)
CAPACIDADES DAS JARRAS
NMERO DO PROBLEMA
1
2
3
4
5
6
7
8
9
10
11

29

3
127
163
43
42
59
49
39
76
48
36

21
14
18
9

20
23
15
28
18
14

_
3
25

10
6
4
3
3
3
4

QUANTIDADE REOUERIDA

20
100
99
5

21
31

20
18
25

22
6

disposto a alguma coisa . O restringir as respostas de traar linhas periferia da


matriz dos nove pontos um exemplo de disposio. Muitos problemas podem ser
resolvidos apenas atravs de respostas no usuais, assim, conveniente instruir as
pessoas que solucionam os problemas de um modo que sua variabilidade de compor
tamento aumente. fcil demonstrar que a disposio est sob o controle da histria
de reforamento do organismo. Luchins (1942)' solicitou aos sujeitos que solucio
nassem uma srie de problemas numricos que requeriam a mensurao da quantidade
de gua atravs de vrias jarras de medidas. A Tabela 14-1 mostra 11 desses problemas.
O problema 1 foi um exemplo introdutrio. Mostrou-se ao sujeito que, para obter 20
unidades de gua (o valor da coluna mais direita), ele teria que encher a jarra de 29
unidades e derramar 3 unidades, 3 vezes. O sujeito, ento, trabalhava nos outros dez
problemas. Note que (excluindo o exemplo introdutrio) todos os problemas, exceto o
nmero 9, esto de acordo com a regra B menos A menos 2 C: encha primeiro, a jarra
maior, B; ento, derrame 1 jarra A e 2 jarras C. Os problemas de 7 a 11, todavia, tm
uma soluo alternativa usando apenas duas jarras, o que pode ser interpretado como
uma cadeia mais simples de comportamento. Contudo, sujeitos do primeiro ano
primrio at ao nvel de ps-graduao raramente empregaram a soluo das duas
jarras. Sua histria de reforamento nos problemas de 2 a 6 tornaram a seqncia de
trs jarras forte o bastante para dominar todas as outras cadeias.
A noo de disposio aparece no clebre problemas dos dois cordes, visto na
Fig. 14-3. A situao inicial, S ^, consiste de dois cordes pendurados no teto de um
quarto praticamente vazio. A situao reforadora terminal, Sb , consiste das duas
pontas dos dois cordes amarradas uma outra. Todavia, a distancia entre os dois
cordes muito grande para que o sujeito alcance um deles enquanto segura a ponta
do outro. Numa verso do problema, o nico objeto a mais, presente na situao
experimental era um rel magntico. A soluo do problema mostrada na Fig. 144.
-3 1 6 -

O sujeito amarrou o rel ao cordo e colocou-o em movimento, como um pndulo.


Assim, ele poderia pegar o cordo em movimento, enquanto segurava o outro, e as
duas pontas podiam ser facilmente amarradas. Os sujeitos que tiveram uma sesso
anterior em que foram instrudos a usarem o rel

Figura 14-3. O problema dos dois cordes. Os dois cordes devem ser amarrados um
ao outro, embora estejam muito afastados para se segurar um enquanto se pega o
outro.

Figura 14-4. Uma soluo para o problema dos cinco cordes. O Sujeito amarrou o
rel a um cordo e colocou em movimento.

como um componente de um circuito eltrico mostraram-se muito deficientes na


soluo deste problema (Birch e Rabinowitz, 1951)- Novamente aqui, uma certa
histria passada (usar o componente eltrico como um componente eltrico) impediu
os comportamentos necessrios para a soluo do problema (usar o compoennte
eltrico como um peso).
Como um exemplo final, considere os problemas dos palitos de fsforo da Fig.
14-5. Os problemas dos palitos de fsforo ilustram um aspecto comum a muitos
- 317 -

(A)

(B)

L L _
LLLI
LL! LU
LI
LU

(C)

(D)

(E)

___U

LLUU
U

II II
LU

LULU

Figura 14-5. Os problemas dos palitos de fsforo de Katona (1940). Em A - C mova


trs palitos e produza uma nova figura que tenha um quadrado a menos que a
figura original. Em D, produza uma nova figura com apenas cinco quadrados, movendo
tres palitos. Em E, mova dois palitos e produza uma figura com quatro quadrados.
(Ver as solues no apndice deste captulo)

problemas, a saber, a soluo a ser alcanada especificada apenas de uma forma


geral.A legenda da Fig. 14-5 diz quais as propriedades gerais que a soluo deve ter
mas no expecificada, em detalhes, a situao terminal, S3 . Com exceo do problema
dos nove pontos, nossos problemas e quebra-cabeas anteriores especificavam a si
tuao reforadora exata, Sb, em vez de sua estrutura geral. O macaco solucionava o
problema quando a banana estava na gaiola; 0 problema dos dois cordes era resolvido
quando os cordes eram amarrados. Mas os problemas dos palitos de fsforo so
solucionados apenas quando a contagem de quadrados igual ao nmero requerido.
Para esses problemas, existem vrias solues aceitveis, com muitas maneiras para se
chegar at elas. (Veja 0 apndice deste captulo).
143 ESTRATGIAS DE PROCURA DE HEURSTICAS
A nossa caracterizao geral de problemas enfatizou sua natureza encadeada ou
composta.
Mas a anlise da maioria das amostras de problemas das sees anteriores
no requer um encademaento detalhado. Ampliemos portanto, o conceito de um
problema . Consideremos o cadeado de segredo da Fig. 14-6. A maioria dos cadeados
de segredo deste tipo tm 50 ou 100 posies discretas, mas 5 sero suficientes para a
nossa ilustrao. Pode-se dizer que um homem para quem tal cadeado barra a entrada
para alguma situao reforadora est diante de um problema se ele no tem a
seqncia dc comportamentos disposio para abrir o cadeado. Por outro lado,
pode-se executar um algoritmo sistemtico (ver seo 1 2 .8 ) para abrir o cadeado tente

Figura 14-6. Um cadeado de segredo de cinco posies.

-3 1 8 -

cada combinao at voc ser bem sucedido. Esta, provavelmente, a noo de


comportamento de tentativa e erro que Kohler e outros psiclogos atriburam a
Thorndike ao criticarem sua anlise da soluo de problema pela falta dos elementus
para uma soluo estruturada. Contudo, Thorndike nunca relatou que os gatos se
empenhavam em todos os comportamentos possveis em todas as seqncias possveis.
De fato, os gatos restringiam sua ateno aos orifcios e partes moveis da caixa
quebra-cabea, apresentando um conjunto altamente seletivo de comportamentos. Mas
um problema de um cadeado de segredo ilustra um responder mais puro por tentativa
e erro. Assim, um cadeado de 50 nmeros, que se abre quando a seqncia correta de
3 nmeros girada, exigir 50^/2 (= 62,500) seqncias a serem tentadas, em mdia,
antes de se abrir. Se cada seqncia dura 6 seg, o tempo mdio para abrir este cadeado
ser de 4 dias detrabalho contnuo. bvio porque tal cadeado serve como uma
proteo, mesmo embora quase todas as pessoas tenham uma cadeia algortmica
apropriada forte que, eventualmente, poderia abr-lo.
Uma estrutura em rvore uma maneira conveniente de representar as seqncias
de comportamento nesse tipo de problema (Fig. 14-7),. Os crculos ou ndulos numa
Situao original, SA

Sigura 14-7. Uma estrutura em rvore representando alguns dos comportamentos e


situaes resultantes que surgem do girar os nmeros do cadeado da Fig. 14-6. O
segredo (3,5,4) visto como linhas pontilhadas que ligam os crculos cheios. Por
questo de espao, apenas algumas das ramificaes do terceiro nvel (inferior) so
mostradas.

estrutura em rvore representam as situaes que podem ser produzidas pelas vrias
respostas disponveis para o organismo. Assim, o ndulo superior a situao original,
onde nenhum nmero foi ainda girado. Os 5 primeiros nmeros possveis so vistos
como ndulos no nvel imediatamente inferior. Analogamente, os 25 ndulos no
prximo nvel representam o conjunto de situaes que resulta do girar ainda um
outro nmero. As possibilidades no nvel inferior, resultantes do girar um terceiro
nmero, so tantas (125) que podemos representar convenientemente apenas uma
amostra destas no diagrama. Na rvore da Fig. 14-7, as linhas representam as respostas
operantes de girar. A estrutura nos proporciona uma maneira de representar as
situaes possveis que podem surgir quando todas as respostas disponveis em um
problema so especificadas e todas as suas conseqncias resultantes conhecidas.
Examinando a Fig. 14-7, fica claro que um homem que deseja abrir este cadeado ter
que percorrer muitas ramificaes at que ocasionalmente, acerte.
- 319 -

Muitos outros problemas podem ser representados na torma de uma rvore de


seqncias operantes e suas situaes resultantes. Se um simples cadeado de 5 nmeros
pode levar a tantas ramificaes possveis (125), como ser que um indivduo sempre
resolve problemas realmente difceis tal como descobrir uma boa jogada no xadrez,
integrar uma funo, provar um teorema da lgica? As situaes possveis que
resultam de apenas doze tipos distintos de respostas conduzidos a um nvel de
seqncia igual a 12 1212 Evidentemente, a tentativa e erro simplesmente no
seriam suficientes para solucionar um problema de qualquer dificuldade.
Suponha que houvesse alguma maneira da pessoa que soluciona o problema limitar
suas operaes alternativas. Isto , suponha que se dissesse ao indivduo .que o primeiro
nmero no tipo de cadeado da Fig. 14.6 comumente 3. Em geral, os problemas que
so solveis tm associadas a eles vrias regras ou heursticas que permitem que o
organismo restrinja sua topografia de resposta a certos grupos de operaes. Essas
heursticas so geralmente caracterizadas como regras prticas que ajudam a limitar a
seqncia de comportamento. Ao contrrio de um algoritmo, seu emprego no garante
uma soluo, mas frequentemente ajudam a encontr-la. Podemos supor que os gatos
de Thorndike exibissem tais heursticas quando limitavam sua ateno aos orifcios e
partes mveis da caixa quebra-cabea. No passado, estas respostas compensavam com
maior freqncia do que outros comportamentos. Uma heurstica possvel para o
problema do cadeado de segredo pode ser a observao de que, algumas vezes, as
pessoas fecham um cadeado e deixam o ltimo nmero da combinao na posio.
Isto no sempre verdadeiro, mas pode servir como uma heurstica til. Nos pro
blemas complexos, conveniente diagnosticar se est ocorrendo um retrocesso ou um
progresso em direo soluo. Isto , se se est ficando quente . medida que
retrocedemos de
frequentemente possvel interpretarmos as situaes interme
dirias (ndulos) como mais prximas ou mais distantes da situao terminal, SgSuponha que coloquemos um homem com os olhos vendados numa sala grande e
digamos-lhe que sua tarefa atirar um dardo na mosca lo alvo. A localizao da caixa
de dardos e o alvo no lhe conhecida. Permitimos ao nosso sujeito duas respostas,
caminhar e atirar os dardos. Concordamos em avis-lo, todavia, depois de cada passo
que ele d, se ou no est chegando mais perto da caixa de dardos. Alm disso, uma
vez que ele chegue at a caixa e comece a atirar os dardos, avis-lo-emos se os seus
lanamentos esto prximos ou distantes do alvo. Isto uma verso do brinquedo de
chicote-queimado ( voc est ficando mais quente) e se o nosso alvo no fr muito
pequeno, o nosso sujeito solucionar este problema rapidamente. Mas, bvio que um
homem que no receba os S^s progressivos ( avisos) ao longo do caminho poder
nunca solucionar o problema.
Em geral, uma anlise da soluo de problema tem a forma de (1) notar as
heursticas apropriadas que restringem a topografia da resposta a serem usadas e as
situaes que valem a pena ser exploradas; (2 ) notar as discriminaes intra-problema
importantes que devem ser feitas para que se possa detectar se uma resposta colocou o
organismo mais perto ou mais longe da situao terminal.
Se estes so realmente os componentes crticos do comportamento de soluo de
problema, deve ser possvel incorpor-los na estrutura de uma mquina que poderia,
ento, resolver problemas semelhantes. O comportamento desta mquina pode ser de
interesse por vrias razes. Primeiro, ela poderia verificar a suficincia do conjunto de
heursticas e discriminaes que podemos supor como necessrias para qualquer con-

- 320 -

junto determinado de problemas. Segundo, variando as jcaractensticas da maquina


poderemos descobrir um meio de desenvolver um solucionador de problemas mais
eficiente c, ento, aplicar essas descobertas prtica educacional. Devido sua rapidez
de operao (25.000 ou mais operaes por seg), o computador digital ideal para
explorar esses modelos de soluo de problemas. As representaes das situaes
podem ser programadas, vrias operaes correspondentes s respostas do organismo
podem ser simuladas e uma estratgia para transformar sucessivamente uma situao
em outra pode ser construda na mquina. Newell e Simon (1963) descreveram um
programa dc computador chamado General Problem Solver (GPS) para tratar com
certos quebra-cabeas e problemas. O programa emprega uma variedade de estratgias
de procura heurstica e testes de discriminao para avaliar se as situaes recmcriadas representam um progresso em direo situao terminal, S b Um dos seus problemas o domnio da lgica simblica. Pode-se pedir mquina
que prove que (Rl>\P). ( ^ .R ^ Q ) equivalente aO; ,(^ Q.P). D-se mquina a
mesma informao que
um universitrio possui, a saber, uma dzia de regras para
transformar os smbolos atravs da adio de termos, supresso de termos, mudanas
das conexes, dos sinais, dos grupos, e assim por diante. O programa que torna o
computador um solucionador de problemas proporciona-lhe a habilidade de aplicar
essas regras (responder) e discriminar as diferenas entre as situaes que ela produz. E
o mais importante, talvez, o programa proporciona-lhe um nmero de heursticas para
dirigir sua procura atravs da rvore do problema. Uma heurstica conveniente restringe
o GPS de tentar transformar uma situao (ndulo) se esta fr mais difcil de
transformar do que uma situao anterior (ndulo). O GPS constri os seus prprios
critrios de dificuldade de transformao. O GPS espera que as diferenas entre as suas
situaes sucessivamente geradas, S j, S 2 , S3
e a situao terminal, S[$, diminua
medida que prossegue trabalhando atravs de suas sries de transformaes. Se isto no
acontecer, o GPS volta a um nvel superior (em direo S \ ) e percorre uma nova
ramificao. Outra heurstica fora o GPS a abandonar uma ramificao quando esta
vai abaixo dc uma determinada profundidade (a diminuio vertical na Fig. 14-7) e a
situao Sb ainda no apareceu. O GPS parece resolver seus problemas to bem quanto
estudantes universitrios e, talvez mais importante, frequentemente incorre nos
mesmos tipos de erro. Outros programas para solucionar demonstraes geomtricas,
jogar xadrez c damas, integrar c estabilizar linha de montagem tem sido projetados,
todos empregando as idias de estratgias de procura dc heurstica.
14.4 IDENTIFICAO DO CONCEITO
Quando um indivduo adquiriu um conjunto dc conceitos pelos mtodos do
Captulo 13, a sua habilidade em induzir ou identificar qualquer conceito particular
atravs da inspeo de apenas alguns membros S^ do conceito pode ser de interesse.
Apesar de certas semelhanas dc procedimento entre a aquisio de conceitos e a
identificao de conceito, o ltimo mais propriamente tratado no contexto da
soluo de problema. Na identificao de conceito, temos um sujeito que j adquiriu
todos os conceitos empregados no experimento. O processo de aquisio de conceito
est bem sedimentado. Suponha que mostremos a um sujeito uma figura de um
pssaro, um avio e um balo e pedimos-lhe que identifique (nomeie) o "conceito
(a classe de So) que eles exemplificam. O sujeito adquiriu h muito tempo atrs o

- 321 -

conceito dc fcobjeto voador atravs de uma histria de discriminao com lais


objetos.Agora, sua tarefa simplesmente apresentar o comportamento verbal ad
quirido, dando o nome k4objeto voador . Em geral, a tarefa do sujeito na identificao
dc conceito consiste cm examinar um nmero de situaes e induzir o conceito delas
(isto , propor uma regra geral para a classe de S^). Ele informado, para cada
situao, se esta ou no um caso da classe de
desconhecida. Nesta tarefa,
tipicamente
o sujeito emprega estratgias, ou seqncias sistemticas de respostas,
que levam identificao correta.

Bruner, (ioodnow e Austin (1956) apresentaram os 81 cartes vistos na Fig. 14-8


aos seus sujeitos. Esses cartes variavam de quatro maneiras; (1) o nmero de figuras
(1, 2 ou 3 );(2) a cor das figuras (vermelha, verde ou preta); (3) a forma das figuras
(... cru/, crculo ou quadrado ) c, (4) o nmero de linhas perifricas (1, 2 ou 3).
Primeiro, mostrava-se ao sujeito um determinado carto (digamos, aquele com trs
crculos vermelhos c duas 1in lias perifricas, 30V2p) e dizia-se-lhe que esse era um caso
positivo de um conceito que ele deveria identificar. O sujeito era, ento, avisado dc
que poderia escolher cartes adicionais entre os 80 restantes para obter informaes.
Depois dc cada escolha, ele era avisado se o carto particular que escolhera era ou no

\j J

OO

OO

o o o

ooo

5 l

fc>oo] o o o
o

I I Dl
o o
i

fp<x>l l 0 0 l !

FI
l - l

pm aj
Ti

2 J E I a JI

llllll
01

o o

>

FIH

o o

Ml

Figura 14-8. Um conjunto de cartes usados para estudar a identif icao de conceito.
As formas variam em (1) nmero, (2) forma, (3) cor, e (4) nmero de linhas
perifricas (Bruner, Goodnow e Austin, 1956).

um caso do conceito. Quando a tarefa consistia de identificar conceitos conjuntivos


(crculos vermelhos, duas figuras verdes, etc.), a maioria dos sujeitos adotou uma
estratgia que consistia em escolher cartes que variavam em uma e somente uma
dimenso do carto positivo inicial conhecido. Dessa maneira, cada seleo eliminava
um ou mais conceitos. Um exemplo dos tipos de seqncias de scolha usando essa
estratgia seria o seguinte:
- 322-

30V2p (+)
20V2p (+)

o exemplo inicial positivo dado


primeira escolha: elimine trs figuras como um
elemento relevante.
3 QVerde2 p () segunda escolha: retenha o vermelho como um
elemento relevante.
3V2p ()
terceira escolha: retenha o circulo como um
elemento relevante.
30Vlp (+)
quarta escolha: elimine duas linhas perifricas
como um elemento relevante.
Logo: o conceito crculos vermelhos .
Bruner, Goodnow e Austin demonstraram que um nmero de variveis, tal como o
tipo do conceito a ser identificado, a maneira em que os 81 cartes eram expostos e o
nmero de exemplos que se permitia aos sujeitos escolherem, afetava o tipo de
estratgia sistemtica empregada.
14.5

A MENSURAO DE HABILIDADES PARA SOLUCIONAR PROBLEMA:


TESTES DE INTELIGNCIA

Talvez, nenhuma palavra seja to mstica em toda a psicologia quanto inteli


gncia . uma palavra que todos empregam mas dificilmente definem. Desde 1905, os
psiclogos mantm a curiosa posio de preparar e defender os testes de inteligncia
e, ento, negar sua responsabilidade por eles, dizendo que ningum sabe o que a
palavra realmente significa (Wechsler, 1958). Veremos que a soluo de problema
proporciona um veculo conveniente para tratar o tpico inteligncia. Em todos os
testes que se propem a medir a inteligncia, veremos apenas uma srie de problemas
proposta a um sujeito e vrias medidas do seu desempenho registradas.
A idia de um teste de inteligncia, ou como preferirmos cham-lo, um teste de
soluo de problma, suigiu originalmente de consideraes puramente prticas. Em
1904, o psiclogo francs Alfred Binet foi encarregado de preparar um teste que
apontasse aquelas crianas cujas deficincias em solucionar problemas tornava im
provvel que elas pudessem tirar proveito da instruo regular da escola. O testes
resultante de Binet era uma srie de problemas com gravuras, blocos de madeira,
tabuleiros, etc., prprios para serem administrados a uma criana de cada vez. Este foi
o primeiro teste de inteligncia que obteve sucesso. Durante a Primeira Guerra Mundial,
surgiu uma necessidade premente nos Estados Unidos de avaliar as habilidades para
solucionar problemas de vrios milhes de convocados o mais rpido possvel. Testes
de lpis e papel que poderiam ser administrados, simultaneamente, a um grupo de
recrutas foram desenvolvidos para suprir essa necessidade e foram aplicados na seleo
de homens para vrias tarefas. Com o tempo, estes testes de grupo passaram a ser
universalmente empregados. Muitas escolas, atualmente, usam seus resultados para
selecionar estudantes. Universidades e escolas de ps-graduao confiam enormemente
nos seus escores para decises sobre admisso. Nossa preocupao, todavia, no com
a aplicao prtica de tais testes. Desejamos, em vez disso, averiguar certas con
tribuies que os testes de inteligncia tm fornecido nossa anlise dos compor
tamentos humanos de solucionar problema.
Qual a natureza dos problemas usados nos testes de inteligncia? No h
melhor maneira de descrev-los do que atravs de exemplo. No teste tpico, aparece
um nmero de subtestes destinados a avaliar vrias habilidades para solucionar
- 323-

( ba ( bhJ S_B_

/ 2 /s a/ / /
/
/
/
/

Qual bandeira igual da esquerda?

ixioiyioioixioioioi i i ii ii r n

Quantos blocos
existem?

Marque o grupo de letras diferente

Ache o caminho da sada

CCZO AC BC SC LC RC MA

Se quatro IF:s ustam 50


centavos, quantos voc compraria
com 1 cruzeiro?________

INICIO

esta para

ffl

H B ffl

Assim como

Copie esta figura


comeando
pelo circu'o

1 i

Complete a srie tie Sx e Os


L

Se X vem antes
de U no alfabeto,
marque oA abaixo
Caso contrrio,
marque o B

XL

esta para.

Figura 14-9. Amostras de itens do tipo usado nos testes grupais de lpis e papel para
habilidades dc solucionar problemas (Kimble e (.arme/y, 1963 ).
p r o D l c m a . Uma amostra de um conjunto de itens apresentada na Fig. 14*9. Os itens
da Fig. 14-9 testam uma variedade de habilidades. Alguns problemas baseiam-se
principalmente em habilidades de linguagem, outros em habilidades discriminativas e
perceptivas. A maior parte procura empregar itens que testem habilidades gerais para
solucionar problema e a habilidade para aplicar conceitos amplos e disposio para
aprender. Esse ideal, todavia, nunca c completamente realizado.

Os escores obtidos com testes de soluo de problema deste tipo nos dizem algo
sobre as habilidades relativas para solucionar problema de indivduos num determinado
grupo cultural. No restante desta seo (1) examinaremos algumas cias variveis a que os
escores tm sido relacionados, e (2) faremos uma anlise mais detalhada dos prprios
escores.
Um dos resultados melhor documentado a funo que relaciona os escores de
soluo de problema idade do sujeito. Curvas tpicas que ilustram a relao bsica
em cinco sujeitos que foram testados e re-testados em vrias idades so vistas na Fig.
14-10. Os cinco indivduos bastante diferentes da Fig. 14-10 continuaram a progredir
em suas habilidades para solucionar problemas no decorrer de um perodo de 25 anos.
Por volta dos 25 anos, a taxa de aumento na habilidade de solucionar problema
comea a diminuir para alguns sujeitos, mas no todos. A populao em geral mostra
uma queda aguda antes dos treze anos e apenas um ligeiro acrscimo na habilidade de
solucionar problema entre os 20 e 50 anos.
Suponha que desejemos relacionar o escore de soluo de problema de um
indivduo com o escore de pessoas da sua idade. Para isto, necessrio administrarmos
um determinado teste para muitos indivduos da mesma idade. Uma vez tenhamos os

- 324-

escores do grupo, podemos comparar os escore^ de qualquer indivduo com aqueles


dos outros no grupo. Um aspecto interessante ^destes escores de teste que eles se
apresentam aproximadamente com uma distribuio normal.

Idade (anos)
Iigurn 14-10. Habilidade para solucionar provlcina cm tun^o da idade( Baylcy,
1955 ).

Isto , se testarmos bastante indivduos, as frequncias relativas em que os vrios


escores possveis ocorrem podem ser descritas pela curva em forma de sino da parte
superior da Fig. 14-11. Nas sees 2.6 e 10.9, vimos que existe uma relao ntima
entre o desvio padro e a percentagem de medidas que caem nas vrias regies da
curva normal. Fssa relao permite-nos estabelecer a escala de percentil vista logo
abaixo da curva. Se, por exemplo, olharmos detalhadamente a Fig. 14-11, veremos que
o ponto +2 O em relao mdia corresponde ao percent il 98. Um escore no
percentil 98 indica que apenas 2% dos escores so maiores do que seu valor. Simi
larmente, o ponto +1 c est no percentil 84, a mdia no percentil 50, e assim por
diante.
Um mtodo ainda mais comum de expressar a habilidade relativa de solucionar
problema encontrar um Quociente dc Inteligncia , definida como
01

escore obtido na soluo de problema


100------------------;-------------------------------------escore mdio na soluo de problema

O escore do indivduo o numerador deste quociente. O denominador do quociente


o escore mdio na soluo de problema do grupo de indivduos da mesm* idade. (Os

escores de crianas so geralmente comparados com os de outras crianas da mesma


idade; os escores de adultos so usualmente comparados com os de outros adultos sem
levar em conta a idade, na suposio de que a habilidade mdia de solucionar
problema varia muito pouco depois dos vinte anos). Se o escore de um indivduo o
mesmo que a mdia do grupo, ento, o numerador
= ao denominador e o QI
calculado 100. A relao entre o ndice de 01 e a faixa de percentil vista na Fig.
14-11. O desvio padro do ndice de QI cerca de 16 pontos de QJ. Assim, um
indivduo cujo QI calculado como 1 16 est cerca de 16 acima da mdia do seu
grupo de idade e, portanto, encontra-se no percentil 84. Apenas 16 por cento dos
indivduos do seu grupo de idade tero um escore mais alto.

Percent is (cent is)

I.. . . I ,. ..I . . . . I,... I . . .. I..

60

70

80

90

mi n, i l i M, 111.il ni .lii iili

100 110 120 130 140

Quocientes de inteligncia
Figura 14-1 1. Relaes entre escores de soluo de problema, percentis e o ndice de
QI (segundo Cronbaeh, 1963).

Muitos pesquisadores tm criticado a derivao, e o uso subsequente de um nico


nmero como o QI, do desempenho em problemas com o aqueles da Fig. 14-9. Dois
indivduos podem obter escores de QI idnticos de 116 (digamos) apesar de suas
habilidades de solucionar problemas poderem ser radicalmente diferentes. Para ilustrar,
fazendo-se referncia Fig. 14-9, um sujeito pode solucionar os problemas dos blocos
ocultos com um alto grau de proficincia, mas se sair muito mal nos problemas que
requerem a completao da srie de letras. O outro indivduo pode apresentar um
repertrio inverso
habilidades superiores para a srie de letras combinadas com pouca
habilidade para solucionar os problemas de relaes espaciais. Mas, ao somar os escores
de ambos os testes obtemos o mesmo total para os dois indivduos. Uma grande parte
de resistncia a uma anlise mais refinada do desempenho em diferentes tipos de
problemas, provavelmente, devida noo histrica de que Inteligncia representa
uma capacidade fixa do organismo para solucionar problemas de todos os tipos. No
h uma evidncia total, mas estudos recentes indicam que a habilidade de um
indivduo para solucionar problemas melhor representada como um grupo de habi
lidades de solucionar problemas. Thurstone (1945) sugeriu o que ele chama uma
anlise de perfil (ver Fig. 14-12). As habilidades de um indivduo para solucionar
problemas so caracterizadas com o sendo constitudas das oito habilidades bsicas
vistas na parte superior ua Fig. 14-12. Esse perfil fornece muito mais informaes
sobre as habilidades de um indivduo para solucionar problemas que qualquer escore
de QI, mas a anlise pode ser ainda insuficiente. Alguns pesquisadores, atualmente,
sugerem que 120, em vez de 8 habilidades bsicas para solucionar problemas, podem

- 326-

Percentual

Verbal

Abstrata

Fspaciai

Mec| nica

1 scri- Soleta
trao

Scntcnas

1 1 1 h 1111111

90

75

60
50
40

25

10

Percentil

Numrica

17

60

76

91

55

15

16

Figura 14-12. Um perfil tpico das habilidades de um indivduo hipottico para


solucionar problema. (Bennett, Seashore e Wesman, 1951).

ser necessrias para descrever o desempenho de um indivduo satisfatoriamente. Com


um nmero to grande como 120, podemos bem indagar em que sentido a palavra
bsico pode ser aplicada.
O contexto em que os lestes de inteligncia se desenvolveram raramente levou os
pesquisadores a procurar maneiras de modificar os comportamentos de solucionai
problema que eles iso!aram. Todavia, bem conhecido que a preparao ou o treino
das habilidades especiais que fazem parte dos problemas de Ql, pode aumentar os
escores significativamente. Se a fig. 14-10 examinada cuidadosamente, veremos que
a idade em que o aumento na habilidade de solucionar problema comea a diminuir
coincide precisamente com a poca em que muitos indivduos terminam o seu treino
escolar ormal. Mas embora a educao formal contribua enormemente para o au
mento na habilidade geral de solucionar problema com a idade, no se fez ainda uma
tentativa ampla de modelar habilidades de solucionar problema do tipo avaliado nos
testes de QL Parece que, se estas habilidades so bsicas em qualquer sentido, um
programa sistemtico, iniciado na tema idade, para model-las atravs das tcnicas
discutidas nos captulos anteriores seria conveniente.
14.6

CORRELAO, TESTE DL CONFIABILIDADE F VALIDADE

Em vrias partes ao longo deste texto, o termo correlao foi empregado no


sentido de relao . Foi dito que os reflexos de correlaes entre eliciadores e

- 327 -

respondentes; que o reforamento est correlacionado com a ocorrncia de um operan


te especificado. 0 sentido dado ao te mio foi o de relao ou dependncia. A
contrao pupilar est estritamente relacionada (depende de) (lashes de luz; a
liberao de alimento est estritamente relacionada ao (depende de) bicar a chave. Em
geral, quando uma varivel dependente de outra, pode-se dizer que ela est correla
cionada com esta; o contrrio, como veremos, no necessariamente verdadeiro. Na
descrio mais completa de relaes ou correlaes particulares entre duas variveis,
somos, tipicamente, levados representao grfica. As correlaes que constituem as
leis do reflexo so descritas pelas funes que relacionam as propriedades do eliciador
s propriedades do respondente. As correlaes que constituem as leis do fortaleci
mento operante tomam a forma de uma curva da taxa de resposta em funo do
tempo.
Quando falamos de duas variveis que so correlacionadas, importante separar as
noes de como e quanto elas esto correlacionadas. Perguntar sobre como duas
variveis esto correlacionadas indagar sobre a forma da relao entre elas. A medida
em que uma varivel aumenta, a outra aumenta, diminui, ou permanece inalterada? A
relao melhor representada por uma linha reta, uma curva simples ou uma curva
complexa com depresses e picos? As pginas anteriores podem ser consultadas, pois
contm amostras de uma larga variedade de formas.
Perguntar sobre o quanto duas variveis esto correlacionadas indagar sobre a
preciso com que somos capazes de predizer o valor de uma delas sabendo o valor da
outra. A resposta ao quanto independente da resposta ao como . A forma de
relao poderia ser linear, curvilnea ou qualquer outra e, mesmo assim, a variabilidade
na medida poderia ser to grande que pouco mais que uma predio grosseira poderia
ser efetuada. O contraste entre uma forma altamente definida e um grau baixo de
correlao esl ilustrado nos dados hipotticos da Fig. 14-13. Nove medidas de U
aparecem para cada valor de X na Fig. 14-13. Os valores mdios dos Ys esto
conectados por uma linha reta. F^ evidente que X est diretamente relacionado a Y e a
forma da relao indiscutivelmente linear. 0 grau de correlao , todavia, baixo.
Onde o valor de X 2, por exemplo, os valores de Y variam de menos de 1 a mais do
que 3. Fm geral, a previso de Y a partir de X, na Fig. 14-13 deficiente. Para
melhorar o grau de correlao na Fig. 14-13, os valores de Y par,, qualquer valor de X
deveriam estar mais prximos. Isto , os valores de Y teriam que ser muito menos
variveis.
Nas vrias relaes grficas, ou correlaes, descritas nas pginas anteriores, a
varivel no eixo horizontal tipicamente uma varivel independente (medida e mani
pulada), enquanto a varivel no eixo vertical tipicamente uma varivel dependente
(medida, mas no diretamente manipulada). Ao tratar estas relaes funcionais, dirigi
mos nossa ateno principalmente para a forma das correlaes isto , como as
variveis esto relacionadas. 0 grau de correlao, isto , a habilidade preditiva ou o
quanto as variaveis esto relacionadas., foi considerado ser alto devido ao controle
experimental cuidadoso, dispositivos precisos de mensurao, e assim por diante.
Algumas vezes, acontece que no h quaisquer manipulaes experimentais dispo
nveis para se determinar como uma varivel influenciada por mudanas sistemticas em
outra. Nesse caso, podemos ser forados a basear-nos nas relaes entre duas variveis
dependentes. O grau de correlao entre as variveis nestas relaes entre duas variveis
dependentes no pode ser tomado como certo. Nenhuma das variveis est

328

X
Figura 14-1 3. Relao linear hipottica entre duas variveis.

sob o controle experimental direto e, j que somos, frequentemente, incapazes de


controlar influncias que podem afetar uma ou outra de maneiras complexas, muito
mais variabilidade nos dados deve ser esperada. Tivemos pouca ocasio para discutira
relao entre duas variveis dependentes neste texto, mas sua avaliao um empreen
dimento comum, frequentemente, com importncia prtica. Os escores que um indi
vduo obtm num teste padronizado de lpis e papel de soluo de problema e sua
taxa de progresso como uma pessoa que est sendo treinada para uma tarefa so
ambos variveis dependentes do desempenho. Mesmo assim, se as duas variveis so
altamente correlacionadas, as predies sobre uma delas podem ser feitas conhecendose o valor da outra.
O grau de correlao entre duas variveis dependentes pode variar de muito baixo
- onde conhecer o valor de uma de pouca ajuda para prever o da outra - a muito
alto - onde sabendo-se o valor de uma torna possvel predizer com preciso qual ser o
valor da outra. Entre estes extremos encontram-se todos os graus de correlaes
intermedirias. Por exemplo, h algum grau de correlao entre altura e peso (ambas
variveis dependentes); pessoas altas tendem a pesar mais do que pessoas baixas. Mas o
grau de correlao est longe de ser perfeito, desde que se pode prever apenas
aproximadamente o peso de um homem a partir de sua altura. Os estatsticos
desenvolveram um ndice numrico, ou coeficiente, para indicar o grau de correlao.
O coeficiente vai de -1 at + 1 , passando pelo zero. Mais 1 representa o caso onde
duas variveis esto diretamente relacionadas e pode-se prever perfeitamente uma delas
a partir da outra. Valores altos de uma acompanham valores altos da outra, valore:
intermedirios acompanham valores intermedirios e assim por diante. Menos 1 epresenta o caso onde as duas variveis esto inversamente relacionadas e perfeitamente
previsveis. Valores altos de uma acompanham valores baixos da outra e vice-versa.
Uma correlao igual a 0 representa uma relao aleatria entre duas variveis;
conhecer o valor de uma no de ajuda alguma para predizer o valor da outra.

329

Coeficientes intermedimos representam graus intermedirios de previsibilidade. A Fig.


14-14 indica graficamente os tipos de elaes que esto associadas aos vrios valores
do coeficiente de correlao. Nosso X e Y poderiam ser quaisquer duas variveis
dependentes relacionadas: por exemplo, escore no teste de lpis e papel (X) versus
realizao no trabalho (Y ), ou altura (X) versus peso (Y).

Figura 14-14.

As correlaes entre duas variveis dependentes frequentemente apresentam pro


blemas de interpretao que esto ausentes quando a varivel X de uma relao c uma
varivel independente. Sabe-se que a habilidade de solucionar problema na criana, por
exemplo, est correlacionada com o comprimento do dedo do p. A medida que a
criana cresce, sua capacidade de solucionai problemas aumenta ao mesmo tempo que
seus ossos esto aumentando de comprimento e, assim, os dois mostram uma correla
o significante. Isto pode ajudar o estudante a ver que, embora a correlao moslre a
relao causai em alguns casos, ela no significa, necessariamente, que uma das duas
coisas correlacionadas causa a outra (Hebb, 1958, p. 237). Aqui existe uma terceira
varivel independente, a idade do indivduo, que funcionalmente relacionada a ambas
as variveis, acarretando, assim, uma correlao entre elas.
Duas correlaes subordinam-se ao conceito e mensurao da inteligncia. ( ! ) A
habilidade relativa de um indivduo para solucionar um tipo particular de problema
numa ocasio correlaciona-se, at certo grau, com sua habilidade relativa para solu
cionar esse tipo de problema numa ocasio posterior. No tosse por essa consistncia
intra-classe na habilidade de solucionar problema, no haveria um conceito de inte
ligncia. (2) A partir do quo bem um indivduo resolve os problemas a, b, c
n
podemos predizer como ele resolver os problemas a \ b \ c........ n \ Sem
esta
consistncia inter-classe na soluo de problema no haveria uma medida da inte
ligncia. Desde Binet, o tratamento prevalente da inteligncia tem sido uma tentativa
contnua de melhorar o grau de correlao inter-classe atravs de selees cada vez
melhores dos problemas a, b, c....... n. Isto , os psiclogos tm se preocupado com o
estabelecimento de grupos padres de problemas (a, b, c,
n, chamados problemas
testes, ou testes de Ql) cuja correlao, com outros grupos de problemas ( a \ b \ c'......
n \ cormimente, a realizao na escola, universidade ou no trabalho, ou mesmo outros
testes de 01) sein aim
A medida da intengencia, como todas as medidas, depende de dois requerimento:
a mais que, por meio de anlise, v-se que envolvem correlaes. O primeiro requeri
mento estipula que os instrumentos de medida sejam confiveis, isto , que o seu uso
repetido proporcione resultados similares. Uma rgua confivel quando suas medidas
repetidas de uma mesa fornece resultados que concordam exatamente entre si. Simi
larmente. se um leste de soluo de problema um instrumento de medida confivel,
seu u>r repetido deve levai ao mesmo valor para a habilidade de solucionar problema
- 330 -

de um determinado indivduo. O requisito confiabilidade , com eteito, uma neces


sidade para um alto grau de correiao entre os resultados do teste em ocasies
diferentes. Dada uma nica medida, devemos ser capazes de predizer a prxima: ela
dever ser aproximadamente a mesma. A confiabilidade depende, parcialmente, das
condies constantes de medida e, parcialmente, do prprio ato de medir que afeta
desprezvelmente o que est sendo medido. A confiabilidade de um teste de solucionar
problema geralmente mais baixa do que a de uma rgua porque muitas operaes
podem facilmente ocorrer entre as medidas, m udando o desempenho de soluo de
problema do indivduo. Por exemplo, prticas demasiadas em vrios problemas afetar
a concordncia das medidas repetidas de 01. Alm disso, o instrumento de medida
afeta dc algum modo, o que est sendo medido: a aplicao repetida de testes de QI
pode afetar os e s c o r e s - o sujeito torna-se versado em teste .
Um segundo requerimento imposto s medidas que elas sejam teis a qualquer
objetivo para o qual so feitas. A utilidade, no contexto de medida, chamada
v a lid a d e . Se temos um piano na rua e queremos estar certos, antes de carreg-lo por
trs lances dc escada, que ele passar atravs de uma certa porta, ser melhor medir o
seu lado mais largo. Comparando esta medida com as dimenses da porta, seremos
capazes dc predizer se podemos entrar com o piano. Poderamos fazer muitas outras
medidas do piano - poderamos determinar o seu valor na praa ou pes-lo - mas
nenhuma dessas medidas seria vlida para os nossos objetivos presentes. Bias no
seriam convenientes para aquilo que pretendamos fazer, no m omento, com o piano.
Segue-se, portanto, que elas no, seriam medidas vlidas para o passar atlavs da
porta1.
A validade uma forma simulada de correlao pois, no exemplo que acabamos de
descrever, a largura do piano a varivel que est mais correlacionada com a
possibilidade dc pass-lo atravs da porta. O peso menos correlacionado e, a menos
que, nos pianos, o valor na praa e o ta m anho sejam relacionados, o valor na praa,
provavelmente, ter uma relao aleatria (0) com esta possibilidade.
Algumas vezes, a validade pode assumir a forma de uma estimativa do grau dc
correlao entre uma dimenso da medida ( D j ) cuja utilidade j oi bem estabelecida e
uma dimenso da medida (D 2 ) diferente c pior estabelecida. Este problema surge
frequentemente quando o mtodo de medida existente envolve dificuldades prticas e
um segundo mtodo mais simples e rpido proposto. Se desejarmos medir uma
grande rea de terra, veremos que impraticvel (mas, em princpio, possvel) medir o
seu perm etro com uma rgua. Em vez disso, adotamos um procedim ento de medida
totalmente diferente e mais rpido, usando equipamento tico de medida. A
justificao para este m todo sua alta correlao com os resultados obtidos quando,
de fato, usavam-se rguas para conferir os valores medidos.
A validade exigida de um escore de teste de inteligncia desse tipo. Certas
dimenses de medida vigentes existem na forma do desempenho na escola, habilidades 110
trabalho, e assim por diante. Mas, frequentemente, impraticvel avaliar todas as
habilidades de solucionar problemas numa criana, ou medir, o repertrio com pleto de
solucionai problema 110 trabalho num indivduo. Poderamos at desejar prever o
desempenho de um homem antes de ele assumir o trabalho. O teste de QI proposto
como um dispositivo rpido de medida que procura medir os aspectos de uma dimenso
complexa da soluo de problema de uma maneira mais simples, atravs de operaes de
lpis e papel. O grau em que os testes de QI reaJizam isso dado pelo grau de correlao

- 331 -

entre seus escores e o desempenho, no trabalho ou na sala de aula, pa solucionar


problema. Quanto mais alto o grau de correlao, maior a validade (utilidachdo escore
do lpis e papel.
APNDICE DO CAPITULO 14.

Figura 14-15. Soluo do quebra-aibra tios nove pontos.

(A)

LL U
U

(B)

(C)

LLU
U

JJJJ
LI Li

(D)

(E)

_IJ_ LLLL
LI LI LI IJ

Figura 14-16. Solues para os problemas dos palitos de lstoro.

REFERNCIAS PARA O CAPTULO 14


Bayley, Nancy. On the growth of intelligence. Am er. Psychologist, 1955,
10, 805-818.
Bennett, G. K., Seashore, H. G., and Wesman, A. G. Counseling from
profile. A case book for the Differential Aptitude Tests. New York:
Psychological Corp., 1951.
Birch, H. G. The relation of previous experience to insightful problem
solving. J . comp. Psychol., 1945, 38, 367-383.
Birch, H. G., and Rabinowitz, H. S. The negative effect of previous
experience on productive thinking. J. exp. Psychol., 1951, 41, 121
125.

- 332 -

Bruner, J. S., Goodnow, Jacqueline J., and Austin, G. A. A study of


thinking. New Y ork: Wiley, 1956.
Cronbach, L. J. Educational psychology. New York: Harcourt, Brace
and World, 1963.
Hebb, D. O. A textbook of psychology. Philadelphia: Saunders, 1958.
Katona, G. Organizing and memorizing: studies in the psychology of
learning and teaching. New York: Columbia Univer. Press, 1940.
Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts,
1963.
Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd
ed.) New York: Ronald, 1963.
Kohler, W. The mentality of apes. New York: H arcourt, Brace, 1925.
Luchins, A. S. Mechanization in problem solving: The effect of Einstellung. Psychol. Monogr., 1942, 54, No. 248.
Newell, A., and Simon, H. GPS, a program that simulates human thought.
In E. A. Feigenbaum and J. Feldman (E d s.), Computers and
thought, New York: McGraw-Hill, 1963, pp. 279-293.
Thurstone, L. L. Testing intelligence and aptitudes. Hygeia, 1945, 53,
32-36.
Wechsler, D. The measurement and appraisal of adult intelligence, Balti
m ore: Williams and Wilkins, 1958.

- 333-

QUINTA PARTE

DINMICA DO REFORAMENTO

15. MOTIVAO I
16. MOTIVAO II
17. CONTINGNCIAS AVERSIVAS
18. COMPORTAMENTO EMOCIONAL

Captulo 15 MOTIVAO I

A motivao do comportamento geralmente interpretada como o conjunto de


d e t e r m i n a n t e s ou c a u s a s d o c o m p o r t a m e n t o . Ma s d e v e t e r
ficado claro, nos captulos anteriores, que a elaborao das causas do comportamento
o campo de toda a psicologia. Desde os reflexos at a soluo de problemas
complexos, um objetivo unificador da cincia tem sido uma elaborao experimental
das causas ou leis do comportamento. O tpico Motivao , se que devemos
distingui-lo dos procedimentos e processos dos captulos anteriores, deve compreender
as causas de comportamento at aqui negligenciadas, ou deve oferecer fenmenos
novos para anlise. Antes de nos dedicarmos a um tratamento experimental da
motivao, til inserir algumas notas sobre c#usa e efeito na cincia, em geral, e na
psicologia, em particular.
15.1

CAUSA E EFEITO E A NOO DE L E I CIENTFICA

Os termos causa e efeito tm uma. longa histria de uso em todas as


tentativa sistemticas para explicar a natureza tanto filosfica quanto cientfica. Os
termos so parte de nossa linguagem cotidiana para descrever os aspectos de furaces,
revolues, epidemias, assassinatos e acidentes aireos, assim como eventos mais triviais
do dia-a-dia nas relaes humanas. Podemos, aissim, ficar surpresos em descobrir, ao
voltarmo-nos para a literatura cientfica contempornea, a falta evidente desses termos.
Em seu lugar, podemos encontrar referncia apenas a relaes entre variveis,
correlao de eventos c leis relacionando fenmenos. No que o cientista tenha
perdido o interesse nas causas de seus fenmeno^. que, simplesmente, tudo o que ele
encontra aps executar experimentos so rela-es entre eventos ou variveis. Para ele,
descobrir as causas de um fenmeno y equivailente a descobrir quais outras variveis
u, v, w, x, e assim por diante, esto sistematica mente (funcionalmente) relacionadas a
y.
.
Toda a cincia est cheia dc exemplos de relaes funcionais que se propem a
ocupar o lugar de noes mais ordinrias de canisa e efeito. Considere a lei de llookc:
enquanto o limite de elasticidade no excedido, a distenso de um corpo
diretamente proporcional fora nele aplicada- A lei pode ser resumida como a
relao entre duas variveis, Fora -----^ Distenso. A relao seria descrita mais

- 337-

extensivamente por um grfico em que as unidades de fora (a varivel independente)


so representadas em funo das unidades de distenso (a varivel dependente).
Podemos, se desejarmos, considerar a causa de qualquer distenso particular como
sendo a fora particular que atua no corpo. Mas, ao chamar a fora de causa da
distenso, no acrescentamos qualquer informao adicional prpria relao fun
cional. De fato, enquanto a lei descreve a forma exata da relao para inmeras foras
e distenses, a designao de causa limitada proposio lgica - se uma fora, ento
a distenso.
Na relao
Aquecer a gua at 100C gua ferve,
a aplicao de calor pode ser considerada como causa da ebulio. Mas se persistirmos
em perguntar por que a gua ferve quando suficientemente aquecida, estaremos nos
referindo a uma outra relao funcional entre a presso do vapor da gua e a
temperatura. Exatamente a 100, segundo nos dizem, a presso de vapor da a'gua
igual da atmosfera. Isto pode ou no satisfazer nossa curiosidade sobre a ebulio da
gua mas, em qualquer caso, a forma das respostas que obteremos para qualquer
porque a mais ser a mesma - mais relaes funcionais.
As relaes so igualmente importantes para o processo explanatrio na cincia
biolgica. O acasalamento de moscas de fruta, em que macho e fmea tm olhos
brancos, gera invariavelmente filhos de olhos brancos.
Casal de pais de olhos brancos

>

prole de olhos brancos.

Existe uma relao funcional entre a cor dos olhos dos pais e a cor dos olhos dos
filhos.
Todas essas relaes funcionais revelam uma lgica comum. Se considerarmos a
varivel antecedente nessas relaes como x e a conseqente que produzida como y
sua lgica parece ser:
Se x, ento y

e seu corolrio
Se no y, ento no x.

Assim, se uma fora (x) aplicada, ento observaremos distenso (y). Mas, se
nenhuma distenso foi observada (no y), ento a fora no deve ter sido aplicada
(no x). Similarmente, se a temperatura da gua sobe a 100 (x) ento a gua ferve
(y). Alm disso, se a gua no est fervendo (no y), ento a temperatura deve estar
abaixo de 100 (no x). Finalmente, se ambos os pais tm olhos brancos (x) ento
todos os filhos tero olhos brancos (y). Mas, se os filhos no tem olhos brancos (no
y) ento os pais no poderiam ter, ambos, olhos brancos (no x).
No devemos ficar desapontados ao aprender que as leis cientificas do uma
representao exata da natureza somente quando certas condies so alcanadas. As
leis cientficas se mantm num'contexto, algumas vezes amplo, algumas vezes estreito,
dependendo da generalidade da relao particular; mas nenhuma lei cientfica
verdadeira sob todas as condies. Alm do limite de elasticidade, a lei de Hooke falha
e a distenso no mais proporcional fora aplicada. A menos que certas variveis
tais como a presso atmosfrica e a pureza da gua sejam mantidas constantes, a gua

- 338-

nao ferve a 100 A irradiao da mosca de fruta complica as relaes de heredita


riedade.
Nas leis descritas, os termos x ey das relaes funcionais so conceitos baseados
em quantidades observveis. A intimidade pela qual tais conceitos esto ligados a
observveis a razo porque tais leis so chamadas empricas. Podemos observar t
medir eventos que so conceituados como foras e distenses de corpos, temperatura e
estados da gua, reproduo sexual e cor dos olhos das moscas de frutas. Os tipos de
explicao proporcionados por leis empricas devem ser contrastados com explicaes
pr-cientficas. Antes da descoberta das leis que relacionam a atividade de micro
organismos doena, esta era frequentemente atribuda demnios alojados no corpo.
Por muito tempo, acreditou-se que o comportamento animal e humano era devido s
almas e espritos animais. Nessas explicaes pr-cientficas a doena e o compor
tamento eram relacionados a eventos hipotticos (demnios e almas), que eram livres
para assumir quase toda propriedade que o teorista lhes desejava impor. A falta de
restries sobre a natureza hipottica desses conceitos tornou possvel que eles, em
princpio, explicassem tudo. Mesmo assim, sua imunidade no-confirmao por
qualquer procedimento colocou-os na posio paradoxal de, na verdade, nada ex
plicarem.
Em contraste com o vazio de tais explicaes fictcias, a relao funcional da
cincia possui habilidades poderosas para a predio, interpretao e controle da
natureza. Quando existe uma lei funcional entre x e y , se soubermos o valor de x
podemos predizer o valor de y. Tendo a lei mo, sempre que suspeitarmos que x e y
esto agindo no mundo cotidiano, estamos em condies de interpretar eventos reais
fora do laboratrio. Finalmente, se pudermos manipular x como desejarmos, ento
temos os meios de controlar y
como desejarmos. No modelo da relao funcional,
temos o poder e a versatilidade do empreendimento cientfico revelados de um modo
surpreendente.
15.2

CAUSAS FICTCIAS DO COMPORTAMENTO

Quando examinamos as causas tradicionais do comportamento notamos que trs


classes principais de causas fictcias dominaram o campo.
Numa delas, o comportamento explicado por referncia a eventos observveis
que so fortuitamente correlacionados com ele, tal como a posio dos planetas no
nascimento, a direo das linhas na palma da mo, a proeminncia relativa de vrias
protuberncias no crnio. Embora tanto o comportamento quanto o agente causai
sejam observveis, qualquer relao entre eles no sistemtica e, assim, qualifica-se
como acidental em vez de regular .
Na segunda, o comportamento frequentemente atribudo a eventos supostamente
localizados no sistema nervoso central (crebro e medula). Quando dizemos que um
homem esperto porque tem crebro , que no pode trabalhar porque seus nervos
esto esgotados, ou que precisa fazer um exame da cabea quando age estranhamente,
estamos invocando eventos causais aparentemente localizados dentro da estrutura
nervosa. Na prtica, todavia, raramente se faz a observao real desses eventos. Nestes
exemplos, o sistema nervoso existe apenas como um repositrio para explicaes
fictcias do comportamento. As propriedades das causas hipotticas so especificadas
apenas a grosso modo e nenhuma relao especfica observada ou teorizada entre
elas e o comportamento observado.

- 339 -

Na terceira, o comportamento comumentc explicado por processos mentais


ii*ternos hipotticos. Diz-se que fechamos uma porta porque a queremos fechada,
que assobiamos uma melodia porque temos um mpeto para assobiar, lemos um
livro porque sentimos vontade de l-lo. Pelo fato de tais proposies parecerem to
naturais e inofensivas, difcil notarmos que elas implicam numa forma de causa e
efeito que difere marcaritemente das leis da seo 15-1. Contudo, em cada vontade ,
mpeto ou sentimento interno no observvel est sutilmente designado o status
de uma causa de algum comportamento. Aqui, novamente, estas causas no possuem
quaisquer propriedades independentes que possam ser relacionadas ou pela teoria ou
pela observao, ao comportamento real a ser explicado. O mpeto e a vontade
so fictcios porque so inferidos inteiramente do comportamento que se propem a
explicar.
O surgimento de uma psicologia cientfica , em grande parte, uma mudana de
causas fictcias do comportamento para causas funcionais. Basta que examinemos os
vrios procedimentos e processos dos captulos anteriores para encontrar vrias dessas
relaes funcionais. Como um preldio para a anlise dos fenmenos de motivao,
ser til faz.cr uma reviso desses paradigmas comportamentais familiares dc modo a
enfatizar como seus procedimentos constituem uma classe importante dc causas com
portamentais.
15.3

HISTRIA PASSADA COM CONTINGNCIAS DE CONDICIONAMENTO E


EXTINO COMO CAUSA DO COMPORTAMENTO

Na medida em que uma histria passada com os vrios paradigmas de condicio


namento operante uma maneira eficaz dc modificar o comportamento de um
organismo, uma histria particular deve ser considerada uma causa genuna do com
portamento. Assim, o reforamento anterior pode causar o aparecimento de uma
cadeia comportamental e o declnio de outro comportamento na situao. Ao con
trrio, o no-reforamento (extino) do comportamento pode levar ausncia ou
baixa probabilidade de algum comportamento. Combiirmdo os procedimentos de
extino c condicionamento, passamos para causas mais complexas. O controle exer
cido sobre o comportamento por S^s pode ser compreendido apenas com referncia a
uma histria passada de treino operante discriminativo. O surgimento de uma nova
forma de comportamento pode, quase sempre, ser explicada apenas pelas condies
especiais de reforamento estabelecidas por aproximaes sucessivas. Certos padres
temporais caractersticos da resposta requerem uma histrica passada especfica com
um esquema de reforamento intermitente.
As causas do, ou aquilo que controla o comportamento, nesses exemplos,
encontram-se na maneira em que o comportamento esteve relacionado ao reforamen
to, no passado. Como as causas da distenso de uma mola, ebulio da gua e cor dos
olhos da mosca, essas causas so melhor descritas sob a forma dc relaes funcionais.
Aqui, as relaes so entre um determinado grupo de contingncias, aplicadas anterior
mente, e o aparecimento de mudanas comportamentais. As mudanas de compor
tamento que esto associadas a essas histrias passadas ocorrem, caracteristicamente, no
tempo. Logo, as curvas que chamamos de processos comportamentais so as descries
fundame itais dessas leis.
Uma idia prevalentc em todas essas causas c a noo de que certos efeitos
- 340 -

comp ort amen tais so condicionais a uma certa histria de condicionamento e extino.
Alguns casos gerais esto resumidos na Tabela 15-1, dc modo a incluir os paradigmas
operantes dos captulos anteriores. Note que cada caso pode ser reduzido a uma
combinao de apenas dois ingredientes: condicionamento e extino. A variedade de
comportamentos que podem ser adquiridos e mantidos atravs dessas operaes, e a
complexidade dos controles ambientais sobre o comportamento que a sua correlac
com estmulos pode induzir, atestam a potncia notvel dessas duas operaes opostas.
Tabela 15-1
ALGUMAS CAUSAS DO COMPORTAMENTO QUE SE ENCONTRAM NA HIS
TRIA DE REFORAMENTO DO ORGANISMO
CAUSA

SIMBOLICAMENTE

EFEITO

1. Uma resposta tem uma


histria de ser seguida por
/eforamento

Fora alta de R

2. Uma resposta tem uma


historia de extino

R+>

Fora baixa de R

SD
R - ,

3. Uma histria passada


com o procedimento de
discriminao

SD controla a ocorrncia de
R, e toma-se um reforador

S*
R -h

R x-b
R ^ S + Ry -/->
4. O comportamento (R^) r 2->
R2-b
r 2- 5 +
deve sua existncia a uma
Uma nova unidade de com
histria prvia de reforportamento adicionada ao
R.,
s+
mento de seus ancestrais
repertrio
Ln*
relacionados
(Estgios sucessivos no tem
po -* )

5. Uma histria passada


com uma contingncia probabilistica particular

'

Um padro caracterstico
de respostas no tempo

- 341 -

15.4

MOTIVOS E REFORADORES

Apesar de todo o seu poder, os procedimentos da Tabela 15-1 so inteis a menos


que as conseqncias ambientais que eles proporcionam ao comportamento sejam do
tipo especial que denominamos reforadores. Nas discusses anteriores, tomamos como
seguro o poder reforador de eventos tais como alimento e gua, adiando at agora
uma anlise das variveis que modulam suas propriedades reforadoras. a elaborao
dessas variveis que constitui o campo da motivao.
Podemos questionar, de incio, o que essa definio de motivao tem em comum
com as concepes mais clssicas de motivao como o estudo de necessidades,
vontades, aspiraes, interesses, desejos, impulsos e outras energias ou motivos do
comportamento. Para o presente, notaremos apenas que estas necessidades e desejos e
outros motivos parecem estar intimamente relacionados ao conceito de reforadores.
Quarido se diz que um organismo necessita de alimento ou gua, a inferncia de
necessidade usualmente feita a partir da observao de que provvel que um
organismo, que tenha estado sem alimento ou gua por um perodo, coma e beba.
Diz-se que uma pessoa deseja beber se ela pede gua ou que, de outra forma, se
empenha num comportamento que tenha anteriormente produzido gua. As necessi
dades e desejos referem-se ao fato de que, devido a um periodo de sua ausncia,
alimento e gua tornaram-se reforadores.
Fazemos uma restrio nossa anlise experimental de motivao identificando
como seu domnio a anlise dos reforadores primrios apenas. A restrio serve para
excluir aqueles reforadores cujo poder reforador depende de uma histria passada de
condicionamento, em particular, do paradigma de discriminao No linguajar comum,
naturalmente, os motivos no so sutilmente distinguidos na base de se eles se referem
a reforadores primrios ou secundrios. De fato, um motivo pode referir-se a quase
todos os porqus do comportamento. Uma necessidade de superar os outros, um
desejo dc ateno e um desejo de possuir um automvel caro ou status social podem
todos qualificar-se como motivos legtimos. No obstante o linguajar comum, as leis
que governam tais motivos so aquelas que governam os reforadores adquiridos.
Consequentemente, tais motivos adquiridos so mais apropriadamente tratados como
fenmenos de condicionamento. O dinheiro, um bom exemplo de um tal motivo,
satisfatoriamente descrito como um reforador positivo generalizado adquirido. Sua
significncia reforadora depende de sua histria ou paradigma de discriminao onde
sua presena estabeleceu a ocasio para Rs que, eventualmente, produziam refor
adores primrios. Ateno; necessidade de poder, afiliao, realizao; competio e
muitos outros motivos sociais parecem se adequar ao paradigma de reforamento
secundrio descrito no Captulo 11. Logo, teremos poucas novidades para adicionar a
sua anlise neste captulo.
O problema dc como estudar os motivos adquiridos foi solucionado no Captulo
1 1 , atravs da formulao de um conjunto de princpios para converter qualquer
situao de estmulo arbitrria num reforador condicionado. Ao estudar os re
foradores primrios, preocupar-nos-emos com a elaborao de um nmero de variveis
que se mostram intimamente relacionadas ao aumento e diminuio no valor de tais
reforadores. Como uma ajuda para ampliar o conceito de reforamento primrio do
estudante, apresentaremos, nas discusses que se seguem, uma variedade de re
foradores primrios diferentes.

- 342 -

15.5

OPERAES DE IMPULSO

Uma operao fundamental que afeta o poder ou valor reforador de todos os


reforadores primrios positivos conhecidos o procedimento de privar o organismo
do reforador por um perodo de tempo. Numa primeira aproximao, digamos que o
valor reforador de um reforador aumenta diretamente medida que aumenta a
durao da privao.
Nas discusses anteriores sobre os efeitos do condicionamento (Pavloviano e
operante) partimos do princpio que as variveis de privao foram reguladas para dar
um valor reforador moderado aos estmulos usados como reforadores. Embora
trabalhando por trs do cenrio at agora, as variveis de privao tm, de fato, um
papel central em tomar possveis os processos comportamentais que estudamos. A
existncia deste novo grupo de variveis, do qual o comportamento depende to
criticamente, tem duas implicaes para anlise comportamental que nopodemos ignorar.
(1) O comportamento multi-determinado. Um cavalo pode no beber a gua que lhe
apresentada porque no foi privado de gua, ou porque nunca adquiriu o compor
tamento de beber gua no cocho. Mas, se ele bebe, ento deve ser porque possui o
comportamento necessrio e est privado de gua. Nem privao, nem o con
dicionamento passado apenas, sero suficientes para causar padres de comportamento.
(2) Uma operao de privao aumenta o valor reforador de uma classe de
estmulos dos quais muitas cadeias de comportamento podem depender. Quando
privamos um homem de alimento, aumentamos a probabilidade de que ele coma. Mas
aumentamos tambm a probabilidade de que ele pea alimento, caminhe para uma
certa rua onde. h um restaurante, entre num mercado e assim por diante. Nas
explicaes tradicionais de motivao este aumento concomitante na fora de muitos
comportamentos a base para se considerar a privao como uma forma de dirigir,
impulsionar o organismo para o reforador. Contudo, usado deste modo, o conceito
de impulso tem pouco mais que um valor metafrico. Se o organismo no adquiriu
o comportamento que o levar ao reforador, a privao por si prpria no resultar
em reforamentos.
E conveniente despir o termo impulso de suas conotaes comuns e dar-lhe uma
redefinio tcnica que enfatize a habilidade de certas operaes em estabelecer
reforadores. A palavra impulso usada para indicar que, como um resultado de
alguma operao efetuada no organismo (por exemplo, privao), algum S torna-se um
reforador, S+. Assim definido, impulso uma palavra como reflexo, significando uma
certa relao entre variveis. Se concordarmos em empregar a palavra apenas neste
sentido tcnico, devemos ter cuidado e evitar dizer que um organismo respondeu por
causa de um impulso. Sendo uma relao entre alguma operao e o comportamento,
um impulso no pode causar qualquer comportamento.
Pode-se efetuar operaes apropriadas de privao para cada reforador primrio.
A observao casual sugere, e experimentos confirmam, que muitas outras operaes
tm efeitos semelhantes privao de reforadores. Exerccio forado, diminuio da
temperatura da sala, injeo de insulina, leses cirrgicas numa regio localizada do
crebro, estimulao de alguma regio do crebro; administrao de certas drogas,
oferecimento de aperitivos, introduo de um animal que est comendo junto ao
primeiro todos podem tornar o alimento um reforador e, assim, so operaes de
impulso.
- 343-

Assim como existem vrias operaes para estabelecer e aumentar o valor dos
reforadores, tambm h operaes de impulso para reduzir ou eliminar o valor do
reforador. Podemos cham-las de operaes de reduo do reforador. A mais univer
sal delas a saciao - apresentao repetida do reforador at que ele perca o seu
poder de reforar. Certas drogas, a injeo de sangue de animais saciados, eventos que
produzem emoo, leses numa parte localizada do crebro e estimulao numa
determinada regio do crebro, reduzem o valor reforador do alimento.
Cada reforador primrio tem suas prprias operaes particulares de estabele
cimento e reduo do reforador. O paradigma [15.1| esquematiza algumas operaes
que tornam a gua um reforador.
Privar de todos os lquidos
Forar a excreo
Injetar atropina Alimentar com sal
Obstruir os dulos salivares
Estimular o crebi o em certa regio

[15.1]

H uma forte tendncia para se dizer que essas operaes de impulso tornam o
organismo sedento e, portanto, ele bebe. Mas a sede um agente causai dbio.
Tudo o que vemos que um nmero de operaes tem um efeito similar tornam a
gua um reforador. Como conceitos explicativos, o termo sede e seu correlativo
fome dificilmente so sustentveis, simplesmente porque eles no apontam qualquer
relao emprica ou terica entre o comportamento e outros eventos observados ou
especificados. Mesmo como termos descritivos, eles podem prender em armadilhas o
descuidado. Quando dizemos que um homem est sedent quando o vemos beber,
ou faminto quando o vemos comer, estamos inferindo que gua e alimento tor
naram-se reforadores por alguma operao de privao. Mas, de fato, as pessoas
comem e bebem por muitas razes. Elas podem encontrar varias presses sociais para
assim o fazer, podem faz-lo para reduzir a ansidade, ou podem faz-lo tal como uma
criana que bebe seu leite ou come seu espinafre para chegar a reforadores como a
sobremesa.
15.6 PERIODICIDADES NO VALOR DO REFORAMENTO
Considere a seguinte lista alfabtica de alguns dos mais conhecidos
reforadores primrios para sujeitos humanos e certos animais superiores
gua
Alimento
Amor,e Afeio
Ar

Atividade
Atividades maternas
Calor
Novidade

Sexo
Sono

O estudo experimental dos reforadores primrios comea com


o de que todos os itens desta lista, algumas vezes, so reforadores e
Essa variabilidade facilmente vista num reforador como o alimento,
reforador passa por ciclos medidos em horas; menos facilmente vista
-3 4 4 -

a observa
outras no.
cujo valor
no ar, cuja

periodicidade so ciclos pequenos de respirao dos animais, medidos em segundos ou


menos. Todavia, o fato geral claro algumas vezes, alimento, gua, ar, sexo e assim
por diante so reforadores, outras no o so. A anlise experimental da motivao
uma tentativa sistemtica de relacionar essa variabilidade a variveis observveis no
ambiente presente ou passado do organismo. Em resumo, pesquisamos as leis
comportamentais da motivao.
A determinao da natureza cclica dos reforadores primrios o primeiro passo
em tal anlise. Nem os homens, nem os animais comem continuamente. Quando
provido com um estoque inesgotvel de alimento, q rato normal come periodicamente.
A natureza cclica do comer vista na Fig 15.1 . Cada resposta de presso barra

Figura 15.1. Comportamento cclico de alimentao apresentado pelo rato (Anliker e


Mayer, 1956)

emitida pelo rato produz uma pequena pelota de alimento e uma contingncia de
reforamento contnuo mantida permanentemente em efeito. Pode-se observar na
Fig. 15.1 que uma refeio inicia-se com uma taxa de presso constante, mantida
entre 3-5 horas (portanto, comendo). Da em diante, a taxa de presso-comer declina,
terminando usualmente numa completa cessao de presso-comer por umas 6 horas.
Deixando-o beber gua quando preferir, o rato produz ciclos caractersticos de
beber e no beber, como indicam as curvas cumulativas do beber da Fig. 15-2. H
relativamente poucas respostas de beber entre as 6 e as 18 horas, isto , durante o dia
O beber, ento, aumenta gradualmente e, em geral, atinge o seu mximo por volta de
meia-noite.

- 345-

ligura 15.2. Curvas cumulativas do beber para quatro ratos. O grfico mostra
perodos de beber e no beber gua destilada que estava constantemente disponvel
(Young e Richey, 1952).

O sono humano caracterizado por periodicidades que mudam nas vrias idades.
A Fig. 15-3 mostra graficamente como os ciclos mudam medida queosujeito
humano envelhece. O ciclo muda tanto seu perodo (nmero de sonecas por dia)
como sua fase (quando a primeira soneca comea) com a idade.
15.7 PARADIGMAS DE PRIVAO E SACIAO
A descoberta de uma perioricidade regular no valor reforador representa apenas o
incio de uma anlise experimental da motivao. Um progiesso maior alcanado
quando se obtm o controle direto dos ciclos. A operao de privao fortemente
identificada com motivao porque a supresso de reforadores primrios um
mtodo universal para variar o valor reforador de todos os reforadores primrios
conhecidos. Quando privamos um organismo de uma classe de reforadores primrios
por um perodo fixo de tempo e, ento, permitimos o acesso ao reforador, podemos
observar o efeito que a nossa operao de privao tem sobre o comportamento. No
caso de alimento e gua, o comportamento real de consumir o reforador quase
sempre de interesse.Depois de um perodo de privao, um animal come e bebe uma certa
quantidade de alimento e gua e, ento pra. Dizemos, assim, que o animal est
saciado. A descrio comportamental desse processo de saciao assume,

- 346-

Um ano

Quatro auos

Dez anos

Adulto

18

meia-noite

I
meio-dia

I
18

Figura 15.3. Ciclos de sono em idades diterentes (Kleitman, 1963).

convenientemente, a forma da mudana na taxa de uma resposta que produz alimento


ou gua em contingncias de crf. Uma vez que cada resposta reforada, a taxa de
comer indicada pela taxa de emisso dessa resposta.
As curvas de saciao de alimento no tm todas a mesma forma, mas a forma
mais comum parece ser a de uma taxa constante de comer seguida por uma cessao
um tanto abrupta (Smith e Smith, 1939 ; Reese e Hogenson, 1962). Na Fig. 15-4, so
vistas vrias curvas de saciao da resposta de bicar uma chave de um pombo,
reforada com alimento. As curvas foram obtidas depois de vrios perodos de
privao de alimento, como indicado.
Por apresentarem uma diminuio na taxa, as curvas de saciao podem ter uma
semelhana superficial com as curvas de extino. A forma de uma curva de saciao
, todavia, caracterizada por uma cessao muito mais abrupta da taxa (ver Fig. 15-4).
Alm disso, se a cadeia de comportamento adquirido examinada com ateno,
notar-se- que ela permanece intacta medida que o processo prossegue. O processc
de extino, por outro lado, est associado com uma desintegrao marcante da cadeia
de comportamento.
O paradigma da saciao pode ser esquematizado como se segue:
DADOS: 1 - Privao de um reforador primrio (ou alguma outra operao
apropriada para estabelecer o reforador).
2 Um comportamento apropriado, previamente fortalecido por este
reforador.
PROCEDIMENTO: R -> S +
PROCESSO: Uma taxa razoavelmente constante de R, seguida por uma cessao
abrupta.
RESULTADO: Cessao da taxa de R.

-3 4 7 -

Figura 15.4. Curvas individuais de saciao de alimento. As curvas esto assinaladas


com o nmero de horas de privao anterior de alimento. Um trao oblquo acima
de cada curva indica que o animal no comia aps a resposta de bicar (Reese e
Hogenson. 1962).

Note que, em geral, o resultado tambm difere do resultado da extino.


Enquanto a extino volta o comportamento ao nvel operante, a saciao volta-o a
um nvel prximo de zero que pode ser inferior ao nvel operante. Saciados de todos
os outros reforadores, os organismos frequentemente vo dormir.
15.8 A MENSURAO DOS IMPULSOS
Frequentemente, referimo-nos ao fato de que um indivduo est mais fortemente
motivado algumas vezes do que outras e, de fato, inferimos um continuum de fora
motivacional. Podemos traduzir essa proposio numa equivalente relativa a um
continuum de fora do impulso. A noo de que um impulso pode variar em fora, de
- 348-

um valor muito baixo a um valor muito alto, parece referir-se, principalmente


observao de que os reforadores primrios podem variar suas foras de valores muito
baixos a muito altos. Assim dizemos que uma pessoa est fortemente motivada para
alimento quando o alimento um reforador forte para o comportamento
instrumental daquela pessoa. Similarmente, uma pessoa que est altamente motivada
para o sexo empenha-se frequentemente em comportamento que produz reforadores
sexuais. Note que, nestes exemplos, apesar de falarmos em termos dc uma alta fora
de motivao, tudo o que realmente observamos a capacidade de um conjunto
particular de reforadores primrios fortalecer e manter o comportamento. Na medida
em que se puder demonstrar que essa capacidade varia de baixa a alta, dependendo das
circunstncias, podemos indicar o seu valor por uma varivel que chamamo, dc valor
reforador primrio dos estmulos.
Como podemos medir o valor reforador dos estmulos? Parece que no h uma
maneira de med-lo, salvo pela medida dos efeitos comportamentais dos estmulos
quando eles so contingentes a respostas operantes. Assim, muitas das medidas
comportamentais familiares citadas nos captulos anteriores, tais como a taxa de
resposta e resistncia extino, sero teis para avaliar a fora da motivao. Segue-se
uma curiosa implicao dessa versatilidade. O comportamento que o experimentador
escolhe para medir no pode, sozinho e em si mesmo, determinar que fenmeno est
sob estudo. A presso barra, bicar uma chave e a vocalizao estou com fome
tm significado somente quando esto associados a outros eventos. Em termos mais
gerais, esta a razo porque a prpria disciplina da psicologia no pode ser definida s
como o estudo do comportamento. Ela considerada mais adequadamente como o
estudo do comportamento na medida em que este se relaciona com o ambiente. Em
captulos anteriores, as taxas de respostas de operantes representativos foram usadas
fre q u e n te m e n te para estudar o condicionamento, extino, discriminao,
encadeamento e outros fenmenos, dependendo do procedimento particular imposto
ao organismo quando o comportamento estava sendo medido. Agora, descobrimos um
outro emprego para as medidas operantes. Quando os parmetros de condicionamento
so mantidos constantes e o comportamento est relacionado a operaes de impulso,
as propriedades do comportamento que est sendo emitido podem servir como uma
medida do valor reforador relativo (ou fpra) de reforadores primrios. Note bem
como essa estratgia experimental contrria quela utilizada em captulos anteriores,
onde as operaes de impulso eram sempre mantidas constantes e as contingncias
de reforamento eram manipuladas. Empregando aquela metodologia a taxa de
comportamento era tomada geralmente para representar a fora do comportamento.
Na metodologia da motivao, a taxa de comportamento ser frequentemente tomadc
para representar a fora do reforador. Evidentemente, o significado dc
comportamento derivado apenas pela considerao da varivel ou variveis s quais c
comportamento est sendo relacionado. Discutiremos abaixo algumas tcnicas
comportamentais que tm sido usadas para medir o valor reforador primrio dos
estmulos e, assim, por inferncia, a motivao. Ao mesmo tempo, ilustraremos uma
variedade de respostas e reforadores primrios diferentes.
1. Resistncia saciao

Nossa intuio nos diz que quanto mais sedentos estivermos, mais gua

- 349-

poderemos consumir c que quanto mais famintos estivermos, mais alimento


poderemos comer. Como podemos quantificar essas impresses?
Uma forma
examinar as propriedades do processo de saciao em relao durao de tempo em
que se tenha impedido a um indivduo o acesso a todos os reforadores de uma certa
classe. Com efeito, examinamos curvas de saciao obtidas a vrios graus de privao.
Suponha que, depois de um perodo de privao, estabeleamos uma contingncia de
modo que alguma cadeia arbitrria de comportamento possa produzir o reforamento.
Ento, ou o tempo que o organismo leva para alcanar algum critrio arbitrrio de
taxa baixa ou o nmero de respostas reforadas emitidas antes de ser atingido o
critrio de taxa baixa, proporcionariam uma medida da resistncia saciao.
evidente que, se contingncias de crf esto em efeito e se a quantidade de
reforamento mantida constante, a ltima medida seria equivalente quantidade de
substncia consumida. A resistncia saciao calculada de modo anlogo
resistncia, extino (seo 5.5). Usando o me'todo de resistncia saciao, Siege
(1947) mediu a quantidade de gua bebida pelos ratos num perodo de 5 minutos em
funo de quanto tempo os animais haviam sido privados de gua. A reiao obtida
vista na Fig. 15-5. De 0 at 48 horas de privao, a resistncia saciao, medida pela
quantidade de gua consumida, aumentou. A taxa de aumento, todavia, parece
diminuir depois de 12 horas. Resultados similares podem ser obtidos para privao de
alimento. Com perodos muito grandes de privao, todavia, a quantidade de alimento
ingerido declinar, presumivelmente como um resultado da contrao do estmago e
inanio. Dentro de certos limites, entretanto, a resistncia saciao aumenta
medida que o tempo de privao aumenta.
A resistncia saciao, embora uma tcnica til, no sempre inteiramente
satisfatria para medir o valor reforador. Uma dificuldade encontra-se nas
complicaes fisiolgicas que ocorrem com longos perodos de privao, causando,

N m ero de h o ras de privao de gua

Figura 15-5. Quantidade de gua ingerida por ratos num pen'odo teste de 5 minutos
m funo do nmero de horas em que no tiveram acesso a qualquer lquido
(segundo Siegel, 1947).

-3 5 0 -

algumas vezes, um consumo reduzido. Outra dificuldade surge se desejarmos saber


quo forte o reforador em vrios pontos do processo de saciao. Em qualquer
nvel de privao, um organismo pode comer ou beber numa taxa constante e alta at
que o processo chegue a uma cessao abrupta (Fig. 15-4). Logo, difcil avaliar a
fora momentnea do reforador atravs da inspeo do processo dc saciao. As
curvas de saciao tendem a diferir principalmente nos seus pontos terminais, c no
nas suas inclinaes (Fig. 15-4). Ento, somos forados a esperar at que a saciao
seja alcanada para sabermos quo faminto ou sedento o animal estava no incio.
2. Taxa de respostas reforadas intermitentemente.

Uma tcnica em geral mais conveniente para medir o valor reforador observar a
taxa de resposta apresentada por um organismo quando o comportamento est sendo
intermitentemente reforado. Um esquema de intervalo, por exemplo, pode ser
programado para fornecer uma taxa de reforamento bastante baixa, de modo que o
comportamento possa ser mantido sem a ocorrncia de saciao por um longo perodo
de tempo. Skinner (1938) usou essa tcnica para avaliar os efeitos comportamentais de
quantidades especificadas de alimento dadas aos ratos, antes do teste. Primeiro, os
ratos foram privados de alimento por 23 horas e, ento, durante vrios dias, foram
alimentados com quantidades diferentes de alimento logo antes do teste com as
contingncias de intervalo. Os resultados para um desses ratos aparecem na Fig. 15-6.
Os nmeros associados a cada curva referem-se quantidade de alimento, em gramas,
dado ao rato previamente. evidente que, quanto mais o rato se alimentava
imediatamente antes do trabalho, menor era a taxa de resposta no esquema.
F. C. Clark (1958) estudou os efeitos de vrios graus de privao de alimento
sobre as taxas de respostas estabilizadas , em intervalo varivel (IV), em ratos.

Figura 15-6. Quatro registros dirios de um rato sob contingncias de intervalo,


privado por 23 horas, e alimentado com diferentes quantidades de alimento
imediatamente antes do teste (Skinner, 1938).

- 351 -

Vrios IVs diferentes foram usados. Clark obteve as curvas da Fig. 15-7 quando
representou a taxa de respostn dos ratos em funo das horas de privao. O efeito do
aumento de privao foi o dc aumentar a taxa de resposta sob todos os esquemas de
IV. A maneira pela qual a privao e os esquemas de reforamento interagem para
determinar as taxas de resposta da Fig. 15-7 de algum interesse. A similaridade na
forma das curvas da Fig. 15-7 significa que a privao interagiu com o esquema IV de
modo que, cm todos os nveis de privao, a razo entre a taxa num IV c a taxa no
outro IV era uma constante. Por exemplo, com 5 horas de privao, a taxa em V-3
era cerca de 4 R/min. e em IV-1 era 2,5 vezes isto, cerca de 10 R/min. Quando a
privao foi aumentada para 20 horas, as duas taxas eram aproximadamente 6 e 15
respectivamente, de modo que a taxa em IV 1 era ainda 2,5 vezes maior do que a
taxa em IV-3.
No experimento de Clark, o intervalo mximo de privao foi de 23 horas. Heron
e Skinner (1937) pesquisaram sobre a privao alimentar prolongada, em ratos, que se
estendia at a morte do animal. Eles descobriram que a taxa de resposta reforada
com alimento em IF aumentava progressivamente durante o perodo de inanio at
atingir um mximo, depois do que declinava rapidamente e logo se seguia a morte
como resultado da inanio. A taxa mxima no ocorreu no mesmo ponto para todos
os ratos. No experimento de Heron e Skinner, ela ocorreu entre 4 e 12 dias. O
resultado apoia as teorias que equiparam a motivao a um deficit corporal

T em po de privao (h o ras)

Figura 15-7. Taxa mdia de resposta em IV em funo do tempo de privao. O


parmetro o IV mdio (Clark, 1958).

- 352-

(necessidade ). Embora o deticil alimentar do rato continue a aumentar atravs da


privao, parece que o valor reforador do alimento no aumenta. Veremos mais tarde
quais outras medidas comportamentais substanciam essa concluso.
3.Resistncia extino.
A taxa dc resposta durante a extino e outras medidas de resistncia extino
(seo 5.5) tm sido usadas, com freqncia, para medir os efeitos comportamentais da
nrivao e outras operaes similares. Crocetti (1962) treinou ratos com 7 horas de
privao de alimento a pressionar uma barra, reforando-os com alimento. Os sujeitos
foram, ento, distribudos em cinco grupos e cada grupo foi extinto depois de uma
durao diferente de privao. Na Fig. 15-8, visto o nmero total de respostas
emitidas por cada grupo, depois de 3 horas de extino. A curva mostra o aumento
usual na taxa de resposta medida que o tempo de provao aumenta. Mas observe
que a forma dessa curva difere daquelas da Fig. 15-7. Diferenas como essas levantam
o problema sistemtico de qual ndice comportamental representa melhor o valor do
reforador. No presente, no h uma soluo definida para esse problema e os teoristas
so frequentemente forados a adotar a posio de que as medidas que se
correlacionam melhor entre si representam melhor a fora do reforamento.

H oras d e Privao

I igura 15-8. A relao entre horas de privao e o nmero de respostas dc presso


barra durante a extino (segundo Crocetti. 19 ^ A

4. Aquisio

Poderamos esperar que, com um aumento no poder do reforador, houvesse


um aumento concomitante na velocidade do processo de aquisio. Quando a aquisio
envolve uma longa cadeia de respostas (por exemplo, o comportamento de percorrer
uma pista) ou uma discriminao, essa predio verificada. Broadhurst (1957)
treinou ratos a percorrerem, submersos, um labirinto equivalente ao labirinto cm Y. Os
ratos eram submersos na caixa de partida, a ficando por alguns segundos
permitindo-se, ento, que nadassem debaixo dagua at ao ponto de escolha. L.

- 353-

era-lhes apresentada uma discriminao luz-escuro, com contingncias do tipo discutido


em relao ao aparelho de saltar de Lashley (seo 10.3). Se, no ponto de escolha, o
rato nadasse para o lado claro, encontrava uma porta aberta que permitiria o acesso
para um lugar seco. Se, todavia, nadasse para o lado incorreto, encontrava uma porta
trancada e tinha de nadar de volta para o ponto de escolha e, ento, dirigir-se para o
outro brao do Y para sair. Todo o procedimento foi efetuado debaixo dgua. O
procedimento , esquematicamente,

onde Sa = na caixa de partida, porta fechada


Sb = na caixa de partida, porta aberta
Rg =nacjar para 0 ponto de escolha
$D = H O
RD = virar
direita
Se = ~IB
RE virar
esquerda.
S+ = lugar seco
onde Tx a varivel independente, a privao de ar por Tx segundos. Broadhurst
variou tambm a diferena de intensidade entre as duas partes do estmulo visual do
ponto de escolha. Quanto maior essa diferena, mais fcil a tarefa discriminativa (Frick,
1948). Logo, uma grande diferena de iluminao corresponde a uma discriminao
fcil; uma diferena pequena corresponde a uma discriminao difcil .

Figura 15-9. Nmero de escolhas discriminativas corretas em 100 tentativas de


aquisio em funo da privao anterior de ar. Os dados so de tres discriminaes
que variam em dificuldade (segundo Broadhurst, 1957).

- 354 -

Os resultados da aquisio so apresentados na Fig. 15-9. E visto o nmero de


escolhas corretas em 100 tentativas de aquisio das duas discriminaes. Para a
diferena grande de iluminao (discriminao fcil), podemos resumir os resultados
dizendo que, quanto maior o tempo de privao de ar, mais eficiente era o
desempenho de aquisio. Mas quando uma pequena diferena de iluminao era usada
(discriminao difcil), a aquisio era mais eficiente num valor mdio (2 seg.) de
privao de ar e menos eficiente com privaes maiores e menores. Se esse resultado
puder ser generalizado, parece que com tarefas difceis possvel ter-se muito mais
motivao para um desempenho timo. Certamente, as diferenas na forma entre as
duas curvas da Fig. 15-9 indicam que o mtodo de aquisio deve ser usado
cauteiosamente como uma medida da fora do reforador. Por exemplo, um resultado
bem diferente foi obtido numa situao que requeria o nadar debaixo dagua, em linha
reta, sem contingncias discriminativas. Ento, numa faixa de privao anterior de ar
de 0 a 10 seg, os ratos nadavam tanto mais rpido quanto maior a privao anterior de
ar.
5. Superar obstculos.
Quanto mais reforador um estmulo, de se esperar que um organismo supere
mais obstculos, impedimentos e barreiras para produzir o reforador. Esta a razo
da Caixa de Obstculo de Colmbia vista na Fig. 15-10. Um rato colocado na caixa
de partida e uma grade eletricamente carregada interposta entre ele e o alimento,
gua ou um companheiro localizado na caixa objetivo (o rato foi previamente treinado
a correr para a caixa objetivo sem receber qualquer choque eltrico). Se o rato
atravessa a grade, ele tem um breve acesso ao reforador e , ento, recolocado na
caixa de partida para outra tentativa. O nmero de vezes que ele atravessa a grade
eletrificada em 30 minutos fornece uma medida da fora do comportamento. Warden
(1931) pesquisou sobre vrios reforadores primrios e procedimentos de privao com
este aparelho. Ele acreditava que esta era uma maneira de comparar objetivamente as
foras mximas de vrios reforadores primrios. Um grupo interessante das funes de
Warden aparece na Fig. 15-11.

Figura 15-10. A caixa de Obstculo de Columbia. H uma grade eletrificada (B) entre
o compartimento do rato (A) e um reforador colocado na caixa objetivo (C)
( segundo Warden, 1931, de Harlow, 1948 ).

- 355-

Atravs dessas funes, vemos que se as operaes so efetuadas por bastante tempo, o
comportamento que produz o reforador chega a uma fora mxima e, ento, declina.
Warden sups que as alturas relativas dos mximos poderiam ser interpretadas como
significando que impulsos para gua e alimento so mais fortes do que o impulso
para sexo. Mas, esta concluso justificvel? Devemos nos lembrar de que as funes
comportamentais dependem de muitas variveis alm daquela particular que o experi-

Dias d e privao

Figura 15-11. Nmero de travessias de uma grade eletrificada em funo dos dias de
privao do reforador primrio apropriado (segundo Warden, 1931).

mentador est pesquisando. O valor reforador, em particular, depende de fatores tais


como a qualidade e quantidade de reforamento. A concluso de Warden suponha que,
de algum modo, esses fatores haviam sido equacionados para sexo, alimento e gua, de
maneira que a privao era a nica varivel na situao. Mas at que ponto, alm do
mais trivial, pode-se afirmar que (digamos) exposies de 10 segundos a um
rato-femea, um recipiente de gua e um pedao de queijo so iguais? E mesmo que
fosse encontrada alguma forma para igualar dois reforadores, os processos de saciao
associados a cada classe de reforador so, quase certamente, to diferentes que a
mdia de travessias numa sesso de 30 min refletiria uma composio diferente de
valores reforadores para cada reforador. Essas consideraes indicam que a classifica
o de Warden dos impulsos para gua, alimento e sexo no deve ser tomada muito
seriamente. A questo de qual impulso o mais forte pode nem mesmo ser
experimentalmente significante.
6 . Tcnica do Trabalho Mximo.

- 356-

A tcnica do trabalho mximo semelhante, em linhas gerais, caixa de obstcu


lo, mas evita um dos efeitos colaterais indesejveis desta ltima a contaminao dos
resultados pelos efeitos emocionais do choque eltrico. A tcnica do trabalho mximo
est baseada na noo de que, quanto mais forte o reforador, mais trabalho o indivduo
efetuar para obt-lo. Hodos (1961) delineou um procedimento engenhoso no qual um
organismo trabalha num esquema de reforamento em razo, onde o valor real da ra
zo aumenta progressivamente com cada reforamento sucessivo. Num experimento, a
sesso iniciava com uma razo 2 e cada reforamento sucessivo aumentava razo de
mais 2, de modo que os animais deveriam emitir 2 respostas para o primeiro reforamen
to, 4 para o segundo, 6 para o terceiro, e assim por diante. Eventualmente, atinge-se
uma razo to alta que o animal se recusa a continuar trabalhando. O ponto em que is
to ocorre chamado de ponto de quebra, definido no trabalho de Hodos como 15 mi
nutos sem nenhuma resposta. Usando ratos como sujeitos e leite condensado para o re
foramento, Hodos manipulou o esquema de privao de seus sujeitos, alimentando-os
todo dia apenas com alimento suficiente para manter o peso de seu corpo numa percen
tagem fixa de seu peso com alimento livre. Assim, um rato mantido a 80 por cento de
seu peso normal est fortemente privado; um rato mantido a 95 por cento de seu peso
normal est apenas um pouco privado. Este procedimento comumente empregado pa
ra controlar a privao de sujeitos experimentais, e alguns acham que ele permite um
controle um pouco melhor da motivao do que men tendo os sujeitos com uma dura
o fixa de privao, digamos 23 horas. A medida do comportamento usada por Hodos
foi o nmero de respostas na ltima razo completada antes do ponto de quebra. Esta
razo final a razo mxima que o rato poderia completar sob as condies do experi
mento. A Fig. 15-12 mostra que, medida que os ratos estavam mais privados, eles com
pletavam uma razo mxima maior. Interpretamos isso como significando que com uma
privao maior o rato apresentar maior quantidade total de trabalho.
7, Adulterao do reforador.

Quando estamos ligeiramente famintos, somos muito seletivos com relao aquilo
que comemos. Eventualmente, medida que ficamos mais famintos, nossos padres so
bre aquilo que aceitaremos sero menos exigentes. Se estivermos com uma privao mui
to grande, comeremos qualquer coisa. Essas impresses sugerem que o impulso poderia
ser medido pela quantidade de uma substncia desagradvel que pode ser misturada com
o alimento de modo a fazer o organismo parar de consumir o alimento adulterado ou
de trabalhai por ele.
Os pesquisadores com interesse nas relaes crebro-comportamento tem comu
mente recorrido destruio experimental (leses) de pequenas regies localizadas dosistema nervoso a fim de localizar regies especficas do crebro associadas a comporta
mentos especficos. Numa regio profunda do crebro (o ncleo ventro-medial do hipotlamo) tal destruio experimental produz um imal que, depois de reabilitar-se da ci
rurgia, come vorazmente. Num perodo dc dois meses, ele dobrar o seu peso se tiver
acesso contnuo ao alimento. (Teitelbaum, 1955 ). Embora tais ratos operados comam
quantidades enormes de alimento e se tornem obesos, Miller, Bailey e Stevenson (1940)
mostraram anteriormente que esses ratos nao trabalham para obter alimento em esque
mas de razo tanto quanto trabalhariam ratos normais.

- 357 -

120
Rato SO
R ato 77
I

80-

100

95

90

85

80

P ercentagem do peso com a lim e n to livre

Figura 15-12. Razo mxima que produz o leite e que os ratos emitiro, em funo
do grau dc privao de alimentos (Hodos, 1961).

Essa uma das vrias descobertas a mostrar que a quantidade de alimento consumido
(resistncia saciao) e o trabalho realizado pela obteno de alimento no esto
perfeitamente correlacionados. Miller, Bailey e Stevenson tomaram os dados da razo
como significando que os ratos obesos no estavam to famintos quanto os ratos
normais, embora, se o alimento estivesse livremente disponvel, eles consumissem
relativamente muito mais alimento.
Teitelbaum utilizou o mtodo de adulterar o alimento do rato com uma pequena
quantidade fixa de quinino (uma substncia que sujeitos humanos acham amarga) para
averiguar interpretao de Miller, Bailey e Stevenson. Ele descobriu que, durante os
dois meses depois da operao, quando os ratos estavam se tomando obesos, o quinino
no detinha seu consumo anormal de alimento. Em outras palavras, durante este
perodo no qual os ratos turnavam-se muito gordos, o alimento era um reforador
forte. Mas, uma vez que os ratos tornavam-se obesos, uma quantidade de quinino
muito pequena para afetar o consumo de alimento pelos ratos normais, detinha
completamente o comer dos animais obesos. Parece que o alimento menos
reforador para o rato completamente obeso do qus para o rato normal. Mesmo assim,
se se d acesso continuo a alimentao no adulterada, o animal obeso comer muito
mais sua resistencia saciao maior que a do normal.
8. Preferncia.

Suponha que seja possvel emitir uma, mas no ambas, de duas cadeias de
comportamento. Na medida em que um organismo emite o comportamento que
produz um reforador em vez de e m itir o comportamento que produz um outro,
dizemos que j tem uma preferncia pelo primeiro reforador. Se a quantidade de esforo
para completar ambas as cadeias aproximadamente a mesma, tal preferncia poderia ser
considerada como uma expresso do valor reforador superior do primeiro reforador.
Assim, o comportamento de preferncia torna-se um mtodo para avaliar o valor reforcador relativo de dois ou mais reforadores.

- 358-

Quando as glndulas supra-renais de ratos so removidas cirurgicamente, ocorre uma


mudana drstica na balana inica de sdio e potssio. A menos que uma grande
quantidade de sdio seja ingerida diariamente, o animal logo morrer. Quando a operao
realizada, os ratos mudam sua preferncia normal por gua para solues salinas (clo
reto de sdio) e ingerem grandes quantidades de soluo salina, conseguindo, assim
manterem-se vivos e sadios. Esta mudana de comportamento a evidncia de que a
operao age de modo a aumentar o valor reforador do sal.
Sumrio.

Descrevemos brevemente vrios mtodos, mostrando que vrios tipos de compor


tamento variam de uma maneira ordenada com mudanas na privao, saciao e ope
raes associadas. Parece existir um conjunto de medidas comportamentais que, dentro
de certos limites, covaria com a privao do reforador.Por exemplo, quando se aumenta
a privao de alimento, o indivduo trabalha mais depressa num esquema de intervalo de
reforamento alimentar, realiza um total maior de trabalho (razo progressiva), supera
mais obstculos e adulteraes do reforador ou adquire mais rapidamente uma nova
habilidade. Resumimos isto no Diagrama 115.21.
I 15.2|

Operao de estabele
cimento do reforador
Mais trabalho realizado
Um reforador de qualidade inferior
tolerado
Maior preferncia pelo reforador.
A covariao sistemtica em um nmero de medidas comportamentais independentes
em relao a uma nica operao (por exemplo, privao) fornece uma base para a
introduo de um conceito que ir resumir e denominar essa covariao. O termo valor
reforador, para o qual, intencionalmente, adiamos uma definio formal at agora,
justamente este conceito. Pode-se dizer que o valor do reforamento denota a covariao
dos comportamentos do lado direito de [ 15.2]. Estamos agora em condies de fundir os
Diagramas [15.1] e [15.2], pois o significado do lado direito de [15.1 ] expresso mais
exatamente por [15.2]. Similarmente, o lado esquerdo de [15.2] mais adeauadamente
referido em [ 15d} .
O verdadeiro conceito de impulso pode agora ser formalmente definido como a
conjuno (relao) dos termos dos Diagramas [15.1] e [15.2]. Isto e\ um impulso c a
relao entre uma operao de estabelecimento do reforamento e o valor reforador de
uma classe de estmulos. Mas podemos, agora, apreciar a grande diversidade de in
formao que o termo impulso contm. O conceito traz consigo um gr^u de complexi
dade que no dve ser esquecido quando usarmos a palavra impulso sozinha. Se, de fato,
- 359-

compreendermos completamente o seu status como um conceito abstrato dc compilao,


ser pouco provvel que o empreguemos metaforicamentcTio sentido de incitao ou
fora que dirige, impulsiona o organismo , ou como uma causa do comportamento.
Similarmente, evitamos referncias sua localizao (j que uma abstrao no tem
localizao) ou sua satisfao (pois, como pode uma abstrao scr satisfeita? ).
Nenhuma das metforas de uso comum apropriadamente aplicada ao conceito de
ilmpulso que explicamos. O termo mostra uma relao complexa e significa, nada mais
nada menos, que Diagramas como [ 15.1 ] e 115.2].
REFERNCIAS PARA O CAPITULO 15
nliker, J., and Mayer, J. perant conditioning tchnique for studying
feeding patterns in normal and obese mice. /. appl. P h y s i o l 1956,
8, 667-670.
Broadhurst, P. L. Emotionality and the Yerkes-Dodson law. /. exp.
Psychol, 1957, 54, 345-352.
Clark, F. C. The effect of deprivation and frequency of reinforcement on
variable interval responding. /. exp. Anal. Behav., 1958, 1, 221
228.
Crocetti, C. P. Drive level and response strength in the bar-pressing ap
paratus. Psychol. Rep., 1962, 10, 563-575.
Frick, F. C. An analysis of an operant discrimination. / . Psychol., 1948,
2 6 ,9 3 -1 2 3 .
Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews
(E d .), Methods of psychology, New York: Wiley, 1948.
Heron, W. T., and Skinner, B. F. Changes in hunger during starvation.
Psychol. Rec., 1937, 1, 51-60.
Hodos, W. Progressive ratio as a measure of reward strength. Science,
1961, 134, 943-944.
Kleitman, N. Sleep and wakefulness, (rev. and enlarged ed.) Chicago:
Univer. of Chicago Press, 1963.
Miller, N. E., Bailey, C. J., and Stevenson, J. A. F. Decreased hunger"
but increased food intake resulting from hypothalamic lesions.
Science, 1950, 11 2 ,2 5 6 -2 5 9 .
Reese, T. W., and Hogenson, Marilyn J. Food satiation in the pigeon.
/. exp. Anal. Behav., 1962, 5, 239245.
Siegel, P. S. The relationship between voluntary water intake, body
weight loss, and number of hours of water privation in the rat
/. comp, physiol. Psychol., 1947, 40, 231-238.
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
Smith, M argaret F., and Smith, K. U. Thirst-motivated activity and its
extinction in the cat. /. gen. Psychol., 1939, 21, 89-98.
Teitelbaum, P. Sensory control of hypothalamic hyperphagia. J. comp,
physiol. Psychol., 1955, 48, 156-163.
-3 6 0 -

Captulo 16

MOTIVAO 11

Diz-se frequentemente que os drives (1) ativam ou do energia ao organismo, e (2)


dirigem-no para um objetivo. Em vista de nossa definio no captulo anterior de drive
como sendo uma relao sumria entre dois grupos de observveis (veja diagramas (15.1)
e(15.2) , somos forados a rejeitar a noo metafrica de que um drive por si s possa
ativar ou dirigir um organismo. Contudo, no devemos ser to drsticos ao ponto de
rejeitar tdas as idias que envolvem a ativao e direo. A partir da anlise, algumas
podem se referir a propriedades fundamentais do comportamento, que negligenciamos
at agora em nossa discusso de motivao.
*
16.1 ASPECTOS DE ATIVAO F DIRECIONAIS DA MOTVAO
Na terminologia presente, a ativao pode ser interpretada como um aumento na
chamada atividade difusa geral do organismo. Tal atividade, no rato, compreende toilete,
locomoo, fungar, mudanas dc posio, explorao e assim por diante. Realmente, o
nvel operante de respostas incondicionadas, estudado em captulos anteriores, uma
forma desse tipo de atividade. Como nem o reforo passado nem o presente, para essas
atividades, esto aparentes, os comportamentos so frequentemente mencionados como
atividade espontnea. Espontneo provavelmente um nome mal empregado desde
que, como veremos, essas atividades podem ser experimentalmente controladas em
alguma extenso. Referir-nos-emos a elas, daqui em diante, como atividades gerais.
Um aparelho conhecido como roda de girar (ou roda de atividade) tem sido usado,
desde o incio do sculo, para estudar a atividade geral em pequenos mamferos (ratos,
cricetos e camondongos). A roda (fig.16-1) quase sempre ligada gaiola-viveiro do
organismo e o animal c livre para entrar na roda a qualquer hora e correr. A questo de
se a motivao est relacionada ativao abordada de uma forma direta pelo estudo da
relao de vrias operaes de drive atividade de correr na roda. Um resultado
representativo a descoberta de Richter (1922), de que a atividade aumenta
regularmente com a privao de alimento at o terceiro dia de privao (72 hr), depois do
que: continuando a inanio, advem uma diminuio da atividade de correr.
Muito pouco trabalho foi feito para explorar os efeitos da privao de gua na
atividade na roda de girar, \ evidncia existente sugere uma atividade aumentando
progressivamente como funo do aumento de privao (Hall, 1961).
- 361 -

Figura 16-1. Uma roda de atividade.

Na seo 15.6, vimos que o valor reforador de reforadores primrios peridico. A


periodicidade que uma rata mostra na receptividade sexual est correlacionada com
periodicidade na secreo de hormnio sexual e ovulaao (chamada ciclo estrual) e vista
muito claramente na atividade de correr. Um ciclo de atividade tpico de uma rata
madura aparece na fig. 16-2. Pode ser visto que aproximadamente cada 4 dias a rata
extremamente ativa. Medidas fisiolgicas correspondentes mostram que precisamente
durante ste perodo ativo que ocorre a ovuiao, colocando a fmea maximamente
susceptvel inseminao. Durante este perodo, diz-se que a fmea est no cio e
ento mais receptiva a avanos sexuais do macho. Durante as partes de baixa atividade do
ciclo, todavia, a fmea provavelmente resistir copulao e lutar contra avanos do
macho. Ento, para a rata, existe uma correlao ntima entre atividade geral e valor
reforador do sexo.
Um outro aparelho, que registra um conjunto algo diferente de atividades gerais o
estabilmetro (Fig. 16-3). O estabilmetro consiste de uma gaiola (quase sempre
triangular) cujo piso montado sobre um sistema de suspenso pneumtica. Pequenos
movimentos na gaiola e mudanas no equilibrio pelo animal inovem o piso ligeiramente,
mudando o equilbrio da presso do ar. Essas mudanas so transmitidas a uma pena
registradora que permite um registro permanente da atividade a ser mantida. Os
movimentos registrados no so necessariamente do mesmo tipo que os movimentos de
- 362-

correr na roda. e portanto no devemos tomar como um paradoxo que alguns


investigadores tenham relatado que as privaes de alimento e gua afetam apenas
ligeiramente, ou nada, as atividades registradas em estabilmetros. Em geral, os tipos de
atividades medidos pela roda parecem ser alterados pela privao, enquanto os medidos
em estabilmetro so muito menos afe+ados. Bolles (1963) suspeitou que essa diferena
significasse que atividades especficas
diferentes eram diferencialmente afetadas pela
privao. Com a ajuda de vrios assistentes, ele observou periodicamente as atividades de
dois grupos de ratos, por um nmero de dias, em suas gaiolas. Uma vez por hora, os
experimentadores olhavam brevemente cada rato, e clci^sificavam o que ele estava
fazendo em uma de seis atividades: dormindo, descansando quietamente, de p em um
local, fazendo toilete, comendo, bebendo. Um grupo (faminto) foi alimentado com 10 g
de alimento uma vez ao dia. Como resultado, esse grupo experimentou uma perda de 15
a 20 por cento em relao ao peso com livre acosso ao alimento. O outro grupo tinha
acesso irrestrito ao alimento e assim foi chamado de grupo ad lib. O regime de privao
de alimento resultou em desvios do padro de atividade do ad lib. Os ratos famintos
faziam mais movimentos (levantar e locomover) e descansavam mais quietamente que os
ratos ad lib. A privao de alimento parece, assim, mudar o padro de atividade,
aumentando algumas atividades e diminuindo outras.
O nvel operante da resposta, isto , a atividade operante antes de fortalecida,
sensvel a operaes de privao. Crocetti (1962) obteve a curva vista na Fig. 16-4,
quando registrou o nvel operante de ratos que pressionavam uma alavanca sob cinco

- 363-

valores diferentes de privao de alimento. A comparao da curva da fig. 16-4 com a da


fig. 15-8 (ambas contendo dados dos mesmos ratos) mostra que a privao de alimento
afetou o nvel operante de presso barra na mesma maneira que afetou a resistncia
extino da resposta aps o seu fortalecimento experimental.

Figura 16-3. Um estabilimetro para registrar movimentos de pequenos


animaisOiarlow, 1948).

A evidncia apresentada de vrias fontes sugere que algumas operaes de drive


aumentam realmente certas atividades, mesmo que essas atividades nunca tenham sido
diretamente relacionadas ao reforador primrio associado com a operao de drive
utilizada. Embora esta proposio possa ser generalizada para incluir muitos reforadores
primrios, no verdadeira para todos. Por exemplo, certas deficincias de vitamina esto
associadas com uma diminuio e no com um aumento de atividade (Hall, 1961). Ao
tentar compreender como as operaes de privao esto relacionadas a atividades, alguns
presquisadores apelam para a evoluo das espcies. Na histria evolutiva das espcies,
pareceria que uma espcie que se torna mais ativa quando foi mais privada de substncias
vitais devia ter uma certa vantagem de sobrevivncia sbre uma espcie que no tivesse
esta tendncia. O tornar-se mais ativo devia levar o organismo a achar alimento ou gua
que um indivduo mais inativo poderia nunca descorir.
Quando nos voltamos para a anlise da chamada propriedade diretiva das operaes
de drive, notamos que a idia expressa menos experimental que de interpretao. Uma
operao de drive direcional no sentido em que age seletivamente no comportamento
associado com uma dada classe de reforadores, e no em todos os comportamentos
igualmente. Assim, a privao de alimento afeta maximamente comportamentos
reforados com alimento, a privao de gua afeta maximamente comportamentos
reforados com gua, e assim por diante. Afetando-se seletivamente os reforadores,
certos comportamentos vm a ter maior probabilidade de ocorrncia que outros. Por
exemplo, quando um chimpanz, que tenha sido altamente privado de alimento e apenas
ligeiramente privado de uma companhia, colocado numa situao onde pode
desempenhar ou uma cadeia de comportamento que leva ao alimento (digamos,
pressionar uma alavanca) ou uma que leva a um companheiro (digamos, entrar em um
compartimento onde seu companheiro est confinado), provavelmente far o primeiro.
-3 6 4 -

Figura 16-4. Nvel operante da taxa de presso barra em relao a horas


de privao de alimento ( segundo Crocetti, 1962)

Esta a essncia da direo, e realmente a direo baseia-se parcialmente na operao de


drive. Mas outra condio crtica para a direo baseia-se na histria passada de
condicionamento. A menos que exista o comportamento para levar ao reforador, a
operao de drive no dirigir o organismo para ele. O melhor que far ser mudar o
padro de atividade geral, ou fazer com que a aquisio ocorra mais rapidamente; por si
s, a operao de drive no tem poder de dirigir.
O exemplo do chimpanz levanta o problema interessante sbre o que acontece se
suas operaes de drive so executadas simultaneamente, e as cadeias de comportamento
so topograficamente incompatveis. Isto , consideremos um chimpanz privado tanto
de alimento quanto de sexo, e colocado em uma situao onde a execuo de um
comportamento que leva a um reforador impede a obteno do out o. Se o animal corre
para seu companheiro, desliga seu
de alimento. Se comea a pressionar a alavanca
para o alimento, uma porta se fecha bloqueando sua passagem para o companheiro. Esta
uma das situaes frequentemente descritas como um conflito de motivos. Quantas
vzes nos vemos forados a escolher entre um reforador e outro? Na presente
terminologia, a situao revela-se semelhante ao mtodo de preferncia usado para avaliar
valores relativos de reforo. Talvez o conflito seja, ento, melhor descrito como um
conflito entre valores de reforo.
16.2 INCENTIVO

A qualidade e quantidade de um reforador, duas variveis relacionadas, esto


associadas de perto com o valor do reforo. J vimos como um alimento pode ser
adulterado com quinino para diminuir seu valor reforador. A qualidade de um
reforador alimentar pode tambm ser adversamente afetada pela mistura com uma
poro de celulose no metabolizada. Jsto constitue, com efeito, uma diluio do reforo
e como tal uma maneira de variar o valor reforador mantendo constante o volume da
substncia ingerida. A diluio, naturalmente, particularmente conveniente para
manipular o valor reforador de lquidos. Gutman (1953) reforou a presso barra por

- 365 -

ratos famintos, com uma gota de soluo de sacarose em um esquema IV. A medida que
a concentrao de sacarose na soluo aumentava, a taxa de presso barra aumentava,
alcanando um mximo quando a concentrao de sacarose era de 32%. Concentraes
acima ds te valor produ/iam um declnio na taxa de resposta.
Os efeitos comportamentais da quantidade de reforador podem ser estudados de
vrias maneiras. Se o reforador alimento, e a qualidade mantida uniforme, o volume
pode ser variado. Km geral, ratos adquirem cadeias de labirinto mais rpido e estabilizam
em urna assntota mais baixa de erros por corrida, quando recebem mais alimento por sua
performance. A quantidade pode tambm ser estudada pela variao do tempo de acesso
ao reforador. Sujeitos ratos correm mais rpido paia um companheiro se se permite que
permaneam mais tempo com ele: pombos bicam mais rpido se se permite mais tempo
de acesso ao gro reforador contingente.
Os efeitos comportamentais da variao da quantidade e qualidade de reforo
primrio podem ser categorizados sob o rtulo de funes de incentivo Como um
substantivo, incentivo um sinnimo de reforo, mas, como um adjetivo, podemos us-lo
para denotar a classe de variveis que mudam o valor reforador atravs de mudanas nas
propriedades do estmulo reforador. Para um sumrio e interpretao dos vrios efeitos
comportamentais que as variveis de incentivo podem ter, o estudante interessado pode
consul tar Cofer e Applcy (1964).
16.3 FATORES FISIOLGICOS NA MOTIVAO
Temos tido pouca oportunidade para mencionar as propriedades do sistema nervoso
neste tratamento dos princpios comportamentais. Esta negligncia no deve ser vista
como uma negao de que estruturas e funes nervosas esto ligadas aos vrios
comportamentos que descrevemos. Em vez disso, isto advm do reconhecimento de que
o imenso volume de informao que constitue a cincia comportamental deve, por
necessidade, ser dividido em partes algo arbitrrias. Psicologia, Sociologiae Antropologia
constituem tais divises: assim fazem as disciplinas hbridas de gentica do
comportamento e psicologia fisiolgica. Embora tenhamos notado em outro lugar que as
leis do comportamento no podem ser subordinadas ou substitudas pelas leis de
fisiologia (ou qumica, ou mecnica, ou fsica nuclear) o sistema nervoso esta
intimamente envolvido em todos os fenmenos comportamentais. Um crebro e medula
intactos, funcionando, so um pr-requisito para tdas as leis do fortalecimento operante
c muitas das leis do reflexo.
Evidentemente, os fenmenos naturais transcendem as fronteiras arbitrrias de
disciplinas. Assim, o comportamento envolve um complexo de eventos fsicos,
ioqumicos, psicolgicos, fisiolgicos e sociolgicos. A posio que adotamos ditada
pela convenincia: a psicologia preocupa-se com relaes funcionais entre meio e
comportamento. Leis relacionando comportamento funo nervosa levam-nos do
territrio estritamente psicolgico para o da fisiologia. Mas sempre que o comportamento
a varivel dependendo de estudos de fisiologia, les contribuem para o nosso
conhecimento de comportamento e fisiologia; da a designao psicologia fisiolgica. Em
um tratamento introdutrio de psicologia, todavia, a psicologia fisiolgica deve ser vista
como uma especialidade avanada, que no pode ser tratada com certo grau de
profundidade. Resolvemos introduzir alguns de seus achados no contexto de motivao,
porque o quadro que est emergindo do mecanismo fisiolgico subjacente ao reforo

- 366-

ajuda a compreender o conceito comportamental de drive. Us estudos fisiolgicos


prometem dar-nos o conceito de valor reforador, com um referente fsico, em vrias
estruturas anatmicas, e a juntar um nmero de operaes de drive ambientalmente
diversas, descobrindo seus efeitos comuns no organismo.
Mecanismo de comer e beber. Na elaborao gradual dos mecanismos corporais
associados com a alimentao, encontramos um exemplo representativo da procura de
eventos fisiolgicos subjacentes a fenmenos comportamentais. Mais precisamente, essa
procura diz respeito a certos eventos e processos internos que acompanham mudanas no
poder reforador de alimento. Desde a antiguidade at tempos recentes, pensava-se que o
estado do estmago tinha um papel importante no controle do valor reforador do
alimento. O fato de as caimbras de fome frequentemente acompanharem
informaes de grande fome em humanos levou a investigaes sbre as relaes entre
cimbras de fome, contraes do estmago e fome. Cannon e Washburn (1912)
estudaram contraes do estmago usando uma tcnica simples em que um sujeito
humano engolia um pequeno balo de borracha. Uma vez no estmago, o balo era
inflado, e qualquer contrao estomacal que ocorresse apertava o balo. As variaes
resultantes de presso do ar no balo eram por sua vez transmitidas a uma pena
registradora. O sujeito pressionava uma chave telegrfica sempre que sentia cimbras de
fomel. Cannon e Washburn mostraram que as contraes estavam bastante
correi aciona das com o relato de cimbra de fome, e concluram que essas contraes
eram a causa da fome. A hiptese ganhou ateno imediata porque parecia oferecer um
mecanismo simples e direto para comer e beber. Mas logo foi visto que pacientes que no
tinham estmago comiam de maneira normal, e relatavam fome embora nunca
tivessem contraes de estmago. As implicaes dessas observaes foram ampliadas em
experimentos que mostraram que ratos comiam normalmente, embora os nervos do
estmago fssem isolados cirurgicamente do crebro. Outras observaes mostraram que
as contraes de fome eram abolidas pelas primeiras mastigadas de alimento, embora o
alimento continuasse a ter um alto valor reforador muito depois que as contraes
cessavam. No fim, a teoria de fome de contrao do estmago teve que ser abandonada,
porque no explicava muitos dos fatos do comportamento de comer.

Um mecanismo mais complicado foi indicado pelos primeiros experimentos de


Tschukilshew (citado em Templeton e Quigley, 1930) em que a transfuso de sangue de
animais privados de alimento para animais bem alimentados aumentou a motilidade do
estmago do receptor. Experimentos mais recentes mostraram que a transfuso de sangue
entre ratos famintos e saciados (Fig. 16-5) afeta o consumo de alimento dsses animais. A
alimentao e o jejum parecem mudar algum aspecto do sangue, o que, por sua vez,
afetaria mecanismos cerebrais, levando a uma mudana no valor reforador do alimento.
Mayer (1953) teorizou que uma varivel mediadora possvel a concentrao relativa de
glicose arterial e venosa, e que as clulas no crebro onde essa concentrao pode ser
medida situam-se em uma regio restrita do hipotlamo (Figc 16-6).

1.

Os trmos "fo m e " e "sde" so usados no seu sentido descritivo com o palavras
breves para significar que alimenxo e gua, respectivamente, tm alto valor
reforador.

- 367-

Trabalho experimental independente confirmou que certas estruturas no hipotlamo


esto intimamente relacionadas ao poder reforador do alimento. Km uma subseo
anterior, descrevemos efeitos comportamentais causados pelo dano experimental na
regio ventromedial do hipotlamo. Ratos com destruio nessa regio comem demais e
tornam-se obesos. A estimulao eltrica dessa regio do crebro tambm tem efeito no
comportamento motivado por alimento.

I igura 16-5. Quando sc transfere o sangue de um rato faminto pura um


bem alimentado, o consumo de alimento 6 alterado (Sanford, 1961).

Finos eletrodos podem ser implantados no crebro em localizaes bem precisas, sem
lesar estruturas vizinhas. Os eletrodos so guiados no tecido nervoso atravs de um
buraco perfurado no crnio, e ento colocado um pedao de plstico cimentado no
crnio, cobrindo o buraco. Finalmente, o couro cabeludo costurado. Depois de alguns
dias de recuperao da operao, o animal operado recupera a sade normal. O animal
no parece de modo algum importunado pela adio dos eletrodos, e vive normalmente.
Atravs dos eletrodos implantados, podem ser aplicadas correntes eltricas diminutas
estrutura do crebro onde esto localizadas as pontas dos eletrodos. Os efeitos
comportamentais de tal corrente eltrica so ento medidos. Quando a regio
ventromedial do hipotlamo assim estimulada, o consumo de alimento diminui. Foram
encontradas outras reas do crebro onde a estimulao leva um animal saciado a
comear a comer. O quadro dos mecanismos fisiolgicos subjacentes privao e
alimentao complexo e ainda fragmentrio. Nenhuma estrutura corporal nica medeia
o valor reforador do alimento. O estmago, o sangue, o crebro e provavelmente outros
sistemas corporais interagem para determinar quando o alimento ser reforador.
Pode-se contar uma histria experimental anloga para o mecanismo de beber, mas
podemos indic-la somente brevemente. As primeiras explicaes foram centralizadas no
papel da secura relativa da garganta e boca e na importncia das secrees salivates. Boca
e faringe secas eram igualadas a sede. Trabalhos posteriores mostraram que a salivao
poderm no ser crucial desde que animais tanto bebiam como paravam de beber
normalmente mesmo quando seus dutos salivares eram fechados. Ao contrrio, em
- 368-

I igura 16-6. Diagrama esquemtico do crebro humano (Rosenzwcig,


1962).

experimentos em que a gua que os cachorros bebiam nunca alcanava seus estmagos,
mas saa por uma fistula no pescoo (Fig. 16-7), cachorros privados de gua continuaram
a beber indefinidamente; embora suas gargantas e bocas fossem mantidas constantemente
molhadas. A ateno experimental mudou gradualmente para o papel da gua contida
nas clulas do corpo. Um pequeno deficit de concentrao normal de gua nas clulas do
corpo c sangue parece ser um fator crtico no beber (Gilman, 1937). O trabalho recente
tem se dedicado localizao de centros cerebrais no hipotlamo que regulam o
comportamento de beber e parar de beber.
Voltamo-nos agora uma breve descrio de alguns mtodos pelos quais os
psicofisiologistas tentam descobrir a lgica da mecnica corporal interna. Suas principais
tcnicas so (1) estimulao do tecido nervoso por corrente eltrica ou por substncias
qumicas ou drogas, (2) destruio cirrgica ou farmacolgica ou isolamento de reas

I igura 16-7. (Segundo Rosen/woig, 1962).

consideradas cruciais, (3) registro de atividade eltrica local no crebro, (4) modificao
de aiguma estimulao encontrada na funo normal, enquanto se deixa outros aspectos
intatos (tal com o o experimento de beber simulado da Fig. 16-7), (5) medidas de
numerosas variveis fisiolgicas em relao ao com portamento (tal com o nvel de glicose
no sangue c gua contida nas clulas), (6) comparao de processos comportamentais
com processos fisiolgicos (por exem plo, a comparao do processo de saciao com
contraes no estmago mostrou que os dois no eram paralelos, indicando que um,
provavelmente, no subjacente ao outro).

Os mtodos dos psicofisiologistas podem levar a importantes descobertas


comportamentais. Olds e Milner (1954) implantaram eletrodos profundamente em
crebros de ratos com o objetivo de verificar se a estimulao em uma regio associada
com o sono facilitaria ou dificultaria a aquisio de operantes simples. Os investigadores
ficaram surpresos ao descobrir que a estimulao, por si s, tinha um efeito marcante no
comportamento do rato.
No experimento teste que estvamos realizando, o animal foi colocado em uma
grande caixa com os cantos rotulados A, B, C e D. Sempre que o animal ia para o
canto A, era dado um choque eltrico fraco em seu crebro pelo experimentador.
Quando o teste foi realizado no animal... ste continuou voltando para o canto A.
Depois de vrios retornos no primeiro dia, finalmente foi para um lugar diferente e
dormiu. No dia seguinte, todavia, parecia mais interessado no canto A.
Neste ponto supusemos que o estmulo devia provocar curiosidade; no
pensvamos ainda nisto como recompensa. Experimentao continuada ccm o
mesmo animal logo indicou, para nossa surprsa, que essa resposta ao estmulo era
mais do que curiosidade. No segundo dia, depois que o animal havia adquirido o

ligura 16-K Rdlo t.*stimulamlo-sc em uma faixa ik' Skinner (seguiuU* Okls. 1956).

-370-

hbito de vdtar ao canto A para ser estimulado, comeamos a tentar lev-lo para o
canto B, dando um choque ellrico sempre que ele tomava um passo nessa direo.
Em questo de cinco minutos o animal estava no canto B. Depois disso, o animal
podia ser dirigido para quase todos os pontos na caixa ao desejo do experimentador.
Cada passo na direo certa era pago com um pequeno choque; com a chegada no
lugar apontado, o animal recebia uma srie mais longa de choques (Olds, 1956).
Evidentemente, a estimulao do crebro estava agindo como um reforador com o
qual o comportamento operante podia ser rapidamente modelado. Depois o animal foi
colocado na caixa de Skinner (Fig. 16-8) e se permitiu que ele estimulasse seu prprio
crebro em qualquer taxa que escolhesse. Altas taxas de resposta foram emitidas sob
contingncias crf. As similaridades entro a recompensa de estimulao do crebro e
reforadores positivos mais convencionais tais como alimento e gua so pronunciadas.
Como outros reforadores positivos, a recompensa de estimulao do crebro mantm
operantesRF, gerando alta resistncia extino depois de contingncias intermitentes, e
permite poderoso controle de esquema (Pliskoff, Wright e Hawkins, 1965). Por outro
lado, os ciclos de privao e saciao da recompensa de estimulao do crebro parecem
ser mensurveis em segundos, em vez de horas ou dias.
Trabalho adicional por Olds e outros indica que no h um, mas um nmero de
locais, no crebro, onde a estimulao eltrica exerce efeito reforador (Olds, 1962).
Muitos desses so os mesmos lugares que parecem, de outros experimentos, estar ligados
ci eficcia do alimento, sexo, atividade e outros reforadores primrios.
16.4 REFORADORES PRIMRIOS ADICIONAIS
Muitos dos princpios de comportamento elaborados nos captulos anteriores vieram
dos estudos em que os reforadores primrios consistiam de alimento para organismos
privados de alimento, ou, ocasionalmente, gua para indivduos privados de gua. gua e
alimento so reforadores poderosos e seguros e suas privaes fornecem uma operao
direta e exata para ativar sua fora. Todavia, h uma quantidade de outros reforos
primrios que, ao contrrio de gua e alimento, no so essenciais para a vida do
organismo. Nesta seo, consideraremos brevemente reforadores primrios tais como
atividade, novidade, explorao, manipulao, afeio e contato corporal. A importncia
de alguns desses reforadores primrios foi reconhecida apenas recentemente. Em muitos
casos, ainda temos muito o que descobrir sbre as operaes que determinam suas foras
reforadoras. Em outros casos, tais como explorao, novidade e afeio, a especificao
real da classe de estmulos reforadores est longe de ser estabelecida. Embora sses
problemas apresentem dificuldades reais para o desenvolvimento do conceito de drive nos
termos desses reforadores, les no diminuem a importncia emprica de tais
reforadores em modificar e controlar o comportamento. Muito do comportamento dc
sres humanos, que vivem em uma sociedade onde fome e privao de lquidos so raras,
parece estar muito distante de drives associados com privao de alimento ou gua.
provvel que a anlise de reforadores primrios adicionais mostre ser essencial para
interpretar a complexa motivao humana.
1.
Atividade. Numa seo anterior, consideramos vrias tcnicas para medir as
chamadas propriedades de ativao da privao de alimento, sexo e gua. Alm dsse
controle sobre a atividade geral, parece que a privao de atividade, por si s, serve como

-371 -

uma operaao de drive para atividade. Por exemplo, um rato confinado em uma pequena
cmara onde seus movimentos so restritos, ir, dando-se-lhe acesso a uma roda de correr,
correr uma quantidade quase proporcional ao tempo em que esteve, anteriormente,
confinado. A atividade , assim, uma funo que aumenta com as horas de confinamento
(Hall, 1961). O valor reforador de atividade aumentado depois de confinamento pode
ser demonstrado tambm por um aparelho, o estabilmetro (gaiola de balano). Quando
colocados em uma gaiola de balano depois de longos perodos de inatividade forada,
ratos movem-se muito mais que o usual. Kagan e Barkun (1954) mostraram que ratos
pressionavam uma alavanca para ter acesso a uma roda em que pudessem correr.
Aparentemente, a atividade pode servir como um reforador primrio para respostas
operantes.
2.
Explorao. Em condies normais, os organismos preferiro quase sempre
colocar-se em uma situao nova. Isto particularmente verdadeiro quando a situao
nova apresenta uma oportunidade para explorao. bem conhecido que um rato
faminto, quando introduzido em uma situao nova que contm alimento, ir
invariavelmente explorar a situao antes de comer. Isto sugere que o valor reforador
da explorao suplanta o do alimento, pelo menos inicialmente. Como uma
demonstrao experimental desse reforador, imagine um labirinto T em que um dos
braos contm um elaborado labirinto tipo tabuleiro (Fig. 12-2), e outro brao contm
uma caixa pequena e comum no fim. Ratos que no esto privados nem de alimento nem
de gua iro correr consistentemente para o lado que tem o labirinto em tabuleiro se se
permite por um breve perodo de tempo que explorem o labirinto em tabuleiro
quando chegam a ele.
Estmulos novos no precisam ser to complicados como o labirinto em tabuleiro.
Ratos e camondongos pressionaro uma alavanca se cada presso produz um breve flash

operante discriminativo de empurrar um painel a/.ul (segundo Murray,


1964, baseado na descrio de Butler, 1953).

- 372 -

importante em se um rato pretere pressionar uma aJavanca qut liga uma luz, ou
pressionar a outra alavanca que desliga uma luz (Lockard, 1963).
Reforadores capazes de fortalecer o comportamento algo vagamente denominado
curiosidade foram demonstrados por Butler (1953). Macacos novos foram colocados
em uma caixa opaca em penumbra com duas janelas cobertas, uma azul e outra amarela.
Empurrar a janela amarela no tinha nenhum efeito, mas o empurrar a janela azul abria-a
por 30 seg, mostrando vrias cenas (Fig. 16-9). Algumas cenas tais como um grande
cachorro rosnador, no eram reforadoras e levavam um pequeno empurro. Outras
cenas, como viso do laboratrio e experimentador, outros macacos e objetos de
brinquedo mveis tinham valor reforador aprecivel. Os macacos confinados
rapidamente discriminavam a cr do painel e produziam as cenas reforadoras
frequentemente. Esse comportamento parece conter alguma relao com privao, desde
que quanto mais o animal era confinado na caixa sem oportunidade de produzir uma
cena, maior sua taxa de resposta quando dada a oportunidade. Butler (1957) encontrou a
funo vista na fig. 16-10, quando a presso ao painel era reforada em um esquema IV
com a viso, por 12 seg; de uma colnia de macacos.
Crianas novas gastam muito tempo com brincar e manipular objetos. Essa
manipulao parece ter propriedades reforadoras intrnsecas e no precisa ser
dependente da associao com outros reforadores primrios. Harlow (1950) demonstrou
que macacos iro desmanchar quebra-cabeas mecnicos do tipo visto na Fig. 16-11, sem
nenhum reforo adicional . Parece que sses macacos resolvero os problemas meramente
pelo gosto de resolv-los. por isto que tais reforadores so chamados intrnsecos. Por
um perodo de 10 hr. de observao, Harlow notou que o nmero de quebra-cabeas
abertos diminua progressivamente, sugerindo um processo de saciao.
3.
Contato fsico para organismos jovens: reforadores de "afeio" : Pode-se
suspeitar que o contato fsico com a me deve ser um reforador para um organismo
jovem. Tal reforador teria, obviamente, utilidade biolgica para manter o organismo
jovem perto de sua me onde alimento, abrigo e proteo poderiam ser encontrados

No. de horas de privao da explorao visual.

I igura 16-10. Taxa de resposta cm IV reforada por uma breve exposio a


uma cena visual com funo de horas de privao visual ( Butler,!957).

- 373 -

Pesquisa realizada por Harlow demonstrou que o contato do corpo um reforador


muito poderoso, e alm disso no depende de reforos primrios adicionais de alimento,
abrigo e proteo com os quais normalmente associado. O contato, por si s, um
reforador primrio poderoso e especfico. Harlow (1960) criou macacos jovens em
completo isolamento de suas mes. Das observaes do reflexo de segurar, em macacos
bebs (Fig. 16-12), Harlow suspeitou que poderia ser construda uma me sub-rodaga
(substituta) que poderia fornecer certos aspectos do contato fsico que as mes
verdadeiras fornecem.

Figura 16-11. Quebra-cabeas mecnico que macacos resolvero sem


qualquer reforo adicional (Harlow, 1950).

O reflexo de segurar e tocar eliciado por um objeto cilndrico; ento, objetos do tipo na
Fig. 16-13 foram colocados nas gaiolas dos bebs macacos desde o nascimento. Esses
objetos cilndricos (mes substitutas) eram idnticos em construo exceto por suas
cabeas (um aspecto determinado mais tarde como irrelevante) e suas superfcies. Ambos
os objetos foram construdos de arcabouos de arame, mas o arcabouo de arame de um
estava coberto por uma camada grossa de tecido , enquanto o arcabouo do outro estava
exposto. Harlow referiu-se ao objeto coberto de tecido macio como me de pano ; e o
outro objeto ele chamou de me de arame. Os macacos criados em gaiolas contendo
ambas essas mes substitutas permaneciam muito tempo de sua vida infantil em contato
com a me de pano , segurando-se a ela muito maneira do reflexo de segurar da
Fig. 16-12. Por outro lado, eles ignoravam virtualmente a me de arame.
Para determinar se o reforador de contato constante fornecido pela me de pano
dependia da histria de associao com reforo de alimento, alguns macacos mamavam
de uma mamadeira inserida no trax da macaca de arame e o restante mamava de uma
mamadeira da macaca de pano. Mas a associao da me de arame com alimento no
modificou a preferncia do infante macaco por segurar-se na me de pano. O nmero de
horas gastas com as duas mes para os dois grupos de macacos visto na Fig. 16-14. Os
macacos alimentados na me de arame passavam menos tempo nela do que os macacos
alimentados na me de pano. Na Fig. 16-13 vemos como alguns macacos resolviam o

-374-

problema de alimentar-se de Uina me enquanto t i n h a t a t o com a outra. Em outros


experimentos, Harlow demonstrou que o valor reforador da me de pano perdurava at
dois anos. Essas descobertas atestam a grande durabilidade desse reforador. As
propriedades reforadoras crticas da substituta parecem ser (1) sua forma cilndrica e (2)
sua maciez. Quando se usou uma tbua chata coberta de tecido, esta no gerou os efeitos
vistos pelo cilindro coberto de pano da Fig. 16-13. O abrao no era possvel com uso
da tbua.

I igura 16-1 2. Reflexo de segurar, em macacos rhesus recm-nascidos,


eliciado por um objeto cilndrico (Harlow, 1960 ).

Harlow indicou que o privar os bebs macacos de suas mes* ou de mes substitutas
apropriadas, pode interferir marcantemente com respostas emocionais e padres de
companhia, mais tarde . Evidentemente, a disponibilidade do reforador de contato no
incio da vida crtica para a ocorrncia normal de certos padres de comportamento na
vida adulta. O trabalho de Harlow fornece um incio impressionante neste problema
muito difcil dos efeitos de experincias iniciais em comportamentos maduros
posteriores. Desde Freud, os psicanalistas tm enfatizado que certas experincias iniciais
crticas so de grande importncia para o ajustamento de padres emocionais de sres
humanos adultos; mas, atravs de experimentao controlada, a explorao dessas idias
tem sido difcil. O paradigma de Harlow pode oferecer um esquema til para testar
algumas dessas idias.

- 375-

1*igura 16-13. Macaco rhesus jovem mamando dc um objeto de arame


cilndrico, enquanto agarra-se a um objeto semelhante coberto com tecido
(Harlow, 1960).

Idade mdia em dias


Figura 16-14. Horas, por dia, passadas com as mes substitutas de pano e
arame em vrias idades, em dias (Harlow, 1960).

16.5 DRIVES ADQUIRIDOS


No tratamento presente de motivao exclumos completamente uma discusso
sbre reforadores adquiridos. Justificamos essa excluso baseados em que as
propriedades dos reforadores condicionados eram bem explicadas atravs de uma certa
histria passada com contingncias comportamentais de discriminao. Neste capitulo e
no captulo 15 limitamos nossa ateno a operaes outras, que no aquelas na histria
passada de condicionamento do organismo, que afetam os reforadores. Se, todavia, fosse
possvel criar um reforador que (1) desse evidncia de ser um reforador terminal de
uma cadeia de comportamento e (2) uma vez criado, fosse sensvel a vrias operaes de
estabelecimento e reduo muito maneira pela qual os reforadores primrios so,
teramos que concordar que tal reforador alcana as condies necessrias para um drive
adquirido. Ao contrrio dos reforadores condicionados do captulo 11, esses
reforadores adquiridos no seriam dependentes de reforo primrio subsequente para
que sua fora continuasse. Dois fenmenos comportamentais, retirados de contextos algo
diferentes, parecem permitir uma considerao tentativa como drives adquiridos deste
tipo.
1.
Imprinting. Certos objetos em movimento, se apresentados no incio da vida,
podem adquirir propriedades reforadoras para espcies cujos filhotes so capazes de se
locomover logo depois do nascimento. Os primeiros relatrios descrevem o
comportamento exibido por gansos, patos e pintos e outras aves, de seguir certos
objetos em movimento. Hess (1958) descreveu as primeiras observaes do zoologista
austraco Konrad Lorenz:
Em uma fazenda perto de Viena, Lorenz dividiu um grupo de ovos postos por
uma gansa em d d s grupos. Um grupo foi chocado pela gansa; outro grupo foi
chocado por uma incubadeira. Os gansinhos chocados pela gansa imediatamente
seguiram sua me pela fazenda. Os outros, todavia, no viram sua me. A primeira
coisa que eles viram foi Lorenz. E ento seguiram Lorenz pela fazenda (Hess, 1958,
p. 81) .

Figura 16-15. Um aparelho usado no estudo de imprinting. Consiste de


uma pista circular na qual um pato chamariz pode ser movimentado. No
desenho, visto um patinho seguindo o chamariz (Hess, 195 9).

-377 -

Esse fenmeno, no qual uma experincia no incio da vida dos gansos influenciou seu
comportamento mais tarde, Lorenz chamou de imprinting. Logo foi estabelecido que a
experincia tinha que ocorrer durante um perodo crtico no incio da vida do organismo
para ser efetivo. Trabalhes subsequentes devotados ao imprinting tm demonstrado que
os tipos de objetos que podem fazer surgir tais comportamentos dc seguir so to
arbitrrios como caixas de papelo ou esferas em movimento. Esses trabalhos posteriores
tem tentado qualificar as condies sob as quais ocorrer o imprinting.

Horas por dia


I-igura i 6-16. Teste positivo de resposta dc preferencia para o objeto-teste
(Hess. 1959).

Tm indicado tambm que seguir simplesmente uma manifestao de que um certo


objeto tornou-se um reforador poderoso. Qualquer comportamento instrumental que
traga a ave jovem a uma maior proximidade com o objeto fortalecido.
O aparelho utilizado por Hess (visto na Fig. 16-15) consiste de uma pista circular
fechada de Plexiglass na qual um pato chamariz pode ser movido por um motor a vrias
velocidades. Um patinho, nascido poucas horas antes, c colocado na pista e o modelo
comea a mover-se em volta da pista. Em alguns experimentos, um som sai de um alto
falante de dentro do modelo. A operao de imprinting consiste de 1 hora, ou menos, de
exposio ao objeto em movimento. Mais tarde, os patinhos, so testados para
determinar preferncia de resposta para o modelo de imprinting em comparao com
outros objetos. Um achado surpreendente que a operao de imprinting deve ocorrer
durante um perodo de idade para ser efetiva na determinao da preferncia. A fig.
16-16 mostra isto graficamente. Para o caso de patinhos selvagens, uma idade de 13-16 h
depois do nascimento d o mximo de imprinting. Parece que, alm de 30 h depois do
nascimento, o imprinting j no possvel nesta espcie.
A fim de estabelecer que o objeto imprinted age como outros reforadores,
Hoffman, Searle, Toffcy e Kozma (1966) modelaram uma resposta de bicar na chave que
produzia uma iluminao breve (5 seg) do objeto imprinted em movimento. Em seus

- 378-

estudos, a arbitrariedade do objeto imprinted foi enfatizada. 0 ubjeto era uma


mamadeira de leite sendo levada em um vago de um trem modelo. Os patinhos recebiam
uma exposio, anterior ao imprinting, mamadeira de leite e mais tarde adquiriram as
Rs de bicar a chave quando cada bicada produzia um aparecimento breve da mamadeira
em movimento como reforador. Subsequentemente, uma razo 5-1 foi mantida. Os
sujeitos que no tiveram exposio anterior ao imprinting mamadeira no bicavam a
chave, mostrando que a operao de imprinting foi essencial para a criao desse tipo de
reforador.
Embora o objeto imprinted parea adquirir propriedades reforadoras, essas
podem no durar indefinidamente. Hoffman, Toffey, Searle e Kozma mediram a
quantidade de tempo pelo qual os patinhos imprinted, vivendo constantemente no
aparelho, mantiveram a viso da mamadeira de leite pelo bicar da chave. Os
experiment adores descobriram que, medida que os animais cresciam, tendiam a
trabalhar cada vez menos pelo objeto. Alguns resultados tpicos so vistos na Fig. 16-17.
Por volta de 60 dias, o valor do objeto em movimento como reforador havia quase
dissipado completamente. Um fato interessante o de que o reforador podia ser
restabelecido temporariamente atravs de choque nos patinhos, ou pela apresentao de
outros estmulos geradores de emoo.

Dias aps a incubao


Figura 16-17. Quantidade mdia de tempo por dia, em que um objeto em
movimento foi mantido vista como uma funo da idade dos patinhos. A
operao de imprinting com este objeto havia sido executada
anteriormente, cada ponto representa uma mdia de 3 dias entre trs
sujeitos (H.S. Hoffman, dados no publicados).

Os resultados dos estudos de imprinting sugerem que o procedimento de imprinting


uma operao que cria uma classe de reforadores que se parecem com o objeto
imprinted . Como esse novo reforador um reforador terminal de uma cadeia de
comportamentos, suas propriedades se parecem mais com aquelas dos reforadores

- 379-

Figura 16-18. Rato viciado toma injeo de droga vontade, pela presso
barra. A soluo de droga vem pelo tubo e ento, atravs de uma cnula
cronicamente implantada, penetra na veia jugular. Uma corrente em uma
coleira impede que o tubo gire quando o animal se move na gaiola (segundo
Weeks, 1964).

primrios do que com as de reforadores secundrios. Ao contrrio de um reforador


condicionado, no sujeito a um procedimento de extino, nem serve como um
para uma resposta que produza um reforador subsequente mais primrio.
2.
Vcio
Sabe-se bem que a administrao repetida de certas drogas cria uma
dependncia em sua administrao contnua. Alm disso, essas drogas (tal como o pio e
seus derivados morfina, herona e demorol) vem a adquirir propriedades reforadoras
poderosas. Os humanos que desenvolvem tais dependncias, chamadas de vcios, tudo
faro para obter injees da droga. A despeito de sua prevalncia na sociedade moderna,
as condies que controlam o vcio (suas causas e curas) rio so bem entendidas.
Estudos recentes com sujeitos animais tm utilizado tcnicas de resposta de operante
livre para estudar o poder reforador dessas drogas depois do vcio. 0 principal objetivo
desses estudos clarificar as condies que esto relacionadas ao vcio.
A operao que cria o reforador de vcio consiste da apresentao repetida
(usualmente por injeo) de morfina e outros compostos em doses gradualmente
maiores. Como uma conseqncia dessa srie de administraes, a droga adquire
poderosas propriedades reforadoras. 0 vcio experimental tem sido produzido em ratos
e macacos por sse mtodo de aumentar gradualmente a dose da droga. As propriedades
do reforador adquirido da droga foram estudadas permitindo-se a um rato viciado os

-3 8 0 -

meios para administrar o narctico em si prprio (Weeks 1964). O rato viciado trabalhava
numa caixa de Skinner onde cada presso barra inicialmente produzia injeo
controlada de um narctico selecionado. O sistema de injeo consistia de um tubo e
uma cnula pela qual a droga era levada, em soluo, diretamente para a veia jugular do
rato (Fig. 16-18). Os resultados mostram que ratos viciados adquirem a R de pressionar a
alavanca quando isso leva a vrias quantidades de morfina. Curvas tpicas de RF
associadas com razes variando entre 10 e 400 presses barra para uma nica injeo
demonstram a natureza extremamente poderosa do reforador morfina. Embora
ocorressem periodieidades de pouca durao no vdor reforador adquirido (efeitos de
saciao), a durao a longo prazo do reforador era indefinida. Um macaco trabalhando
sob condies semelhantes a essas descritas para o rato permaneceu viciado por 21 meses
(Weeks 1964). A tcnica revela-se promissora em trazer resultados que podem sugerir os
procedimentos a serem usados no controle das propriedades do reforo de drogas, uma
vez que tenha ocorrido o vcio.
O controle dos reforadores de vcio tem implicaes bvias para o controle de
de vcios em humanos.
REFERNCIA PARA O CAPTULO 16
Bolles, R. C. Effect of food deprivation upon the rats behavior in its
home cage. / . comp, physiol. Psychol., 1963, 56, 456-460.
Butler, R. A. Discrimination learning by rhesus monkeys to visualexploratory motivation. J. comp, physiol. Psychol., 1953, 46, 95-98.
Butler, R. A. The effect of deprivation of visual incentives on visual
exploration motivation in monkeys. J. comp, physiol. Psychol.,
1957, 50, 177-179.
Cannon, W. B., and Washburn, A. L. An explanation of hunger. Amer.
J. Psychol., 1912, 29, 441-452.
Cofer, C. N., and Appley, M. H. Motivation: theory and research. New
York: Wiley, 1964.
Crocetti, C. P. Drive level and response strength in the bar-pressing
apparatus. Psychol. Rep., 1962,10, 563-575.
Gilman, A. The relation between blood osmotic pressure, fluid distribu
tion, and voluntary water intake. Am er . J. Physiol., 1937, 120,
323-328.
Guttman, N. Operant conditioning, extinction, and aperiodic reinforce
ment in relation to concentration of sucrose used as reinforcing
agent. J. exp. Psychol., 1953, 46, 213-224.
Hall, J. F. Psychology of motivation. New York: Lippincott, 1961.
Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews
(E d .), Methods of psychology, New York: Wiley, 1948.
Harlow, H. F. Learning and satiation of response in intrinsically moti
vated complex puzzle performance by monkeys. J. comp, physiol.
Psychol., 1950, 43, 289-294.
Harlow, H. F. Primary affectional patterns in primates. Amer. J. Ortho-

381 -

psychiat., 1960, 30, 676-684.


Hess, E. H. Imprinting in animals. Sci. Amer., 1958, 195, 81-90.
Hess, E. H. Imprinting. Science, 1 9 5 9 , 130, 133-141.
Hoffman, H. S., Searle, J. L., TofTey, Sharon, and Kozma, F. Behavioral
control by an imprinted stimulus. J. exp. Anal. Behav., 1966, 9,
177-189.
Kagan, J., and Berkun, M. The reward value of running activity. J. comp,
physiol. Psychol., 1954, 47, 108.
Lockard, R. B. Some effects of light upon the behavior of rodents.
Psychol. Bull., 1963, 60, 509-529.
Mayer, J. Glucostatic mechanism of regulation of food intake. New
England J. Med., 1953, 249, 13-16.
M urray, E. J. Motivation and emotion. Englewood Cliffs: Prentice-Hall,
1964.
Olds, J. Pleasure centers in the brain. Sci. Amer., Oct. 1956, 195, 105
116.
Olds, J. Hypothalamic substrates of reward. Physiol. Rev., 1962, 42,
554-604.
Olds, J., and Milner, P. Positive reinforcement produced by electrical
stimulation of septal area and other regions of rat brain. J. comp,
physiol. Psychol, 1954, 47, 419-427.
Pliskoff, S. S., Wright, J. E., and Hawkins, T. D. Brain stimulation as a
reinforcer: intermittent schedules. J. exp. A n a l Behav., 1965, 8,
7 5 -88.
Richter, C. P. A behavioristic study of the activity of the rat. Comp.
Psychol Monogr., 1922,1, No. 2.
Richter, C. P. Animal behavior and internal drives. Quart. Rev. B iol,
1927,2, 307-343.
Rosenzweig, M. The mechanisms of hunger and thirst. Chap. 3 in L.
Postman (E d .), Psychology in the making. New York: Knopf,
1962.
Sanford, F. Psychology, a scientific study of man. Belmont, Calif.: W ads
worth, 1961.
Templeton, R. D., and Quigley, J. P. The action of insulin on the mobility
of the gastro-intestinal tract. Amer. J. Physiol , 1930, 91, 467-474.
Weeks, J. R. Experimental narcotics addiction. Sci. Amer., Mar. 1964,
210, 46 -5 2 .

- 382-

Captulo 17 CONTINGNCIAS AVERSIVAS

Nossas discusses sobre o comportamento operante tm, at aqui, lidado exclusiva


mente com casos em que, pela manipulao da correlao entre uma classe especifica
da de resposta c eventos tais como alimento c gua, ocorrem certas mudanas no
comportamento. Aquisio, discriminao, esquemas dc reforamento, diferenciao,
aproximaes sucessivas e encadeamento so as denominaes dos procedimentos
especficos que ditam a forma precisa da correlao resposta-reforamento. O termo
impulso agrupa as variaes 110 comportamento operante que esto sob o controle dc
operaes que alteram o valor reforador daqueles reforadores. Em todos os diversos
procedimentos tratados, o comportamento mantido por reforadores que so
definidos como estmulos que tm a habilidade de aumentar a probabilidade das
respostas que seguem. Volt amo-nos, neste captulo, para uma nova classe de estmulos
reforadores que no preenchem essa definio de reforadores positivos, embora
modifiquem c mantenham o comportamento de maneira caracterstica.
17.1 REFORADORES NEGATIVOS
Pouco mais do que a observao casual necessria para se detetar que, sob
circunstncias apropriadas, a re m o o de certos eventos ambientais exerce efeitos
comportamentais poderosos. Observamos que as aves encontram abrigo durante as
tempestades, os ces dirigem-se para a sombra quando o sol do vero incide sobre eles
e as pessoas fecham as janelas quando o barulho do trfego est alto. Nesses exemplos,
o comportamento emitido remove ou termina algum evento ambiental tal como chuva,
calor e luz, c barulho, listas observaes sugerem a existncia de uma classe distinta de
eventos reforadores. Como a operao que define esses eventos como reforadores
(sua remoo) e oposta, cm carter, quela dos reforadores positivos (definida por sua
apresent ao), eles so conhecidos como re fo r a d o re s n e g a tiv o s (S~ ). Em geral, os
reforadores negativos constituem-se daqueles eventos c u jo t rm in o (ou reduo 11a
intensidade) fortalecer c manter operantes.
Os reforadores negativos incluem os eventos que, no linguajar comum, chamamos
de irritantes , desconfortveis , dolorosos , desagradveis , nocivos c assim por
diante. A maioria desses termos envolve um domnio de referncia no compor tame ntal que, provavelmente, no ser adequado para uma anlise funcional. Com um

-383-

sinnimo para reforador negativo, o termo aversivo mais neutro que qualquer um
desses adjetivos e tem a vantagem dc sugerir a noo apropriada de evitar , mover-se
para longe de ou fugir de uma situao. No laboratrio, os estmulos aversivos
tm, tipicamente, a forma de
choques eltricos, imerso prolongada na gua e certas
intensidades de luz, som e temperatura,
17.2 CONDICIONAMENTO DE FUGA
Podemos verificar a qualidade aversiva de qualquer estmulo tornando sua remoo
contingente a um operante at ento no condicionado. Se a fora deste operante
aumenta, subsequentemente, diz-se que o estmulo aversivo.

eltrico
Figura 17-1. Labirinto em T para estudar o comportamento de fuga (segundo
Meunzinger e Fletcher, 1936).

Um experimento de Muenzingcr c Fletcher (1936) representativo deste procedi


mento de fuga. Um rato foi colocado num labirinto cm forma de T, que continha um
piso de grades eletrificadas. O piso estava ligado a uma fonte de modo que, enquanto
o animal permanecesse na grade, um choque contnuo era administrado cm suas patas
(Fig. 17-1). Uma cobertura sobre o labirinto (no mostrada) impedia o rato de escapar
do choque pulando para fora do aparelho. Mas, havia uma maneira de fugir - o animal
podia se livrar do choque correndo consistcntcmentc para um determinado brao do
T.
O comportamento no labirinto cm T comumente medido cm cada tentativa pela
contagem do tempo que o rato leva do incio at o brao sem choque ou pela
contagem do nmero de vezes que o animal se dirige para o brao incorreto
- 384-

( erros ). Nas primeiras tentativas, o virar para a esquerda ou direita so igualmente


provveis, mas medida que a aquisio da resposta dc virar para o lado seguro
prossegue, as respostas para o lado incorreto diminuem. Vemos a tendcncia media
de 25 ratos na Fig. 17-2. Podemos inferir a partir da diminuio do nmero de erros
na curva da Fig. 17-2 que a resposta de virar para o lado seguro ocorreu depois de 100
tentativas de treinamento.
() processo comportamental representado na Fig. 17-2 exige que ampliemos o
nosso conceito de fortalecimento operante. As respostas podem ser fortalecidas ou
pela produo de reforadores positivos ou pela terminao de reforadores negativos
(S"~ ). A ltima variante

s"R ----->S0

Blocos de dez tentativas


Figura 17-2. Percentagem de respostas incorretas em 100 tentativas de treino de fuga
(segundo Muenzinger, e Fletcher, 1936).

Uma resposta (R) conduz o organismo de uma situao aversiva, S


diferente, menos aversiva,

s0.

para uma

17.3 PARMETROS DE S
A Fig. 17-3 esquematiza os eventos, variveis e relaes inerentes s contingncias de
fuga no reforamento negativo. As variveis independentes de maior interesse na Fig.
17-3 so (1) a intensidade de estmulo aversivo prevalente, (2) a durao do perodo com
estmulo ausente, (3) a quantidade em que a intensidade reduzida
depois da resposta, (4) a natureza da intermitcncir, se alguma, existente entre R e a
terminao ou reduo de S'", e (5) o atraso, se algum, que intervm entre uma R c- o
trmino ou reduo subsequente do estmulo.
- 385-

durao do
perodo sem
estmulo

intensidade

I I

reduo parcial
na intensidade
do estmulo

contingncia
intermitente

!
!

atraso na
terminao

j~*- tempo de reao


Figura 17-3. Variveis nus contingcncias dc fuga.

Se uma fonte dc estimulao aversiva adicionada aparelhagem da caixa de


Skinner, a presso barra torna-se conveniente para o estudo do reforamento
negativo. A caixa de Skinner tem o mrito dc deixar o animal livre para responder a
qualquer momento. Em conseqncia, a taxa dc resposta torna-se disponvel como
uma medida dependente sensvel e ampla dos efeitos comportamentais cm sujeitos
individuais. Para objetivos especiais, o tempo dc reao, RT (ver Fig. 17-3) pode
suplementar tais medidas dc taxa.
Um procedimento usado por Dinsmoor e Winograd (1958), serve como uma
demonstrao-prottipo, assim como ilustra a ao dc alguns parmetros dc S
Ratos
aprenderam a pressionar uria barra quando este era o nico comportamento que
desligava choques clctricos liberados atravs das grades do piso do seu compartimento
experimental. O choque era desligado por 2 minutos aps a presso barra (durao
do perodo sem estmulo), depois do que a estimulao aversiva era restabelecida.
Presses na ausncia de choque no tinham conseqncias especiais. 0 procedimento
simplesmente

Quando o RT entre S e R diminuiu ate um valor assinttico baixo, uma contingncia


dc IV 30 seg foi adicionada ao procedimento:

As respostas eram efetivas para a fuga do choque apenas depois que o choque estivesse
ligado por uma durao mdia de 30 seg. O procedimento gerou uma laxa moderada c
constante de presso barra na presena do choque. O padro do comportamento
assemelha-se resposta reforada com alimento em IV
Dinsmoor c Winograd exploraram os efeitos da variao da intensidade dc S
sobre esta linha-base de resposta dc fuga em IV. Sua tcnica foi a dc iniciar a sesso
com uma determinada intensidade de Spresente, digamos lOOjLiamps, obseivar a fre
qncia de resposta por um perodo de tempo suficiente para obter uma medida
-386-

confivel da taxa, depois dc mudar para um valor diferente dc S , digamos 400


y amps, e repetir o processo. Numa sesso de 2 horas, eles puderam obter medidas da
taxa de fuga para seis valores diferentes de intensidade de S .
O comportamento de um rato durante uma parte da sesso aparece na Fig.
17-4. O registro cumulativo mostra que cada valor dc intensidade de choque controla
uma nica taxa de resposta de fuga. O efeito comportamental da mudana de um valor
dc intensidade para outro (marcada pelos traos) c quase instantneo: independente de
sua taxa anterior, o animal muda abruptamente para uma taxa, apropriada nova
intensidade dc choque.
Quando a taxa total dc resposta colocada cm funo da intensidade dc choque,
restrita a Fig. 17-5A. Essa funo foi obtida do inesmo rato cuja curva cumulativa
aparece na Fig. 17-4. A Fig. 17-5A indica que, na faixa estudada, medida que a
intensidade do choque aumenta a taxa de resposta dc fuga tambem aumenta
continuamente.

Figura 17-4. Respostas de fuga em IV acumuladas para intensidades diferentes de


choque (Dinsmoor e Winograd, 1958).

As Figs 17-5B e 17-5C documentam os resultados dc experimentos semelhantes


com outros agentes aversivos. A Fig. 17-5B ilustra os efeitos do aumento da
intensidade de um som sobre a taxa de presso barra em IV de fuga, cm gatos. Os
resultados da Fig. 17-5C loram obtidos dc um grupo dc ratos que, pressionando um
painel sob contingncias dc IF, terminavam luzes de vrias intensidades. Tanto o painel
(B) como o painel (C) da Fig. 17-5 demonstram que os mximos no comportamento
de fuga ocorrem quando a intensidade do estmulo aversivo c muito grande. O
declnio nas respostas associado com eventos aversivos muito intensos no c bem
compreendido. Pensa-se que ele seja devido a um efeito supressivo geral (cmocional)
dos estmulos aversivos fortes.
- 387 -

choquc eltrico
(microamperes)

(A)

Nvel do rudo
(millivolts)

luz incandescente (milliamberts)


a

(B)

(C)

Figura 17-5. Taxa de resposta de fuga em funo da intensidade do estmulo


aversivo. A abscissa est em unidades logartmicas (A) Dinsmoor e Winograd,
1958; (B) Barry e Harrison, 1957; (C) Kaplan 1952.

Ser conveniente fazer um paralelo ocasional entre o reforamento positivo c


negativo. A que varivel, no campo do reforamento positivo, podemos perguntar,
corresponde a intensidade dc um estmulo aversivo? Superficialmente, a intensidade
dc um reforado negativo parece anloga magnitude de um reforador positivo. A
intensidade dc S
e a magnitude dc S 1 so, ambas, propriedades de estmulo do
reforador e o aumento cm ambas as variveis gera aumento nas respostas (ver seo
J6.2). Mas, uma anlise mais profunda do papel funcional que essas duas variveis
desempenham no reforamento negativo e positivo, respectivamente, sugere que a
analogia apenas superficial. O principal efeito do aumento na intensidade de uma
luz, um som, ou um choque, de um valor baixo para um valor alto, c que o
reforamento do comportamento lorna-se possvel atravs do trmino da nova
intensidade. O aumento na intensidade de um S
tem, assim, a lgica de uma
operao de estabelecimento dc reforamento: torna possvel o fortalecimento do
comportamento. Assim, na presena de uma intensidade fraca de luz, um rato no
apresentar o condicionamento de uma resposta que
termine a luz. Assim, tambm,
com um pequeno valor de privao dc alimento, uma resposta que produz alimento no
ser fortalecida. Por outro lado, valores altos de ambas
intensidade do choquc e
privao de alimento
tornam possvel usar a terminao do choque e apresentao
de alimento como reforadores para condicionar operantes. Se as funes das Figs.
17-5 e aquelas na seo 15.8 forem examinadas, ser encontrado um paralelo na
maneira em que as horas de privao e a intensidade de S controlam o comporta
mento. Tais consideraes implicam num status conceituai interessante para os
estmulos aversivos. Sua apresentao simultaneamente uma operao de impulso e
negaiivameue reforadora.
H, naturalmente, uma varivel no campo do reforamento negativo que corres
ponde magnitude dc S 1. Considere a durao do tempo que decorre entre o trmino
de um estmulo aversivo e seu restabelecimento subsequente, indicada como a durao
do perodo sem estmulo na Fig. 17-3. Fis aqui uma varivel independente que
corresponde estritamente magnitude ou durao de S*. Quanto maior a durao do
perodo com o, estmulo aversivo ausente, maior a fora da resposta de fuga. Usando
uma contingncia de fuga em crf e medindo o Kl da presso barra ao S
Dinsmoor e Hughes (1956) obtiveram o gradiente de reforamento de fuga reproduzi
do na Fig. 17-6. Quando as presses barra produziam um perodo longo sem cheque.

-38 8-

o rato respondia prontamente ao aparecimento do clioque. Mas, quando perodos


pequenos sem choques eram a conseqncia do pressionar, os RTs ao aparecimento do
choque eram longos, indicando que estes valores pequenos de durao do perodo sem
choque proporcionavam pouco ou nenhum reforamento. No c necessrio que um
operante termine completamente um estmulo aversivo para que seja fortalecido. A

1 igura 17-6. Tempo dc reao (RT) de fuga em funo dc vrios valores de durao
do perodo sem choque (segundo Dinsmoor e Hughes, 1956).

simples reduo do nvel de intensidade do estmulo c quase sempre suficiente para


condicionar e manter o comportamento operante. Pequenas redues na intensidade,
quando contingentes presso burra, formam a base dc um procedimento para medir
o nvel de estimulao aversiva que um organismo ir tolerar (Weiss e Latics, 1959,
1963). Neste procedimento, cada presso barra produz uma pequena diminuio na
intensidade de um estmulo aversivo prevalcntc. Um perodo fixo de tempo sem uma
nica presso barra produ/ um pequeno aumento na intensidade do estmulo. As
relaes entre R e S sto ilustradas esqucmulicamentc na Fig. 17-7. A primeira R
emitida na Fig. 17-7 reduz a intensidade de S um pouco. Uma segunda R segue logo
a primeira R e a intensidade diminui um pouco mais. 0 critrio de tempo, ento,
decorre sem que alguma resposta ocorra e, como resultado, esse S 6 aumentado um
pouco. Passa-se mais um perodo sem uma R e outro aumento em S ocorre. As
prximas 6 Rs ocorrem com freqncia suficiente para diminuir a intensidade aversiva
ao nvel dc zero. Subsequentemente, a intensidade aumenta por trs ve/.es na ausncia
de outras respostas emitidas.

S
i i_________ i i i

0 seg. f Tempo i______ i______ i--------- 1--------- --------- 1--------- 1--------- 1---------LF ig u r a i 7-7.

-3 8 9 -

liste procedimento age dc modo a originar um estado dc equilbrio. O organismo


conserva uma taxa de resposta que mantm a intensidade de S * dentro de uma
pequena faixa de intensidades (usualmente baixa). Quando o S~ choque elctrico, esse
equilbrio denominado nvel de tolerncia ao choque. O nvel real mantido varia
com um nmero de parmetros do procedimento e sensvel administrao de
certos agentes farmacolgicos, tais como analgsicos c anestsicos. A Fig. 17-8 ilustra a
estabilidade comportamental tpica que esse procedimento gera. Alm disso, a figura
mostra o resultado comportamental da administrao intravenosa de uma pequena
quantidade dc morfina num macaco rhesus trabalhando neste procedimento. (A Fig.
17-8 significa um registro bem detalhado e ampliado do contorno de S' da Fig.
17-7). A injeo dc morfina seguida rapidamente por um aumento da tolerncia ao
choque a um novo nvel de intensidade, que pcrmanccc pelos 40 minutos restantes
apresentados. O efeito confirma as propriedades clnicas bem conhecidas da morfina, e
sugere que o procedimento fornecc um instrumento experimental adequado para medir
as propriedades analgsicas dc vrias drogas.
25
20

"3
d>

2 3
- , 0i f
-5

0
Figura 17-8. Efeito da administrao intravenosa de sulfato de morfina, 0,25 mg/kg,
sobre o nvei de tolerncia ao choque. O registro iido da direita para a esquerda
(Weitzman, Ross, Hodos e Gaiambos, 1961).

17.4 ESTMULOS AVERSIVOS CONDICIONADOS


Quando fugimos de um carro que vem cm nossa direo, desviamo-nos de um
murro intencional e samos de um campo dc golfe ao ver nuvens dc tempestade, nosso
comportamento toma a forma dc fuga dc estmulos que no so aversivos em si
mesmos. Veculos em nossa direo, brao levantado c uma nuvem escura so eventos
cujo significado deve ser adquirido de algum modo. Parece existir uma classe de
estmulos aversivos adquiridos que podem ser apropriadamente chamados de reforado
res negativos secundrios. Para analisar a maneira pela qual os estmulos adquirem
propriedades de reforadores negativos secundrios, leremos que recorrer aos conceitos
do condicionamento clssico. Acontece que uni evento ambiental originalmente neutro
adquire propriedades aversivas se ele emparelhado, de maneira Pavloviana, com
eventos como choques, sons intensos e luz. Estes ltimos agentes aversivos tem uma
funo comportamental dupla. Eles lm tanto o status dc reforadores negativos
primrios (S ^), como o de eliciadores incondicionados (S 2 ) do aumento na axa
cardaca, respirao rpida e outros respondeutes. Quando u mS j emparelhado com

- 390 -

um desses eventos S 2 , S\ passa a (1) evocar uma CR semelhante a R2 pelas leis do


condicionamento respondente; c (2) adquirir poder aversivo.
A maneira atravs da qual as propriedades dc reforadores negativos so conferidas
s situaes anteriormente neutras pode ser demonstrada, no rato, com o aparelho
visto na Fig. 17-9. Dois compartimentos esto separados por u m a porta que pode ser
aberta, deixando uma barreira entre eles. Cada compartimento tem um piso gradeado
atravs ao qual podem ser liberados choques. Lmpadas e alto-falantes fornecem sinais
quando desejados. Uma vez que conseqncias especiais podem ser contingentes ao
pular a barreira de um compartimento para o outro, isto e, ao ir e voltar para um e
outro compartimento, o aparelho comumcntc conhecido como caixa do vai-e-vem.

Figura 17-9. Uma caixa do vai-e-vem para o estudo do controle de estmulo aversivo
(segundo Miller, 1951).
- 391 -

Brown c Jacobs (1949) colocaram ratos num compartimento de uma caixa do


vai-e-vcm e emparelharam um tom pulsantc h luz (S j) com 6 seg. dc choque
inevitvel (SJ). Vinle e dois emparelhamentos de Sj c S2 foram administrados cm um
perodo dc dois dias. O choquc foi ento permanentemente desligado e testaram-sc as
propriedades aversivas de Sj. A porta entre os compartimentos foi levantada, S\
apresentado e estabelecida uma contingncia tal que qualquer tentativa dc pular para o
outro compartimento terminava o Sj toin-luz. 0 efeito das tentativas dc teste foi
condicionar o saltar a barreira. Desde que o choquc nunca foi apresentado no teste, esse
condicionamento deve ter sido a conseqncia da fuga do Sj tom-luz. E desde que os
ratos normalmente no tentam escapar dos tipos de tons c luzes usados neste
experimento, a operao de emparelhar os tons c luzes com o choquc deve ter sido
crtica.
Ao testar o reforamento positivo condicionado (seo 11.1), podemos lembrar,
permitiu-se que um novo operante produzisse um S^, mas o reforamento primrio foi
removido. O novo operante foi inicialmente fortalecido em virtude do
contingente,
mas, medida que o tempo passava, o
perdia o seu poder de reforador
condicionado, uma vez que no mais estabelecia a ocasio para o reforamento
primrio. Esla perda apareceu como um declnio eventual na fora do novo operante.
Um aumento similar e uma queda na probabilidade de um novo operante ocorrcin ao
se testar o podor de um estmulo aversivo condicionado. No teste da caixa do
vai-e-vcm, cada vez que tom + luz apresentado sem choque, ocorre uma tentativa dc
extino Pavloviana. Isto , o tom + luz perde algumas das propriedades cliciadoras
que lhes foraih conferidas pelos emparelhamentos prvios com o choque. Com a
extino do poder eliciador dc Sj ocorre uma reduo gradual no poder de S\
reforar negativamente uma resposta. O resultado, naturalmente, que, cm ccrto
ponto, os ratos param de pular a barreira quando Sj apresentado. No experimento
de Brown e Jacobs, o RT de pular a barreira ante o aparecimento de S\ diminui nas
20 primeiras tentativas do teste; ento, nas 20 tentativas subsequentes, o RT comea a
aumentar, indicando que o poder controlador do tom-luz est diminuindo. Precisamos
ter essas relaes dchcadas cm mente quando lidarmos com os fenmenos das sees
seguintes.
17.5 CONDICIONAMENTO DE ESQUIVA
O fenmeno do comportamento de esquiva levanta um problema geral con
cernente ao lugar da inteno na metodologia cientfica. Dizemos que viramos o
volante de um carro que derrapa, na direo oposta derrapagem, para evitar uma
batida; que se constri uma ponte de um certo modo para evitar sua queda; que um
veado foge a fim de evitar um lobo que o persegue. O termo para , ou a fim de ,
d uma certa qualidade intencional ao comportamento. O objetivo de um determinado
ato e, consequentemente, sua explicao aparente, fornecido numa proposio das
conseqncias aversivas ou indesejveis que teriam ocorrido se no fossem evitadas pelo
ato. As explicaes propositais ou teolgicas so geralmente rejeitadas pelos cientistas
com o argumento de que tais explicaes propem que um evento futuro (e, logo, no
existente) seja a causa de um evento presente (existente) e porque as explicaes
propositais nada adicionam aos fatos. Dizer, por exemplo, que uma pedra cai ao cho
a fim de retornar a seu lugar natural de repouso, a terra, nada mais diz que a

- 392-

proposio puramente descritiva: as pedras caem na terra. E, alm disso por parecer
ser uma explicao suficiente, a proposio teleolgica tende a desencorajar um exame
adicional do fenmeno, pospondo assim uma anlise funcional.
A explicao, na cincia, um assunto complexo e de muitas facetas, mas alguns
estudiosos acham que ela pode ser reduzida a (1) descries extensas dos eventos em
questo, incluindo suas relaBes com outros eventos; e (2) familiaridade com estas
descries e relaes. A explicao cientfica, de acordo com este ponto de vista, cm
grande parte um problema de fornecer relaes entrelaadas entre os fenmenos da
experincia sensorial. Eventualmente, essas relaes tornam-se to familiares que
parecem lgicas, ou auto-evidentes. Assim, as reformulaes radicais de uma gerao
so o bom senso da gerao seguinte. Compare este tipo de explicao com a do
tipo proposital. Embora achemos estranho, 300 anos depois de Galileu, pensar que as
pedras possuem um desejo de retornar terra, frequentemente, content am o-nos em
considerar o comportamento como sendo dirigido pela vontade ou inteno. Todavia,
assim como o propsito irrelevante para explicar a queda das pedras, tambm o
para a anlise do comportamento. Dizer que os organismos respondem para (a fim de)
produzir reforadores no traz mais informao do que dizer que eles respondem
quando suas respostas so frequentemente seguidas por reforadores.
Frequentemente, propem-se explicaes teleolgicas para o comportamento de
esquiva. Ao dizermos que nos abrigamos, quando vemos uma nuvem de tempestade
para no ficarmos molhados, estamos implicitamente invocando uma explicao
proposital para o nosso comportamento. Todavia, nossa proposio (ou crena) no
constitui uma explicao no sentido tcnico descrito (a saber, uma proposio de
alguma relao funcional entre o comportamento que est sendo descrito e alguma
outra varivel), mas meramente uma reproposio dos fatos quando o cu est
escuro e trovejando, movemo-nos de um certo modo. A esquiva de um evento
ambiental que ainda no aconteceu (a chuva) dificilmente pode controlar o com
portamento presente. Supor que isto poderia acontecer criar o problema lgico de
como explicar um evento em termos de outro evento que ainda no ocorreu. Em vez
disso, procuramos uma explicao (descrio) do comportamento em termos de
variveis que (1) atuam por ocasio do comportamento, e (2) agiram, no passado, em
condies similares. Ao fazer isto, baseamos nossa explicao nos conceitos intro
duzidos nas trs sees anteriores.
Iniciamos nossa anlise do comportamento de esquiva com uma demonstrao
experimental do fenmeno. Talvez encontremos, no exame cuidadoso dos eventos
comportamentais que ocorrem na situao de esquiva, algumas relaes invariantes nas
quais possamos basear uma explicao mais aceitvel do fenmeno.
Brogden, Lipman e Culler (1938) colocaram cobaias em rodas de atividade
individuais. Um tom de 1000 cps era apresentado ao animal e, 2 seg mais tarde, um
choque era administrado atravs do piso da gaiola. Se o animal corresse na roda,
fazendo-a girar 2,5 cm ou mais quando o som se iniciava, ele poderia evitar o choque.
O girar a roda atravs da corrida tambm terminava o som. Note a estrutura bsica
para os paradigmas de esquiva. Primeiro, ocorre algum evento ambiental de aviso (o
tom); ento, aps um lapso de tempo, segue-se um segundo evento ambiental, aversivo.
Enquanto isso, h uma contingncia estabelecida por um experimentador ou pela
natureza - de modo que, se uma resposta especificada ocorre entre o aparecimento do
primeiro estmulo e o aparecimento do estmulo aversivo, o estmulo aversivo
omitido e o primeiro estmulo terminado.
- 393-

- No experimento de Brogden, Lipman e Culler, as cobaias aprenderam a girar a


roda, e, assim, evitar o choque em quase todas as tentativas. A Fig. 17-10 relaciona o
aumento observado na percentagem das respostas de girar a roda com o nmero mdio
de dias em que cada percentagem particular foi atingida.
100

80

S' 60
I

40

"7*----------s

/S
\\
V\
\\

20

//

/
s
*s
*
*
s/
s*

//
//

s
ss

\
\
\\
\
2

Mdia do nmero de dias de treinamento


Figura 17-10. Aquisio do comportamento de esquiva. Dados de quatro cobaias
(segundo Brogden, Lipman e Culler, 1938).

Os fatos sobre a esquiva so claros, mas sua representao um outro problema.


evidente que o fortalecimento comportamental observado no condicionamento
operante por reforamento positivo, desde que nenhum reforador positivo era
contingente resposta. Parece pouco provvel que o girar a roda tenha sido
condicionado classicamente, uma vez que a resposta tem um carter de emisso. Mas
ser conveniente considerar a possibilidade. O paradigma

Si > Rj
[17.1]
S2 -----> R-2

onde S j =
S rRj =
R^ =
C =
K
- 394 -

tom dc 1000 cps


choque elctrico
no mdida
correr, pular, guinchar, etc.
semelhante a R 2 ,

aparentemente, e adequado. Note, todavia, que o Diagrama [17.11 no descreve o


efeito que o correr na roda (CR) tem sobre o choque (Sj).
No verdadeiro
condicionamento Pavloviano, a CR no impede a ocorrncia de S2- Quando um
cachorro passa a salivar ante um som, a salivao no evita a ocorrncia de alimento.
O fato de a resposta condicionada na esquiva evitar a ocorrncia de S2 pode ou
no ser significante. Brogden, Lipman e Culler supuseram que se o correr que eles
observaram era realmente uma CR, ento a omisso do choque no deveria fazer
qualquer diferena no comportamento de correr. O procedimento Pavloviano
meramente uma prescrio para emparelhar dois eliciadores. Realizou-se, ento, um
segundo experimento em que o tom de 1000 cps era apresentado e, 2 seg mais tarde,
o choque era administrado como no primeiro experimento. No segundo experimento,
todavia, as respostas de correr que ocorriam antes do choque no tinham efeito na
liberao subsequente do choque. O experimento, ento, proporciona um emparelhamento estrito de um S\ e S j. Se a resposta de correr condicionada pelos
princpios Pavlovianos, deveramos esperar que o novo reflexo S\
CR (Tom-Correr)
aumentasse em fora.
Os resultados do experimento, vistos na Fig. 17-11, so nitidamente diferentes
daqueles do primeiro experimento, vistos na Fig. 17-10. Durante o segundo experi
mento, a fora da resposta de correr flutuou, aumentando vagarosamente at um
mximo (cerca de 50 por cento das tentativas dirias no 13o. dia) e, ento, declinando
at um nvel baixo, prximo de zero, l pelo vigsimo d ia (5000^ tentativa), quando o
experimento terminou. Contraste este resultado com o desempenho de 100 por cento
dos animais no primeiro experimento (Fig. 17-10) depois de apenas 8 dias (120
tentativas). O fracasso em se condicionar o correr atravs de um procedimento
Pavloviano elimina a possibilidade de que o condicionamento de esquiva seja um tipo
de condicionamento respondente.

dias de treinamento
1- iguni 17-11. Percentagem dc respostas dc correr, quando o correr no evita S?
(segundo liroirden. I ipinan c Cuiier, 193S).
~

- 395-

O condicionamento de esquiva nem um fortalecimento operante por refor


amento positivo nem um caso de condicionamento Pavloviano. Seria um tipo de
treino de fuga? Se examinarmos com ateno os dois experimentos de Brogden,
Lipman e Culler descobriremos que ambos fornecem condies necessrias para se
estabelecer um reforador negativo secundrio. No primeiro experimento, o expe
rimento de esquiva, o correr antes da apresentao do choque terminava o tom. Na
seo 17.4, mostramos que esta contingncia servia para fortalecer o operante, R.
sr

R > s0
onC*e ^ = um estmulo aversivo condicionado
R = um operante
So = uma situao em que
S\ noest

presente,

Essas condies, afirmamos agora, so exatamente aquelas encontradas durante o


condicionamento de esquiva. No primeiro experimento de Brogden, Lipman e Culler, o
choque era evitvel; mas (crtico para esta anlise) o tom de aviso de 1000 cps era
tambm terminado pela resposta operante. Por haver sido emparelhado com o choque
em tentativas anteriores ao desenvolvimento do comportamento de esquiva, o tom
adquiriu caractersticas aversivas condicionadas. Assim, era a terminao do estmulo
aversivo condicionado, o tom, e no a no-ocorrncia do choque que reforava a
resposta de correr. A esquiva de S2 era um subproduto da fuga do reforador negativo
secundrio.

Podemos agora notar o procedimento para o condicionamento deesquiva. Ele se


reduz a uma contingncia de fuga
em que um
operantereforadopelotrminode
um reforador negativo secundrio:
s;
T ----->S2R -----> S0
Agora, podemos ver que o permanecer ao ar livre na presena de nuvens e troves
fornece estmulos que, no passado, foram correlacionados com a queda da chuva. O
procurar um abrigo nos permite fugir desses estmulos de aviso, sendo a esquiva da
chuva um subproduto. Similarmente, o veado que no consegue correr do lobo (S)
peg o (Sf). Se o veado ainda estiver vivo na prxima vez que um lobo aparecer,
qualquer resposta do veado que remova o lobo do seu ambiente imediato reforada
pelo trmino de um reforador negativo secundrio.
Uma implicao significante do comportamento de esquiva deve ser examinada.
Quando a resposta que remove S\ ocorre, S^- consequentemente omitido. Que
brando-se a correlao S\ - S^T dessa maneira, esperamos que S\ perca gradualmente
s^ias propriedades aversivas condicionadas e que, como resultado disto, a resposta de
esquiva no seja mais emitida, permitindo que S2 reaparea. Atravs de um novo
emparelhamento, S^T renova o carter aversivo de S \. Dados experimentais apoiam a
-3 9 6 -

previso terica de que o comportamento de esquiva , de fato, cclico (Wertheim,


1965). A restaurao ocasionai das propriedades aversivas de S\ significa que o
emparelhamento de Sj^ SJ* , na realidade, intermitente. A intermitncia, pro
vavelmente, mantm a fora aversiva de S\ bem melhor do que se Si fosse
correlacionado toda vez com SJ, pelas mesmas razes porque um estmulo inter
mitentemente emparelhado com alimento um reforador positivo secundrio mais^
durvel. medida que prossegue o treino de esquiva, os emparelhamentos de S\ e S2
tornam-se cada vez menos freqentes, enquanto a durabilidade aversiva de Si continua
a aumentar. Em certo momento, pode se alcanar um ponto onde toda a vida restante
do indivduo no seja bastante longa para que a correlao S j, S f ocorra novamente.
Esta discusso sobre a esquiva tem se restringido aos casos em que o S\ terminado
um estmulo de aviso externo. Casos mais sutis de condicionamento de esquiva
ocorrem quando o prprio comportamento do organismo adquire carter aversivo,
como no grupo de contingncias conhecido por procedimento de Sidman (Sidman,
1953). Podemos fornecer, aqui, apenas um esquema do que talvez seja a variante mais
simples desse procedimento. Se um estmulo aversivo breve liberado para um
organismo depois de T unidades de tempo sem o aparecimento de uma dada resposta,
temos a seguinte contingncia em efeito:

[17.2]

Em [17.2], S~ poderia ser um choque eltrico, R poderia ser a presso barra,


Tx poderia ser qualquer valor fixo, de uns poucos segundos a vrios minutos. Choques
eltricos so liberados a menos que uma resposta seja emitida. O procedimento define
uma contingncia de esquiva que no contm um estmulo de aviso explcito (Si)
anterior ocorrncia de ST. Os animais adaptam-se a esse procedimento respondendo
numa taxa moderada e recebendo poucos dos possveis choques que seriam liberados
(Verhave, 1959). A Fig. 17-12 mostra registros cumulativos do comportamento gerado
por este procedimento. Evidentemente, a ausncia de um Sj de aviso explcito no
impede a aquisio e manuteno do comportamento eficiente de esquiva.
Nossa primeira explicao do comportamento de esquiva depende to criticamente
da noo de um Sj sendo emparelhado com um SJ, que podemos, primeira vista,
perguntar como a esquiva de Sidman se coloca neste quadro. Mesmo no procedimento
de Sidman, todavia, existe a possibilidade de um emparelhamento de certos eventos
com S~. Considere o comportamento de um rato no incio do treino, antes do
desenvolvimento do comportamento eficiente de esquiva. Choques esto sendo libe
rados frequentemente. Ocasionalmente, uma presso barra em nvel operante
emitida, pospondo assim, o choque. Voltemos nossa ateno para o que o rato est
fazendo no momento em que recebe o choque. Ele pode estar colocando o focinho
nos cantos da gaiola, investigando as paredes da caixa, descansando imvel, e assim por
diante. Embora no possamos dizer, com certeza, exatamente o que o animal estava

- 397-

Figura 17-12. Registros cumulativos da resposta de esquiva presso barra durante


a primeira sesso de treino. Os traos verticais indicam choques. O valor de T era de
30 seg. (Verhave, 1959).
X

fazendo ao receber um choque, podemos dizer, com toda certeza, o que ele no estava
fazendo. Ele no estava pressionando a barra. Se estivesse, no receberia o choque.
Logicamente, todo comportamento, exceto presso barra, pode ser emparelhado com
choques da mesma maneira que dada ocorrncia de S\ de aviso nas situaes de
esquiva convencional primeiro emparelhada com o choque. O efeito desse emparelhamento de comportamentos com choques na situao de esquiva de Sidman fazer
com que uma grande parte do prprio comportamento do animal adquira propriedades
aversivas condicionadas. Depois de um certo tempo, muito do prprio comportamento
do rato, exceto sua presso barra, adquire o status de Si de aviso auto-administrado.
Se o rato foge do seu prprio comportamento aversivo, nada h que possa fazer,
exceto pressionar a barra. Pressionando a barra, ele obtm o subproduto usual de
eventos aversivos condicionados - isto , a esquiva de um reforador negativo
condicionado.
17.6 PUNIO
Quando um reforador negativo contingente a um operante podemos falar de
punio deste operante. Uma criana que toca uma chama queimada, um homem que
atravessa na frente dos carros atropelado; ambos os organismos so punidos por agir
de uma dada maneira numa dada situao. No laboratrio, a contingncia de punio
pode ser estabelecida pelo fornecimento de um estmulo aversivo controlado seguindo
a ocorrncia de uma resposta. Por exemplo, presses barra ou bicadas na chave,
previamente fortalecidas acima do nvel operante pelo reforamento positivo, podem,
-398-

agora, ser punidas apresentando-se cnoques na pele aps sua ocorrncia. A sociedade
usou, e ainda usa, o procedimento de punio, numa variedade de maneiras, para
desencorajar certos comportamentos dos seus membros. A palmatria no desapareceu
completamente de nossas escolas; espancamos nossos filhos quando eles se comportam
mal ; e a punio ainda o principal instrumento da justia. O procedimento de
punio parece ser usado frequentemente no porque funcione to bem, mas porque
(1) tem um efeito imediato; e (2) sua liberao e/ou efeitos colaterais so quase
sempre positivamente reforadores para a pessoa que administra a punio. Os
psiclogos clnicos e os psiquiatras referem-se aos indivduos que so positivamente
reforados ao punir os outros, como sdicos. Adiaremos a discusso das condies que
podem fazer surgir o comportamento sdico para o prximo captulo.
Os efeitos imediatos da punio so facilmente observados. Uma criana que ri na
igreja pode ser imediatamente silenciada por um belisco; um cachorro i.ue pula nas
visitas pode normalmente ser controlado por uma pancada com o jornal. Ambs,
criana e cachorro, provavelmente no sero permanentemente- curados de seus
comportamentos indesejveis atravs da punio. No momento, todavia, o compor
tamento indesejvel temporariamente suprimido e essa supresso serve para propor
cionar reforamento positivo imediato para o comportamento do punidor, tornando
ento, mais provvel que ele puna no futuro.
A supresso temporria do comportamento produzida pela punio pode ser
facilmente demonstrada no laboratrio, onde suas caractersticas quantitativas podem
ser apuradas. Num dos primeiros experimentos de Skinner (1938), ratos famintos
foram treinados a pressionar uma barra que produzia alimento num esquema de
reforamento em I F . A presso barra foi ento extinta, retirando-se o alimento.
Alguns dos ratos foram punidos durante os 10 primeiros minutos de extino. A
punio foi na forma de um tapa forte nas patas dianteiras, liberados pela prpria
barra, depois de cada presso. O tapa consistia de um movimento inverso rpido e
forte da barra, provocado por um martelo que nela batia aps cada presso. O efeito
desses 10 min de tapa pode ser visto, comparando-se os processos de extino de dois

Primeiro dia

Segundo dia
Tempo (min)

ligura 17-13. Os eleitos dc uma punio leve (tapa) no processo de extino operante
(Skin tier, 1938).

-399 -

grupos de ratos na Fig. 17-13. Est bem claro, na Fig. 17-13, que os tapas reduzem
imediatamente o responder para bem abaixo de sua taxa normal de extino. Aps os
10 min de tapas a taxa de respostas permaneceu, no primeiro dia, bem abaixo daquela
dos ratos no punidos. Esta supresso de resposta um resultado tpico da punio e
uma especificao parcial dos efeitos emocionais da punio. At agora, os resultados
confirmam nossa expectativa sobre a punio ela suprime o comportamento e tem
efeito* imediato. No segundo dia de extino, todavia, o grupo punido respondeu mais
rapidamente que o grupo no punido, de modo que,no fim de dois dias, o nmero
total de respostas de presso barra em extino, para os dois grupos, era o mesmo.
Somos forados a concluir que a punio leve, tal como um tapa nas patas
durante alguns minutos, no suprime permanentemente o processo de extino
operante; simplesmente adia-o. Fosse nosso desejo eliminar a presso barra comple
tamente, no poderamos usar esse procedimento, j que seu efeito transitrio.
Devemos ser cuidadosos para no supergeneralizar com base nesta nica demons
trao. A punio no tem um efeito simples sobre o comportamento. Seus efeitos
dependem de muitos parmetros do estmulo aversivo - sua fora e durao, por
exemplo. Se um poderoso choque eltrico tivesse sido usado, em vez de um tapa leve.
e/ou tivesse a contingncia de punio permanecido por vrias horas em vez de poucos
minutos, o comportamento seria suprimido por muito mais tempo do que o foi. Alm
disso, o nmero total de respostas no processo de extino teria sido significantemente
atenuado, embora o tempo para alcanar o nvel operante pudesse no ter sido
afetado. A menos que a punio tenha sido extremamente intensa, todavia, uma vez
que cesse, o comportamento eventualmente ressurge. Somente com estimulao
aversiva extremamente forte, a punio pode reduzir permanentemente o compor
tamento para o nvel zero (Holz e Azrin, 1963). Os diferentes efeitos que a punio
pode ter sobre a resposta, dependendo da forado estmulo aversivo, aconselham
cautela ao se fazer qualquer generalizao superficial sobre os efeitos da punio.
irs

Figura 17-14. Representao do labirinto usado por Whiting e Mowrcr


(1943).

-4 0 0 -

No procedimento empregado por Skinner, apenas uma nica resposta, a presso


barra, podia produzir o reforamento positivo. Quando vrias respostas podem
produzir o reforamento positivo na mesma situao, a punio de uma resposta pode
facilitar o deslocamento do comportamento e, se efetuada criteriosamente, ajudar a
aquisio de novos padres de comportamento. Num experimento de Whiting e
Mowrer (1943). ratos famintos aprenderam a percorrer o labirinto visto na Fig. 17-14.
Os ratos colocados na caixa de partida, rapidamente, adquiriram a cadeia de correr
para a caixa objetivo atravs do caminho curto. O comportamento est de acordo com
a Lei do Menor Esforo: dadas duas ou mais cadeias alternativas para o mesmo
reforador, o organismo escolhe aquela que requer menos trabalho. Aps a aquisio,
trs procedimentos foram comparados em termos de sua habilidade para forar os
ratos e usarem o caminho longo. Para um grupo de ratos, A, uma barreira de vidro foi
colocada no meio do caminho curto, de forma que os animais s podiam atingir a
caixa-objetivo atravs do caminho longo. Para um segundo grupo, B, retirou-se o
reforamento para o percorrer o caminho curto e este s era dado se os ratos usassem
o caminho longo. Para um terceiro grupo, C, uma placa eletricamente carregada foi
colocada no meio do caminho curto, liberando um choque para os ratos que tentassem
us-lo. Contudo, se os ratos passassem pelo choque, eles encontravam alimento.
Whiting e Mowrer obtiveram diferenas marcantes nas taxas de ajustamento a esses
procedimentos. Os ratos punidos do grupo C passaram a usar o caminho longo depois
de uma mdia de apenas 6 choques. O grupo da barreira foi 82 vezes barreira antes
de mudar consistentemente para o caminho longo. 0 grupo B, sob extino simples,
correu 230 vezes caixa objetivo vazia atravs do caminho curto, antes de preferir o
longo. Evidentemente, punir uma resposta pude ajudar bastante na aquisio de outra
resposta disponvel.
Esse resultado tem sido corroborado por outros experimentos. Se escolhas
incorretas so punidas e escolhas corretas so positivamente reforadas, num labirinto
T, a aquisio mais rpida do que se apenas se reforar positivamente as respostas
corretas (Warden e Aylesworth, 1927). Deve-se tomar uma precauo na interpretao
de tais resultados. Embora a aquisio de comportamento possa ser acelerada pela
punio de formas indesejveis da resposta, existe pouca evidncia para indicar o que
acontece ao novo comportamento adquirido quando cessa a punio do compor
tamento indesejvel. No estudo de Warden e Aylesworth, por exemplo, poderamos
perguntar se haveria um aumento temporrio nos erros caso os choques para as
respostas incorretas cessassem depois da aquisio.
Esses estudos sugerem uma concluso prtica. Se a punio empregada na
tentativa de eliminar certos comportamentos, ento qualquer que seja o reforamento
que o comportamento indesejvel tenha produzido, ele deve tornar-se disponvel
atravs de um comportamento mais desejvel. Apenas punir as crianas por um mau
comportamento na sala de aula pode ter pouco efeito permanente, salvo gerar uma
averso duradoura pelo estudo. Os reforadores para o mau comportamento devem
ser analisados e a sua obteno deve, talvez, ser permitida atravs de respostas
diferentes, ou em outras situaes. Se no se permite oportunidade suficiente para
atividade fsica s crianas, por exemplo, elas, provavelmente, sero superativas na sala
de aula, com efeitos prejudiciais para o ensino. Recessos freqentes, contingentes ao
trabalho produtivo, em conjuno com a punio consistente da atividade indesejvel,
pareceria ser uma aplicao prtica dos resultados de Whiting e Mowrer. Even-

-401 -

tuaimente, a necessidade de se administrar estimuiao aversiva desapareceria, mdida


que o comportamento punido desaparecesse e fosse substitudo por formas de
comportamento mais desejveis. Mas, para que isso acontea, parece importante
proporcionar uma alternativa recompensadora para as respostas punidas.
Uma classe de comportamento para a qual a punio pode ter efeitos muito
complicados o comportamento que adquirido e mantido por contingncias
aversivas. Qual, por exemplo, o efeito da punio no comportamento estabelecido de
esquiva do tipo descrito na Fig. 17-12? A evidncia que temos no presente indica que,
se o comportamento punido com o mesmo estmulo que o animal foi previamente
treinado a evitar, essa punio no reduz a fora do comportamento. Em vez disso,
pode aumentar sua fora! Se a punio um estmulo aversivo diferente, entretanto,
ela ter seu efeito supressivo usual (Church, 1963; Solomon, 1964).
Um ponto crtico a ser retirado da presente discusso sobre punio a
complexidade de seus resultados. Os efeitos da punio dependem de muitos fatores
para podermos escrever um simples paradigma de Procedimento, Processo e Resul
tados. Os Processos e Resultados dos Procedimentos de punio so variveis e
condicionais ao tipo de comportamento que esta sendo punido, assim como aos
estados de muitas variveis que operam no ambiente presente e passado do indivduo
punido. At que se desenvolvam leis gerais de punio, os subprodutos emocionais que
acompanham a estimulao aversiva sugerem que o seu emprego no controle prtico
do comportamento humano deve ser efetuado com bastante cautela.
Muito do que chamamos punio nas atividades humanas toma uma forma algo
diferente da apresentao de um estmulo aversivo primrio (incondicionado). Quando
punimos uma criana por mentir privando-a de seu jantar, ou quando mandamos um
homem para a cadeia por ter roubado, as conseqncias punitivas so na forma da
remoo de reforadores positivos (condicionados e incondicionados). Ferster (1958)
estudou alguns efeitos comportamentais da remoo de um estmulo discriminativo
positivo contingente a certas respostas. No treino preliminar, a presso barra de
chimpanzs famintos era reforada com alimento, num esquema de intervalo varivel,
numa situao (S^), mas nunca era reforada numa segunda situao (S^ ), As
situaes eram alternadas periodicamente. Este um procedimento padro de dis
criminao, com reforamento intermitente em S ^ Quando uma discriminao estvel
havia sido estabelecida, o procedimento foi modificado de modo que o S ^ s aparecia
(o SD s terminava) seguindo taxas altas de resposta. A remoo do SD era
contingente a um certo padro de respostas de presses barra, isto , taxas altas. Pela
inibio das taxas altas, os chimpanzs foram capazes de evitar perodos de SA . O
efeito da contingncia de Ferster foi produzir taxas de resposta anormalmente baixas
(inibio de taxas altas) que somente voltavam ao normal quando a contingncia de
punio era retirada. possvel que a punio deste tipo evite alguns dos efeitos
emocionais colaterais indesejveis dos estmulos aversivos incondicionados, merecendo
mais estudo como uma tcnica adequada para controlar o comportamento.
17.7 MASOQU1SMO
Diz-se que certos indivduos procuram punio. Os psiclogos clnicos e o?
psiquatras, referem-se a tais indivduos como masoquistas. Que tipo de histria de
condicionamento poderia ter dotado os estmulos aversivos primrios usados na

-402-

punio de propriedades positivamente reforadoras? Muenzinger (1934) mostrou que


tal inverso do valor de reforamento pode ocorrer mesmo em nvel infra-humano. Ele
treinou ratos famintos a correrem num labirinto em T, dando-lhes choque e depois
alimento, ao escolherem o brao designado. Esses ratos adquiriram a cadeia de
percorrer o labirinto mais rapidamente que os ratos controle que eram alimentados
mas no recebiam choque por escolherem o brao designado. Neste experimento e em
outros semelhantes, o choque usado como um
para respostas que so, depois,
positivamente reforadas. Uma escolha correta no labirinto seguida por um choque
que estabelece a ocasio para continuar at o alimento. Este procedimento deve, assim,
ser contrastado com aquele do choque para respostas em
ou incorretas . s
contingncias so:
R(escolha correta) -

s~
R (aproximar-se) -

Sob essas condies, mesmo choques moderadamente fortes podem adquirir o status
de S^s para a aproximao ao alimento e, assim, o status de reforadores positivos
condicionados. Num paradigma convencional de discriminao S^ - S ^ , Holz e Azrin
(1961) liberavam choques para a resposta de bicar a chave, em pombos, reforada com
alimento em S^ mas no em S^ . Eles descobriram que o elemento de punio em S^
passou a controlar taxas apreciveis de resposta. No teste, quando a punio era
administrada durante o S ^ , os animais comeavam a trabalhar rapidamente, como se
estivessem em S^, embora nenhum alimento fosse liberado para tal resposta em S^ .
Esses animais de Muenzinger e de Holz e Azrin realmente pareciam ser masoquistas.
Eles pareciam trabalhar para serem punidos. Quando apreciamos a histria que
transforma choques eltricos, em SDs para respostas que podem ser positivamente
reforadas, talvez estejamos em vias de compreender as causas do masoquismo
humano.
REFERNCIAS PARA 0 CAPITULO 17
Barry, J. J., and Harrison, J. M. Relations between stimulus intensity
and strength of escape responding. Psychol. Rep., 1957, 3, 3-8.
Brogden, W. J., Lipman, E. A., and Culler, E. The role of incentive
in conditioning and extinction. Amer. J. Psychol., 1938, 51, 109
117.
Brown, J. S., and Jacobs, A. The role of fear in the motivation and acqui
sition ot responses. J . exp. Psychol., 1949, 39, 747-759.
Church, R. M. The varied effects of punishment on behavior. Psychol.
Rev., 1 9 6 3 ,7 0 ,3 6 9 -4 0 2 .
Dinsmoor, J. A., and Hughes, L. H. Training rats to press a bar to turn
off shock. J. comp, physiol. Psychol., 1956, 49, 235-238.
Dinsmoor, J. A., and Winograd, E. Shock intensity in variable interval
escape schedules. J . exp. Anal. Behav., 1958, 1, 145-148.
Ferster, C. B. Control of behavior in chimpanzees and pigeons by time
out from positive reinforcement. Psychol. Monogr., 1958, 72,
Whole No. 461.
- 403 -

Holz, W. C., and Azrin, N. H. Discriminative properties of punishment.


J. exp. Anal. Behav., 1961, 4, 225-232.
Holz, W. C., and Azrin, N. H. A comparison of several procedures for
eliminating behavior. J. exp. Anal. Behav., 1963, 6, 399-406.
Kaplan, M. The effects of noxious stimulus intensity and duration during
intermittent reinforcement of escape behavior. J. comp, physiol.
Psychol., 1952, 45, 538-549.
Miller, N. E. Learnable drives and rewards. Chap. 13 in S. S. Stevens
(E d .), Handbook of experimental psychology. New York: Wiley,
1951.
Muenzinger, K. F. Motivation in learning: I. Electric shock for correct
responses in the visual discrimination habit. J. comp. Psychol.,
1934,17, 439-448.
Muenzinger, K. F., and Fletcher, F. M. Motivation in learning, VI.
Escape from electric shock compared with hunger-food tension in
the visual discrimination habit. J . comp. Psychol., 1936, 22, 7 9 -9 1 .
Sidman, M. Two temporal parameters of the maintenance of avoidance
behavior by the white rat. J. comp, physiol. Psychol., 1953, 46,
253-261.
Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938.
Solomon, R. L. Punishment. Amer. Psychologist, 1964, 19, 239-253.
Verhave, T. Avoidance responding as a function of simultaneous and
equal changes in two temporal parameters. J. exp. Anal. Behav.,
1959,2, 185-190.
Warden, C. J., and Aylesworth, M. The relative value of reward and
punishment in the formation of a visual discrimination habit in
the white rat. J. comp. Psychol., 1927, 7, 117-127.
Weiss, B., and Laties, V. G. Titration behavior on various fractional
escape programs. /. exp. Anal. Behav., 1959, 2, 227-248.
Weiss, B., and Laties, V. G. Characteristics of aversive thresholds m ea
sured by a titration schedule. J. exp. Anal. Behav., 1963, 6, 563
572.
Weitzman, E. D., Ross, G. S., Hodos, W., and Galambos, R. Behavioral
method for study of pain in the monkey. Science, 1961, 133, 37-38.
Wertheim, G. A. Some sequential aspects of IRTs emitted during Sidmanavoidance behavior in the white rat. J. exp. Anal. Behav., 1965, 8,
9-15.
Whiting, J. W. M., and Mowrer, O. H. Habit progression and regression
a laboratory investigation of some factors relevant to human
socialization. J. comp. Psychol., 1943, 36, 229-253.

-404-

Captulo 18 COMPORTAMENTO EMOCIONAL

Uma das distines mais antigas a classificao geral do comportamento humano


em emoes e paixes, de um lado, e atos racionais e voluntrios do outro. No
entanto, esta dicotomia respeitvel e constrangedora pouco tem feito para desenvolvei
a anlise experimental dos comportamentos considerados emocionais. Quase sempre,
eles permanecem simplesmente como comportamentos que no podem ser explicados
por causas conhecidas. A emoo tem sido, com efeito, uma categoria de com
portamento do tipo cesto de lixo e os vrios fenmenos a depositados tm
apresentado uma forte resistncia integrao sistemtica. Realmente, muitos
psiclogos atuais, desencorajados por fracassos persistentes na formulao de um
conceito positivo de comportamento emocional, gostariam de afastar o termo
emoo do vocabulrio conceituai da cincia. Eles - prefeririam interpretar os
fenmenos emocionais como estados especiais de motivao ou atividade geral.
Nenhuma dessas tentativas mostra-se completamente satisfatria porque, como ve
remos, uma dissecao conceituai cuidadosa do comportamento emocional revela
certas caractersticas nicas, no incorporadas por outras rubricas comportamentais
unificadoras. Na presente anlise, portanto, reteremos o conceito de emoo, usando-o
com referncia a certas mudanas amplas no comportamento operante; que resultam
da aplicao de operaes ambientais bem definidas. Mas, antes de elaborar essas
relaes, discutiremos um nmero de solues tradicionais para os problemas que tm
sido atribudos ao campo da emoo.
18.1

A EMOO UMA CAUSA DO COMPORTAMENTO OU UM EFEITO


COMPORTAMENTAL?

Antes do fim do sculo dezenove, pensava-se que a emoo era um estado interno
do organismo que, quando induzido, causava um comportamento apropriado por parte
deste organismo. Assim, do ponto de vista tradicional ou clssico, a emoo era uma
causa do comportamento. Ouando, por exemplo, um veado v um urso (S), surge o
mdo (um estado corporal) que seguido por uma R apropriada, correr. Similarmente,
um homem quando contrariado (S), torna-se zangado (estado corporal) e sua raiva
torna-o agressivo, R.
Os comportamentos manifestos supostamente induzidos por estados emocionais

- 405 -

foram classificados bem cedo, e Charles Darwin escreveu um tratado clssico des
crevendo sua utilidade biolgica. O medo, por exemplo, induzindo precauo, pode ter
salvo a vida de muitos animais na histria da evoluo. Assim tambm a raiva
pode ter sido til para destruir certas barreiras fsicas que evitavam a concluso de uma
cadeia de comportamento que levaria a um reforador biologicamente significante.
Outras emoes, tal como a alegria, Darwin sups serem teis para o objetivo de
comunicar a outros organismos prximos que nenhuma ao agressiva viria, e que os
comportamentos cooperativo, sexual e outros seriam agora seguros e reforadores.
Darwin descreveu as posturas elaboradas c os respondentes pelos quais as emoes de
raiva, medo e alegria so expressas nos animais (Fig. 18-1). Poderiam ser iden
tificados padres de resposta bem definidos que eram, de alguma forma, peculiares
espcie e, mesmo assim, apresentavam elementos comuns entre as espcies. O
enrijecimento dos lbios de um homem com raiva, revelando seus dentes caninos, era
interpretado como um vestgio da retrao da boca dos animais que preparam seus
dentes afiados para atacar um agressor. Hoje, raramente mordemos quando com raiva
mas esse padro de vestgio ainda est conosco.
As explicaes de Darwin enfatizam o que podemos chamar de aspectos

Figura 18-1. Hostilidade e nl'ah i ida do cm animais. (1) Hostilidade no co. (2)
Afabilidade no co. (3) Hostilidade no gato. (4) afabilidade no gato (de Darwin,
1872, segundo Yoimc, 1%1).
"
"

- 406-

topogrficos do comportamento emocional. William James, escrevendo no fim do sculo


dezenove, estava mais interessado na seqncia de causa e efeito na emoo. Em
particular, ele estava interessado em refutar a idia de que os estados internos
causassem o comportamento emocional. James props que as mudanas somticas na
emoo (respondentes fisiolgicos) no eram a causa do comportamento manifesto,
mas sim o resultado de padres comportamentais que eram eliciados diretamente pela
situao. 0 bom senso diz: perdemos nossa fortuna, ficamos tristes e choramos*
encontramos um urso, assustamo-nos e corremos; somos insultados por um rival,
ficamos com raiva e lutamos (James, 1890). James argumentou, todavia, que a
proposio mais racional que nos sentimos tristes porque choramos, raivosos
porque lutamos, medrosos porque trememos e no que choramos, lutamos ou
trememos porque estamos tristes, zangados ou com medo, como seria o caso (James,
1890). James inverteu, assim, a seqencia clssica dos eventos na emoo.
Na explicao de James, assim como em todas as tradicionais, o sentimento de
emoo, fosse uma causa ou um efeito, tinha um papel crtico.
fi quase impossvel, para mim, pensar que tipo de emoo de medo restaria se
no estivessem presentes o sentimento da acelerao dos batimentos cardacos e da
respirao ofegante, do.tremor dos lbios e dos membros enfraquecidos, dos arrepios e
das contraes viscerais. Pode-se fingir um estado de raiva e no se apresentar uma
excitao no peito, no ficar com a face vermelha, no se dilatar as narinas, no
ranger os dentes, no se ter um impulso para a ao vigorosa...? E, tal como na
tristeza, o que seria dela sem suas lgrimas, seus soluos, sua sufocao do corao e
suas dores no peito? (James, 1890).
A descrio de James implicava em que os estados corporais que acompanham os
comportamentos emocionais ofereciam uma base para definir as emoes.
Nas dcadas de 1920 a 1930, Walter Cannon, um fisilogo, contestou as sugestes
de James de que as emoes eram distinguidas por estados corporais especiais. Cannon
argumentava que ( 1 ) os estados fisiolgicos para muitas emoes diferentes eram
muito semelhantes e no podiam ser distinguidos; raiva e ansiedade, por exemplo,
proporcionavam mudanas idnticas em muitos respondentes. (2) Os respondentes da
emoo ocorriam em estados no emocionais, tais como exposio a um vento gelado,
exerccio pesado e febre. (3) A droga adrenalina, quando injetada em sujeitos
humanos, produz os respondentes tpicos de medo (dilatao dos bronquolos,
constrio dos vasos sanguneos, liberao de acar do fgado, aumento nos batimen
tos cardacos, cessao da funo gastro-intestinal, etc.) embora os indivduos assim
injetados no relatassem emoo (Cannon, 1927).
Cannon aduziu outra evidncia para provar que o sentimento de emoo no
poderia ser apenas o resultado de mudanas respondentes que ocorrem em situaes
emocionais e, ento, apresentou uma teoria prpria. Os eventos internos que
relatamos como sentimentos so mediados por uma regio especial do crebro, o
tlamo. Sua hiptese foi baseada nos efeitos de leses e estimulao eltrica dessa
regio do crebro no comportamento emocional.
18.2 TRS CONCEITOS DE EMOO
Eventos internos. Apesar das diferenas entre as teorias de Darwin, James e
Cannon, em todas elas eventos privados no observveis (sentimentos ), acessveis
somente ao indivduo que est experimentando, ocupam uma posio proeminente. Os

-4 0 7 -

Diagramas da Fig. 18-2 resumem esses pontos de vista histricos. (L-se ->com o conduz
Clssico"---- S -----
emocional

James (1890)S

Comportamento
emociona]
Eventos

Cannon (1927)- S
emociona]
Figura 18-2. Representao esquemtica de trs teorias histricas da causao
emocional.

Surge um problema metodolgico na determinao de como tratar os chamados


sentimentos de emoo, aqueles eventos to vivamente descritos por James na p .407
Podemos concordar que tais sentimentos realmente caracterizam a emoo, mas
como iremos med-los e control-los? E, na ausncia de uma observao direta, como
podemos pelo menos estar certos de que o sentimento de medo que Smith diz que
tem o mesmo sentimento de medo que Jones diz ter? Um indivduo adquire tais
respostas verbais, como estou com medo , estou triste , estou feliz , atravs do
reforamento pelos pais e outros adultos quando, em criana, ele vocaliza essas frases
na presena de certas situaes, ambientais. Por exemplo, ao ver uma criana tremer e
chorar na presena de um objeto no familiar, um pai pode ser inclinado a dizer voc
est com medo , e a criana, desse modo, poderia adquirir a resposta estou com
medo . Uma histria anloga prevaleceria para outras emoes . Mas a comunidade
que modela o nosso repertrio verbal de emoo nunca olha dentro de ns para
tornar o reforamento contingente ao responder discriminativo na presena de um
estado fisiolgico particular e bem definido. Quaisquer que sejam os elementos de S^s
internos que estiveram presentes por ocasio do reforamento inicial, eles so
p re su m iv e lm e n te os mesmos eventos internos que esto presentes quando o adulto, mais
tarde, relata seu estado emocional; mas esses eventos discriminativosso privados e
permanecem para sempre privados para cada um de ns.
A inacessibilidade de nossos sentimentos ao exame de outras pessoas no os torna
de todo irrelevantes. Eles permanecem inteis como sugesto para onde e quando o
cientista procurar as variveis, relaes e conceitos significantes do comportamento
emocional. como um dado cientfico que eles no alcanam o critrio de
observabilidade da cincia, j que esse critrio estipula que os dados sobre os quais a
cincia constri suas leis devem ser acessveis a todos os que desejam observ-los.
Quando a emoo - como a aprendizagem, memria, motivao e outros fenmenos
psicolgicos tratados em captulos anteriores encontra uma traduo em termos
comportamentais que todos podem validar, est preparado o estgio para sua anlise
experimental.
- 408-

O problema dos eventos privados particularmente enfatizado na emoo apenas


porque o comportamento emocional manifesto frequentemente acompanhado por
mudanas viscerais (estmago, corao, pulmes, etc.) e glandulares intensas e amplas.
Sejam ou no esses eventos mais fortes quando se diz que o comportamento e
emocional , a metodologia para o estudo da emoo exatamente a mesma que a de
outros processos comportamentais. Os sentimentos que podem acompanhar os eventos
viscerais sempre apresentam o problema de serem privados e, portanto, de excluso
cientfica, por mais vvidos_que possam ser para a pessoa que os est experimentando.
Uma suposio razovel a de que os eventos privados inacessveis que chamamos de
sentimentos esto correlacionados com estados fisiolgicos particulares que so aces
sveis observao, dada a instrumentao necessria. realmente recomendvel
dirigir-se para dentro do organismo e investigar as propriedades dos processos
fisiolgicos concomitantes com o comportamento manifesto e isto desempenha um
papel importante no desenvolvimento de um quadro compreensivo de qualquer
fenmeno comportamental. Mas tal investigao fisiolgica no substitui a necessidade
de uma informao slida sobre o comportamento e seus determinantes ambientais.
Padres reflexos. Se desviarmos nossa ateno dos eventos privados, descobrimos
que o problema da seqncia de situao, sentimento e comportamento no mais nos
preocupa da mesma maneira que preocupou James e Cannon. Desde que os sentimen
tos reais no so mensurveis ou manipulveis diretamente, no de interesse crtico,
para ns saber se eles ocorrem antes, depois ou ao mesmo tempo que o com
portamento. J. B. Watson, o homem que tanto preparou a psicologia para a anlise
moderna do comportamento, parece ter sido um dos primeiros a ver isso e, em seus
escritos, encarava a emoo como padres especiais de respostas, eliciados inicialmente
por estmulos incondicionados. Esses padres, ele notou, poderiam ser ligados a
estmulos previamente neutros, atravs de procedimentos de condicionamento
Pavloviano. Partindo de estudos em recm-nascidos, Watson concluiu que havia somente
tres de tais padres que legitimamente eram qualificados como emoes padres X, Y
e Z. A Tabela 18-1 resume o esquema de Watson. Evidentemente, os trs padres
emocionais primrios da Tabela 18-1, X, Y e Z, so os prottipos do que mais
comumente chamamos de raiva, medo e alegria. De acordo com Watson, todas as
outras emoes so baseadas nessas trs, como misturas ou combinaes que surgem
atravs de procedimentos complexos de condicionamento Pavloviano.
Watson preparou uma demonstrao simples para mostrar como o condiciona
mento amplia os controles da emoo. Para uma criana Albert de 11 meses de
idade, Watson mostrou um rato (S j) nunca antes temido e emparelhou a presena do
rato com umas poucas apresentaes de um som alto sbito (S 2 ), produzido pela
batida de um martelo numa barra metlica. O som amedrontava a criana (sndrome Y
de Watson), e servia como o eliciador incondicionado num paradigma Pavloviano. Em
certo ponto, o rato (S \) passou a eliciar, em Albert, uma CR que era muito
semelhante ao comportamento Y: chorar, gritar, retrair-se, etc. A forma condicionada
de medo pode ou no ser exatamente idntica ao medo incondicionado. Para enfatizar
esse ponto, a CR baseada nos reflexos de medo incondicionado geralmente referida
como ansiedade. Em experimentos posteriores, Watson mostrou que essa ansiedade
condicionada podia ser lentamente extinta pelo mtodo usual apresentao de
S\ (o rato) sem o S2 (o som alto).
Uma das vantagens importantes do tratamento das emoes feito por Watson com

-409-

relao ao de seus predecessores que ele formulou a pergunta: quais so as causas


externas do comportamento emocional? Como o prprio Watson frisou, nunca
ocorreu a James ou a algum dos seus seguidores neste aspecto, especular, e muito
menos experimentar, sobre a gnese das formas emocionais de resposta (Watson,
1930, p. 142). A demonstrao de Watson de que as emoes estavam ligadas aos
princpios do condicionamento Pavloviano foi um primeiro passo para a sua anlise
experimental. Realmente, o captulo presente pode ser chamado de Alguns efeitos
complexos do condicionamento Pavloviano, mas ns seguimos a tradio discutindo
esses efeitos como emoes .
TABELA 18-1
A DEFINIO WATSONIANA DAS EMOES DA CRIANA COMO
PADRES REFLEXOS (Compilada por Tolman, 1923)

ELICIADORES

RESPONDENTES
RAIVA (X)

Impedir os movimentos da criana segurando sua face ou cabea; ou segurar


seus braos fortemente junto ao corpo.

Chorar, gritar, endurecer o corpo. Movimentos coordenados de golpear e bater


das mos e braos. Levantar e abaixar
ps e pernas. Prender a respirao.

MEDO (Y)
Remover subitamente todos os meios de
sustentao (deixar cair das mos para
ser segura por um assistente). Som alto.
Empurrar de repente ou balanar leve
mente (logo que comear a dormir ou
logo que acordar). Puxar de repente o
cobertor (quando est adormecendo).

Reteno sbita da respirao. Segurar se (reflexos de segurar). Piscar os olhos,


Franzir os lbios. Chorar.

ALEGRIA (Z)
Acariciar ou manipular uma zona ergena. Fazer ccegas, balanar, embalar
suavemente. Dar tapinhas leves. Colocar
em decbito ventral no joelho do assis
tente.

Se a criana est chorando, ela para de


chorar. Aparece um sorriso. Ela emite
sons.

Operantes interrompidos. Outro passo conceituai deve ser dado para simplificar a
anlise experimental de fenmenos emocionais. Watson endossou o ponto de vista
(como fez Darwin) de que as emoes primrias eram padres complexos de resposta
in condicionada e tomou trs de tais padres como fundamentais. Mas qual a
justificativa que ele possuia para limitar-se justamente a esses trs em particular? Um
som alto por exemplo, um tiro de pistola queima-roupa produzir o padro de

-410-

susto (Fig. 18-3) c uma imensido de outros respondentes. O padro completado em


cerca de 1/2 scg, e contm muitos dos aspectos de um breve ataque de emoo. Mas,
por que no c chamado de uma emoo? Assim, tambm a tosse, o soluo, o espirro,
o lacrimejar dos olhos por causa de uma partcula de poeira, os sintomas da alergia
chamada febre do feno, a palpitao e o enrubescimento depois de exerccios pesados,
e a indigesto depois de comer muito, todos envolvem padres complexos de
respondentes. Contudo, poucos os chamariam de emoes. O que h de especial com as
reaes X, Y, Z que elas, e no esses outros padres, devem receber um status
especial e ser denominadas emoes? Nenhuma resposta satisfatria foi dada, ainda,
a esta questo. No foram encontrados critrios adequados que possam distinguir os
reflexos emocionais dos reflexos no-emocionais. Na sua ausncia, podemos supor que
a definio de emoo encontra-se em outro lugar que no nas caractersticas especiais
de certos padres reflexos.
Um aspecto primordial de todas as emoes a ruptura, distrbio, intensificao
ou mudana geral que ocorre em qualquer de uma variedade de comportamentos
arbitrrios nos quais um indivduo possa estar empenhado no momento em que ocorre o
que ns chamamos de uma situao emocional. Realmente, um homem amedrontado
mais facilmente identificado pela depresso marcante de todas as suas atividades usuais

l iguni 1R-3. Resposta dc susto a uni tiro dc pistola (Lands c Hunt, 1939).

do que por mudanas cardacas, respiratrias ou digestivas especiais. Um homem com


raiva o epitome de um homem com o comportamento interrompido. E improvvel
que um indivduo muito zangado prossiga o que estava fazendo antes de tornar-se
zangado. Agora ele se volta a novos comportamentos; o mais provvel que ele
estrague coisas sua volta, faa rplicas verbais fortes e emita operantes com fora no
usual. Prometa a uma criana uma atividade especialmente atrativa e ela poder,
literalmente, pular dc alegria. Muitos dos comportamentos presentes da criana so
temporariamente interrompidos e outros podem ser intensificados. E o carter especial
- rr* -

dessas mudanas amplas, e rio dos padres reflexos ou dos estados corporais, que se
mostrar o esquema mais conveniente para estudar as emoes.
As operaes que fazem aparecer essas mudanas amplas consistem de dois tipos
principais: ( 1 ) a apresentao ou trmino de reforadores primrios poderosos, e ( 2 ) a
apresentao de estmulos que foram previamente associados com tais reforadores
poderosos atravs do condicionamento Pavloviano. As mudanas amplas em muitos
comportamentos operantes associadas com essas operaes poderiam ser interpretadas
como mudanas simultneas no valor reforador de praticamente todos os reforadores
primrios do organismo. A destruio e o estrago adquirem tal valor reforador para o
indivduo zangado que, momentaneamente, nada mais importante. O homem que
est amedrontado ou desgostoso perde o apetite e o desejo sexual. As pessoas
enamoradas esto frequentemente to envolvidas com os seus reforadores recm-encontrados que elas vivem dc amor exclusivamente, por um perodo de tempo,
negligenciando o alimento e no se empenhando em outras atividades de rotina.
Pareceria que a emoo, como a motivao, classifica um grupo de operaes que
modulam o valor reforador de reforadores primrios e mudam a atividade geral do
organismo. Assim, no devemos nos surpreender em saber que muitas autoridades,
atualmente, tratam os dois tpicos como uma rea unificada. De qualquer forma, h
diferenas nas espcies de operaes historicamente atribudas aos dois campos. As
operaes universais antecedentes associadas motivao so privao e saciao. Na
enioo, as operaes antecedentes so mudanas abruptas de estmulo. Alm disso, o
medo, a raiva e a alegria implicam em mudanas difusas, no especficas, no valor de
todos os reforadores; fome e sede implicam em mudanas algo mais especficas num
grupo mais restrito de reforadores.
18.3 0 PARADIGMA DA ANSIEDADE
Uma parte significante da anlise da emoo como uma quebra das atividades
operantes rotineiras de um indivduo surge dos estudos de um fenmeno de
laboratrio conhecido como ansiedade experimental. A ansiedade produzida por uma
variante da variao de Watson do condicionamento Pavloviano: um estmulo original
mente no aversivo (S l) emparelhado com um estmulo aversivo (S J). A ansiedade
medida observando-se os efeitos que o emparelhamento tem sobre quaisquer atividades
operantes em que o organismo possa estar empenhado. Desde que somos limitados na
faixa de estmulos aversivos que poderamos desejar apresentar para um organismo
humano, geralmente podemos escolher entre macacos, ratos c pombos para serem
sujeitos. Para manter esses animais em atividades operantes por perodos substanciais,
podemos priv-los de alimento ou gua e, ento, trein-los a pressionar uma barra ou
bicar uma chave com reforadores positivo intermitente. Uma vez completado esse
treino, temos um organismo que manter uma taxa moderada de comportamento
operante por um longo perodo de tempo, uma preparao a partir da qual podemos
administrar procedimentos de condicionamento Pavloviano
Um experimento clssico de ansiedade condicionada, o de W. K. Estes e B. F.
Skinner (1941) usando um procedimento Pavloviano superposto a um operante
reforado intermitentemente, como salientamos. Certos refinamentos dc procedimento
foram introduzidos por Hunt c Brady (1951, 1955) e e sua tcnica experimental que
descreveremos. Eles treinaram ratos privados dc lquidos a pressionar uma barra poi

-41 2-

gua , ento, coocaram o comportamento sob um esquema IV de reforamento com


gua. Quando o comportamento em IV se tornou estvel, foram feitos jmparelhamentos Pavlovianos, periodicamente, com um clique (S j) soando por 5 min, seguido por
um choque eltrico breve (S2 ) nos ps do rato.

(A) Resultado tpico durante


um perodo de 15 min.

(B)Primeira tentativa de
condicionamento.

(C) Resposta emocional condicionada

Legenda
Clique introduzido em C,
terminado pelo choque
em S aps 5 min.
Tempo

I'igura lfl-4. A resposta cie ansiedade condicionada ((AR) no rato, como aparece
tipicamente no comportamento operante de pressionar a barra positiva e intermiten
temente reforado (Hunt e Bradv, 1951).

-413-

Algumas das mudanas comportamentais tpicas que se seguiram podem ser vistas
nas curvas cumulativas de presso barra da Fig. 18-4. Estas curvas descrevem
distrbios no operante reforado por gua que estava ocorrendo, distrbios estes que
surgiram devido ao emparelhamento Pavloviano de S\ comS 2 . Na Fig. 18-4A, o rato
estava trabalhando estavelmente na barra. Os reforamentos com gua no so vistos,
mas vrios foram fornecidos durante o perodo visto em (A). A primeira tentativa de
condicionamento Pavloviano (S i, S2 ) vista em (B). Note que, neste estgio, o clique,
S i, no tinha efeito perceptvel na presso barra. O choque, todavia, quando
apareceu, resultou numa breve diminuio da taxa, mas logo o rato estava novamente
trabalhando com estabilidade. O procedimento de emparelhamento foi repetido em
intervalos. Depois de alguns emparelhamentos, ocorreu uma mudana que pode ser
vista na parte central, esquerda, na Fig. 18-4. O rato comeou a responder
irregularmente e com taxa reduzida durante o clique. Enquanto isto, a resposta original
ao choque comeou a se adaptar (seo 18.9), de modo que o choque, em si, afetava
cada vez menos a presso barra. Depois de um nmero de emparelhamentos (em
baixo, direita, na Fig. 18-4), ocorre uma cessao quase completa de presso barra
no perodo de clique. O comportamento operante em processo foi quase completa
mente interrompido pelos emparelhamentos; havia se desenvolvido a ansiedade condi
cionada, na forma de uma supresso condicionada da presso barra positivamente
reforada. A observao do rato durante o perodo de clique, revelou os reflexos
caractersticos do medo: retrao, tremor, palpitao, imobilidade, defecao e mico.
A ansiedade condicionada tem sido verificada em um nmero de espcies e com
um nmero de esquemas de linha-base de reforamento positivo. O resultado geral
uma supresso do responder desenvolvido durante o estmulo de aviso. A supresso
duradoura; pombos mantiveram-na aps um perodo de 2 anos de descanso (Hoffman.
Fleshier, e Jensen, 1963). Logicamente, ento, os efeitos do procedimento de
ansiedade so consistentes e durveis. Mas h alguma razo para se acreditar que o que
estamos estudando em animais no laboratrio tem alguma coisa a ver com a ansiedade
como a conhecemos no homem?
Resta ver se o que chamado ansiedade pelo pesquisador no laboratrio
relevante para as especulaes sobre ansiedade no homem. Certamente no compre
endemos, do ponto de vista clnico, precisamente o que a ansiedade no homem,
enquanto que o pesquisador no laboratrio pode especificar um significado. Tomar
emprestada a palavra ansiedade para os nossos experimentos reflete o julgamento
de que os experimentos contm os aspectos bsicos do que acreditamos, embora
sem prova adequada ainda, de estar envolvido na ansiedade humana (Schoenfeld, p.
75).
Voltemo-nos para alguns aspectos adicionais da ansiedade condicionada. fcil
verificar que a supresso condicionada ocorre no seu mximo para o estmulo de aviso
particular (S i) que foi usado no emparelhamento Pavloviano. Mas tambm ocorre
alguma supresso para estmulos semelhantes a S j, mesmo que esses nunca tenham
sido previamente emparelhados com choque. Pode-se demonstrar um gradiente de
generalizao para a supresso condicionada, testando-se a extenso de supresso
ante estmulos relacionados com o S\ real usado no treino, embora diferentes.
Hoffman e Fleshier, (1961) estudaram essa generalizao da supresso condicio- 414

300

450

670

1000

1500

2250

3400

F re q n cia (ciclo s p o r seg u n d o )

Figura 18-5. Gradientes de generalizao de supresso. O ndice de supresso usado


tem as seguintes propriedades: quando o ndice igual a 1.0, a supresso em Si
total; quando 0, no h distrbio durante S\; e quando menor que 0, h
intensificao da taxa em IV durante S\. Os nmeros esquerda de cada gradiente
indicam as sesses includas.

nada em pombos cuja resposta de bicar era mantida por um esquema de refor
amento com alimento em IV 2 min. Um tom de 1000 ciclos foi usado como
Si e um choque eltrico no corpo do animal como S2 - Aps repetidos emparelhamentos de Si e S2 , o bicar a chave foi suprimido em Si. Ento, o choque foi
permanentemente interrompido, tons de vrias freqncias foram apresentados no
decorrer de 25 sesses-teste e qualquer supresso a eles foi medida. A Fig. 18-5, de
um animal tpico, mostra que no decorrer das sesses 1-5 (a curva superior acima),
ocorreu, quase completa supresso a uma faixa ampla de tons; o gradiente achatado.
Nas sesses subsequentes o gradiente tornou-se gradualmente mais inclinado, medida
que o animal restringia o bicar a chave, bicando na presena daqueles tons mais
remotos do S\ dc treino. Mas, mesmo depois de 25 sesses sem choques, ainda ocorria
uma supresso quase perfeita para o Sj original do treinamento. Esses gradientes de
generalizao indicam, primeiro, que a ansiedade pode se espalhar para condies
muito diferentes daquelas que originalmente a produziram e, segundo, que a ansiedade
condicionada, uma vez produzida, pode ser extremamente resistente extino.
Podemos resumir a informao apresentada sobre ansiedade experimental em seu
paradigma.
DADOS: Um operante, previamente fortalecido com reforamento positi
vo, um eliciador aversivo incondicionado, um estmuloneutro
PROCEDIMENTO: (1) um operante mantido num esquema intermitente de
reforamento positivo, por exemplo R - > S'h
( 2 ) Enquanto as contingncias de reforamento positivo
permanecem em vigor, S\ ocasionalmente emparelhado com
S2

-41 5-

PROCESSO: Ocorre uma supresso gradual da taxa de R sempre que


S\ apresentado.
RESULTADO: R suprimida em alguma extenso mensurvel durante S] e
outros Ss relacionados.
Nossa avaliao do paradigma de ansiedade experimental revela que o emparelhamento de um estmulo previamente neutro com um estmulo aversivo, enquanto o
organismo est empenhado em outras atividades, produz certos efeitos drsticos, e
durveis naquelas atividades. Geralmente, as outras atividades tm se restringido ao
comportamento mantido por esquemas dc reforamento intermitente. Um perfil mais
completo dos efeitos emocionais incluiria informaes sobre discriminao, diferencia
o, encadeamento, soluo dc problema, esquiva e outras linhas-base comportamen
tais. Existem razes para se esperar efeitos caractersticos em cada um desses casos.
Frequentmente, diz-se que a ansiedade moderada facilita a soluo de problema,
enquanto que a ansiedade forte a dificulta. Os procedimentos de ansiedade condicio
nada permitem testes objetivos
dessas e de outras afirmaes. Os efeitos dos
procedimentos de ansiedade condicionada so seguramente mais complexos do que
qualquer proposio simples de supresso . J se sabe que o procedimento de
emparelhar S j , S J >quando superposto a uma linha-base dc esquiva, pode gerar
facilitao da resposta, em vez de supresso. (Sidman, 1960).
A ansiedade experimental, na forma dc supresso da resposta intermitentemente
reforada, tem se mostrado um instrumento de utilidade prtica para o estudo de
diversas variveis experimentais. Brady e Hunt (1955) descobriram que podiam
eliminar temporariamente a ansiedade experimental liberando corrente suficiente, no
crebro do rato, para produzir convulses (um procedimento chamado de ECC o
choque cletroconvulsivo , comum na prtioa psiquitrica). A supresso condicionada
previsivelmente afetada por tranqilizantes que controlam os sintomas da ansiedade
humana. Outros pesquisadores tm estudado os efeitos de vrias leses cerebrais na
supresso condicionada, na busca de estruturas do sistema nervoso central que so
crticas para o comportamento emocional (Brady, 1961, 1962).
18.4 RAIVA
A ansiedade diz respeito apresentao de reforadores negativos. Uma forma
bem diferente de distrbio comportamental ocorre quando reforadores positivos so
removidos. J tivemos ocasio de fazer referncia (seo 5.1) ao breve aumento que
ocorre na taxa de resposta quando uma cadeia de comportamento operante
abruptamente quebrada pela extino. No rato, esse aumento na taxa da resposta
fortalecida acompanhado por uma variedade dc outros comportamentos cujas
caractersticas
morder o manipulandum da resposta, agitao extrema, excitamento
violento implicam como emocionais.
Essas observaes tm seus corolrios nos comportamentos agressivos apresentados
por sujeitos humanos com raiva. Gates (1926) entrevistou estudantes universitrias e
lhes pediu para fazerem uma lista das circunstncias que tipicamente as tornavam
iradas. As moas citaram recusas de convites, atraso de amigos aos encontros, discar
um nmero errado no telefone, falhas na operao de relgios, canetas c mquinas de
escrever, atraso de nibus ou elevadores ou perda de dinheiro, como os precipitadores
mais comuns. Cada uma dessas situaes produzia tendncia fortes para retorquir
-416-

verbalmente, causar danos fsicos a algum, quebrar objetos, retirar-se vigorosamente


da situao, gritar e xingar. Cada uma das causas citadas implica numa extino sbita
de um comportamento previamente reforado, a interrupo abrupta de uma cadeia de
comportamento.
Azrin, Hutchinson e Hake (1966) planejaram uma tcnica para medir experimen
talmente a durao e frequncia de comportamentos agressivos que resultam da
interrupo de uma cadeia dc comportamento. Nesta tcnica, um pombo faminto foi
treinado a bicar uma chave por alimento. Quando o pombo experimental havia
adquirido o comportamento de bicar a chave, um segundo pombo alvo , imobilizado
numa caixa especialmente construda, foi introduzido no compartimento experimental
(Fig. 18-6). caixa que continha o pombo-alvo foi montada de maneira que um
interruptor, colocado sob a caixa, desligava, sempre que esta era sacudida vigorosamen
te. A montagem foi cuidadosamente equilibrada, de modo que os movimentos normais
espontneos do pombo-alvo eram insuficientes para acionar o micro-interruptor, ao
passo que, quaisquer ataques vigorosos que o pombo experimental dirigisse ao corpo
exposto do pombo-alvo seriam registrados. Os ataques ocorreram dentro da previso.
Sempre que as contingncias de reforamento eram mudadas abruptamente de crf para
extino, o pombo experimental, invariavelmente, atacava, o alvo. Os ataques eram
viciosos e agressivos, durando ate 10 minutos.
Os resultados paralelos da interrupo de uma cadeia de comportamento refora
do, tanto em animais como em homens, confirmam a generalidade do paradigma de
frustrao. Seu procedimento , simplesmente, uma extino abrupta de um operante
aps reforamento contnuo. Seus resultados so mudanas amplas na topografia do
comportamento, acompanhadas por mudanas no valor reforador da destruio,
estrago e outros atos agressivos.
So esses comportamentos de raiva condicionados da mesma maneira que o medo
foi condicionado na seo anterior? Num estudo relevante Leitenberg, (1966) treinou
Proteo

Ajuste
da fora

Moi a de compresso

1 igura 18-6. R epresentao csqu em tica da aparelhagem


(Azrin, H u tch inso n e Hake, 1966).

para medir

o a taq u e

- 417 -

ratos, a pressionarem uma barra com reloramento positivo num esquema IV . Durante
a sesso, foi apresentado um estmulo de aviso (S i), seguido poucos minutos mais
tarde por um segundo estmulo (S^ 2 ),que indicava que um perodo de extino para a
presso barra havia entrado em efeito. O procedimento anlogo ao procedimento
de ansiedade condicionada, mas um estmulo correlacionado com extino ( S 4 )
substitui, aqui, o choquc (SA). Depois de poucos emparelhamentos, os ratos de
Leitenberg, aumentaram suas respostas no estmulo de aviso , embora tal aumento na
taxa no produzisse mais reforamento.
_
Podemos especular que essa facilitao da taxa de resposta representa uma
resposta condicionada dc raiva , mas o procedimento de Leitenberg, apenas
sugestivo. Muitos aspectos do comportamento no foram medidos para que possamos
estar certos de que, durante o estmulo de aviso, a probabilidade de comportamentos
agressivos tais como o ataque ou o responder anormalmente intenso pode tambm ter
sido aumentada.
18.5 ELAO
Medo e raiva so aproximadamente descritos como emoes negativas, j que
dependem da apresentao de reforadores negativos ou remoo dc reforadores
positivos. Mas o comportamento emocional no se limita puramente aos exemplos
negativos. Watson identificou a sndrome Z como um padro reflexo incondicionado
resultante da estimulao dc zonas ergenas ou associadas com alimentao (lactente)
Na conversa casual, identificamos os comportamentos como alegres, excitados, agrad
veis e assim por diante. Nosso objetivo, aqui, ser mostrar que essas termos implicam
na existncia de um outro grupo de distrbios operantes que, como a ansiedade, esto
estritamente associados com certos procedimentos dc condicionamento Pavloviano.
Todos j viram uma criana encantada pela promessa da chegada de coisas boas.
Mesmo o adulto pode vibrar com boas notcias. O eo tem um mecanismo tpico, o
balanar a cauda, para indicar seu entusiasmo
quando acolhe seu dono ou quando
est perto de ser alimentado ou acariciado. Tais observaes sugerem que os efeitos do
reforamento positivo no se limitam ao fortalecimento e manuteno do comporta
mento (-perante. Um S+ ou um estimulo que precede S+ 5 parece gerar algum distrbio
comportamental que pode ser chamado de alegria ou elao . Podemos imaginar
facilmente+um procedimento de elao condicionada no qual um S\ emparelhado
com um S2 enquanto o organismo est trabalhando numa atividade operante. mais
difcil predizer os efeitos desta operao. Um homem de negcios trabalhando
diligentemente 11a sua agenda diria quando sabe que acertou na bolsa dc valores e a
dona de casa, no meio dos afazeres domsticos, assando uni bolo, quando fica sabendo
cjue ganhou uma passagem de graa para o Hava, provavelmente tero suas atividades
interrompidas. Contudo, uma questo experimental saber como esta interrupo
difere daquelas chamadas de ansiedade c raiva. A questo implica num programa
sistemtico de pesquisa envolvendo numerosas linhas-base c, talvez, muitos procedi
mentos diferentes dc emparelhamento de S i,S 9 . No presente, temos a oferecer apenas
uma informao experimental restrita acercada realidade da elao condicionada.
Herrnstein e Morse (1957) treinaram pombos a bicar uma chave por alimento e,
ento, estabilizaram a resposta na chave num procedimento que gerava uma taxa
muito baixa dc bicar. Lies reforavam apenas aquelas respostas espaadas de pelo

- 418 -

menos 5 min (drl 5 min, ver seo 8 . 6 ). Quando a taxa de resposta parecia estvel,
um paradigma Pavloviano foi superposto s contingnicas operantes. S\ era uma
mudana na cor da chave seguida depois de algum tempo por S2 , uma apresentao
livre de alimento, idntica ao reforamento usado para manter a linha-base, exceto ,
que a apresentao livre de alimento no era contingente a uma bicada na chave. O
procedimento de Herrstein e Morse produziu uma mudana dramtica na taxa de bicar a
chave durante S]. Antes do procedimento Pavloviano, uma taxa muito baixa e
razoavelmente constante de bicar havia sido mantida
Depois do procedimento
Pavloviano estar em efeito por algumas sesses, todavia, taxas altas de bicar desenvol
veram-se durante S \. A Fig. 18-7 mostra os registros cumulativos da sesso 11 para
seis sujeitos. Em a, o S\ era apresentado, (f indica a apresentao de
, alimento).
Neste experimento, S\ era prolongado por 1 min alm dc s j e terminava em b
embora, aqui, nos preocupemos somente com os efeitos da taxa de a a f. A Fig. 18-7
indica que a maioria dos animais mostra um aumento da taxa a (S \) que dura,pelo
menos, at f (S 9 ). 0 aparecimento rpido do efeito parece anular a possibilidade de
que o aumento da taxa seja devido a qualquer relao supersticiosa do bicar com 0
reforamento livre.

I 8-7. Segmentos de uma hora de elao condicionada (Herrstein c Morse,

-419-

Experimentos semelhantes usando uma linha-base reforada em IV com alimento e


estimulao cerebral positivamente reforadora (ver seo 16.3) como
tambm
demonstram uma facilitao condicionada (Fig. 18-8) durante um estmulo que
consisten temente precede a estimulao cerebral (Brady, 1961).
Um efeito ainda mais sutil desse tipo geral foi observado por Pliskoff (1963). 0
comportamento pode ser mantido sob vrios esquemas IV. alternados diferentes, sendo
que cada IV fica em efeito por um tempo limitado e cada IV correlacionado com
um estmulo especial. Sc um estmulo de aviso (S j) apresentado antes da mudana
(S 2 ) de um IV com um intervalo mdio maior entre as oportunidades de reforamento
para um comum intervalo mdio menor (digamos IV 2 min para IV 1/2 min), podem
ocorrer certas mudanas no responder durante o estmulo de aviso. Quando a mudana
de um intervalo mdio longo para um pequeno, como acabamos de descrever, o
organismo est, na verdade, mudando de um esquema menos favorvel para um mais
favorvel. O procedimento de Pliskoff produziu uma supresso moderada na taxa dc
resposta durante o estmulo de aviso, sugerindo que uma operao dc elao pode
nem sempre aumentar as atividades operantes.

I igura 18-8. 1 acilitao condicionada numa linha-basc cm IVm reforada com alimento
resultante do emparelhamento de S| com um choque cerebral positivamente reforador.
(Brady, 1961)

O estabelecimento das condies gerais que produzem supresso e daquelas que


produzem facilitao esperam por mais trabalho experimental sobre os efeitos emocio
nais gerais dc $3 c do emparelhamento de Sjs com S+s em outras linhas-base
comportamentais. Os poucos estudos descritos indicam como as emoes positivas
podem ser encaradas como mudanas condicionvcis no comportamento operante em
processo.
Esta seo c as duas precedentes completam nossa anlise dos efeitos comporta
mentais dc trs categorias de operaes produtoras de emoo. As operaes so
reflexas, os comportamentos operantes. Mesmo assim, ao contrrio dos fenmenos
operantes comuns, esses que denominamos emocionais referem-se a mudanas em
operantes que no so produzidas diretamente pela alterao de suas conseqncias de
reforamento. Nenhum dos efeitos da ansiedade, raiva ou elao
torna o reforamento
- 420 -

positivo mais provvel ou o reforamento negativo menos provvel. O rato ansioso


na Fig. 18-4 recebe choquc caso haja ou no supresso. O pombo com raiva que
bica seu companheiro vigorosamente no restabelece, atravs disso, o reforamento. O
rato alegre dc Brady (Fig. 18-8) no acelera a ocorrncia da estimulao cerebral
por responder rapidamente. Assim, embora as mudanas medidas no comportamento
sejam mudanas nas taxas de operantes, elas no so controladas diretamente pelas
contingncias de reforamento dc nenhum dos operantes afetados.
Dizer que um efeito emocional no til, aqui e agora no ambiente de laboratrio
do animal, ou no ambiente do homem civilizado, para influenciar a probabilidade dc
reforamento, no significa que ele no possa ter sido alguma vez til para influenciar
a probabilidade de reforamento e que no possa ser til cm outros ambientes. Fm
particular, o comportamento emocional pode ter sido extremamente til para os
ancestrais do indivduo cujo comportamento emocional estamos agora testemunhando.
As sugestes de Darwin a respeito da utilidade biolgica dc comportamentos emocio
nais no ambiente natural j foram salientadas (p. 406). Tais especulaes esto de
acordo com os fatos conhecidos dc que os rcspondent.es emocionais so mediados por
partes do sistema nervoso que, na maioria, so filogcncticamcntc mais velhas que as
partes desse sistema que controlam as capacidades para adquirir comportamentos
operantes complexos. Os comportamentos emocionais parecem estar entre aqueles
comportamentos primitivos cujas potencialidades esto estabelecidas c, como outros
reflexos, eles esto sob o controle de princoios Pavlovianos cm vez de operantes.
18.6

UM MODFLO PARA RFPRFSFNTAR H INTKRRIi Lm^ juinak FLNOMFNOS


HMOCIONAIS

Descrevemos trs padres dc distrbios nos comportamentos operantes estritamen


te ligados a remoo ou apresentao de reforadores, embora, cm muitos casos,
estejam intimamente relacionados a procedimentos Pavlovianos. Uma vez que os efeitos
comportamentais produzidos parcccm lembrar, dc certo modo, os comportamentos
que em ns mesmos chamamos de ansiedade, raiva c elao, mantivemos esses termos
para denominar esses trs paradigmas. Nossa intuio nos diz, todavia, que, mesmo que
esses trs paradigmas correspondam realmente aos fenmenos humanos, eles no
chegam a comcar a esgotar o campo da emoo. Palavras como tristeza, humilhao,
desapontamento, vergonha, culpa, penria, embarao, piedade, amor, ternura, conten
tamento e euforia sugerem que h muitas variantes emocionais sutis no consideradas
na nossa classificao geral de medo, raiva c elao.
Uma variedade de consideraes diferentes tem sido fornecida por filsofos c
psiclogos para esquematizar e representar vrios fenmenos emocionais (Plutchik,
1962). O esquema terico a ser elaborado aqui 6 tirado de duas idias histricas: (1)
que certas emoes diferem entre si apenas em intensidade, e ( 2 ) que certas emoes
podem ser consideradas como compostas dc outras, mais fundamentais. A primeira
idia clara. Raiva, clera c aborrecimento, por exemplo, so palavras que parecem
denotar diferentes intensidades de um distrbio de tipo semelhante. A segunda noo,
misturar emoes puras para formar outras, c mais sutil. H trs sculos, Descartes
argumentava que todas as emoes eram derivadas dc seis paixes bsicas: amor, dio,
desejo, alegria, tristeza e admirao, embora ele no tenha dado nenhuma justificativa
para a escolha dessas seis, em particular, como bsicas. Outros autores fornecem outras

-421 -

istas cujo tamanho varia dc trs a vrias dzias dc emoes bsicas. Nenhum critrio
satisfatrio para selecionar as emoes primrias ou fundamentais foi ainda encontra
do, nem foram analisados detalhadamente os mtodos de composio.
Nossa considerao comea com a afirmao dc que os trs padres citados por
Watson (Tabela 18-1) e descritos como mudanas operantes nas trs sees precedentes
constituem os trs padres emocionais fundamentais. Seu status fundamental deriva-se
do fato de que ( 1 ) em sua forma incondicionada, seus procedimentos exaurem as
possibilidades de apresentao c remoo dc reforadores primrios positivos e
negativos, e ( 2 ) em sua forma condicionada, seus procedimentos exaurem as possibili
dades de paradigmas Pavlovianos simples. A Tabela 18-2 resume as operaes
Pavlovianas c alguns dos seus efeitos comportamentais conhecidos. Na Tabela 18-2, um
trao diagonal em S c uma abreviao da notao que indica o trmino do evento
estmulo reforador. Pode-se observar que a coluna esquerda da tabela exaure as
combinaes possveis dc um S\ com a apresentao ou termino de S+ ou S .
Existem quatro possibilidades lgicas, mas agrupamos duas delas na premissa dc que os
efeitos comportamentais de se terminar um reforador negativo ou apresentar um
reforador positivo sejam bastante semelhantes para permitir um tratamento conceituai
semelhante. Uma segunda suposio que simplifica feita ao se negligenciar as diferenas
entre reforadores particulares positivos ou negativos. Assim, a elao produzida
pelo emparelhamento de um S\ com um reforador sexual no distinguida. no
esquema da Tabela 18-2 da elao produzida pelo emparelhamento de um S\ com um
reforador alimentar. Essas suposies constituem trabalhos hipotticos cuja utilidade
somente a experimentao futura poder determinar.
Tendo estabelecido trs emoes primrias , podemos nos voltar para o problema
de representar outras emoes. Na Fig. 18-9, as trs emoes primrias aparecem como
vetores de um modelo geomtrico.
Tabela 18-2
AS OPERAES EMOCIONAIS PRIMRIAS E ALGUNS DE SEUS EFEITOS
COMPORTAMENTAIS
OPERAO DE
EMPARELHAMENTO
PAVLOVIANO

NOME COMUM
DA
EMOO

Ansiedade

- 422-

EFEITOS SOBRE A ATIVIDADE


OPERANTE

Supresso de operantes positivamente


reforados, Facilitao de operantes nega
tivamente reforados.

Elao

Facilitao dc alguns operantes. Pouca


informao disponvel.

Raiva

Aumentos na magnitude de alguns ope


rantes. Valor reforador de ataque e des
truio umentado.

S-

I igura 18-9. o sistema de coordenada emocional. Um modelo para repre


sentar diferenas dc intensidade nas operaes emocionais fundamentais.

Este quadro de referncia nos permite representar a noo de que algumas emoe:>,
aparentemente, diferentes, podem ser consideradas como correspondentes a diferenas nv
intensidade do reforador positivo ou negativo em que esto baseadas. As emoes
retratadas nos extremos de cada vetor so baseadas nos valores mais fortes dos
reforadores incondicionados relevantes e os termos usados para descrever os
comportamentos so escolhidos apropriadamente. medida que nos movemos em
direo origem, a intensidade diminui. Seguimos Plutchik (1962), ao supor que,
medida que a intensidade diminui, os efeitos comportamentais tendem a desaparecer e
ser menos claramente distinguveis. Isto indicado pela escolha de um sistema que
converge em direo a um ponto (a origem) onde as trs emoes se encontram. Deve
ficar claro que um grande nmero de termos da linguagem comum de emoo poderia ser
colocado em algum ponto nessa estrutura, da qual so vistos apenas trs nveis (alto,
mdio e baixo).
Muitos fenmenos comportamentais aos quais aplicamos o termo emoo no
encontram um lugar na Fig. 18-9, qualquer que seja o nvel de intensidade que
escolhermos. Esses, sugerimos, podem ser considerados como casos de emoes primrias
misturadas. Como as emoes primrias se misturam? De duas formas principais: (1) um
d eterm in a d o S \ emparelhado sucessivamente com duas ou trs primrias,
esquematicamente (por exemplo)
SS+; S 1,S ; S S ; S 1,S+; . . .
(2) Um determinado S\ c emparelhado com um S2 que compreende dois ou mais
reforadores primrios d i f e r e n t e esqucmaticamente (por exemplo)
S lJS \ S l9S \ S l9S \ S u S \ . . .

- 423 -

Como uin exemplo 0a primeira mistura, consideremos o efeito que ocorre quando
uma criana rouba um doce. O doce na mo um S| para o S+ doce na boca; mas c
lambm um S] para punio (S ), que lem uma alta probabilidade de ocorrer. Kssa
combinao particular (um S\ emparelhado primeiro com um S"1 e depois com um S")
ocorre muito frequentemente na natureza para que seus efeitos tenham um nico nome,
culpa. A anlise de Plutchik sugere que, de uma maneira anloga, o orgulho deve ser uma
mistura de raiva e alegria. Logicamente, casos mais complicados podem ocorrer com
outras misturas das trs emoes primrias. Hm alguns casos, os efeitos no se fundem e
falamos de emoes mistas Variando independentemente as probabilidades dc ocor
rncia de cada um dos S2 S, podem ser adquiridas outras sutilezas nos padres de compor
tamento emocional. Assim como o qunico atualmente prepara compostos que no
existem na natureza, emoes experimentais que no surgem comumente no mundo
natural podem ser geradas por vrias operaes compostas de condicionamento.
O caso cm que S2 6 composto de elementos tantos positivos, como negativos (S^)
ilustra um tipo de situao psicolgica de conflito. Se uma dada situao incluc
elementos tanto positivos quanto negativos, os comportamentos dc aproximao c
esquiva podem existir, ambos, com uma alta fora e diz-se que h um confltio entre
Juas cadeias incompatveis de comportamento: aproximar-se versus afastar-se. Uma
criana que ordinariamente evita ou foge de espinafre pode ser colocada numa situao
de conflito se se lhe diz que a sobremesa depende de ela comer o espinafre. O tonar o
espinafre-no-estmago um S ^ para respostas que produzem sobremesas d ao espinafre
um certo valor de reforador positivo que pode ou no superar a averso original. Um
exemplo de um confltio ainda mais forte aparece num experimento dc um psiquatra,
Julcs Masscrman (1946). Gatos famintos foram colocados numa caixa contendo
alimento no seu extremo. Os gatos logo passaram a se aproximar c comer o alimento
sempre que colocados na caixa, lm tentativas posteriores, colocou-se um tubo para
conduzir ar
comprimido perto do alimento, de tal modo que-, assim que o gato
estivesse quase pegando o alimento para comer, uma violenta corrente dc ar era
dirigida para a sua cabea. Masserman descreve o efeito comportamental deste
emparelhamento do comportamento de aproximao reforado positivamente com um
estmulo aversivo, como pnico . No dia seguinte, c subsequente, esses gatos
recusaram-se a se aproximar
do alimento. A corrente dc ar foi, ento, removida
permanentemente (extino Pavloviana), mas muitos gatos nunca mais se aproximaram
do alimento, preferindo a fome. Masserman caracterizou estes gatos como neur
ticos e sugeriu que um procedimento dc conflito deste tipo deve ser o fator
subjacente dc muitas neuroses humanas. Uma interessante observao colateral foi
feita. Antes do incio do experimento, as preferncias alcolicas dos gatos foram
testadas, ofcrcccndo-sc-lhcs leite puro numa tigela c leite misturado com lcool cm
outra. Antes dc experimentar o procedimento de conflito, os gatos invariavelmente
preferiam leite puro, mas depois de experimentar o procedimento de conflito os gatos
de Messerman apresentaram uma preferencia marcante pelo leite alcoolizado .
Misturas ou compostos emocionais podem ser produzidos por procedimentos
Pavlovianos ainda mais complicados. Certos padres emocionais, aparentemente, depen
dem de operaes dc condicionamento bem complexas, muitas das quais no so
possveis sem outras histrias anteriores de condicionamento, ainda mais complicadas.
Considere o caso da remoo no apenas dc um nico S+, mas de um reforador
generalizado (seo 11.4). Removendo tal reforador, removemos efetivamente uma
- 424 -

variedade de reforadores positivos. Mas sem a his Uri a que primeiro torna um S um
reforador generalizado, os efeitos emocionais particulares dc sua remoo no so
possveis. O caso cm pauta, acreditamos, tem uma relao estreita com o fenmeno
que chamamos de tristeza . A morte dc um amigo, a perda de um bom emprego c
eventos semelhantes provocam a tristeza porque, dc uma s vez, uma variedade de
reforadores c perdida, parccc razovel que esse padro raramente seja visto cm
animais, porque os reforadores generalizados so mais comumentc criados nas
sociedades humanas. Mas todos conhcccm o co que, com a morte do seu dono,
apresenta comportamentos bastante parecidos com nosso prprio comportamento dc
tristeza. Na medida em que as operaes sejam plausveis, pode ser possvel gerar esses
ou comportamentos similares em outras espccics. As emoes que usualmente supomos
serem caractersticas do homem podem ser peculiares para ns, no porque os animais
sejam incapazes de possu-las, mas porque suas condies geradoras raramente, ou nunca,
surgem fora das sociedades humanas.
18.7 MEDICINA PSICOSSOMTICA
Definimos emoo como a associao entre certas mudanas amplas nos comporta
mentos operantes cm processo e a apresentao ou remoo dc reforadores. Como
uma relao abstrata entre eventos, a emoo , tal como o impulso, no pode causar
nada sentimentos, comportamentos ou mudanas fisiolgicas. No entanto, as
operaes que do origem a certos comportamentos emocionais, podem, se efetuadas
frequentemente, provocar mudanas corporais patolgicas agudas. Assim, uma emoo
forte e prolongada pode ser correlacionada com hipertenso, bronquite asmtica,
lcera gastrointestinal, dores de cabea c outras doenas. Tem sido reconhecido, h
algum tempo, que certas doenas tem suas origens cm situaes dc tenso; isto c,
situaes cm que figuram estmulos aversivos fortes e/ou prolongados que fazem surgir
comportamento emocional forte e prolongado. Os executivos so propensos a lceras e
certas doenas cardio-vasculare?. 0 surgimento da asma, c', algumas vezes, associado a um
evento amedrontador na infncia c pode ser subsequentemente instigado por cicunstncias moderadamente amedrontadoras. Em geral, a ansiedade crnica c quase sempre
correlacionada com um nmero dc sintomas somticos patolgicos, desde a acne at o
distrbio gastrointestinal grave.
A medicina psicossomtica se especializa no diagnstico c tratamento de doenas
que parecem resultar dos mesmos procedimentos que produzem certos comportamen
tos emocionais condicionados. A realidade das doenas psicossomticas pode ser
demonstrada de forma dramtica em animais no laboratrio, onde podem ser
produzidas situaes emocionais aversivas cujos efeitos so letais para o sujeito. Nos
experimentos dc Brady, Porter, Conrad e Mason (1958), macacos foram treinados a
evitar choques eltricos, atravs da presso dc uma barra, emprcgando-sc um
procedimento semelhante ao da esquiva dc Sidman visto no Diagrama 17.2. Os
choques eram programados a cada 20 seg. e os macacos eram expostos ao procedimen
to por 6 horas consecutivas, aps o que havia 6 h. dc descanso c, ento, 6 h. de
esquiva c assim por dainte, indefinidamente, dia aps dia. Uma luz vermelha era
correlacionada com as 6 h. do perodo dc esquiva.
O comportamento de esquiva tpico gerado por esse procedimento visto na Fig.
18-10. Note que poucos choques foram realmente administrados no perodo dc 6 h

-425-

Uma hora
1 igura 18-10. Uma poro da curva acumulada dc presso barra, mostrando o
comportamento dc esquiva na 18a. sesso experimental consecutiva do procedimento
de esquiva repetitiva com 6 h. dc* esquiva e 6 h. de descanso, s choques so
indicados por pequenos tiacos verticais nos rceislros (Bradv, Porter, Conrad, e
Mason, 1958).
'
*

de esquiva. Depois de poucas semanas, a morte inesperada de muitos dos sujeitos deu
ao experimento uma parada abrupta. A autpsia revelou que os .animais haviam
sucumbido por lceras duodenais perfuradas. Quando esses resultados foram obtidos,
eles sugeriam que o procedimento de esquiva poderia ter sido o agente causai na
produo da lcera e morte dos macacos. Mas outra possibilidade era de que a lcera
fosse um resultado dos efeitos dos choques eltricos recebidos, dia aps dia, e que a
contingncia de esquiva fosse suprflua.
Para testar essa possibilidade, preparamos um experimento controlado ,
usando dois macacos em cadeiras conjugadas'; nas quais ambos os macacos
recebiam choques mas somente um podia evit-los. () macaco executivo' ou
experimental poderia evitar os choques para si mesmo c para o outro atravs da
presso barra. A barra do macaco dc controle era ineficaz. Assim, ambos os
animais estavam sujeitos a mesma tenso Tsicci (i.c; ambos recebiam o mesmo
nmero de choques ao mesmo tempo), mas apenas o macaco executivo" estava
sob a tenso psicolgica de ter que pressionar a barra (Brady, 1958).

426

Uma figura do aparelho err. que os dois animais ficavam por vrias semanas durante o
teste de esquiva mostrada na ilustrao da Parte Cinco ( p.335), o animal executivo
emitia uma taxa alta dc resposta de esquiva durante os perodos de 6 h. dc esquiva c
respondia pouco durante o perodo de 6h. de descanso. O macaco de controle, por outro
lado, raramente pressionava a barra durante o perodo de esquiva ou de descanso , j
que sua b arra estav a associada com a contingncia nula. No experimen
to de controle conjugado, todavia, somente o animal executivo sucumbiu de lceras.
Os macacos dc controle, sacrificados no dia da morte dc seus pares executivos, no
apresentaram qualquer produo dc lcera, sugerindo assim que o fator letal eram
realmente as contingncias dc esquiva prolongada, e no o choquc em si. Estudos
subsequentes indicaram que um fator crtico para a produo dc lceras por esse
mtodo a escolha de um ciclo dc 6 h de esquiva descanso. Outros ciclos no
produziram ulcerao (Brady, 1958).
Do ponto de vista da presente anlise do comportamento emocional, notamos que
o animal executivo o nico dos dois que recebe um emparelhamento Pavloviano
consistente. Apenas para ele, a no ocorrncia de uma presso barra cm 20 seg
(R20) suficiente para proporcionar uma situao (S j) que c consistentcmcnte
emparelhada com choques. Seu parceiro de controle, todavia, recebe choques ocasio
nais, mas esses nunca so consistcntcmentc emparelhados corn qualquer situao
determinada (S j) no seu ambiento. Portanto, o paradigma de ansiedade condicionada
preenchido apenas pelo macaco executivo.
18. 8 O SISTEMA NERVOSO AUTNOMO
Sir Charles Sherrington comentou que, das reas onde a psicologia c a fisiologia se
encontram, uma c a emoo. Ccrlamenle, nenhuma anlise da emoo seria completa
sem alguma descrio das grandes mudanas fisiolgicas que ocorrem sob paradigmas
Pavlovianos de emoo. Alguns psiclogos endossam o ponto de vista de que o
territrio psicolgico dos fenmenos emocionais e exaurido pela anlise dos padres
reflexos c perturbaes dc operantes que so produzidos pelos procedimentos que
descrevemos nas sees anteriores. Tal ponto de visla pode ser tecnicamente correto,
dependendo da definio pessoal de psicologia, mas impe limites disciplinares
arbitrrios que no correspondem aos fenmenos naturais em si mesmos. Notamos em
algum ponto, neste texto, que os limites entre as disciplinas cientficas so quase
sempre traados de forma muito arbitrria e bvio que um cientista interessado nos
fenmenos emocionais pode utilizar-se da anlise comportamental, da fisiologia do
reflexo, da endocrinologia, da neurofisiologia, assim como de outras disciplinas
relacionadas. Numa abordagem introdutria psicologia, nossa obrigao c descrever
os principais efeitos comportamentais das vrias mudanas ambientais. Mas no nos
aprofundamos muito no assunto, notando apenas brevemente alguns dados ncuiotisiolgicos que ajudam a pintar um quadro mais completo do fenmeno em discusso.
A noo de que cada emoo est associada a um padro nico dc respondentes
autnomos aparece na passagem de William James citada anteriormente (p.407).
Todavia, esses vrios padres podem frequentemente ser muito semelhantes e uma
medida bem detalhada de muitos respondentes pode ser necessria para discernir suas
diferenas (Ax, 1953). Em nossa discusso introdutria sobre os reflexos e o
condicionamento Pavloviano simples, salientamos que os procedimentos Pavlovianos
- 427 -

Olho
Glndula lacrimal
Membrana mucosa do nariz e palato
Glndula sub-maxilar
Glndula sublingual
Membrana mucosa da boca
Glndula partida

tstago
Lstmago
Vasos sanguneos
abdominais
Fgado

Pancreas

Intestino Delgado

' Intestino grosso


/

Reto
Glndula suprarenal
Rim
Bexiga

Medula

rgos sexuais
Genitlia externa

I igura 18-11. O lado direito do sistema nervoso autonomo humano ( Kimblc e (iarmezy, 1963)
-42 8-

parecem mais apucavcis aqueles respondentes internos que so mediados por uma parte
do sistema nervoso chamada sistema nervoso autnomo (auto-regulador) (SNA),
representado diagramaticamcntc na Fig. 18-11. O SNA conduz impulsos eltricos do
crebro e medula para os rgos viscerais, nunca ao contrrio. O SNA se divide
funcionalmente em duas partes. Uma chamda o sistema simptico e vista em linhas
pontilhadas na Fig. 18-11. A outra, o parassimptico (para significa paralelo a),
encontra-se anatomicamente acima c abaixo do simptico c visto cm linhas cheias na
Fig. 18-11.
Os fatos que se seguem so dc importncia. Primeiro, os rgos servidos pelo SNA
so precisamente aqueles que, como j indicamos, produzem respondentes,condiciona
dos c incondicionados. O respondeu te respirat rio, o respondents salivar e a taxa
cardaca so velhos amigos do condicionamento Pavloviano. Nos ltimos cinqenta
anos, os pesquisadores russos mostraram meticulosamente que o funcionamento de
quase todos os rgos neste diagrama suscetvel aos procedimentos de condiciona
mento clssico. O SNA to iiHimamcnte ligado ao condicionamento Pavloviano que
se poderia encar-lo como o aparelho anatmico para o condicionamento deste tipo.
Um segundo ponto de interesse a diferena dc tuno servida pelas duas partes
do SNA. Note que as fibras em linhas cheias (parassimpticas) vem tipicamente dc
origens nicas e vo diretamente para seus rgos sem interconcxo ou interao. Hsse
fato anatmico refletido no fato fisiolgico dc que partes diferentes do sistema
parassimptico operam individualmente. As fibras simpticas (pontilhadas), todavia,
vo primeiro para uma cadeia de juno comum (a estrutura vertical longa, vista
parlalcla ao lado direito da medula na Fig. 18-11), onde interagem antes de chegar at
seus rgos. F,stc fato anatmico refletido por uma unidade do sistema simptico, tal
que suas fibras afetam todos os rgos dc uma vez.
Finalmente, podemos observar que cada rgo individual na Fig. 18-1 1 tem fibras
tanto pontilhadas quanto cheias que chegam at ele e assim sujeito a influncias dc
ambas as partes: simptica e parassimptica. Mas os efeitos dessas duas partes em cada
rgo no so os mesmos. De fato, eles so tipicamente opostos. Isto se d cm parte
porque as duas partes liberam produtos qumicos diferentes nos seus pontos terminais
no rgo. O sistema simptico libera uma substncia muito parecida com a adrenalina,
enquanto os nervos parassimpticos liberam uma substncia diferente,chamada acctilcolina. A Tabela 18-3 resume alguns efeitos principais das duas divises do sistema
autnomo.
Fm certa poca, pensou-se que a ansiedade e medo eram eicitos principalmente
simpticos, enquanto a raiva era um efeito principalmente parassimptico. Acredita-se,
agora, que o quadro muito mais complexo e que o resultado de Iodas as operaes
emocionais c a produo de efeitos simpticos e parassimpticos. Quaisquer diferenas
fisiolgicas existentes entre as emoes devem ser devidas a padres diicrentes de
respondentes; isto e, a diferenas sutis na ao simptica e parassimptica. Fsses
padres de respondentes autnomos associados com o comportamento emocional
constituem aquilo que algumas vozes chamado de substrato autnomo das emoes.

-429-

Tabela 18-3
AO RESPONDENTE AUTNOMA (Segundo P. T. Young, 1961)
NERVOS
SIMPTICOS
Dilata a pupila
Inibe a secreo
Reflexo pilomotor
Aumenta a secreo
Contrai
Acelera
Dilata bronquolos
Secreta glicose
Inibe a secreo gstrica
e peristal tis mo
Contrai expelindo
eritrcitos
Secreta adrenalina
Inibe a atividade
de msculos lisos
Contrai
Relaxa msculos lisos

ESTRUTURAS
SOMTICAS

NERVOS
PARASSIMPTICOS

I ris
(ilandulas salivares
Cabelo
Glndulas sudorp iras
Artrias superficiais
Corao
Pulmo
Fgado
Estmago

Contrai a pupila
Facilita a secreo

Medula da suprarenal
Intestino delgado
Artrias viscerais
Bexiga
Colo c Reto

Contrai,
a ereo
Contrai
Contrai
Contrai

Artrias dos rgos


sexuais externos
Vasos deferentes
Vesculas seminais
tero

no orgasmo
no orgasmo
no orgasmo

Facilita a secreo
gstrica e peristatismo

Bao

Relaxa msculos lisos


neutralizando

Inibe
Contrai bronquolos

Facilita a atividade
dc msculos lisos
Contrai msculos lisos
para expelir
Contrai msculos lisos
para expelir
Dilata, causando ereo

Deve ser mencionado que um nmero de demonstraes mostra que a induo


artificial do substrato respondente da emoo no produz tipicamente as outras
propriedades comportamentais da emoo. Por exemplo, a injeo da droga adrenalina
(que atua imitando a ativao simptica) em animais no d origem s interrupes
operantes caractersticas da ansiedade, clera c alegria. Sujeitos humanos que recebem
injeo dc adrenalina relatam uma emoo simulada: eles se sentem como se
estivessem com raiva, como se estivessem alegres, como se estivessem com medo,
e assim sucessivamente. Uma demonstrao realizada por Schactcr c Singer (1962)
indica que esta induo artificial do substrato respondente do comportamento
emocional influencia a sensibilidade do indivduo a situaes emocionais. Assim,
estudantes universitrios injetados com adrenalina apresentaram comportamentos mais
fortes de raiva numa situao geradora de raiva,. mas tambm mostraram comporta
mentos mais eufricos numa situao de alegria do que estudantes no injetados.
Parece que a induo dc respondentes da emoo pode sensibilizar o organismo para as
operaes de emoo.

-430-

18 9 CONTROLE EMOCIONAL, MATURIDADE EMOCIONAL E COMPORTAMEN


TO EMOCIONAI PATOLGICO
____
Sc as cmoocs envolvem comportamentos cliciados, ento que lipo do autocon
trole pode ser exercido sobre eles? Como nossos operantes esto sob o controle dr
suas conseqncias c porque somos capa/es dc observar esse fato, somos inclinados a
tradu/ir isto como um controle que ns' temos sobre eles Mas os respondentes no
esto sob o controle dc suas conseqncias. J notamos como os efeitos dc supresso c
facilitao dos procedimentos emocionais frequentemente no se relacionam s conse
qncias reforadoras de tal forma que parecem no-adaptativos e inteis. Mas os
reflexos emocionais dc uma pessoa so frequentemente aversivos para outros indi
vduos e para ela mesma e a sociedade civilizada exige algum controle sobre o
comportamento emocional. A mudana usual nos padres emocionais, da infncia ate
a fase adulta, c caracterizada por um aumento maior no controle do comportamento
emocional, frequentemente, chamado dc maturidade emocional. Como ela c consegui
da? Aparentemente, existem pelo menos trs maneiras principais de se chegar a tal
controlo.
Quando uma situao que produz comportamento emocional c repetidamente
apresentada, a magnitude da resposta diminui com tempo. Este c o fenmeno
conhecidocomo adaptao ou habituao, citado cm nossas discusses iniciais sobre o
condicionamento operante. A introduo de um organismo numa situao nova
frequentemente produz comportamento de medo: retrair-sc, imobilizar-sc, dcfecar,
urinar, etc. Mas a introduo repetida do organismo nessa mesma situao resulta
numa diminuio gradual dos efeitos. Diz-se que o indivduo sc adaptou, ou se
habituou situao.
Na sociedade, um mtodo importante de modificar o comportamento emocional
o de adapt-lo. Um organismo sujeito ao procedimento dc extino depois de um
esquema de reforamento intermitente no mostra a taxa dc resposta aumentada ou
outras mudanas que chamamos de raiva. Depois que tal organismo tiver tido uma
histria de extino aps reforamento intermitente, seu comportamento de raiva est
ausente porque ele sc adaptou h muito tempo e, agora, dizemos que ele tem uma
alta tolerncia frustrao . Vemos efeitos anlogos na conduta humana. As crianas
choram c gritam quando seus brinquedos so removidos. Os adultos (usualmente)
mostram reaes mais moderadas. O adulto tpico j teve uma longa histria de perder
coisas: teve alguns anos dc adaptao f*.s asperezas da extino c reage correspondente
mente menos. Frequentemente, falamos na superao de nossos medos, indicando que
a sua habituao ocorrc no tempo ccrto. A adaptao no limitada a eventos
aversivos, entretanto. Mesmo coisas boas da vida podem perder sua atrao se nos
tornamos acostumados a elas.
Uma segunda forma de controle ocorre quando disfaramos nossos respondentes
encobrindo-os com operantes opostos. Assim, diz-se a uma criana no deve chorar e
lamuriar, embora ela possa sentir . Na sociedade ocidental, o homem deve reter as
lgrimas, mas a mulher pode chorar. Comportamentos manifestos de medo so
frequentemente repreendidos c somos induzidos a apresentar operantes que ocultem
nossos medos. Sempre que somos advertidos para aguentar firmes, somos encorajados a
contra-atacar, com um operante oposto, o respondente reflexo de csmorecimcnto que
ocorre na fossa . A facc inexpressiva c uma habilidade necessria para o bom
jogador de pquer, mas no provvel que ocorra uma habituao suficiente para
abolir completamente o substrato respondente inobservado gerado por uma seqncia
- 431 -

real de cinco cartas. Bssa sobrevivncia de respondentes autnomos na ausncia dc


outros comportamentos (tal como a expresso facial) caractersticas da emoo a
base do detetor de mentiras que, na relidadc, c um detetor dc respondentes
autnomos. Esse dispositivo consiste de um aparelho para medir a taxa cardaca, a
respirao, resistncia da pele, tenso muscular c outros respondentes. Quando so
feitas perguntas para um suspeito, suas respostas podem consistir dc operantes que
mascaram qualquer reao emocional externa. Mas a mensurao de seus respondentes
autnomos pode desmascar-lo se ele estiver mentindo , j que um homem que
cometeu recentemente um crime, provavelmente, apresentar efeitos seletivos dc
ansiedade para as palavras que descrevam as ccnas c os eventos do crime.
Uma terceira forma de controle sobre a emoo consiste da esquiva, de um lado,
ou produo, dc outro, de situaes que evocam o comportamento emocional. Quando
evitamos um inimigo que provavelmente nos far raiva, ou paramos de jogar golfe
porque jogamos mal continuamente, ou quando vamos a um restaurante onde
frequentemente temos uma boa refeio, evitamos ou produzimos certos reforadores.
Mas, como um subproduto, podemos tambem escapar dc, ou produzir alguns dos
nossos prprios comportamentos emocionais. Nesse sentido, pode-se dizer que exerce
mos controle sobre nossas emoes.
H evidente, com esta considerao breve desses trs mtodos de controle emocio
nal, que o nosso controle sobre os nossos respondentes emocionais carccc do grau de
controle que temos sobre nossos braos, pernas ou cordas vocais. Talvez seja til
apreciar essa diferena na nossa educao das crianas c no nosso tratamento com
outras pessoas.
A sociedade est repleta de situaes geradoras de raiva e ansiedade. Desde a infn
cia , encontramos proibies e conflitos, ameaas e frustraes. Algumas so caprichosas;
outras parecem necessrias para a ocorrncia ordenada das atividades humanas. A
maioria dos indivduos consegue sair dessa histria com um repertrio de habilidades
para evitar eventos aversivos c produzir reforadores positivos, o que c suficiente para
manter a raiva e a ansiedade em nveis tolerveis. Mas alguns indivduos, talvez
porque suas histrias contenham uma quantidade incomum dc controle aversivo, ou
talvez porque, geneticamente, so mais sensveis a operaes geradoras dc raiva ou
ansiedade, no adquirem as habilidades suficientes para um ajustamento satisfatrio s
contingncias da sociedade. J discutimos os casos que caem no terreno da medicina
psicossomtica. Muitos outros indivduos humanos demonstram efeitos drsticos dc
operaes de raiva c ansiedade prolongadas que no podem ser chamadas de doena no
mesmo sentido que lceras, hipertenso c asma. Uma ausncia prolongada de situaes
geradoras dc elao pode tambem tet efeitos adversos, especialmente se o empobreci
mento ocorre cedo na vida. As crianas que so criadas, desde o nascimento, cm
instituies quase sempre recebem comida c cuidado suficientes para sua sade geral,
mas podem no receber a estimulao afetiva e o carinho que as outras crianas obtm
dos pais. Se falta esta estimulao afetiva durante os seis primeiros meses dc vida. esses
bebs frequentemente se tornam crianas c adultos extremamente apticos (Spitz,
1957). As crianas tornam-se abatidas, desinteressadas, mostram estupor, falta de
apetite c desenvolvimento fsico rctardado.Tais crianas parecem no ter a intensidade
usual de comportamento de alegria, bem como dc medo e raiva. L:m resumo, todos os
seus comportamentos emocionais parecem estar altamente atenuados. Algumas delas
-432-

nunca desenvolvem nveis normais dc reforadores positivos e, assim, tem que ser
mantidas cm instituies por toda a vida.
Existem vrios outros estados comportamentais patolgicos aos quais os homens
so propensos c cujas causas so mais sutis e pobremente compreendidas. As pessoas
que apresentam efeitos comportamentais dc ansiedade por longos perodos dc tempo
nas situaes complexas que surgem na sua vida cotidiana, so quase sempre chamadas
neurticas . O comportamento emocional prolongado do tipo denominado ansiedade
constitui uma interferncia marcante nos outros operantes e pode-se dizer que um
neurtico desajustado simplesmente porque, cm vez de se empenhar cm operantes
que podem produzir reforadores positivos, ele apresenta as supresses caractersticas
da ansiedade. Se as supresses persistem por longos perodos, a eficincia do indivduo
nas atividades normais pode ser bastante reduzida. Outros indivduos desenvolvem
padres de comportamento que so to patolgicos ou perigosos para a sociedade cm
geral que essas pessoas tem que ser institucionalizadas, para sua prpria segurana ou a
da sociedade. Numa ampla classe de patologia do comportamento conhecido como
psicose, os reforadores positivos normais podem perder o seu valor ou inexistir de todo.
Alguns psicticos tm que ser mimados, outros no tm qualquer interesse em alguma
coisa, outro relatam o aparecimento de situaes que no esto de fato presentes
(alucinaes), outros mostram uma generalizao de ansiedade para quase todas as
situaes, outros ainda apresentam em alta fora comportamentos como assassinatos e
violao, que esto ausentes no repertrio civilizado tpico. A reabilitao e cura de
indivduos que apresentam patologias de comportamento dessa magnitude so problemas
sociais graves, embora as causas precisas da maioria de tais comportamentos permaneam
obscuras.
Durante a idade mdia, os comportamentos bizarros eram atribuidos a influencias do
diabo e as pessoas que apresentavam tais comportamnetos eram queimadas como
bruxas, encarceradas c sujeitas a outras brutalidades destinadas a exorcizar o diabo. A
crueldade do homem para com seu semelhante agora mais lcida do que na histria
inicial do tratamento de indivduos perturbados. Durante o sculo dezenove, surgiu
uma atitude mais esclarecida. Os indivduos que apresentavam patologias de comporta
mento passaram a ser encarados como doentes em vez de possessos. Em vez de
presos, eles eram enviados a hospitais.
Os hospitais so um avano significante em relao as prises. Mas uma implicao
significante pode ser retirada da psicologia moderna: as causas e curas dos comporta
mentos patologicos diferem muito das doenas organicas. S muito recentemente, as
patologias do comportamento passaram a ser encaradas como produtos de histrias
incomuns de condicionamento. Como tal, suas curas exigem um tratamento comporta
mental e no mdico. Foi o psiquiatra de Viena Sigmund Freud que reconheceu que as
causas de certos comportamentos patolgicos encontram-se na histria passada remota
do indivduo. Alem disso Freud salientou que frequentemente, o indivduo incapaz
de descrever os eventos crticos do passado que levam patologia. Um aspecto
importante do mtodo psicoanaltico de Freud, assim, envolvia o fornecimento de
SDs verbais para aumentar a probabilidade de o paciente relatar incidentes de seu
passado que poderiam ter uma relao com o distrbio atual. Para Freud, parecia bvio
que o tratamento consistisse parcialmente em fazer o prprio paciente saber qual era a
sua histria relevante. Tal ponto de vista tem relao com o que conhecemos sobre
a extino e adaptao de efeitos emocionais.
- 433 -

No podemos pretender que tenhamos chegado a uma compreenso clara (le


exatamente quais tipos de histrias levam a patologias diferentes e quais tipos de ao
devem ser efetuadas para reeducar os indivduos em padres de vida mais reforadores.
Contudo, os princpios comportamentais bsicos do tipo descrito neste livro sero
seguramente teis para ajudar a formar uma base experimental slida para a psicologia
clnica e a psiquatria. Isto porque, tal como a prtica da medicina orgnica deriva-se das
descobertas de processos qumicos, bioqumicos e fisiolgicos, fundamentais, assim
tambm a prtica da psicoterapia deriva-se das descobertas de processos comportamentais
fundamentais.
18.10 UM INDICK DE MUDANA EMOCIONAL
Apresentamos, aqui, um mtodo simples para medir a supresso ou facilitao da
taxa de resposta operante devido ao emparelhamento de um S\ com um S+ ou S . 0
mtodo consiste em se observar a taxa de resposta no perodo imediatamente antes de S\
ser a p re se n ta d o e, e n t o , co m p arar essa taxa com a taxa de resposta
durante S \. Por exemplo, seS j dura 5 min, poderamos medir convenientemente a
taxa durante os 5 min imediatamente precedentes a Sj e comparar esta com a taxa
durante o prprio Sj. Na Fig. 18-12, isto seria feito, comparando-se a taxa de a a b.
com a taxa de b a c. Um ndice adequado de interrupo comportamental durante Sj

j
_____ c b______
e
(c b) + {b a)
onde Ie definido como o ndice de mudana emocional. Deve ficar claro que c-b o
nmero de repostas durante S\ e b-a o nmero de respostas num perodo de controle
imediatamente antes de S\ e de durao igual a S j. Quando o responder durante S\
e o perodo de controle igual (nenhum efeito de S i), ento Ie - 0,5. Quando
c-b < b-a, ocorreu supresso e o Ie encontra-se entre 0 e 0,5, dependendo de quo
completa foi a supresso. No caso onde ocorre facilitao em S j, c-b > b-a, ento
1,0 < Ie >0,5. Evidentemente, Ie varia de 0 (supresso completa) a 1,0 (facilitao
completa: inexistncia de resposta no perodo de controle, todas as respostas em S]).

Tempo (minutos)
Figura 18-12. O clculo dc um ndice de supresso.
-434-

EXERCCIO 10.

Porque dificil uma emoo como um padro de comporta


mento particular?

EXERCCIO 11
Discuta as similaridades e ediferenas entre motivao e emoo.
EXERCCIO 12

Faa a notao do procedimento atribudo a Pliskoff na seo 18.5

REFERNCIAS PARA O CAPTULO 18


Ax, A. F. The physiological differentiation between fear and anger in
humans. Psychosom. Med., 1953, 15, 433-442.
Azrin, N. H., Hutchinson, R. R., and Hake, D. F. Extinction-induced
aggression. J. exp. Anal. Behav., 1966, 9, 191-204.
Brady, J. V. Ulcers in executive monkeys. Sci. Am er., 1958, 199, 95
100.
Brady, J. V. Motivation-emotional factors and intracranial self-stimula
tion. Chap. 30 in D. E. Sheer (E d .), Electrical stimulation of the
brain. Austin: Univer. of Texas Press, 1961.
Brady, J. V. Psychophysiology of emotional behavior. Chap. 10 in A. J.
Bachrach (E d .), Experimental foundations of clinical psychology.
New York: Basic Books, 1962.
Brady, J. V., and Hunt, H. F. An experimental approach to the analysis
of emotional behavior. J. Psychol., 1955, 40, 313-324.
Brady, J. V., Porter, R. W., Conrad, D. G., and Mason, J. W. Avoidance
behavior and the development of gastroduodenal ulcers. J. exp.
Anal. Behav., 1958, 1 ,6 9 -7 2 .
Cannon, W. B. The James-Lange theory of emotions: a critical examina
tion and an alternative theory. Am er. J. Psychol., 1927, 39, 106
124.
Darwin, C. The expression of the emotions in man and animals. London:
Murray, 1872.
Estes, W. K., and Skinner, B. F. Some quantitative properties of anxiety.
J. exp. Psychol., 1941, 29, 390-400.
Gates, G. S. An observational study of anger. J. exp. Psychol., 1926, 9,
325-336.
Herrnstein, R. J., and Morse, W. H. Some effects of response-inde
pendent positive reinforcement on maintained operant behavior. J.
comp, physiol. Psychol., 1957, 50, 461-467.
Hoffman, H. S., and Fleshier, M. Stimulus factors in aversive controls:
the generalization of conditioned suppression. J. exp. Anal. Behav.,
1 9 6 1 ,4 ,3 7 1 -3 7 8 .

-435-

Hoffman, H. S., Fleshier, M., and Jensen, P. K. Stimulus aspects of


aversive controls: the retention of conditioned suppression. J. exp.
Anal. Behav., 1963, 6, 575-583.
Hunt, H. F., and Brady, J. V. Some effects of electro-convulsive shock
on a conditioned emotional response ( anxiety ). J. comp,
physiol. Psychol., 1951, 44, 88-98.
James, W. Principles of psychology. Vol. II. New Y ork: Holt, 1890.
Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd
ed.) New York: Ronald, 1963.
Landis, C., and Hunt, W. A. The startle pattern. New Y ork: F arrar and
Rinehart, 1939.
Leitenberg, H. Conditioned acceleration and conditioned suppression in
pigeons. J. exp. Anal. Behav., 1966, 9, 205-212.
Masserman, J. Principles of dynamic psychiatry. Philadelphia: Saunders,
1946.
Pliskoff, S. S. Rate change effects with equal potential reinforcements
during the warning stimulus. J. exp. Anal. Behav., 1963, 6,
557-562.
Plutchik, R. The emotions: facts, theories, and a new model. New Y ork:
Random House, 1962.
Schacter, S., and Singer, J. E. Cognitive, social, and physiological
determinants of emotional state. Psychol. Rev., 1962, 69, 379-399.
Schoenfeld, W. N. An experimental approach to anxiety, escape, and
avoidance behavior. Chap. 5 in P. Hoch and J. Zubin (E d s.),
A nxiety. New York: Grune and Stratton, 1950.
Sidman, M. Normal sources of pathological behavior. Science, 1960,
1 3 2 ,6 1 -6 8 .
Spitz, R. A. No and yes. New York: International Univer. Press, 1957.
Tolm an, E. C. A behavioristic account of the emotions. Psychol. Rev.,
1 9 2 3 ,3 0 ,2 1 7 -2 2 7 .
Watson, J. B. Behaviorism, (rev. ed.) Chicago: Univer. of Chicago
Press, 1930.
Young, P. T. M otivation and emotion. New York: Wiley, 1961.

-436 -

TABELA

DE

PARADIGMAS

COMPORTA MENTA IS

Nome

TABELA

DE

Dado

PARADIGMAS
Procedimento

COMPORTAMENTAIS
Processo

Resulta

o do

Um eliciador, S2

Apresentar S2 repetidamente

R2, a resposta eliciada, dimi


nui em magnitude, aumenta
em latncia, etc.

A fora do reflexo
temporariamente

amen
ano

Dois eliciadores, Sj
e S2

Emparelhar repetidamente S\
com S2

S\ passa a controlar uma nova


resposta (CR) semelhante a R j

Sj evoca seguram

1. Um operante R
com freqncia
v 0
2. Um reforador
adequado

1. Aumento na taxa de R para um novo valor estve


2. R incorpora-se a um eio de comportamento
3. A variabilidade topogrfica de R diminui

Uma R anteriormen
te fortalecida

R --------- /-------------------

1. Diminuio de R
2. Desintegrao da cadeia de
comportamento
3. Aumento na variabilidade
da forma e magnitude de R

Os processos com
aproximam-se do
nvel operante

Uma classe de com


portamento com for
a v 0

0 reforamento aplicado pa
ra um conjunto de variantes
dentro da classe, 0 resto sub
metido extino

1. Fortalecimento das varian


tes reforadas
2. Enfraquecimento daquelas
variantes que passaram por
extino

As variantes refo
sentam-se com um

nao

1. Uma classe de
resposta
2. Duas condies
de estmulo

Reforar a R numa das condi


es de estmulo (S^) e extinguir a R na outra condio de
estmulo (S)

A fora da resposta em
eS
gradualmente se diferencia,
ocorrendo um processo de ex
tino prolongada em S

0 organismo pass
em
e no em S

o para

Contingncias de dis
criminao adequa
das

Apresentar uma srie de pro


blemas relacionados de discri
minao

Os processos de discriminao
do indivduo mudam gradual
mente de lentos e graduais pa
ra sbitos e abruptos

Discriminaes no
lacionadas, so re
eficincia mxima

mento

S+

Nome

TABELA

DE

Dado

1. Uma R previa
mente fortaleci
da
2. Organismo priva
do de uma classe
de reforadores

ona
e tuga

Um estmulo aversi
vo, S

Uma contingncia de
reforamento cont
nuo

PARADIGMAS

Processo

Procedimento

COMPORTAMENTAIS

S+

Permitir que uma R termine

CON

Resulta

Taxa constante de R seguida


por uma cessao abrupta do
responder

0 reforador pe
riamente o seu v
dor

A fora de R aumenta

S controla a ocor

s-

Extino abrupta

Aumento no valor reforador da destruio e dano.


A probabilidade de comportamento agressivo aumen

Adaptao, ao choque eltrico, 414


de emoes, 431, 432
Adquiridos, drives, 377381
Adquiridos, reforadores, 227
fora de, 256
Adrenalina, na emoo, 430
Adulterao de alimento com quinino, 358
Agresso, 417, 418
Alegria; 410 ver tambm Elao, Paradigma de,
Algoritmo, 2 6 7 ,3 1 8 319
Alimento, privao de atividade geral, 361
Alma, 2 4 -2 5 , 26
Alucinaes, 433
Ambiente, 126
Animais em experimentos de psicologia, 201202
habilidades para formar conceitos, 2842 8 8 ,299
Animais, espritos, 24
Ansiedade, paradigma de, 412416
superposto ao comportamento de esquiva, 415, 416
Antropomorfismo, 27
Aparelhagem, balo para o estmago, 367
barra de deslocamento de resposta, 167
caixa de obstculo de Columbia, 355
caixa quebra-cabea, 28
caixa de Skinner com barra, 32, 78
caixa do vai-e-vem, 391
cmara para pombo, 110,121
de desenhar com espelho, 175
estabilmetro, 3 6 2 -3 6 4
para o estudo do vcio, 380
Labirinto, 251
Labirinto em T para o estudo de fuga, 284
mquina de ensinar, 300
pista de correr, 154
plataforma de saltar, 211
de puxar o cordo, para macacos, 213
roda de atividade, 178, 362
Wisconsin general test, 274
Aproximao-esquiva, conflito de, 424425

Aproximao sucessiva, 169,170


no treinamento discriminativo, 248
do comportamento de razo fixa, 171
Aritmtico, soluo de problema, 265267
Assntota, de uma funo, definida, 69
do processo de discriminao, 209
Ateno, como comportamento de observao encoberto, 237
como reforador condicionado, 342
como reforador generalizado, 235
Atividade geral, 3 6 1 ,3 6 4
ciclos sexuais e, 363
espontnea, 361365
no estabilmetro, 362363
nvel operante de, 361, 363365
padro e privao de alimento, 364
privao de alimento sobre, 361
roda de, 362
para estudo de esquiva, 393
Auto-estimulao do crebro, 371
Aversivos, estmulos, 383, 384
condicionados, 3 9 0 -3 9 8
incondicionados, 384
Beber, periodicidades no, 345, 346
Brincar como reforador, 373
Cadeias de comportamento
adio de membros resposta,a, 248, 250
e o andar, 2 5 7 -2 5 9
desempenho de passagens musicais como, 259
e desenvolvimento de sentena, 262
elementos de, 245
elocuo gramatical como, 263
encoberta, 267269
extino seletiva aplicada s, 2 5 2 -2 5 4
heterogneas (definidas), 252
homogneas (definidas), 255
em labirintos, 251252
ligaes (definidas), 245
linguagem, 260263
membros (definidos), 245
processos no desenvolvimento de, 2 4 7 -2 4 8

ramificadas, 263
resoluo em, 245247
de respostas vocais, 250, 260263
rompimento devido a S^s atrasados, 261
e saciao, 347
na soluo de problema, 312321
Caixa do vai-e-vem, 341
Causa do comportamento, 23
anedtica, 27
nos casos patolgicos, 433
concepes medievais de, 24
emoo como, 405407, 424
extino como, 114
fictcia, 339
futuro como, 392
histrias de condicionamento passado, 340341, 433
motivos, 342
variveis de privao, 343
Causa e efeito, na Cincia, 337, 338
seqncia de, na emoo, 407
Cerebrais, leses,
e impulso para alimento, 358
e supresso condicionada, 414, 416
Crebro (diagrama). 360
Choque eltrico
intensidade e taxa de fuga, 3 8 6 -3 8 8
reduo parcial de, 388390
S" no treinamento de fuga, 384
Choque eletroconvulsivo, 416
Coeficiente de correlao, 330
Comer, mecanismos fisiolgicos no, 367 periodicidade no, 345
Comportamento
agressivo, 416418
categorias de Aristteles, 24
emocional, 405
encoberto, 237
instrumental, 28
operante de observao, 148 449
predio e controle do, 31
reflexo, 25

supresso de, 3 5 8 -4 0 0 , 434


topografia de, 8687
Comportamento de esperar, 176178
Comportamento de esquiva,
aquisio de, 3 9 2 -3 9 8
efeitos do paradigma de ansiedade sobre, 416
de respondentes emocionais, 431
sem estmulo de aviso, 396298
e ulcerao, 4 2 5 -4 2 7
Comportamento instrumental, 2729, 77
Comportamento de observao, 1 4 8-149
Comportamento proposital, 7577
Comportamento respondente,
definio genrica de, 160
eliciao de, 4142
Comportamento social, 239242
Compreenso; ver Significado
Conceito
aquisio de, 273
e aquisio de discriminao, 282283
conjuntivo, 292
como controle por relaes de estmulo, 281
disjuntivo, 288291
de fora do reforador, 359
impulso, 343344, 358
de pessoa, 288
de propriedades conjuntivas, 2 9 2 -2 9 3
relacionai, 279
de rotao anti-horria, 2 8 7 ,2 8 8
estrutura hierrquica de, 295
Conceito, formao de; ver Conceito, aquisio de
Conceitos
ensinados nas escolas, 301
de impulso, 359
interdisciplinares, 366367
nas leis cientficas, 39, 43
simples vs. compostos, 297
de transformao, 306
Condicionamento
comparao entre o Pavloviano e o operante, 97
fuga, 3 8 4 -3 8 8

Pavloviano, das emoes, 410


na ansiedade experimental, 4 1 2 -4 1 4
nas emoes mistas, 424
tempo, 6364
usando S", 3 9 0 -3 9 2
Condicionamento clssico; ver Condicionamento Pavloviano
Condicionamento retroativo, 64
Condicionamento Pavloviano, 5359
na ansiedade experimental, 412416
das emoes, 6566
nas emoes mistas, 410411
intefvalo S\ S2timo no, 63
procedimentos de emparelhamento no, 6264
relaes temporais no, 6264
substituio de estmulo no, 57, 6466
no treinamento de reforamento secundrio, 238
Condicionamento respondente; ver Condicionamento Pavloviano
Condicionamento de retardo, 64
Condicionamento salivar, 5356
Condicionamento temporal, 6364
Condicionamento de trao, 63
Condicionamento verbal, 9294
Conflito
de aproximao-esquiva, 424425
de motivos, 365
Constncias perceptivas, 305308
Constructo hipottico
fora do reflexo, 4 2 43
Contingncias comportamentais, 127 ver tambm Esquemas de
Reforamento
agrupadas, 141 142
na aquisio de significado, 2 9 5 -2 9 6
aversivas na sociedade, 432
em cadeias, 245
como causas do comportamento, 342
discriminao, 139, 210
na disposio para aprender, 274
durao de, 1 3 3 -1 3 4
escolha de acordo com o modelo, 286
filogenticas, 3 0 7 -3 0 8 , 364, 406, 420421

fuga, 385
funcionais, 140141
imitativas, 240241
mltiplas, 1 3 0 -1 3 2
negativas, 137138
nulas, 132
probabilsticas, 1 3 8 -1 3 9
punio, 398402
ramificadas, 263267
repetitivas, 135136
Contingncia de reforamento contnuo (crf), 79
supersticiosa, 94
Continuidade de comportamento, 159,178
Contraes no estmago, papel no comer, 367
Contraste de brilho, 187188
Controlado, experimento, 66 -68
Controle do ambiente
por estmulos no relacionados, 291
sobre operantes, 185
Controle do comportamento; ver Causas do Comportamento;
Controle do Ambiente
Controle, das emoes, 431434
experimental, 66
SD ; ver Discriminao
Correlao
coeficiente de, 330
grau vs. forma de, 327328
Covarincia, de medidas motivacionais, 359
Culpa, 424
Curiosidade, comportamento de, 372
Curva Normal, 5152
Curvas de respostas acumuladas
construo de, 80
empilhadas, 145
Definio, como uma estrutura de significado, 296297
Deixas Verbais, 259
Delineamento de grupo, 104106
Detetor de mentira, 431
Desvio padro, 223

Diferenas individuais, 247


na soluo de problema humano, 3 2 4 -3 2 5
Diferenciao, 1 6 4 -1 8 0
da fora do responder, 164-165, 169
progressiva; ver Aproximao sucessiva
Discriminao, baseada em reforadores intrnsecos, 355
baseada no reforamento condicionado, 234
classificada por complexidade, 206
contingncias de, 210
de formas, 286
ndice de, 208
luz-escuro, sob a gua, 3 5 3 -3 5 5
de odor, 2 0 9 -2 1 0
como uma operao de teste, 265
processo de na formao da, 274278
sem erro, 2 1 7 -2 1 9
social, 241
Discriminativo, operante, 220
Discriminativo, tempo de reao, 2 1 9 -2 2 0
Disperso de medidas; ver Variabilidade nas medidas
Disposio para aprender; - L - SET
274278
relao com experimentos de formao de conceitos em
sujeitos humanos, 282
singularidade, 279
variveis que afetam a aquisio de, 278
Distribuio de freqncia relativa, clculo de, 4 8 -5 2
Drive ver Impulso e o paradigma de elao, 418420
Drogas, e comportamento emocional, 430431
efeitos sobre o comportamento, 156
e nvel de tolerncia ao choque, 390
vcio, 38 0 -3 8 1
Dualismo, 24
Durabilidade de reforadores condicionados, 2 2 9 -2 3 3
Elao, 418421
Hiciador, 37
Emoes, 405
mistas, 4 2 2 -4 2 5
primrias, 422
Emparelhamento simultneo de estmulo, 62
Enfraquecimento do comportamento; ver Extino

Escolha de acordo com o modelo, 286288


Escolha de matiz, em animais, 287
Esquecimento, 1Q8112
Esquemas encadeados, 255257
Esquemas de reforamento,
condicionado, 233
descrio terica dos, 180
encadeados, 255257
intervalo fixo (IF), 144147
intervalo randmico (IR), 147
intervalo varivel (IV) 149
como linha-base para o estudo da emoo, 412413
com S, 286
probabilidade uniforme, 149-151
no estabelecimento de reforadores condicionados poderosos, 230-231
de operantes RF, 1 72-173
razo fixa (RF); ver Operante de Razo fixa
no treinamento de discriminao, 2 0 6 -2 0 7
e variabilidade da resposta, 155
Esquiva condicionada, 392398
Estabilmetro, 362363
Estados estveis; 1 5 5 -1 5 7 ver tambm Linhas-base
de intensidade do choque, 390392
Estados fisiolgicos
da emoo, 407
Estampagem, 377380
Estimulao cerebral como reforador, 370371
Estimulao intracraniana, 370371, 420
Estmulo, 185
aversivo, 383
condicionado, 3 9 0 -3 9 8
incondicionado, 383384
concepo de Descartes, 24
controle, nos conceitos, 282283
definio de, 126
dimenses, 1 8 5 -1 9 0
discriminativo, 205
habilidade para reforar, 228229
privado, 407409

eliciador, 4 0 -4 1
generalizao, 190201
gradiente; ver tambm Generalizao da Extino
gradiente, 192-196;
intensidade, nas emoes, 421423
luminoso, 185188
neutro, 59
novo, como reforador, 372373
redescoberta de Whytt, 25
redundncia, 239
reforador; ver Reforadores; Reforamento
similaridade, 190, 199201
sonoro, 189190
substituio, 5758
Estmulos sonoros, 189190
Estratgias de procura de herurstica
Experincia anterior, 374376 sobre o desenvolvimento emocional posterior, 432
Experimental, mtodo, 6670
Experimento, definido, 69
Experimento conjugado, 427
Experimento do macaco executivo , 3 3 5 ,4 2 5 427
Explicao, ver tambm Causas do comportamento
causai, 4142
concepo de Pavlov, 26
proposital, 392393
teleolgica, 392393
vazia, 41
Expresso das emoes, 406
Extino, 149
aplicada a elementos de cadeias, 252255
como uma causa do comportamento, 340341
do choro da criana, 112114
definio de, 112
efeitos emocionais na, 99
e esquecimento, 100112
generalizao de, 197198
latencia, 254255
mudanas na taxa de resposta durante, 100
mudanas topogrficas em, 101 102
processo de, 99

punio durante, 398400


recuperao espontnea da, 106
resistncia , 1 0 2 -1 0 6 , 1 1 6 -1 1 9
esforo da resposta e, 104
quantidade de reforamento e, 104
de respostas emocionais patolgicas, 433
numa tentativa, 107
ao testar a generalizao de estmulo, 192
ao testar o poder de estmulos aversivos condicionados, 392
nos testes de reforamento secundrio, 228229
variabilidade do comportamento na, 101102
Extino latente, 254255
Fatores fisiolgicos,
no beber, 369
no comer, 367369
Feedback, 261
Feedback auditivo com atraso, 261
Fome, 344
Fonema, 90, 9697
Fora do comportamento, 115
Freqncia, distribuio de, 4852
Freqncia, polgono de, 4950
Frustrao
adaptao , 431
paradigma de, 416
Fuga, de S" condicionado, 396397
treinamento, 3 8 4 -3 8 9
General Problem Solver, 3 2 0-321
Generalizao; ver tambm Estmulo, generalizao de
de extino, 197199
gradiente de, 190196, 218
da supresso condicionada, 321323
Habliidades; na soluo de problemas,
Habituao; ver Adaptao
Hiptlamo, papel do, no comportamento de comer, 368
Histograma, 4 9 - 5 0
de taxas de resposta em S^ e S, 222
Iluso de Mller-Lyer, 1 8 7-1 8 8
Imitao, 240-241
Implantao de eltrodo no crebro, 368

Impulsos
adquiridos, 377381
para atividade, 371
comparao das foras de, 355356
conceito de, 3 4 3 -3 4 4 , 359
como direcionador do comportamento, 364365
como energia, 361365
e fatores fisiolgicos, 3 6 6 -3 7 1
mensurao de, 248360
Inanio em ratos, 351352
Incentivo, 365366
ndice
do desempenho discriminativo, 208
do rompimento emocional, 434
ndice de supresso, 434
Induo; ver Resposta, induo de
Informao
fornecida por estmulos discriminativos, 3 2 4 -3 2 7
na identificao de conceito, 321
Insight, na soluo de problema, 314
Instruo programada, 8083t., 298305
mquinas de ensinar, 300
quadros na, 300
como um veculo para o ensino de conceitos, 302305
Inteligncia, 3 2 3 -3 2 7 , 3 30-331
e idade, 3 2 4 -3 2 5
mensurao de, 331
quociente de, 3 2 5 -3 2 6
L-set. ver Disposio para aprender
Labirinto
comportamento de fuga em 384
reforadores exploratrios em, 372
Latncia
de respondentes, 38, 40
de respostas condicionadas, 61
Lei do condicionamento, de Pavlov, 25
Lei do efeito, 28, 33, 88
Lei do limiar, 40
Lei do menor esforo, 169, 401

Leis
conceitos nas, 39
do estmulo-respostas, 25
generalidade cientficas das, 39
limitaes cientficas, das, 342
do reflexo, 40
como relaes funcionais, 337339
uso cientfico, 3 3 7 -3 3 8
Lesse; ver Cerebrais, leses
Limiar, 210
de respondentes, 38,40
Linguagem
como cadeias, 261 263
nas interrelaes de conceito, 296
problemas gerais para a psicologia e, 260
Linha-base; ver tambm Estados estveis
Para o estudo da emoo, 412
Linhas-base comportamentais, 156157
Lquido

privao de e resistncia saciao, 34 9 -3 5 1


Luz como um estmulo aversivo, 387
Luz, reforamento com, 373
Me substituta, 374
Masoquismo, 402
Mdia, de uma distribuio de freqncia, 49
Mediana de uma distribuio de freqncia, 49
Medicina psicossomtica, 425427
Medidas
confiabilidade de, 331
de impulso, 3 4 9 -3 6 0
de supresso comportamental, 434
validade de, 3 3 1 -3 3 2
Medo, 410t., 429, 3 3 1 -3 3 2
Medo condicionado, 412416
Moda de uma distribuio de freqncia, 49
Modelo, dos fenmenos emocionais, 421
hidrulico de Descartes, 24
Morfina, efeito sobre o nvel de tolerncia ao choque, 390
vcio experimental de, 380381

Motivao, 337
distinguida da emoo, 412
fatores fisiolgicos na, 366-3 7 1
Motivos de comportamento, 342
Necessidade, 352353
Neurose, 433
Nvel operante, mensurao do, 79
Notao diagramtica de fluxo, 265266
Notao diagramtica de fluxo de computador, 265266
Olho, comparado a uma cmara, 186, 187, 188
Opo, para produzir estmulos discriminativos, 236
Operaes de impulso, adrenalectomia, 358359
pr-alimentao, 3 5 1 -3 5 2
privao, 343344
de alimento, 352, 356
de gua, 341
de ar, 354
e reforadores lquidos, 344
saciao, 344
Operante; ver tambm Resposta
comportamento, 77
condicionamento; 9596 ver tambm fortalecimento operante
controle de estmulo, 220221
definio genrica de, 162163
fortalecimento, 7598
como causa do comportamento, 340341
com S', 385
estereotipia do comportamento; ver tambm mudanas de variabilidade
leis do, 87
mudanas de variabilidade no, 8687
paradigma, 89
processo, 90
por reforamento condicionado, 229
mtodos para criar, 170
de ordem superior, 1 7 0 -1 7 3 , 177
de pequena escala, 173175
razo fixa (RF), 1 7 0 -1 7 3 , 177, 2 3 0 -2 3 2
relao com operaes de computador, 265
rompimento na emoo, 410

Parmetros, definidos, 118119


do reforamento negativo, 385
Patolgicos, fenmenos emocionais, 433
Pausa aps o reforamento, IF, 144147
RF, 171, 172
Pensamento, como soluo de problema encoberta, 267269
Perceptivas, constncias, 305308
cor neutra, 306
forma, 305306
tamanho, 306308
Periodicidades no valor do reforamento, 344346
Pista de correr, 154
Potencial muscular na imaginao, 267269
Pr-alimentao, como uma operao de impulso, 351352
Preferncia, experimento de, 358359
Privao, operaes de, 343344
Privao de explorao visual, 373
Probabilidade de reforamento, 7072
Problema, como um conjunto de contingncias de discriminao, 274
definio de, 285, 311312
Problemas de singularidade, 279
Procedimento de razo progressiva, 357
Procedimento de titulao; ver Choque eltrico
Processos comportamentais, 56
definio de, 70
Processo de ensino, como interao social, 242
Processos mentais, 3 0 -3 2
Propriedades ondulatrias da luz, 186
Proprioceptores, 189
no encadeamento, 275
Psicofsica, 30
Psicologia, definio de, 37
Psicologia fisiolgica, 366
e o estudo da emoo, 427
tcnicas em, 3 68-371
Psicose, 433
Psicoterapia, 4 3 3 -4 3 4
Punio, 398402
como um auxlio para a aquisio de compostamentos alternativos, 401
nas instituies educacionais, 401
como um SD, 403

Quantidade de reforamento comparada com o perodo sem choque, 389


Quebra-cabea, caixa de, 2729
Quebra-cabeas, 315318
Como reforadores para macacos, 318
Raiva, 416418
Raiva condicionada, 418
Rastreamento, 2 1 5 -2 1 7
Receptores, 185
Recompensas token, 233234
Recuperao espontnea da extino, 106
Reflexo condicionado, 2526, 55
comparado com o reflexo incondicionado, 6 0 -6 2
como um princpio explicativo, 37
de segunda ordem, 6162
contribuio de Pavlov, 25
fadiga do, 41
incondicionado, 3 7 -4 5
comparado com o condicionado, 6062
padres, na emoo, 409410
de segurar, 375
relaes, 38
Reforadores adquiridos, 227
gua, e estados da boca, 369
e centros hipotalmicos, 369
e fatores celulares, 369
alimento, e contraes do estmago, 367
e centros hipotalmicos, 367
e glicose no sangue, 367
atividade, 371
ausncia de normais, 433
condicionados, 227
negativos, 237239
contato corporal, 432
contato fsico, 373376
definio de, 88
estimulao cerebral, 370
explorao, 372
fora de, 3 4 1 -3 4 2 , 3 4 8 -3 6 0
na emoo, 412
sexuais e atividade geral, 363
periodicidades na, 344346

generalizados, 234235, 342


incondicionados, 227
intrnsecos, 3 7 1 -3 7 5
luz e escuro, 372
morfina, 380381
negativos, 383
terminao de, 422 t.
como eliciadores, 390
por objeto estampado, 377380
primrios, 227, 342, 344345
qualidade e quantidade, 365366
secundrios, 227
terminao de, 422 t.
valor; ver Reforador, fora de
Reforadores exploratrios, 372
Reforadores generalizados, 234235
Reforador negativo condicionado, 390392
Reforadores negativos, 383
terminao de, 422
Reforamento; ver tambm Diferenciao
circularidade do, 8889
de comportamento contnuo, 178179
condicionado e choque eltrico, 403
contingncia; ver Contingncia comportamental
crf, 143, 1 4 9 -1 5 0
definio de, 4 8 8 -4 8 9
generalizao de, 199
intermitente, 143
no contingente, 418419
de taxas de resposta, 152, 176178, 418419
social, 239242
de sons humanos e animais, 9092
Reforamento diferencial de taxas altas (drh) 178
Reforamento diferencial de taxas baixas (drl), 176,178
Reforamento seletivo; ver Diferenciao
Registrador cumulativo, 8083
Relaes funcionais, 337 -3 3 9
Repertrio, comportamental, inicial, 3 1 2 -3 1 3
como habilidades na soluo de problema, 264265

Repertrio comportamental, de respostas de linguagem, 298


Representao grfica tridimensional, 117
Resistncia extino de operantes RF, 173
aps reforamento de probabilidade uniforme, 155
aps IV, 153
Resistncia saciao, 349351
Respondentes autnomos, 407427
na emoo, 406407
ocultos por operantes, 431432
Resposta, classe*, definio de, 159164
condicionada, 5658
denominao de cor, 186
diferenciao, 164180
dimenses, 160162
emitida, 79
fora, 206, 2 5 5 -2 5 6 , 350
induo, 175
de observao, 235237
operante, 33, 8 7 ,1 2 4 126
probabilidade, 33, 114116
reflexa, 25
respondente, 37
taxas de, 33
mudanas na relativa, 8485
variabilidade, aps um esquema IV, 155
aps um esquema de probabilidade unif orme, 156
variantes, distribuio de reforadas, 167
Respostas de observaao, 235237
Reteno, de comportamentos verbais ver Esquecimento
de supresso condicionada, 414
Rudo, como um estmulo aversivo, 387
Rudo branco, 189
Saciao, 344
curvas de, 348
de reforadores intrnsecos, 373
resistncia , 349351
Sadismo, 398
SD, 206
SA ,2 0 6
Secrees psquicas; ver Condicionamento salivar

Sede, 344, 3 6 8 -3 6 9
Sensibilizao de respostas emocionais, 431
Sentenas, como cadeias de comportamento, 262
Sentimentos, como eventos internos, 407409
Sidman, procedimento de, 397398
Significado, como comportamento interconceitual, 291298
de taxas de resposta, 3 4 8 -3 4 9
Significncia estatstica, 225
Slabas sem sentido, 109111
Similaridade; ver Estmulo, similaridade
Simulao de computador na soluo de problemas humanos, 320321
Sistema de coordenada retangular, 6667
Sistema nervoso autnomo, 65, 427430
Sistema parassimptico do SNA, 429
Sistema simptico do SNA, 429
Soluo de problema, como cadeias ramificadas, 263267
definio de solues em 317318
testes de, 323324
Soluo salina, como reforador para o rato adrenalectomizado, 359
Somao temporal, 42
Sono, efeito sobre o esquecimento, 111
periodicidades no, 346
Sucessivos, extino e recondicionamento, 107108
Superstio, 9495
Supresso condicionada, reteno da, 414, 4 1 5 ,4 1 6
Tempo de reao, assinttico, 219220
para o aparecimento de reforadores negativos, 385
em experimentos de labirinto, 251252
na pista de correr, 154
Tentativa e erro, responder por, 312314
Teoria dos conjuntos, 1 6 3 -1 64 , 1 8 0 -1 8 3 , 292
Teoria da evoluo, 27
Teorias, da emoo, 405407
Testes estatsticos, de diferenas entre duas mdias, 221225
Texto programado, 301
Time-out, de estimulao aversiva, 388389
como punio, 402
Tonalidade, 198
Topografia do comportamento, 161

Transformaes de conceitos disjuntivos, 290


Valor de reforamento; ver Reforador, fora de
Variabilidade nas medidas, 4552
aps o fortalecimento operante, 8687
na extino, 102
Varivel composta, 209
Varivel dependente, definio de, 6667
taxa de resposta como, 33
Varivel independente, definio de, 6667
Variveis intervenientes; ver Varivel composta
Vcio, 3 8 0 -3 8 1
Wisconsin general test apparatus, 214, 274
Zeitgeist, 2930

Você também pode gostar