Princípios de Análise Do Cpto - Millenson, J. R. (1967)

J. R.
MILLENSON
p r in c íp io s d e
ANÁLISE DO
COMPORTAMENTO
A mais moderna e sistemática coleção de princípios elementares
universais que existem para a modificação do comportamento
Obtura- Retículo de difração
K
l V
dor
§
L
* tf) 1__
■4
k l :
\
\
Monocromador Fonte de Luz
ÍHesbiirUÍ
PRINCÍPIOS DE ANÁLISE
DO COMPORTAMENTO
J.R. MILLENSON
PRINCÍPIOS DE ANÁLISE
DO COMPORTAMENTO
T ra d u ç ã o de
A lin a de A lm e id a Souza
D io u e tie K ezende
COORDENADA
THESAURUS
© Copyright, J. R. Milleonson, 1967
Título original: Principles-of Behavior Analysis
THI MACMILLAN COMPANY, NLW YORK
Library of Congress catalog card number: 67 15540
Montagem: Afonso Rocha

Fotomontagem de : João Pinto
Composição de: Antonio Carlos da Silva e Clemente Silva l 'ilho
Capa: Paulo Magalhães
MCMLXXV
Todos os direitos, em língua portuguesa no Brasil, reservados de acordo com a lei. Nenhuma parte
deste livro pode ser reproduzida ou transmitida de qualquer forma ou por qualquer meio, incluindo
fotocópia, gravação ou informação computadorizada, sem permissão por escrito da editora
COORDENADA / THESAURUS EDITORA DE BRASÍLIA LTDA. SIG Q. 08 LOTE 2356 -
FONE: (061) 344 3738 - FAX: (061) 344 2353 - Brasília - DF.
Para
VIVIENNE
PREFÁCI O À EDI ÇÃO BRAS I LEI RA
A maior parte do livro PRINCÍPIO S DE A N Á L IS E DO C O M PO R TAM EN TO fo i

escrita durante o ano acadêmico de 1964, enquanto eu era um jovem professor assistente
de Psicologia no In stitu to de Tecnologia Carnegie (agora Universidade Carnegie-Mellon),
em Pittsburgh, Pensylvania. Eu o concebi como um te x to sistemático de introdução dos
estudantes, em nível elementar e avançado, àqueles princípios conhecidos de m odificação
do com portam ento que devem servir de base à grande porção da conduta adaptativa do
homem e de organismos relacionados com ele. Em sua maior parte, escrever este livro fo i
um trabalho de amor. Eu ensinava Psicologia a iniciantes, para quem eu a interpretava
como a ciência que se preocupa com as interações do com portam ento com o meio
ambiente e para quem havia tantas coisas que desejava dizer (e que o fiz muitas e muitas
vezes!) que não se encontravam em qualquer dos livros textos existentes, que decidi
desenvolvê-los por escrito. Aquela época existia apenas um livro te x to sistemático e
elementar sobre esse campo de estudo que, embora suportando majestosamente a sua
idade, m uita coisa tinha acontecido desde a sua publicação em 1950.
Parece-me claro agora, como o fo i ent£o, que a Psicologia é um campo c ie n tífic o a
mover-se rapidamente de seu estágio pré-paradigmático para a exploração sistemática de
um conjunto unificado de com portam entos. Gosto de pensar que em sua d im in u ta trilh a ,
o livro PRINCÍPIOS DE A N Á L IS E DO CO M PO RTAM ENTO continua a dar uma
contribuição permanente pc.ra o estabelecimento desse novo paradigma da Psicologia.
Agor.i, olhando para trás, uma década desde que esse livro apareceu, posso ver mais
claramente as suas virtudes e falhas. É certo que nessa ciência de desenvolvimento tão
rápido qualquer livro te x to logo se desatualiza. Novos processos im portantes, como a
ûto-modelagcm, o com portam ento adjuntivo e o biofeedback entraram em cena; outros
processos familiares, como o da punição e do condicionam ento clássico, foram
consideravelmente relorm ulados. Por o utro lado, enquanto em 1964 não tinham os quase
nenhuma teoria que merecesse esse nome, os anos de 70 testemunharam a chegada de
modelos quantitativos tanto na teoria do reforço como na do condicionam ento clássico.
Esses modelos, embora deliberadamente restritos à área que cobrem, têm uma certa aura
de a u te n tic id a d e que íalta totalm ente nas grandiosas teorias prim itivas sobre
aprendizagem da era anterior. As descobertas complementares de que as atividades
autônomas reflexas são reíorcáveis e nue os com portam entos em itidos nodem ser
excitados por contingências associadas/ colocam em questão nossa distinção fechada
entre operantes e respondentes. É m u ito cedo para dizer quão drasticamente essas
descobertas vão abalar nossos fundam entos teóricos, mas é certo que maiores
modificações estão no ar.
Há dez anos atrás, como reação às prematuras teorizações das décadas de 1940 e
1950, a disposição dos que trabalhavam nesse campo era fortemente descritiva. A análise
que B.F. Skinner fez do com portam ento proposital, sua preocupação com o organismo
individual e sua ênfase no controle pelo reforçam ento de contingências eram as bases do
cultivo em pírico vigoroso dos princípios de reforçam ento positivo. A lei do efeito de
T horndike estava no seu zênite e este livro é um p ro d u to daquele clím ax. Porém algumas
mudanças sutis estão acontecendo no Zeitgeist. O controle de contingências — pervasivo
e im portante como é — começou a ceder lugar a um conjunto de efeitos perplexantes
que, mesmo parecendo intim am ente ligados ao reforço, vão alem da lei do efeito. Por
outro lado, o condicionam ento clássico, a outra face da moeda do determ inism o na
Psicologia, acha-se menos e menos seguro de seu papel como o segundo maior p rin c íp io
de m odificação do com portam ento. Suspeito mesmo que devemos logo nos preparar para
aceitar a idéia de que as modificações das respostas no condicionam ento clássico pode ser
grandemente reduzido a uma forma de aprendizagem instrum ental. Naturalm ente que,
quando e se, essa integração vier, ela certamente não eliminará Pavlov. Pelo contrário, os
diques serão finalm ente eliminados para a exploração das descobertas do grande fisiólogo
Russo, em sua área mais apropriada: a modulação do com portam ento corrente pelos
efeitos Pavlovianos sobre a motivação, a emoção e a criação de reforçadores.
O livro PRINCÍPIOS DE A N Á L IS E DO COM PORTAM ENTO guarda um silêncio
virtual sobre as contribuições dos biólogos com portam entais às fontes evolucionistas da
variação do com portam ento; fator este não facilm ente manipulável mas não facilm ente
ignorado. Enquanto eu sempre senti a negligência às contribuições dos etologisias às
características com portam entais das espécies, como a m aior omissão de meu livro, e o
enfoque no meio-ambientalism o (que poderia ter sido d ifíc il conseguir com uma
apresentação balanceada de biologia e psicologia) fo i e é a sua m aior força. Porquanto a
sua preocupação com as variáveis do meio ambiente do passado e do presente
perm itiram -me aplicar a teoria do reforço de maneira criativa a um amplo espectro de
c o m p o rta m e n to s humanos complexos, incluindo a aprendizagem de conceitos,
significado e compreensão, solução de problemas, motivação e emoção, de tal modo que
ainda hoje parece-me que retêm um sabor moderno. Assim, por todas as mudanças e
ferm entos que ocorreram desde o seu aparecimento e por todas as suas omissões, pode
m uito bem ser qüe o livro PRINCÍPIOS DE A N Á L IS E DO CO M PO RTAM ENTO ainda
contenha a mais noderna e sistemática coleção de princípios elementares universais que
existem para a jodificação do com portam ento. Certamente eu creio que minha atenção
meticulosa para a elaboração e a aplicação de conceitos fundamentais, minha pressão
neste livro na descrição form al de contingências de reforçam ento, a preocupação no
te xto com os detalhes íntim os, em profundidade, de um número lim itado de processos
fundamentais do com portam ento, seu com prom etim ento em compreender, opondo-se a
uma ( obertura superficial dos temas, sua natureza programada e, finalm ente, sua fé em
que a teoria psicológica pode e deve ser desenvolvida a um nível com portam ental são,
todos eles, características que permanecem distintas e perenes.
Tornando este livro disponível numa edição em Português a, talvez, uma audiência
bem maior, esta poderá ser introduzida aos recentes insights e às promessas conceituais
dessa ciência do século XX
PREFACIO
O objetivo deste livro é fornecer uma introdução rigorosa à Psicologia Experimental

orientada para os dados. Ele se dirige principalmente ao estudante do primeiro curso em
Psicologia e contém material adequado para dois semestres consecutivos ou um período
de um ano. Embora o texto atinja um grau incomum de sistematização para
o nível introdutório, o material que ele contém não é necessariamente mais difícil do que
o encontrado na maioria dos textos de abordagem geral no campo. Com um grupo
limitado de conceitos gerais, tentei construir uma estrutura razoável de modo que o
estudante tenha, se este fôr o seu primeiro, único ou último curso em ciência, os meios
para interpretar e ordenar uma ampla variedade de fenômenos psicológicos.
Não fiz tentativa alguma para rever todas as atividades variadas dos psicólogos em
geral na metade do século vinte. Na maior parte mantive o caminho direto e estrito da
Psicologia Experimental. Dentro desses limites, concentrei-me no que, em termos tradi
cionais, seria chamado aprendizagem e condicionamento, motivação e emoção e, em
menor extensão, Psicofísica, percepção e resolução de problemas. Os correlatos fisio
lógicos do comportamento são apresentados nas discussões sobre motivação e emoção.
As desordens do comportamento são estruturadas como fenômenos emocionais patoló-
>s. Não há um capítulo com títulos como os de Percepção e Psicofísica, mas seus
1'miiTilns básicos e alguns dados representativos são considerados no texto, nos capítulos
h*>l»ic* controle de estímulo, discriminação e aquisição de conceitos, e em outras partes. A
aluminum na área é feita em termos da análise funcional do comportamento, um ponto
do visla há muito tempo associado com B. F. Skinnei. Embora a maioria dos “prin
cípios’* dosciilos tenham suas origens no laboratório de pesquisa animal,sua relevância
para as atividades humanas é repetidamente enfatizada.
Algumas noçoes de Estatística elementar são apresentadas, principalmente para
fornecei algum sabor à variabilidade dos dados e para apontar a utilidade de instrumentos
estatísticos no losumo e interpretação dos resultados. Utilizei o método de anexar alguns
capítulos com seçoes sobre análise de dados, muitos dos quais descrevem conceitos
estatísticos simples. Embora estas seções estejam organizadas de modo a incorporar os
dados empíricos citados nos capítulos em que aparecem, eles fornecem seqüência
independente colocada à narte do c o rn o d o textn
Um sistema de notação de R e S para descrever os procedimentos comportamentais é
uma parte integral do texto. Os procedimentos no campo estão se tornando cada vez
mais complexos e algum esquema formal para reduzí-los aos seus elementos parece dese
jável se se quer que o estudante aprecie diferenças e similaridades de procedimento. 0
problema de se a notação particular, aqui elaborada, há de encontrar um lugar permanente
na ciência não será resolvido aqui. Mas, com sua inclusão, desejo enfatizar que uma
representação simbólica da lógica de nossos procedimentos está se tornando obrigatória
para uma exposição e comun icação e ficientes.
Espero que o instrutor encontre dificuldade para modificar a seqüência dos capítulos
ou omitir qualquer um completamente. (As seções que podem ser omitidas sem destruir a
continuidade estão em tipo pequeno.) Os conceitos se constroem uns sobre os outros e o
livro é uma unidade. O nível de dificuldade parece-me ser uma função direta do número
do capítulo. Ao usar o material com estudantes de vários níveis, o principal grau de
liberdade parece ser a velocidade em que o instrutor pode progredir. Mantendo o prin
cípio de Bruner1, que “qualquer assunto pode ser ensinado, de modo efetivo e de uma
forma intelectualmente honesta, a qualquer indivíduo em qualquer estágio de desenvol
vimento” , espera que o livro seja útil para diversos níveis: talvez, como um
texto auxiliar para o curso de aprendizagem em graduação, ou mesmo como um livro de
consulta para cursos de pós-graduação em análise experimental do comportamento.
Um laboratório seria um complemento valioso para um curso tal como este e a
seqüência do texto é tal que facilita uma ordem lógica de tópicos experimentais para o
laboratório.
Meus agradecimentos são para muitos dos meus ex-alunos da Columbia University,
Birkbeck College (University of London) e Carnegie Institute of Technology que,
durante anos, estabeleceram as condições para escrever o livro e que modelaram
amplamente a sua estrutura. A Susan Alcott, Nancy Innes, Mary Carol Perrott, e par
ticularmente Isabelle Alter, tenho uma dívida pela leitura crítica, releitura, e edição dos
rascunhos preliminares. As sugestões dos meus colegas Daryl Bem, John Boren, Derek
Hendry, Dennis Kelly, Bernard Migler e do editor dessa serie, Melvin Marx, que entre eles
ieu cada c a p ítu lo do livro, esclareceram , apreciavelmente, a versão final.
Evalyn Segai, genero sam ente, realizou o árduo trabalho de reler todo o manuscritc
durante as férias de verão, e seus comentários detalhados ajudaram a melhorar o livro de
muitas maneiras. W. N. Schoenfeld e Francis Mechner merecem o crédito por aquilo que
de valor original aqui for encontrado. Não seria necessário dizer que eles não são de
modo algum responsáveis pelos defeitos e deficiências e espero que eles perdoem quais
quer distorções de suas idéias que eu possa ter, inadvertidamente, criado.
J. R. M.
1
J. S. Bruner, The process of education. Cambridge: Harvard llnivrr Press 196^ n ^
SU M Á RIO
NOTA AOS ESTUDANTES......................................................................................... 19
PRIMEIRA PARTE: A REGULARIDADE DO COMPORTAMENTO..................... 21
CAPÍTULO 1 - UM BACKGROUND PARA A ABORDAGEM CIENTÍFICA AO

COMPORTAMENTO....................................................................... 23
1.1 Primeiras tentativas para explicar e classificar o comportamento hum ano..... 23

1.2 A ação reflexa........................................................................................................ 25
1.3 Reflexos condicionados ou adquiridos............................................................... 25
1.4 A teoria da evolução e o comportamento adaptativo....................................... 26
1.5 Os primeiros experimentos sobre o comportamento “voluntário” .................. 27
1.6 O Zeitgeist.............................................................................................................. 29
1.7 A psicologia perde a sua m ente............................................................................ 30
1.8 O firme estabelecimento de uma análise experimental do comportamento .... 32
1.9 Revisão.................................................................................................................... 34
CAPÍTULO 2 - COMPORTAMENTO REFLEXO (ELICIADO)........................... 37
2.1 A fórmula S - R .................................................................................................... 37

2.2 Leis do reflexo prim ário........................................................................................ 39
2.3 Leis secundárias do reflexo................................................................................... 41
2.4 Força do reflexo: um constructo hipotético....................................................... 42
2.5 Exemplos comuns de reflexos.............................................................................. 44
2.6 Variabilidade nas medidas; resumo de dados em distribuição de freqüência;
estatística básica; a curva norm al........................................................................ 45
CAPÍTULO 3 - CONDICIONAMENTO PAVLOVIANO ....................................... 53
3.1 Reflexos condicionados e a natureza de um experim ento................................. 53

3.2 O paradigma Pavloviano: um método esquemático de representar ocondi
cionamento 56
3.3 Relações temporais nos paradigmas de condicionamento................................. 62
3.4 A extensão do condicionamento clássico................................ ........................... 64
3.5 O método experimental ........................................................................................ 66
3.6 Introdução aos conceitos elementares de probabilidade................................... 70
CAPÍTULO 4 - FORTALECIMENTO OPERANTE............................................... 75
4.1 Introdução ao comportamento proposital.......................................................... 75

4.2 Um experimento p rotótipo.................................................................................. 77
4.3 Mudanças na taxa absoluta................................................................................... 79
4.4 Mudanças na taxa relativa.................................................................................... 84
4.5 Mudanças seqüenciais no responder.................................................................... 85
4.6 Mudanças na variabilidade.................................................................................... 86
4.7 Operantes e estímulos reforçadores..................................................................... 87
4.8 O paradigma do fortalecimento operante........................................................... 89
4.9 Operantes vocais..................................................................................................... 90
4.10 A extensão do fortalecimento operante............................................................. 92
4.11 Superstição............................................................................................................. 94
4.12 Condicionamento operante .................................................................................. 95
CAPÍTULO 5 - EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE....... 99
5.1 Mudanças na taxa de resposta durante a extinção.............................................. 100

5.2 Mudanças topográficas e estruturais na extinção............................................... 101
5.3 Resistência à extinção........................................................................................... 102
5.4 Recuperação espontânea ....................................................................................... 106
5.5 Condicionamento e extinção sucessivos............................................................. 107
5.6 Esquecimento e extinção...................................................................................... 108
5.7 Uma definição compreensiva de extinção operante........................................... 112
5.8 A extensão dos conceitos de extinção................................................................. 112
5.9 Representações gráficas dos resultados de experimentos nos quais muitas
variáveis independentes são estudadas em conjunto........................................ 116
SEGUNDA PARTE: AS UNIDADES FUNDAMENTAIS DE ANÁLISE............... 121
CAPÍTULO 6 - NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTÍ

MULO................................................................................................ 123
6.1 Respostas e eventos ambientais............................................................................ 124

6.2 Situações e eventos ambientais............................................................................. 126
6.3 A noção de uma contingência comportamental................................................ 127
6.4 A situação inicial (Sa ) .......................................................................................... 129
6.5 Contingências múltiplas na mesma situação....................................................... 130
6.6 A contingência n u la .............................................................................................. 132
6.7 A duração das situações e das contingências....................................................... 133
6.8 Mais de uma resposta é exigida para a conseqüência S ....................................... 134
6.9 Contingências repetitivas......................................................................... ........... 135
6.10 Facilitação............................................................................................................. 136
6.11 Çontingências negativas....................................................................................... 137
6.12 Contingências probabilísticas............................................................................. 138
6.13 Discriminações...................................................................................................... 139
6.14 R e S funcionalmente dependentes................................................................... 140
6.15 Contingências agrupadas...................................................................................... 141
CAPÍTULO 7 - REFORÇAMENTO INTERMITENTE......................................... 143
7.1 Contingência de intervalo.................................................................................... 144

7.2 Probabilidade de reforçam ento.......................................................................... 149
7.3 Notas teóricas sobre esquemas de reforçam ento.............................................. 152
7.4 Os efeitos do reforçamento intermitente naresistência à extinção................. 153
7.5 Outros efeitos comportamentais do reforçamento interm itente.................... 155
7.6 Estados estáveis do com portam ento.................................................................. 155
CAPITULO 8 - A ESPECIFICAÇÃO DA RESPOSTA.......................................... 159
8.1 A definição de classes de resposta............................................... ..................... 159

8.2 Uma definição de resposta operante emtermos da teoria dos conjuntos....... 163
8.3 O paradigma da diferenciação............................................................................ 164
8.4 Aproximação sucessiva........................................................................................ 169
8.5 Extensão do conceito de operante.................................................................... 170
8.6 Diferenciação de ta x a .......................................................................................... 176
8.7 Reforçamento do responder contínuo.............................................................. 178
8.8 Sumário................................................................................................................. 179
8.9 A linguagem e lógica dos conjuntos................................................................... 180
CAPÍTULO 9 - CONTROLE AMBIENTAL............................................................ 185
9.1 Dimensões do estím ulo....................................................................................... 185

9.2 Generalização de estím ulo................................................................................... 190
9.3 Generalização da extinção................................................................................... 197
9.4 Algumas implicações da generalização............................................................... 199
9.5 Notas sobre o delineamento de experimentosem psicologia usando sujeitos
anim ais................................................................................................................... 201
TERCEIRA PARTE: UNIDADES COMPONENTES DO COMPORTAMENTO .... 203
CAPÍTULO 10 - DISCRIMINAÇÃO........................................................................... 205
10.1 Duas condições do estímulo, uma classe deresposta......................................... 206

10.2 O paradigma da discriminação............................................................................ 210
10.3 Duas condições do estímulo, duas classes de resposta..................................... 21 i
10.4 m Condições do estímulo, n classes de resposta............................................... 213
10.5 Mudanças contínuas no comportamento em função de mudanças contínuas
numa dimensão do estím ulo............................................................................... 215
10.6 Discriminação sem respostas em S^ .................................................................. 217
10.7 Tempos de reação discriminativos..................................................................... 219
10.8 As implicações do controle de estímulo operante........................................... 220
10.9 A significância das diferenças entre duas m atérias........................................... 221
CAPITULO 11 - REFORÇADORES ADQUIRIDOS................................ 227
11.1 As propriedades reforçadoras dos estímulos discriminativos positivos.......... 228

11.2 Como aumentar a durabilidade de reforçadores condicionados..................... 229
11.3 Recompensas “token” ......................................................................................... 233
11.4 Reforçadores generalizados ................................................................................. 234
11.5 Respostas de observação ..................................................................................... 235
11.6 As condições necessárias e suficientes para se criar reforçadores condi
cionados ................................................................................................................. 237
11.7 O reforçamento secundário no comportamento social................................... 239
CAPÍTULO 12 - ENCADEAMENTO........................................................... 245
12.1 Os elementos de cadeias comportamentais............................................. ......... 245

12.2 O desenvolvimento de uma cadeia com plexa................................................... 247
12.3 A aprendizagem de labirinto como um encadeamento................................... 251
12.4 Os efeitos da extinção seletiva em pontos diferentes na cadeia..................... 252
12.5 Esquemas encadeados.......................................................................................... 255
12.6 O comportamento humano cotidiano como encadeamento........................... 257
12.7 Cadeias vocais....................................................................................................... 260
12.8 Cadeias ramificadas e representação do diagrama de fluxo............................ 263
12.9 Cadeias de comportamento encoberto.............................................................. 267
QUARTA PARTE: CONTINGÊNCIAS COMPLEXAS.............................................. 271
CAPÍTULO 13 - AQUISIÇÃO DE CONCEITO ......................................... 273
13.1 Dispc' íção para aprender (simples)................................................................... 274

13.2 Algumas variáveis que interferem na aquisição da disposição para aprender
(L -S E T )................................................................................................................. 278
13.3 L-SETS mais com plexos.................................................................................... 278
13.4 Experimentos simples sobre formação de conceito em sujeitos hum anos..... 280
13.5 Estudos sobre formação de conceito em animais............................................ 284
13.6 Classes arbitrárias de S^; conceitos disjuntivos............................................... 288
13.7 Significado e compreensão considerados como interrelações entre conceitos 291
13.8 A aquisição de conceito através da instrução programada............................. 298
13.9 As constâncias perceptivas.................................................................................. 305
CAPÍTULO 14 - SOLUÇÃO DE PROBLEMA E INTELIGÊNCIA........................ 311
14.1 A estrutura de um problema e a natureza de uma solução............................ 311

14.2 Quebra-cabeças..................................................................................................... 315
14.3 Estratégias de procura de heurísticas................................................................ 318
14.4 Identificação do conceito.................................................................................... 321
14.5 A mensuração de habilidades para solucionar problema: testes de inteli
gência ..................................................................................................................... 323
14.6 Correlação, teste de confiabilidade e validade.................................................. 327
QUINTA PARTE: DINÂMICA DO REFORÇO......................................................... 335
CAPÍTULO 15 - MOTIVAÇÃO I ................................................................................ 337
15.1 Causa e efeito e a noção de lei científica......................................................... 337

15.2 Causas fictícias do comportamento .................................................................. 339
15.3 História passada com contingências de condicionamento e extinção como
causas do com portam ento................................................................................... 340
15.4 Motivos e reforçadores................................................................... ..................... 342
15.5 Operações de impulso ......................................................................................... 343
15.6 Periodicidades no valor do reforçam ento......................................................... 344
15.7 Paradigmas de privação e saciação.................................................................... 346
15.8 A mensuração dos impulsos................................................................................ 348
CAPÍTULO 16 - MOTIVAÇÃO I I ............................................................................... 361
16.1 Ativação e aspectos direcionais da motivação.................................................. 361

16.2 Incentivo ............................................................................................................... 365
16.3 Fatores fisiológicos na motivação ...................................................................... 366
16.4 Reforçadores primários adicionais...................................................................... 371
16.5 Drives adquiridos.................................................................................................. 377
CAPÍTULO 17 - CONTINGÊNCIAS AVERSIVAS................................................... 383
17.1 Reforçadores negativos........................................................................................ 383

17.2 Condicionamento de fuga ................................................................................... 384
17.3 Parâmetros de S'".................................................................................................. 385
17.4 Estímulos aversivos condicionados..................................................................... 390
17.5 Condicionamento de esquiva.............................................................................. 392
17.6 Punição................................................................................................................... 398
17.7 Masoquismo........................................................................................................... 402
CAPfrULO 18 - COMPORTAMENTO EMOCIONAL.............................. P................ 405
18.1 É a emoção uma causa do comportamento ou um efeito comportamental? .. 405

18.2 Três conceitos de em oção.................................................................................. 407
18.3 O paradigma da ansiedade.................................................................................. 412
18.4 R aiva...................................................................................................................... 416
18.5 Elação..................................................................................................................... 418
18.6 Um modelo para representar einterrelacionar fenômenos emocionais.......... 421
18.7 Medicina psicossomática...................................................................................... 425
18.8 O sistema nervoso autônom o.................................................................... i........ 427
18.9 Controle emocional, maturidade emocional e comportamento emocional
patológico............................................................................................................... 431
18.10Um índice de mudança emocional..................................................................... 434
ÍNDICE ANALÍTICO.......................................................................................................... 437

NOTAS AOS ESTUDANTES
UMA PSICOLOGIA INTRODUTÓRIA PODE SER INTERPRETADA COMO UMA

introdução aos métodos e princípios da análise científica do comportamento. Embora as
definições antigas de Psicologia enfatizassem os “processos mentais”, por razões que
serão esclarecidas através deste texto, uma abordagem moderna àPsicologia toma o
comportamento dos seres humanos assim como dos animais inferiores como seu objeto
de estudo. Apoiando-se firmemente no canone de que apenas o que pode ser observado
pode ser cientificamente estudado, este ponto de vista moderno ataca problemas da
Psicologia tradicional através da análise do comportamento. No decorrer deste texto
encontrar-nos-emos estudando e representando na linguagem do comportamento, tópicos
tais como aprendizagem e memória, solução de problema e inteligência, sensação e per
cepção, emoção e motivação.
A organização deste livro permitirá que você chegue a uma compreensão preliminar
dos princípios básicos do comportamento humano. Embora muitos dos paradigmas e
conceitos fundamentais, que são tratados com detalhes, tenham sido derivados origi
nalmente de experimentos de laboratório com sujeitos animais, eles não são de modo
algum limitados aos animais. Empregamos sujeitos animais na pesquisa psicológica por
razões pragmáticas: o ser humano do século vinte provavelmente não se submeteria
livremente a uma faixa ampla de controle ambiental necessária para um estudo científico;
e mesmo que se submetesse, a sociedade não o permitiria.
Para chegar a uma compreensão das causas do comportamento humano e animal,
será necessário que você adquira primeiro um vocabulário técnico e uma familiaridade
completa com os conceitos básicos da Psicologia. Não se conhece um caminho mais curto
para se chegar a tal vocabulário. Você deverá aprendê-lo do mesmo modo que, ao se
preparar para uma partida de xadrez, é necessário aprender os nomes e movimentos
permissíveis das peças, as saídas mais comuns e os princípios básicos de ataque e defesa.
Ao estudar Psicologia, você pode ter uma desvantagem peculiar que não existe na
aprendizagem inicial de xadrez. Certas opiniões e pontos de vista pré-concebidos sobre as
causas do comportamento, os quais são uma parte padrão da interpretação do mundo
dada pelo bom senso, devem primeiro ser esquecidas. Infelizmente, esta visão do bom
senso da natureza humana não é sempre a mais útil para a formulação de uma ciência
-1 9 -
sistemática das relações entre o comportamento e suas variáveis controladoras. Por essa
razão, será melhor que você tente colocar de lado seus preconceitos sobre as ações das
pessoas e, em particular, seu sistema de representação dos assim chamados processos
mentais internos. Tente, assim, abordar a matéria com um ponto de vista novo, conten
tando-se, inicialmente, em fazer perguntas ingênuas tais como “ O que o organismo
observado estava fazendo? ” e “O que se relaciona consistentemente com o que ele
fazia? ” No início, seu progresso pode parecer lento mas ele será sempre seguro.
J. R. M.
- 20-
PRIMEIRA PARTE
A REGULARIDADE DO COMPORTAMENTO
1. UM BACKGROUND PARA A ABORDAGEM

CIENTIFICA AO COMPORTAMENTO
2. COMPORTAMENTO REFLEXO (EL1CIADO)
3. CONDICIONAMENTO PAVLOV1ANO
4. FORTALECIMENTO OPERANTE
5. EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE
Capítulo 1 UM BACKGROUND PARA A ABORDAGEM CIENTIFICA AO COM
PORTAMENTO
Quando Sócrates ouviu falar das novas descobertas no campo da anatomia, que se
propunham a provar que as causas dos movimentos corporais eram derivadas de um
engenhoso arranjo mecânico dos músculos, ossos e articulações, disse: “ Isto dificilmente
explica porque estou sentado aqui, numa posição recurvada... falando com vocês”
(Kantor, 1963). Passaram-se 2.300 anos desde este comentário de Sócrates e nos séculos
subsequentes, as causas do comportamento humano foram atribuídas a marés, espirito
divino, posição das estrelas e, com freqüência, simplesmente ao capricho. Nos últimos
cem anos, surgiu uma ciência do comportamento trazendo um conceito estrutural novo,
com novas atitudes em relação às causas do comportamento. Uma breve história dos
eventos que levaram ao desenvolvimento desta ciência é uma introdução apropriada para
seu estudo. Assim como não existe um modo melhor de entender as atividades presentes
de uma pessoa do que estando a par de sua história passada, também não há melhor meio
de entender as atividades presentes de uma ciência do que através do conhecimento do
seu passado.
1.1 PRIMEIRAS TENTATIVAS PARA EXPLICAR E CLASSIFICAR O COMPORTA

MENTO HUMANO
As origens precisas da ciência do comportamento, como aquelas todos os campos
do conhecimento, estão perdidas na obscuridade dos tempos. Mesmo assim, sabemos que
pelo ano 325 a.C., na Grécia antiga, Aristóteles combinou a observação e a interpretação
num sistema naturalístico de comportamento, ainda que primitivo. Aristóteles procurou
as causas (1) do movimento dos corpos, e (2) das discriminações feitas pelos organismos.
Descreveu muitas categorias de comportamento tais como a percepção dos sentidos,
visão, olfato, audição, bom senso, pensamento simples e complexo, apetite, memória,
sono e sonho..Seus tópicos soam-nos familiares, atualmente, e eles rão ainda encontrados
de uma forma ou de outra, em quase todos os textos de Psicologia. Aristóteles estava
menos interessado na previsão e controle da natureza do que estamos atualmente e, desta
torma, suas explicações do comportamento têm um sabor mais antiquado. Aristóteles
estava preocupado em explicar as várias atividades de um indivíduo, mostrando serem
eias padrões específicos de “qualidades” gerais, tais como apetite, paixão, razão, vontade
e habilidade sensorial (Toulmin e Goodfield, 1962).
- 23 -
As observações e classificações de Aristóteles e dos estudiosos gregos que o seguiram
foram um início substancial na tentativa naturalística de entender as causas do compor-'
tamento humano. Mas a nova ciência declinou com o desaparecimento da civilização
helênica. O início da Era Cristã e da Idade Média produziu um clima intelectual pobre
para o desenvolvimento da observação e pesquisa: o homem voltou sua atenção para os
problemas metafísicos. Os Padres da Igreja iniciaram e os teólogos medievais comple
taram uma transformação conceituai de uma das “qualidades” puramente abstratas de
Aristóteles numa alma sobrenatural a quem as causas do comportamento humano eram
atribuídas. Encarando esta alma como imaterial, insubstancial, e sobrenatural, um
dualismo definitivo foi estabelecido entre alma e corpo. Colocando as causas do compor
tamento numa região não observável do espírito, este dualismo inibiu o estudo natura-
lístico do comportamento. Então, por um longo período de tempo, as ciências do
comportamento permaneceram adormecidas. Temos que pular adiante para o século
dezessete, no tempo de Galileu e o surgimento da física moderna para retomar os fios
que eventualmente, deram-lhes uma estrutura científica.
As teorias do filósofo e matemático Renè Descartes (1596-1650), contemporâneo
francês de Galileu, representam uma quebra parcial da explicação metafísica do compor
tamento. Tomando como modelo as figuras mecânicas dos jardins reais de Versailles que
se moviam e produziam sons, Descartes sugeriu que o movimento corporal era o
resultado de causas mecânicas semelhantes.
As máquinas nos nrdins reais operavam baseadas em princípios hidráulicos. A água
era bombeada em tubos fechados para impulsionar os membros das figuras, produzindo
movimentos, ou era conduzida através de aparelhos que emitiam palavras ou músicas
quando a água passava. Descartes imaginou que animais e homens eram, na realidade, um
tipo de máquina complicada, analogamente construída. Ele substituiu a água das figuras
reais pelos espíritos animais, um tipo de substância intangível, elástica e invisível; e supôs
que os espíritos fluíssem nos nervos de tal modo que entravam nos músculos causando,
assim, sua expansão e contração e, por sua vez, fazendo os membros se movimentarem.
Algumas das Figuras Reais estavam arrumadas de maneira que, se os visitantes
passassem por cima de ladrilhos escondidos, o mecanismo hidráulico atuante fazia as
figuras se aproximarem ou se afastarem. Descartes tomou essa resposta mecânica como
modelo para explicar como um estímulo ambiental externo poderia causar um movimento
corporal. Uma ilustração (ver la. Parte, p.21) num dos seus trabalhos, mostra o retraimentc
de um membro de um homem próximo de uma chama. De acordo com Descartes, “a má
quina do nosso corpo é assim formada” de tal modo que o calor de uma chama excita
um nervo que conduz essa excitação ao cérebro. Do cérebro, os espíritos animais são
transmitidos ou refletidos de volta ao membro, através do nervo, aumentando o músculo
e causando assim a contração e retraimento (Fearing 1930).
O desejo de Descartes de encarar o comportamento humano como determinado por
íorças naturais foi somente parcial. Hle limitou sua hipótese mecânica para certos com
portamentos “ involuntários” e supôs que o resto era governado pela alma, localizada no
cérebro. A alma guiava inclusive os mecanismos dos comportamentos “ involuntários” ,
mais ou menos do mesmo modo que uma máquina poderia dirigir as Figuras Reais. A
despeito deste dualismo e a despeito de sua escolha de um princípio hidráulico, as
formulações de Descartes representaram um avanço no pensamento inicial sobre o com
portamento. A teoria do corpo como um tipo específico de máquina poderia ser testada
por observação e experimentação. Hsta foi a propriedade seriamente omitida nas
- 24
explicações medievais. Ao'restabelecer a idéia de que, pelo menos, algumas das causas do
comportamento humano e animal poderiaim ser encontradas no ambiente observável,
Descartes estabeleceu as bases filosóficas que eventualmente iriam justificar uma
abordagem experimental do comportamento.
1 .2 - A AÇÃO REFLEXA
O ponto de vista de Descartes simboliza o novo interesse num mecanismo que

conduziu à experimentação sobre a ação “reflexa” do animal. Em 1750, um psicólogo
escocês, Robert Whytt, redescobriu e expandiu experimentalmente o princípio do
estímulo, de Descartes. Pela observação da contração sistemática da pupila à luz,
salivação a irritantes e vários outros reflexos, Whytt foi capaz de estabelecer uma relação
necessária entre dois eventos separados: um estímulo externo (por exemplo, a luz), e uma
resposta corporal (por exemplo, a contração da pupila). Além disso, a demonstração de
Whytt que um número de comportamentos reflexos poderia ser eliciado numa rã decapi
tada, enfraqueceu a atratividade de uma explicação em termos de alma. Contudo, não foi
possível, ainda no século dezoito, olhar o estímulo isoladamente como uma causa sufi
ciente do comportamento. A alma, pensou Whytt, provavelmente se difunde através da
medula e do cérebro, retendo, consequentemente, o controle mestre dos reflexos.
Nos 150 anos seguintes, mais e mais relações reflexas foram descobertas e elaboradas
e o conceito de estímulo adquiriu mais força. Ao mesmo tempo, a ação do nervo passou
a ser compreendida como um sistema elétrico ao invés de hidráulico. No inicio do século
XIX, a tendência espiritual tomou-se supérflua para explicar a ação “involuntária” e Sir
Charles Sherrington, célebre fisiologista inglês, pôde resumir as causas do comportamento
reflexo em leis quantitativas de estímulo-resposta. Essas leis relacionavam a velocidade,
magnitude e probabilidade da resposta reflexa à intensidade, freqüência e outras
propriedades mensuráveis do estímulo. A ciência havia anexado inteiramente o reflexo.
Mesmo assim, uma grande proporção do comportamento humano e dos animais
superiores permaneceu ligada a forças sobrenaturais.
1.3 - REFLEXOS CONDICIONADOS OU ADQUIRIDOS
Pouco antes do início do século XX, Ivan Pavlov, fisiologista russo, estava
pesquisando as secreções digestivas de cães. No curso desses experimentos, notou que
enquanto a introdução de alimento ou ácido, na bôca, resultava num fluxo de saliva, a
mera aparição do experimentador trazendo alimento poderia também eliciar um fluxo
similar. Pavlov não foi, de modo algum, o primeiro homem a fazer observações deste
tipo. Mas parece ter sido o primeiro a suspeitar de que seu estudo detalhado poderia
fornecer um indício para a compreensão do comportamento ajustado e adaptado dos
organismos. Foi esta visão que o ievou ao estudo sistemático desses reflexos, os quais
chamou de reflexos condicionais, porque eles dependiam ou eram condicionais a um
evento prévio na vida do organismo. A aparição do experimentador não eliciava origi
nalmente a saliva. Somente depois que sua aparição era frequentemente associada com
alimento ou ácido, ela apresentava esse efeito. A contribuição particular de Pavlov foi
mostrar experimentalmente como os reflexos condicionais eram adquiridos, como
poderiam ser removidos (extintos) e que faixa de energias do ambiente era efetiva em sua
produção. Pavlov, em tempo, apontou uma lei geral de condicionamento: depois de uma
-2 5 -
associação temporal repetida de dois estímulos, aquele que ocorre primeiro, eventual
mente, passa a eliciar a resposta que, normalmente, é eliciada pelo segundo estímulo.'
Esta lei continua conosco até hoje, ligeiramente modificada.
Três aspectos gerais do trabalho de Pavlov merecem nossa atenção. Primeiro, ele não
estava satisfeito em observar simplesmente os aspectos gerais do condicionamento, como
muitos outros fizeram antes dele (c. f. Hall e Hodge, 1890). E^m vez disso, ele prosseguiu
para verificar a generalidade do fenômeno usando muitos estímulos e muitos cães. Foi
somente depois de numerosas demonstrações que ele codificou numa lei o que havia
descoberto -- lei esta aplicável, pensou ele, a todos os estímulos e a todos os organismos
superiores. Segundo, Pavlov, preocupou-se com os aspectos mensuráveis ou quantitativos
do fenômeno. Essas quantidades mensuráveis, tais como a quantidade de saliva e o
número de emparelhamentos do retlexo, foram úteis por permitirem uma análise deta
lhada do condicionamento. Um terceiro aspecto do trabalho de Pavlov foi sua natureza
sistemática. Limitando seus estudos aos efeitos de numerosas condições sobre uma única
grandeza (quantidade de saliva), Pavlov assegurou que suas descobertas experimentais
pudessem ser interrelacionadas e, consequentemente, mais significativas.
Pavlov viu claramente como se deve proceder na explicação do comportamento.
“o naturalista deve considerar somente uma coisa: qual é a relação desta ou daquela
reação extema do animal com os fenômenos do mundo externo? Esta resposta pode
ser extremamente complicada em comparação com a reação de qualquer objeto
inanimado, mas o princípio envolvido permanece o mesmo.
Estritamente falando, a ciência natural tem por obrigação determinar somente a
conexão precisa que existe entre um dado fenômeno natural e a resposta do organis
mo vivo a este fenômeno (Pavlov, 1928, p. 82)” .
Contudo, apesar de seu próprio interesse declarado na relação meio e resposta,

Pavlov gradativamente passou a encarar o condicionamento como um estudo da função
do cérebro. Suas explicações tendiam a ser em termos de processos cerebrais hipotéticos.
Mas, na verdade, Pavlov raramente mediu qualquer relação real entre cérebro e compor
tamento. Assim, estas explicações eram tão fictícias como as primeiras explicações em
termos da alma. Tentando explicar o comportamento através de funções desconhecidas
do cérebro, ele evitava uma descrição direta do próprio comportamento violando, deste
modo, uma das suas próprias afirmações de que uma ciência do comportamento necessita
determinar somente a "conexão precisa que existe entre um dado fenômeno natural e a
resposta do organismo vivo a este fenômeno” .
L4 - A TEORIA DA EVOLUÇÃO E O COMPORTAMENTO ADAPT ATIVO
De certo modo, o trabalho de Pavlov representa o auge da doutrina mecanicista de

Descartes sobre o comportamento reflexo. Com respeito ao comportamento que
tradicionalmente era colocado sob o controle do desejo ou volição, Descartes seguiu os
preconceitos de seu tempo, atribuindo-o ao controle de uma alma não observável. Tal
“solução” , todavia, apenas adiou a investigação científica, uma vez que o problema
original de explicar o comportamento foi simplesmente transferido para um outro mais
difícil, o de explicar o comportamento da alma postulada. Em 1859, ocorreu um grande
evento científico que alterou o clima intelectual tornando-o favorável para um estudo
-26 -
naturalistic*) do comportamento voluntário. Naquele ano, Charles Darwin propôs a teoria
da evolução, dizendo que o homem era membro do reino animal e que diferenças entre o
homem e outros animais eram quantitativas e somente uma questão de graus. Assim um
conhecido historiador da Psicologia colocou a questão;
“ A teoria da evolução levantou o problema da Psicologia animal porque ela exige

uma continuidade entre diferentes formas animais e entre o homem e os animais. De
uma maneira vaga, a noção Cartesiana [de Descartes] ainda prevalecia. O homem
possuia uma alma e os animais eram considerados sem alma, e havia, além disso,
pouca distinção entre uma alma e uma mente. A oposição à teoria da evolução era
baseada principalmente na suposição que fazia de haver continuidade entre homens e
feras e a réplica óbvia para a crítica foi demonstrar a continuidade. A existência de
mente nos animais e a continuidade entre a mente humana e animal, deste modo,
tornou-se crucial para a sobrevivência da nova teoria (Boring, 1929, p. 462-463)” .
A teoria de Darwin era baseada em muitas observações cuidadosas que ele havia feito de
fósseis e da estrutura da flora e fauna vivas, em áreas isoladas da Terra. Além disso, ele
pesquisou o comportamento através do qual os animais se adaptavam aos seus meios. As
observações comportamentais de Darwin foram tão amplas e detalhadas que marcam a
primeira tentativa sistemática de uma Psicologia Animal Comparativa (ver Darwin, 1873).
O interesse de Darwin no comportamento foi, como observou o professor Boring,
baseado naquilo que tal comportamento revelaria sobre a mente. Assim, a demonstração
da complexidade e variedade nos comportamentos adaptativos de animais em relação a
seus ambientes mutáveis, pareceria provar que eles, como o homem, deviam também
pensar, ter idéias, e sentir desejos. Consequentemente, Darwin foi criticado por seu
antropomorfismo, isto é, por tentar explicar o comportamento animal em termos de
conceitos mentalistas. Mas pouco se pensou neste tempo em levantar a questão meto
dológica mais radicai; se os conceitos mentalistas tradicionais (pensamento, idéia,
desejos) têm valor explicativo mesmo para o comportamento humano.
George John Romanes, amigo de Darwin, escritor inglês e popularizador da ciência
escreveu um livro sobre a inteligência animal (Romanes, 1886) no qual comparou o
comportamento de várias espécies de animais. Romanes colheu material da observação
cuidadosa de animais, mas, também levou em consideração evidências de cunho popular
sobre animais de estimação e de circo. Por esta razão, seu método veio a ser chamado
aned ó tico. Os métodos, antropomòrfico e anedótico de Darwin e Romanes,
respectivamente, marcaram uma renovação no interesse pelo comportamento adaptativo
do animal e pela relação deste com o comportamento humano. Consequentemente, eles
representam importantes precursores históricos de uma verdadeira análise experimental
do comportamento.
1 .5 - O S PRIM EIR O S EXPERIM EN TO S SOBRE O COMPORTAMENTO
“VOLUNTÁRIO”
Em 1898, Edward L. Thorndike, da Universidade de Columbia, publicou os

resultados de alguns estudos de laboratório com gatos, cães e pintos. Seus métodos eram
radicalmente opostos àqueles da observação casual que o haviam precedido. A
aparelhagem utilizada por Thorndike é mostrada na Fig. 1-1.0 comportamento estudado
foi a fuga de um ambiente fechado e atos, tais como, puxar um cordão, mover um trinco,
- 27 -
pressionar uma barra ou abrir uma porta erguendo uma tramela, foram escolhidos por sua
co n v en iên cia e ex atid ão de observação. Uma vez que qualquer um destes
comportamentos podia ser organizado de modo a servir como instrumento que
produziria a fuga da caixa, Thorndike os chamou de comportamentos instrumentais.
I igura 1-1. A caixa quebra-cabeças utilizada por Thorndike para estudar a

aprendizagem instrumental de animais (Garret, 1951).
Quatro elementos do trabalho de Thorndike sobre o comportamento instrumental

demonstram uma qualidade moderna não vista nas pesquisas comportamentais antes de
sua época. (1) Ele reconheceu a importância de se fazer observações de animais cujas
histórias passadas fossem conhecidas e mais ou menos uniformes. Logo, criou seus
animais no laboratório onde poderiam obter condições ambientais semelhantes antes do
experimento. (2) Thorndike compreendeu a necessidade de se fazer observações repetidas
de um mesmo animal e de se fazer observações em mais de um animal e em mais de uma
espécie. Somente deste modo poderia estar certo de que os resultados que ele obtinha
eram aplicáveis aos animais em geral. (3) Thorndike viu que, a menos que considerasse
mais do que um ato particular do comportamento, suas conclusões, seriam válidas apenas
para o único aspecto do comportamento que ele escolhesse. Logo, empregou diversos
comportamentos em vários aparelhos diferentes. (4) Ainda outra qualidade do trabalho
de Thorndike, caracteristicamente científica, foi sua tentativa de fazer uma apresentação
quantitativa dos resultados.
De seus trabalhos com animais nas caixas quebra-cabeça, Thorndike apresentou um
conjunto de princípios ou leis gerais do comportamento que acreditava serem válidas
para muitas espécies e muitos tipos de comportamento. Um desses, princípios, embora
-2 8 -
modificado chegou até nossos dias. Thorndike notou que, quando os animais eram
inicialmente colocados na caixa quebra-cabeça, eles apresentavam muitas respostas difusas
de debater-se. Eventualmente, um desses comportamentos difusos poderia, por acaso, fazer
funcionar o mecanismo de fuga. A porta, então, abrir-se-ia, permitindo ao animal sair da
caixa e o b te r um a pequena quantidade de alimento. Thorndike observou que o
comportamento, que inicialmente permitia ao animal sair, era apenas um dos muitos que ele
executava na situação. Assim, à medida que o animal era repetidamente submetido à
situ açã o , ele passava a a p re s e n ta r menos comportamentos supérfluos, até que
eventualmente não apresentasse, praticamente, nenhum daqueles mal sucedidos.
Thorndike concluiu disto que os resultados bem sucedidos do passado, ou efeitos do
comportamento, deveriam ter uma influência importante na determinação das tendências
comportamentais presentes do animal. Thorndike chamou isto —a capacidade dos efeitos
passados do comportamento modificarem os padrões do comportamento animal — a lei
do efeito. Esta lei sobrevive ainda hoje como um princípio fundamental na análise
fundamental e controle do comportamento adaptativo.
1 .6- O ZEITGEIST
Thorndike forneceu um novo método experimental e com sua ajuda formulou o que
logo seria aceito como uma lei básica do comportamento adaptativo. Do mesmo modo
que Whytt, 1 50 anos antes, deixou o conceito de reflexos parcialmente no estado de fato
observado e parcialmente no estado de interpretação supérflua, assim tambémThórndike
deixou a lei do efeito. Na sua proposição do princípio, Thorndike não estava satisfeito em
considerar o “efeito” como uma mera fuga do confinamento ou mero acesso ao
alimento. Mas em vez disso, sentiu necessidade de inferir que o sucesso levava ao prazer e
a satisfação, e que estas eram as causas verdadeiras das mudanças observadas no compor
tamento. Deste modo, ele deixou a explicação a cargo de estados mentais hipotéticos,
prazer e satisfação, os quais não eram mais reais do que a “alma” de Descartes. Para
Thorndike, como para seus contemporâneos, o comportamento de um gato escapar de
uma caixa quebra-cabeça não era importante como comportamento, mas somente como
um meio de esclarecer os processos mentais e associações de idéias do animal.
T h o rn d ik e foi, então, fiel à sua época e suas tradições considerando o
comportamento principalmente interessante pelo que podia revelar sobre algum outro
sistema. O que as épocas e as tradições impõem aos mais originais pensadores são
frequentemente denominadas de Zeigeist. Os grandes homens de uma era erguer-se-ão
acima de Zeitgeist de algumas maneiras mas, mesmo assim, serão por ele acorrentados de
outras maneiras. Descartes superou-o quando propôs uma teoria mecanicista original
sobre o movimento do corpo. Que ele foi acorrentado pelo Zeitgeist, é evidente, pela sua
permanência no dualismo “ mente-corpo” . Vimos o Zeitgeist em Whytt, que redescobriu
o princípio do estímulo, mas não foi capaz de eliminar a alma como a causa final dos
reflexos que observou. Pavlov estudou os reflexos condicionados, um fenômeno cuja
importância foi negligenciada durante séculos. Mesmo assim, vimos que Pavlov estava
preso pelo Zeitgeist; ele manteve o ponto de vista de que os reflexos condicionados,
embora, claramente, um fenômeno comportamental, eram de interesse para a
compreensão do cérebro ao invés do comportamento. Agora, vemos o Zeitgeist em
Thorndike, que realizou alguns dos primeiros experimentos sobre o comportamento
“voluntário” , mas explicou suas descobertas através da associação de idéias. De fato, o
-2 9 -
princípio do Zeitgeist penetra de tal forma todas as ciências que podemos tomar como
regra geral que todo trabalho humano será colorido pelas teorias e ponlos de vistas
aceitos em sua época. Assim, embora a grandeza de um homem consista em libertar-se de
certas maneiras de pensar estabelecidas e ver o que ninguém antes dele viu claramente,
ou, do mesmo modo, ele não escapará completamente do clima social, filosófico e 1
cultural no qual trabalha.
1.7 - A PSICOLOGIA PERDE A SUA MENTE
Thorndike introduziu o comportamento adaptativo no laboratório e, assim fazendo,
descobriu a importância da le i do efeito. Os estudos de Thorndike sobre o compor
tamento surgiram do seu interesse, como Psicólogo, nos processos mentais. Será instru
tivo, neste ponto, examinar a disciplina da Psicologia que, na primeira metade do
século vin te, fundir-se-ia com outras contribuições históricas da ciência do
comportamento. A pesquisa psicológica experimental iniciou-se em meados do século
dezenove como uma disciplina derivada da fisiologia dos órgãos dos sentidos. De fato, os
pioneiros Herman Helmholtz, Johannes Müller e Wilhelm Wundt eram todos físicos e
fisiologistas. Estes primeiros psicólogos experimentais adotaram as categorias de
comportamento descritas por Aristóteles mas, de um modo diferente deste, eles estavam
interessados no comportamento, apenas, na medida em que esclarecia os processos
mentais. Logo, o trabalho dos primeiros psicologistas representava uma tentativa para
tornar os métodos experimentais naturalísticos, introduzidos por Galileu, compatíveis
com as doutrinas metafísicas da Idade Média.
Foi Wundt que, em 1879, fundou o primeiro laboratório de Psicologia em Leipzig.
Podemos considerar o seu sistema como representativo das atividades desta nova
disciplina, a qual tinha menos de vinte anos quando Thorndike estava fazendo seus
experimentos com gatos e pintos na Colúmbia. Wundt advogou que a psicologia era a
ciência da experiência; e, como tal%seu objeto de estudo abrangia sentimentos,
pensamentos e sensação. Ele formulou a doutrina de que o método da Psicologia era
introspectivo, um exame dos processos conscientes do organismo em experiencia. Logo,
Wundt esquematizou o problema da Psicologia como “(1) a análise dos elementos dos
processos conscientes, (2) a determinação de como esses elementos são conectados e (3)
a determinação das leis de conexão” (Boring, 1929, p. 328, ital. omitidos). Os expe
rimentos que Wundt e seus seguidores realizaram dão uma imagem melhor do conteúdo
da psicologia do que as definições fornecidas por Wundt. A maioria dos trabalhos foi
classificada sob o título de sensação humana e dizia respeito ao sentido visual em
particular. Numerosos experimentos mediam as intensidades mínimas de luz que um ob
servador poderia detectar sob várias condições. Outros estavam voltados para as menores
mudanças ambientais necessárias para um observador relatar diferenças apenas percebidas
çm luminosidade, cor e distância dos objetos. Tais pesquisas vieram a ser chamadas de
experimentos de limiares em Psicofísica. Psico— porque as sensações eram consideradas
estar sob estudo; física - porque mudanças físicas no ambiente eram manipuladas e
medidas experimentalmente. Audição, tato, gosto, olfato e o sentido do tempo também
foram pesquisados, assim como o tempo de reação, atenção e sentimento. A memorização
de vários tipos de sílabas sem sentido era um método para tratar a associação de idéias e
deduzir as propriedades da memória.
Embora se afirmasse ser a psicologia uma ciência dos conteúdos, processos e atos
mentais, o que de fato ela investigava era o comportamento. Associações de idéias eram
- 30-
inferidas a partir da aprendizagem de sílabas sem sentido; sensações idênticas eram inferi
das de observações do comportamento quando um sujeito humano agrupava dois objetos
ambientais diferentes em contextos diferentes (por exemplo, duas amostras de papel
cinza sob diferentes condições de iluminação); a velocidade do processo mental era
inferida do tempo de reação do indivíduo. Assim, não foi paradoxo algum o fato de que
quando Thorndike veio a fazer uma observação mais detalhada da associação de idéias,
estivesse livre para escolher animais como sujeitos. Se o comportamento dos
organismos humanos poderia levar à inferência sobre o processo mental, por que não o
comportamento animal? Logo, aconteceu que o trabalho de Thorndike ajudou a intro
duzir os métodos de pesquisa animal na Psicologia. Aí eles pejmanecem ao lado dos
descendentes metodológicos da psicologia sensorial clássica e da Psicologia introspect iva
do século dezenove.
Mas, talvez o homem que mais contribuiu para esclarecer a relação entre o
comportamento e Psicologia foi John B. Watson. O primeiro trabalho deste psicologista
americano dizia respeito às modalidades sensoriais que o rato usa na aprendizagem de um
labirinto. À medida que Watson continuava seus estudos com animais, tornava-se mais e
mais preocupado com o ponto de vista predominante de que o comportamento era
significativo somente quando esclarecia processos mentais ou conscientes. Ocorreu a
Watson que os dados do comportamento tinham valor em si mesmos e que os problemas
tradicionais da Psicologia — imaginação, sensação, sentimento, associação de idéias —
poderiam ser todos estudados estritamento por métodos comportamentais.
Em 1913, Watson publicou um trabalho, atualmente clássico, definindo a psicologia

como ciência do comportamento e chamando esta nova Psicologia de “behaviorismo” .
Watson argumentava, neste trabalho, que o estudo do comportamento poderia chegar a
u m ‘status’ independente dentro da ciência. O objetivo de tal ciência seria a previsão e
controle do comportamento de todos os animais, sem nenhuma preferência especial para
os seres humanos. O behaviorista, dizia Watson, deve relacionar seus estudos de ratos e
gatos com o comportamento humano não mais (não menos) do que o zoologista deve
relacionar suas dissecações de sapos e vermes à anatomia humana. Através de sua
doutrina, Watson estava destruindo a teoria homocêntrica da importância do homem no
mundo do comportamento tão eficazmente como Copérnico, quatrocentos anos antes,
havia destruído a teoria do universo geocêntrico (terra no centro).
O ponto crítico de Watson era o de que a psicologia deveria ser objetiva —isto é, ela
deveria ter um objeto de estudo que, como nas outras ciências, fosse independente do
observador. A Psicologia clássica, tentando estabelecer como seu objeto a auto-
observação, carecia de um observador independente, localizado fora do sistema em
consideração. A adoção do comportamento como objeto a ser observado deu à nova
psicologia o observador independente necessário.
O programa de Watson tinha um grande alcance e era para sua época, notavelmente
sofisticado. Ao enfatizar o comportamento como um objeto independente de uma
ciência dirigida para a previsão e controle do comportamento e a análise microscópica
do ambiente e comportamento em termos de estímulo e resposta como a maneira para a
compreensão eventual de padrões complexos do comportamento, o programa de Watson
preparou a base para nossos pontos de vista modernos.
- 31 -
1 . 8 - 0 FIRME ESTABELECIMENTO DE UMA ANÁLISE EXPERIMENTAL DO
COMPORTAMENTO
Os primeiros experimentos de Thorndike sobre o comportamento animal e a
definição de Psicologia dada por Watson, como uma ciência do comportamento,
introduziram a pesquisa animal na Psicologia,Mesmo assim, o ‘status’ científico da nova
Psicologia era precário. No princípio dos reflexos condicionados formulado por Pavlov,
Watson pensou ter encontrado um mecanismo explicativo para muitos dos ajustamentos
complexos e sutis de organismos adultos, inclusive o homem, aos seus ambientes. Mas a
tentativa de forçar todos os comportamentos no modelo do reflexo foi um fracasso.
Watson não soube apreciar a importância daJei do efeito de Thorndike, principalmente,
pode-se supor, devido ao excesso de bagagem conceituai com que Thorndike envolvera a
questão. O ponto de vista de Watson de que a tarefa de uma ciência preditiva do
comportamento fosse a compilação de todas as correlações estímulo-resposta hereditárias
e adquiridas que um dado organismo exibisse, desviou a atenção da procura de leis gerais
do comportamento. Neste vácuo teórico, conceitos mentalistas tradicionais continuaram
a sobreviver. O rigor experimental do behaviorismo estava fora de questão, mas sua meto
dologia corria o risco de ser estéril.
“Vinte anos de “método de ciência natural” sustentados pelo behaviorismo fracas
saram em fornecer uma formulação sistemática consistente e útil. Os dados experi
mentais refletiam muitas propriedades arbitrárias dos aparelhos. Conclusões acei
táveis com qualquer grau de generalidade referiam-se a aspectos, características ou
capacidades limitantes. Enquanto muitas dessas eram bastantes válidas, poucas eram
logicamente convincentes e preferências pessoais levavam a muitas ‘ciências’
individuais do comportamento” (Skinner, 1944; p. 276).
Numa série de publicações iniciadas em 1930, B. F. Skinner propôs uma formulação

do comportamento que surgiu de observações feitas num único organismo respondendo
numa situação experimental artificial, cuidadosamente controlada e altamente padro
nizada. O organismo que Skinner usou foi o rato branco, e a aparelhagem consistia numa
caixa contendo uma pequena barra que, se pressionada pelo rato, fornecia uma pequena
pelota de alimento em um recipiente localizado diretamente abaixo da barra
Figura 1-2. A caixa de Skinner

para o estudo do comportamen
to operante de pequenos animais
(Skinner, 1938).
-3 2 -
Sob essas condições experimentais, um rato faminto deixado só na caixa, logo viria a
pressionar a barra com uma taxa constante e moderada até que um dado número de
pelotas de alimento liberadas começasse a saciar o animal. A situação experimental
utilizada por Skinner e sua abordagem aos problemas do comportamento foram únicas
em muitos aspectos. Skinner viu a necessidade de encontrar uma variável dependente
sensível e exata. Isto é, algum aspecto quantitativo do comportamento que pudesse variar
numa ampla faixa e ter uma relação ordenada e regular com as variáveis ambientais
passadas e presentes, relação esta que pudesse ser formulada em termos de uma lei. Sua
descoberta de que a freqüência de ocorrência da resposta de pressionar a barra durante
um intervalo de tempo (sua taxa) satisfazia essas condições, foi o principal avanço em
direção a uma análise sofisticada do comportamento individual.
A abordagem de Skinner aos problemas do comportamento diferia, de certo modo,
daquelas dos seus precursores assim como de seus contemporâneos que trabalhavam com
a psicologia animal. Como proposição fundamental, ele sustentou que uma ciência do
comportamento poderia ser o que chamou de descritiva ou funcional; isto é, poderia
limitar-se a descobertas de relações ou correlações entre variáveis mensuráveis. Skinner
também argumentou que as pesquisas deveriam ser sistemáticas, no sentido de que as
relações obtidas estivessem ligadas por um ponto comum. Limitando suas observações às
formas pelas quais uma única variável dependente (a freqüência por unidade de tempo de
um ato arbitrário mas, mesmo assim, representativo) mudavam com as condições
ambientais variadas, Skinner manteve seu próprio trabalho altamente sistemático.
Um objeto de estudo, frequentemente, espera instrumentos para colocar o
observador em melhor contato com ele. Skinner inventou um registrador que realiza um
registro visual das respostas sucessivas através de um ligeiro deslocamento vertical de uma
pena, movendo-se horizontalmente no tempo. À medida que o experimento progride, um
gráfico de respostas acumuladas é desenhado em função do tempo. Esse registrador
cumulativo de respostas torna possível um registro de alta qualidade do processo
comportamental para inspeção imediata que funciona para os behavioristas de uma
maneira não diferente da que o microscópio funciona para o biologista.
As contribuições metodológicas reais de Skinner para a ciência moderna do
comportamento são numerosas e podemos apresentar, aqui, somente um esboço de
algumas das mais importantes. Ele reconheceu a antiga dicotomia entre ações reflexas e
voluntárias ou, como chamou mais tarde, operantes. Mas mostrando que o princípio de
Pavlov se aplicava ao fortalecimento dos reflexos, enquanto a lei do efeito de Thorndike
descrevia o fortalecimento de operantes, ele colocou ambos os tipos em perspectiva
harmoniosa. Formulou, tambérq um vocabulário preciso cujos termos foram definidos
com referência aos fatores observáveis que ele media e manipulava. Nessa terminologia
está a base do nosso quadro conceituai moderno.
Desde o inicio, Skinner enfatizou a importância da predição e controle detalhados
do comportamento individual, ao invés de diferenças gerais entre grupos de animais. Suas
próprias pesquisas foram invariavelmente caracterizadas por um grande número de
medidas em poucos organismos, sendo a reprodutibilidade do processo sob estudo o teste
de sua validade. O enfoque de Skinner na taxa de uma resposta operante representativa
evitou muitos dos problemas associados com as medidas mais indiretas do compor
tamento. Thorndike observou o número de erros cometidos e o tempo gasto para
alcançar o sucesso no seu quebra-cabeça, mas nenhuma dessas era, na realidade, uma
propriedade real do comportamento instrumental que estava sendo adquirido. Se dese
jamos treinar um cão a pular através de um aro, por exemplo, não estamos interessados
- 33-
nos erros que ele comete, mas no seu comportamento de pular através do aro. Os erros são
medidas de comportamentos outros que não aqueles que estamos investigando. Questões
interessantes sobre se um dado ato ocorrerá ou não, ou com que freqüência ocorrerá,
nunca poderiam ser respondidas em termos de erros ou escores de tempo. O dado básico
de Skinner, a taxa de respostas, está relacionado de perto com a probabilidade de
ocorrência do comportamento e tem sido especialmente útil em fornecer respostas a
questões sobre a probabilidade da resposta.
Com o passar dos tempos, Skinner ampliou sua base empírica. Combinações de
respostas e organismos outras que não o pressionar a barra por ratos têm sido estudadas.
A expectativa original de que este ato seria característico do comportamento operante,
de um modo geral, tem sido aparentemente confirmada. Além disso, as relações que
Skinner obteve garantem, em muitos casos, o título de princípios comportamentais, já
que elas parecem manter-se para um grande número de organismos, incluindo o homem,
e para todas as respostas que podem ser classificadas como operantes.
O trabalho de B.F. Skinner nos leva a um ponto próximo da nossa conceituação
moderna de ciência do comportamento. Estamos ainda muito perto desse período his
tórico, muito envolvidos em nosso próprio Zeitgeist, para termos a perspectiva necessária
para determinar os pontos fracos no sistema de Skinner. Nos capítulos que se seguem,
todavia, veremos que a ciência do comportamento, atualmente restabelecida de um modo
firme como uma ciência natural, está se expandindo em muitas áreas de pesquisas. Talvez,
a prova mais convincente de que essa ciência se desenvolveu encontra-se no surgimento
recente de uma tecnologia do comportamento esboçada diretamente a partir dela. Como
veremos, as aplicações de técnicas do comportamento estão sendo ampliadas a pesquisas
de drogas, treino de animais, guerras, tratamento do comportamento humano anormal e
educação.
1.9 - REVISÃO
A história da ciência do comportamento começa com a classificação naturalística do

comportamento feita por Aristóteles. Logo foi sucedida por uma Filosofia Teológica e a
análise do comportamento permaneceu adormecida por quase dois mil anos. Mas no
século XVII, surge novamente com a concepção de Descartes de que o corpo animal é
uma máquina, e alguns dos seus movimentos são ordenados e regulares. Robert Whytt e
várias gerações de fisiologistas posteriores mostraram que estes movimentos de
característica automática se relacionavam, de forma precisa, a eventos particulares nc
ambiente do animal. Essa relação entre um evento ambiental e um movimento particular
torna- e a primeira unidade organizada de análise para a ciência do comportamento. Ê o
reflexo. Eventualmente, Pavlov amplia o conceito de reflexo para incluir relações
ambiente-comportamento que são condicionais a operações anteriores na história do
animal. Esses reflexos condicionais tornam possível uma análise de alguns dos
comportamentos que um organismo adquire durante sua vida. Thorndike é o primeiro a
mostrar que o comportamento que possui uma espontaneidade não observada nos
reflexos obedece a certas leis qualitativas que diferem das leis do reflexo. Nessa época,
John Watson inicia a sua campanha para convencer a Psicologia, o estudo da mente, de
que a mente é, em grande parte, comportamento. Com a descoberta de B. F. Skinner de
um objeto de estudo fidedigno, a taxa de respostas operante, o comportamento
espontaneamente emitido começa a desenvolver leis próprias, sendo cada ocorrência tão
-34-
geral e previsível como aquelas do reflexo. Aiiistória da análise do comportamento revela
que os homens estão bastante enclinados a adotar interpretações supérfluas sobre o
com portam ento, ao invés de aceitar a realidade das descrições do próprio
comportamento. Quase todo contribuinte da ciência compartilhou de algumas
superstições da sua época sobre o comportamento que estava pesquisando.
REFERÊNCIAS PARA O CAPITULO 1.
Boring, E. G. A history of experimental psychology. New York: The

Century Company, 1929.
Darwin, C. R. The expression of the emotions in man and animals.
London: Murray, 1873.
Dennis, W. Readings in the history of psychology. New York: Appleton-
Century, 1948. (Chapters 3, 45, 48, and 50.)
Fearing, F. Reflex action: a study in the history of physiological psy
chology. Baltimore: Williams and Wilkins, 1930.
Garrett, H. Great experiments in psychology, New York: Appleton-
Century-Crofts, 1951.
Hall, G. S., and Hodge, C. F. A sketch of the history of reflex action.
Am er. J. Psychol., 1890, 3, 71-86; 149-173; 343-363.
Kantor, J. R. The scientific evolution of psychology. Vol. 1. Chicago:
Principia Press, 1963.
Pavlov, I. P. Lectures on conditioned reflexes. New York: International
Publishers, 1928.
Romanes, G. J. Anim al intelligence. (4th ed.) London: Kegan Paul,
1886.
Skinner, B. F. A review of C. L. Hull’s Principles of behavior. Am er.
J. Psychol., 1944, 57, 276-281.
Skinner, B. F. The concept of the reflex in the description of behavior.
/. gen. P s y c h o l 1931, 5, 4 27-458.
Thorndike, E. L. Animal intelligence. Psychol. R e v . Monogr. Suppl.
1898, No. 8.
Toulmin, S., and Goodfield, June. The architecture of matter. New York:
Harper and Row, 1962.
Watson, J. B. Psychology as the behaviorist views it. Psychol. R ev.f
1913, 20, 158-177.
-3 5 -
Capítulo 2 - COMPORTAMENTO REFLEXO (ELICIADO)
Seria consistente com a nossa argumentação histórica sobre a ciência do compor*

tamento afirmar que a Psicologia é a ciência que se preocupa com o modo pelo qual o
comportamento de um organismo está relacionado com o seu ambiente. Talvez a mais
simples dessas relações comportamento-ambiente seja o reflexo.
Para o fisiologista, o reflexo é um fenômeno a ser explicado. Isto é, o fisiologista
está interessado nas estruturas anatômicas subjacentes ao reflexo e os eventos corporais
que ocorrem entre o estímulo eliciador e a resposta. Seu interesse baseia-se na compo
sição ou análise do reflexo. Para o Psicólogo, por outro lado, o reflexo é um fenômeno a
ser empregado para explicar outros comportamentos. Isto é, o Psicólogo está interessado
em mostrar que padrões complexos de comportamento são compostos de, ou podem ser
sintetizados a partir dos reflexos. A distinção análise-síntese mostra de uma vez o ponto
comum e o ponto de partida das duas ciências. A partir do reflexo, as duas disciplinas
movem-se em direções diferentes. Como Psicólogos, desejamos usar o reflexo como um
princípio explanatório ou como uma unidade de análise do comportamento mais com
plexo. Portanto, devemos entender algumas das propriedades quantitativas e conceituais
dos reflexos.
2.1 - A FÓRMULA S - R
Como vimos ao considerar o comportamento reflexo no capítulo 1, Descartes e

Whytt representaram o ambiente com o conceito de estímulo. E representaram o com
portamento em termos dos movimentos do organismo ou resposta a este estímulo. Esses
conceitos continuam a ser úteis para a descrição de relações ordenadas entre ambiente e
comportamento. Neste capítulo, designaremos o estímulo na relação reflexa pelo
símbolo S e a resposta pelo símbolo R. A regularidade existente na relação entre eventos
ambientais e ações reflexas podem ser resumidas pela fórmula.
R 2 = / ( S2)
^ssa fórmula diz que uma certa resposta reflexa, R 2 (chamada um respondente). é uma
função de (isto é, depende de) um evento estímulo S2 (chamado um eliciador)1. Essa
1. Os ín d ices n u m érico s serão esclarecidos no C a p ítu lo 3.
-37 -
fórmula expressa uma relação ou correlação importante, entre dois eventos. No de
correr deste capítulo, examinaremos esta correlação em detalhe.
Um dos experim entos de Sherrington serve de ilustração. Ele conectou um
músculo da perna de um gato a um aparelho para medir a contração deste músculo.
Anteriormente, sob anestesia, o cérebro do gato havia sido desconectado da medula. (No
estudo dos reflexos, as influências que não estão sob o controle direto do expe-
rimentador são frequentemente removidas cirurgicamente. Neste caso, separar o cérebro
da medula espinhal remove qualquer efeito possível que o cérebro possa ter sobre o
músculo em estudo.) Choques elétricos breves de várias intensidades foram, então, apli
cados a um nervo sensorial que se sabia estar envolvido em um arco reflexo neste
músculo.
A Fig. 2. 1 ilustra os resultados hipotéticos do tipo que Sherrington poderia ter
obtido, à medida que aumentasse gradualmente a intensidade do choque em sete tenta
tivas sucessivas. Algumas das propriedades de um reflexo típico estão representadas: por
exemplo, se observarmos, na Fig. 2.1, que a linha relativa ao tempo se desloca da esquerda
para a direita, observaremos primeiramente que o choque mais fraco (o choque mais fraco e
localizado na extrema esquerda) não elicia um respondente. Valores de choque não
suficientes para eliciar uma resposta . Mas para estarmos certos, apresentamos o mesmo
valor do choque novamente na tentativa 3. Desta vez, obtemos uma resposta. Este valor
do choque se encontra no que chamaremos a região de penumbra ou limiar: é o bastante
forte para, algumas vezes, eliciar um respondente e outras vezes não. Continuando nossas
apresentações de choque de maior intensidade observamos um número de efeitos inte
ressantes: (1) cada apresentação de choque é seguida por (elicia) um respondente, (2)
choques eliciadores mais fortes são seguidos por respondentes mais fortes, (3) os res-
pondentes ocorrem mais rapidamente após eliciadores mais fortes; isto é, o tempo entre o
eliciador e o respondente, chamado latência, é menor quando o eliciador é mais forte.
latência longa latência curta

r*—
i —► M—
Respondente A .k A A h
região de penumbra
■
Choques elétricos
no músculo JL JL
T em p o ►
- ----- 1-----1-----1-----1---- J-----1-----1-----1-----1-----1----- 1——J----- L——i---------- 1------------- l
Figura 2 1 Seqüência temporal esquemática de apresentações repetidas de um

eliciador e a ocorrência de respondentes associados. A altura dos respondentes indica sua
magnitude. A altura dos eliciadores indica sua intensidade. A distância entre o apàreci-
mento do eliciador e o aparecimento do respondente representa a latência. A linha do
tempo é feita por um marcador periódico que marca intervalos de tempo iguais e
arbitrários.
-3 8 -
A descoberta de relações e propriedades como essas ilustradas na Fig. 2. 1 é um dos
objetivos permanentes da ciência. Quando relações quç se mantém entre os valores de um
evento (tais como intensidades de choque) e valores de outro evento (tais como a mag
nitude ou rapidez de movimento do músculo) podem ser isoladas ou reproduzidas dia
após dia, experimento após experimento, frequentemente falamos da regularidade da
natureza. De um modo figurado, estamos dizendo que a natureza parece ser limitada por
certas leis cuja descoberta é o principal objetivo da pesquisa científica.
Devemos qualificar cuidadosamente essa última proposição * todavia, porque parece
certo que as relações ou leis da natureza não são como conchas numa praia, esperando
por nós para ajuntá-las numa cesta científica.
Antes de podermos estabelecer leis relacionando nossos conceitos, é preciso termos
formulado, pelo menos numa primeira aproximação, os nossos conceitos. A descoberta
das leis do reflexo foram precedidas por quase trezentos anos de uma evolução gradual
do conceito de estímulo, iniciando-se com Descartes. Então, a ciênciaé uma operação
similar ao funcionamento de uma armadilha. Em estágios pré-científicos, nossa intuição e
experiência ingênua levam-nos a suspeitar que uma certa ordem existe na natureza a
especulamos qual a natureza desta ordem. (Por exemplo, consideremos a suposição de
Descartes de que o comportamento involuntário era como uma máquina.) Então,
começamos a perturbar um pouco a natureza, isto é, a fazer experimentos e, assim,
mudar o curso natural dos eventos de modo que possamos obter uma idéia melhor do
que pode acontecer com um fenômeno particular.
Mas mesmo para fazer um primeiro experimento exploratório, necessitamos,
geralmente, definir nosso fenômeno de um modo mais preciso, bem como decidir sobre
o que alterar e onde procurar pelos efeitos de nossa alteração experimental. Os resultados
do nosso primeiro experimento permitir-nos-ão definir nossos termos ainda mais preci
samente. Deste modo, modificamos continuamente os nossos conceitos. Ao mesmo
tempo, enriquecemo-los, relacionando-os a outras coisas que são conhecidas. Além disso,
tendo refinado nossos conceitos na base de experimentos, somos levados a novos experi
mentos. Diz-se, às vezes, que um bom experimento responde uma velha questão e levanta
duas novas. Não há um ponto final para esse processo (o qual é a ciência) uma vez que
estamos continuamente refinando e redefinindo os nossos conceitos e continuamente
relacionando uns aos outros.
2.2 - LEIS DO REFLEXO PRIMÁRIO

A ordem ou regularidade ilustrada pela Fig. 2-1 está ao nível de uma das unidades
mais simples do comportamento, o reflexo. Devido ao fato de que esta regularidade
envolve o comportamento dos organismos como a propriedade que é sujeita a, ou
sensível a mudanças no estímulo eliciador, chamamos essas leis de leis do
comportamento.
Os cientistas tentam formular suas leis de um modo tão geral quanto possível. Não
estariam satisfeitos em ter uma lei para o efeito de choques elétricos' sobre o músculo da
perna, outra para os efeitos de ácidos na boca sobre a salivação e ainda outra para o
reflexo pupilar. Eles preferem expressar suas leis em termos de certas propriedades
comuns a todas essas relações, de modo que possam abranger uma faixa de fenômenos
tão ampla quanto possível. Assim, quando Sherrington estudou os reflexos, ele fez um
estudo de muitos reflexos envolvendo eliciadores e respondentes diferentes. A partir de
experimentos deste tipo, ele formulou três leis que podemos chamar as três leis
-3 9 -
primárias do reflexo. Essas leis não são deformuladas em termos de qualquer eliciador
particular como o choque elétrico, ou de qualquer respondente particular como um
determinado movimento muscular. Elas são, ao invés disso, formuladas genericamente
em termos de estímulos eliciadores (qualquer eliciador) e respostas (qualquer res
pondente). Formulando-as assim, obtemos uma generalidade adequada, mas com sacri
fícios de detalhes particulares. Por exemplo, a relação exata entre a intensidade do
estímulo e a magnitude do respondente varia de reflexo para reflexo. Algumas vezes, a
relação é quase diretamente proporcional, de modo que numa ampla faixa de intensidade
de estímulos, dobrando-se a intensidade do estímulo, a magnitude do respondente será
dobrada, e assim por diante. Em outros reflexos, um aumento de dez vezes na inten
sidade do estímulo seria necessário para produzir o dobro da magnitude do res
pondente. Nossas leis do reflexo primário são expressas de tal forma que essas diferenças
ficam encobertas.
Os eliciadores sempre podem ser especificados por uma dimensão de intensidade.
E n tã o , eliciadores do tipo do choque podem ser fracos, moderados, ou de maior
intensidade. Eliciadores do tipo da luz para respostas pupilares podem variar de intensidades
tão fracas, que mal podemos ver, a intensidades tão altas que a luz torna-se dolorosa. Como
notamos, energias abaixo de um certo nível na dimensão da intensidade são insuficientes
para eliciar qualquer resposta. À medida que a intensidade é gradativamente aumentada,
encontramos uma região em torno da qual valores da intensidade podem ou não eliciar
um movimento. Essa região de indeterminação onde a intensidade pode ou não ser o
bastante forte para eliciar um respondente é a região de penumbra do limiar. Podemos
formular essa informação mais especificamente numa lei:
1. Lei do limiar. Existe uma faixa de intensidade abaixo da qual nenhuma resposta
ocorrerá e acima da qual uma resposta sempre ocorrerá. Dentro dessa faixa as respos
tas ocorrerão com alguma incerteza. Um ponto arbitrário, nessa região de incerteza
(digamos, aquela intensidade que elicia a resposta 50 por cento das vezes) é chamado
de limiar, intensidade acima desse ponto são chamados estímulos eliciadores.
À medida que a intensidade do estímulo é aumentada a resposta ocorre sempre e é
graduada em relação ao estímulo. Então, eliciadores fortes eliciam rapidamente res-
pondentes fortes e de longa duração. Eliciadores fracos são seguidos mais lentamente por
respostas fracas e de curta duração. A maior parte dessa informação pode ser represen
tada por duas leis do reflexo:
2. Lei da Intensidade-Magnitude. A medida que a intensidade de um estímulo eli
ciador é aumentada, a magnitude do respondente eliciado também aumenta.
3. Lei da latência. À medida que a intensidade do estímulo eliciador é aumentada, o
tempo (latência) entre o aparecimento do estímulo eliciador e o aparecimento do
respondente diminui.
As leis do reflexo são importantes para definir o conceito de reflexo. Pode-se dizer
que um reflexo é uma correlação entre uma mudança em parte do ambiente e uma
propriedade comportamental, tal que as três leis muito especiais que descrevemos
acima sejam válidas. Esquematicainente, um reflexo pode ser representado assim
S2 —^ R-2
- 40 -
onde S2 representa um eliciador, —> representa “causa pelas leis do reflexo” e R2
representa a mudança comportamental produzida. Nessa fórmula vazia nada é dito sobre
como R 2 depende de S2 . Tal fórmula pode ser considerada extremamente geral (ela
descreve toda ação reflexa) e muito pouco precisa (ela nâo especifica os detalhes de
qualquer ação reflexa particular). A seta — > pode ser lida elicia, onde elicia é defini
do como 'conduz à, pelas leis do reflexo” . O termo elicia é de alguma importância na
ciência do comportamento porque denota um grupo muito específico de leis causais
entre ambiente e comportamento, isto é, as leis do reflexo. Então, S2 pode ser dito um
estímulo eliciador, uma mudança no ambiente que está correlacionada com o compor
tamento através das leis do reflexo. Similarmente, R 2 *o respondente, é definido como
uma resposta eliciada. E útil reservar a palavra eliciar para a definição precisa formulada
acima. Nos capítulos subseqüentes empregaremos o termo estímulo repetidamente em
conjunção com um tipo diferente de controle sobre o comportamento. Mas distingui-
remos tal controle pela omissão cuidadosa do qualificador "eliciar" naquele contexto.
2.3 - LEIS SECUNDÁRIAS DO REFLEXO
Certas leis, chamadas leis secundárias do reflexo, codificam uma informação adicio
nal. Uma delas é a lei da fadiga do reflexo. Quando um respondente é repetidamente
eliciado muitas vezes por segundo, por uma intensidade de estímulo constante, a mag
nitude do respondente declina gradualmente, e eventualmente a resposta pode cessar de
todo. Esse fenômeno é chamado façiiga do reflexo e é visto esquematicamente na Fig.
2- 2 .
Pf Ílílririnnnnnri-------------- ------------------
s 2n n n n n n n n n n n n n n n n n n nr i n . n - - - - Figura2-2. Fadiga do Renexo.
T em po __ 1------1------ 1------ 1------ 1------1------1------1------1------
Um erro comum é cometido ao se dizer que o declínio do respondente a zero é

devido à fadiga. Isto é um exemplo de uma explicação inteiramente vazia e deveria ser
evitado. Um fenômeno, (y), é parcialmente explicado quando pode ser relacionado a
outro fenômeno, (x), que ocorre anteriormente no tempo. A chuva, (y), é parcialmente
explicada quando pode ser relacionada à condensação de vapor de água que ocorre
quando uma nuvem quente é rapidamente esfriada, (x). A febre tifóide, (y), é par
cialmente explicada quando pode ser relacionada às atividades, (x), de um pequeno
microorganismo, a Salmonella typhosa. Mas para explicar que o declínio do respondente,
(y) da Fig. 2-2, é devido à fadiga, a que (x) o estamos relacionando? A fadiga, usada
neste sentido, é uma entidade não observável - sem qualquer propriedade independente
a ser relacionada ao fenômeno observável. Esse declínio do respondente é a fadiga, e não
devido à fadiga.
Outra lei secundária do reflexo é a lei da Somação Temporal de Subliminares.
Lembremo-nos de que na Lei do Limiar, apresentações muito fracas de energias apropria
-41 -
das não eliciam respondentes. Diz-se que esses valores baixos de energia estão abaixo do
limiar, e são chamados subliminares. Todavia, se apresentarmos dois ou mais desses
subliminares em sucessão rápida podemos, sob certas condições, produzir um res-
pondente. Esse fenômeno é visto esquematicamente na Fig. 2-3. É como se as duas
intensidades subliminares se somassem para formar um único eliciador. A somação tem
poral, vista na Fig. 2-3, define exatamente o que queremos dizer por esses conceitos que
chamamos de reflexos, estímulos eliciadores e respostas eliciadas.
Figura 2-3. Somação Temporal. -----* ------------ m --------------------- -------------------
Tempo ------ 1------ 1____i____i------ 1------1____i----- j------ 1------
Podemos notar em relação a isto que a palavra eliciar é frequentemente tomada sem
crítica, como sendo idêntica a “ causar”. (Por exemplo um estímulo luminoso pode ser
dito “ causa”, de um comportamento pupilar.) O termo “causa” é uma palavra antiga
usada, às vezes, na história da filosifia e da ciência para denotar uma relação necessária e
suficiente entre eventos. A palavra parece ter sido empregada para descrever um evento
X, sempre que X se relaciona a um evento Y, de tal forma que se há o evento X entáo o
evento Y ocorrerá; e se não Yf então não X. Tente essa fórmula. Faça de Y um
respondente, digamos uma contração muscular, “causada” por um estímulo-choque que
chamamos X. Logicamente, é certo que: se o choque, então a contração. É também certo
que, se não observarmos a contração (não Y ), então não terá havido um dado estímulo, o
choque (não X). É, então, evidente que, logicamente, um estímulo eliciador pode ser dito
“ causar” uma resposta na ação reflexa, mas é também claro que essa proposição oferece
pouca informação sobre a natureza exata da relação causai. Em geral necessitaremos de
uma descrição mais detalhada da relação entre o comportamento e suas causas do que é
possível por uma mera proposição da sua sucessão lógica na fórmula X e Y. Logo, o
termo eliciar é preferível ao termo “causar” no presente contexto —não porque seja algo
mais objetivo ou lógico que a palavra “causar” — mas porque “eliciar” contém uma
grande proporção de todas as leis primárias e secundárias do reflexo. Evidentemente,
quando chutamos uma bola “causamos” sua “resposta” de viajar no ar. Mas as leis que
governam essa “resposta” são as leis do movimento, de Galileu enão as leis do reflexo, de
Sherrington.
2.4 - FORÇA DO REFLEXO: UM CONSTRUCTO HIPOTÉTICO
Consideremos uir. dado reflexo, digamos, flexionar o joelho a uma pancada no

mesmo. Em qualquer momento, esse reflexo terá um certo limiar, indicado pela menor
intensidade da pancada necessária para eliciar algum movimento da perna. Além disso,
em qualquer momento, uma pancada com uma intensidade fixa eliciará um movimento
de uma determinada magnitude, com uma dada laténcia entre S2 e R 2 . E ainda, no
mesmo momento podemos conceber que um dado número de pancadas será necessário
-4 2 -
para fatigar o reflexo. Uma característica importante dos reflexos é encontrada na o d-
servação de que, nos momentos em que o limiar é baixp (uma pancada muito fraca é
efetiva) a magnitude de R.2 para um dado valor de S2 (padrão) será alta, a latência será
curta e o número de S2 sucessivos necessários para fatigar o reflexo será grande. Ao
contrário, naqueles momentos em que o limiar é alto (uma pancada forte é necessária
para qualquer movimento), a magnitude de R2 para um valor padrão de S2 será baixa, a
latência será longa e apenas poucos S2 sucessivos serão necessários para fatigar o reflexo.
Essa associação sistemática ou co-variância das propriedades do reflexo (limiar, mag
nitude, latência, etc.) levaaurna interessante construção lógica. Somos levados a
identificar essa co-variância e inferir que existe uma entidade hipotética que intervém
entre o estírtiulo e o respondente. Deduz-se que esta entidade, a ser designada como força
do reflexo, determina a variação sistemática, ou co-variância de cada propriedade do
respondente. No caso do reflexo, o cons true to força do reflexo é definido por essa
co-variância de tal modo que grandes magnitudes, latências curtas, limiares baixos, R 2
fatigadas lentamente, etc; representam reflexos fortes. Ao contrário, pequenas mag
nitudes, latências longas, limiares altos, R2 rapidamente fatigadas, etc. constituem refle
xos fracos. Note que o constructo não é definido exclusivamente em termos dos valores
respondente. Ele incorpora (no limiar) também o valor do eliciador. Então, uma R2 de
graitde magnitude não precisa necessariamente representar um reflexo forte. Ela pode
bem ser o resultado de um reflexo fraco sendo testado com um S2 intenso. O construto
força do reflexo é representado na Fig. 2.4.
Magnitude
Figura 2-4. O construto força do
Limiar
Diz-se que o construto da Fig. 2-4 é hipotético, simplesmente porque não é dire
tamente observado. Ninguém viu a força de um reflexo; o que vemos são meramente as
mudanças no comportamento. Mas o fato de mudanças comportamentais estarem corre
lacionadas umas às outras induz-nos a agrupá-las como reflexões de uma entidade
única subjacente. O formar construtos como a íorça do reflexo apresenta certos riscos,
particularmente ao se determinar propriedades para o construto hipotético que vão
muito além das observações que lhe dão origem. Ainda assim a construção hipotética é
um tipo importante e persistente de formação de conceito em todas as ciências e sua
justificação encontra-se na sua utilidade. No caso particular da força do reflexo, ela entra
como um conceito útil na formação de outras leis num sistema de comportamento.
(Lembre-se, primeiro devemos ter nossos conceitos, então, chegar às nossas leis.) Por
exemplo, drogas, doenças do sistema nervoso central e eliciação simultânea de outros
reflexos todos causam mudanças concorrentes nas grandezas que definem a força do
reflexo. Então, é conveniente representar essas leis correlacionadas por um único termo,
força do reflexo. Veremos outros exemplos desse tipo de representação e composição de
relações em capítulos seguintes.
-4 3 -
2.5 - EXEMPLOS COMUNS DE REFLEXOS
Às observações que são resumidas como leis do reflexo são mais facilmente feitas em
músculos cirurgicamente isolados de influências outras que não aquelas do eliciador em
estudo. Embora estudemos reflexos em músculos cirurgicamente preparados para obter
mos precisão de controle, os reflexos são facilmente vistos em formas qualitativa no
comportamento intacto de todos os animais, desde o homem às espécies mais inferiores. A
ilustração de Descartes relativa ao retraimento do membro de um homem de uma chama
(ver p. 1) é um reflexo humano intacto. Outros são as eliciações de lágrimas pelo sumo de
cebola, espirro devido à pimenta no nariz, flexão do joelho devido a uma pancada no
tendão patelar, descarga de saliva quando alimento é colocado na boca, mudança no
batimento cardíaco devido a um som alto,e assim por diante. Todos esses reflexos estlo
de acordo com o nosso modelo fundamental, ou paradigma,
S2 —> R 2
onde algum S2 elicia algum respondente R 2 ; e se o reflexo pudesse ser apropriadamente

isolado, uma relação como aquela na Fig. 2-1 seria obtida. Alguns exemplos de seqüên
cias eliciador-respondente são vistos na Tabela 2.1. Todas as correlações na Tabela 2.1
são reflexos. Alguns envolvem músculos do esqueleto (espirro, flexionar o joelho, tremo
res), alguns envolvem músculos cardíacos (mudanças na taxa cardíaca), outros envolvem
glândulas (salivação, lágrimas) e outros envolvem músculos lisos (palidez da pele, mudan
ças pupil ares).
Tabela 2.1
SEQÜÊNCIA COMUM DE REFLEXOS
NOME DO PELAS LEIS DO

REFLEXO ELICIADOR S2 REFLEXO CONDUZ À RESPONDRNTE R-,
sumo de cebola Lacrimejar

Lacrimal nos olhos
Espirrar Pena no nariz, Espirro
Patelar Pancada no joelho Flexão do joelho
Salivar Alimento na bôca Salivação
Sobressalto Barulho alto Taxa cardíaca aumenta, múscu

los do esqueleto contraem-se,
pupila dilata-se, :tc.
Tiritar F rio Tremor, palidez t pele
Pupilar Luz no olho Contração pupila
- 44 -
Uma vez ou outra, esses reflexos têm sido chamados de involuntários, involuntário é um
termo histórico empregado para expressar grosseiramente a natureza automática e
eliciada de certos comportamentos. Desde a análise quantitativa de Sherrington sobre o
reflexo, o conceito original de eliciação tem sido bastante refinado. Parece criterioso,
assim, substituir.o mais velho e o mais vulgar dos termos “involuntário” pelo mais exato
“eliciado” , que compreende todas as leis do reflexo em sua definição. Essa substituição
eventual de um termo pobremente especificado, que, com freqüência, foi associado a um
quadro pré-científico de referência, é uma ocorrência comum e típica na ciência. Por
outro lado, algumas vezes, uma análise científica retem a velha palavra mas imprime-lhe
um significado novo e preciso. A ciência reteve do vernáculo as palavras força em física,
elemento em química e motivo em psicologia, mas tem mudado e expandido bastante os
seus significados. Mas não é sempre fácil separar as conotações de conceitos pré-
científicos e, algumas vezes, uma nova palavra ajuda na mudança conceituai. A velha
palavra, então, será deixada de lado para morrer lentamente pelo desuso. Tal é o caso da
palavra “involuntário” em psicologia.
2.6 - VARIABILIDADE NAS MEDIDAS: RESUMO DOS DADOS COM DISTRIBUI

ÇÕES DE FREQUÊNCIA; ESTATÍSTICA BÁSICA; A CURVA NORMAL
Um importante passo em direção à análise de qualquer fenômeno natural ocorre

quando certos aspectos deste fenômeno podem ser medidos. Medidas implicam em
números e os números que são registrados pelos pesquisadores sob várias condições de
observação são o que chamamos de dados quantiativos brutos. Um número prodigioso de
medidas ou dados são geralmente coletados no curso de um únicn experimento. Mesmo
uma demonstração muito casual de uma das leis do reflexo poderia facilmente requerer
até 250 medidas da magnitude do respondente. As numerosas medidas que constituem os
dados brutos de um experimento são inconvenientes. Seu grande volume torna-se de
difícil compreensão, mesmo para o pesquisador que as coletou. Certamente, elas dificil
mente poderiam ser comunicadas em sua forma bruta a uma comunidade científica como
um todo. Sob tais pressões, desenvolveram-se métodos de resumir os dados e caracterizá-
los por alguns de seus aspectos proeminentes. Estas caracterizações sumárias e descritivas
constituem o que chamamos estatística descritiva. No restante desta seção, considerare
mos brevemente certos conceitos estatísticos simples considerados úteis pelos experimen-
talistas na descrição e resumo de seus dados.
Suponha que estejamos com a tarefa de determinar a magnitude do respondente
patelar eliciado por uma pancada com uma força de 70,00 g aplicada no joelho.
Iniciamos sentando nosso sujeito confortavelmente, colocando suas pernas numa posição
padrão e aplicando, então, nossa pancada de 70,00 g num ponto determinado tão
precisamente quanto possível. Prosseguimos, medindo a extensão resultante da flexão do
joelho, anotando a altura máxima (excursão) que a perna alcança, digamos o ponto que o
tornozelo atinge antes de voltar à posição original. Suponha que nossa medida da
extensão da perna seja feita com uma régua comum e que observamos, neste caso, que a
perna percorreu uma distância de 4,25 cm. Neste ponto, podemos ser inclinados a dizer
que a magnitude do flexionar o joelho para um eliciador de 70,00 g de força e 4,25 cm.
A ciência, geralmente, nunca se contenta com observações não replicáveis e, desta
forma, somos levados a repetir nossas operações simples. Podemos, então, voltar a eliciar
o reflexo e medir novamente a magnitude do respondente por várias vezes, anotando
- 45-
cada vez o resultado numénco das nossas operações de medida. Embora tenhamos siao
cuidadosos em bater no mesmo ponto cada vez, em chegar a posição original da perna e
em dar ao sujeito um descanso breve entre as pancadas, observamos contudo, que a
magnitude do respondente é 4,25 cm numa tentativa, 4,12 cm em outra, e 431 numa
terceira. Ficamos um tanto perdidos em relação a qual medida particular devemos relatar
como sendo o valor verdadeiro da magnitude do respondente a uma pancada de 70,00 g.
O que foi iniciado como uma simples tarefa tomou-se mais complicado do que
supúnhamos originalmente.
Suponha agora que decidamos fazer algum tipo de média de nossas medidas e chamar
essa média a magnitude do respondente a uma pancada de 70,00 g. Somamos nossos
valores
4,25
4,12
4,31
12,68
e, então, para dar a cada medida uma representação igual na média, dividimos pelo
número de medidas que temos, neste caso, 3. Obtemos o seguinte número 4.2266... uma
vez que não era possível originalmente ler nossa régua mais do que 0,10 arredondamos
nossa resposta para duas casas decimais, relatando a magnitude da flexão do joelho como
4,23 centímetros.
Mas considere agora o que realmente foi feito através de uma coisa simples como tirar
a m édia das m edidas. Com que base é-nos permitido somar os nossos valores
e dividir pelo número de medidas e chamar isso o valor ‘ verdadeiro”? Descobriremos
que a questão não é facilmente respondida. Porque não escolhemos, por exemplo, o
resultado intermediário entre todas as medidas como o "verdadeiro", neste caso 4,25 ?
Uma dificuldade ainda mais importante apresenta-se quando tentamos medir
novamente a flexão do joelho no dia seguinte e descobrimos que, embora nossas medidas
sejam novamente próximas umas das outras (digamos, 4,00, 4,25, 4,19), elas não são
exatamente os mesmos valores que os do dia anterior. Que números tomaremos agora
como o valor verdadeiro do respondente para 70,00 g? . Não somente os erros de medida
presentes, mas condições não controladas tais como temperatura, umidade e o quanto
nosso sujeito dormiu na noite anterior podem estar afetando nossas medidas. Não é
provável que possamos sempre controlar completamente todas as influências que têm um
efeito perturbador em nossas medidas. Somos forçados, por fim,a concluir que o valor
“verdadeiro” do respondente é apenas fictício e que não existe nenhuma operação para
descobrí-lo.
Na prática, naturalmente, a situação não é tão ruim quanto a tornamos aqui. De fato,
nossas medidas são todas razoavelmente próximas uma das outras e frequentemente
podemos computar apenas tal média, ou média aritmética. Uma vez tendo essa média
aritmética computada, podemos tomá-la como nossa melhor estimativa da magnitude do
respondente e considerar como irreal nossa procura de um e somente um valor
verdadeiro.
A média ou média aritmética é um dos conceitos mais primitivos da estatística
embora comum em todas as ciências. Este conceito torna possível a abstração de um
valor, a partir de um número de medidas repetidas, o qual é tomado para representar
todo o grupo de medidas. Então, podemos medir várias vezes o ponto de ebulição do
- 46-
álcool etílico e concluir que o ponto médio de ebulição é igual a 78°C. Ou, podemos
observar, durante uma hora, a freqüência de carros que atravessam uma ponte em
intervalos de 5 minutos sucessivos e concluir que a taxa média é igual a 31 carros por 5
min. Justificamos esta média apelando para certas propriedades gerais das medidas que
examinaremos agora.
A justificativa para o uso de uma média é melhor observada olhando-se de perto
algumas propriedades das medidas repetidas de R2- Suponha que obtivemos 20 valores
para a magnitude de R 2 , em centímetros, que são registrados na Tabela 2-2.
Tabela 2-2
MAGNITUDE DE RESPONDENTES DE FLEXIONAR O JOELHO, EM CENTÍME
TROS, EM 20 APLICAÇÕES SUCESSIVAS DE UMA PANCADA NO JOELHO
TENTATIVA EXCURSÃO R2 EM CENTlkETROS
1 4,25
2 4,12
3 4,31
4 4,00
5 4,25
6 4,19
7 3,96
8 4,05
9 4,12
10 4; 19
11 3,88
12 4,25
13 4,19
14 4,19
15 4,12
16 4,05
17 4,31
18 4,44
19 4,20
20 3,92
Desejamos agora apresentar ou representar esses dados brutos numa forma que
revelará algumas de suas propriedades, à primeira vista. Para esse objetivo, a primeira
manipulação que frequentemente se mostra útil é agrupar as medidas em classes mais
amplas do que aquelas nas quais são originalmente dadas. Suponha que agrupemos os
resultados da Tabela 2-2 em categorias de décimos de centímetro. Então, poderíamos
estabelecer o grupo de categorias mostrado no lado esquerdo da Tabela 2-3. Essas
categorias têm uma faixa de um décimo de centímetro. Na Tabela 2-3 os números das
tentativas em que o respondente ocorreu numa dada categoria são colocados na coluna
do lado direito.
-4 7 -
A Tabela 2-3 reduz nossos dados a 7 categorias de 3,80 a 4,49. As 20 medidas
individuais iniciais foram reduzidas a 7 categorias de medidas. Perdemos alguma precisão
(4,00 não pode mais ser distinguido de 4,05 na Tabela 2-3), mas ganhamos alguma
economia na representação. O ganho não é grande com apenas 20 medidas originais, mas
seria muito grande se tivéssemos começado com 20.000.
Tabela 2-3
REAGRUPAMENTO DAS MEDIDAS DA TABELA 2-2 EM CATEGORIAS MAIS

AMPLAS
(1/10 cm)
CATEGORIA TENTATIVAS NAS QUAIS O RESPONDENTE

CAI NUMA CATEGORIA PARTICULAR
3,50 -3 ,5 9
3,60 -3 ,6 9
3,70 -3 ,7 9 11
3,80 - 3 ,8 9 7 ,2 0
3,90 - 3 ,9 9 4 ,8 ,1 6
4,00 -4 ,0 9 2,6,9,10,13,14,15
4,10 -4 ,1 9 1,5,12,19
4,20 - 4 ,2 9 3,17
430 -4 3 9 18
4,40 - 4 ,4 9
4,50 -4 ,5 9
4,60 -4 ,6 9
Um outro sumário útil poderia ser feito se nossos dados fossem mostrados
graficamente. Um número de esquemas visuais tem sido sugerido como auxilio na
representação de dados do tipo que temos aqui. Consideremos uma classe deles. É
possível, em primeiro lugar, espaçar regularmente os vários valores de nossos grupos de
medidas numa linha horizontal, chamada o eixo do x ou abscissa. Segundo, podemos
colocar uma linha vertical que intercepta a abscissa (chamada o eixo do V, ou ordenada)
para representar o número ou freqüência de medidas. Dessa maneira, se colocamos um x
para cada uma de nossas medidas em tal referência (chamada um sistema de coordenada
Cartesiana ou retangular) obteremos a representação pictorial da distribuição dos valores
vista na Fig. 2-5.
Alguns aspectos da Fig. 2-5 são de interesse particular. Primeiro, notamos que exis
tem exatamente 20 X. Então, cada medida aparece como um único X na Fig. 2-5 e o
número total de X é o número de medidas tomadas.
Um segundo aspecto da Fig. 2-5 é a sua forma. Parece avolumar-se em volta de um
valor central e ser grosseiramente simétrica. Essa característica de muitas medidas
repetidas justifica o uso de um único valor médio para resumir todo o grupo de medidas.
Atrás desse valor “médio” , tacitamente se esconde uma figura mais ou menos como a
Fig. 2-5. Diz-se que o número que indica o valor prevalente de uma distribuição de
freqüência, tal como a Fig. 2-5, representa um índice da chamada tendência central da
distribuição. Mas podemos notar que existem várias possibilidades de escolha para índices
- 48-
de tendência central. Dessas, uma simples seria escolher a categoria contendo maior
freqüência (maior número de X). Quando se escolhe o valor da tendência central dessa
Ordenada
TItíJ 10
t Moda
Figura 2-5. Medidas hipotéticas da .o r
o X
flexão do joelho (categorizadas em n X
décimos de centím etro) representa V X
c XX
das como uma distribuição de fre
qüência num sistema de coordenadas XXX
XX XXX
retangulares. X X X X X X X. - Abscissa
1.0 2.0
Magnitude da flexão do joelho
(centímetros)
maneira diz-se que se encontra a moda da distribuição. No presente caso, a moda é a

categoria 4,10 — 4,19, porque contém 7 medidas, número este maior do que qualquer
outra categoria (ver Fig. 2-5). Um segundo tipo de índice de tendência central é obtido,
isolando-se a categoria de medida particular que tem o mesmo número de medidas abaixo
e acima dela. Tal estatística de tendência central é chamada o valor mediano da
distribuição. A categoria mediana dos dados presentes está na categoria 4,10 — 4,19,
porque pode ser encontrado um valor nesta categoria que seria maior do que os 10
valores inferiores e menor do que os 10 superiores.
O terceiro tipo, conhecido como média, é o que calculamos previamente somando as
medidas e dividindo pelo número total de medidas. No caso presente, esse índice, ou
média aritmética, é cerca de 4,15.
Qual desses três “índices” representa o mais próximo da magnitude real do
respondente? Nenhuma resposta geral é possível para esta questão porque “a magnitude
real do respondente” é uma quantidade fictícia. A única maneira disponível para se
avaliar a magnitude do respondente é obter-se medidas repetidas dele sob condições tão
constantes quanto possíveis.
Essas medidas seriam como aquelas representadas pela Fig. 2-5. Se precisássemos de
um único número para resumi-las, o melhor que poderíamos fazer seria calcular um ou
mais índices de tendência central. No caso presente, a forma simétrica nos assegura que
qualquer desses três índices concordará aproximadamente, mas, em algumas distribuições
contendo umas poucas medidas muito distantes da moda (tal como na distribuição de
rendas nos Estados Unidos onde poucas pessoas são muito ricas mas a maioria do povo
está agrupada em torno de um ponto central), a média aritmética é deslocada em
direção às poucas enquanto a mediana é menos afetada e a moda não é perturbada.
A distribuição da Fig. 2-5 é convenientemente representada por (A) ou(B )daFig.
2-6. Em (A) os X foram substituídos por barras cujas alturas são proporcionais à
frequência real, f. A parte (A) é chamada um histograma e será empregada com
freqüência na descrição de dados comportamentais nos capítulos subseqüentes. Em(B),
os X foram substituídos por linhas retas conectando a altura de cada categoria. A parte
(B) é chamada um polígono de freqüência. Ambas as respresentações vistas na Fig. 2-6
são apenas maneiras alternativas de representar distribuições de frequência.
Em todas as distribuições de freqüência, os índices de tendência central assumem
grande importância.
-49 -
3,50 4 ,5 0
(centímetros)
Figura 2-6. Mais duas representações de
distribuições de freqüência (A) como
histogram a e (B) como polígono de
freqüência. Os dados são derivados da
Figura 2-5.

(centímetros)
(B) Polígono de Freqüência
Mas outra propriedade importante das distribuições de frequência é o espalhamento das
medidas, tecnicamente chamado sua dispersão. Consideremos as duas distribuições de
magnitude do respondente da Fig. 2-7. tomadas, digamos, de dois sujeitos diferentes.
Ambas as distribuições têm medidas de tendência central idênticas (médias, medianas e
modas). Mesmo assim, elas diferem de maneira tão óbvia que seria interessante ter-se um
índice sumário para caracterizar esse tipo de diferença. Notemos, antes de tudo, que a
diferença entre as duas curvas da Fig. 2-7 é grosseiramente a de "espalhamento”. Mas,
logicamente, o espalhamento de uma distribuição está relacionada com a variabilidade
das medidas que contém. Quanto mais variáveis nossas medidas e mais elas diferirem umas
das outras, maior será o espalhamento. Uma estatística simpes, embora grosseira, para
resumir o espalhamento ou dispersão de medidas
Figura 2-7. Distribuições de duas

freqüências com tendências centrais
idênticas e dispersões diferentes.
Magnitude de R 2
pode ser calculada, descobrindo-se a maior (em nossos dados originais do reflexo 4,44) e
subtraindo desta o menor escore obtido, 3,88. Com tais dados à mão, a operação resulta
num valor 4,44 — 3,88 = 0, 56. Tal estatística é chamada amplitude da distribuição. A
amplitude é fácil de ser calculada, mas não é tão útil como desejaríamos. Sua dificuldade
é que uma única medida muito extrema muda-a drasticamente. Por essa razão, preferimos
dizer que a amplitude é uma estatística que não tem estabilidade.
Outra medida mais sofisticada da dispersão de uma distribuição é possível,
aproximando-se, em primeiro lugar, os dados resumidos pelas Figs. 2-5 e 2-6 com o tipo
de curvas matematicamente suaves, em forma de sino, vistas na Fig. 2-7. Essas curvas
suaves são simétricas e são chamadas curvas normais. O estudante curioso pode muito
bem estar interessado em saber como essas curvas suaves da Fig. 2-7 foram descobertas,
mas infelizmente sua derivação matemática não pode ser tratada aqui. Devemos nos
contentar em dizer que elas parecem aproximar, razoavelmente bem, muitos tipos de
medidas repetidas, das quais nossa magnitude do respondente é uma. Um índice
adequado para a dispersão ou variabilidade pode ser encontrado através do exame
acurado da forma das duas curvas da Fig. 2-7. Se iniciamos no extremo mais à esquerda
de cada curva, devemos observar que, inicialmente, a curva é côncava crescente. Então,
para ambas as distribuições, a curva passa através de uma região em que é quase uma
linha reta. Finalmente, continuando em direção à direita, as curvas adquirem uma forma
côncava decrescente, alcançando eventualmente, um máximo no ponto rotulado de
média. Já que essas curvas normais são simétricas, uma análise correspondente pode ser
feita iniciando-se na extremidade direita e movendo-se para a esquerda. Os dois pontos
simétricos em que as curvas mudam de concavidade crescente para concavidade
decrescente são chamados os pontos de inflexão e estão localizados nas setas horizontais
na Fig. 2-7. Esses pontos localizados tomam-se bons marcos para caracterizar a dispersão
das distribuições (compare a distância entre os dois grupos de setas da Fig. 2-7 colocados
nesses pontos). E, embora sejam difícies para um julgamento a òlho nú, não é difícil
calculá-los a partir de medidas reais.
Deveria ser notado que os pontos de inflexão estão relacionados à média da
distribuição, tal que quanto maior dispersão de uma curva normal, tanto mais dis
tante da média estão esses pontos. Em outras palavras, quanto maior a dispersão, mais
os pontos de inflexão serão desviados da média. Essa idéia de desvio está incluída
no nome usualmente dado aos pontos de inflexão da curva normal, os pontos de
desvio padrão. O desvio padrão (abreviado 0 , ou sigma) é a distância da média a qual
quer um dos pontos de inflexão. A grande vantagem desses pontos como índices de
dispersão da distribuição sobre outras medidas (por exemplo a amplitude) é que eles
dividem a distribuição normal de uma maneira extremamente útil, como é visto na
Fig. 2-8. Em particular, o resultado é que para dados que podem ser aproximados
por uma curva normal, cerca de 34 por cento das medidas cairão na região entre
—1 O e a média; e cerca de 34 por cento cairão na região + 1 O e a média. Assim, cerca,
de 68 por cento das medidas estarão contidas dentro da média de 1 10. Similarmente,
cerca de 95 por cento estarão contidas dentro de í_ 2 Qe acima de 99 por cento dentro
de± 3Q. Então, existe uma relação bastante exata entre o desvio padrão e a percentagem
de medidas a serem encontradas nas diferentes regiões da curva, um fato não verdadeiro
para a amplitude ou outras medidas comuns de variabilidade. Métodos de computação
para estimar qualquer grupo de medidas são encontrados em numerosos textos ele
mentares de estatísticas e não serão descritos aqui.
- 51 -
Figura 2-8. Curva normal dividida por seu desvio padrão, mostrando a porcentagem de
medidas contidas em cada região.
Transformações para distribuições de freqüência relativa. Uma transformação muito
útil e simples é frequentemente feita nas medidas originais quando se lida com
distribuições. Em vez de se fazer diretamente gráficos do número real de eventos numa
dada categoria, frequentemente divide-se o número observado numa dada categoria pelo
número total de medidas que se tem. O resultado dessa operação é sempre um número
menor do que ou igual a 1, que é chamado a freqüência relativa desta categoria. Por
exemplo, com referência à Tabela 2-3, podemos dividir o número total de medidas na
categoria 4,20 - 4,29 (4) pelo número total de medidas (20) e obteremos 4/20 - 0,2, a
freqüência relativa nessa categoria particular. Uma maneira útil de pensar sobre a
freqüência relativa é considerá-la como a proporção das medidas totais que ocorrem
numa dada categoçia. Se multiplicarmos este número por 100, obtemos a percentagem de
todas as medidas que caem na categoria particular. Um grupo de tais percentagens, ou
freqüências relativas, fornece-nos uma maneira conveniente para comparar duas
distribuições quando o número total de medidas em cada uma não é necessariamente o
mesmo. Note que a curva da distribuição de freqiência relativa ou de distribuição de
percentagem tem o mesmo modelo, ou forma, que a curva de distribuição das freqüências
reais observadas da qual ela foi derivada.
EXERCÍCIO 1: Transforme a distribuição da Fig. 2-5 numa distribuição de freqüência
relativa.
-52 -
Capítulo 3 - CONDICIONAMENTO PAVLOVIANO
Por volta de 1903, PAVLOV, fisiologista russo, interessou-se pelo fenômeno que
primeiro chamou de “ secreções psíquicas’.. Pavlov descreve o ponto de partida de suas
pesquisas na seguinte citação:
“Se alimento ou alguma substância rejeitável é colocada na boca, uma secreção de

saliva é produzida. O objetivo dessa secreção é, no caso de alimento, alterá-lo
quimicamente, e no caso de uma substância rejeitável, diluí-la e removê-la da boca.
Este é um exemplo de um reflexo que ocorre devido às propriedades físicas e
químicas de uma substância quando ela entra em contato com a membrana mucosa
da boca e língua. Mas, além disto, uma secreção reflexa semelhante é evocada quan
do essas substâncias são colocadas a uma distância do cão e os órgãos receptores
afetados são apenas aqueles do olfato e da visão. Mesmo o recipiente no qual o
alimento é dadoé suficiente para evocar um reflexo alimentar completo em todos os
seus detalhes; e, além disto, a secreção pode ser provocada mesmo pela visão da
pessoa que trouxe o recipiente, ou pelo ruído de seus passos” . (Pavlov, 1927, p. 13).
Desde o início, estava claro para Pavlov que algum tipo de associação entre o reflexo
salivar S2 —> R 2 e eventos arbitrários como vasilhas de alimento e ruído de passos era
responsável pela capacidade destes evocarem “secreções psíquicas” . A primeira e mais
importante contribuição de Pavlov para a ciência do comportamento foi sua descrição e
elaboração das condições necessárias e suficientes para essa associação. Através de um
estudo sistemático do respondente salivar de cães, Pavlov descobriu que, se qualquer
mudança ambiental arbitrária (digamos. S j) precedia direta e exatamente o reflexo
eliciador de salivação, S] poderia por si só vir a produzir a salivação.
3 1 - REFLEXOS CONDICIONADOS E A NATUREZA DE UM EXPERIMENTO
Examinaremos com detalhes um experimento realizado por um dos discípulos de

Pavlov (Anrep, 1920) como exemplo do método Pavloviano e os resultados que levaram a
essa conclusão importante. A Fig. 3-1 mostra a situação experimental empregada por
Pavlov e seus colegas no Instituto de Medicina Experimental em Petrogrado (hoje Lenin-
grado). Ele é bem descrito por Keller e Shoenfeld:
-5 3 -
Figura 3-1. Representação de uma situação Pavloviana para
condicionar a resposta salivar num cão (Paviov, 1928).
“Em primeiro lugar, familiariza-se um cão normal com a situação experimental até
que não apresente nenhum distúrbio quando colocado em arreios e deixado sozinho
numa sala especialmente construída para eliminar estímulos indesejáveis externos.
Uma pequena abertura ou fistula é feita na pele da mandíbula, perto do conduto de
uma das glândulas salivares. Quando a fistula cicatriza, um tubo de vidro é cuidado
samente cimentado externamente na fistula de modo a drenar a saliva sempre que a
glândula for ativada. Do funil, a saliva então flui para um vidro ou cai, gota a gota,
numa plataforma de registro levemente equilibrada. A magnitude das respostas aos
vários estímulos pode ser medida pelo volume total ou número de gotas secretadas
numá dada unidade de tempo. O experimentador, que fica sentado numa sala ad
jacente, pode fazer suas medidas, aplicar os estímulos desejados (incluindo alimento)
e observar o comportamento do cão através de uma janela” (Keller e Schoenfeld,
1950, pp. 16-17).
O experimentador tem, então, condições para medir precisamente o reflexo salivar. É

também capaz de controlar cuidadosamente a apresentação de vários eventos estímulo
para o organismo.
Num experimento realizado por Anrep (1920), um tom soava na sala do animal por
5 seg. Dois ou três seg mais tarde um pouco de alimento era dado ao cão. Esse empare-
Ihamento de tom com alimento foi repetido depois de intervalos que variavam de 5 a 35
min. A fim de observar o efeito de um tom sozinho, o experimentador ocasionalmente,
apresentava-o por 30 seg. desemparelhado do alimento. No curso de 16 dias, foram feitas
50 associações alimento-tom e 6 testes do tom. Os principais dados do experimento de
Anrep foram obtidos durante os 6 testes apenas com o tom. Durante esses testes, ele
mediu cuidadosamente o total de gotas de saliva e o tempo entre o aparecimento do tom
de 30 seg. e a primeira gota de saliva. A Tabela 3-1 apresenta os dados.
- 54 -
Tahela 3-1
AQUISIÇÃO DE UM RESPONDENTE SALIVAR A UM TOM

(DADOS DE ANREP, 1920)
TEMPO DECORRIDO
ENTRE O APARECIMENTO
DO TOM E A
NÚMERO DE EMPARELHAMENTOS GOTAS DE SALIVAÇÃO SUBSEQUENTE
PRÉVIOS DE ALIMENTO-TOM SALIVA (SEGUNDOS)
X Y Z
1 0
10 6 18
20 20 9
30 60 2
40 62 1
50 59 2
Vê-se na Tabela que, depois de um emparelhamento alimento-tom, a apresentação do

tom sozinho não produziu salivação. Depois de 10 emparelhamentos, todavia, 6 gotas
apareceram no teste com o tom sozinho, e a primeira dessas 6 gotas apareceu 18 se
gundos depois do aparecimento do tom do teste. Depois de 20 de tais emparelhamentos,
20 gotas foram produzidas e a primeira gota demorou só 9 seg. para aparecer. De 30
emparelhamentos em diante, aproximadamente 60 gotas de saliva foram obtidas para
cada teste e, então, elas começaram a aparecer um ou dois segundos depois do apareci
mento do tom do teste. Os resultados do experimento são claros. A salivação ocorre
exatamente a um tom selecionado, arbitrariamente, depois que este é emparelhado 30
vezes com alimento.
O processo pelo qual um tom adquire a capacidade de produzir uma resposta salivar
por si mesmo, à medida que os emparelhamentos com alimento aumentam, é chamado
“condicionamento”. Pavlov viu uma semelhança próxima entre essa nova correlação de
tom com salivação e a ação reflexa comum e foi levado, assim, a chamar essa nova
correlação de reflexo condicional (pobremente traduzido como um “reflexo con
dicionado”). Vemos nas palavras seguintes porque ele fez isto:
“Denominei esses novos reflexos, reflexos c o n d i c i o n a d o s , para distinguí-los dos inatos

ou reflexos incondicionados. O emprego do termo ‘condicionado’cada vez mais
torna-se generalizado e penso que seu uso é totalmente justificado. Isto porque,
comparado com os reflexos inatos, esses novos reflexos realmente dependem- de
muitas condições, (ital. adicionados) tanto sua formação como na manutenção de
sua atividade fisiológica. Naturalmente, os termos ‘condicionado’ e ‘incondicionado’
poderiam ser substituídos por outros de igual mérito. Então, por exemplo, podemos
conservar o termo ‘reflexos inatos’ e chamar o novo tipo de ‘reflexos adquiridos’; ou
-5 5 -
chamar os primeiros de ‘reflexos da espécie", uma vez que são característicos das
espécies e os últimos de ‘reflexos do indivíduo’, já que eles variam de animal para
animal numa mesma espécie, e no mesmo animal variam em ocasiões diferentes e sob
diferentes condições” (Pavlov, 1927, p. 25).
3.2 - O PARADIGMA PAVLOVIANO: UM MÉTODO ESQUEMÁTICO DE REPRE

SENTAR O CONDICIONAMENTO.
O princípio do reflexo condicionado é convenientemente resumido por um modelo

simples de estímulo-resposta, ou paradigma. Os elementos do paradigma são os dois
reflexos iniciais e um novo “reflexo” condicionado desenvolvido.
Representemos os reflexos nos quais o condicionamento está baseado como
Si — -> Ri e S2 — > R2- No procedimento de Pavlov, Si precede S2 . Se ignorarmos
0 respondente a S i , esse emparelhamento pode ser representado como
Si
S2 -> R 2
De acordo com o princípio de Pavlov, depois de um número de emparelhamentos

(S1 )S2; S 1,S 2; S 1,S 2 ;...) Sj passa a evocar uma nova resposta, a resposta con
dicionada (CR) no diagrama f 3.11*
CR [3-11
O diagrama [3.1] é conhecido como o paradigma pavloviano, e representa esquemati-

camente o procedimento e os resultados do condicionamento pavloviano ou dàssíco
O Diagrama [3:11dá uma descrição esquemática ou simbólica de certos aspectos do
paradigma, mas podemos desejar uma especificação mais completa. Como um guia útil
para resumir o paradigma pavloviano, assim como muitos outros paradigmas compor-
tamentais que serão descritos em capítulos subsequentes, introduziremos uma repre
sentação estrutural, de quatro partes, de tais paradigmas. Em geral, todo paradigma
coinportamental consistirá de um Dado, um Procedimento, um Processo e um Resultado.
Neste quadro de referência, o paradigma pavloviano funciona como se segue:
DADOS: dois eliciadores S\ e S2

PROCEDIMENTO: emparelhamento repetido de S\ com S2 , sempre na ordem S 1 ,
$2>^1’ ^25 • •■
PROCESSO: S \ passa gradualmente a controlar a nova resposta (CR), que pode se
assemelhar à R 2 de S2 .
RESULTADO: Si elicia seguramente uma CR.
- 56-
Note certas características de tal paradigma. O Dado frequentemente contém umo
descrição do estado comportamental anterior ao Procedimento. Aqui,é necessário ter-se
dois eliciadores, ou dois reflexos intactos, antes que se possa começar. O Procedimento é
uma descrição suscinta do que os experimentadores fazem. (Notaremos, com freqüência,
que é útil representar o aspecto do procedimento de nossos paradigmas comportamentais
através de símbolos). O Processo diz brevemente o que acontece no tempo com os
aspectos significativos do comportamento, à medida que aplicamos o nosso proce
dimento. Uma descrição de um processo compor tamental adquire, tipicamente, a forma
de um gráfico, com o tempo no eixo horizontal (X) e alguma propriedade do compor
tamento do organismo no eixo vertical (Y). Discutiremos isso mais completamente numa
seção posterior. Finalmente, o Resultado é o estado final do processo. Quando o compor
tamento cessou de mudar significantemente sob o determinado procedimento, o resul
tado foi alcançado. Nas subseções seguintes, elaboraremos alguns dos mais importantes
aspectos do paradigma pavloviano.
A reiaçáo de CR com R2. Podemos considerar um acidente histórico o fato de Pavlov
iniciar sua pesquisa sobre o condicionamento com um reflexo que gerava uma CR muito
semelhante àR2,incondicionada. Tanto CR como R 2 envolvem a produção de secreção
das glândulas salivares. Realmente, não é provável que o observador casual detecte qual
quer diferença entre a salivação condicionada e a incondicionada. A similaridade entre
CR e R 2 no reflexo salivar é, provavelmente, responsável pela crença geral, perpetuada
até aos tempos modernos, de que CR é R2- Mas Pavlov sabia que isto não era verdade.
Não somente a magnitude de CR era diferente de R 2 , mas a composição química real da
saliva diferia entre CR e R 2 . Pavlov preferiu ignorar as diferenças entre CR e R2 e se
concentrar nas similaridades. Isto é frequentemente uma estrategia segura na pesquisa
científica preliminar Foi o gênio de Galileu que o permitiu ignorar as pequenas dife
renças na velocidade de queda de objetos leves e pesados em favor de uma teoria que os
idealizava caindo na mesma velocidade. Ele fez isso em face de uma teoria bem esta
belecida da natureza que exigia exatamente a conclusão oposta. Ao formular um
princípio teórico que afirmava ser CR = R 2 , Pavlov estava empregando a estratégia de
Galileu de ignorar pequenas diferenças. S i,ele supòs, passa a eliciar o respondente de S2
como um resultado de seu emparelhamento com S2-
P^sse princípio, conhecido como o princípio de substituição de estímulo (Sj substitui
S2 ), tinhauma grande atração em termos de suas aparentes (1) generalidade, (2) sim
plicidade, e (3) capacidade para explicar outros fenômenos. Uma vez que estes aspectos
são característicos dos nossos melhores conceitos na ciência, não é surpreendente que o
princípiode substituição de estímulo fosse adotado por John Watson e outros primeiros
behavioristascomo base paraexplicar todo comportamento. Na substituição de estímulo
eles pensavam ver o mecanismo subjacente aos padrões complexos de comportamentos
aprendidos e hábitos compostos. Consideremos o programa arrojado de Watson para'uma
análise experimental do comportamento: “dado o estímulo, podemos predizer a resposta;
iada a resposta, podemos predizer o estímulo” .Neste quadro de referência era natural
considerar a ligação dos novos estímulos com as velhas respostas (substituição de
estímulo) como um princípio poderoso para criar novas seqüências de comportamento.
Watson acreditava que o comportamento complexo humano e animal representava o
embasamento e a composição de reflexos condicionados. Devido à importância teórica da
substituição de estímulo nas teorias de Pavlov e Watson, os pesquisadores posteriores
ignoraram as diferenças entre CRs e &2S Por algum tempo. Contudo, por duas razões, o
princípio da substituição, de Pavlov, não resistiu ao teste do tempo.
-5 7 -
(1) Embora Watson propusesse que todo comportamento poderia ser visto como
uma interação e composição de reflexos condicionados, a proposição não conduziu a
novas formas poderosas de prever e controlar o comportamento. O teste de todos os
conceitos científicos é o seu emprego na previsão, controle e organização da matéria prima
da natureza. No início, a substituição de estímulo parecia ser útil para ordenar o
comportamento, mas à medida que os anos se passavam ela permanecia estéril na previsão
e controle. Mesmo os homens que o haviam empregado muito entusiasticamente
começaram a duvidar de sua natureza fundamental. Eventualmente, com uma nova ex
ploração da lei do efeito de Thorndike, tornou-se claro que grande parte do com
portamento não cabia dentro do modelo Pavloviano. Mas esta é uma história que fica
para o próximo capítulo.
(2): À medida que dispunha de mais e mais informações sobre o condicionamento
descobriram-se casos em que a CR era apenas ligeiramente diferente de R2 mas, em
alguns casos era exatamente o oposto. Um experimento realizado por Notterman,
Schoenfeld e Bersh (1952) empregando sujeitos humanos é ilustrativo. No seu estudo, S]
era um tom audível e S2 um choque elétrico suave, liberado na mão esquerda do sujeito.
Esses pesquisadores mediram a taxa cardíaca respondente com um aparelho um pouco
diferente do conhecido como um eletrocardiógrafo familiar em muitos consultórios
médicos. Em vez de manter seus sujeitos numa situação pavloviana (Fig. 3-1), eles
sentaram-nos em cadeiras comuns, instruindo-os para permanecerem tão quietos quanto
possível por cerca de 90 min. Durante este período, os experimentadores registravam a
taxa cardíaca de seus sujeitos enquanto apresentavam tons e choques. Notterman,
Schoenfeld e Bersh encontraram evidência clara de uma taxa cardíaca (CR) depois de 11
emparelhamentos de choque e tom. Todavia, enquanto a resposta incondicionada ao
choque (R 2 ) era uma aceleração da taxa cardíaca, a resposta condicionada (CR) envolvia
uma diminuição dessa taxa. Embora um trabalho posterior (Zeaman e Smith, 1965)
mostre que as diferenças entre CR e R2 na taxa cardíaca estão estritamente relacionadas
a diferenças respiratórias correspondentes, a disparidade entre as formas dos
comportamentos condicionado e incondicionado permanece.
Exemplos extremos como este levaram-nos a ver de uma forma diferente o
condicionamento pavloviano ou clássico. Em quase todos os casos de uma suposta
substituição de estímulo, existem diferenças marcantes entre CR e R2- Em muitos casos,
elas estavam ocultas devido as medidas grosseiras tomadas quando os pesquisadores
estavam somente interessados no condicionamento como um fenômeno de substituição.
Abreve história da substituição de estímulo é exemplo interessante do crescimento
contínuo da ciência. Um conceito pode influenciar por alguns anos ou décadas porque
parece fornecer comorto intelectual e prometer a ordem da natureza. Mas, a menos que
cumpra a sua promessa, eventualmente, ele dará lugar ao peso da evidencia experimental.
Durante seus dias de glória, todavia, tal conceito pode dirigir pesquisas de maneiras que
efetivamente colocam vendas nos cientistas em relação a fraqueza do conceito. É quase
como se, para dar ao conceito uma “chance”, ignoremos por um tempo, certas discre-
pâncias, certa indeterminação em sua definição. Essa permissividade temporária no
estágio inicial da exploração é justificada a longo prazo porque muitos de nossos con
ceitos bem estabelecidos passaram através de tal iniciação e emergiram fortes e lógicos
por causa dela. O próprio reflexo é um bom exemplo disso, e assim são muitos conceitos
da ciência física que sobreviveram ao teste do tempo.
— 58 —
A importância do Reflexo S \ ---- > R i Pavlov sugeriu que S \ -----> R \ deveria ser
um reflexo “biologicamente mais fraco” do que S2 ---- > R2 para que o con
dicionamento clássico ocorresse. A noção “de fraqueza biológica” não está inteiramente
clara. Presumivelmente, é uma maneira de dizer que, se as energias de S \ e S2 fossem de
algum modo igualadas, então R \ seria sempre menor ou ocorreria menos frequentemente
do que R 2 . Um fato relacionado que Pavlov enfatizou foi que o condicionamento é maií
fácil de ser observado (embora não necessariamente mais fácil de ser obtido) quando S]
não elicia inicialmente R2 - Deveria estar claro que, se S \ elicia R2 antes do condiciona
mento, então o efeito do emparelhamento de Sj e S2 pode ficar obscuro. Assim, na
maioria dos experimentos de condicionamento, toma-se o cuidado de selecionar um Si
que não tenha a capacidade original de eliciar R 2 - Diz-se que tal S] é neutro com
respeito a R 2 - Um S \ neutro é especialmente desejável se, durante o condicionamento,
vamos procurar pela CR no mesmo lugar onde observamos R 2 . Contudo, a neutralidade
inicial de S\ em relação a R2 não é um aspecto necessário para a ocorrência do condi
cionamento clássico, como Long (1941) demonstrou algum tempo atrás. Num dos ex
perimentos de Long, um tom de 1/7 seg. de duração foi usado como S\ e um breve
flash de luz como S2 . Em ambos os casos, o respondente de piscar os olhos em sujei
tos humanos foi medido. Tanto a luz como o tom eliciava o piscar desde o inicia Mas
depois dos emparelhamentos, o S] tom sozinho, passou a eliciar duas piscadas suces
sivas. A Fig. 3-2 dá um exemplo de um dos registros de Long quando S] era
apresentado.
Figura 3-2. Resposta de piscar a um tom de 1/7 seg. depois de 30 emparelhamentos

tom-luz (segundo Long, 1941)
Ainda mais impressionante foi um experimento realizado por Long no qual S\ e S2

eram tons idênticos. Neste experimento um resultado semelhante foi obtido: o primeiro
tom passou a produzir dois movimentos das pálpebras depois dos emparelhamentos.
Assim, o caso especial do paradigma Pavloviano com Si = S2 produz resultados
condizentes com o paradigma geral.
Os resultados de Long têm um significado adicional. Se antes do condicio
namento, um estímulo elicia Ri e depois do condicionamento evoca Ri e CR podemos
generalizar isto para casos em que um único estímulo pode vir a controlar uma variedade
- 59 -
de comportamentos diferentes, dependendo das várias histórias passadas de emparelha-
mento com S2 s diferentes. Este resultado pode ser representado diagramaticamente
como
R
CR'
S, CR” [3.2]
CR
\ •
etc.
Assim, um tom emparelhado independentemente com um choque, uma luz e alimento
pode simultaneamente evocar CRs de mudanças na taxa cardíaca, piscar de olho e
salivação, respectivamente. Essa constelação inteira de comportamentos evocados por um
unico estimulo pode ter importância para o nosso estudo da emoção como veremos num
capítulo posterior. Naturalmente, deveria ser enfatizado que, no Diagrama 13-21 Rj é
um sumário de todos os comportamentos inicialmente eliciados por Si - Embora fre
quentemente limitemos nossas discussões sobre o condicionamento a uma ou duas res
postas, o condicionamento é um fenômeno que invade todo o sistema compor tamental
de um indivíduo. Quando examinamos uma única resposta em detalhe, assim o fazemos
porque julgamo-la representativa do que está ocorrendo em geral no sistema de resposta e
não porque seja tudo o que está ocorrendo. Tentar pesquisar o sistema total de uma vez
nos sobrecarregaria com detalhes não controláveis. Tomamos uma amostra representativa
e tentamos explorá-la em profundidade. Essa é outra estratégia de pesquisa que tem tido
sucesso na pesquisa científica embora tal sucesso evidentemente, dependa de quanta sorte
temos ao escolher uma amostra que seja realmente representativa de um fenômeno em
geral. O fato de que a CR e R 2 salivar sejam tao semelhantes e tão dominantes no caso
de Pavlov sugere a possibilidade de que a sua amostra não fosse tão representativa como
ele poderia té-lo desejado.
É S -|-----> CR um "Novo Reflexo"? No velho princípio de substituição,
S] ---- > R 2 era visto como o novo reflexo “condicionado” . Embora possamos preferir
representar os efeitos do condicionamento clássico como a formação de uma CR para S 1
ainda temos de encarar a questão sistemática de se S \ — > CR é um reflexo, ou um outro
tipo de correlação estímulo resposta. Existe muito pouca evidência experimental dispo
nível que trata do assunto, mas o pouco que temos indica que ele não é de fato um
reflexo verdadeiro.
Em primeiro lugar, aumentos na intensidade de S\ não resultam em aumentos na
magnitude de CR, ou em decréscimos na sua latência. Ao contrário, o máximo de
magnitude de CR e sua latência mínima são obtidos com o valor exato de S\ empregado
no condicionamerto (Mostofsky, 1965). Valores mais ou menos intensos resultam em
CRs mais fracas. Por outio lado, lembremo-nos do Capítulo 2 onde foi dito que as leis de
magnitude *: latência do reflexo especificam uma simples proporcionalidade entre a
intensidade de S2 e a força de R 2 -
- 60 -
Segundo, a laténcia da CR adquirida para S \ é geralmente mais longa do que a
latência dos respondentes (R is) associados com aquele mesmo S i . Isto pode ser demons
trado atrave's do emparelhamento de uma luz (S \) com uma corrente de ar na pálpebra
(S2 ). Originalmente, tanto Si como S2 eliciam o piscar de olho. Como resultado do
emparelhamento, Si passa a evocar duas piscadas de olho distintas, uma R i seguida por
uma CR. Usando esse procedimento com sujeitos humanos, Grant e Norris (1947) iden
tificaram várias regiões modais de latência, como mostra o histograma da Fig. 3-3. Esses
Latência (milisegundos)
Figura 3-3. Distribuição da latência de todas as respostas de piscar o olho eliciadas por
uma luz forte no curso de um experimento de condicionamento com sujeitos humanos
(segundo Grant e Norris, 1947).
pesquisadores chamaram a região entre 50 e 110 mil segundos (1 mseg. S 3 se^

= 1/1000 seg.) a faixa do reflexo verdadeiro; a região entre 260 e 450 mseg representa a
faixa de CR.
Terceiro, se S \— CR é um reflexo verdadeiro, deveria ser possível construir mais
reflexos condicionados a partir dele. O próprio Pavlov viu as possibilidades dessa
acumulação de condicionamentos, assim como as implicações disso para o comportamen
to humano. Por exemplo, num experimento realizado por Frolov (citado por Pavlov
1927, pp. 33-34). um metrônomo foi primeiro utilizado como S\ no paradigma, onde
Alimento — > Saliva era o reflexo incondicionado. Depois de alguns emparelhamentos
o resultado usual foi obtido: o metrônomo sozinho evocava uma CR salivar. Frolov
então, tentou usar a nova correlação S \ ------ CR como a base para um reflexo con
dicionado de segunda ordem. Ele colocou um quadrado preto no campo visual do cão
por 10 seg. Então, esperou 15 seg mais e, finalmente, soou o metrônomo por 30 seg.
Essa é uma variação do emparelhamento “simultâneo1’ discutido acima e, de acordo com
Pavlov, ele seria necessário para se chegar a um condicionamento de segunda ordem.
Depois de 10 de tais tentativas, o quadrado preto passou a evocar alguma salivação
embora nunca tivesse sido emparelhado com alimento. Representamos esse exemplo de
condicionamento de ordem superior como uma operação de dois estáeios na Fig. 3 4 .
61
Este reflexo foi omtido após
s S i ----- CR ter sido formado.
................
j s2 ------------ *- R* J
Figura 3-4. Procedimento de Ordem ---------------------- J
Frolov para estabelecer o
condicionamento de segunda
ordem. I) S i— -------- R|
^C R '
II) S0 ^ -------- - R 0
Tipicamente, a CR’ de ordem superior era pequena em magnitude, longa em latência,

variável em ocorrência e de pouca duração. As tentativas para se chegar além do condicio
namento de segunda ordem sem o emprego do S2 — > ^ 2 original não foram bem
sucedidas com respondentes salivares. A importância do condicionamento de superior
desse tipo ainda está em discussão entre os psicólogos. Seu caráter transitório (se o S2
é omitido por várias tentativas, ele desaparece de todo)a dificuldade em estabelecè-lo e
sua incapacidade para se estender a muitas ordens,levaram alguns autores a comentar que
“dificilmente poder-se-ia esperar que a influência do condicionamento de ordem superior
fosse muito grande no comportamento cotidiano dos organismos” (Keller e Shoenfeld
1950, p. 32). Por outro lado, suas possibilidades teóricas como um princípio expla-
natório, têm impressionado favoravelmente outros autores, tais como C.E. Osgood
(1953) que considera que *‘esse processo certamente se estende de maneira ampla na
aprendizagem humana, especialmente na área da linguagem” (Osgood, 1953, p. 316)
Em resumo, parece que as relações S \ CR estabelecidas pelo condicionamento
são, provavelmente, bastante diferentes dos reflexos verdadeiros, o que justifica agrupá-
las separadamente.
3.3 RELAÇÕES TEMPORAIS NOS PARADIGMAS DE CONDICIONAMENTO
O condicionamento Pavloviano ou clássico pode convenientemente ser considerado

como o efeito característico da apresentação de estímulos em certas relações temporais,
isto é, numa certa ordem no tempo. Até agora, content amo-nos em colocar a operação
fundamental do condicionamento Pavloviano como um "emparelhamento" de dois es
tímulos eliciadores. Já é tempo de considerar com mais detalhes a natureza desta
operação de emparelhamento. Na Fig. 3-5, são apresentadas quatro maneiras diferentes
em que Sj pode ser emparelhado no tempo com S2
S, XI S,
S, JZL S, rz L
(A) “Sim ultâneo” Figura 3-5. Algumas relações (B) Retardo
temporais possíveis entre S j
e S 2 no condicionamento
Si
clássico.
s, ___EL_
S, St
(C) Traço (D) Retroativo
-6 2 -
O primeiro caso (A) talvez seja o tipo mais comum e é referido na literatura de
condicionamento como condicionamento “simultâneo” . O S i é curto e seu aparecimento
ocorre cerca de 1/2 seg. antes de S2 . Na Fig. 3-5A, S\ termina antes de S2 ; todavia Si
pode ultrapassar S2 sem alterar os resultados. Outro procedimento temporal empregado
no condicionamento clássico é visto na Fig. 3-5B. O Si é iniciado antes de S2 e per
manece por um intervalo de tempo considerável. Quase no final de S j, S 2 é apresentado.
Este é chamado um procedimento de retardo.Étambém possível, sob as condições de
Pavlov, obter-se CRs com retardos até de vários minutos. O caso ilustrado na Fig. 3-5C é
semelhante ao condicionamento “simultâneo” exceto que S\ é apresentado mais cedo e
termina antes da apresentação de S2 . Este é o procedimento que Frolov usou em seu
experimento de segunda ordem. Este caso é referido como um procedimento de traço, na
suposição de que um “traço” de S\ permanece no sistema nervoso do organismo depois
que S] termina. Se o tempo entre S\ e S2 não for muito grande (uns poucos minutos) é
possível se formar CRs para S\ através do procedimento de traço.
Quão longo pode ser o tempo entre S] e S2 antes que o condicionamento se torne
impossível? Nenhumá resposta geral é possível, pois isto depende do reflexo particular
S2 — R2 , das intensidades de S\ e $2 e de muitos outros fatores. Uma questão
relacionada é mais fácil de ser respondida: qual é o intervalo ótimo entre o aparecimento
de S\ e o aparecimento de S2 ? Isto é, que intervalo permite asCRsmais consistentes?Um
estudo realizado por Wolfle (1932) usando a retração do dedo a um choque elétrico
como S2 ---- ^ -R 2 gerou a curva vista na Fig 3-6. Note que a percentagem máxima de
CRs ocorreu em
o
•8 «I
c O
Intervalo S i ---- S 2 (seg)
Figura 3-6. Condicionabilidade relativa em função do intervalo Sj S 2 (segundo

Wolfle, 1932).
(Xíca de 1/2 segundo e esse valor é frequentemente tido como sendo o intervalo ótimo de
S i ------ S2 . Poucas CRs foram registradas em 0 seg. (simultaneidade verdadeira). Os
valores negativos do intervalo S i ----- S2 (aqueles a esquerda de 0 na Fig. 3-6) apresen
tam algum interesse teórico. Eles representam o caso (visto na Fig. 3-5D) em que S\ vem
-6 3 -
depois (!) de S2 - Esse é o procedimento chamado de condicionamento retroativo. Con
corda-se atualmente que o procedimento de condicic. jnento retroativo não resulta na
formação de uma nova CR para S\ e a Fig. 3-6 apoia este ponto de vista. Da nossa análise
na seção anterior, poderíamos esperar, todavia, que S2 (agora o primeiro estímulo)
adquirisse uma CR. Embora tal resultado não seja consistente com a noção de Pavlov de
que o estímulo anterior deva pertencer a um reflexo biologicamente mais fraco ele seria
compatível com uma análise do condicionamento clássico puramente em termos de
relações temporais entre estímulos.
Um procedimento final, não visto na Fig. 3-5, ocorre quando S2 é apresentado
periodicamente sozinho, sem qualquer Si . Num experimento, Pavlov alimentou um cão
regularmente em cada 30 min. Nenhuma mudança de estímulo precedia a alimentação.
Quando esta rotina de alimentação estava bem estabelecida, o alimento foi totalmente
retirado, medindo-se os efeitos. Sob essas condições observou-se que a salivação
começava aproximadamente no fim do período de 30 min, o período em que o alimento
normalmente viria. Pavlov chamou esse procedimento de condicionamento de temporal
com base na analogia de que o intervalo de tempo desde a alimentação anterior
passava a atuar, de alguma forma, como um S\.
3.4 - A EXTENSÃO DO CONDICIONAMENTO CLÁSSICO

O leitor deve sair dessa introdução ao condicionamento clássico com uma compreen
são clara da natureza invariante de um aspecto do fenômeno. Sempre que dois eliciadores
são associados no tempo através das regras apresentadas em nossa discussão sobre
“emparelhamento” um resultado inevitável é obtido. O primeiro eliciador passa,
eventualmente, a evocar algum novo conjunto de comportamento no organismo. Isto é
verdadeiro, caso o emparelhamento seja realizado ou por um experimentador num
la b o ra tó rio cuidadosam ente construído ou pela ação da natureza na selva.
Frequentemente, algum novo comportamento assim evocado oü “condicionado”
assemelhar-se-á a alguns dos respondentes do segundo eliciador, mas isso não é
necessariamente verdadeiro.
Esse fenômeno parece ser bastante geral, estendendo-se em todo reino animal. Já se
obteve CRs em vermes, caranguejos, peixes, répteis, pombos, galinhas, carneiros, cães,
macacos e fetos humanos de sete meses de idade ainda no útero materno (Hilgard e
Marquis, 1940).
Na história inicial da pesquisa sobre o condicionamento clássico, quando o paradig
ma era tido como Sj —5* R2 >pensava-se que qualquer reflexo poderia ser “condiciona
do” . Isto é, qualquer respondente (R 2) poderia ser transferido por substituição de
estímulo para novos Sis. Com a queda da substituição de estímulo e a aceitação geral de
que a CR pode não ser idêntica a R 2 , essa posição foi enfraquecida. Alguns insucessos na
obtenção de condicionamento são esclarecedores. Numa série de experimentos
cuidadosos com o ernprego de S]s e S 2 S diferentes e vários intervalos Si — S2 , F.A.
Young (1958) foi incapaz de obter uma transferência do respondente pupilar para S j.
Young resume a literatura dos últimos trinta anos sobre um suposto condicionamento
desse respondente e conclui que a evidência indica que nenhum pesquisador demonstrou
inequivocamente o condicionamento desse respondente. Schlosberg (1928) indica que
condicionamento da flexão do joelho pode ser um artefato devido aos processos que
veremos no Capítulo 4. Reinwald (citado em Keller e Schoenfeld, 1950) não foi capaz de
obter uma CR de flexão do joelho em mais de 1.000 emparelhamentos de uma iuz com
-6 4 -
uma pancada no tendão patelar. É possível que esses pesquisadores estivessem procuran
do por uma CR muito parecida com a R2 , original. O condicionamento clássico pode ter
sido algo distorcido por muitos anos devido a procura de CRs somente ao longo de
dimensões mais óbvias de R 2 - O fato é que podem existir CRs em dimensões compor-
tamentais diferentes de R2 - Realmente, é bem conhecido que o condicionamento clássico
é um fenômeno que invade muitos aspectos do sistema comportamental de resposta do
organismo. Moore e Marcuse (1945) mostraram que quando vários sistemas compor-
tamentais são examinados, as CRs são vistas mais claramente em alguns desses (como
respiração, salivação e taxa cardíaca) do que em outros (atividade motora ou geral). A
Fig 3-7, um dos registros de Moore e Marcuse, tomados de um porco colocado num
arreio Pavloviano e previamente sujeito a tons (S i) emparelhados com biscoitos (S 2 ) é
ilustrativa.
Cabeça ____ ____
Salivação (1/60 cc) ________________________
Coração __________________________________________
A lim entação________________________ ___________________
Tom (480 )
A lim e n to ----------------------------------------*-------------------------------------------- ----- .
Tempo (seg.^.................. - ............... -...... -.....-............................ -........ -
Figura 3-7. Respostas de um porco em um número de sistemascomportamentaisa um

sinal sonoro que havia sido previamente emparelhado com alimento (segundo Moore e
Marcuse, 1945).
As CRs parecem mais convincentemente formadas em respondentes que dependem das

funções do sistema nervoso autônomo. Como Keller e Shoenfeld em (1950) salientam:
“ Estes envolvem as ações de glândulas e músculos lisos (e.g. a secreção de suor e a

contração das veias). Desde que a ação de tais 7efetores'é frequentemente associada
com estados de emoção (no'm edo" a saliva seca, o suor é excretado, a pele esfria, ar
pupilas dos olhos se dilatam, etc.) não seria surpresa.... saber-se que esses estados
podem ser condicionados à maneira Pavloviana” (Keller eSchoenfeld, 1950 pp. 27-28).
Com a não confirmação da expectativa de Watson de que a substituição de estímulo

seria a pedra fundamental para construir uma teoria geral de todo comportamento
aprendido, a pesquisa básica sobre o condicionamento clássico tem sido, até recentemente,
pouco enfatizada nos Estados. Unidos. (Prokasy, 1965). Os russos por outro lado,
nunca estiveram tão interessados no condicionamento como um instrumento para a
análise psicológica. Por essa razão, talvez, a pesquisa sobre reflexos condicionados nunca
entrou em declínio naquele país. Embora o condicionamento clássico nunca possa atuar
como seus entusiásticos adeptos esperavam a 30 ou 40 anos atrás, parece provável que ele
ainda possa emergir, se bem que numa forma diferente como um conceito importante
— 65 —
para a compreensão do comportamento. O fato de que nossas emoções pareçam seguir as
leis de Pavlov, ao invés ua lei do efeito de Thorndike fornece um indício da possível
importância do condicionamento clássico. Em vez de serem as unidades de compor
tamento aprendido como Watson concebeu, pode ser que os estados emocionais
classicamente condicionados acompanhem e sejam mesmo essenciais para a manutenção
de muitos de nossos padrões de comportamento. Mas, no momento, isso é uma mera
especularão e uma apresentação mais detalhada deve esperar um capitulo posterior.
3.5 O MÉTODO EXPERIMENTAL
A partir daqui, faremos uso recorrente de certos conceitos básicos da ciência

experimental. Na presente seção começaremos a introduzir alguns princípios simples do
método experimental como são usados na psicologia, motivando a discussão através de
referências a experimentos de Pavlov e seus colaboradores.
Em todo experimento, o cientista procura estudar certos aspectos do mundo natural
na medida em que se relacionam a outros aspectos. Uma das primeiras tarefas do cientista
é tentar eliminar as influências sobre o objeto de seu estudo nas quais ele não está
diretamente interessado, na ocasião do seu experimento. Assim, ao estudar como a
magnitude do respondente variava com mudanças da intensidade do estímulo,
Sherrington separou o cérebro da medula para eliminar as influências desconhecidas que
o cérebro pudesse ter sobre a magnitude do respondente. De um modo similar, Pavlov
rotineiramente colocava os cães numa sala especial onde eram isolados do mundo
exterior. Ele diz:
“Pensávamos, no início de nossa pesquisa, que seria suficiente simplesmente isolar o

experimentador na câmara de pesquisa com o cão a sua frente e impedir a entrada de
qualquer pessoa durante o curso de um experimento. Mas essa precaução mostrou-se
ser completamente inadequada, uma vez que o experimentador, por mais que
tentasse ficar quieto, era uma fonte constante de um grande número de estímulos.
Seus menores movimentos — o piscar o olho ou o movimento dos olhos, a postura,
respiração e assim por diante — todos agiam como estímulos que, chegando até ao
cão, eram suficientes para viciar os experimentos, tornando a interpretação exata dos
resultados extremamente difícil. A fim de excluir essa influência imprópria do
experimentador tanto quanto possível, ele deveria ficar localizado fora da sala em
que o cão estivesse colocado, e mesmo essa precaução provou-se insatisfatória em
lab o ra tó rio s não construídos especialmente para o estudo desses reflexos
particulares. O ambiente do animal, mesmo quando fechado numa sala, está sempre
mudando. Os passos de uma pessoa que passa, conversas ocasionais nas salas vizinhas,
o bater de uma porta ou a vibração de um furgão passando, vozes da rua, bondes e
mesmo sombras que penetram através da janela para dentro da sala, qualquer desses
estímulos casuais, não controlados, que chega aos receptores do animal... vicia os
experimentos” (Pavlov, 1927), p. 20).
Fica claro a partir do relato de Pavlov que os cientistas se esmeram para

controlar as influências indesejáveis nos seus experimentos. Este é o sentido que damos à
sxpressão “experimento controlado” . Algumas vezes todavia, é impossível eliminar uma
temperatura e umidade da sala onde fica o animal não podem ser alteradas. Se estas
-6 6 -
mudam drasticamente, elas alteram as propriedades do reflexo. A idade do animal, sua
saúde e o grau de privação de alimento são influências semelhantes. O melhor que
podemos fazer é mantê-las tão constantes quanto possível durante o curso do experi
mento. Este é, então, um segundo significado de um experimento controlado: mantemos
constantes muitas influências no nosso fenômeno em questão.
Tendo controlado as influências indesejáveis, removendo-as ou mantendo-as

constantes, prosseguimos na execução de um experimento. Mas o que isso impõe? Em
cada experimento, não importa em que ciência, há certos ingredientes básicos na sua
preparação. Em primeiro lugar, uma vez que cada experimento é uma tentativa de
relacionar duas ou mais coisas entre si, ele trata com pelo menos duas grandezas que
possam assumir valores diferentes. (Nos experimentos de Pavlov, duas de tais grandezas
eram frequentemente o número de emparelhamentos e a magnitude da resposta.) As
grandezas que podem adquirir valores diferentes receberam dos matemáticos o nome de
variáveis. Adotaremos esse nome, empregando-o frequentemente através do restante
deste texto. Ambas as variáveis num experimento devem ser mensuráveis e uma delas
deve ser controlável ou manipulável pelo experimentador. Isto é, ele deve ser capaz de
mudar ao menos uma delas como desejar.
No experimento de Anrep (ver seção 3.1) existem três variáveis, três grandezas que
assumem valores diferentes: o número de emparelhamentos prévios alimento-tom gotas
de saliva e o tempo passado entre o aparecimento do tom e a salivação subsequente
(Tabela 3-1). Para simplificar, limitemos nossa atenção a somente duas delas: número de
emparelhamentos e gotas de saliva. Ambas as variáveis foram medidas pelo Dr. Anrep.
Todavia, somente uma foi manipulada por ele. Isto é, ele determinava diretamente o
valor de só uma delas. Essa variável foi o número de emparelhamentos. Uma variável que
é medida e manipulada num experimento é chamada de variável independente. Qualquer
outra variável que for concorrentemente medida neste experimento mas não manipulada,
é chamada variável dependente. Anrep, assim tinha duas variáveis dependentes: gotas de
saliva e o tempo para a primeira gota aparecer. Consideremos, por um momento, somente
a primeira delas.
80 r Y
60-
ct
•Í5
1
•8 40 -
BO
O
20-
0 ---------- 1---------- 1_______i_______i_______i_______ Y

10 20 30 40 50
Número de emparelhamentos sucessivos de X
Figura 3-8. Representação da variável independente de Anrep (1920) e uma de suas
variáveis dependentes num sistema de coordenada retangular.
-6 7 -
Suponha que tentemos representar nossas variáveis e nossos resultados num sistema
de coordenada retangular bidimensional como na Fig. 3-8. Designamos a variável
independente para o eixo horizontal (eixo do X) e a variável dependente para o eixo
vertical (eixo do Y). (Essa localização da variável dependente é exatamente oposta aquela
de um histograma. Ver Fig. 2-6.) Várias propriedades da Fig. 3-8 são interessantes de se
notar. (1) Sempre damos aos nossos eixos rótulos informativos descrevendo nossas
variáveis. (2) Marcamos distâncias iguais nos eixos e fazemos com que essas distâncias
representem aumentos iguais de nossas variáveis. (3) As escalas dos eixos (X) e (Y) não
precisam ser as mesmas. (4) O zero coincide para ambos os eixos onde as linhas
coordenadas se encontram no ponto chamado de origem.
80
>< 60
a
.fe
13
40
20
10 20 30 40 50
Número de emparelhamentos sucessivos X
Figura 3-9. Os dados de Anrep (1920) sobre gotas de saliva e número de

emparelhamentos indicados como pontos bidimensionais num sistema de coordenada
retangular.
Prosseguimos representando os dados de Anrep no sistema de coordenada retangular.

Utilizamos as colunas 1 e 2 da Tabela 3-1 para colocar os pontos nos locais apropriados
dentro do quadro de referências. Cada ponto representa um par de números: o número
de gotas de saliva associado com o número de um dado emparelhamento. Ao fazermos
isso, obtemos a Fig 8-9.
O último passo é conectar os pontos com linhas retas. Com esta operação, obtemos a
Fig. 3-10, que chamamos a curva ou função que relaciona o número de gotas de saliva ao
número de emparelhamentos prévios alimento-tom, numa faixa da variável independente
que varia de 0 a 60 emparelhamentos. A forma de tais curvas ou funções é de algum
in tere sse . No p re sen te caso, vemos que além do ponto que representa 30
emparelhamentos não ocorre muita mudança na variável dependente. Quando uma
função alcança um valor limite em torno do qual flutua daí em diante, dizemos que
alcançou a assíntota. Presumivelmente, mesmo que quiséssemos continuar com milhares
de emparelhamentos adicionais, obteríamos, aproximadamente, apenas 60 gotas em cada
teste.
-6 8 -
Linha assintótica
>
73
oo
a>
T3
ão
OD
Figura 3-10. A funçáo de Anrep (1920) relacionando gotas de saliva e numero de

emparelhamentos, mostrando sua assíntota.
Estamos agora, em condições de definir um experimento como a medida e manipulação

de uma variável e a medida concorrente e não manipulação de outra. Estritamente falando,
essa d e fin iç ã o vale apenas para os experimentos mais simples, aqueles com
uma variável independente e uma variável dependente. Experimentos mais complicados
podem ter muitas variáveis dependentes e independentes, mas aqui é suficiente
compreender que um acréscimo de variáveis não contém novos princípios.
O experimento de Anrep serve ainda para ilustrar uma característica especial dos
experimentos em Psicologia. Num experimento psicológico, a variável dependente é inevi
tavelmente algum aspecto do comportamento do organismo, a variável independente é
inevitavelmente algum aspecto do ambiente imediato ou anterior do organismo. Aqui por
exemplo, gotas de saliva é uma grandeza comportamental; o número de emparelhamentos
refere-se à freqüência de algum estado anterior do ambiente do animal. Note
cuidadosamente que nem saliva nem tom são variáveis segundo nossa definição. Gotas de
saliva e número de tons apresentados é que são variáveis. Assim, uma variável é a
grandeza que pode assumir valores diferentes (variáveis); é aquilo que medimos e
registramos.
Agora que temos os instrumentos para compreender e representar os experimentos
seus resultados, estamos numa posição muito melhor para compreender os dados obtidos
por Anrep e resultados semelhantes. A função da Fig. 3-10 representa o nosso primeiro
exemplo de um processo comportamental. Um processo comportamental pode ser
definido como uma mudança no comportamento no tempo (ou tentativas no tempo) em
que um procedimento constante é mantido em efeito. Podemos verificar que o experi
mento de Anrep preenche essas condições. Ele seguiu o mesmo procedimento-
emparelhamento de tom com alimento — tentativa após tentativa, testando ocasional
mente o efeito do tom sozinho. Em nenhum ponto de suas cinqüenta tentativas ele
desviou e instituiu um procedimento novo e diferente. Foi sempre o mesmo:
tom-alimento, esperar um pouco, tom-alimento, ... e assim por diante. Então, a curva da
Fig. 3-10 que cresce até alcançar assíntota, é o processo através do qual um tom passa,
gradualmente, à medida que a u r v ;,»am os emparelhamentos, a adquirir a habilidade de
produzir uma resposta de saliva p* >i mesmo.
- 69 -
3.6 - INTRODUÇÃO AOS CONCEITOS ELEMENTARES DE PROBABILIDADE
Muitas das coisas que os psicólogos registram e observam ocorrem aquém da certeza
perfeita, mesmo quando todas as condições de experimentação e observação são tão
cuidadosamente controladas quanto possível. Por exemplo, em qualquer tentativa teste
antes de assíntota de aquisição ser atingida, a apresentação do S\ no experimento de
Anrep (ver figura 3-4) poderia não ter gerado nenhuma CR. Se imaginarmos qualquer
tentativa teste realizada antes da assíntota, teríamos de admitir que haveria uma
incerteza muito real ligada à predição de se ou não qualquer CR ocorreria para S\.
Naturalmente, à medida que o número de tentativas prossegue, a incerteza diminui
Diz-se que um respondente condicionado está complementamente adquirido quando suas
chances de ocorrer depois de S\ tom aram-se certas ao máximo. O que é verdadeiro para
os reflexos condicionados é verdadeiro para muitos outros eventos comportamentais e
não comportamentais. Algumas vezes, uma pessoa comerá o que é colocado diante dela,
outras vezes não. Algumas vezes, um trem chegará atrasado; algumas vezes, chegará
pontualmente. O que gostaríamos de ter seria uma régua ou um instrumento de medida
com o qual pudessemos representar e comparar, de uma maneira precisa, a certeza de
eventos tais como CRs, comer sobremesas, chegada de trem. Felizmente, encontramos
este instrumento no conceito matemático de probabilidade. Para o presente objetivo,
consideraremos a probabilidade de um evento como um número que podemos associar a
este evento, um número que caracterizará a certeza relativa do evento sob condições bem
definidas de observação.
A fim de determinar esse número para um evento, devemos primeiro estabelecer um
grupo de condições padrão sob o qual iremos procurar pelo evento. Um dos tipos de
condições padrão envolve uma certa operação (procedimento) que executamos tal como
jogar uma moeda, apresentar um S{ ou ordenhar uma vaca. Num segundo tipo as
condições padrão são estabelecidas pela natureza e meramente fazemos nossas obser
vações em ocasiões definidas. Assim, podemos observar se o trem local das 7h34min.
chega ou não pontualmente, ou podemos observar o número de carros que cruza a ponte
George Washington numa determinada hora. Por conveniência, daqui em diante referir-
nos-emos a qualquer tipo de condições padrão de observação simplesmente como a
observação padrão.
Denominaremos de resultados os eventos de interesse que surgem quando fazemos as
observações padrão. Por exemplo, ao apresentar um estímulo e procurar por um res
pondente (uma observação padrão), podemos observar a ocorrência de uma flexão do
joelho (um resultado). Ao atirar uma moeda, podemos estar interessados na ocorrência
de “cara” (um resultado). Em geral, sempre que a ocorrência de um determinado evento
ou resultado não é perfeitamente certa, isto pode significar que, ao se fazer a observação
padrão algum outro evento ocorreu, evento este diferente daquele no qual estávamos
principalmente interessados. Assim, se estivéssemos interessados no evento “cara” ao
jogar uma moeda, o evento “coroa” seria aquele que ocorre sempre que o evento “cara”
não ocorre. Para aplicar as noções de probabilidade deveremos classificar todos os resul
tados possíveis de uma observação padrão.
No caso de uma moeda de dois lados, os resultados possíveis são óbvios. Mas quantos
resultados possíveis poderiam resultar da observação de carros ou da ordenhação de uma
vaca? Nesses casos, seria útil classificar o grande número de possibilidades em um
-7 0 -
número fixo e pequeno de categorias. Por exemplo, ao medir a produção de leite
podemos achar conveniente preocuparmo-nos apenas com o fato de se Mimosa dará 0 —
0 — 21, 2 — 41 ou mais do que 41 toda manhã, ao ser ordenhada. A ordenha é a
observação padrão e quebramos arbitrariamente os eventos possíveis em apenas três
resultados. Parece que esse é um procedimento arbitrário e que poderíamos ter escolhido
dois (algum leite ou nenhum leite), ou mais do que três resultados, estabelecendo mais
categorias. Nos experimentos de condicionamento, quase sempre perguntamos se uma
resposta condicionada é ou não observada após cada apresentação de um estímulo. Aqui,
a observação padrão é a apresentação de um estímulo e existem dois resultados — uma
resposta de nenhuma resposta. Mas poderíamos escolher uma característica da resposta
para examinar (digamos, sua magnitude) e categorizá-la tal como fizemos com a
quantidade de leite produzido pela manhã. O ponto importante de todas essas
classificações é que elas nos permitem tomar cada resultado real da observação padrão e
classificá-lo em uma ou outra categoria de resultado.
Uma vez fixadas quais as categorias de resultado que nossa observação padrão deve
ter, seguimos adiante. Nosso próximo passo para medir a certeza de qualquer resultado
particular pode consistir em se fazer a observação padrão algumas vezes a fim de se obter
uma idéia de quão frequentemente o resultado em questão ocorrerá em relação a outros
Figura 3-11. Razáo de freqüência de “ caras” numa seqüência de atirar uma moeda.
Note a escala comprimida (logarítmica) do eixo horizontal. (Cramér, 1955).
resultados possíveis. Esse é um procedimento fundamental na estimativa de

probabilidades. Por exemplo, podemos jogar uma moeda 100 vezes e obtermos 53 caras e
47 coroas. Ou podemos notar que, em 50 apresentações de um S j , observa-se uma CR 45
- 71
vezes. Se tomarmos agora a razão entre a freqüência dos resultados observados do evento
em questão, e a freqüência total de resultados observados, obteremos um número entre 0
e 1. Este número dos dá alguma noção da certeza do evento em questão. Assim, a
razão da freqüência de caras no total de eventos de atirar moedas é 53/100 = 0,53.
Analogamente, a razão da freqüência de CRs nas apresentações de S\ ê 45/50 = 0,90.
Desses exemplos deveria ficar claro que as razões de freqüência podem ser calculadas
sempre que tivermos obtido freqüências de determinados eventos e freqüências de
todos os eventos. A idéia de uma razão de freqüência nos aproxima muito do nosso
índice desejado de certeza. Mas uma outra característica da razão de freqüência deve ser
notada. Uma razão de freqüência está sujeita aos erros usuais de medidas discutidas na
seção 2.6. Isto é, as razões de freqüência observadas variarão de algum modo em blocos
diferentes de observações padrão. Mas, a medida que fazemos mais e mais observações
padrão, algo interessante ocorre com a razão de freqüência: ela tende assintoticamente a
se aproximar de um valor limite. A Fig. 3-11 mostra como isto acontece quando jogamos
uma moeda e observamos os valores da razão de freqüência de ‘ caras ’, à medida que se
faz mais e mais observações padrão. Evidentemente, estamos chegando cada vez mais
perto de uma assíntota^ neste caso 0,50. A assíntota de uma razão de freqüência é
definida como a probabilidade do evento.
A faixa de variação desse número que chamamos probabilidade é de 0 a 1. Uma
probabilidade 0 indica que nunca em qualquer observação padrão anterior, o evento em
questão foi observado. Geralmente probabilidades próximas de 0 estão associadas com a
previsão de que é improvável que um resultado do tipo em questão ocorra em qualquer
tentativa determinada da observação padrão e que em muitas tentativas no futuro, ele
ocorrerá apenas algumas vezes. Probabilidades próximas de 0,5 significam que o resultado
em questão ocorre aproximadamente metade das vezes que a observação padrão é feita e
em conseqüência, essa é a nossa previsão para o futuro. À medida que a probabilidade se
aproxima de 1 ficamos cada vez mais certos de que deveremos observar o resultado em
questão. Finalmente em 1, dizemos que estamos certos de que o resultado ocorrerá.
Assim, a nossa convicção de que o sol nascerá amanhã recebe uma expressão quantitativa
dada por uma probabilidade igual a 1 ,0 , já que toda observação no passado resultou em
“o sol aparece” . O resultado “o sol não aparece” , todavia, tem até agora uma freqüência
igual a 0 e, então, uma probabilidade 0. Esse valor expressa nossa falta de confiança em
prever esse resultado. Uma maneira útil de representar a escala de probabilidade é vista na
Fig. 3-12.
N unca Perfeitamente
aconteceu certo
. Pode ou não
acontecer
^ Baixa 2 Alta
Probabilidade
Figura 3-12. A escala de p ro b ab ilid a d e.

Anrep, G. V. Pitch discrimination in the dog. / . Physiol., 1920, 53,

3 6 7 -3 8 "
- 72 -
Cramér, H. 77:./ elements of probability theory. Wiley: New York, 1955.
Dashiell, J. F. Fundamentals of general psychology. (3rd ed.) Boston:
Houghton Mifflin, 1949.
Grant, D. A., and Norris, E. B. Eyelid conditioning as influenced by the
presence of sensitized Beta-responses. / . exp. P sychol, 1947, 37,
423-433.
Hilgard, E. R., and Marquis, D. G. Conditioning and learning. New
York: Appleton-Century-Crofts, 1940.
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New Y ork:
Appleton-Century-Crofts, 1950.
Long, Lillian D. An investigation of the original response to the condi
tioned stimulus. A rch . Psychol., (New Y ork) 1941, No. 259.
Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.
Moore, A. U., and Marcuse, F. L. Salivary, cardiac, and motor indices of
conditioning in two sows. J. comp. Psychol., 1945, 38* 1-16.
Mostofsky, D. (E d .) Stimulus generalization. Stanford: Stanford Univer.
Press, 1965.
Notterman, J., Schoenfeld, W. N., and Bersh, P. J. Conditioned heart rate
response in human beings during experimental anxiety. /. comp,
physiol. Psychol., 1952, 45, 1-8.
Osgood, C. E. M ethod and theory in experimental psychology. New
York: Oxford Univer. Press, 1953.
Pavlov, I. P. Conditioned reflexes. London: Oxford Univer. Press, 1927.
Pavlov, I. P. Lectures on conditioned reflexes. New Y ork: International
Publishers, 1928.
Prokasy, W. F. (E d .) Classical conditioning: a symposium. New Y ork:
Schlosberg, H. A study of the conditioned patellar reflex. J. exp. Psychol
1928, 1 1 ,4 6 8 -4 9 4 .
Wolfle, H. M. Conditioning as a function of the interval between the
conditioned and the original stimulus. J. gen. Psychol., 1932, 7,
• 80-103.
Young, F. A. Studies of pupillary conditioning. J. exp. Psychol., 1958,
55, 97 -1 1 0 .
Zeaman, D., and Smith, R. W. Review of some recent findings in human
cardiac conditioning. Chap. 19 in W. F. Prokasy (E d .), Classical
r *in'nning. New York: Appleton-Century-Crofts, 1965.
-7 3 -
Capítulo 4 - FORTALECIMENTO OPERANTE
A regularidade demonstrada nos fenômenos reflexos — tanto incondicionado como

condicionado - ilustra o tipo de ordem a ser encontrada entre comportamento e
ambiente. Todavia, muitas das atividades dos organismos superiores não parecem
enquadrar-se num modelo reflexo de comportamento. Essas incluem as ações humanas
que foram descritas^ántes de Descartes como voluntárias, espontâneas intencionais e
propositais, e que resistiram à análise experimental até o início do século vinte. Uma
ilu stra ç ã o esclarecedora sobre onde terminam os reflexos e começam esses
comportamentos é encontrada na seguinte passagem:
quando um gato ouve um rato, volta-se para a fonte do som,vê o rato, corre em
sua direção e lança-se sobre ele. Sua postura em cada estágio, mesmo na seleção do
pé que dará o primeiro passo, é determinada por reflexos que podem ser
demonstrados um a um em condições experimentais. Tudo que o gato tem a fazer é
decidir se persegue ou não, todo o resto está preparado para isso pelos seus reflexos
posturais e locomotores” (Skinner, 1957, p. 343).
Por trás da proposição ilusoriamente simples de “tudo que o gato tem a fazer e
decidir” encontra-se o ponto de partida para uma ciência daqueles comportamentos cujas
ocorrências não estão relacionadas reflexamente à presença imediata de um eliciador ou a
uma história de emparelhamento de dois eliciadores.
4.1 - INTRODUÇÃO AO COMPORTAMENTO PROPOSITAL

No estudo dos reflexos e respostas condicionadas vimos que a explicação e
compreensão científicas surgiram através da descoberta progressiva e da elaboração de
relações entre certos aspectos do comportamento (as respostas, variáveis dependentes)
e certos aspectos do ambiente (as variáveis independentes, estímulo e história passada).
C ada descoberta de uma nova relação ou lei do comportamento foi um evento
importante na história do reflexo. Á medida que nossas leis começam a se empilhar e
se misturar, sentimo-nos justificados em falar acerca de uma compreensão parcial do
comportamento reflexo.
A nálise ex p e rim en tal tem procedimento similar com os comportamentos
- 75
que chamaremos, por enquanto, “propositais” . Desde o trabalho pioneiro de Thorndike
com gatos e pintos sobre aprendizagem, os psicólogos têm, progressivamente, persistido
na procura de relações entre o comportamento proposital e outros eventos.
Em geral, a procura dessas relações não nos conduziu ao longo dos mesmos caminhos do
reflexo. Contudo, uma abordagem funcional já foi iniciada. Considere o problema no
desenvolvimento de tal abordagem: como procedemos para encontrar as variáveis ou
eventos aos quais o comportamento proposital possa estar significantemente
relacionado?
Inicialmente, devemos proceder por intuição e observação grosseira. Se tivermos sorte,
podemos cumprir nossa tarefa ajudados por uma especulação filosófica avançada. Vinte e
cinco anos antes de Thorndike,o filósofo britânico Herbert Spencer escreveu o seguinte.
“Suponha, agora, que ao estender sua cabeça para apanhar uma presa de difícil
alcance, uma criatura falhe rapidamente. Suponha que, ao lado do grupo de ações
motoras aproximadamente adaptadas para alcançar a presa a esta distância... um
pequeno movimento do corpo para a frente (ocorre). O sucesso, ao invés do fracasso,
será alcançado... Quando as circunstâncias se repetem, esses movimentos musculares
que foram seguidos por sucesso são provavelmente repetidos: o que foi inicialmente
uma combinação acidental de movimentos será agora uma combinação que tem
probabilidade considerável” (Spencer, 1878).
Na proposição de que “aqueles movimentos musculares que foram seguidos por
sucesso são provavelmente repetidos” , Spencer estava enfatizando que o que um or
ganismos faz agora está, de algum modo, relacionado com as conseqüências do que o
organismo fez no passado. Aqui, então, está a deixa que Thorndike, e mais tarde Skinner,
deveriam seguir extensivamente.
O comportamento proposital é aquele que é quase totalmente definido por suas
conseqüências. Considere a Tabela 4.1. Em cada ato ali citado, o objetivo do compor
tamento está relacionado de perto com as conseqüências. Dizemos que amarramos um
Tabela 4.1
ALGUNS COMPORTAMENTOS “PROPOSITAIS” DOS ANIMAIS E HOMENS, SEUS
ASSIM CHAMADOS PROPÓSITOS, E SUAS CONSEQÜÊNCIAS PASSADAS REAIS.
COMPORTAMENTO PROPÓSITO CONSEQÜÊNCIAS
Amarrar um sapato Para manter o sapato 0 sapato fica no pé

Comprar uma capa de chuva Para não molhar A chuva não molha
Entrar em um restaurante Para almoçar Você almoca
Abrir uma torneira Para obter água Aparece a água
Escrever uma carta Para assegurar uma resposta A resposta é obtida
Cavar um buraco Para escapar do frio Obtém-se calor
sapato para manter nosso sapato no pé, mas uma proposição equivalente é que
amarramos nosso sapato e, ontem quando o amarramos, ele ficou no pé. Aproposiçãode
que os ratos se refugiam em buracos para escapar do frio pode equivalentemente ser
expressa com a proposição de que os ratos frequentemente, no passado, refugiaram-se em
buracos e encontraram temperaturas mais elevadas.
-7 6 -
EXERCÍCIO 2.
Transforme cada um dos comportamentos e propósitos da Tabela 4.1 em propo
sições equivalentes que expressem simplesmente o comportamento presente e o com
portamento passado com suas conseqüências.
Aparentemente, temos duas maneiras de representar o mesmo comportamento, na

nossa língua: 1 ), o proposital no qual empregamos o termo para (ou de modo a) e que
implica no tempo futuro; 2 ), o descritivo, no qual especificamos o comportamento
presente e o associamos com o que aconteceu no passado. A redundância na repre
sentação é desperdício e usualmente é evitada pelos cientistas. Na presente argu
mentação, deveremos rejeitar a linguagem proposital e adotar a linguagem mais descritiva
por uma razão lógica. O comportamento não pode ser relacionado com eventos futuros,
isto é, eventos què ainda não aconteceram. Um lembrete algo desagradável pode ser
retirado da seguinte ilüstração:
“ Durante a guerra, os russos usaram cães para bombardear tanques. Um cão era
treinado para se esconder atrás de uma árvore, arbustos ou outro esconderijo
qualquer. Quando um tanque se aproximava e passava, o cão corria ao seu lado e
uma pequena mina magnética, presa às suas costas era suficiente para danificar o
tanque ou incendiã-lo. O cão, naturalmente, tinha que ser substituído” (Skinner,
1956, p. 228).
Apenas uma das duas possíveis descrições é satisfatória aqui. O cão corre na direção
ao tanque devido a certas conseqüências passadas de correr na direção de tanques.
(Presumivelmente eles eram ali alimentados ou acariciados, etc.) Nesse exemplo extremo
é fácil rejeitar a proposição alternativa de que os cães corriam na direção dos tanques
para serem explodidos. Mesmo assim, a ilustração é útil para estabelecer o princípio geral
de que o futuro não determina o comportamento.
Em resumo, uma classe muito real e importante de comportamentos surgida de
situações que parecem envolver escolha ou decisão, é chamada comportamento
proposital. Esse comportamento, deve ficar claro de uma vez, inclui-se na categoria de
Descartes de ‘'voluntário” e constitui a ação que os antigos chamavam “intencional” .
Nossa análise presente, indica que esse comportamento está de algum modo relacionado
com suas conseqüências controlado por elas. Por essa razão, daqui por diante, deveremos
substituir o antigo termo proposital pelo termo “ instrumental” de Thorndike, ou “ ope
rante” de Skinner. Chamar o comportamento de “ instrumental” ou de “ operante” sugere
que, operando no ambiente, o comportamento é instrumental na obtenção de conseqüên
cias. Nenhum desses termos implica o mesmo quadro conceituai indesejável que o termo
“ proposital” , mesmo assim ambos tentam aprender a noção fundamental de que as
conseqüências passadas de tal comportamento são um de seus determinadores impor
tantes.
4.2 UM EXPERIMENTO PROTÓTIPO
Se um rato de laboratório, faminto, é colocado na caixa ilustrada na Fig. 4-1 e certos

procedimentos são efetuados, um número de efeitos comport ame ntais interessantes
podem ser observados.
- 77 -
Para os objetivos da presente análise, as características significativas da caixa são ( 1 )
uma bandeja para o fornecimento de uma pequena pelota de alimento para o rato e ( 2 )
uma alavanca ou barra, projetando-se da parede da frente, que, quando pressionada para
baixo com uma força de cerca de 10 g, fecha um micro-interruptor, permitindo um
registro automático desse comportamento. Os aspectos significantes do rato são os
seguintes: ( 1 ) é sadio e foi acostumado a comer uma refeição por dia, por volta da mesma
hora em que se encontra na caixa. (2) Foi previamente adaptado a essa caixa e, durante
este período de adaptação, o alimento era ocasionalmente fornecido na bandeja. Agora,
ele se aproxima prontamente da bandeja de alimento e come-o sempre que este'está
disponível.
Figura 4.1 - Uma câmara experimental baseada na caixa originalmente usada por B. F.
Skinner para o estudo do comportamento instrumental no rato e outros pequenos
mamíferos (Will Rapport).
Considere o seguinte experimento. O rato é cuidadosamente observado nessa caixa

por um período de 15 minutos. Durante este tempo, nenhum alimento é fornecido na
sua bandeja. Não será difícil observar a ocorrência de comportamentos que chamamos
exploratórios. O rato cheira os cantos, cheira a bandeja, pressiona ocasionalmente a
barra, levanta-se apoiando suas patas dianteiras nas paredes e assim por diante. Além
disso, o animal frequentemente se engaja em atividades de “limpeza” e de farejar, e
ocasionalmente permanece quase completamente imóveL Todas essas atividades são
exemplos daquilo que os psicólogos usualmente rotulam de respostas. É suficiente, no
presente, observar a seguinte precaução: esses comportamentos não são respondentes
(nenhum eliciador específico pode ser encontrado para eles. Isso não significa que eles
-7 8 -
não dependam, em grande parte, da construção da caixa para que ocorram. Não obstante,
eles parecem ser emitidos na ausência de qualquer estímulo específico. Por essa razão,
eles são frequentemente referidos como respostas emitidas.
A observação dos comportamentos emitidos por um animal na situação onde
nenhuma conseqüência especial está sendo fornecida para qualquer resposta é conhecida
como a observação do nível operante. Os registros do nível operante servem como uma
importante linha base em relação à qual deveremos, mais tarde, comparar os efeitos da
liberação de conseqüências especiais para uma ou mais respostas emitidas.
Depois de 15 minutos de observação dessas várias respostas emitidas, iniciamos o se
guinte procedimento. Cada vez que observamos que o rato pressiona a barra, imediatamente
fornecemos uma pelota de alirtiento na bandeja. Agora, pela primeira vez na história do rato,
o comportamento de pressionar a barra tem a conseqüência especial de produzir
alimento. Não será necessário esperar muito para ver os efeitos dessa nova contingência
no com portam ento do rato. Logo o animal estará ativamente ocupado com
comportamentos de pressionar a barra e comer. Algumas mudanças ou modificações bem
marcantes em seu comportamento ocorrem no espaço de poucos minutos.
Na linguagem comum, dizemos que o rato aprendeu a pressionar a barra para obter o
alimento. Tal descrição contribui pouco para a proposição de que o rato está agora
pressionando a barra frequentemente e está obtendo alimento. 0 que desejamos fazer é
descrever em detalhe, e tão quantitativamente quanto possível, as mudanças no
comportamento as quais resultam da simples operação de liberar uma conseqüência
especial, para apenas uma das atividades normais do indivíduo que ocorre na situação.
Para fazer isso, consideremos quatro maneiras complementares de encarar as mudanças
no comportamento do rato quando, como o foi aqui, um de seus comportamentos é
selecionado e recebe uma conseqüência favorável.
4.3 - MUDANÇAS NA TAXA ABSOLUTA
O experimento que descrevemos é um exemplo dos experimentos protótipos sobre o

comportamento operante realizados por B. F. Skinner em 1930. Uma das mudanças
comportamentais marcantes que ocorre sempre que um comportamento, como o
pressionar uma barra, é seguido por alimento, é que o comportamento aumenta
grandemente em freqüência. Será útil considerar o aumento que ocorre na freqüência,
quando o comportamento já existente é sujeito a uma conseqüencia especial, como um
fortalecimento deste comportamento. Então, o processo que estamos examinando agora
poderia ser chamado de fortalecimento do comportamento operante, ou mais
brevemente, fortalecimento operante.
As mudanças na freqüência de um dado comportamento são vistas mais claramente
no aparelho similar a um quimógrafo, de Skinner, que registra, à tinta, as ocorrências
sucessivas da resposta selecionada e as acumula verticalmente num papel de registro, ao
mesmo tempo que a pena se move continuamente no tempo na direção horizontal. Para
compreender esse aparelho, que pode justificadamente ser chamado de microscópio dos
behavioristas, leia o programa da Tabela 4.2 passo por passo. Escreva suas respostas nos
espaços fornecidos para isso. Prossiga, passo por passo, até chegar ao fim.
- 79
Tabela 4-2 (continuação)
Neste diagrama, a taxa aumenta constantemente de um valor baixo
próximo de___________ para um valor alto próximo d e --------------------
Um aumento na taxa é chamado aceleração positiva. A aceleração
positiva é vista neste diagrama/no diagrama do quadrado acima (marque
qual).
A aceleração negativa refere-se a um (a )-----------------------------------------
na taxa.
A aceleração negativa é vista no diagrama deste quadro/no do quadro
acima (marque qual).
Para registrar outros eventos que ocorrem enquanto c animal está
respondendo, a pena move-se rapidamente 4para o sudeste'' e retorna
novamente. No diagrama à esquerda, a pena traçou uma linha d e ------
para____Nesse ponto, a pena retornará imediatamente para---------------
A pequena marca diagonal ("traço ou risco") e m --------------------------
____foi feita pelo mesmo movimento da pena como mostrado ein d — e.
A marca ou risco “sudeste” é frequentemente usada para indicar que
uma resposta produziu alguma conseqüência especial.. No diagrama
deste quadro, essas respostas foram registradas somente pela marca
vertical e m ---------------- - e ----------------- •
No diagrama deste quadro, uma resposta recebeu uma conseqüência
especial e m --------------
N a p rá tic a , o traço vertical feito por uma umca resposta é muito
pequeno para ser facilmente identificado. Entretanto, podemos usar
a --------------------- da curva em qualquer ponto como um indicador váli
do da taxa de resposta.
No diagrama, a taxa foi mais alta entre_____ e ________zero entre -
— e ------ -- e de um valor intermediário entre____e _____ _________
T abela 4-2 (continuaçao)
Quando os degraus são tão pequenos que nao podemos contar as respos
tas, podemos ainda determinar o número de respostas entre dois p o n to
no registro usando uma escala.
No diagrama deste quadro, a porção vertical da escala à direita nos diz
que aproximadamente respostas foram emitidas entre a e b
/ /
no registro cumulativo à esquerda.
£ | '00 Se o papel se move muito devagar, não será possível medir acuradamen
,1' g>50 te o tempo entre duas respostas, mas ainda assim podemos determinar o
S 5 10
Sl ------- 1------- L_ tempo passado entre dois pontos escolhidos^
M inutos No diagrama deste quadro, a porção horizontal da escala à direita nos
diz que as respostas a e b do registro cumulativo à esquerda ocorreram
com um intervalo de aproximadamente minutos.
d
No diagrama a esquerda, após completar cerca de 100 respostas entre a
e b , o animal parou por um curto p e r í o d o J " q
f ----- - " ~ e então emitiu cerca de ---- -- ------------- respostas entre c e d
/a ££ ----5------»
10
aM M inutos
D
&
s vezes, uma curva cumulativa e usada para registrar a progressão de um automóvel em movimento e, então,
ação indica a velocidade do movimento. Quando uma curva cumulativa é usada para registrar o comporta
nima! a inclinação indica---------------------
de resposta” significa o número de respostas por unidade de tempo. Num registro acumulativo, o número
ostas pode ser determinado pela distância percorrida pela pena na direção-------------
gistro cumulativo o tempo é indicado pela distância percorrida pela pena na direção--------------------------------- —
TABELA 4-2
UMA SEQÜÊNCIA DE INSTRUÇÃO PROGRAMADA SOBRE COMO LER UM
REGISTRO CUMULATIVO DA RESPOSTA (ADAPTADO DE SKINNER. 1959).
Uma larga tira de papel desenrola-se de um rolo. A ponta do papel

move-se vagarosa e constantemente para a esquerda. Uma pena fixa
O b
sobre o papel traçou uma linha que começa em __________ e termina
e m ------------------------- —__________________________
O movimento vagaroso do papel sob a pena traçou a linha horizontal de

_a ____________ . Em b a pena moveu-se repentinamente
percorrendo uma distância pequena para cima até
No diagrama à esquerda, o papel percorreu uma distância pequena além

da posição mostrada no diagrama do quadro acima. A pena fixa traçou
uma segunda linha horizontal de _____________ a ____________
No diagrama deste quadro, a pena já ocupou as quatro posições a, b,

c, d. Ela ocupou a posição____________primeiro e___________por
último.
No diagrama deste quadro, o tempo que decorreu entre c e d f o i---------
-----do que o tempo que decorreu entre a e b ----------------------------------------------
Tabela 4-2 (continuação)
Ao registrar as respostas emitidas por um organismo, a pena move-se para
cima e traça uma linha vertical curta cada vez que uma resposta é emitida.
No diagrama à esquerda, um experimento começou quando a pena estava
em a. A primeira resposta ocorreu em
No diagrama, tres respostas toram emitidas rapidamente e com uma
taxa constante e m ----------------------- --------------- e ---------------------- —
No diagrama a esquerda, as três respostas registradas em a foram

emitidas _____________ rapidamente do que as três em b,------------------
Quanto mais rápido o responder, tanto ---------------- as pausas entre as respostas.

Quanto mais alta é a taxa de respostas, tanto — .-------------- a linha horizontal traçada
pela pena entre respostas sucessivas.
No diagrama do último quadro, quanto mais rápido o responder, tanto_______________
a inclinação da linha em degraus.
A taxa de resposta é mostrada p ela____________ de linha em degraus.
As respostas no diagrama a esquerda começam com uma taxa

relativamente alta em a. O tempo entre as respostas sucessivas torna-se
progressivamente_____________ __ ______________________________
No diagrama, a inclinação da primeira parte da curva traçada pela pena
começando em a é relativamente_________________________________
A que se parecem as curvas cumulativas típicas do processe de fortalecimento instru
mental? As curvas vistas na Fig. 4.2 são os registros de quatro ratos individualmente
submetidos ao procedimento que descrevemos acima. As curvas indicam que o processo
de fortalecimento é abrupto.
Tempo (minutos)
Figura 4.2 - Algumas curvas típicas de respostas acumuladas obtidas de ratos famintos
no dia do fortalecimento de uma resposta de pressão a barra pela primeira vez. Como
cada resposta produz uma pelota de alimento, os traços de alimento estão omitidos
(Skinner, 1938).
0 efeito da conseqüência especial de alimento nem sempre ocorre imediatamente,

mas uma vez que ocorre, há uma mudança abrupta para uma nova e alta taxa de resposta
que é mantida no restante do experimento.
4.4 MUDANÇAS NA TAXA RELATIVA
Uma segunda maneira conveniente de observar o processo de fortalecimento da

resposta é considerar as mudanças de taxa na resposta selecionada em relação as
mudanças de taxa que ocorrem em todo o substrato das atividades que ocorrem na
situação. Por exemplo, numa demonstração do fortalecimento da resposta de pressionar
a barra para uma classe de graduaçã do Cornegie Institute of Technology foram
registrados os seguintes comportament' de um rato, em 15 min, de nível operante, e 15
min subsequentes de fortalecimento d? ^ssão a barra.
Rp = atividades de pressão à barra.

= farejar
= Puxar uma pequena corrente pendurada no teto
Ra = cheirar a bandeja de alimento
Rb = Estender uma pata em direção a um bloco de chumbo colocado em um dos can
tos.
Ri = permanecer imóvel por aproxjnv«dar\vnre ’9 seg contínuos.
-84 -
As freqüências dessas atividades durante o nível operante e durante o fortalecimento
estão representadas nos histogramas da Fig. 4.3.
Rp Rf Rc Ra Rb Ri
COMPORTAMENTOS
Figura 4.3 - Freqüências relativas de vários comportamentos que ocorrem numa caixa
experimental antes e depois do fortalecimento do comportamento de pressionar a barra
Olhando a Fig. 4.3, vemos claramente que não apenas a taxa de pressão a barra
aumentou, mas as taxas das outras atividades não associadas com alimento na situação
diminuíram.
4.5 - MUDANÇAS SEQÜENCIAIS NO RESPONDER
As modificações comportamentais que acompanham o fortalecimento de uma dada

resposta se estendem além dessa resposta para muitas outras atividades. Em particular,
quando o alimento é dado ao animal, todas as atividades envolvidas na obtenção de
alimento são também fortalecidas. Mas o fortalecimento não se limita simplesmente ao
aumento na sua freqüência. Uma mudança na ordem em que o animal emite certos
comportamentos ocorre no fortalecimento instrumental. Uma ordem particular é
rapidamente estabelecida e mantida. No experimento de pressionar a barra, a seqüência é
(1) pressionar a barra, (2) aproximar-se da bandeja de alimento, (3) pegar o alimento (4)
ingerí-lo, (5) aproximar-se da barra. (1) pressionar a barra... Em resumo, um elo contínuo
de comportamento foi formado pela operação de tomar o alimento contingente à pressão à
barra. Esse elo é bastante diferente do padrão de seqüência de resposta vistas no ní'^1
operante. Dois membros do elo estabelecido 1 e 2, servirão para ilustrar este ponto.
Ignoremos, por um momento, todos os outros comportamentos possíveis na situação e
limitemos nossa atenção ao ( 1 ) pressionar a barra e ( 2 ) aproximar-se da bandeja (U*
- 8b
alimento. Antes do fortalecimento da pressdo à barra, essas duas respostas ocorrem de tal
modo que, quando o animal emite uma delas, é provável que ele repita essa rnesma
resposta novamente em vez de emitir a outra (Frick e Miller, 1951). Assim, uma
seqüência bastante típica de pressão à barra (Rp) e respostas de aproximar-se da bandeja
(Ra), no nível operante, pode ser:
Rp Rp Ra Rp Rp Rp Ra Ra Ra . .
Durante o fortalecimento, essa seqüencia muda rapidamente para a alternação:
Rp Ra Rp Ra Rp Ra . ..
e dificilmente será visto outro padrão (Millenson e Hurwitz, 1961). Não se sabe quão
rapidamente esse processo ocorre, mas sob condições favoráveis, parece provável que s ja
quase tão instantâneo quanto a mudança na taxa absoluta de pressão à barra.
4.6 - MUDANÇAS NA VARIABILIDADE
Um indivíduo nunca emite um ato duas vezes exatamente da mesma forma. Assim
como cada vez que escrevemos nosso nome, fazemo-lo ligeiramente diferente, assim
também cada vez que o rato pressiona a barra, ele o faz de um modo ligeiramente
diferente. Algumas pressões são feitas com a pata esquerda, algumas com a direita,
algumas vom o nariz e algumas com o ombro. Mesmo assim, agrupamos todos esses casos
e dizemos que a classe de respostas que chamamos pressões à barra é constituída de todas
as possíveis maneiras de pressionar uma barra. Durante o fortalecimento de tal classe de
resposta, estamos realmente fortalecendo esses casos individuais de respostas, cada uma
das quais difere ligeiramente de seus semelhantes.
Esse fortalecimento dos membros da classe de comportamentos que constituem a
pressão a barra tem um efeito marcante na forma final em que o comportamento se
estnbelece. Enquanto inicialmente, no nível operante, o rato tende a pressionai a barra de
muitas maneiras diferentes, depois do fortalecimento, tende a fazê-lo de poucas maneiras.
Em outras palavras, os casos individuais tornam-se cada vez mais semelhantes. Expressa
mos este resultado dizendo que a topografia do comportamento se restringe durante o
fortalecimento instrumental. A topografia de uma resposta refere-se à maneira pela qual o
animal emite a resposta. Estritamente falando, a topografia parece dizer respeito aos
músculos realmente empregados no momento da ocorrência da resposta. 0 registro de
tais eventos, todavia, apresenta dificuldades. Como uma tentativa para fazer isso, pode-se
empregar uma câmara para fotografar o animal no momento em que a resposta é con
cluída. Guthrie e Horton (1946) tiraram fotografias de gatos e cães quando o comporta
mento que produzia uma conseqüência especial era o de inclinar uma vara que estava no
centro da caixa do animal. A Fig. 4.4 ilustra alguns exemplos extremos da estereotipia do
comportamento depois do fortalecimento. Cada animal adota uma topografia idiossincrá
tica e só se afasta dela em qualquer ocasião determinada apenas em detalhes. Um
exemplo surpreendente de estereotipia humana no comportamento instrumental apren
dido é visto na Fig. 4.5.
— 86 —
‘r f t i ' t f h d i d i
Figura 4.4 - Desenhos das respostas de dois gatos e um cão em emissões sucessi
vas de uma resposta de inclinar uma vara (Kimble, 1956, segundo Guthrie e Hor
ton, 1946).
4.7 - OPERANTES E ESTÍMULOS REFORÇ ADORES
Em resumo, então, os quatro efeitos do fortalecimento de uma resposta são:

1 —aumentar a taxa desta resposta em relação ao seu nível operante;
2 — aumentar a taxa dessa resposta em relação à táxa de outro comporta
mento que está ocorrendo na situação;
3 — transformar num elo, que é sempre repetido, o padrão ou seqüência das
respostas envolvidas;
4 —aumentar a estereotipia da resposta selecionada.
A pressão à barra, o puxar a corrente, explorar com o nariz, inclinar uma vara e assim
por diante são atos convenientes escolhidos pelos experimentalistas para estudar esses
efeitos. A adequação desses comportamentos para o estudo do fortalecimento operante
depende criticamente da sua capacidade de serem modificados como foi descrito. For
malmente, esses e outros comportamentos, assim fortalecidos, são definidos como
operantes. Os quatro efeitos do fortalecimento constituem o que chamaremos, daqui por
diante, de leis do fortalecimento operante. Pressões à barra e outros comportamentos
simples dos animais são escolhidos para estudar essas leis porque eles são facilmente
observados e medidos pelo experiinçntador e facilmente executados em várias taxas pelo
organismo. No decorrer deste texto, continuaremos a ampliara aplicabilidade dessas leis
e do termo operante muito além de pressão à barra e ratos.
- 87 -
Na sua lei do efeito, Thorndike enfatizou a importância de certas consequencias
espeicais do comportamento. Eventos que eram “ satisfatórios” , dizia ele, e que seguiam o
comportamento, atuavam de modo a fixar aquele comportamento. Embora chamar
tais eventos de satisfatórios possa, à primeira vista, parecer uma especificação indepen
dente e útil das conseqüências especiais, o fato é que fornecer uma definição satisfatória
para “satisfatória' 1 é difícil. No caso do animal, não temos uma maneira de saber se um
evento é satisfatório, salvo pela observação de se ele atua no comportamento de acordo
com as leis do fortalecimento operante. No caso do ser humano podemos pensar que a
satisfação possa ser facilmente identificada, mas tente definir o termo. Coisas satisfa
tórias são aquelas das quais gostamos, mas quais são essas coisas? Em última instância, as
coisas de que gostamos são aquelas que trabalharemos para obtçr. Mas dizer que trabalha
remos por elas é outra maneira de dizer que faremos por elas o que o nosso rato fará
“ por” alimento. Somos, então, levados à conclusão de que a definição dessas conse
qüências especiais é melhor concebida em termos de seus efeitos especiais no comporta
mento.
Figura 4.5 - Ted Williams completando

suas 2.000 rebatidas no primeiro turno e
2.001 rebatidas no quinto turno de um jo
go disputado no Yankee Stadium em 11
de agosto de 1955 (The New York Times
and Patrick A. Burns).
Em resumo, temos um grupo de conseqüências especiais, especiais porque quando

usadas em conexão com operantes, como fizemos na seção 4.2, resultam em mudanças
características de comportamento.
Uma lista parcial de tais conseqüências é conveniente. Para seres humanos e animais
superiores
Alimento
Água
Sexo
Calor
Novidade
funcionam dessa maneira.
-8 8 -
Uma conseqüência é sempre uma mudança no ambiente de um indivíduo. A apresen
tação de alimento para nosso rato foi uma mudança 110 seu ambiente previamente sem
alimento. A conseqüência de pedir um copo d’água pode ser um novo ambiente onde o
copo d’água aparece na mão de um amigo. A conseqüência de tirar o telefone do gancho
é um novo ambiente que agora inclui o sinal de discar. Poderíamos estender tais
exemplos indefinidamente. Note, nosso ambiente foram definidas, no contexto dos
reflexos e do condicionamento Pavloviano, como estímulos. É, então, evidente que, ao
falar de um certo grupo especial de conseqüências, nada mais estamos fazendo do que
delimitando, pelos seus efeitos especiais sobre operantes, um certo subconjunto de
estímulos. Podemos convencionalmente definir aqueles estímulos que, ao seguirem o
comportamento operante, atetam-no através das leis do fortalecimento operante, como
estímulos reforçadores (S+) ou simplesmente reforçadores. A operação de apresentar um
reforçador denominaremos de reforçamento.
Diz-se, algumas vezes, que os tenros operante e reforçamento são circulares. Parece
que cada um é definido em termos do outro. Reforçadores parecem ser definidos como
aqueles eventos que fortalecem operantes; mas operantes parecem ser definidos como
aqueles comportamentos que são suscetíveis de fortalecimento pelos reforçadores. O
“pequeno experimento imaginário’ que se segue mostra como a circularidade pode ser
quebrada.
Imagine um experimentador ingênuo diante de um Marciano. Ele observa um “orga

nismo” que nunca viu antes. O organismo faz alguma coisa. O experimentador, de sua
mala de conseqüências, apresenta uma aleatória. Será que o organismo executa nova
mente esse comportamento com maior freqüência ou será que a conseqüência não tem
efeito algum? Se não, talvez o experimentador tente novamente outra conseqüência ou
tente, talvez, a mesma conseqüência, mas selediona outro comportamento. Por um
processo de tentativa e erro, o experimentador pode descobrir certas conseqüências e
certos comportamentos que funcionem das maneiras descritas nas seções 4.3 a 4.6. Tendo
descoberto uma conseqüência especial, ele pode continuar a usá-la para descobrir outros
operantes. Tendo encontrado um operante, ele pode continuar a usá-lo para descobrir
outras conseqüências. Pouco a pouco, o experimentador persistente construirá seus con
ceitos de “ reforçadores ” para o Marciano e “operantes” do Marciano apenas através de
tais operações.
4.8 - 0 PARADIGMA DO FORTALECIMENTO OPERANTE
O que temos discutido no fortalecimento operante é diversamente mencionado na

literatura de psicologia como suscetiva, de ensaio e êrro, aprendizagem de efeito,
aprendizagem instrumental, condicionamento instrumental, aquisição, condicionamento
Tipo R (para resposta), aprendizagem operante e condicionamento operante. Preferimos
restringir o termo fortalecimento operante para as condições em que o comportamento
que é reforçado já existe com uma certa força, maior do que zero, no momento em que o
fortalecimento é iniciado. Contudo, ao examinarmos outras fontes, é útil reconhecermos
a equivalência desses vários nomes para o processo de fortalecimento.
Estamos agora em condições de dar uma definição compreensiva do paradigma do
fortalecimento operante. Tal como o condicionamento Pavloviano, ele tem quatro
aspectos: um. Dado, um Procedimento, um Processo e um Resultado.
- 89 -
DADO : 1 — Uma resposta operante sendo emitida numa freqüência maior
do que zera
2 - Um reforçador apropriado.
PROCEDIMENTO: Seguir cada emissão do operante selecionado com o estímulo refor
çador.
É útil representar o procedimento de fortalecimento operante simbolicamente. O

procedimento pode ser representado simplesmente como:
R -> S+
Onde R representa uma classe de resposta operante (constituída de r j, r 2 . . . rn), S+
representa um estímulo reforçador e a seta é lida como “ produz” ou “conduz a”.
PROCESSO: Um aumento abrupto na taxa do operante, sua incorporação rápida

num elo de comportamento e uma restrição na topografia do ope
rante.
RESULTADO: O mesrrto que no processo.
4.9 - OPERANTES VOCAIS
As atividades humanas que chamamos linguagem constituem possivelmente, o mais

complexo de todos os padrões de comportamento humano. Até o presente momento, a
linguagem é ainda tão única para o organismo humano que pode muito bem ser tomada
como uma das propriedades principais que definem a espécie. Os elementos comuns de
todas as linguas são os sons produzidos pela vibração do ar que é expelido dos pulmões e
que passa através de um grupo de músculos na laringe, chamados de cordas vocais. A tensão
desses músculos, à medida que o ar passa através deles, está sob o mesmo tipo de controle
que governa os movimentos de outras partes do corpo. Conseqüentemente, a produção
do som é comportamento operante. A região maxilar, os lábios e a língua agem em
combinação com a laringe para moldar os sons e produzir mais de quarenta sons humanos
diferentes, conhecidos como fonemas, os quais são usados em várias combinações nas
línguas. Devido ao fato de que os sons dos fonemas são diretamente dependentes dos
movimentos do aparelho vocal, a medida da produção do fonema constitue uma medida
indireta do comportamento, do mesmo modo que a medida da pressão a barra constitue
uma medida indireta dos movimentos realizados pelo rato ao pressionar esta barra.
A linguagem humana desenvolve-se a partir de sons não refinados, emitidos pelas
crianças. De um modo surpreendente, um bebê, durante os primeiros 5 meses de vida,
emite todos os sons usados em todas as línguas fiumanas — nasais e fricativas francesas,
guturais germânicas, e assim por diante (Osgood, 1953). Esses sons são emitidos indepen
dentemente de estímulos eliciadores e devem ser distinguidos do choro real de um bebê.
Durante os primeiros meses de vida, um bebê exibe um nível operante muito alto de
produção de sons. Ele pode ficar horas produzindo sons de gargarejo estalos com a
língua, sibilos, gritos e roncos. O termo técnico balbucio é empregado para denotar a
emissão espontânea desses comportamentos. Um progresso importante no balbucio
ocorre por volta de seis meses, quando a estrutura seqüencial do balbucio é alterado de
modo que a criança tende a repetir sua própria produção vocal (gu-gu, dá-dá, lá-lá, etc).
As mudanças que ocorrem do balbucio à fala são complexas e um único gráfico não
-9 0 -
é suficiente para descrever completamente o progresso. Todavia, uma mudança impor
tante que ocorre é a mudança na freqüência relativa dos diferentes sons pronunciados, à
medida que o bebê cresce. Assim, na França, os fonemas envolvidos no r francês e as
vogais nasais são fortalecidos pela comunidade que reforça — os pais da criança, seus
companheiros de brinquedos e, eventualmente, seus professores. Em países de língua
inglesa, um grupo diferente de fonemas é modelado em palavras por uma comunidade
reforçadora diferente. O resultado desse fortalecimento pode ser inferido de um grupo de
histogramas semelhantes aos da Fig. 4.3, porém mais complicados. Na Fig. 4.6, são vistos
os histogramas das freqüências relativas de 12 fonemas vocálicos (veja o Apêndice A
neste capítulo, para sua explicação) para crianças de várias idades e adultos. Podemos
inferir que o reforçamento desses sons ajusta a sua freqüência àquela da comunidade
adulta.
recém-naícido _ -23-24 meses —

cu
<
c60
tf
C
o
o
<L>
O, — 5-6 meses - A d ulto----
JZ t
i Ie£«AeoDoUu i I e C s A e o o o U u
Figura 4.6 - Perfis da freqüência de fonemas vogais, mostrando a mudança gradual

da freqüência relativa em direção a um padrão típico do adulto na comunidade refor
çadora das crianças (Irwin, 1952).
Uma prova mais direta dos efeitos de se reforçar sons produzidos pela criança surge
de experimentos de laboratório. Num experimento, o comportamento de bebês de 3
meses de idade foi observado enquanto eles permaneciam em seus berços. Durante duas
sessões de observação, um experimentador adulto recurvava-se sobre o berço a uma
distância um pouco maior do que 30 cm da criança e permanecia relativamente sem
movimento e sem expressão. Durante esse período, um segundo observador registrava a
freqüência de sons produzidos pela criança. Em duas sessões subseqüentes, o procedi
mento foi o nesmo, exceto que o primeiro experimentador seguia cada som que não
fosse choro com um^sorriso”, três sons utsk” e um leve toque aplicado no abdomen da
criança com os dedos da mão”. (Rheingold, Gewirtz e Ross, 1959, p. 28). Isto, natural
mente, é apenas:
R(balbucio) —> ^(sorrisos, sons, tocar oâbdomen)
O efeito do procedimento foi um aumento da freqüência do balbucio bem acima da sua

taxa ao nível operante durante essas sessões de fortalecimento.
O experimento demonstra a natureza operante dos sons humanos. Muitos' outros
animais emitem sons, alguns dos quais são reforçáveis e outros não. Um chimpanzé foi
criado, desde o nascimento, com uma família que tentou ensiná-lo a falar. (Hayes, 1951).
A tarefa foi difícil, porque o macaco, à primeira vista, não emitia som operante algum.
Os únicos sons que produzia eram gritos reflexos quando alimento ou outros eliciadores
- 91 -
apareciam, e sons CR aos estímulos que haviam sido previamente emparelhados com
esses eliciadores. Mrs. Hayes tentou seguir o seguinte procedimento
o p PI _j_
°1 (visão do alimento) (g ri to excitado) S (alimento) [4.1]
na esperança de fortalecer a CR (gritar), reforçando-a. 0 procedimento foi seguido por

muitos meses mais não foi efetivo, mostrando que o comportamento respondente con
dicionado não está sob o controle de suas conseqüências. Eventualmente, um som ahhhà
emitido apareceu, espontaneamente, num dia e mostrou-se ser reforçável. O macaco
aprendeu, eventualmente, a dizer Mam^ Papa e Cup através de procedimentos que
discutiremos num capítulo posterior.
É interessante especular sobre a importância da história de f4.ll para a produção
eventual do operante “ ahhha”. Foi £4.1) um precursor necessário para esse operante, ou
com a mera passagem do tempo poderia o macaco tê-lo desenvolvido, de qualquer
modo, na ausência de [4.1]? Uma das dificuldades principais para o desenvolvimento da
fala (como a conhecemos) no macaco é a ausência de balbucio. Enquanto um bebê
balbucia para si mesmo por horas sem fim, num estágio comparável de desenvolvimento,
o bebê chimpanzé permanece quieto. Em geral, por vários dias, o chimpanzé não pro
nuncia um único som. Logicamente, um nível operante maior que zero é um requisito
para fortalecimento, pois alguma coisa deve existir para se reforçar.
Em experimentos com outros animais, verificou-se que o ladrar de cães, o miar de
gatos e alguns dos sons das aves são reforçáveis. Nestes casos, a freqüência da produção
de sons pode ser aumentada marcadamente, através de suas conseqüências especiais.
4.10 - A EXTENSÃO DO FORTALECIMENTO OPERANTE
O fortalecimento operante é um fenômeno que, de algum modo, é limitado aos

comportamentos simples de animais e crianças que discutimos até agora. Estudamos o
animal porque podemos controlar rigorosamente seu ambiente passado e presente. Mas o
comportamento operante isto é, o comportamento que pode ser fortalecido por suas
conseqüências constitui uma grande proporção das atividades cotidianas dos homens
Quando chutamos uma bola de futebol, cozinhamos uma galinha, discutimos a última
moda, lamentamos o tempo e lavamos os pratos, estamos constantemente emitindo
muitos operantes. Com efeito, estamos emitindo algum operante em cada momento de
nossa vida. Na verdade, nossos operantes são freqüentemente arranjados em seqüências
mais complicadas do que a simples cadeia repetitiva do rato na seção 4.2 *Mas como
veremos em capítulos posteriores, uma complexidade surpreendente pode ser também
gerada ao nível do rato, gato, pombo e macaco.
Não é difícil demonstrar o fortalecimento operante em seres humanos. Dadas as
condições do paradigma do fortalecimento operante, podemos realizar demonstrações em
nossos amigos sem grandes dificuldades. A principal consideração adicional é que
acharemos a demonstração mais drástica e convincente se impedirmos nosso sujeito
humano de “ tornar cônscio” de que estamos realizando um experimento de fortaleci
mento. O “ tornar-se cônscio”é uma maneira dedizer que o sujeito é capaz de verbalizar o
procedimento que está sendo efetuado. Este “ estar cõnscio” verbal é um índice seguro de
que o comportamento que estamos tentando fortalecer estará agora sob o controle
poderoso de anos de história passada, com o qual a aplicação de um paradigma de
- 92 -
fortalecimento de, digamos, 30 min. com um reforçador fraco terá pouca possibilidade
de competir.
Num delineamento experimental interessante, baseado nos trabalhos iniciais de W.
Verplanck (1955) um assistente de pesquisa de graduação foi usado como um (‘ ator**
para tentar fortalecer certo comportamento de conversa em alunos de graduação
(Centers, 1963). O assistente e o sujeito eram colocados numa sala, ambos esperando
ostensivamente serem chamados para um experimento de psicologia. Na verdade, este era
o experimento. Durante esse tempo, o assistente estabelecia uma conversa com o sujeito
que de nada suspeitava e, em vários períodos, reforçava diversos tipos de conteúdo de
conversa, tais como demonstração de opinião, fornecimento de informação e perguntas,
com concordância -e atenção especial. Enquanto isso, sem conhecimento do sujeito, a
conversa estava sendo gravada e observada através de um espelho unidirecional.
A “ conversa” experimental durava 30 min. sendo dividida em três períodos de 10
min. Durante o primeiro período, ou nível operante, o assistente procurava não demons
trar concordância ou fornecer respostas informativas às opiniões e perguntas do sujeito.
Durante os 10 minutos seguintes, o período de fortalecimento comportamental o assis
tente concordava com, ou parafraseava favoravelmente, todas as demonstrações de
opinião emitidas pelo sujeito. Além disso, ele expressava atenção, simpatia, e compreen
são para todas as informações propostas e reforçava todas as perguntas ou dando a
informação solicitada ou concordando e aprovando, se era isto o que a pergunta indicava
desejar. Durante os 10 min. finais, o assistente ou discordava das opiniões do sujeito ou
permanecia silencioso depois que elas eram verbalizadas. Ele ignorava as informações
fornecidas e era o mais alheio possível às questões.
Os resultados do reforçamento de concordar (fortalecimento) indicaram claramente
que a freqüência de demonstração de opinião e fornecimento de informação, em relação a
todas as proposições, aumentou. Além disso, nenhum sujeito notou este condiciona
mento de seu comportamento. Por razões desconhecidas aos experimentadores, o fazer
perguntas não mostrou qualquer fortalecimento e assim, de acordo com a nossa defi
nição, ele não constitui uma classe operante.
Num nível diferente de desenvolvimento, Brackbill (1958) fortaleceu com sucesso
uma resposta de sorrir em bebês de 4 meses de idade, utilizando o contato físico como
reforçamento.
O próprio cientista está empenhado num empreendimento que exige, frequente
mente, a emissão de muitos operantes, poucos dos quais são reforçados. Comporta
mentos que levam à proposição de novas relações, ou de uma nova ordem entre os
conceitos, uma descoberta de um novo fenômeno e assim por diante, são reforçados pela
comunidade científica. Entre os reforçadores proeminentes para os behavioristas, está a
ordem observada quando se vê que algum comportamento de um indivíduo está regular
mente relacionado às suas conseqüências, como no caso da pressão a barra pelo rato da
seção 4.2. Essa lembrança de que o próprio pesquisador é um organismo que se com
porta, sujeito às leis do fortalecimento operante, caracteriza o desenho visto na Fig. 4.7.
A verificação das leis do fortalecimento operante no comportamento humano é
importante, porque isto mostra que apesar das diferenças aparentes muito grandes entre
homem e animal existem certas similaridades funcionais. São essas similaridades que, em
úítima instância, justificam o nosso estudo da psicologia através do comportamento de
organismos inferiores. Afinal de contas, o Psicólogo está principalmente interessado no
comportamento humano, o a mais exatamente dos comportamentos, que são cornparti-
93 -
Figura 4.7 - Rapaz, este cara está condicionado. Cada vez que eu pressiono a barra, ele joga
uma pelota aqui dentro” . (Adaptado com permissão de Jester Columbia College).
lhados por ambos, seres humanos e animais superiores. Frequentemente, utilizamos

sujeitos animais em nosso trabalho experimental por razões pragmáticas. Podemos con
trolar mais facilmente o ambiente imediato e passado do animal. Podemos privá-lo de
agentes tais como alimento e água, de modo a utilizá-los mais tarde como reforçadores
poderosos. Finalmente, podemos observar continuamente o animal por períodos longos
de confinamento.
O uso de animais na pesquisa em psicologia segue uma tradição longa e respeitada na
ciência, a de controlar e isolar condições relevantes, de modo a revelar a regularidade
básica na natureza. Talvez, a classe mais importante de variáveis independentes em psico
logia diga respeito à história passada do indivíduo. Um sujeito humano chega até nós com
uma história passada longa, complicada e incompletamente conhecida. 0 fato de que
mais ou menos uma hora de reforçamento fraco de operantes apenas parcialmente especi
ficados possa resultar numa modificação comportamental detectável, como no experi
mento de Centers (1963), deve ser tomado como um tributo à natureza fundamental dos
processos que isolamos a partir do estudo animal.
4.11 - SUPERSTIÇÃO
Dizer que o reforçamento é contingente a uma resposta pode significar apenas que
ele segue a resposta e não implica necessariamente numa ligação física direta entre a
resposta e o reforçador. O reforçamento pode ser mediado pelo comportamento de um
experimentador, ou por algum outro aparelho automático. 0 efeito do reforçamento no
comportamento é indiferente aos meios pelos quais a correlação temporal entre R e S+ é
efetuada. O poder automático do reforçamento em fortalecer o comportamento nos
lembra que, do mesmo modo que o condicionamento Pavloviano, sempre que as condi
ções temporais para o procedimento de fortalecimento operante são alcançados (na selva,
no lar, no laboratório), é provável a ocorrência de modificações no comportamento.
Quando nos lembramos de que o processo de fortalecimento é quase sempre virtual
mente instantâneo, não nos surpreenderíamos ao descobrir que o fortalecimento do
comportamento pode ocorrer mesmo em situações onde existe apenas uma coincidência
fortuita entre uma dada R e a ocorrência do S+. No experimento realizado por Skinner
(1948), um pombo faminto foi colocado numa caixa não diferente daquela vista na Fig.
- 94 -
4.1. Não havia, no entanto, uma barra nesta caixa e o alimento consistia dc pequenas
porções de grãos misturados que poderiam ser fornecidos através do alimentador. Cada
15 segundos, o alimento era automaticamente apresentado ao pombo, não importando o
que ele estivesse fazendo no momento. Sob essas condições, 6 entre 8 pombos rapida
mente desenvolveram respostas caracteristicamente diferentes mas estereotipadas. Um
pombo desenvolveu um movimento circular contrário aos ponteiros do relógio, comple
tando duas ou três voltas entre os refçrçamentos. Um segundo pombo repetidamente
estendia sua cabeça em direção a um dos cantos superiores da gaiola. Outro apresentou
um movimento de “balançar a cabeça'’ no plano vertical. Os outros três pombos desen
volveram uma variedade de outros movimentos bizarros da cabeça e do corpo,
característicos.
O processo de fortalecimento casual é, em geral, aparente. Por acaso, o animal estava
executando alguma resposta no momento em que o alimento era fornecido. Essa coinci
dência fortalece essa resposta e, assim, torna-a mais provável de reaparecer novamente e
ser reforçada uma segunda vez. Uma vez iniciado, o processo se perpetua. Como Skinner
salientou, pode-se dizer que o experimento demonstra um tipo de superstição.
“O animal comporta-se como se existisse uma relação causai entre seu compor
tamento e a apresentação do alimento, embora tal relação não seja real. Existem
muitas analogias no comportamento humano. Os rituais para mudar a sorte de
alguém com cartas são bons exemplos. Poucas conexões acidentais entre um ritual e
as conseqüências favoráveis são suficientes para estabelecer e manter o comporta
mento, apesar dos muitos casos não reforçados. Um outro exemplo é o do jogador de
boliche que lança a bola fora da pista, mas continua a se comportar como se estivesse
controlando-a através da curvatura e torsão de seu braço e ombro. Esses comporta
mentos não têm, naturalmente, efeito real algum sobre a sorte de alguém ou sobre a
bola a meio caminho fora da pista, tal como, no presente caso, o alimento apareceria
com a mesma freqüência se o pombo nada fizesse —ou, estritamente falando, se ele
fizesse outra coisa qualquer” (Skinner, 1948, p. 171).
4.12 - CONDICIONAMENTO OPERANTE
O fortalecimento operante é um caso especial do que chamaremos mais tarde de um

modo mais geral de condicionamento operante. O termo condicionamento é algo
infeliz neste contexto porque ele lembra a natureza eliciada do comportamento respon
dente. Contudo, o fortalecimento operante e o condicionamento Pavloviano têm certas
similaridades importantes. Em particular, as modificações do comportamento observadas
em ambos os paradigmas são condicionais a alguma história passada anterior. Num caso, a
história é um emparelhamento de um S ^co m um S2 - No outro, é a história de uma
determinada R que ocorre imediatamente antes de um S+. É essa natureza condicional
das mudanças comportamentais que justifica o uso do termo condicionamento para
ambos. Na medida em que as diferenças importantes entre os dois fenômenos sejam
sempre lembradas, não há perigo algum em empregar o termo “condicionamento” , quali
ficado que seu adjetivo apiopriado, Pavloviano ou operante. Todavia para evitar o perigo
que advem de se negligenciar essas diferenças, limitamos geralmente o termo condiciona
mento para o paradigma Pavloviano e utilizaremos outros termos (por exemplo, fortaleci
mento) para nos referirmos às várias modificações operantes que estudaremos nos capítu
los que se seguem. A Tabela 4.3 apresenta algumas comparações diretas entre os dois
tipos de modificações comportamentais que são frequentemente chamadas de condicio
namento.
Tabela 4.3
COMPARAÇÃO ENTRE O CONDICIONAMENTO PAVLOVIANO E OPERANTE
CONDICIONAMENTO CONDICIONAMENTO
PAVLOVIANO OPERANTE
Sr
PARADIGMA OU
CR R -» S ^
PROCEDIMENTO
CR está sob o controle de

S\ (CR pode ter elemen
NATUREZA DA R é emitida
tos em comum R 2 )
A ____________
R aumenta em freqüência sua

CR é gradualmente evocada topografia é reduzida e ela
PROCESSO
por S\ é incorporada a um elo de
comportamento.
Fortalecimento de uma R
Formação de alguns com
RESULTADO já existente no repertório
portamentos novos (CR) a
comportamental.
Sl
Probabilidade da CR a S\ Taxa de R, forma de R or
COMO É MEDIDO magnitude da CR, latência dem seqüencial relativa a
da CR. outras Rs que ocorrem
CORRELATOS Em geral envolve músculos Em geral envolve músculos

FISIOLÓGICOS lisos e glândulas. do esqueleto.
Envolvido na emoção. Pos Pedra fundamental para

IMPORTÂNCIA PA sivelmente, parte do subs aquisição de atividades
RA A PSICOLOGIA trato motivacional. complexas de solução de
problemas.
-9 6 -
APÊNDICE A
A tabela seguinte é a chave para os fonemas apresentados na abscissa da Fig. 4-6.
SÍMBOLO EXEMPLO
j o i na palavra fria
1 o i na palavra fácil
/
e o a n/á palavra mesa
e o é da palavra fé, seguido do a de rua
X intermediário entre o á de já e o é em fé
A primeiro a da palavra cama
0 som aberto do é na palavra fé
a o a da palavra caro, um pouco mais demorado
c o o na palavra nó
0 como em vou
V o o da palavra porque
u como o u na palavra uva

Brackbill, Yvonne. Extinction of the smiling responses in infants as a
function of the reinforcement schedule. Child Develpm., 1958, 29,
115-124.
Centers, R. A laboratory adaptation of the conversational procedure for
the conditioning of verbal operants. /. abnorm. soc. Psychol., 1963,
67, 334-339.
Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. NTew York:
Frick, F. C., and Miller, G. A. A statistical description of operant condi
tioning Am er. /. Psychol.. 195 1, 64, 20-36.
Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New York: Rine
hart, 1946.
-9 7 -
Hayes, C. The ope in ourM ause ifevv Y ork H arper and Row, 1951.
Irwin, O. C. Infant spcech: development of vowel sounds. / . speech
hearing Disorders, 1952, 1 7 ,2 6 9 -2 7 9 .
Mednick, S. A. Learning. Englewood ClifTs: Prentice-Hall, 1964.
Millenson, J. R., and Hurwitz, H. M. B. Some tem poral and sequential
properties of behavior during conditioning and extinction. /. ex p .
Anal. Behav., 1 9 6 1 ,4 ,9 7 -1 0 5 .
York: Oxford Univcr. Press, 1953.
Rhcingold, II. L., Gewirtz, J. L., and Ross, H. W. Social conditioning of
vocalizations in the infant. /. comp, physiol. Psychol., 1959, 52,
68 -7 3 .
Skinner, B. F. The behavior of organisms. New York: Appleton-Cen-
tury, 1938.
Skinner, B. F. Superstition in the pigeon. / . exp. Psychol., 1948, 38,
168-172.
Skinner, B. F. Walden two. New York: Appleton-Century-Crofts, 1948.
Skinner, B. F. A case history in scientific method. A m e r. Psychologist,
1 9 5 6 ,1 1 ,2 2 1 -2 3 3 .
Skinner, B. F. The experimental analysis of behavior. Am er. 5c/., 1957,
45, 343-371.
Skinner, B. F. Cumulative Record. New Y ork: Appleton-Century-Crofts,
1959.
Spencer, H. The principles of psychology. New Y ork: D. Appleton,
18/78.
Verplanck, W. S. The cçntrol of the content of conversation. / . abnorm.
soc. Psychol., 1955, 51, 668-676.
-9 8 -
Capítulo 5 - EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE
Quando a conexão entre uma resposta operante e seu reforçador é abruptamente

desfeita, o resultado é um processo comportamental característico. As características
deste processo, que é chamado extinção, representam uma parte importante na instalação
e manutenção de padrões comportamentais complexos, sendo por isso examinadas com
alguns detalhes neste capítulo.
Historicamen te, o conceito de extinção tem tido uma evolução vagarosa e difícil. O
enfraquecimento característico do comportamento (isto é, o declínio em sua freqüência)
visto sob o procedimento de extinção foi considerado pelos primeiros pesquisadores
como um mero artefato do fortalecimento concorrente de outros comportamentos
‘ competitivos’ . A suposição de que a extinção não poderia ser explicada em termos de
uma operação de fortalecimento concomitante em qualquer outra parte na corrente de
comportamento veio somente com a descoberta de que a extinção acarreta mais do que o
enfraquecimento (diminuição na freqüência) de uma única classe de resposta.
Quando se permite que um operante, previamente reforçado, ocorra sem a conse
qüência usual de reforçamento, numerosas respostas não reforçadas ocorrem. Essas
respostas são, no início, emitidas com uma alta freqüência, maior mesmo do que quando
elas estavam sendo reforçadas. Esse aumento imediato na taxa de resposta está correlacio
nado com mudanças na topografia e magnitude do comportamento que o implicam como
emocional. Um rato, treinado anteriormente a pressionar uma barra por alimento, atacará
vigorosamente e morderá a barra quando o reforçamento for omitido. O rato, tal como
um homem incapaz de achar suas chaves no bolso, onde ele, usualmente,as encontrava,
mostra efeitos que podem ser designados como “ raiva”. Além dessas mudanças compor
tamentais na taxa e topografia, o elo de comportamento, anteriormente bem estabeleci
do, degenera-se, voltando aos padrões de atividades vistos antes do fortalecimento. Ao
mesmo tempo, à medida que a extinção continua, os comportamentos previamente
suprimidos pelo fortalecimento da resposta selecionada começam a retornar à sua proe-
minência antiga no repertório de resposta do animal. Muitas dessas mudanças ocorrem
gradualmente, estendendo-se por um período de muitas horas. De fato, o processo de
extinção é tão demorado, mesmo seguindo uns poucos reforçamentos, que é seguro dizer
que provavelmente nenhum estudo delineou o processo em todos os seus aspectos, até
seu ponto final.
-9 9 -
5.1 MUDANÇAS NA TAXA DE RESPOSTA DURANTE A EXTINÇÃO
O declínio na taxa de uma resposta anteriormente reforçada é o efeito mais claio da

extinção. As mudanças na taxa são claramente vistas numa curva cumulativa, onde elas
nparecem como flutuações ondulatórias superpostas numa aceleração negativa geral. A
Fig. 5-1, ilustra a curva de extinção a resposta de pressão à barra de um rato,
anteriormente acostumado a receber uma pelota de alimento para cada pressão a barra. A
taxa de resposta é mais alta no início (imediatamente após a retirada do reforçamento) e
diminui gradualmente durante o período de uma hora e meia. Ao fim de 90 min. o rato
está respondendo numa taxa apenas ligeiramente maior do que a do seu nível operante.
omo a Fig. 5-1 mostra, a curva de extinção é muito irregular e contém muitos períodos
íl alta atividade intercalados com períodos de pouca atividade (as porções planas da
curva). Esses últimos tornam-se mais proeminentes próximo ao fim da extinção. Alguns
Figura 5-1. Uma curva de extinção para uma resposta de pressão a barra anteriormente
reforçada (De Skinner, 1938 dados de í7. S. Keller e A. Kerr).
p v.iüisadores supuseram que o processo de extinção é devido principalmente a um

aumento gradual no número desses períodos inativos no decorrer do tempo e que>
qua ido o organismo responde, ele o faz na sua taxa alta usual. Hurwitz (1 9 5 7 ) apresen
tou dados sugestivos que suportam essa noção. Ele analisou um número de curvas simila
res as da Fig. 5-1, dividindo-as em intervalos sucessivos de tempo de 2 min. Dividiu,
então, os intervalos em duas classes, dependendo de quantas respostas eles continham.
Aqueles que continham zero ou somente uma resposta, ele chamou de silenciosos .
aqueles que continham duas ou mais, ele chamou de "ativos". Hurwitz descobriu que o
número de respostas nos períodos kativos’ não declinava a medida que a extinção
progredia, mas que mais e mais intervalos tornavam-se "silenciosos". Seus resultados para
trupo de animais estão resumidos na Fig. 5-2.
10 20 30 40 50 60
t
Intervalos sucessivos de 2 min. Intervalos sucessivos de 2 min.
(A) (B)
Figura 5-2. Análise do responder durnnte a extinção. (Segundo Hurwitz, 1957).
/ -
5.2 - MUDANÇAS T0P0GJRAFICAS E ESTRUTURAIS NA EXTINÇÃO
Os efeitos da extinção não se limitam a mudanças na freqüência de uma determinada

resposta. Ocorrem, em particular, mudanças marcantes na form a do comportamento
durante a extinção. Num estudo de Antonitis (1951), onde foi estudado o operante do
rato de introduzir o focinho por entre uma fenda de uma das paredes, mediu-se os efeitos
de várias sessões de extinção intercaladas com fortalecimento. Uma parede da gaiola
utilizada por Antonitis continha uma fenda horizontal de 50 cm de comprimento.
Sempre que o rato introduzia o focinho dentro da fenda, um raio de luz era
interrompido, sendo tirada uma fotografia do rato no momento exato em que a resposta
era dada. Media-se a posição em que o rato estava ao longo da fenda, naquele momento, e
o ângulo que seu côrpo formava com uma linha perpendicular à fenda. A Fig. 5-3 ilustra
o aparelho.
Figura 5-3. Representação pictorial da resposta estudada por Antonitis (195 1 ).
- 101 -
Reforçando, com aliipento, a colocação do focinho na fenda, a freqüência desse
comportamento foi primeiro aumentada acima do nível operante. Subsequentemente, o
colocar o nariz na fenda foi extinguido, refortalecido, reextinguido e refortalecido nova
mente. Confirmando os resultados de Guthrie e Horton (1946) com a resposta de inclinai
uma vara em gatos e cães, Antonitis notou que o ângulo e a posição da resposta tendiam
a se tornar estereotipados durante o fortalecimento: o animal limitava suas respostas a
uma região restrita da fenda. A extinção, entretanto, produziu uma variabilidade no
comportamento de colocar o focinho na fenda pelo menos tão grande quanto a que foi
observada durante o nível operante: o animal variou suas respostas sobre o comprimento
inteiro da fenda. Finalmente, o refortalecimento resultou em maior estereotipia (respos
tas mais restritas) do que o fortalecimento original havia produzido.
Resultados similares foram obtidos por Notterman (1959), que estudou a força com
que um rato pressionava a barra durante o nível operante, fortalecimento e extinção.
Uma descoberta adicional emergiu dos dados de Notterman. Os registros individuais
revelaram forças ocasionais, emitidas durante a extinção, que excediam qualquer obser
vação anterior, tanto no nível operante como no fortalecimento. Retornaremos a essa
descoberta mais tarde, nas discussões de diferenciação e habilidades.
O elo ou cadeia de comportamento estabelecida pelo reforçamento degenera-se
quando se retira o reforçamento para os operantes. Frick e Miller (1951) forneceram a
ratos 300 reforçamentos espaçados durante 5 sessões pelo pressionar uma barra, no
aparelho mostrado na Fig. 5-4. (Note que a bandeja de alimento, neste aparelho, está um
pouco mais distante da barra do que na caixa-protótipo usada por Skinner, já descrita).
Após o 300^ reforçamento, obteve-se um registro de 24 horas de extinção para cada
rato. Durante a extinção, Miller e Frick observaram a degeneração da cadeia... Rp Ra Rp
Ra . . . fortalecida. À medida que a extinção progredia, começavam a suceder-se pressões
à barra (Rp Rp, etc.) e idas à bandeja (Ra Ra etc.). Houve pouca tendência para o padrão
se tornar aleatório durante a extinção. Ao contrário, o padrão fortalecido de Rp Ra Rp
Ra . . . gradualmente, deu lugar ao padrão do nível operante, o de ocorrências repetidas
da mesma resposta. Talvez deva ser enfatizado que este resultado não foi, de modo
algum, forçado logicamente. O elo de comportamento poderia ter simplesmente dimi
nuído em freqüência durante a extinção, embora permanecendo intacto.
Em resumo, o efeito do procedimento de extinção é induzir um processo gradual de
comportamento cujas mudanças incluem diminuição na freqüência da resposta,
aumento na variabilidade da forma e intensidade da resposta e quebra estrutural da
seqüência do comportamento. Estas são todas propriedades importantes da extinção e
serão mencionadas frequentemente, daqui por diante, como mecanismos explicativos.
5.3 RESISTÊNCIA À EXTINÇÃO
Se se peimitisse que o processo de extinção se completasse, os estados de nível

operante poderiam eventualmente ser alcançados. O tempo para que isso*ocorra é aparen
temente um índice da persistência do indivíduo em face à extinção. Em experimentos
reais, uma volta ao nível operante raramente, se alguma vez é alcançada.
Consequentemente, medidas mais convenientes e práticas da persistência ectão
baseadas na rapidez com que a taxa de resposta diminui durante a extinção. Por exemplo,
o número de respostas emitidas ou a quantidade de tempo até o ponto em que algum
critério de taxa baixa é alcançado, são chamados medidas de resistência à extinção.
- 102 -
Foto célula
Figura 5-4. Aparelho usado pára estudar as mudanças na seqüência do comportamento

durante o fortalecimento e extinção (Frick e Miller, 1951).
A maneira pela qual os valores reais dessas medidas são obtidos é ilustrada na Fig
5-5, onde a curva de extinção da Fig. 5-1 reaparece.
Figura 5-5. Uma curva de extinção da pressão à barra apòs o fortalecimento. No ponto a
nenhuma resposta havia sido emitida por cinco minutos consecutivos (segundo Skinner,
1938, dados de F.S. Keiler e A. Kerr).
Suponha que adotemos o critério arbitrário de qué, se em qualquer momento durante a

extinção, mais de 5 min decorram sem uma ocorrência da resposta selecionada, a extin
ção deve ser considerada ‘completa’ para todos os objetivos práticos e devemos, então,
terminar nosso experimento. Examinando, então a Fig. 5-5, nosso experimento terminará
em a. Neste ponto, nenhuma resposta ocorreu por 5 min, 130 respostas foram emitidas e
32 min se passaram. Qualquer um desses dois últimos valores, juntamente com a especifi-
cação do critério de taxa baixa (nenhuma resposta durante 5min), serve como um índice
da resistência à extinção.
Um critério diferente pode afetar o resultado da resistência a extinção. Na Fig. 5-5,
por exemplo, um critério de 5 minutos sem resposta teria sido bastante frouxo, já que
muito mais respostas, bem acima da taxa no nível operante, ainda seriam emitidas. Por
outro lado, se tivéssemos escolhido 10 minutos sem resposta, os 90 minutos do experi
mento de Keller e Kerr não seriam suficientes para alcançar o nosso critério, uma vez que
nenhuma pausa de tal duração ocorreu. A fim de evitar a natureza arbitrária de um
critério de extinção, muitos pesquisadores prosseguem com o procedimento de extinção
até que a inclinação geral da curva indique que a função está próxima de sua assíntota.
Então, o número de respostas emitidas em qualquer tempo arbitrariamente conveniente,
daí em diante, pode facilmente ser lido no registro cumulativo como a resistência à
extinção. Esse procedimento é ilustrado no ponto b da Fig. 5-5 onde, em 1 hora, a
resistência à extinção é definida como 190 respostas.
A resistência à extinção fornece um índice comportamental quantitativo cuja relação
com um número de operações experimentais é de interesse. Oportunamente, referir-
nos-emos a estudos em que a resistência à extinção é a principal variável dependente
comportamental. Na vida real, estamos frequentemente interessados em saber o quão
persistente será uma pessoa face a nenhuma recompensa. Diz-se que um homem, cuja
resistência à extinção é baixa, "desiste muito f acilmente” “ ou” "não tem perseverança’'
diante de uma tarefa difícil. Por outro lado, muita resistência à extinção é algumas vezes
indesejável. O homem que passa muito tempo, improdutivamente, tentando restabelecer
uma relação amorosa interrompida, pode perder uma boa chance de uma relação nova e
melhor.
Uma das variáveis que inicialmente se suspeitava afetar a resistência à extinção era a
quantidade de fortalecimento anterior. Parecia plausível que, se muitos reforçamentos
fortalecedores fossem dados, a resistência à extinção poderia ser maior do que se apenas
poucos fossem fornecidos. Essa hipótese geral foi confirmada por vários experimentos
(Williams, 1938; Perin, 1942 ; Hearst, 1961) que indicaram que a resistência à extinção
de um operante é baixa quando apenas alguns reforçamentos são dados no fortaleci
mento, aumentando, gradativamente até alcançar um máximo depois de 50 e 80
reforçamentos.
Outra variável que provavelmente afetaria a persistência de uma resposta à extinção
seria o esforço despendido na resposta Mowrer e Jones (4943) levantaram a hipótese de
que as respostas que exigem grande esforço são mais rapidamente extinguidas do que as
que requerem menos esforço. Esta previsão foi confirmada num estudo realizado por
Capehart, Viney e Hulicka (1958) que treinaram ratos a pressionar uma barra para obter
alimento. Eles variaram a força necessária para pressionar a barra durante o fortaleci
mento, de modo que, em algumas sessões, uma barra pesada era apresentada e, em outras,
uma leve ou uma intermediária Os animais foram, então, divididos em três grupos, um
dos quais foi extinguido na barra pesada, outro na barra leve e o último, na barra
intermediária. Usando um critério de nenhuma resposta em 5 minutos como índice de
resistência à extinção, eles obtiveram a função vista na Fig. 5-6.
O delineamento desse experimento é bem diferente daqueles que consideramos até
aqui. Nas representações gráficas dos efeitos comportamentais neste e em capítulos
anteriores, apresentamos dados obtidos com um só sujeito. Algumas vezes, a re
presentação gráfica consistiu de médias de vários sujeitos mas, em todos os casos, cada
- 104-
Peso da barra (gramas)
sujeito foi submetido a um procedimento idêntico e completo. Por completo,queremos
dizer que o comportamento dq sujeito foi medido em cada valor empregado para a
variável independente. Ouso dei vários sujeitos e a média dos resultados é apenas uma
tentativa de eliminar erros aleatórios de medidas, que perturbam todo experimento.Em
certos estudos comportamentais, contudo, é impossível sujeitar o mesmo indivíduo a
mais do que um valor da variável independente sem introduzir novas variáveis pertur
badoras. Este é geralmente o caso quando a resistência à extinção é a variável dependen
te. Para medir os valores da resistência à extinção para cada um dos vários valores de
nossa variável independente, teríamos que obter várias curvas de extinção do organismo.
Mas, após o fortalecimento original num valor determinado da variável independente,
existe apenas uma curva de extinção. Para obter outra deveríamos, ou fortalecer c
comportamento ou usar outro sujeito. 0 primeiro caso é justificado somente se ascurvas
sucessivas de extinção depois do fortalecimento e refortalecimentos repetidos fererr-
idênticas. Acontece, contudo (ver seção 5.6) que elas não o são. Na verdade, elas são
sistematicamente diferentes. Então, não temos outro recurso para adotar senão o de usar
um sujeito diferente ou grupo de sujeitos para cada condição experimental.
Consequentemente, Capehart, Viney e Hulicka extinguiram a resposta de um rate
numa barra de 5 gramas, outro numa de 40 gramas e um terceiro numa de 70 gramas.
Deste modo, eles evitaram o problema de como obter curvas de extinção inicial para
o mesmo rato em todos os três pesos da barra. Mas, ao fazerem isso, eles introduziram
uma nova fonte de erro de medida: as diferenças individuais entre os sujeitos devido a
outros fatores como diferenças genéticas ou diferenças não controladas na história pas
sada. Para fazer uma média dessas diferenças individuais entre os sujeitos, média esta que
poderia obscurecer qualquer efeito que o esforço da resposta pudesse ter, os pesquisado
res replicaram essencialmente o experimento 9 vezes mais e fizeram uma média de seus
resultados, usando, ao todo, um total de 27 sujeitos (9 ratos para cada uma das três
condições diferentes). Embora a suavidade da sua função que relaciona a resistência à
extinção ao peso da barra ateste o sucesso de sua estratégia, seus resultados (e todos os
resultados simillares) devem ser interpretados com cautela. Em seu experimento, nenhum
sujeito experimentou os três valores da variável independente na extinção. Logo, a gene
ralização do resultado para qualquer organismo individual depende da suposição de que,
se fosse possível obter uma curva de extinção inicial para os três valores diferentes da
variável independente num único indivíduo, os resultados de tal procedimento correspon
deriam aos resultados obtidos ao se sujeitar indivíduos diferentes às diferentes condições
experimentais. Em geral, procuramos evitar essa suposição sempre que possível e recor
-105-
remos a tais funções de grupo (das quais a Fig. 5-6 é um exemplo) somente quando,
como neste caso, aparentemente não tivermos outra escdha. Sempre que tivermos uma
escolha, é preferível realizar um experimento completo com um sõ sujeito, expondo-o a
todas as condições em que estamos interessados. A confiabilidade de nossos resultados
pode, então, ser avaliada através de replicações completas de nosso experimento com
sujeitos adicionais.
Exercício: Sem consultar a literatura de psicologia, veja se você pode delinear um

experimento para testar o efeito do número de reforçamentos durante o fortaleci
mento na resistência à extinção. Você teve que usar um delineamento de grupo
(como Capehart, Viney e Hulicka) ou foi capaz de usar um delineamento individual
(como a função de Anrep na Fig. 3-10).?
5.4 - RECUPERAÇÃO ESPONTÂNEA
A extinção pode ser prolongada até que a taxa de um operante anteriormente for
talecido tenha alcançado um nível baixo. Se o sujeito (por exemplo, um rato numa caixa
de Skinner) é, então, retirado da situação e colocado de volta um pouco mais tarde, outra,
curva de extinção (menor) será obtida (ver Fig. 5-7).
Figura 5-7. Recuperação espontânea da extinção de uma resposta de pressão à barra de

um rato. As porções da curva à direita e à esquerda da linha vertical foram separadas
por 47 horas durante as quais o organismo esteve fora da situação (Skinner, 1938).
Mesmo que nenhum fortalecimento tenha ocorrido entre as duas sessões de extinção,
ocorre uma certa quantidade de aumento espontâneo na força da resposta.
A quantidade de recuperação espontânea (quando medida pela resistência à extinção
da segunda curva de extinção) depende, até certo ponto, do intervalo de tempo entre o
fim da primeira extinção e o início da segunda. Os efeitos da recuperação espontânea
podem ser vistos num intervalo tão pequeno quanto 15 min entre as duas sessões de
extinção, na situação de pressionar a barra. O efeito aumenta até cerca de 2 horas de
intervalo, depois do que nenhum aumento adicional na recuperação espontânea ocorre.
Os fenômenos da recuperação espontânea têm sido assunto para muitas especulações,
mas seus pressupostos mecanismos estão além da perspectiva de uma proposição intro
dutória.
- 106 -
5.5 CONDICIONAMENTO E EXTINÇÃO SUCESSIVOS
Na seçáo 5.4, dissemos que a primeira extinção após o fortalecimento original é um

fenômeno único. Extinções posteriores (depois de refortalecimentos) diferem da primeira
extinção porque são mais rápidas e contêm um total menor de respostas. O efeito é
documentado pelos dados de Bullock e Smith (1953). Eles expuseram ratos a 10 sessões
diárias de um procedimento onde se reforçava as 40 primeiras respostas à barra,
seguindo-se diretamente 1 hora de extinção. Quando as curvas de extinção foram exami
nadas, notou-se que elas tornavam progressivamente menores da sessão 1 a 10 . O efeito é
visto na Fig. 5-8. Enquanto que, na sessão 1, a média da resistência à extinção em 1 hora
foi 50 respostas, na sessão 10 isto havia caído para 10 respostas apenas.
Figura 5-8. Curvas medias de respostas

acumuladas durante 1 hora de extinção
Os números à direita de cada curva iden
tificam a sessão (segundo Bullock e Smith,
1953).
5
10
10 20 30 40 50 60
Minutos
Esses resultados podem ser extrapolados para além de dez sessões. Parece que apenas
poucas sessões a mais seriam necessárias para que o animal alcançasse o que é chamado
extinção numa tentativa. Na extinção numa tentativa, apenas uma única resposta é
emitida após a retirada do reforçamento. A mudança no comportamento torna-se
abrupta e parece razoável concluir que o organismo passa a discriminar o procedimento
de extinção como tal. Poucas respostas em extinção é a regra, no nível humano. Muitas
de nossas próprias respostas mostram uma diminuição rápida, quando cessa o reforça
mento. Não continuamos a inserir moedas numa máquina de cigarros ou de doces
quebrada, quando não obtemos aquilo que pagamos. Ouando abrimos a caixa do correio
e descobrimos que está vazia, não continuamos a abri-la. Como os ratos de Bullock e
Smith, aprendemos a esperar pelo nosso reforçamento.
Resultados tais como os de Bullock e Smith não deixam dúvidas de que os processos-
de extinção sucessiva são diferentes. De fato, eles formam um subprocesso progressivo, à
medida que tendem a uma assíntota de uma resposta por período de extinção O que
acontece, contudo, se cada período de extinção é prolongado até alcançar a taxa de nível
operante? Será cada extinção sucessiva ou pouco mais rápida, que a precedente? Pouca
informação existe para responder à questão com autoridade, mas dados não publicados
coletados por J. L. Kerr e J. R. Mülenson (1957) mostraram que, quando a pressão à
barra de um rato era extinta até ao ponto onde duas sessões consecutivas fossem iguais
ou menores do que a taxa ao nível operante, um efeito similar ao de Bullock e Smith era
- 107 -
jLinda obtido. A Fig. 5-9 mostra o resultado desse procedimento para um animal efetuado
em quatio desses ciclos de condicionamento e extinção.
50
s
*8 40
Figura 5-9. Resistência à extinção num rato

em função de procedimentos sucessivos de ^ 30
condicionamento e extinções com volta ao 3
nível operante (dados não publicados de c
Kerr e xMillenson 1957) ’g
8 20
H
‘í>
£
o* 10
5.6 ESQUECIMENTO E EXTINÇÃO Números de ciclos de condicionamento-extinção

Devido ao fato de que o esquecimento e a extinção estão ambos associados a um
enfraquecimento do comportamento, eles são frequentemente confundidos. Na extinção,
o enfraquecimento está associado à emissão de respostas não reforçadas na situação
previamente associada com reforçamento. No esquecimento, o efeito do reforçamento é
enfraquecido pela simples passagem do tempo, durante o qual o indivíduo não está
na situação previamente associada com o condicionamento. O esquecimento pode ser
estudado, fortalecendo-se, em primeiro lugar, um operante e, então, permitindo que se
passe um tempo considerável e, finalmente,extinguindo esse operante. Quando isso é feito
nas condições controladas da caixa de Skinner, a curva de extinção resultante é muito
semelhante aquelas obtidas logo após o fortalecimento. A Fig. 5-10 mostra uma compara
ção entre duas curvas médias de respostas acumuladas, uma obtida de um grupo de ratos
extinguidos 1 dia depois do fortalecimento original e a outra obtida de ratos extinguidos
45 dias depois do fortalecimento original. Os 44 dias de diferença de tempo parecem ter
tido apenas um efeito muito pequeno em comparação com o efeito do procedimento de
extinção real.
Figura 5-10. Curvas de extinção obtidas 1

dia após o fortalecimeno oiiginal e 45 dias
após o fortalecimento original (Skinner,
1938)
30 60
Minutos
- 108-
Existem' ainda resultados mais surpreendentes que apoiam a noção de que a mera
passagem do tempo entre o condicionamento e a extinção tem, espantosamente, pouco
efeito. Um grupo de pombos foi treinado, no aparelho visto na Fig. 5-11, a bicar uma
chave ou disco iluminado, obtendo alimento. Depois do fortalecimento da resposta de
bicar a chave, os animais foram transferidos para o biotério. Quatro anos mais tarde.
retomaram ao aparelho e foram testados no procedimento de extinção. Embora os
pombos não tivessem visto o disco por mais de 1.400 dias, eles começaram a bicá-lo,
imediatamente e deram centenas de respostas em extinção (Skinner, 1950).
Existe uma vasta literatura sobre o esquecimento do comportamento verbal humano.
Antes do início do século vinte, Ebbinghaus memorizou listas das chamadas sílabas sem
Figura 5-11. Aparelhagem usada para o estudo do comportamento operante

de pombos.
sentido (Ver Fig. 5-12) e registrou a perceniagem de sílabas das quais ele se lem
brava em vários períodos de tempo. O uso de sílabas sem sentido ao invés de palavras foi
uma tentativa de eliminar fatores de significado e familiaridade que poderiam influenciar
os resultados, caso fossem usadas palavras comuns. Ebbinghaus observou (ver Fig. 5-13)
que uma queda marcante na retenção ocorria durante as primeiras 8 horas depois de
aprendidas as listas. Depois disso, o processo de esquecimento aproximava-se muito
lentamente de uma assíntota. Quase a mesma quantidade podia ser relembrada 31 dias ou
2 dias depois da aprendizagem.
- 109-
BIK NAX
Figura 5-12. Uma lista de sílabas sem sentido para o estudo da aprendizagem ZUR KIB
verbal e esquecimento. JEK VOD
ZOT MEF
YIN BEW
Figura 5-13. Curva de esquecimento, de Ebbinghaus para sílabas sem

sentido (segundo Ebbinghaus, 1885, de Keller e Schoenfeld, 1950).
Sílabas sem sentido são facilmente esquecidas. Outros materiais verbais não são tão
rapidamente perdidos. A Fig. 5-14 mostra curvas de esquecimento para três tipos de
materiais: poesia, prosa e sílabas sem sentido.
Porque as curvas de extinção de animais mostram efeitos tão pequenos depois de
passado longo tempo, enquanto um homem pode esquecer mais da metade do que ele
aprende em poucas horas? É essa uma superioridade não esperada do rato e do pombo
em relação ao homem? Talvez seja, mas encontramos uma explicação mais conveniente
ao considerarmos a atividade que interve'm duranie a passagem do tempo nos dois tipos
de experimentos. Nos experimentos com animais, o animal é removido da situação ex
perimental e tem pouca chance de emitir respostas que se assemelhem ao operante
Figura 5-14. Curvas de esquecimento mostrando a retenção para

diferentes tipos de materiais (segundo Guilford, 1938 e Kendler,
1963).
-110-
fortalecido. No biotério, os animais não experimentam quaisquer situações muito seme
lhantes às de sua caixa de treinamento. O homem, por outro lado. após memorizar
trechos de palavras - sejam palavras sem sentido, prosa ou poesia - não é abruptamente
removido de seu ambiente verbal. Ao contrário, ele continua a usar palavras (aprendidas)
e a experimentar situações com um certo grau de similaridade com o ambiente onde a
memorizaçãov/'riginal foi feita. Sempre que as situações mudam radicalmente depois da
aquisição, o esquecimento não é tão grande. As habilidades de datilografia são apenas um
pouco afetadas depois de um ano ou mais sem se praticar. Longe da máquina de escrever,
as chances de uma pessoa executar respostas similares à datilografia são pequenas. Nadar
e andar de bicicleta são duas ilustrações adicionais de habilidades que são retidas por
]ongos períodos sem prática.
Sempre que uma resposta especial é fortalecida num novo ambiente, diferente de
qualquer um encontrado na situação cotidiana, o esquecimento é reduzido. Isto é verda
deiro tanto para o homem como para jó animal. É difícil transportar um homem, abrup
tamente, de uma situação de aprendizagem para um outro ambiente completamente
diferente. Jenkins e Dallenbach (1924) tentaram fazer isso. Seus sujeitos aprenderam
uma lista de sílabas sem sentido logo antes de dormir. Os sujeitos foram, então, acorda
dos em vários intervalos após a aprendizagem e solicitados a se recordarem da lista que
Horas dcsdc a aprendizagem
Figura 5-15. Curvas mostrando o número de sílabas relembradas após

dormir ou ficar acordado (adaptado de Jenkins e Dallenbach, 1924)
haviam aprendido anteriormente. Os resultados (Fig. 5-15) foram comparados com

aqueles obtidos de um grupo de sujeitos que não foram dormir após terem aprendido a
lista, mas continuaram com suas atividades cotidianas usuais. Aparentemente, o que é
feito durante a passsagem do tempo é crítico na determinação de quanto esquecimento
ocorre. Podemos convenientemente considerar que, no caso mais extremo de “ esqueci
mento” , ocorre extinção normal e completa, isto é, a resposta é emitida repetidamente,
mas sem reforçamento, até que pare de ocorrer. Em outros casos reais, algum enfraqueci
- 111 -
mento ocorre devido à similaridade de outros comportamentos com o comportamento
aprendido e à similaridade dos ambientes durante o fortalecimento e o esquecimento.
5.7 - UMA DEFINIÇÃO COMPREENSIVA DE EXTINÇÃO OPERANTE

O procedimento de extinção faz surgir o processo de extinção. Como vimos o
processo de extinção consiste, em parte, de um declínio na taxa de resposta. Um número
de outros processos comportamentais tais como fadiga, habituação e saciação envolve um
declínio similar e devemos ser cuidadosos ao distinguí- los. Se um declínio na taxa de
resposta é tudo o que observamos, provavelmente, encontraremos dificuldades para dizer
qual processo está envolvido. Ao teorizar posteriormente, podemos atribuir um declínio
na taxa de resposta à extinção de certas outras respostas, as quais não estão sendo
medidas, mas apenas supostas. Esse é um exemplo de como os conceitos bem conhecidos
(por exemplo, extinção) são usados como pedras fundamentais para erigir um edifício
explanatório para um processo mais complexo e menos compreendido. Mas devemos
estar atentos ao atribuir todos os declínios de taxa a uma presumível extinção. Quando
possível, recorra à definição compreensiva de extinção:
DADO: uma resposta ooerame pieviamente lortaleciüd.

PROCEDIMENTO: i'etjra<ia do relorçam em o para o operante.
Em notação simbólica:
R, ou R -fr
PROCESSO: 1 - um declínio gradual, algo irregular, na taxa, marcado por aumentos

progressivos na freqüência de períodos relativamente longos de não-
resposta.
2 _ um aumento na variabilidade da forma (topografia) e da magnitude
da resposta.
3 — um rompimento gradual no elo ordenado do comportamento for
talecido.
RESULTADO: os processos comportameniais aproximam-se dos estados do nível
operante como valores limitantes.
5.8 - A EXTENSÃO DOS CONCEITOS DE EXTINÇÃO
A diminuição da força da resposta vista na extinção experimental não se limita a

ratos e pombos de laboratório. Isto é demonstrado pela pesquisa original relatada por C.
D. Williams, aqui reproduzida integralmente do “Journal of Abnormal and Social
Psychology”.
A ELIM INAÇÃO DO COMPORTAMENTO DE BIRRA ATRAVÉS DF

PROCEDIMENTOS DE EXTINÇÃO.
Carl D. Williams, University of Miami.
Este trabalho relata o tratamento bem sucedido do comportamento de birra numa
criança do sexo masculino, pela retirada do reforçamento. O sujeito (S) tinha
aproximadamente 2 1 meses de idade. Havia estado seriamente doente durante os
- 112 -
primeiros 18 meses de vida. Sua saúde melhorou, então, consideravelmente e ele
adquiriu peso e vigor.
O S, agora exigia o cuidado e a atenção especiais que lhes haviam sido dados
durante os meses críticos. Ele impunha alguns de seus desejos, especialmente na hora
de dormir, através de um comportamento de birra para controlar as ações de seus
pais.
Os pais e uma tia revezavam-se para colocá-lo na cama à noite e à tarde, na hora
da sesta. Se o pai (ou a mãe) deixava o quarto depois de colocar o S na cama, elo
gritava a esperneava até que o pai (ou a mãe) voltasse ao quarto. Assim, não se podia
deixar o quarto até que S dormisse. Se o pai (ou a mãe) começava a ler enquanto
estava no quarto, S gritava até que o material de leitura fosse posto à parte. Os pais
sentiam que S gostava deste controle sobre eles e que se esforçava durante o tempo
mais longo possível para não dormir. Em qualquer ocasião, os pais estavam gastando
de meia hora a duas horas, cada vez que colocavam a criança para dormir, esperando
no quarto até que dormisse. ^
Após um parecer médico a respeito da condição física de S, foi decidido retirar
o reforçamento desse comportamento de birra. Consistente com o princípio de
aprendizagem de que, em geral, o comportamento que não é reforçado será extinto,
um dos pais ou a tia colocava o S na cama dê uma maneira agradável e relaxada.
Depois dos agrados característicos da hora de dormir, deixava-se o quarto e se
fechava a porta. O S gritava e chorava, mas o pai (ou a mãe) não voltava ao quarto. A
duração dos gritos e do choro era medida a partir do momento em que a porta era
fechada.
Os resultados são vistos na Fig. 5-16. Pode ser observado que S continuou gritando
por 45 min na primeira vez em que foi colocado na cama, na primeira série de extinção.
55
50
45
40
0 35
1 30
O 25
.S _ 20
O"O
1 2 3 4 5 6 7 8 9 !0
Vezes '■m que a criança foi colocada para dormir
Figura 5-16. Duração d< . oro em duas se'rires de extinção em função d; ocasiões
sucessivas de ser colocado na c.-una (Williams. 1
- 113
O S não chorou a segunda vez que íoi posto na cama. Isso talvez seja atribuível à sua
fadiga de chorar na ocasião 1. Pela décima sessão, o S não mais choramingava, esperneava
ou chorava quando os pais deixavam o quarto. Em vez disso, ele sorria quando eles
saiam. Os pais notaram que ele emitia sons alegres até cair no sono.
Cerca de uma semana mais tarde, o S gritou e esperneou após a tia tê-lo colocado na
jama, provavelmente refletindo uma recuperação espontânea do comportamento de
birra. A tia reforçou, então, o comportamento de birra, voltando ao quarto do S e lá
permanecendo até que ele dormisse. Foi, então, necessário extinguir o comportamento
uma segunda vez.
A Fig. 5-16 mostra que a segunda curva de extinção é semelhante a primeira. Ambas
as curvas são similares às curvas de extinção obtidas com sujeitos subhumanos. A segunda
série de extinção atingiu o zero na nona ocasião. Nenhuma birra posterior, na hora de
dormir, foi relatada durante os dois anos seguintes.
Deve ser enfatizado que o tratamento, neste caso, não envolveu punição. Tudo o que
se fez foi suspender o reforçamento. Ocorreu, então, extinção do comportamento de
birra.
Nenhum pós-eíeito ou efeito colateral indesejável desse tratamento foi observado.
Aos três anos e 9 meses de idade, S parecia ser uma criança cordial, expressivae“ esperta”.
O uso do procedimento de extinção é geral, então, para enfraquecer a força de
qualquer operante. Em capítulos posteriores, veremos outras numerosas maneiras de
manipular a força do comportamento. Mas apenas com a aplicação simples de duas
operações principais —reforçamento e extinção podemos variar amplamente a força do
comportamento. A força do comportamento é um conceito importante na psicologia
devido a sua relação estrita com a probabilidade de ocorrência do comportamento.
Quando uma resposta existe com alta torça, sua freqüência é alta e a probabilidade de que
seja emitida em qualquer tempo determinado é também alta. Estas são, simplesmente,
maneiras diferentes de dizer a mesma coisa. Essa afirmação é verdadeira para homens e
animais. A análise do comportamento operante é, de modo geral, o estudo da forma e,
mais particularmente, da probabilidade de ocorrências de tais comportamentos. Se admi
timos que os conceitos do reflexo possam explicar os mecanismos simples da execução de
comportamentos tais como postura, caminhar e correr, então o território que resta para a
exploração psicológica parecer ser o inicio dos operantes. Logo, nosso interesse cen
traliza-se em situações que proporcionem uma escolha de comportamentos. Mesmo na
simples caixa de Skinner, onde frequentemente uma única resposta é medida, a escolha
está presente na “ liberdade” aparente do animal de responder ou não responder. Em
geral, nossa preocupação é com as causas do comportamento ou, em termos mais téc
nicos, com os controles sobre a emissão de respostas. Embora uma seqüência de compor
tamento possa estar integrada, de um modo reflexo, do inicio até o fim podemos ainda
estar interessados em saber porque ela começou. Embora todo este livro consista numa
série de respostas propostas a esta questão, já podemos perceber que as operações de
condicionamento e extinção fornecem dois princípios explanatórios poderosos. Uma
resposta pode não ocorrer, por exemplo, porque foi extinta.
“ Um aspirante a escritor que tenha enviado vários originais aos editores, tendo-os
todos rejeitados, pode dizer que ‘não consegue escrever nem mais uma palavra'. Ele
pode estar parcialmente paralisado com o que é chamado ‘câimbra de escritor’. Ele
pode ainda insistir que ‘deseja escrever’ e podemos concordar parafraseando-o: sua
- 114 -
probabilidade extremamente baixa de resposta é devida principalmente à extinção.
Outras variáveis continuam efetivas e, se a extinção não houvesse ocorrido, elas
produziriam uma alta probabilidade” (Skinner, 1953, pp. 71-72).
A noção de freqüência ou força de resposta é fundamental para a Psicologia, prin

cipalmente porque muitos comportamentos parecem ser explicáveis em termos da fre
qüência com que as unidades de comportamento ocorrem.
“ Dizemos que alguém é um ‘entusiasta’ do bridge quando observamos que ele joga e
fala frequentemente sobre bridge. Estar ‘bastante interessado' em música é tocar, ouvir e
falar muito sobre música. O jogador ‘inveterado’ é aquele que joga frequentemente. O fã
da fotografia está sempre tirando fotografias revelando-as e olhando as fotos feitas por
Figura 5-17. O poder da extinção. (Desenhado por Opie, 1961, The New Yorker
Magazine, Inc.).
-11 5-
ele e por outros. O ‘erotomaiuaco' frequentemente se ocupa com comportamento sexual
O dipsomaníaco’ bebe frequentemente" (Skinner, 1953 p. 62)
Embora nossa análise sobre c ■Míinção esteja muito longe de ser completa neste
capítulo, ela ilustra alguns dos principais efeitos conhecidos da retirada do reforçamento
na força do comportamento.
5.9 - REPRESENTAÇÕES GRÁFICAS DOS RESULTADOS DE EXPERIMENTOS

NOS QUAIS MUITAS VARIÁVEIS INDEPENDENTES SÁO ESTUDADAS EM
CONJUNTO.
Neste texto, o principal dispositivo para representar os resultados de experimentos é

o gráfico bi-dimensional. Nos casos mais simples, tal gráfico é construído de uma tabela
que contém pares de valores de x e y (ver Tabelas 2-2 e 3-1). Nas tabelas, cada valor da
variável independente forma um par com um único valor da variável dependente (em
geral, uma média de muitos valores observados). Num gráfico simples tal como o da Fig.
5.6, três valores da variável independente (peso da barra) formam um par com as respec
tivas médias observadas da variável dependente - resistência à extinção —e são indicados
como pontos. Então, traçam-se linhas retas conectando (isto é, interpolando-as entre) os
pontos. A “ curva” resultante permite-nos ver os resultados num quadro único, relacio
nando, assim, os dados de um modo que a tabela não faz. Os registros cumulativos são
mais sofisticados. Na Fig. 5-1, a variável independente (tempo) é contínua e a interpola-
ção é desnecessária já que o registrador cumulativo marca a ocorrência ou não ocorrência
de uma resposta (a variável dependente) em cada momento no tempo e não em poucos
pontos selecionados.
Algumas vezes um pesquisador deseja num único experimento estudar os efeitos de
mais do que uma variável independente. O método comum de representar os resultados
quantitativos de tais experimentos é ainda o gráfico, mas a forma ê algo generalizada.
Considere as duas funções da Fig. 5-18. Uma delas (A) é simplesmente a Fig. 5-6 reprodu
zida aqui por conveniência. A outra é a função de Perin (1942) — Williams (1938)
•cl acionando
150
i- 0
5 40 70 10 20 30 40 50 60 70 80 90
Peso da barra (gramas) N úmero dc reforçamentos
(A) ( 8)
Figura 5-18. (A) Resistência à extinção em função do peso da barra (Capehart. Viney, e
Hulicka, 1958). (B) Resistência à extinção em função do número de reforçamentos
prévios (adaptado de Perin, 1942, e Williams, 1938).
-116-
a resistência à extinção da pressão, à barra, no rato, com o número de reforçamentos
prévios, que fortaleceram a resposta. Poderíamos supor, para o objetivo da presente
discussão que o experimento representado por (A) e (B) na Fig. 5-18 tivessem sido
efetuados no mesmo laboratório, com o mesmo aparelho e com as condições controladas
de modo que as únicas diferenças entre (A) e (B) consistissem das manipulações da
variável independente indicada.
Podemos iniciar nossa análise com a observação de que ambos os gráficos corres
pondem a nossa fórmula simples de um experimento: uma variável independente ligada a
uma variável dependente. Há, contudo, uma relação interessante entre os dois exemplos
da Fig. 5-18. Ambos (A) e (B) apresentam a mesma variável dependente, resistência à
extinção. Além disso, um exame mais detalhado revela que (A) e (B) têm um ponto em
comum. Para ver isso, considere a noção, implícita em (A), de que muitas variáveis foram
mantidas constantes; somente o peso da barra foi variado. Analogamente, implícita em
(B) está a noção de que muitas variáveis foram mantidas constantes; somente o número
de reforçamentos foi variado. Contudo, em (A) uma das variáveis mantidas constantes é a
variável independente de (B) e uma das variáveis mantidas constantes em (B) é a variável
independente de (A). Especificamente, todos os sujeitos em (A) receberam 90 reforça
mentos, enquanto que todos os sujeitos em (B) tinham uma barra que pesava 15 gramas.
Portanto, tem um ponto em comum: o ponto que representa 90 reforçamentos com uma
barra de 15 gramas.
O elo entre (A) e (B) da Fig. 5-18 torna-se mais claro com a representação gráfica de
ambas as funções num mesmo sistema de coordenadas. Será útil empregar um sistema de
coordenadas tridimensional, uma vez que há duas variáveis independentes e uma variável
dependente. Examine a representação tridimensional de (A) e (B) na Fig. 5-19. Nesta
figura, a Fig. 5-18A é mostrada como um polígono sombreado no plano xy enquanto
que a Fig. 5-18B é mostrada como uma seção cônica traçada no plano zy.
Figura 5-19. Representação das duas funções da Fig. 5-18 como duas superfícies num
sistema de coordenadas tridimensional.
-117-
As duas superfícies interceptam-se nos seus pontos comuns x = 15,2 90. (O fato de que
os limites das curvas das duas superfícies não coincidam precisamente pode ser explicado
pelas várias diferenças nos dois experimentos além das duas variáveis em consideração).
A Fig. 5-19 é um mapa que mostra o território da resistência à extinção limitado por
essas duas variáveis independentes. O mapa mostra que as duas funções da Fig. 5-18
fornecem informação compor tamental acerca dos efeitos do peso da barra e número de
reforçamentos somente numa pequena região do espaço possível.
A representação espacial da Fig. 5-19 sugere que o território pode ser mais eficiente
mente estudado num experimento onde ambas as variáveis independentes sejam manipu
ladas juntamente de modo a cobrir uma porção maior do espaço experimental. Uma
manipulação desse tipo poderia ser uma extensão do experimento de Capehart, Viney e
Hulicka (1958) onde o número de reforçamentos fosse manipulado juntamente com o
peso da barra. A especificação dos grupos para as várias combinações das variáveis inde
pendentes pode ser feita de acordo com o esquema que vem descrito na Tabela 5-1.
Tabela 5-1.
Especificação dos grupos de um Experimento para Estudar os Efeitos conjuntos do
Número de Reforçamentos Anteriores e Peso da Barra sobre a Resistência à Extinção.
GRUPOS NÚMERO DE REFORÇAMENTOS

PESO DA BARRA
DADOS NO FORTALECIMENTO
A 50 5
B 50 15
C 50 30
D 100 5
E 100 15
F 100 30
G 300 5
H 300 15
I 300 30
As curvas hipotéticas da Fig. 5-20 sugerem que tipo de resultado pode ser obtido se
os grupos que recebem 30, 90, e 270 reforçamentos fossem estudados, usando-se os três
pesos da barra. Na Fig. 5-20, a representação é bi-dimensional, sendo que o valor de uma
das variáveis independentes (número de reforçamentos) é mostrado simplesmente como
um numeral pequeno à direita de cada curva. Essa representação é uma alternativa para a
Fig. 5-19. Representações bi-dimensionais como a da Fig. 5-20 são frequentemente en
contradas na literatura e são conhecidos como famílias de curvas, ou a forma paramétrica
da representação funcional. Essa última terminologia é uma forma aceita de se mencionar
as variáveis independentes que se sabe ou se acredita serem relacionadas a uma dada
variável dependente. “Parâmetro” é virtualmente sinônimo de “variável independente”
embora seja empregado especificamente para denotar as variáveis independentes
relacionadas a uma variável dependente comum.Os parâmetros da resistência à extinção
mostrados na Fig. 5-20, são, portanto, peso da barra e número de reforçamentos
-118-
200
150-
Peso da barra (gramas).

Figurá 5-20. Representação bidimensional dos resultados hipotéticos da manipulação
do peso da barra juntamente com a manipulação do número de reforçamentos. Os
pontos em 90 são de Capehart, Viney e Hulicka ( 1 9 5 8 ) Os outros pontos indicados são
hipotéticos.
antes da e.Uinção. Evidentemente, o número de parâmetros de qualquer variável de

pendente pode ser bem grande. Em qualquer experimento particular, contudo, raramente
estudamos mais do que um ou dois deles ao mesmo tempo.
EXERCÍCIO 4
Desenhe uma representação paramétrica (bidimensional) de possíveis resultados de

um experimento similar ao de H.M. Wolfle (Fig. 3-6). usando quatro valores diferentes de
intensidade de S2 - Utilize os dados de Wolfle como uma das suas quatro curvas.
REFERÊNCIA PARA O CAPITULO 5

Antonitis, J. J. Variability of response in the white rat during condition
ing and succecding extinction and reconditioning. Unpublished
doctoral dissertation, Columbia Univer., 1950.
Antoni,tis, J. J. Response variability in the white rat during conditioning,
extinction, and reconditioning. J. exp. P s y c h o l 1951, 42, 273-281.
Bullock, D. H., and Smith, W. C. An effect of repeated conditioniiig-
cxtinction upon operant strength. J. exp. Psychol., 1953, 46, 349
352.
-119-
Capehart, J., Viney, W., and Hulicka, I. M. The efícct of effort upon
extinction. J . comp, physiol, Psychol., 1958, 51, 505-507.
Ebbinghaus, H. Memory (Translated by H. A. Ruger and C. E. Bussen-
ius). New York: Teachers College, 1913.
Frick, F. S., and Miller, G. A. A statistical description of operant condi
tioning. Amer. J. Psychol., 1951, 64, 20-36.
Guilford, J. P. General psychology. P rinceton: ,D. Van Nostrand, 1939.
Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New Y ork: Rine
hart, 1946.
Hearst, E. Resistance-to-extinction functions in the single organism.
J. exp. Anal. Behav., 1961, 4, 133-144
Hurwitz, H. M. B. Periodicity of response in operant extinction. Quart.
J. exp. Psychol., 1957, 9, 177-184.
Jenkins, J. G., and Dallenbach, K. M. Oblivcsccnce during sleep and
waking. Amer. J. Psychol., 1924, 35, 605-612.
Keller, F /S ., and Schoenfeld, W. N. Principles oj psychology. New Y ork.
Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts,
1963.
Kimble, G. A. Principles of general psychology. New York: Ronald
Press, 1956.
Mowrer, O. H., and Jones, H. M. Extinction and behavior variability as
functions of effortfulness of task. J. exp. Psychol., 1943, 33, 3 6 9
386.
Notterman, J. M. Force emission during bar pressing. J. exp. Psychol.,
1959, 58, 341-347.
Perin, C. T. Behavior potentiality as a joint function of the amount of
training and the degree of hunger at the time of extinction. J. exp.
Psychol., 1942, 3 0 ,9 3 -1 1 3 .
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950,
57, 193-216.
Skinner, B. F. Science and human behavior. New York: Macmillan,
1953.
Williams, C. D. The elimination of tantrum behavior by extinction
procedures. /. abnorm. soc. Psychol., 1959, 59, 269.
Williams, S. B. Resistance to extinction as a function of the num ber of
reinforcements. J. exp. Psychol., 1938, 23, 506-522.
-120-
SEGUNDA PARTE
AS UNIDADES FUNDAMENTAIS DE ANÁLISE
6 . NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTÍMULO

7. REFORÇAMENTO INTERMITENTE
8 . A ESPECIFICAÇAO DA RESPOSTA
9. CONTROLE AMBIENTAL
Capítulo 6 NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTIMULO
Sistemas elaborados de notação abreviada que expressam as relações entre procedi

mentos, conceitos e eventos são, comumente desenvolvidos pela ciência. Tais sistemas de
notação podem ser convenientes para descrever as operações. Como um meio analítico, a
notação pode ajudar a reconhecer as similaridades e diferenças entre procedimentos e
simplificar sua classificação, foijando uma maneira para sua eventual integração teórica.
Um sistema desse tipo, altamente desenvolvido e bem conhecido, existe na química.

Indicando um elemento particular por um símbolo e definindo as relações entre os
elementos (por exemplo, + para combinação; —> produz; A para aplicação de calor),
uma descrição parcimoniosa de um procedimento e alguns de seus resultados podem ser
rapidamente dados e a relação .áésse procedimento com outros procedimentos seme
lhantes é facilmente vista. Deve-se salientar, todavia, que em todas as notações usadas
com o objetivo de resumir, perde-se alguma informação. Quando o sódio, por exemplo, é
adicionado à água, o hidrogênio é liberado e forma-se o hidróxido de sódio. Este procedi
mento e seus resultados são conveniente e quantitativamente ‘expressados assim
2Na + 2H O H ---- > 2NaOH + H 2
Esta expressão omite grande quantidade de detalhes pelo fato de representar certas
relações fundamentais de uma maneira simples e concisa. Ela não informa por exemplo,
que esta reação gera calor, não dá qualquer informação a respeito do tempo gasto pela
reação e não diz sobre o estado (sólido, líquido, gasoso), em que o produto se apresen
tará. Apesar dessas limitações, a notação tem se mostrado bastante útil para justificar sua
inclusão contínua na química, porque ela descreve convenientemente inúmeros eventos
com grande generalidade. Por exemplo, a representação é verdadeira para muitas formas
diferentes de sódio (pó, sólido, granular, cristalino), em qualquer hora do dia, numa
enorme faixa de temperatura e pressões atmosféricas. Como a maioria das generalizações
científicas, todavia, ela não é válida universalmente. Se a temperatura for muito baixa e a
pressão atmosférica muito alta, a reação não ocorrerá A representação também não
informa que o Na não é um material unitário, mas realmente um número de materiais
relacionados (isótopos). Todos eles comportam-se de uma forma muito semelhante para a
maioria dos objetivos, o que permite que o rótulo Na seja aplicado a todos como ,na
aproximação.
- 123-
Os psicólogos estão principalmente interessados nas relações entre as atividades dos
organismos e outros eventos no mundo. Um sistema de notação que emprega eventos
ambientais e eventos comportamentais como termos fundamentais seria conveniente para
descrever inúmeros procedimentos psicológicos e, como veremos, tomaria possível uma
comparação analítica das operações. O esquema de notação esboçado em detalhe neste
capítulo é derivado de um sistema descrito inicialmente por F. Mechner (1959) e elabo
rado por Vicki Mechner (1963). Ao contrário do exemplo químico, a notação
comportamental que esboçaremos esquematiza somente aspectos de procedimento da
experimentação. Nesse sentido ele se assemelha à notação da eletrônica. Nesta, um
circuito é representado por símbolos e o resultado de tal circuito, quando uma voltagem
lhe é aplicada, deve ser descrito por funções que relacionam as variáveis independentes e
dependentes que operam no circuito. Ao ser usada, a presente notação poderia igual
mente ser suplementada com funções que relacionem as variáveis independentes
(mudanças em eventos ambientais) com as medidas do comportamento.
Ao nível da presente consideração, não tentaremos dar definições formais ou
rigorosas para as unidades que empregaremos para descrever os procedimentos
comportamentais: estas podem ser encontradas em outros capítulos. O nosso interesse
aqui é somente fornecer de uma maneira concisa e com o mínimo de comentários, vários
instrumentos de notação através de exemplos e problemas que ilustram os poderes,
características e limitações principais da notação R e S que é amplamente usada no
decorrer deste texto,
6.1. RESPOSTAS E EVENTOS AMBIENTAIS
A notação incorpora eventos comportamentais sob a fo m a de respostas instru

mentais (operantes), abreviadas como R. Estas são, naturalmente, comportamentos que
são controlados por suas conseqüências. Para os objetivos presentes, podemos definir o
comportamento como qualquer coisa que um organismo individual faz. Então, podemos
ainda identificar uma resposta como uma unidade de comportamento. A palavra chave na
especificação do comportamento é o verbo fazer. Um organismo, para se comportar,
deve fazer alguma coisa, deve agir. Assim, temos abaixo exemplos de comportamento e
também exemplos daquilo que chamaremos de respostas.
( 1 ) João rebateu a bola.

(2) O Sr. Mitty engrenou o carro.
(3) Eu levei minha bandeja para a mesa.
(4) O rato pressionou a barra.
(5) O macaco coçou suas costas.
( 6 ) Jorge esperou pelo ônibus.
Em todos esses exemplos, algum organismo fez alguma ;oisa. De modo geral,
..entamos especificar a resposta em termos dos movimentos que o organismo faz, ao invés
de em termos das conseqüências desses movimentos. Então. “João rebatei a bola”
implica e que João levantou os braços de uma certa maneira e em corespondéncia com a
direção em que a bola vinha e, como uma conseqüência, a bola é rebatida. É impor;ante,
ao princípio, separar os eventos com portam entais de suas conseqüências.Portanto, ( 1 ) é
escrito melhor assim: “ Joao levantou o bastão” : e (3) é ('sciito melhor “ Eu movi minhas
-124-
pemas em tal e tal direção, segurando uma bandeja em minhas mãos e, eventualmente,
cheguei à mesa”. Chegar à mesa foi uma conseqüência do comportamento de mover as
pemas.
Note-se que, em cada exemplo, um organismo foi identificado. Seguiremos a
convenção de que cada especificação de uma R identificará o organismo para o qual o
evento e uma R. Deste modo, evitaremos confundir a R de um organismo com aquelas de
um outro.
Uma regra simples para identificar eventos respostas num texto de linguagem comum
é selecionar os verbos de ação. Já que uma resposta é um ato, os verbos de ação estão em
geral (embora não invariavelmente) associados a eventos resposta.
Os seguintes exemplos ilustram alguns eventos que não são eventos resposta.
(7) A bola rebateu em João

( 8 ) 0 furacão assolou o país.
(9) O governo sofreu um colapso.
(10) A Sra. Brown morreu.
( 1 1 ) 0 macaco adormeceu.
(12) Jorge ficou cansado de esperar.
Em (7), João nada fez. Houve uma ação sobre ele. Em ( 8 ), o furacão não é um orga
nismo, então não pode emitir respostas, tal como as conceituamos. Em (9), o governo
não consiste de um organismo individual que sofreu o colapso. O comportamento de um
indivíduo não está sendo descrito pelo colapso do governo. Rejeitamos (10) porque
morrer é um evento comportamental único para cada organismo e as respostas devem ser
eventos repetíveis. Em (11), o dormir, embora um fenômeno comportamental interes
sante, não deve ser interpretado como um evento resposta. Finalmente, a proposição que
diz “Jorge ficou cansado” é uma especificação grosseira de algum estado interior de
Jorge, mas não uma descrição de algo que ele esteja fazendo e, assim, não é um evento de
resposta.
Escreveremos os eventos resposta de várias maneiras. Podemos representá-los com
um R maiúsculo com um índice numérico ou em forma de letra e especificar, à parte,
ima chave com sua identidade verdadeira, como no exemplo
onde R^= João ergueu o bastão

Rb = João correu para a primeira base
Este exemplo simples mostra algumas características importantes da notação. Em

primeiro lugar, cada R, em qualquer exemplo particular, deve ser uma R do mesmo
organismo. Então, não poderia ser um exemplo de alguma coisa que João fez e Rg
um exemplo de alguma coisa que Jorge fez. Outra maneira de dizer isso, é salientar que
somente podemos discutir o comportamento de um organismo de cada vez.
Uma alternativa para indicar a identidade verdadeira de R é subscrever, abreviando o
comportamento com uma palavra como
-125-
^(levantou)
e
^(correu)
Ambas as formas serão usadas.
6.2 SITUAÇÕES E EVENTOS AMBIENTAIS
Qualquer indivíduo que se comporta é cercado e bombardeado por uma multi

plicidade de energias. Alguma dessa energia está muito longe para afetar o organismo.
Assim, um sinal luminoso do tráfego em Tóquio não terá efeito em nosso comportamen
to em Nova York. Um homem atirando contra nós a oito quilômetros de distância não
irá, similarmente, ter efeito sobre nós, a menos que o vejamos. Outro tipo de energia
pode não ter efeito porque o organismo não possui receptores especializados para captá-
la. Ondas de rádio e radiação cósmica rodeiam-nos constantemente mas não detetamos
estas energias a menos que estejamos equipados com instrumentos especiais para
traduzi-las em sons e deflexões de ponteiros —energias que podemos detetar. O organis
mo é construído de modo a detetar uma amostra de energias à sua volta e todas elas
constituem seu ambiente. Um ambiente, num dado momento, pode ser muito complexo,
consistindo de sons, padrões de luz, odores e todas as configurações daquilo que chama
mos objetos.
Frequentemente, notaremos que é necessário especificar apenas as mudanças que
ocorrem em nossos ambientes. Quando João rebateu a bola, esta viajou na direção geral
do campo externo. O restante do seu ambiente permaneceu relativamente constante mas
a parte que envolvia a bola mudou. As idéias que se seguem se mostrarão úteis. Uma
descrição do ambiente de um organismo em qualquer tempo e lugar determinados e em
referência a ele, será designada uma situação, abreviada por S. Além disso, chamaremos
uma mudança numa parte ou em todo o ambiente deste organismo de um estímulo. Uma
vez que um estímulo é apenas um caso especial da situação, não precisamos de um
símbolo especial para ele. Podemos usar o S de situação. Eis algumas s i t u a ç õ e s para vários
organismos:
(13) A bola veio em direção a João...
(14) Walter Mitty no seu Volkswagen 1962 cinza, sob a chuva, com o pé na
embreagem, o motorista do carro de trás buzinando...
(15) Minha bandeja contendo o almoço...
(16) 0 rato na caixa de Skinner, uma barra na parede da frente, nenhuma comida
presente.,..
(17) Uma pulga picando o macaco...
(18) Jorge no ponto de ônibus...
Note que três pontos seguem cada uma dessas situações descritas. Isto porque
qualquer situação pode sempre ser descrita indefinidamente com maiores detalhes. Feliz
mente, precisamos descrever apenas os aspectos da situação nos quais estamos interes
sados. Na maioria das vezes, estes serão as mudanças no ambiente e que ocorrem de
-126-
uma situação para outra. Note também a ausência de quaisquer verbos de ação na
descrição de situações ambientais. A penúltima (17), parece ser uma exceção. Contudo, a
picada é uma situação (S) para o macaco (embora seja uma resposta da pulga). Esta
ilustração enfatiza a importância de se identificar sempre para cada evento R ou cada
evento S a que organismo Rs e Ss estão se referindo.
As situações (Ss) são escritas de forma semelhante às Rs. Podemos subscrever um número
ou uma letra como em
S l 6 ” b°la dirigindo-se para João

Sb = Walter Mitty no seu carro
ou subscrever o quanto da situação real julgarmos necessário:
S(rato na caixa, alimento ausente)
É importante notar que as situações podem ser simples como a situação
S24 = bomba caiu + a rua

foi destruída + povo gritando + sirenes de ataque aéreo soando + fogo ardendo
à minha volta...
Embora muitas mudanças ocorram no ambiente num determinado momento, elas todas
constituem uma e somente uma situação: uma situação com muitas mudanças. Deve-se
depreender dessas considerações que, logicamente, só uma situação, em cada momento,
pode existir para qualquer organismo. Será conveniente usar o sinal + para combinar
mudanças separadas no mesmo evento S.
6.3 A NOÇÃO DE UMA CONTINGÊNCIA COMPORTAMENTAL
O fazer alguma coisa frequentemente produz algumas conseqüências importantes. Na

linguagem de eventos resposta e estímulo, essa proposição significa que a R frequente
mente conduzirá a um S de alguma conseqüência. A presente notação é fundamen
talmente uma notação das conseqüências de estímulo do comportamento. Sempre que
observamos que um evento comportamental produziu repetidamente, no passado, alguma
conseqüência específica no ambiente, estamos diante de uma contingência comportamen
tal. Formalmente, uma contingência comportamental é definida como uma regra que
especifica uma relação condicional entre uma resposta e suas conseqüências. Examine
alguns exemplos dessas regras.
(19) Pressionar o botão de partida faz o motor funcionar.

(20) Se você disser mais uma palavra, será mandado para a cama sem o jantai.
(21) Gire a maçaneta para a esquerda, para abrir a porta.
(22) Beba seu leite e você ganhará a sobremesa.
(23) Sempre que o macaco pressiona a barra ele recebe um amendoim.
Cada um desses cinco exemplos especifica um evento resposta e uma conseqüência de
- 127 -
estímulo para esse evento R. Considere (19). Se você pressionar, R, o botão de partida,
então, o motor funcionará, S (funcionar). Em (20): Se você disser uma palavra, R, então,
você estará na cama sem o jantar, S(na cama + sem o jantar). Note que mudamos “você
será mandado” em (20) para a forma “você estará” . A mudança acentua a idéia crítica de
que os eventos ambientais acontecem para o organismo. Em (20), o mandá-lo para a
cama poderá envolver eventos resposta da parte de outro indivíduo (por exemplo, sua
mãe) mas desde que estamos discutindo você, este é um evento S para você. É muito
importante manter um quadro de referência consistente na notação de contingências. No
momento, vamos supor que podemos notar os eventos R e S de um e somente um
organismo de cada vez. Assim, não podemos misturar os eventos comportamentais de
dois organismos no mesmo diagrama e chamá-los Rs. No exemplo (21), se a maçaneta é
girada para a esquerda, R(girar para a esquerda), então a porta se abre S(porta se abre).
Os exemplos (22) e (23) também cabem na forma se R, então S.
De um modo geral, uma contingência especifica a dependência de uma mudança
ambiental de um evento anterior de comportamento. Embora as contingências sejam
muito frequentemente especificadas no tempo futuro (veja os exemplos prévios) deve
estar claro que elas são regras baseadas em observações feitas no passado. Podemos
usualmente ler a dependência dada por uma contingência com: se Rf então S. Uma
maneira equivalente de descrever essa dependência de S sobre R é observar que, numa
contingência comportamental R conduz a S, ou R produz S. Estas últimas formas tem
uma utilidade tão geral que existe um símbolo especial, -> , cujo significado é conduz a
ou produz. Então, podemos escrever os exemplos de contingências de (19) a (23) como
se segue.
(19a) R (pressionar)-----> S (m otor funciona)
(20a) R a -----> S a
onde R a " dizer uma palavra e Sa ~ na cama
(21a) R( 16)---- > S i

onde R(] 6) ” vixar a m açaneta para a esquerda e S\ = p o rta aberta
(22a) R (beber leite)----- > ^(sobrem esa)

(23a) R (pressionar a barra) — ->S(amendoim)
Cada um desses cinco casos é convenientemente lido como R conduz a S.
A noção de uma contingência comportamental não é difcil, mas é importante notar
alguns de seus aspectos característicos. Primeiro, a contingência descreve as conse
qüências de S para dar uma R. Ela não descreve a ocorrência do comportamento. Isto
é, não diz que R ocorrerá. Apenas diz que S é condicional (dependente) a R, isto é, que
R ocorreu no passado e foi, então, seguida por S. Segundo, a contingência comporta
mental especifica apenas as conseqüências ambientais para o comportamento. Há um
número de outros tipos de contingências que a notação não se destina a manejar. Vários
destes estão ilustrados nos seguintes exemplos:
(24) Os selvagens executaram a dança da chuva e no dia seguinte choveu.

(25) Se houver sol, irei ao pique-nique.
(26) Se ele abrir o livro, começará a ler.
-123-
(27) Quando acordei, podia ouvir Joseila já movimentando-se na cozinha.
(28) Se continuar a chover, a lavoura será destruída.
Em (24), estamos diante de uma pseudo-contingência. R(dança) realmente conduziu a

(-----£*) S(chuva)* Todavia, a proposição não implica que, no passado, tal dança também
tenha produzido chuva. O exemplo (24) é meramente uma especificação de uma
seqüência única de R e S e a noção crítica de regra está ausente. Em (25), temos a idéia
de que algum evento comportamental, R(jr ao pique-nique), ^ condicional a algum
evento ambientei S(se houver sol)- Mas isto é o oposto da nossa idéia de contingência
comportamental, que propõe a dependência de S a uma R anterior. Em (26) temos
R(ler) dependente de R (abrir o livro)- Mas, novamente, isto não é uma conseqüência de
estímulo para o emitir uma R. É uma conseqüência comportamental do emitir uma R. Q
exemplo (27) é meramente uma proposição descritiva de algum evento e nem especifica,
nem implica em qualquer regra. Finalmente, (28) descreve dois eventos ambientais. O
segundo, S(colheita destruída), é dependente do primeiro, S(chover mais)- Tal contingên
cia S---- S não se enquadra no modelo básico R—3*S de uma contingência comporta
mental.
A noção de que as conseqüências de S são dependentes de R é fundamental nas
contingências comportamentais. A notação é equipada apenas para representar tais con
tingências. Isto simplesmente porque, como o texto deixa claro, controlar as conseqüên
cias passadas do comportamento é um dos meios mais poderosos que o psicólogo tem
para controlar eficientemente o comportamento que se lhe apresenta no momento. Logo,
não será surpreendente que urâ notação tenha sido desenvolvida para representar o
padrão dessas conseqüências em relação ao comportamento, tanto no laboratório como
fora dele.
6.4 A SITUAÇÃO INICIAL (SA)
Logicamente, toda contingência comportamental faz parte de algum ambiente. Outra

maneira de dizer isso é que as contingências são geralmente possíveis apenas em alguma
situação determinada. Assim, no exemplo (19), pressionar o botão de partida é possível
somente quando você está em seu carro, com o botão ao alcance e assim por diante. Em
( 20 ), a contingência permanece somente quando uma segunda pessoa está presente para
escutá-lo e mandá-lo para a cama sem o jantar. Considerações, similares podem ser feitas
para o restante dos exemplos de contingência. Em geral, uma determinada situação
prevalece num momento em que uma determinada contingência está em efeito. Uma vez
que a situação é mudada com a ocorrência de R (R produz uma nova situação, a
conseqüência S) é frequentemente desejável, por questões de comparação, indicar essa
situação inicial, de pré-conseqüência. Na notação, isto é feito escrevendo-se a situação
inicial (abreviada frequentemente por Sa) verticalmente acima de R. Coloca-se, então,
um colchete abrangendo os dois termos, S \ e R, para indicar que a situação e a contin
gência associadas a R ocorrem simultaneamente. Considere:
S, [ 6. 1]
- 129 -
onde Sa = leite à sua frente
R = beber
Sb - sobremesa
O diagrama [ 6 . 1 1 é lido: quando o copo de leite estiver à sua frente e, se você o beber,
então ganhará a sobremesa. O diagrama [ 6.1 | é o tipo mais simples possível de diagrama
de contingência a ser escrito na notação. Ele mostra duas situações, uma inicial e uma
segunda —as conseqüências de R. Ele especifica um evento resposta. Embora os diagra
mas que se sucedem sejam mais complicados, todos eles contêm como elementos a idéia
expressa em [ 6 .1 1 Isto é, em alguma Sa, se uma R é emitida, entio Sg ocorrerá. As
contingências que se adaptam ao diagrama [ 6.1 j são melhores lidas como:
quando ou
enquanto ou R -----> SB
durante ou SA
logo após se então
Se esta fraseologia for adotada, haverá pouca possibilidade de interpretação errônea de

qualquer problema.
6.5 CONTINGÊNCIAS MÚLTIPJ AS NA MESMA SITUAÇÃO
Raramente encontramo-nos numa situação onde possamos fazer apenas uma coisa
que tenha conseqüências. Normalmente, existem diversos comportamentos que podería
mos desempenhar em cada situação, muitos dos quais poderiam produzir mudanças
significantes no ambiente, ou conseqüências. Por exemplo, ao estar sentado diante da
máquina de escrever, lá estão quarenta ou mais teclas que podem ser batidas, cada uma
produzindo uma conseqüência diferente. Poderíamos também colocar e tirar o papel,
apagar as letras com a borracha, mudar a fita, etc. Além disso, se o telefone estiver perto,
poderemos telefonar. Se uma segunda pessoa estiver próxima, podemos solicitar seus
préstimos e sermos atendidos. Pode-se continuai enumerando indefinidamente várias
atividades possíveis nessa situação, todas com conseqüências distintas. Resolvemos este
problema na notação escrevendo somente quantas dessas contingências desejarmos notar
e isto é feito com a simples adição de Rs nos colchetes. Assim, se estivermos interessados
em notar as contingências do bater em qualquer tecla de uma máquina de escrever e
produzir uma letra, ou do discar um número num telefone, ou do pedir um copo de água,
poderíamos escrever:
Sa (na máquina de escrever, perto do telefone, amigo próximo)
Rl (bater na tecla) S(ietra) ^ 2\
R2 (discar o número) -» S (aiguem responde)
R3 (pedir água) —> S(um copo com água é trazido)
Em geral, podemos escrever tantas contingências de R quantas desejarmos, simplesmente

pela adição de Rs e suas conseqüências dentro de um colchete.
-130-
SA
Ri SB
R 2 —>
[6.3]
R .3 SD
R4 sE
Os três pontos na vertical significam kke assim por diante” .

Note, cuidadosamente, que |6 .2 |e | 6.3 | não são representações dos comportamentos
que serão realizados quando estivermos sentados à maquina de escrever. São represen
tações do que acontecerá se qualquer uma das Rs ocorrer. Os diagramas \6.2\ e 16.3 |não
asseguram que alguma dessas Rs seja, na realidade, efetivada ou que algum comporta
mento ocorra. O máximo que a notação pretende c mostrar quais conseqüencias ocor
rerão se alguns comportamentos ocorrerem. Este é um ponto fundamental que deve ser
con st an temente lembrado sempre que Se examinar diagramas de R c S.
Um caso especial de contingência múltipla ocorre quando mais de uma R pode
produzir as mesmas conseqüências S. Na expressão “há mais de uma maneira de tirar o
couro de um gato” , temos um conjunto de contingências do tipo visto no diagrama 6 .4 :
SA
R{ ----r—> Sb
R2 — 1 [6.4]
R a- 1
onde S\ - gato intacto

S[3 gato sem couro
R] = um modo de tirar o couro do gato
F*2 - outro modo
R3 = ainda outro modo
Para um exemplo mais específico, considere as maneiras pelas quais podemos chamar um
garção à nossa mesa. Podemos chamar “garção” , podemos fazer um sinal ao garção mais
próximo com as mãos ou podemos meramente olhar na direção do garção, fixando
nossos olhos nos dele.
- 131 -
(nao luí garçao à nossa mesa)
S(o garção vem) [6.5]
(cli am a r o ga rç ão) _____
R(olhar o garção)
0 diagrama | 6.5 | ilustra um método útil de especificar Sa, a situação inicial. Para produ
zir o diagrama 16.5 [ escrevemos primeiro todos os com portam ento* envolvidos. Então,
escrevemos a conseqüência principal, “ o garção vem até nós’\ Finalmente, para d eter
minar o melhor método de especificar Sa, verificamos apenas qual seria o oposto da
conseqüência. Neste caso, é simplesmente ‘‘nenhum garção à nossa mesa” . Quando
casos,complexos, contêm muitos Ss, é frequentemente útil obter o oposto de cada S, pois
o oposto pode dar uma pista de como iniciar o diagrama.
6.6 A CONTINGÊNCIA NULA
Nos diagramas 6.1 a 6.5, Rs produziram Ss. Sempre que uma R conduzia a uma nova
situação, esta era incluída num colchete vertical ao longo da situação em vigor. Mas,
nesses diagramas, a conseqüência S foi escrita sozinha, fora do colchete. Um S fora de um
colchete usualmente indica que nenhuma contingência especial (em que estamos interes
sados) se mantém nessa situação. Então, o significado de Sg sozinho em 16.1 Jé o mesmo
que:
Aqui se infere que a R em questão, R (beber)’ n^° m a*s tem quaisquer conseqüências
especiais uma vez o organismo alcance Sg. Assim, a ausência de qualquer R detenninada,
num colchete, implica que se esta R fôr emitida durante aquele S, nenhuma conseqüência
especial ocorrerá. A ausência de quaisquer conseqüências especiais para uma R define um
caso especial de uma contingência e é chamada de contingência nula. Assim, a ausência
de qualquer R determinada em qualquer colchete implica que a contingência nula está
em ação para esta R durante o S deste colchete. Além disso, o aparecimento implica na
contingência nula de um S fora de um colchete nesta situação para todas as Rs em con
sideração.
Ocasionalmente, em alguma situação, digamos S, desejamos enfatizar que uma R que
anteriormente tinha uma conseqüencia, não a tem mais. Uma maneira de fazer isto seria
simplesmente omitir a R do colchete que inclui Sa ^ mas para enfaiizar, pode ser ade
quado escrever:
S*
R R
os quais são ambos lidos: durante Sa, R não mais produz quaisquer conseqüências espe
ciais. Ambos são equivalentes a
Sa ou [S„
* todas as q u atro form as ilustram m aneiras diferentes de escrever a contingência nula.
- 132 -
6.7 A DURAÇÃO DAS SITUAÇÕES E DAS CONTINGÊNCIAS
As situações não duram indefinidamente, façamos ou não alguma coisa para muda
las. Podemos subir num ônibus somente enquanto ele permanece no ponto. Podemos
acenar para o garção enquanto ele está à vista, mas eventualmente ele desaparece e
nossos sinais não são eficazes. As crianças frequentemente têm um limite de tempo para
beber o leite. Depois disso, não haverá sobremesa, independentemente do que elas façam.
O fato de que muitas situações e contingências tenham uma duração de tempo definida a
elas associada, leva à introdução do símbolo T que representa a duração dc tempt'). O uso
de T é direto. A situação (S j), que dura um tempo T, e escrita:
Vários pontos devem set levantados a respeito da interpretação de [6 .6 .| Primeiro, T c a

duração de Sj. Segundo, em T há sempre uma seta que nele se origina. Se uma situação
dura um tempo T, então uma nova situação deve substituí-la. Esta nova situação será
encontrada na ponta da seta que se origina em T. Terceiro, T e sua seta são usados para
representar “ ao fim de T unidades de tempo''. Então, T é sempre uma determinada
duração dc tempo. Temos alguns exemplos do uso dc T, a seguir: (29). A peça dura duar
horas, mas há um intervalo de 10 minutos entre o primeiro e o segundo ato. O primeiro
ato dura 45 minutos.
S (ato 1 ) S (intervalo) S (ato II) S(Hm da pena)

Z(45 min) > ZOOm in) X(65 min) *
(30) o rato ficará na caixa por uma hora.
SA
T -* S n
onde Sy\ rato na caixa

T - 1 hora
Sg rato fora da caixa
Nenhuma contingência foi escrita nesses colchetes já que nenhuma conseqüência para
quaisquer comportamentos foi especificada. Se houvesse sido especificada alguma, então
as Rs teriam sido colocadas nos colchetes.
Algumas vezes, apenas um valor aproximado de T é conhecido. Então, se estamos
esperando que alguém saia da cabine telefônica para que possamos fazer uma chamada,
não podemos estar certos de quanto tempo a situação de S(cabine tejefônica ocupada)
- 133-
durará- O máximo de que somos capazes, nessas condições, seria estimar uma media do
tempo de espera, digamos 5 minutos, em media. Uma média de T, assim especificada, é
escrita T, onde o - indica “em media”. T é usado exatamente da mesma maneira que
T. Por exemplo:
1(5 min) —> S(cabine livre > [6.7 1

S(cabine ocupada)
O diagrama 6.7 ilustra mais duas características da notação. Primeiro, as setas sempre se
originam nos Ts (ou Rs), nunca nos Ss. Quando um S sucede outro, a seta deve vir de um
T (ou de- R). Segundo, a posição vertical de T e S, num colchete, é irrelevante. Um pode
estar abaixo ou acima do outro. Os eventos dentro de um colchete entram em ação
simultaneamente.
6.8 MAIS DE UMA RESPOSTA É EXIGIDA PARA A CONSEQÜÊNCIA S.
Quando mais de uma ocorrência de uma dada resposta é necessária para produzir
alguma conseqüência S, este fato pode ser indicado de uma ou duas maneiras. Antes de
tudo, o evento, comportamental associado com a contingência pode ser definido em
termos do número de elementos requeridos. Então, o exemplo “ escreva uma palavra no
quadro negro 100 vezes e, então, você pode ir para casa” , poderia ser notado assim:
Ra Sa
Si
onde Sj = dentro da sala de aula

Ra ~ escrever uma palavra 100 vezes
Sa = permissão para sair
Aqui, o número de elementos requerido está envolvido na definição de Ra. Alternati

vamente, este caso poderia ser notado assim:
Rn.a ^ Sa
S,
on de s j = dent ro da sa1a de au 1a
Ra = escrever uma palavra
Sa = permissão para sair
n = 100
Assim como o T, algumas vezes pode-se conhecer apenas o valor médio de a. Quando
somente o número médio de respostas requeridas para uma mudança S é conhecido,
escrevemos n.
-134-
6.9 CONTINGÊNCIAS REPETITIVA.
Nos diagramas [6.1 | a [6.5 [ as respostas produziram consequencias ambientais.

Mesmo assim, todas essas contingências poderiam ser descritas de uma vez. Isto é, uma
vez que a R especificada ocorreu, apareceu uma nova situação e a contingência nula
entrou, então, em efeito para todas as Rs enumeradas no colchete seguinte. Todavia, esta
é uma condiçãoque nem sempre é verdadeira. Em 6.2, por exemplo, uma simplificação
grosseira foi feita, desde que está claro que, quase que imediatamente depois de bater
numa tecla, podemos bater em outra e produzir uma letra. Evidentemente, necessitamos de
alguma maneira para descrever a natureza repetitiva de certas contingências.
Talvez a contingência repetitiva mais comum seja aquela que a máquina de escrever
ilustra. Depois de fazer alguma coisa obtemos uma conseqüência, mas podemos fazer a
mesma coisa novamente, se desejarmos, e ainda obtermos uma conseqüência e assim
indefinidamente. A maneira mais simples de descrever este caso seria diagramá-lo de modo
a indicar que a contingência antiga está novamente em efeito logo depois da
conseqüência. Esta seria uma representação exata, porque é certo que não podeipos
datilografar uma nova letra no momento em que a tecla está batendo no rolo. Se
fizermos assim, teremos a sobreposição de tipos e outros efeitos indesejáveis. A idéia
principal é que devemos esperar um pouquinho, apenas uma fração de um segundo.
Assim, a contingência nula que está em efeito no momento da conseqüência dura
somente uma pequena fração de segundo, depois do que voltamos ànosssa contingência
original. Na seção 6.7, discutimos como o tempo pode produzir novas situações.
Precisamos apenas ampliar este conceito para permitir que o tempo conduza de volta às
situações antigas e também ás antigas contingências. Essa ampliação de nossas idéias
permitirá uma representação exata de muitas contingências repetitivas. No caso da
máquina de escrever, podemos notar:
SA Sb
Ra |T -
2
, 16.8|
onde S a " à máquina de escrever, teclado em repouso.
Ra - âter numa tecla
S[} a letra aparece
j pequena fração de segundo.
No diagrama 16.8 | representamos o fato de que numa situação S^, podemos bater numa
tecla e produzir uma marca na página e na outra S b , não podemos obter esse efeito
batendo na tecla. Para nos referirmos às duas contingências distintas (uma das quais,
naturalmente, é o caso nulo) subscrevemos os numerais 1 e 2 embaixo dos colchetes.
Outros exemplos de contingências repetitivas simples são:
- 135 -
(31)A ave recebe uma apresentação de 3 seg de alimento cada vez que bica o disco.
(32)Você pode encher sua caneta tintoiro colocando-a no tinteircr e empurrando o
émbolo. (Aqui, o T da contingência 2 é bem longo, dependendo do quanto você
escreve).
(33)Cada pressão no gatilho faz a arma disparar um tiro.
Um segundo tipo de contingência repetitiva ocorre quando uma segunda resposta,

em vez da mera passagem do tempo, faz voltar às condições da primeira situação e suas
contingências. Quando um rato é reforçado com uma gota de leite cada vez que pressiona
a barra, um?. segunda pressão à barra não p ro d u z irá uma segunda gota de leite até que a
primeira seja consumida. Assim,
onde S a leite ausente

S r - gota de leite
RA pressão à barra
RB - beber o leite
representa aquelas condições. Este tipo de reciclagem comportamental é muito comum

Algumas armas de fogo pequenas são construídas para atirar somente quando reguladas
entre cada tiro.
S(arma regulada) _______ ^ |S(fogo) ________

R(puxar o gatilho) [R(regular)
1 2
Similarmente, você pode obter muitas garrafas de uma máquina de Coca-Cola, inserindo
as moedas, mas você deve remover cada garrafa para que a próxima moeda seja eficiente.
Em resumo, há dois modos principais de reciclar uma contingência repetitiva: através
da passagem de tempo (indicado por T ^ ) } no por meio de um evento resposta (indicado
por R -----1 )
6.10 FAC1LITAÇÃO
Ocasionalmente, acontece que a emissão de uma resposta, embora não altere o

ambiente, torna possível que uma segunda resposta produza um estímulo. Assim, quando
chegamos ao final de uma linha com a nossa máquina de escrever, o teclado não mais
opera. Se pressionarmos o soltador de margem, as teclas não operam, mas esta resposta
não muda nosso ambiente de um modo apreciável. A máquina de escrever parece
exatamente a mesma antes e depois de ter sido pressionada a tecla de soltar a margem. As
mudanças ocorrem, naturalmente, dentro da máquina de escrever e são reveladas pela
possibilidade, de ígora, se produzir letras,batendo nas teclas. Notamos es.se caso, assim:
136-
onde S24 =■término da linha
$23 - a letra aparece
Ra = pressionar o soltador de margem
Rb = bater na tecla
T - pequena fração de segundo
Assim, o aparecimento de no colchete, 2, sem um S, implica em que o S do colchete

precedente, S2 4 , está ainda em vigor. E realmente isto é correto. Casos tais como [6.9]
são indicados esquematicamente
Rj -----> R 2 *
e são lidos: Se R j, então se R 2 -.
0 comportamento verbal humano frequentemente configura-se numa representação

semelhante a [6.9 j. Quase sempre prefaciamos os nossos comentários com “Escute isso” ,
ou “Ouviu falar desta? ” . Estas proposições introdutórias têm o efeito de captar a
atenção, embora a atenção nem sempre seja revelada por qualquer mudança aparente na
face da nossa audiência, isto é, no nosso ambiente. 0 que acontece, todavia, é que os
nossos comentários subsequentes certamente serão mais observados (isto é, produzirão
conseqüências) se forem prefaciados por táis proposições.
Para assar um bolo somos aconselhados a untar levemente o fundo da forma. Assim,
o bolo não ficará agarrado à fornia quando formos removê-lo. Não podemos ver
diretamente os efeitos do untar a forma uma vez que tenhamos colocado o bolo, mas
podemos observar que a resposta de untar torna possível a resposta de removê-lo.
Em termos mais técnicos, a facilitação é a produção de uma contingência
comportamental através da ocorrência de uma resposta que por si mesrna não produz
qualquer conseqüência ambiental direta.
6.11 CONTINGÊNCIAS NEGATIVAS
As contingências de comportamento são, muitas vezes, especificadas de maneira

negativa. A menos que você beba seu leite, será mandado para cama. Se você não pagar
sua conta de telefone, eles cortarão o seu telefone. Todos os que não votarem serão
severamente repreendidos. Um erro comum é considerar o “não beber” , “não pagar’.,
“não votar” , como Rs. Desde que o comportamento é alguma coisa que o organismo faz,
tais assertivas são claramente uma violação de nossas definições. Uma solução para a
especificação da R está na observação de que o tempo, invariavelmente, tem um
im p o rta n te p apel, em bora frequentem ente camuflado, nessas contingências.
Logicamente, se uma conseqüência ocorrerá para 0 não fazer algo, o administrador da
conseqüência tem que decidir quanto tempo de não fazer constitui o “não fazer” . Assim.
- 137-
o tempo está intimamente ligaao às contingências negativas, porque é sempre alguma
duração de inatividade que produz as conseqüencias.
Ao considerar as contingências negativas, é útil levar em conta todos os
comportamentos possíveis, exceto a R determinada, como uma classe única de
comportamentos. Embora essa classe seja, em geral, muito diversa e não bem
especificada, podemos estar certos de que, pelo menos, não incluirá R como membro.
Para indicar esse conjunto complementar de comportamentos que não inclui R comc
membro, empregamos o símbolo R (lê-se “ R barra”) para referirmo-nos a todos os
comportamentos, exceto R. Desde que, como notamos, é sempre uma certa duração de R
(não executar R) que produz as conseqüências, devemos sempre subscrever um T para R.
Assim, “a menos que paguemos nossa conta de telefone dentro de duas semanas, a partir
do momento em que a recebemos, o telefone será cortado” é diagramado assim
[6.10]
on(ê Sa = recebimento da conta
R = pagar a conta
T = 1 4 dias
Sb = telefone cortado
Note que R não está representada na chave como qualquer comportamento específico.
Todavia, sua R complementar está especificada na chave, embora apareça no diagrama
real apenas por implicação (isto é, se a quantidade de T de R não ocorre, então fT deve
ocorrer). Assim, R é sempre definida em relação a R de modo que uma ou outra deve
ocorrer, mas, evidentemente, ambas não podem ocorrer. Em [6.10 [ se a quantidade T de
R ocorrer, então, o telefone será cortado, mas se.R ocorrer, então nada de especial
acontecerá. Uma vez que R não está representada em [6.10,] isto significa que R está
numa contingência nula com relação a S a e Sg e, realmente, isto é verdadeiro. Não
pagá-la (duas semanas de qualquer coisa, exceto pagá-la) resulta nas conseqüências.
Como um guia geral, observar-se-á, frequentemente, que Sg nessas contingências
negativas, é um evento aversivo ou indesejável. Logo, 6.10 pode ser tido como uma
prescrição para a produção de eventos aversivos. Logicamente, isto significa que é
também uma prescrição para evitá-los e é isto precisamente o que desejávamos notar
quando introduzimos este tipo de exemplo.
6.12 CONTINGÊNCIAS PROBABILISTIC AS
Algumas vezes, as conseqüências S de uma resposta variam. Quando atiramos uma

moeda, nem sempre obtemos o mesmo resultado. Metade das vezes obtemos cara, metade
das vezes, coroa. Este caso é notado pela inclusão de mais de uma seta originando em R e
colocando os valores da probabilidade sobre cada seta. Quando mais de uma seta com
origem em R é empregada desta m a n e ira d o s v a lo re s especificados da probabilidade devem
som ar l. Na moeda não viciada, temos:
- 138-
Em geral, quando o comportamento pode ter um número de conseqüências possíveis,
devemos escrever
indicando a probabilidade de cada conseqüência S sobre sua seta correspondente.

Naturalmente p + q + r + s+...deve somar 1 .
As situações dc estímulo podem também se suceder probabilisticamente. Quando
chove rui segunda-feira, c provável que chova também na terça-feira mas, algumas vezes, o
tempo podo mudar em 24 horas, e, na terça-feira, o sol brilhar:
onde S\ = chuva
T24 = 24 horas
5 2 = dia de sol
5 3 = mais chuva
6.13 DISCRIMINAÇÕES
Em todos os diagramas apresentados supôs-se que o tempo corresse da esquerda para

a direita. Isto é, a sucessão temporal de Ss e contingências era da esquerda para a direita.
(As contingências que reciclam não são exceções, porque a seta que recicla da direita para
a esquerda é meramente uma abreviação para escrever uma série infinita de símbolos à
direita.) A dimensão vertical foi empregada para indicar que os eventos escritos no
mesmo colchete entram em efeito simultaneamente. Em algumas ocasiões, é útil consi
derar várias contingências que poderiam estar em efeito simultaneamente. Assim-,
podemos pretender discutir as contingências que surgem de discriminações simples de
laboratório. Se a luz for vermelha, o macaco deve pressionar a barra para conseguir
alimento; mas se a luz fôr alaranjada, o macaco deve girar uma roda para conseguir o
alimento:
-139-
§
R(vermelha) -r S
4(alimento)
y(pressionar)
S" [6. 11]
R(alaranjado)
(girar a roda)
Em 16.11] nenhuma regra é dada para a ordem do vermelho e alaranjado. Portanto,

nenhuma reciclagem é apresentada. O aparecimento de dois colchetes, um acima do
outro, implica em que., antes do reforçamento, ambas as contingências estarão em efeito.
O diagrama [6.11] também ilustra o fato ôbvio de que mais de uma R pode produzir a
mesma situação.
6.14 R e S FUNCIONALMENTE DEPENDENTES
Os casos complexos de contingências repetitivas podem envolver mais do que uma

simples reciclagem para a situação original. Frequentemente, a situação original é modifi
cada por cada ocorrência do evento resposta. Quando inflamos uma câmara de bicicleta,
cada bombada infla a câmara um pouco mais. Para notar isso, usamos as últimas letras do
alfabeto (u, v, x, y, z) como índices de S, querendo implicar a natureza variável e
inconstante de S. Assim, em
onde Sx = pneu inflado com uma quantidade x

x = uma função de nR
R = inflar
vemos que a quantidade de ar na câmara é uma função do número de Rs que ocorreu. O

diagrama 6.12 é ilusoriamente simples mas um número de casos comuns usam-no como
um elemento. Quando cortamos uma árvore, batemos creme e corremos 100 metros,
cada resposta que executamos, modifica um pouco a situação. Tão logo seja dada uma R,
modificando a situação, outra R pode ser emitida imediatamente modificando-a uin
pouco mais, e assim por diante. Eventualmente, no final, um novo conjunto de contin
gências estará em efeito: podemos colocar a árvore caída num caminhão, o creme em
cima de um pedaço de bolo e podemos receber uma medalha pela nossa velocidade na
corrida.
Algumas vezes, a resposta que produzirá as conseqüências é uma função de algum
aspecto da situação existente. No capítulo 1 ° discutiremos um caso no qual o comporta
mento de procurar resulta na descoberta de um objeto. Mas a direção em que a procura é
efetiva é uma função da localização espacial do objeto. Este é um caso simples onde
tanto a R como o S no mesmo colchete requerem índices variáveis. A forma correta de R
- 140 -
depende de S, mas, a mçjios que o objeto seja encontrado sempre no mesmo lugar, S sera
variável. O diagrama [6.13 (representa este caso
Sc [6.13J
Rj, * S2
onde S2 = objeto na mão

R = procurar
y = direção no espaço
x ” posição do objeto
S = objeto a alguma distância de nos
e y = f(x)
6.15 CONTINGÊNCIAS AGRUPADAS
0 tempo (T) tem sido usado como referência à duração de situações e contingências.
Algumas vezes, é útil representar por um único T a duração de um conjunto inteiro de
contingências. Para indicar essa possibilidade, uma nova facilidade notacional deve ser
desenvolvida. Considere que a época dos morangos vá de março a setembro, isto é, 7
meses. Se você vai à mercearia durante esta época, encontrará morangos anunciados e em
exposição. Se você perguntar se há morangos para vender, receberá uma afirmativa.
Naturalmente, a mercearia não permanece aberta 0 dia todo. A loja abre às 9 horas e fecha
às 18 horas. Aqui, temos dois ciclos de tempo independentes. Primeiro, temos a época
dos morangos que dura 7 meses e a época em que não há morangos, que dura 5 meses.
S(na época) S(fora de época)

T(7 meses) T(cinco meses)
zi
Mas também temos o horário de 9 horas por dia de trabalho da mercearia. Isto é
(9 horas) T( 15 horas) __
[ (mercearia aberta) S(mercearia fechada)
Precisamos conseguir uma maneira de combinar as situações e ciclos de tempo. O diagra
ma 6.14 mostra esta representação. Aqui, os colchetes aparecem agrupados dentro de
colchetes.
- 141 -
0 T 7 meses e o T 5 meses aplicam-se à duração de todas as contingências neles incluídas.
T 2 é incluído apenas para permitir a reciclagem do seu pedido de morangos. Provavel
mente, leva um certo tempo para que você profira as palavras e tenha a primeira caixa em
suas mãos. Então, você pode pedir novamente e receber outra caixa. O exemplo mostra
um agrupamento tríplice. Uma vez que uma e somente uma situação pode estar presente
em qualquer tempo, Sg inclui muitos dos elementos de S\
REFERÊNCIAS PARA O CAPITULO 6

M echner, F. A notation system for the description of behavioral pro
ced u res./ . exp. A n a l Behav., 1959, 2 , 133-150.
Mechner, Vicki. A notation system jor behavioral contingencies: an
instructional program. New York: Basic Systems, 1963.
- 142-
Capítulo 7 REFORÇAMENTO INTERMITENTE
No paradigma do fortalecimento operante, cada membro de uma classe de resposta

selecionada emitido é tipicamente seguido por um estímulo reforçador. Esse paradigma
pode ser efetuado por cientistas do comportamento, pais, professores, amigos ou pela
própria natureza. Sempre que o procedimento de fortalecimento operante é iniciado, o
resultado típico é um aumento na probabilidade da resposta. O reforçamento de cada
membro de uma classe selecionada de resposta, nesse paradigma, é chamado de reforça
mento contínuo (daqui por diante, abreviado por crf). O termo não significa que o
reforçamento esteja continuamente disponível. Ele simplesmente significa que uma con
tingência do tipo R S+ prevalece /Continuamente entre a resposta e o reforçamento.
No mundo civilizado e na selva, as relações entre os comportamentos emitidos e as
mudanças subsequentes no ambiente são frequentemente mais complexas do que o crf.
Em certos dias, muitas vezes por razões obscuras ou desconhecidas, o mesmo comporta
mento que teve êxito em outras ocasiões não o terá. Este caráter fortuito da relação entre
operantes e conseqüências subsequente s.pode ser evitado no laboratório. Aí, controlando
explicitamente o reforçamento dos comportamentos, podemos decidir para os nossos
sujeitos humanos e animais exatamente quais comportamentos de uma série emitida
serão bem sucedidos. De um modo típico, tal controle é descrito na forma de regras.
Essas regras especificam em detalhes as relações que existem entre certas respostas ope
rantes e os estímulos reforçadores subsequentes. As regras são apenas casos especiais das
contingências comportamentais do Capítulo 6 , mas elas incorporam como eventos S
críticos as conseqüências especiais que já denominam os reforçadores.
Os comportamentos humanos nas situações cotidianas revelam ambas as contin
gências: reforçamento contínuo e intermitente. Sob circunstâncias normais, muito do
nosso comportamento é reforçado continuamente. Os interruptores acendem e apagam a
luz com regularidade. Quando ouvimos uma voz e olhamos na direção em que ela vem,
normalmente vemos a face de outra pessoa. Quando perguntamos a um amigo quantas
horas são, regularmente obtemos uma resposta. Exceções ocorrem, mas são tão infre*
quentes que causam surpresa e perplexidade quando acontecem. Em outras situações,
todavia, o reforçamento intermitente é a regra. A paciência do pescador em lançar e
retirar o anzol da água por horas a fio, sem a ocorrência de uma mordiscada, desen
volve-se através de uma história de reforçamento intermitente. No basebol, o refor
çamento sob a forma de uma rebatida é considerado adequado quando em séte entre dez
- 143-
ou mais tentativas o jogador perde a vez. O cinemeiro inveterado, talvez raramente vcj«
um bom filme, mas seu comportamento de ir ao cinema semanalmente permanece forte.
Neste capitulo, analisaremos alguns dos princípios do reforçamento intermitente que
foram isolados no laboratório com sujeitos animais e humanos e mostraremos alguns dos
muitos procedimentos possíveis. ( 1 )
7.1 CONTINGÊNCIAS DE INTERVALO
Como ponto de partida, lembre-se do procedimento de condicionamento e extinção

sucessivos (ver seção 5.5). Tipicamente, este procedimento proporcionava n reforça
mentos contínuos para uma resposta, seguindo-se T horas de extinção. Este ciclo caracte
rístico, consistindo de uns poucos reforçamentos c, depois, uma extinção prolongada,
estendia-se por uma ou mais sessões experimentais. Quando a extinção havia resultado
numa reduçíTo acentuada do responder, o ciclo era repetido. Considere agora uma
variação desse procedimento, consistindo do reforçamento de uma única resposta,
seguido por apenas um minuto de extinção, novamente um segundo reforçamento e
assim por diante. Nessa variação, muitos ciclos de condicionamento e extinção são con
densados em uma única sessão de uma hora. Depois de efetuar este procedimento, surge
um efeito comportamental característico, que se vê estilizada da Fig. 7-1.
Inicialmente, curvas condensadas de extinção, negativamente aceleradas, seguem

cada reforçamento (Fig. 7-1), (parte a). A resposta que produz o reforçamento é freqüen
te mente a última de uma série de respostas cm taxa baixa. Esse quadro, no entanto, é
transitório e depois de um certo número de reforçamentos ter ocorrido, desenvolve-se
uma taxa moderada e estável (parte b). Esta é também uma fase evanescentc, que dá
lugar a uma terceira fase (c), caracterizada por uma pausa depois de cada reforçamento,
pausa esta que é seguida por uma mudança gradual ou abrupta para uma taxa de resposta
aoderadamente alta, mantida até ao final do intervalo de 1 minuto.
As fases transitórias b c c são ilustradas com dados reais na Fig. 7-2. Esta figura repre
senta as sessões 2, 3 c 4 da resposta de bicar o disco (chave) de um pombo, que recebia
alimento de acordo com o procedimento condicionamcnto-cxtinção descrito acima. As
curvas da Fig. 7-2 foram “empilhadas” ; isto c, foram tiradas do seu sistema de coorde
nadas usual e colocadas horizontalmente mais próximas, para economizar espaço e faci
litar a comparação. As taxas reais de resposta em qualquer momento e também o número
de respostas acumuladas emitidas cm qualquer momento podem ser estimados por com
paração com a pequena chave inserida na parte inferior direita da figura.
O procedimento descrito é uma das várias maneiras possíveis em que um experi-
mentador pode programar contingências de reforçamento em relação ao tempo. No caso
em questão, o experimentador estabeleceu um intervalo fixo de tempo entre o último
reforçamento c o restabelecimento da contingência de reforçamento. Até que esse inter
valo fixo tenha passado, nenhuma resposta pode ser reforçada. Tal procedimento fixa o
tempo entre o reforçamento e a próxima contingência de reforçamento e, por isso, é
apropriadamente denominado um esquema de Intervalo Fixo (abreviado por IF). Note,
todavia, queo intervalo de tempo entre o recebimento de quaisquer dos reforçamentos
reais nao c fixo.
- 144-
Reforçamento (tempo)
Figuro 7-1.. Curva estilizada da transição do crf para reforçamento intermitente em

intervalos periódicos fixos. O uso de ti para rotular a abeissa sugere que os segmentos
sucessivos de resposta devem estar associados nào com reforçamentos sucessivos, mas,
(1) Faz-se necessária uma palavra a respeito do delineamento dos experimentos sobre
reforçam ento interm itente discutidos neste capítulo. É típ ic o desses experimentos que os
sujeitos sejam inicialm ente treinados num esquema c rf de reforçam ento. Somente
q u a n d o uma taxa estável de resposta é estabelecida sob as condições c rf o
e x p e r im e n ta d o r in tr o d u z as in te rm itê n c ia s desejadas.
- 145-
Embora o valor mínimo deste intervalo seja o tempo fixo entre um reforçamento e o
estabelecimento de uma contingência, seu valor real depende de quão rápido a resposta
ocorre depois que a contingência entra em efeito. O elemento básico aparece em notação,
assim
(fixo) —> R —> S*
Os eteitos principais de um esquema em intervalo fixo (IE ), imposto após um crf

podem ser resumidos da seguinte maneira:
1 . O comportamento do indivíduo mostra um ajustamento gradual ao procedi
mento, que se nota através das mudanças no padrão da taxa de resposta. Já discutimos
este efeito.
2 . O padrão que emerge no final tem a forma de ondas (ondulado). Num esquema
IF, o reforçamento c seguido por um período subsequente de não reforçamento. Uma
longa história passada neste estado de coisas faz com que o animal pause por um tempo
apreciável apôs um reforçamento. Essa cessação do responder é uma conseqüência
natural do fato de que, no passado, uma resposta após o reforçamento numea foi refor
çada. É uma forma de extinção discriminada, que será esclarecida mais tarde, quando
discutirmos o processo comportamental da discriminação.
3. O comportamento pode ser mantido indefinidamente em IFs de apenas poucos
segundos até IFs de várias horas de duração.
DIA
24 68 144
O O O
Figura 7-3. t-stágios no desenvolvimento do comportamento num esquema 11* 30 min.

Dados de int 'rretorçamento selecionados são apresentados para os dias indicados. O
número à esquerda de cada segmento indica o número ordinal do reforçamento que
termina este segmento (segundo Cummine e Schoenfeld, 1958).
-146-
Num experimento, pombos famintos foram expostos 16 horas por dia a contin
gências de reforçamento com alimento em IF -3 0 min, em 144 dias consecutivos, repre
sentando uma história experimental dc mais de 1.300 horas. O comportamento de bicar a
chaye foi mantido através do experimento e verificou-se a natureza transitória de certos
efeitos de IF Na Fig. 7-3, as mudanças no padrão de resposta são ilustradas através do
registro de comportamento de um animal durante intervalos interreforçamento selecio
nados, obtido nas sessões 24, 68 e 144. A mudança progressiva de uma ondulação gradual
para uma ondulação abrupta é evidente.
IR 4 min
Figura 7-4. Registros cumulativos de animais em IR 4 min, obtidos nas sessões iniciais
(4a. ou 5a.) e Finais (15a., 17a. ou 20a.) (Millenson, 1963).
Contingências em IF não são raras na vida cotidiana. O conteúdo de uma panela
ferve, aproximadamente, após um certo tempo fixo que o calor é aplicado. Os ônibus que
andam no horário reforçam a espera dos passageiros no ponto em intervalos fixos. O fato
dc o IF não manter um nível constante de comportamento num período de tempo é,
com freqüência, um obstáculo importante para o seu uso no controle prático do compor
tamento. Em cursos universitários, onde a principal contingência estabelecida é um
exame final, muitos estudantes trabalham muito pouco durante o curso. Poucos dias
antes do exame final, ocorre um frenesi de atividades.
Suponha que os intervalos de tempo entre o reforçamento e a próxima contingência de
reforçamento tenham durações aleatórias e sejam imprevisíveis. O resultado é um novo
tipo de procedimento chamado esquema de Intervalo Randômico (IR). Este esquema
pode ser especificado apenas pelo intervalo médio entre o reforçamento e o restabele
cimento da contingência. Para dar alguma indicação da variação em intervalos que pode
ser encontrada, num esquema de IR 1 min, por exemplo, cerca dc 95% dos intervalos
entre o reforçamento e as contingências de reforçamento cairão na faixa de 0 a 2
minutos. A exposição inicial a um procedimento IR após uma história em crf, produz
somente os dois primeiros estágios de transição descritos para a IF na Fig. 7-1. O resul-
- 147 -
tado final em IR é uma taxa de resposta estável e uniforme, cujo registro cumulativo não
apresenta desvios sistemáticos de uma linha reta (ver Fig. 7-4).
Figura 7-5. Registros cumulativos de respostas para esquemas IV de deflexôes de

ponteiro, com intervalos médios, de 15 seg, 30 seg, 1 min e 2 min, respectivamente.
Todos os registros sâo do mesmo sujeito. Km cada caso, o registro apresentado foi feito
depois de sessões prévias no esquema (Holland, 1958).
Aproximações de esquemas IR são frequentemente encontrados fora do laboratório.

Os operadores de radar que observam o osciloscópio para detectar sinais infrequentes
encontram-se numa intermitênciasimilar ao esquema IR, Sua resposta ó o comportamento
de observar; o reforçamento é a descoberta de um sinal. Um caso similar ocorre quando
um operador tem de observar o marcador para detectar deflexôes infrequentes, mas
críticas. Nesses exemplos, pode-se pressupor que o comportamento visível de observar
- 148 -
segue as leis do comportamento operante, mas ele nem sempre é facilmente medido. No
procedimento de Holland (1958), sujeitos humanos foram instruídos a examinar um
marcador e relatar (pela pressão de uma chave telegráfica) cada deflexão observada a
partir de um ponto zero. Ambos, marcador e sujeito, todavia, estavam num quarto escuro
e o marcador podia ser visto somente após a pressão de uma segunda chave telegráfica
que fornecia iluminação por uma fração de segundo. Deste modo, Holland estabeleceu
um operante convenientemente mensurável que se correlacionava com o comportamento
de “ observar” do sujeito; para olhar o marcador, o sujeito tinha que pressionar uma
chave. Para colocar o comportamento de pressionar a chave sob um esquema similar ao
de intervalo randômico, o experimentador programou deflexões no ponteiro (reforça
mentos) separadas por diferentes intervalos de tempo. Os intervalos não eram propria
mente randômicos, mas tinham durações variadas. O procedimento é um exemplo do que
é chamado um esquema de Intervalo Variável (TV). Sob as condições de Holland, o
esquema manteve taxas de pressionar a chave (resposta de observação) superiores a uma
resposta por segundo. Holland pesquisou os efeitos da mudança do intervalo médio entre
asdeflexões programadas do ponteiro. Começando com um intervalo médio de 15 seg,
ele aumentou progressivamente o intervalo médio para 30 seg, 1 min e, finalmente, 2
min, em várias sessões consecutivas. A fig. 7-5 mostra os resultados obtidos com um de
seus sujeitos, um homem alistado ha Marinha dos Estados Unidos. Os padrões de taxa
observados estão de acordo com qs estudos animais sobre os efeitos comportamentais
deste esquema (Ferster e Skinner, 1957). Os resultados de Holland na Fig. 7-5 indicam,
além disso, que o IV produz uma taxa de resposta que tende a aumentar à medida que o
intervalo médio entre as deflexões (reforçamentos) diminui. Uma implicação interessante
desta descoberta é que, se as deflexões forem transitórias (isto é, se durarem apenas
pouco tempo), então menos deflexões serão perdidas (isto é, mais serão observadas)
quando o intervalo médio entre elas for pequeno. Então, um homem que observa uma
tela de radar onde os sinais raramente ocorrem tem uma boa chance de perder um sinal
transitório crítico quando este aparece , porque é provável que sua taxa de observação
seja baixa. Os resultados da Fig. 7-5 sugerem a possibilidade de se inserir sinais artificiais
suplementares para manter a taxa de observação alta, ao nível que assegurará a detecção
de todos os sinais críticos.
7.2 PROBABILIDADE DE REFORÇAMENTO
Um esquema de reforçamento pode ser provisoriamente definido como um procedi

mento ou plano que determina quando e por quanto tempo uma contingência de reforça
mento estará em efeito. Como tal, ele deve ser estabelecido e mantido por um experi
mentador. Um esquema de reforçamento é, assim, um fenômeno de laboratório. Embora
haja esquemas que se assemelhem a algumas intermitências de reforçamento vistas na
natureza, o conceito de esquema é independente dessas comparações e tem implicações
que vão muito além delas. Um esquema de reforçamento pode ser considerado um caso
idealizado de uma intermitencia de reforçamento.
Um esquema de reforçamento é fundamentalmente uma especificação da probabi
lidade 'de reforçamento para uma resposta selecionada em determinadas ocasiões. Na
seção anterior, apresentamos contingências que programavam muoaiiças apartir de, epan
valores extremos de probabilidade, 0 e 1. Evidentemente, extinção é outro nome para o
valor extremo, probabilidade de reforçamento = 1. Nos esquemas de intervalo discu
tidos acima, foram estabelecidas contingências que especificavam uma probabilidade de
- 149 -
reforçamento 1 , após intervalos fixos, randômicos e variáveis, durante os quais essa
probabilidade era 0. Mas o campo dos esquemas dc refo.çamento não é, de modo algum,
restrito a misturas temporais, embora complexas, dos extremos superiores e inferiores da
probabilidade de reforçamento.
É possível, por exemplo, construir um esquema no qual a probabilidade de reforça
mento para uma determinada resposta seja a mesma o tempo todo. Certas situações da
vida real aproximam-se desses esquemas de probabilidade constante ou uniforme de
reforçamento. Os resultados de se atirar uma moeda não viciada ocorrem em tais
bases probabilísticas. Numa aposta, por exemplo, uma série de lançamentos pode ser
feita e eventualmente obtém-se o reforçador desejado, digamos, cara. Todavia, a cara
pode não aparecer em um grande número de lançamentos, embora a probabilidade de se
obter cara, em qualquer lançamento, seja uniformemente constante e igual a 1/2. A
Tempo (minutos)
Figura 7-6. Taxas dc respostas acumuladas quando o bicar c reforçado num esquema dc
probabilidade* uniforme (dados de J. Farmer).
- 150 -
imprevisibilidade de um lançamento de moeda é característica da probabilidade uniforme
dc contingências de reforçamento. Apostar e jogar, em geral, são realmente probabilís-
ticos deste modo. Se o bom tempo é tido como um reforçador e o comportamento de ir
ao piquenique é efetuado, o reforçamento ocorre probabilisticamente. Podemos
consultar o departamento de meteorologia para confirmar o número de dias bons previs
tos para junho. Mas, embora a probabilidade de que faça bom tempo possa ser muito
alta, nosso comportamento de ir ao piquenique pode, ainda assim, não ser re fo rç a d o com
um dia bom.
Geralmente, partimos do princípio de que, em qualquer período de tempo determi
nado, é vantajoso para o indivíduo ganhar tantos reforçamentos quanto possível. Na
extensão em que esta generalização é verdadeira, diante de um esquema de probabilidade
uniforme a melhor estratégia é responder tão frequentemente quanto possível. Se somos
pagos para achar conchas bonitas numa praia, quanto mais conchas examinarmos, mais
conchas bonitas encontraremos. Isto é verdadeiro seja qual fôr a probabilidade de encon
trar conchas bonitas. Algumas praias podem permitir-nos uma probabilidade mais alta do
que outras, mas, em qualquer praia, será vantajoso para nós examinar tantos espécimes
quanto possível . Outro modo de dizer isto seria afirmar que é vantajoso que o nosso
comportamento de examinar/tenha a máxima taxa possível.
Um pombo faminto, exposto a um esquema de probabilidade uniforme de reforça
mento com alimento desta natureza, rapidamente se ajustará a uma estratégia ótima, se a
probabilidade fixada não foi muito baixa. O esquema gera taxas de resposta extrema
mente altas ("Brandauer, 1958).
A figura 7-6 é uma amostra de alguns resultados típicos obtidos neste esquema, onde
a probabilidade de receber alimento por bicar era de 1/25. Em alguns momentos na Fig.
7-6, o pombo estava bicando a uma taxa de três por quatro respostas por segundo p o r
oeríodos consecutivos. Quando Sidley e Schoenfled (1964) expuseram pombos a vários
valores de probabilidade dc reforçamento variando de 1 até 1/160, obtiveram a interes
sante função da Fig. 7-7. Fm seu estudo, a taxa total de respostas foi maior quando a
2.50-
fz.oo1
I 1.50-
O
8 1.0 0 -
od
0.50
0 V 10 l' * ~ 0.1000 0.0500 0.0250 00125 0 0068
1 igura 7-7. 1'axas totais dc resposta em função da probabilidade de reforçamento

(segundo Sidley e Sclioenfeld, 1964).
probabilidade dc reforçamento era 1/10. Probabilidades de reforçamentos superiores c

inferiores a 1 / 10 , levaram a uma redução na produção, o que não representa uma estra
tégia ót ima.
- 151 -
1.3 NOTAS TEÓRICAS SOBRE ESQUEMAS DE REFORÇAMENTO
Podemos resumir a importancia sistemática das seções 7.1 e 7.2 pela observação de
que um esquema é um conjunto de regras que especificam: ( 1 ) quando estabelecer uma
contingência de reforçamento; (2) quanto tempo mantê-la em vigor; (3) qual valor da
probabilidade de reforçamento atribuir a ela. Quando as variações nessas três condições
são permutadas com os diversos parâmetros de resporta a serem discutidos no próximo
capítulo, as possíveis variações de procedimento para manter operantes tornam-se
enormes. Pressionados no sentido de economizar representações, os teóricos têm desen
volvido representações tais como as da Fig. 7-8 para descrever e relacionar os vários
Probabilidade uniforme
^ de 1/5___________
j___ •___ t___ j___ I___ |
Figura 7-8. Probabilidade dc reforçamento para uma resposta em função do tempo

desde o reforçamento anterior.
esquemas. Na Fig. 7-8, a probabilidade de reforçamento para uma resposta é dada em

função do intervalo pós-reforçamento para cinco dos esquemas que consideramos.
(Devemos notar, entre parênteses, que um acordo universal sobre qual a melhor repre
sentação de esquemas ainda não foi conseguido entre os pesquisadores neste campo. Ao
consultar a literatura, o estudante avançado deve, assim, estar preparado para encontrar
outras maneiras de conceituação dos procedimentos deste capítulo e do Capítulo 8 ).
A tareia de descrever ou especificar um vasto número de procedimentos de reforça
mento em termos de poucas variáveis manipuláveis é um de dois problemas relacionados
na análise teórica de esquemas. O outro problema está na explicação de como os
esquemas geram seus efeitos característicos na taxa de resposta. Skinner (1953) salientou
que os esquemas são apenas maneiras aproximadas de reforçar taxas de resposta. Isto é.
- 152-
os esquemas trequentemente sâo programados de modo a liberar reforçamentos numa
ocasião cm que o indivíduo, provavelmente, estaria respondendo como um certo tipo de
taxa, alta ou baixa, dependendo do esquema particular, Dc acordo com a lei familiar do
fortalecimento operante, o comportamento que ocorre imediatamente antes do reforça
mento tem sua probabilidade aumentada ou mantida. Nossa analogia com a concha
levou-nos à conclusão dc que, num esquema de probabilidade uniforme, por exemplo,
quanto mais alta a taxa dc resposta, tanto mais provável torna-se um reforçamento num
determinado intervalo curto dc tempo. Neste tipo de esquema, então, uma taxa alta de
resposta frequentemente precederá o reforçamento.
Os esquemas de intervalo, logicamente, apresentam, no conjunto, uma contiguração
diferente. Nestes, admitindo-se que o organismo responda pelo menos uma vez por
intervalo, taxas mais altas não aumentam a probabilidade do reforçamento. Isto porque o
restabelecimento da contingência dc reforçamento no intervalo é independente do com
portamento do animal. Ela é estabelecida por um relógio no caso de um esquema IF, e
por um contador Geiger ou outra fonte aleatória no caso do esquema IR.
Nada que o animal faça pode apressar a liberação do reforçamento. De fato, quanto
mais tempo o organismo esperar antes dc responder, maior a probabilidade de reforça
mento quando finalmente ele responder. Num esquema IF por exemplo, a probabilidade
de reforçamento c igual a 1 /se o organismo esperar todo o período de IF^ antes de
responder (veja o painel IF, Fig. 7 -8 ). Essas relações entre esperar c, então, responder,
sugerem que os esquemas dc intervalo agem dc modo a retardar a taxa dc resposta.
7.4 OS EFEITOS DO REFORÇAMENTO INTERMITENTE NA RESISTÊNCIA À

EXTINÇÃO
O reforçamento intermitente, quando comparado ao crf, leva a um aumento substan

cial na resistcncia à extinção da resposta selecionada. Assim,os esquemas de reforçamento
fornecem uma técnica importante para aumentar a persistência comportamental. Depois
do reforçamento contínuo da pressão à barra ou do bicar uma chave, a curva típica de
extinção alcança os critérios dc extinção comumente empregados por volta de uma hora,
durante a qual, na maioria dos casos, apenas poucas centenas de respostas são emitidas.
Por outro lado, na Fig. 7-9, os registros dc um animal após uma história dc intervalo
variável .(IV) dc reforçamento indicam que uma assíntota de mais que 3.000 respostas
eslá sendo gradualmente alcançada depois dc 8 horas.
Figura 7-9. Fxtinção após IV (Skinner 1 5 0 )
- 153-
Os esquemas de probabilidade uniforme de reforçamento também produzem maior
resistência à extinção do que crf. Um experimento feito por Weinstock (1954) dizia
respeito à extinção do comportamento após valores diferentes de probabilidade de refor-
çamento no treinamento. Um aparelho com uma pista, semelhante ao visto na Fig. 7-10
Porta que fecha
foi empregado. Em tal aparelho, um animal é colocado na caixa de partida, a porta é

aberta no momento apropriado e um cronômetro começa a funcionar. Quando o animal
entra na caixa objetivo, onde pode encontrar alimento, o cronômetro para e o animal é
removido quando se deseja. Essa seqüência de eventos é chamada uma tentativa. Uma
vez que a téntativa realmente continua até que o animal, finalmente, vá até a caixa
objetivo, a freqüência de resposta não é uma medida adequada do comportamento
nestas circunstâncias. O tempo que é gasto para o animal ir do início até a caixa
objetivo, todavia, é relevante e facilmente mensurável. Essa medida é um caso do que
chamaremos tempo de reação. Ela contém certas similaridades com a latência, uma vez
que é o tempo entre uma mudança ambiental (a porta é aberta) e uma resposta
(entrada na caixa objetivo). Mas, a latência é reservada para uma descrição de
respondentes e o tempo de reação é reservado para a descriação de operantes
Weinstock (1954) treinou 4 grupos de ratos a correrem num aparelho similar ao da
Fig. 7-10. A cada grupo foi dada uma de quatro probabilidades fixas diferentes de
encontrar alimento na caixa objetivo, p - 1,0: 0,8; 0,5 e 0,3. Assim, o grupo 1,0 encon
trava alimento em cada tentativa (crf), o grupo 0.8 encontrava-o em 80?£ das tentativas, c
assim por diante. Depois que todos os animais haviam sido treinados a correr, aparente
mente, na sua velocidade máxima, iniciou-se a extinção, retirando-se o alimento da caixa
objetivo. Apenas uma tentativa era efetuada por dia. Os resultados indicam que o grupo
1,0 foi o mais rápido para extinguir, isto é, após poucas tentativas(4 ou 5), esses animais
passaram a gastar muito tempo para atravessar a pista, se é que chegavam a fazê-lo. A
ordem da extinção seguiu a ordem inversa da probabilidade. Quanto menor a probabili
dade, mais tempo persistiu o comportamento condicionado de correr. O grupo 0,3 foi o
-154-
que levou mais tempo para que seu comportamento de correr fosse enfraquecido pela
extinção. Na faixa das probabilidades pesquisadas, portanto, a diminuição da probabili
dade de reforçamento aumentou a resistência à extinção, medida pela volta da veloci
dade do correr ao nível operante. Note que esta proporcionalidade inversa não pode ser
mantida abaixo de algum valor mínimo de probabilidade porque, se a probabilidade de
reforçamento se torna muito pequena (aproximando-se de 0 ), o fortalecimento original
será impossível.
Por que as contingências intermitentes aumentam a resistência à extinção? Uma
explicação prende-se à observação de que, depois de uma história de reforçamento inter
mitente, a extinção não parece muito diferente do procedimento de fortalecimento real.
Durante um reforçamento intermitente de qualquer tipo, ocorrerão períodos de extinção
quando nenhum reforçamento estiver disponível para a resposta. Nesse sentido, toda a
história de reforçamento intermitente do animal lhe diz que um período de extinção
leva, eventualmente, ao reforçamento. Na verdade, o esquema ensinou perseverança ao
animal.
7.5 OUTROS EFEITOS COMPORTAMENTAIS DO REFORÇAMENTO INTERMI
TENTE /
Os esquemas de reforçamento são, obviamente, procedimentos que manipulam taxas
de resposta. É bastante surpreendente que a maioria de nossas informações sobre seus
efeitos comportamentais seja derivada de análises de taxas de resposta durante e em
seguida à exposição a eles. Ainda assim, é válida a questão de como tais procedimentos
afetam a constelação total de comportamentos de um indivíduo. Uma resposta parcial
poderia ser na forma de proposições que descrevem como os esquemas afetam proprie
dades do comportamento tais como a topografia da resposta, a magnitude da resposta a
ordem seqüencial do responder, etc.
Lane e Shinkman (1963) estudaram os efeitos de um esquema IVsobre a amplitude
e duração do p ia r no pinto. Este operante foi inicialmente fortalecido pelo reforça
mento de cada piar no pinto, por um pintinho faminto, com uma breve apresentação de
alimento. Seguindo-se esse treino, o piar foi reforçado intermitentemente num esquema
de IV 100 segundos. Na fase final do experimento, o piar foi extinto. Os resultados
mostraram que a duração e amplitude da resposta de piar eram altamente estereotipadas
durante o crf, tomando-se significativamente mais variáveis durante o procedimento IV
Mas a extinção produziu um nível ainda mais alto de variabilidade nas medidas das
respostas.
Quando a duração da pressão à barra de um rato foi analisada sob esquemas de
probabilidade uniforme, notou-se que ela era extremamente estereotipada sob crf, algo
mais variável durante contingências de probabilidade uniforme e extremamente variável
na extinção (Millenson, Hurwitz e Nixon, 1963).
Os dados parecem apoiar a generalização de que a variabilidade de comportamento
parece aumentar progressivamente sob condições de crf, esquemas intermitentes e extin
ção, nesta ordem.
7 6 ESTADOS ESTÁVEIS DO COMPORTAMENTO
Na maior parte de nossa análise precedente do comportamento, enfatizamos a impor

tância de certos procedimentos comportamentais e dos processos comportamentais carac
-155-
terísticos associados a eles. Desta maneira, examinamos os processos de condicionamento
Pavloviano e operante e da extinção. Neste capítulo vimos que os estados transitórios —
que são os produtos iniciais da exposição a esquemas de reforçamento —constituem um
conjunto distinto de processos comportamentais. Embora tais processos sejam impor
tantes no estudo do comportamento, seus pontos finais são, pelo menos, de igual impor
tância. Assim, um reforçador é definido tanto em termos de sua capacidade de manter
0 compoitamento nos padrões característicos do esquema como em termos de sua capa
cidade de aumentar as taxas de respostas durante o processo de fortalecimento operante.
A manutenção do comportamento por contingências intermitentes aproxima-nos dos
nossos próprios comportamentos cotidianos, muitos dos quais foram fortalecidos ou
adquiridos no passado remoto e mantidos, daí em diante, por reforçamento intermitente.
No laboratório, esta manutenção permanente do comportamento pode ser melhor
descrita pelos chamados estados estáveis. As medidas comportamentais atingem estados
estáveis ao final de seu “ processo’' ou aspecto transitório. Por exemplo, as curvas da
sessão 144 da Fig. 7-3, provavelmente, representam um estado estável do comportamento
sob as contingências de IF Similarmente, as curvas de IV da Fig. 7-5 parecem ser
representativas do desempenho final nesses tipos de esquemas. Um esquema IV ou IR
pode gerar taxas estáveis moderadas de resposta por longas sessões, dia após dia, indefini
damente.
O fato de que os esquemas podem levar a estados estáveis de comportamento, que
podem ser mantidos indefinidamente, sugere que esses estados podem servir como
linhas-base adequadas, a partir das quais pode-se avaliar os efeitos de numerosas variáveis
sobre o comportamento. A noção de uma linha-base é bastante familiar. O nível operante
foi usado como linha-base para determinar se o fortalecimento de uma resposta ocorreu.
Podemos usar um desempenho que está sendo mantido no momento por um esquema
como uma linha-base. Em capítulos posteriores, os efeitos das mudanças de estímulo,
contingências interpoladas e de outros procedimentos em tais linhas-base ajudarão a
definir muitos conceitos psicológicos importantes. Como uma ilustração da técnica geral,
devemos nos contentar, no momento, com uma demonstração do efeito de uma droga
tranquilizante sobre o comportamento estável. Dews (1955) estudou o efeito do pento
barbital no responder estável de pombos em IF Depois de ter exposto os pombos às
contingências IF 15 minutos o bastante para o surgimento de um padrão estável, Dews
injetou pequenas quantidades de droga nos animais durante certas sessões. Observou,
então, os efeitos no padrão de IF Neste experimento, a variável independente foi a
quantidade de droga injetada e a variável dependente foi a mudança no comportamento a
partir do estado normal cm IF (ver Figs. 7-2 e 7-3). Para estar certo de que qualquer
efeito observado pudesse ser atribuído apenas à droga e não ao distúrbio causado pela
propria injeção, uma solução salina foi injetada nos animais em outras sessões Até um
certo nível de concentração de droga, Dews não observou efeitos no comportamento — o
desempenho continuou semelhante aquele sob o IF normal. Com concentrações acima de
1 mg de pentobarbital, ocorreu uma mudança significativa. A taxa total foi reduzida em
cerca de 75%, e a ondulação característica do IF foi praticamente perdida, sendo substi
tuída por uma taxa de resposta constante e muito baixa através do intervalo fixo.
Este é um exemplo relativamente simples dc uma sub-areada ciência do compor
tamento aplicada muito ampla e em expansão, conhecida como psicofarmacologia — o
estudo da ação de drogas no comportamento. Muitas firmas farmacêuticas mantêm atual
mente laboratórios comportamentais exclusivamente para o estudo dos eteitos de novas
-156-
drogas no comportamento animal. Na exploração de uma nova droga, muitas linhas-base
devem ser usadas. Uma droga não afetará todos os padrões de comportamento da mesma
forma. Até aqui, não mencionamos muitos estados de línha-base, mas os seguintes pro
cessos que estudamos terminam em estados estáveis estatísticos, que podem ser usados
como linhas-base:
L Esquemas de intervalo
2. Esquemas probabilísticos
3. Condicionamento e extinção sucessivos
4. A própria extinção
5. A seqüência comportamental vista em elos simples de comportamento
6. A topografia e magnitude do comportamento sob crf.
REFERÊNCIAS PARA O CAPÍTULO 7

Brandaucr, C. M. The effects of uniform probabilities of reinforcement
on the response rate of the pigeon. Unpublished doctoral disserta
tion, Columbia Univer.,/1958. -
Cumming, W. W., and Schpenfeld, W. N. Behavior under extended ex
posure to a high-value fixed interval reinforcement schedule. /. exp.
Anal. Behav., 1958, 1, 245-263*.
Dews, P. B. Studies on behavior. I. Differential sensitivity to pentobarbital
of pecking perform ance in pigeons depending on the schedule of
reward. J. Pharmacol, exp. Ther., 1955, 113, 393-401.
Ferster, C. B., and Skinner, B, F. Schedules of reinforcement. New Y ork:
A ppleton-Century-Crofts, 1957.
Holland, J. G. H um an vigilance. Science, 1958, 128, 6 1-67.
Lane, H. L., and Shinkman, P. G. Methods and findings in an analysis
of a vocal operant. J. exp. Anal. Behav., 1963, 6 , 179-188.
Millenson, J. R. Random interval schedules of reinforcement. J. exp.
Anal. Behav., 1963, 6 , 437-443.
Millenson, J. R., Hurwitz, H. M. B., and Nixon, W. L. B. Influence of
reinforcement schedules on response duration. J. exp. Anal. Behav.,
19ul, 4, 243—250.
Sidley. N. A., and Schoenfeld, W. N* Behavior stability and response
rate as functions of reinforcement probability on “random ratio”
schedules. J . exp. Anal. Behav., 1964, 7, 281-283.
Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950,
57, 193-216. ~
Skinner, B. F. Science and human behavior. New Y ork: M acmillan, 1953.
Weinstock, S. Resistance to extinction of a running response following
partial reinforcement under widely spaced trials. J . comp, physiol.
Psychol., 1 9 5 4 ,4 7 ,5 1 -5 6 .
- 157-
Capítulo 8 A ESPECIFICAÇÃO DA RESPOSTA
Nas seções precedentes, limitamos nossa análise sobre a modificação comportamental

àquelas mudanças dos comportamentos que já existiam com alguma força maior que zero
antes do condicionamento. Agora é o momento de abandonar esta restrição simplificado-
ra e arbitrária do paradigma de condicionamento operante, verificando como um novo
comportamento, não existente antes no repertório do indivíduo, é adquirido. Antes de
proceder ao estudo deste processo de aquisição, entretanto, é necessário uma explicação
adicional do termo resposta operante e seus componentes.
8.1 A DEFINIÇÃO DE CLASSES DE RESPOSTA
Uma das razões pelas quais a ciência do comportamento demorou a se desenvolver,

baseia-se na própria natureza de seu objeto. Ao contrário do tecido renal, cristais jde sais,
baterias, o comportamento não pode ser facilmente retido para observação. Em vez disso,
os movimentos e ações dos organismos parecem fluir numa corrente contínua, sem início
e fim definidos. Quando um rato se move da frente para o fundo de sua gaiola, quando
você dirige seu carro 400 km sem parar, quando você prega um botão,é difícil identificar
pontos na correnie comportamental contínua, onde as unidades naturais do comporta
mento possam ser consideradas fracionadas. Uma complicação adicional é que nãohá
duas ações de um organismo que sejam exatamente iguais, porque nenhum comporta
mento é repetido exatamente.
O problema da conceituação das unidades fundamentais de uma corrente comporta
mental contínua, não repetitiva, baseia-se na própria estrutura da ciência. Para submeter
o comportamento a uma análise científica — isto é, de modo a ser possível predizê-lo e
controlá-lo — precisamos dividir nosso objeto de estudo de tal modo que alguma coisa
fixa e reproduzível possa ser conceituada. Os métodos da ciência são reservados para
eventos reproduzíveis. Tanto o termo evento como seu qualificador reproduzível são
conceitos científicos básicos. Temporais, cargas elétricas, fluidos, moléculas, planetas,
instituições sociais, etc; são a matéria prima das ciências. Embora dois temporais e dois
governos democráticos não sejam exatamente iguais, é necessário agrupar eventos seme
lhantes, embora não idênticos, numa única classe e chamá-los “ temporais” ou “governos
democráticos” . Através do uso de tais artifícios, não somente a meteorologia e a ciência
política, mas todas as ciências, estabelecem conceitos em termos dos quais se enquadram
- 159 -
suas leis, generalizações e, previsões. A conceituação dc comportamento em termos de
tais classes, análogas aos conceitos de classe dc outras ciências, é, assim, uin
pré-requisito para uma ciência do comportamento capaz de descobrir leis, fazer
generalizações e previsões.
Em se tratando do comportamento, podemos algumas vezes iniciar, classificando
numa única categoria um conjunto de comportamentos que são correlacionados com o
mesmo estímulo. Assim, podemos observar as flexões sucessivas da perna, em resposta a
um toque bem definido no joelho e, embora notando suas diferenças, decidir chamar de
resposta patelar à classe (conjunto) de todos os movimentos que ocorrem com uma
duraçüo entre os limites de 1/5 a 1 seg. e que caem numa faixa de ângulos ( a ) de 5 a 30
graus (ver Fig. 8-1). Ao admitirmos essa classe, nossa esperança é incluir todos, ou quase
todos os comportamentos que estão de fato correlacionados com este eliciador parti
cular. Obtivemos os movimentos sucessivos através da eliciação repetida, usando o
mesmo estímulo eliciador com intensidade, duração e localização fixas, e assim por
diante Embora a classe, que é assim formada, pareça ser um agrupamento de movi
mentos aparentemente semelhantes, sua definição formal é apenas a classe de movi
mentos que ocorre a um dado estímulo.
Figura 8-1. Diagrama esquemático da faixa de movimentos que inclui todos os compor
tamentos que são chamados “ Reflexos Patelares” .
Tal classe é, naturalmente, um respondente e, neste caso, ela define o respondente

patelar.
Para definir estas classes de comportamento, é necessário conceituar certas dimen
sões através das quais os comportamentos possam ser descritos e medidos. Da mesma
forma que uma mesa é exaustivamente descrita através da medida de sua largura, compri
mento, altura, número de pés, cor, peso, densidade da madeira, número de gavetas e
assim por diante, assim também uma amostra de comportamento pode ser exausti
vamente descrita pela medida da posição e. orientação do organismo em referência a
partes de seu ambiente, os movimentos que estão ocorrendo, o período de tempo que
eles preenchem, a intensidade e freqüência com que ocorrem e assim por diante. Mesas
particulares e amostras particulares de comportamento podem, então, ser descritas por
sua configuração única de valores dimensionais. Parece, assim, que as classes de “mesas” e
de “ amostras comportamentais do tipo X” são determinadas pelo estabelecimento de
- 160 -
restrições, limites e condições ao longo de certas dimensões, de modo que todas as
“ coisas” que desejarmos chamar mesas e comportamentos do tipo X, respectivamente,
incluir-se-ão, com certeza, nessas classes. Assim, as mesas deveriam ter, digamos, um ou
mais pés (uma condição), deveriam ser feitas de material sólido, ao invés de líquido ou
gasoso (uma restrição), ter uma superfície plana (uma restrição), ter um comprimento
maior que 30 cm e menor que 35 m (um limite), e assim por diante. Da mesma forma, os
comportamentos do tipo X poderiam incluir, digamos, qualquer movimento para baixo
(uma restrição) do braço esquerdo (uma condição) que esteja entre 15 a 100 gramas de
força (um limite) e que não exceda a 1/2 seg. de duração (uma restrição) e assim por
diante.
Mencionamos exemplos de dimensões do comportamento tais como posição,
duração e força da resposta, em seções anteriores. Essas dimensões foram usadas para
descrever a variabilidade de comportamento no nível operante, fortalecimento, extinção
e esquemas de reforçamento. Algumas dimensões como posição, ângulo, localização e
orientação do comportamento são chamadas dimensões topográficas, uma vez que uma
relação de seus valores em qualquer momento determinado especificará a forma exata do
comportamento. A especificação do valor dessas dimensões, em qualquer momento
determinado, dá o tipo de informação fornecida por uma fotografia do organismo surpre
endido em ação. Tendo apreendido a forma estática do comportamento através das
variáveis topográficas, podemos usar as dimensões dinâmicas tais como a velocidade,
força, duração e taxa de repetição do comportamento para descrever, ainda mais, uma
amostra particular do comportamento. Em princípio, uma amostra de comportamento
poderia ser completamente descrita por uma especificação dos valores de todas as
dimensões pertinentes ao comportamento. Esta descrição, em relaçio a uma e-xplicação
mais completa, estaria, sem dúvida, precisamente na mesma relação que há entre um
instantâneo e um filme. Na prática, uma descrição exaustiva do comportamento rara
mente é tentada. Quando a topografia ou forma é de interesse principal, deve-se recorrer
ao uso de dispositivos para fotografar o comportamento, mas uma análise quantitativa de
uma ou duas dimensões comportamentais representativas será, em geral, preferida. No
caso do reflexo patelar, a especificação da classe de comportamento em termos de apenas
duas dimensões parece suficiente para uma aproximação adequada. Uma dessas
dimensões constitui o ângulo da perna em relação à posição de descanso; a outra
dimensão é a duração do movimento. Em geral, a especificação experimental de um
fragmento do comportamento nunca é mais que parcial, sendo que os valores de muitas
dimensões ficam indeterminados.
Para formar as classes ou unidades para expressar as leis, generalizações e previsões
do comportamento emitido, uma estratégia diferente daquela usada para definir respon
dentes deve ser adotada. No comportamento não eliciado, podemos iniciar pela definição
de um conjunto algo arbitrário de comportamentos que preenchem certas restrições e
condições e que caem dentro de certos limites ao longo das dimensões especificadas da
resposta. Nossos critérios originais para agrupar certas amostras de comportamento
podem estar baseados em pouco mais do que a observação superficial de que o conjunto
de comportamentos, que cai no que descrevemos como tipo X, poderia ser uma classe de
algum interesse. Tendo formado essa classe arbitrária, deve-se solicitar agora - não um
eliciador, porque não existe um - mas um reforçador, para a confirmação de que a classe
que arbitrariamente selecionamos funcionará realmente como uma unidade. Isto é, pros
seguimos aplicando a operação de reforçamento em fragmentos sucessivos do comporta
- 161 -
mento tipo X, como definido. Cada membro da classe será, sem dúvida, um pouco
diferente de qualquer outro e, por essa razão, é chamado uma variante. Preparamo-nos
para tais diferenças ao especificar os limites (e não valores exatos) dentro dos quais
reforçaríamos. Se o reforçamento, agora, afeta o comportamento de modo a fortalecer
seletivamente uma classe de comportamentos, estamos certos ao referirmo-nos a esta
classe como uma classe de resposta operante, ou mais simplesmente como um operante.
Considere alguns exemplos. Poderíamos definir os limites de uma certa classe de
movimentos e tentar reforçar todos os movimentos dentro dos limites. O reforçamento
de uma classe de extensões do braço ocorre nos movimentos de pegar. As palavras são
exemplos proeminentes da formação de classes arbitrárias de resposta. Todos os sons que
caem dentro de certos limites aceitáveis (portanto, são produzidos pela ação muscular
dentro de certos limites aceitáveis), constituem as palavras faladas "por favor". Quando
uma criança enuncia e pronuncia as palavras corretamente (isto é, emite uma variante que
cai na classe desejada), o reforçamento é liberado e a classe de movimentos que produz
por favor é fortalecida.
Na natureza, parece pouco provável que o reforçamento seja sempre contingente
um conjunto restrito de limites do modo descrito acima. No laboratório, o reforçamento
poderia ser tornado contingente a um subconjunto restrito de comportamentos definidos
pelas limitações dimensionais. Mas, mesmo aí, as unidades são estimadas de modo mais
geral, classificando juntos todos os movimentos que atuam, pelas leis da mecânica
simples, para produzir uma mudança específica no ambiente. Portanto, todos os movi
mentos que pressionam uma barra, ou um disco, ou uma chave telegráfica, ou que
conduzem um rato do início ao fim de uma pista, giram uma roda, ou colocam açúcar
numa chícara de café, servem para limitar efetivamente a topografia do organismo de tal
modo que se consegue uma estimativa da classe topográfica especificada. Isto é verdade,
simplesmente porque há limites nas maneiras possíveis de se fazer todas essas coisas. Se
construímos nosso aparelho com cuidado, os comportamentos possiveis que poderiam
produzir as mudanças ambientais especificadas serão bastante limitados e, portanto, for
çados a terem uma forma razoavelmente semelhante. (Os comportamentos de enfiar linha
numa agulha são mais limitados que os de fechar uma porta). Na medida em que restrin
gimos nossas dimensões, os comportamentos que constituem a classe terão semelhanças
topográficas da mesma forma que os respondentes tem naturalmente. Todavia, a única
exigência formal para um operante é que ele seja uma classe de comportamento susce
tível, como classe, de reforçamento. Se especificamos uma classe que não pode ser
fortalecida ou mantida pelo reforçamento de seus membros, tal classe não constitui uma
resposta operante, seus membros não são variantes da resposta e, presumivelmente, não
se presta para o uso no estudo do comportamento operante. Isto é verdade se uma
especificação dos limites do comportamento fôr feita em termos de limitações dimensio
nais ou de alguma mudança ambiental necessária que o comportamento deva produzir.
Operantes, ou respostas operantes (respostas, para simplificar, se você se lembra de que
respostas não significam “ responder a” ), então, são as classes de comportamento, suscetí
veis ao reforçamento, que formam as unidades fundamentais de análise de uma grande
parte das ações humanas c animais.
Na definição de operantes como uma classe de comportamentos sensíveis de reforça
mento, nenhuma lógica exclui a definição de subclasses ou superclasses de operantes
contidos em ou que contem qualquer classe operante particular, previamente
definida. Esta flexibilidade no modo pelo qual os conjuntos comportamentais básicos
- 162-
podem ser subdivididos em “ conjuntos” menorjs, ou combinados para formar conjuntos
maiores, será de grande importância quando examinarmos os limites extremos aos quais
os conceitos de operante podem ser estendidos. Portanto, a definição de um operante,
em si mesma, não coloca qualquer restrição 3obre a amplitude de uma classe de resposta,
em termos da quantidade de comportamento abrangida por ela. Como veremos na seção
8.5, classes que consistem de contrações musculares muito breves para serem observáveis
pelo sujeito que as emite, podem vir a funcionar como operantes. No outro extremo,
seqüências longas de ações parecem funcionar como classes únicas de operantes. Sob
algumas condições, será possível falar de tricotar um suéter, escrever um livro, ou caminhar
para o trabalho, como operantes. Extensões do conceito de operante a tais operantes de
grande escala só agora estão sendo exploradas no laboratório.
8.2 UMA DEFINIÇÃO DE RESPOSTA OPERANTE EM TERMOS DA TEORIA DOS

CONJUNTOS
Uma definição alternativa do operante, compatível com a exposição precedente, é

iOrnecida, aqui, na notação da teoria dos conjuntos (ver seção 8.9).
Considere o conjunto de todas as amostras de comportamentos possíveis.
Neste conjunto U, vamos definir o subconjunto de comportamentos, B, que está dentro

dos limites preestabelecidos La — Lb, Mc - Md,-- , e tem restrições ou condições tais
que a forma do comportamento deve ser N, O, ..., onde as letras maiúsculas L, M, N, O,
significam as dimensões do comportamento e os índices especificam os limites supe
riores e inferiores dessas dimensões. Então, este subconjunto pode ser representado por
Como um meio alternativo de definir B, podemos considerar todos os comporta

mentos que completam um determinado resultado ambiental, S, para constituir o sub
conjunto B.
Considere uma tentativa de reforçar amostras sucessivas do subconjunto B. Se o
fortalecimento dos membros do subconjunto, R, de comportamentos, agora, ocorre
( como evidenciado por um aumento seletivo na sua freqüência, uma mudança na sua
ordem seqüencial em relação a outros comportamentos, e assim por diante), então, este
subconjunto R será conhecido como um operante e os membros observados de R serão
identificados como variantes da resposta operante. Se nenhum fortalecimento de um
subconjunto R ocorre, então B c considerado apenas um subconjunto específico de
comportamentos, destituído de importância empírica para a análise do comportamento.
Dado um operante R, é possível definir um subconjunto, r, tal que cada membro em
r seja também um membro de R.
- 163-
Na prática, pude-se verificar que muitos desses subconjuntos r ^ r j — podem ser operan
tes em si mesmos, pela definição anterior. Desde que, todavia, a definição de um
operante depende de se observar o fortalecimento pelo reforçamento e desde que o*
fortalecimento é definido em relação a outros comportamentos (ver seção 4.4), o limite
até o qual o fracionamento e/ ou subdivisão da classe R pode ser ampliado é estabelecido
pelo ponto no qual não é possível fortalecer um dado subconjunto ri sem igual fortaleci
mento de qualquer outro ij. Evidentemente, isto determina o limite inferior da definição
de uma classe de operante.
Uma operação oposta é admissível. Dado o operante R, é possível descobrir (ou
criar) um superconjunto R de ordem superior, que contém todos os membros de R, além
de outros comportamentos.
\ssim, embora os movimentos para pressionar uma barra possam funcionar como um
operante, os movimentos de pressionar uma barra vinte e cinco vezes podem funcionar
como um operante de orc1em superior, R. Da mesma forma, os movimentos de pressionar
uma barra, seguidos pelos movimentos de puxar uma corrente, podem funcionar como
um operante de ordem superior. Novamente, os limites aos quais os operantes podem ser
estendidos dessa maneira são estabelecidos apenas pelos limites da suscetibilidade com
portamental ao reforçamento.
8.3 O PARADIGMA DA DIFERENCIAÇÃO
O reforçamento exclusivo daqueles fragmentos de comportamento que estão dentro

dos limites e que têm as restrições e condições estabelecidas pelas dimensões comporta -
mentais é conhecido como o procedimento de diferenciação de resposta. Assim, o forta
lecimento de comportamentos tais como bicar o disco por pombos, pressionar a barri
por ratos, pegar os brinquedos pela criança, envolvem diferenciação de resposta. O que
chamamos até aqui de fortalecimento operante é um caso especial de diferenciação .de
resposta. Para avaliar os vários aspectos quantitativos da diferenciação de resposta, é útil
examinar um caso em que a especificação da classe comportamental a ser reforçada é
feita cm termos de uma única dimensão comportamental.
Na definição do pressionar a barra por um rato, a força mínima requerida para que a
barra seja pressionada pode quase sempre ser especificada. Essa força mínima é um
exemplo do limite inferior de uma dimensão comportamental. Se a força mínima fôr
bastante baixa, o nível operante dc pressionar a barra será maior que zero e o fortalecl-
- 164-
(A)
» 1
^3 17 21 25 29 33 37
1 i
41 45495357
(B)
o 8 8 I 1l 1i 1 i i
13 17 21 25 29 33 37 41 45 49 53 57
Intensidade das pressões, em gramas
Figura 8-2. Distribuição de força de resposta, quando todas as forças acima de

21g (A) e acima de 36 g (B) eram reforçadas ( segundo Hays e Woodbury, cita
do em Hull, 1943).
mento da classe operante de pressionar a barra procederá exatamente como descrito no

Capitulo 4. Hays e Woodbury (citados em Hull, 1943) realizaram um experimento de
fortalecimento semelhante, empregando uma força mínima de 21 gramas. Depois que o
processo de fortalecimento havia estabilizado, eles obtiveram respostas distribuídas ao
longo da dimensão força, como é visto no histograma superior da Fig. 8-2. A Fig. 8-2A
mostra nada mais que a variabilidade familiar que caracteriza o comportamento, mesmo
quando este é reforçado em condições de crf.
Em (A), as forças emitidas estão distribuídas quase simetricamente em torno de um
ponto cerca de 8 g acima do limite inferior da classe de resposta operante. Note que
poucas pressões (representadas por círculos vazios na Fig. 8-2) não alcançam adequada
mente o critério de uma resposta e, portanto, não são reforçadas. Quando os experimen-
tadores estavam convencidos de que a Fig. 8-2 representava o estado final estável do
comportamento sob suas condições, eles aumentaram a força mínima requerida para 36 g
O resultado dessa mudança na classe de resposta foi o ajustamento do comportamento
do rato mostrado no histograma da Fig. 8-2B. A distribuição de forças deslocou-se para
os valores maiores e centralizou-se em aproximadamente 41-45 g. O condicionamento
desta nova classe de comportamento foi bem sucedido; a condição necessária para
conferir à classe o 'status' de uma resposta operante foi alcançada. Houve uma outra
conseqüência importante desse condicionamento. Novas forças emitidas, nunca antes
vistas no repertório do animal (aquelas além de 45 g), ocorrem agora com freqüência
moderada.
- 165-
O procedimento dc diferenciação resultou no aparecimento e estabilização de um
conjunto de novos comportamentos. Como isto ocorreu? Dois processos com piemen ta
res parecem ser responsáveis. Primeiro,observe que, no momento em que foi colocada em
efeito, a nova condição de 36 g incorporava algumas forças existentes (veja a extremidade
direita da Fig. 8-2A). Esperar-se-ia que o fortalecimento desses comportamentos com
forças maiores que 36 gramas os manteria. Se esta condição não tivesse sido alcançada,
quase que certamente teria ocorrido a extinção normal. Então, em segundo lugar, o
mínimo de 36 g excluiu muitas forças anteriormente reforçadas. Quando pressões à barra
com essas forças anteriormente reforçadas foram emitidas sob o procedimento de 36 g no
mínimo, elas foram extintas. Lembre-se que um dos resultados do procedimento de
extinção é um aumento na variabilidade do comportamento (seção 5.2). A extinção das
forças de 21-36 gr anteriormente reforçadas, tenderia, assim, a produzir novas forças,
tanto superiores quanto inferiores àquelas usualmente emitidas.A emissão de forças muito
baixas não teria conseqüências no experimento presente, mas a emissão de forças muito
altas teria conseqüências reforçadoras e, logo, seria fortalecida. Eventualmente, esses dois
processos —( 1 ) extinção diferencial e ( 2 ) fortalecimento diferencial —que interagiam ao
longo da dimensão força, conduziram à estabilização comportamental na forma do histo-
grama (B) da Fig. 8-2.
A extinção teve um papel duplo, crucial nessa diferenciação de pressões à barra mais
fortes. (1) Agiu de modo a trazer novas e excepcionais variantes da resposta, algumas das
quais com possibilidades de serem reforçadas. (2) Agiu de modo a enfraquecer o compor
tamento ao longo da porção da dimensão onde o reforçamento havia sido suspenso.
Como outros paradigmas comportamentais, a diferenciação tem uma definição
completa apenas na especificação de seu dado, procedimento, processo e resultado.
DADA: uma classe de comportamento sendo emitida com alguma

força maior que zero.
PROCEDIMENTO: aplicar o reforçamento a* um subconjunto de variantes
dessa classe e submeter o resto ao procedimento de
extinção.
PROCESSO: ° fortalecimento gradual das variantes reforçadas e o
e n fraq u e cim e n to gradua! do grupo dc variantes
submetidas a extinção.
RESULTADO: uma distribuição estabilizada das variantes reforçadas cuja
força excede aquela das variantes não reforçadas.
O procedimento de diferenciação não precisa ser necessariamente aplicado como o foi no

experimento de Hays-Woodbury. Tudo o que é necessário, pela nossa definição, é que um
subconjunto de variantes seja reforçado e um segundo subconjunto extinto e que,juntas,
essas duas possibilidades esgotem todas as variantes. Na Fig. 8-3, várias possibilidades são
vistas esquematicamente. Somente (A) corresponde ao caso de Hays-Woodbury.
Lxcrcício 5. Prediga os efeitos do procedimento de diferenciação aplicado, da manei

ra mostrada, em cada um dos casos da Fig. 8-3, esboçando novas distribuições de vari
antes da resposta.
- 166 -
Dimensão comportamental
Figura 8-3. Algumas aplicações possíveis de reforçamento e extinção

a variantes de R. As regiões reforçadas estão sombreadas.
Um caso semelhante au da Fig. 8-3D foi descrito por Keller e Schoenfeld (1950).
Uma máquina de jogo foi modificada para permitir uma medida precisa de quanto o
êmbolo era puxdo antes de ser solto. Variações nos limites inferiores superiores da
resposta foram exploradas e o reforçamento para as variantes corretas era um 1flash?'de luz
após a liberação do êmbolo. Pode-se selecionar uma faixa de variantes à qual os reforça
mentos serão aplicados, tão estreita que um fortalecimento seletivo dessa faixa particular
não é obtido. Pelo contrário, as variantes mais próximas da faixa de reforçamento
manter-se-ão com forças iguais 'aquelas da faixa reforçada. Nessa situação, o experimen
tador atingiu as restrições mínimas para a definição de uma classe de resposta. Acima
desses limites, os resultados confirmam, todavia, a lei: tudo o que é reforçado é também
fortalecido.
Herrick (1963) projetou a barra vista na Fig. 8-4 para estudar o deslocamento da
pressão à barra. As pressões realizadas por um rato moviam uma barra em T descrevendo
um arco, enquanto um circuito eletrônico registrava o deslocamento máximo de cada
pressão. A distância máxima que a barra percorria em cad.: pressão foi classificada em
uma de oito zonas. A barra foi planejada de um modo que, quanto maior o número da
zona, maior a quantidade de trabalho exigida do rato.
Figura 8-4. Barra usada para estudar o deslocamento da resoost*

Num experimento, Herrick (1964) primeiro reforçou as pressões incluídas em qualquer
zona de 1 a 8 . Os resultados de um rato são vistos na Fig. 8-5A. Uma ampla faixa de
deslocamentos foi obtida. A faixa das posições reforçadas foi, então, progressivamente,
limitada. Quando somente as posições 3-6 eram reforçadas, obteve-se o histograma da
Fig. 8-5B. A distribuição dos deslocamentos foi um pouco mais estreita; não obstante, o
rato manteve a maior parte de suas pressões dentro dos limites reforçados. Mais além, nas
séries experimentais, os únicos deslocamentos reforçados foram aqueles na zona 5. Os
resultados são vistos na Fig. 8-5C. As pressões na faixa reforçada foram muito freqüentes
mas ocorreram numerosas pressões nas zonas não reforçadas. Um efeito interessante visto
no histograma da Fig. 8-5B é que as zonas próximas dos limites inferiores de reforça
mento (zonas 3 e 4) incluem mais comportamentos do que as zonas próximas dos
36
18
r-n
1 2 3 4 5 6 7 8
(A)
co 54
36
18
E
0>
0
1 2 3 4 5 6 7 8
(B)
(C)
Zona da barra
I'igura 8-5. Distribuição dos deslocamentos da barra em função do tamanho da região reforçada. Às
sombreadas do histograma indicam as zonas da barra nas regiões reforçadas (segundo Herrick, 1964)
- 168-
limites superiores da zona de reforçamento (zonas 5 e 6 ). Este fenômeno pode ser
interpretado como uma tendência do rato de dlspender “menos esforço” : dadas duas
zonas de reforçamento, aquela que exigir a menor condição de trabalho será a mais
fortalecida.
8.4 APROXIMAÇÃO SUCESSIVA
O maior poder do procedimento de diferenciação consiste na sua habilidade para

criar e, então, manter comportamentos ainda não observados no repertório do animal.
Este poder estende-se mais além nos casos em que diferenciações progressivas e graduais
podem ser feitas no decorrer do tempo. No exemplo de Hays-Woodbury e nos exemplos
da Fig. 8-3, uma diferenciação com um passo foi pretendida. Mas um segundo procedi
mento de diferenciação pode ser feito a partir dos resultados da primeira, e assim sucessi
vamente, de modo a produzir, eventualmente, comportamentos qué podem ser muito
diferentes das formas originais. A menos que a história de diferenciação sucessiva fosse
conhecida, seria difícil explicar o aparecimento desses comportamentos. Um bebê inicia a
vida com um repertório de todos os sons básicos usados nas várias línguas, mas seu
balbucio e murmúrio são muito diferentes da pronúncia adulta de uma frase em portu
guês. Ainda mais, o aparecimento de sentenças é precedido pelo de palavras, palavras pelo
de sons silábicos e estes são diferenciados a partir da corrente de sons rudes emitidos pelo
recém-nascido. As diferenciações progressivas e graduais que se fazem sobre os resultados
de cada diferenciação prévia e que, gradualmente, conduzem o comportamento a alguma
forma final desejada, são conhecidas como aproximações sucessivas do comportamento,
final ou de modo mais simples modelagem do comportamento. O processo é represen
tado esquematicamente na Fig. 8 -6 . Pela enésima diferenciação, a distribuição de
variantes obtida parece, para o observador casual, não ter relação alguma com a distri
buição original da resposta. Contudo, as origens da enésima distribuição baseiam-se no
- fortalecimento c extinção sucessivos dos predecessores dessas variantes. Sem esta história
causal a distribuição final na Fig. 8-6 nunca teria surgido
Dimensão da R
Figura 8-6. Representação esquemática de diferenciações progressivas (aproximações
sucessivas) ao longo de uma dimensão quantitativa da resposta. As áreas sombreadas
representam as variantes reforçadas.
- 169-
A diferenciação sucessiva deve ter um limite superior, determinado pela capacidade
do organismo. Mas, dentro dos limites dessas restrições de capacidade, a aproximação
sucessiva de uma forma final de comportamento é um método extremamente poderoso
para produzir comportamento. Através deste processo de aproximação -sucessiva na
dimensão força da barra, Skinner (1938) foi capaz de treinar um rato de 200 g a realizar
o feito hercúleo de pressionar uma barra que requeria o mínimo de 100 g de força.
Nem a diferenciação nem a aproximação sucessiva estão limitadas a mudanças ao
longo de uma dimensão quantitativa da resposta. Mesmo que a topografia, ou forma do
comportamento seja de difícil mensuração, sua modelagem se dá de forma análoga à
aproximação sucessiva ao longo de uma dimensão quantitativa. Anteriormente, fez-se
referência ao operante de bicar o disco do pombo. Essa resposta, quase sempre, tem uma
freqüência igual a zero, no nível operante e, assim, precisa ser modelada. Neste caso, o
experimentador aproxima-se sucessivamente da forma desejada do comportamento,
iniciando com uma forma que pode se parecer em nada com o bicar uma chave. O
experimentador pode reforçar primeiro todos os movimentos do animal que ocorrem na
vizinhança da parede que contém o disco. O efeito deste procedimento de diferenciação é
fortalecer os movimentos do animal nas proximidades do disco. Então, o reforçamento é
tornado contingente aos movimentos da cabeça próximos ao disco. Quando essa contin
gência tiver tido efeito de aumentar tais movimentos, o reforçamento será condicional ao
tocar o disco com o bico. Neste exemplo, a mudança dos requisitos para o reforçamento
combina-se com as mudanças progressivas do comportamento para modelar um novo ato.
O aparecimento do bicar o disco é devido a uma história de diferenciação progressiva de
antecedentes comportamentais remotos, com relação ao,s quais o bicar o disco contém
uma pequena semelhança superficial. É este o processo através do qual muitas de nossas
próprias habilidades são modeladas. É interessante notar que, embora a natureza forneça
muitas situações de reforçamento seletivo (a corrida do coelho é reforçada somente se fôr
bastante rápida para iludir a raposa; a corrida da raposa é reforçada apenas se fôr mais
rápida que a do coelho), parece que a aproximação sucessiva é um arranjo de contingências
estritamente humano. Professores, pais e amigos seguem tal procedimento, embora raras
vezes tão sistematicamente como deveria ser. Talvez seja no laboratório que o maior
poder do procedimento possa ser explorado, porque é lá que podemos controlar e mank
pular melhor os muitos parâmetros, sugeridos pelas Figs. 8-3 c 8 -6 , cujos efeitos no
processo são ainda bastante desconhecidos.
8.5 EXTENSÃO DO CONCEITO DE OPERAOTE
Uma história de diferenciação e aproximação sucessiva pode tornar classes de compor

tamento suscetíveis ao reforçamento, classes estas que, de outra maneira, poderiam
permanecer indisponíveis. Neste sentido, os procedimentos de diferenciação e aproxi
mação sucessiva são, adequadamente, considerados métodos de criar operantes. Estamos
agora em condições de entender porque a maioria dos operantes que observamos fora do
laboratório, tais como o abrir e fechar portas, dizer “por'favor” , operar máquinas, assar
bolos, e n v ia r mensagens pelo código morse, chutar bolas de futebol, parecem ter uma
estrutura mais unitária, como se fossem um único evento, do que sugerimos, anterior
mente, ser característico da corrente de comportamento.O “status”de evento desses atos
lhes é c o n f e r id o pelo lato de eles serem produtos da diferenciação.Diferencialmente refor
- 170 -
çados, de início na forma de classes arbitrárias, esses operantes tornam-se unidades fun
cionais através da ação do reforçamento seletivo de seus membros e extinção concorrente
dos membros de todas as outra classes de comportamento.
Uma classe importante desses operantes criados é o conjunto cujos membros são cons
tituídos de elementos que foram previamente modelados como operantes. No caso mais
simples, o reforçamento é contingente à emissão de n repetições sucessivas de um
operante anteriormente reforçado. Esse procedimento especifica um novo operante de
ordem superior, constituído de n ocorrências sucessivas da classe de comportamento
anteriormente reforçacfa. Quando descrevemos tal operante de ordem superior, refe-
rimo-nos aos membros da classe anteriormente reforçada que o constituem como seus
seus elementos ( r i , r 2 , r3 , ..., rn). Embora os elementos por si sòs constituíssem,
inicialmente, classes unitárias de resposta, eles são tratados agora como componentes de
uma classe de resposta de ordem superior (Findley, 1962). A especificação de um
operante em termos de um número fixo de tais elementos repetidos é conhecida como
operante de Razão Fixa (RF). O termo “ razão” refere-se ao número fixo de elementos
repetidos por reforçamento. Por exemplo, depois de ter fortalecido o operante de pres
sionar a chave telegráfica num macaco, o reforçamento pode ser tornado contingente a
30 pressões consecutivas à chave telegráfica. Depois de modelar o bicar o disco num
pombo, pode se tornar o reforçamento contingente a cada 50 bicadas no disco. Esses
casos são denotados RF 30 e RF 50, respectivamente. Tais operantes de ordem superior,
sendo constituídos de componentes facilmente observáveis e experimentalmente criados,
são úteis por permitirem uma micro-análise compreensiva da estrutura do comporta
mento operante. Os elementos dos operantes RF são estudados tipicamente do mesmo
modo que as respostas são estudadas em esquemas de reforçamento intermitente. Assim, os
registros cumulativos dos elementos de operantes RF constituem um método de obser
vação das características temporais de classes de resposta altamente ampliadas.
A transição do reforçamento de uma classe que tem somente um elemento para uma
Classe contendo n elementos, representa um tipo de aproximação sucessiva, ao longo da
dimensão do número (n) de elementos. Antes de mudar a condição para o reforçamento
de um único elemento para n elementos, não há, todavia, qualquer informação sobre as
variantes acessíveis ao longo das n dimensões. O único valor de n previamente examinado
(reforçado) em crf foi sempre 1. Assim, a diferenciação é, em grande parte, um problema
de tentativa e erro. Usando o bicar o disco (chave) por pombos, Ferster e Skinner (1957)
foram capazes de passar diretamente de um elemento por reforçamento para razões de
reforçamento de 40 e 50 elementos sem que a extinção ocorresse. Quando a diferen
ciação do novo operante havia estabilizado (umaspoucasdúziasdehoras).o padrão da taxa
dos elementos era tal que taxas altas e uniformeseram freqüentese uma pequena pausa
ocorria depois de cada reforçamento. A diferenciação de razões ainda mais altas requer
uma aproximação sucessiva pelo aumento gradual de n. A razão e aumentada de 5 ou 10 c
mantida no novo valor por várias sessões. Uma curva cumulativa típica, mostrando-um
desempenho estável cm RF 120 por um pombo modelado desse modo, é vista na Fig.
8-7. A curva mostra a uniformidade marcante do comportamento, no tempo, sob especi
ficações RF. O reforçamento e seguido caracteristicamentc por pausas que duram 5 ou 6
min, depois do que o animal começa a bicar com uma taxa uniforme e alta que é mantida
ate o reíorçamento. A pausa pós-reforçamento está relacionada de perto com o tamanho
da razão. Razões grandes são marcadas por pausas longas. Em razões pequenas, a paus;(
pode desaparecer totalmente. O limite superior da diferenciação da razão taivez seja
- 171
desconhecido. Skinner (1957) relata dados de Morse e Herrnstein nos quais um operante
RF contendo 900 elementos foi estabilizado através de diferenciação progressiva.
Figura 8-7. Curva cumulativa do bicar a cliave, por um pombo reforçado após cada
120 bicadas (Ferster e Skinner, 1957).
Â noção de que o procedimento dc razão define um operante dc ordem superior é

baseada em estudos que verificaram que este operante, como outros, pode ser submetido a
um esquema de reforçamento e mantido indefinidamente nos moldes característicos dc
um esquema particular. Ferster e Skinner (1957) reforçaram operantes em RF 30 sob um
esquema de probabilidade uniforme. Isto é,
onde R = 3 0 bicadas na chave

SA = iluminação normal
S3 = diminuição da iluminação
- 172 -
O fim de uma RF não reforçada era sinalizado no experimento de Skinner e Fe rs ter, por
uma breve mudança na iluminação (colchete 3 no diagrama). Probabilidade de reforça
mento (p) para o comportamento de bicar a chave em RF 30, de 0,85 ate 0,50, manti
veram o comportamento. Em 0,50, houve quase sempre uma tendênciaparaaocorrência
de longas pausas entre os operantes RF (não entre os elementos) característica de um
resultado encontrado por Brandauer (1958), que usou valores de p muito pequenos com
um operante mais siipplcs, uma bicada na chave. Uma vez que Brandauer teve que chegar
a probabilidades de 1/600 para obter o efeito que aqui foi obtido com 0,50 parece que a
quantidade de comportamento envolvida num operante modifica sua suscetibilidade a
um esquerna.
A função que relaciona a resistência à extinção ao tamanho da RF recebeu alguma
atenção experimental. RFs grandes podem exigir um trabalho substancial do indivíduo e,
por essa razão, pode se esperar que ela acarrete uma menor persistência, face à extinção,
do que RFs pequenas. Boren (1961) e Weissman e Crossman (1966) apresentaram dados
que mostram que na faixa entre RF 1 e RF 64, a pressão à barra em ratos e o bicar a
chave em pombos parecem apresentar tal efeito. Apesar desta diminuição na persistência
do operante em função do seu tamanho, muito mais elementos são, na realidade,
emitidos na extinção de grandes RFs. De fato, dentro de certos limites, quanto maior a
RF no treinamento, tanto maior será o número de elementos individuais emitidos
durante a extinção.
Uma conclusão importante segue-se. Sc estamos interessados cm aumentar a persis
tência do comportamento face à extinção, a especificação de RF fornece um método
altenativo para um esquema produzir perseverança. Podemos incorporar o comporta
mento como um elemento de um operante RF dc ordem superior.
Em contraste com os operantes de ordem superior criados pela combinação de
elementos que se demonstrou anteriormente serem operantes, Hefferline e Keenan
(1963) pesquisaram um operante “miniatura” , tão pequeno que uma amplificação eletrô
nica precisa ser empregada para detetá-lo. Essespesquisadores generalizaram, com êxito, u
conceito de classe de resposta operante para comportamentos tão pequenos em aplitude
que o sujeito, geralmente, não é capaz de dizer ter observado suas próprias respostas.
Num experimento, potenciais de contração muscular do polegar de sujeitos humanos
foram registrados. Eletrodos simulados foram colocados em outros pontos do corpo do
sujeito para desviar sua atenção da resposta do polegar. Os sujeitos eram conforta
velmente sentados em um cubículo triangular, com ar condicionado e à prova de som e
eram instruídos, apenas para se relaxarem. Eles foram avisados de que ocorreria reforça
mento na forma de pontos, registrados num contador localizado perto deles, e que cada
ponto valeria 5 “cents” . Mas não foi dito aos sujeitos como eles poderiam produzir os
pontos. Num sujeito, as contrações do polegar que geravam potenciais na amplitude de
25-30 microvolts eram reforçadas e, depois, extintas. Os histogramas para os 10 min de
nível operante, seguidos por 6 blocos sucessivos de 10 min dc fortalecimentQ, seguidos
por 10 min finais de extinção, são vistos na Fig. 8-8 . Os histogramas de condicionamento
mostram que o procedimento de diferenciação foi bem sucedido no fortalecimento sele
tivo da classe reforçada de comportamento e que os 10 min de extinção causaram um
enfraquecimento marcante na classe. Os registros cumulativos da contração muscular
reforçada mostram uma taxa típica dc aumento da classe reforçada, mas - como deve ser
esperado de um operante com dimensões tão limitadas o processo é gradual, esten-
-173-
150 - 2 0 -3 0 150 - Extinção
100 100 -
50 - __ , 50 -
0 . 1---- 1 Q
10 15 20 25 30 35 40 45 10 15 20 25 30 35 40 45
Microvolts
Figura 8-8. Histogramas de frequência de respostas para várias categorias de contrações do

polegar, medidas em microvolts, durante o nível operante (NO), condicionamento e ex
tinção. A categoria reforçada está sombreada (Segundo Hefferline e Keenan, 1963).
dendo-sepor 60 minutos de condicionamento. Isto difere, assim, das curvas abruptas de
fortalecimento da pressão à barra no rato (Fig. 4-2).
Os resultados de Hefferline e Keenan são importantes na nossa análise do comporta
mento por várias razões. Primeiro, eles mostram os limites inferiores a que o nosso
conceito de operantes pode ser levado e ainda denotam uma unidade funcional de com
portamento. wSegundo, demonstram que a inabilidade do sujeito para verbalizar as contin
gências de reforçamento de modo algum afeta a regularidade do condicionamento e
-174-
extinção. Um terceiro fenômeno empírico — típico do comportamento operante em
geral — é demonstrado. No operante de contrair o músculo a classe de resposta foi
definida como c o n tra c ts entre 25 e 30 microvolts. Mas uma inspeção mais detalhada
dos histogramas da Fig. 8-8 mostra que as classes vizinhas de comportamento, embora
não realmente reforçadas, foram também algo fortalecidas. O fortalecimento incidental
induzido em comportamentos que realmente não participam das contingências de refor
çamento é chamado indução de resposta. A indução de resposta ocorre durante o fortale
cimento de qualquer operante, mas nem sempre é fácil verificá-la. Embora o experimen
tador possa desejar limitar o reforçamento a uma classe específica de comportamento, o
fortalecimento pode se estender, através de indução, muito além dos limites estabe
lecidos. Ratos que aprendem os movimentos necessários para atravessar uma pista
complexa, são capazes de nadar na pista, eficientemente, quando esta está alagada,
embora o nadar requeira um grupo de movimentos bastante diferentes. Aprender a
escrever com a mão direita treina a mão esquerda não usada, embora em grau menor.
Aprender a falar o italiano torna mais fácil aprender a falar espanhol. A indução de
resposta é estudada no laboratório com ajuda do aparelho para desenhar, que inclui um
espelho, visto na Fig. 8-9. O sujeito recebe a tarefa de desenhar uma figura vendo, no
espelho, a imagem desta. Uma vez que as relações usuais entre mão e olho são invertidas
as primeiras tentativas são reproduções ruins. Gradualmente, o sujeito passa a desem
penhar melhor a tarefa. A indução de resposta pode ser medida em qualquer momento,
no processo de aquisição, testando-se a quantidade de melhora mostrada pela mãe
esquerda, com a qual o sujeito não praticou.
F ig u ra 8-9. D iagram a e sq u em ático de u m ap a re lh o de d e sen h ar, co m espelho. O su jeito

se se n ta fre n te a u m a estrela que lh e é vfsivel so m e n te no espelho (M ednick. 1 964)
-1 7 5 -
8.6 DIFERENCIAÇÃO DE TAXA
Ao se considerar os efeitos de certos esquemas de reforçamento, recorre-se sempre ao
fato de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com
o reforçamento. Assim, esquemas de intervalo randômico tendem a fornecer reforça
mento diferencial apôs taxas baixas e esquemas de probabilidade uniforme tendem a for
necer reforçamento diferencial depois de taxas altas. Uma vez que o efeito do reforça
mento é fortalecer qualquer que seja o comportamento que vem antes dele, esses
esquemas agem indiretamente no fortalecimento de certas taxas de comportamento. Se
desejarmos, poderemos fazer surgir uma diferenciação maisdireta e invariante pela especi
ficação dos limites, condições ou restrições da taxa do operante que deve ser reforçado.
No reforçamento diferencial de taxas baixas (drl), um operante R é primeiro especi
ficado e fortalecido. Quando R tiver sido suficientemente fortalecido, ele é tomado um
elemento numa nova especificação de resposta de ordem superior: somente os elementos
de resposta que estão espaçados entre si pelo mínimo de uma certa quantidade de tempo
são agora reforçados. Assim, o procedimento drl reforça um certo comportamento
somente quando precedido de uma pausa. Wilson e Keller (1953) efetuaram este procedi
mento de drl, exigindo que os ratos espaçassem suas respostas de pressão à barra de
determinados retardos mínimos, para que o alimento fosse liberado. A especificação do
tempo mínimo para o operante foi aumentada gradualmente, em passos de 5 seg, de 10
para 30 seg, num período de 30 sessões. A Fig. 8-10 mostra que as diferentes pausas
exigidas, estabelecidas pelas especificações, produziram taxas diferentes de pressão a
barra.
Intervalo de Retardo (seg)

F ig u ra 8-10 . T ax a m édia de pressão à b a rra , d u ra n te a ú ltim a sessão, em cad a um dos cin
co v alores d ife re n te s d e um intervalo de r e ta rd o m ín im o necessário e n tr e pressões re fo r -
çad as ( seg u n d o W ilson e K eller, 19 5 3 ).
- 176-
Quando a especificação da pausa do d rl foi aumentada, ocorreu um declínio sistemático
na taxa dos elementos da pressão à barra. Outra maneira de dizer isso é que, quando se
exige um aumento no retardo, ocorre um aumento sistemático na duração média das
pausas entre as pressões à barra.
A especificação do d rl é um operador poderoso para fortalecer e manter taxas baixas
de algum comportamento especificado. Curvas cumulativas do bicar a chave mantido em
taxa baixa, em pombos, quando somente bicadas precedidas por pausas de 3 minutos ou
mais eram reforçadas, são vistas na Fig. 8-11. Através de um ajustamento adequado da
especificação do d r l, manteve-se os pombos trabalhando lenta, mas estavelmente, 24
horas por dia, durante dois meses.
O operante de ordem superior fortalecido pelo procedimento drl consiste de
uma topografia bem especificada (por exemplo, uma bicada ou uma pressão) precedida
por uma topografia problemente especificada (por exemplo, qualquer coisa exceto uma
bicada ou pressão). A classe “ qualquer coisa exceto” é, em geral, o suficientimente ampla
para que os sujeitos individuais venham a formar comportamentos idiossincráticos, su
persticiosamente reforçados durante a pausa forçada Wilson e Keller relatam que cada
F igura 8-11. T ax as de b icar a chave q u a n d o so m e n te b icad as p reced id as p o r um a pausa de

3 m in o u m ais eram re fo rç a d a s (S k in n e r, 1957).
rato desenvolveu uma forma de comportamento colateral, facilmente reconhecível e

previsível, constituida ritualmente de limpar-se, farejar e andar em várias partes da
câmara experimental durante os intervalos de retardo.
A especificação do operante drl é convenientemente expressada como uma amostra
de comportamento que inclui, por um certo tempo,qualquer comportamento outro que
não o selecionado, seguido pelo comportamento sejecionado. Fm notação de conjunto,
defininmwnicialmente, em U , o operante R. A porção de )J não incluida em R é
chamada R e inclui quaisquer comportamentos, exceto aqueles que caem na classe R.
Evidentemente, R e R esgotam o espaço comportamental, ]J Sob o d rl, o novo
operante, 0, é definido como consistindo de: pelo menos T min de R, + R.
O operante drl foi mantido com sucesso em esquemas de intervalo por Angei (1956)
e Ferster e Skinner (1957).
-177 -
Em contraste com o d ri, taxas muito altas de comportamento podem ser geradas,
tornando-se o reforçamento contingente à completaçao dos elementos de uma razão
operante dentro de um intervalo de tempo especificado. Se este intervalo fôr progressiva
mente diminuído, ou a razão progressivamente aumentada, ocorrerá uma modelagem de
taxas extremamente altas dos comportamentos componentes. Este procedimento é
conhecido como reforçamento diferencial de taxas altas (d r h ) .
8.7 REFORÇAMENTO DO RESPONDER CONTÍNUO
Como vimos, a criação de operantes através do processo de diferenciação age, tipica

mente, impondo um início e um fim arbitrários ao comportamento. A criação de uni
dades discretas desta natureza é útil para se medir os efeitos comportamentais, pois as
unidades prestam-se à contagem. A contagem, naturalmente, toma possível o cálculo de
uma taxa de resposta e, consequentemente, da probabilidade da resposta, com todas as
vantagens adicionais dessas variáveis.
Todavia, esta separação de operantes em eventos discretos com início e fim
definidos não é uma condição necessária para sua definição. Se o fosse, a análise de
comportamentos interessantes tais como ficar parado e o seu inverso, mover-se
continuamente, estariam fora do âmbito do comportamento operante. Que esses
co m p o rtam en to s são tão suscetíveis ao reforçamento, como as unidades
comportamentais mais óbvias, é demonstrado pelo reforçamento de uma resposta
contínua de correr, num rato. O aparelho para estudar o correr é uma gaiola rotatória,
semelhante à que é vista na Fig. 8-12, mas modificada pela adição de um comedouro
para liberar automaticamente uma pelota de alimento, quando necessário. Com o
F ig u ra 8-12. G aio la ro ta tó ria e reg istrad o r a u to m á tic o . A ro d a gira a p en as n o se n tid o

a n ti-h o rário .
-1 7 8 -
objetivo de estabelecer uma classe de comportamento, uma volta de 360 graus fornece
uma unidade conveniente, embora perfeitamente arbitrária, do comportamento a nüi
reforçado. Se o correr (definido como uma volta completa) é reforçado num intervalo
fixo de 5 min ( IF 5 min), somente a primeira volta depois de decorridos os 5 min será
reforçada. Os efeitos do reforçamento consistem em fortalecer um padrão de corrur,
característico do responder em esquemas IF (ver Figs 7-2 e 74 ). O rato para por
vários minutos logo após um reforçamento e, então, corre numa taxa altá até o
próximo reforçamento, e assim por diante (Skinner e Morse, 1958). Aqui o
desenvolvimento do padrão da IF serve para verificar a natureza operante do correr.
8.8 SUMÁRIO
Os procedimentos de diferenciação e aproximação sucessiva aumentam
fcrandemente o nosso controle experimental sobre o comportamento. Eles são
procedimentos que permitem selecionar os aspectos do comportamento que desejamos
reforçar e, realmente, tornar os comportamentos desejados disponíveis para o
fortalecimento. A combinação de esquemas de reforçamento com várias especificações
de resposta (incluindo as especificações de ordem superior compostas de operantes
condicionados anteriormente) permite que grandes amostras do comportamento de um
organismo, no laboratório, sejam mantidas e estudadas por longos períodos de tempo.
Os procedimentos de razão permitem o estudo de como a quantidade dc trabalho
necessária para o reforçamento pode afetar o comportamento. Os procedimentos dc
d rl e d rh tornam possível o estudo de uma ampla faixa de taxas de comportamento.
No pombo, por exemplo, esses procedimentos produzem uma faixa estabilizável do
taxas de bicar a chave de menos de 100 respostas por hora até 20.000 respostas poi
hora. Frequentemente, especificações de respostas engenhosas podem ser usadas pani
estabelecer linhas-base comportamentais, análogas às linhas-base de esquemas, a parlii
das quais podem ser estudados os efeitos típicos de drogas e outras operações.
Um número de atividades humanas características são correlacionadas com vária»
especificações operantes pesquisadas no laboratório. O trabalho por peça, no qual um
trabalhador é pago para produzir um número fixo de artigos, c uma especificação RF clara.
Assim também são atividades como datilografar um grande número de páginas, preparar
longos exercícios ou bater um prego na madeira. Em muitas dessas, se a quantidade de
comportamento envolvida é substancial,uma pausa antes dc “ voltar ao trabalho” é vista
com freqüência. Podemos observar comportamentos em d rh nas atividades onde um
prêmio e dado pela execução rápida do trabalho em pouco tempo - isto pode ser visto
em garçons, na hora de movimento ou, no basebol, os movimentos de um jogador
correndo para a primeira base. Tipos de comportamento mais “intelectuais” também sc
ajustam aos paradigmas de diferenciação. Numa discussão verbal, por exemplo, há comu*
mente um premio em d rh para “ pensar rápido” e replicar. Por outro lado,numa briga,há
frequentemente um premio em d rl para o não responder muito precipitadamente e “ dizer
coisas de que nos arrependeremos mais tarde” .
Segue-se uma nota sobre as similaridades entre os efeitos de certas especificações de
resposta e os efeitos de certos esquemas. A Razão Fixa, por exemplo, não difere do IF
em seus efeitos sobre o comportamento (compare a Fig. 8-7 e a Fig 7-3 ). Essas seme
lhanças têm levado os teóricos a tentarem reduzir esquemas e diferenciação a uma estru
tura comum, enfatizando os parâmetros de probabilidade de reforçamentoê nâo enfati-
-17 9-
/.ando variáveis de especificação de resposta, ou vice-versa. O sucesso de tal empreendi
mento ainda não está assegurado e, para os objetivos presentes preferimos considerar um
esquema como um procedimento de especificação de contingências probabilistic as de
reforçamento no tempo, dada a classe de R. Por outro lado, consideraremos a diferen
ciação como um procedimento para especificar em que classe de comportamento se deve
agir com um esquema dc reforçamento. A observação de que uma certa definição de R
sob um esquema pode produzir efeitos semelhantes,ou mesmo idênticos à outra definição
sob um esquema diferente, pode realmente ser interessante. Todavia, tais correspon
dências comportamentais não significam necessariamente que, em geral, cada especifi
cação ou esquema seja redutível ao outro.
8.9A LINGUAGEM E LÓGICA DOS CONJUNTOS
Um conjunto é qualquer coleção bem definida de objetos ou entidades conceituais.

O termo “ objetos ou entidades conceituais" é tomado num sentido amplo, significando
coisas tais como árvores, pessoas, mesas de cozinha, resultados do atirar uma moeda, cor de
cabelo, respostas ou números. Dizer que um conjunto é uma coleção bem definida
significa o fato dc que, para qualquer objeto ou entidade conceituai, podemos dar uma
resposta definida -- sim ou não - no que se refere a se esse objeto está numa coleção
particular. Alguns exemplos de conjuntos são:
(1) Todas as pessoas da cidade de Kansas com cabelo vermelho.

(2) Os filmes onde Alec Guinness aparece.
(3) Os números ímpares.
(4) Os países do mundo com parlamentos eleitos.
(5) Todos os comportamentos que abrem uma porta.
Para cada um desses conjuntos, podemos dar uma resposta sim ou não no que se refere
a se uma dada pessoa, ou filme, o número,ou país, ou comportamento, respectivamente,
poderia ser incluido na coleção. Na terminologia dos conjuntos, os itens individuais que
compõem a coleção são chamados os membros, ou elementos do conjunto.
Os conjuntos são quase sempre simbolizados por letras maiúsculas. Assim, os inteiros
ímpares menores que 10 , tomados como um conjunto, podem ser simbolizados pela letra
I, c o conjunto das vogais comuns na língua inglesa, pela letra V. Suponha que desejamos
indicar os membros de um conjunto. Um método para escrever as coleções que chama
mos conjuntos é enumerar cada um dos membros do conjunto, separando cada um por
vírgulas e colocando-os em chaves. Assim, o conjunto dos inteiros ímpares menores que
10 é escrito.
/ = { 1 ,3 ,5 ,7 ,9 }
e o conjunto das vogais comuns da língua inglesa é escrito
V = {a, e, i, o, u)
Algumas vezes o conjunto ou coleção é muito amplo para que possamos conveniente
mente escrever todos os seus membros ou elementos. Então, podemos usar três pontos
- 180 -
após escrever um número de membros suficiente para sugerir a regra que d e t e n m n a ;■
filiação. Por exemplo, poderíamos escrever o conjunto dos governos com a s s e m b lé i a s
legislativas eleitas, P, como
P {Canadá, Inglaterra, França, Estados Unidos, Islândia...}
Dois conjuntos especiais, são de interesse. Um é o conjunto universal, s i m b o l i z a d o

por y . O conjunto universal, y , contém todos os elementos aos quais f a z e m o s
qualquer referência numa dada discussão.Em termos de nossos exemplos anteriores,
todos os seguintes seriam conjuntos universais apropriados:
(1) todas as pessoas da cidade de Kansas.

(2) todos os filmes feitos.
(3) - todos os números.
(4) todos os países do inundo.
(5) todos os comportamentos do indivíduo.
O y serve simplesmente para delimitar qualquer discussão particular, estabelecer seus

limites c definir o tópico ou região a partir da qual as várias coleções podem, então, sei
feitas.
Um segundo conjunto especial é aquele que não tem membro algum. Tal conjunto é
chamado conjunto vazio, <p . Todos os números ímpares com um único dígito acima de
10 , todos os países do mundo que têm dinossauros vivos, todas as pessoas da cidade de
Kansas com cabelo verde são presumivelmente exemplos do conjunto vazio, $ . Note que
há somente um $ , ao passo que há tantos conjuntos universais diferentes quantos
quadros de referência houverem para qualquer discussão determinada.
Embora um conjunto se componha de elementos, alguns ou todos os elementos
podem ser, por si sós, considerados conjuntos. Considere o conjunto universal, y , de
todos os livros, sentenças, palavras e letras. Um elemento desse conjunto é este livro. Mas
este livro contem uma coleção de sentenças. Essas sentenças compõem um conjunto: o
conjunto das sentenças deste livro. A análise pode ser levada ainda mais longe para
palavras c, então, para letras. As sentenças contêm os elementos palavras; as palavras
contêm, ainda, como elementos, as letras. Nessa conexão, é importante notar que, ao se
enumerarmos elementos de um conjunto, incluimos apenas os elementos diferentes.
Assim, os elementos do conjunto L das letras que constituem a palavra “agradável” sao
escritos
L — {a, g, r, d, v, e, 1}
Não duplicamos o a que ocorre mais de uma vez na palavra porque é um e l e m e n t o

idêntico. Naturalmente, se a palavra Agradável fosse escrita em letra maiúscula, e n t a o
deveríamos incluir o A, assim como o a, como elementos, dependendo se t iv é s s e m o s
tomado o nosso conjunto universal como o conjunto de todas as letras, ou s o m e n l e o
conjunto das letras minúsculas.
A noção de que os conjuntos podem ser divididos em conjuntos está contida n o
conceito de um subconjunto. Um subconjunto, B, de A, é um conjunto tal que iada
membro de B é também um membro de A. O contrário não é necessariamente ver d a
i Ri
deiro. Assim, se o conjunto de todas as pessoas que vivem nos Estados Unidos é um
conjunto universal, então o conjunto das pessoas da cidade ae Kansas é um subconjunto.
Além disso, o conjunto das pessoas de cabelo vermelho da cidade de Kansas é um outro
subconjunto. Suponha que todas as pessoas sejam um conjunto universal, y . Então, o
conjunto dos homens é um subconjunto deste conjunto universal. Mas o conjunto de
meninos é ainda um outro subconjunto. Todos os meninos são do sexo masculino, nias
nem todas as pessoas do sexo masculino são meninos.
Para representar o fato de que todos os membros ae um dado conjunto B são
também do conjunto A, escrevemos
B C A
o que significa que cada elemento de B é também um elemento de A.
Para representar estas noções e para ajudar nossa intuição sobre as várias manipu
lações e combinações simples dos conjuntos que desejarmos fazer, os diagramas conhe
cidos como diagramas Venn são úteis. Num diagrama Venn, o Conjunto P- é represen
tado por urn retângulo e os vários conjuntos e subconjuntos de y são representados poi
círculos, figuras oblongas, ou outras figuras irregulares. Assim, na ilustração anterior a
relativa ao conjunto das pessoas da cidade de Kansas, desenhamos
[8 .1]
(Hide K são as pessoas da cidade de Kansas. Se desejamos indicar as pessoas de cabelos

vermelhos da cidade de Kansas podemos desenhar dois círculos, deixando-os parcialmen
te sobrepostos, como em:
[8.2]
onde os círculos K e V representam, respectivamente, as pessoas da cidade de Kansas e as

pessoas de cabelo vermelho. Nem todas as pessoas de cabelo vermelho vivem na cidade de
Kansas, mas aquelas que vivem estão representadas pela região superposta sombreada em
18 .2 1 chamada a intersecçao dos dois conjuntos V e K 0 símbolo a é usado para
denotar a intersecçao de dois conjuntos. Logo, [8 .2 1 pode ser escrito como V A K.
Suponha que desejamos nos referir aos dois conjuntos de animais, ratos, R, e gatos,
G. Então, se o conjunto universal P consiste de todos os animais conhecidos, temos .
[8.3]
- 182-
Em [8.3], nenhum elemento é membro de ambos, R e G. Isto é, não há animal algum
que seja, ao mesmo tempo, um rato e um gato. Evidentemente, então, R a G =
Corjuntos que nao têm regiões de superposição como em [8.3] são ditos conjuntos
m u tu a m e n te e x c lu s iv o s . Se ou não dois conjuntos se sobrepõem, freqüentemente temos
ocasião de aludir aos membros de ambos os conjuntos, tomados simultaneamente, como
um grupo. Se estivéssemos interessados em animais peludos, então ratos e gatos pode
riam ser classificados juntos. Em diagramas Venn, para nos referirmos a essa coleção,
poderíamos escrever:
onde P é o grupo de animais peludos.

Um conjunto X tal que qualquer elemento x é ou um gato ou um rato é chamado
a u n iã o dos dois conjuntos R e G e é escrito: X "RUG. O conjunto Xé o que está
representado pelas áreas sombreadas em |8.4).
Um conceito final será útil. Frequentemente, desejamos discutir o co m p le m e n to de
um conjunto S, simbolizado porS,—>S. O complemento de um dado conjunto é aquele
conjunto que contem todos os n ão membros do conjunto dado. Assim, os conjunto*
complement ares de cada um dos nossos exemplos originais são dados por:
(1) U - Todas as pessoas que não têm cabelos vermelhos na cidade de Kansas.
(2)U -Todos os filmes que não apresentam Guinness
(3)U -Todos os números exceto os ímpares
(4)U -Todos os países do mundo que não têm parlamentos eleito e
(5)U -Todos os comportamentos que não abrem portas.
Note que o complemento e formado pela comparação do conjunto original com o

conjunto universal, escrevendo-sc como complemento o que está fora. Assim, o comple
mento de nosso conjunto K em 18 .1 1c convenientemente representado pela área som
breada em [8.5j
[8.5]
Exercício 6 .
D e m o n stre que S U S — 11 e qu e S A S = cí>.
REFERÊNCIAS PARA OCAPÍTUI O 8

Anger, D. The dependence of interresponse times upon the relative rein
forcement of different interresponse times. J. exp. Psychol., 1956,
52, 145-161.
- 183
Boren, J. J. Resistance to extinction as a function of the fixed ratio. / . exp.
P s y c h o l 1961, 61, 304-308.
Brandauer, C. M. The effects of uniform probabilities of reinforcement on
the response rate of the pigeon. Unpublished doctoral dissertation,
Columbia Univer., 1958.
Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New Y ork:
Findley, J. D. An experimental outline for building and exploring multi
operant behavior repertoires. J. exp. Anal. Behav., 1962, 5, 113
166.
Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a
small-scale (covert) operant. J. exp. Anal. Behav., 1963, 6 , 307
315.
Herrick, R. M. Lever displacement during continuous reinforcement and
during a discrimination. J. comp. Physiol. Psychol., 1963, 56,
700-707.
Herrick, R. M. The successive differentiation of a lever displacement
response. J. exp. Anal. Behav., 1964, 7, 211-215.
Hull, C. L. Principles of behavior. New York: Appleton-Century-Crofts,
1943.
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York:
Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.
1938.
Skinner, B. F. The experimental analysis of behavior. Am er. Sci.f 1957,
45, 343-371.
Skinner, B. F., and Morse, W. H. Fixed-interval reinforcement of running
in a wheel. J. exp. Anal. Behav., 1958, 1, 371-379.
Weissman, N. W., and Crossman, E. K. A comparison of two types of
extinction following fixed-ratio training. J. exp. Anal. Behav., 1966,
9 ,4 1 -4 6 .
Wilson, M. P., and Keller, F. S. On the selective reinforcement of spaced
responses. J. comp, physiol. Psychol., 1953, 46, 190-193.
-1 8 4 -
Capítulo 9: CONTROLE AMBIENTAL
Ao discutir os procedimentos de fortalecimento operante, esquemas e diferenciação,

dedicamos pouca atenção ao ambiente predominante. Durante o fortalecimento da
pressão à barra de um rato, do choro de um bebê, do bicar de um pombo e da expressão
de opinião de um estudante, nosso interesse no ambiente se limitou à verificação de que
o operante era possível (isto é, que barras, discos, e uma história passada com a língua
inglesa existissem quando necessários) e que o reforçamento poderia ser introduzido
quando se desejasse. Contudo, é visível, ao se considerar o comportamento de qualquer
organismo, que essa negligência das condições predominantes do meio deve resultar
numa imagem muito inadequada do comportamento. Em geral, os organismos emitem
respostas seletivamente, de acordo com o estado de seus ambientes presentes ou
passados. Uma criança aprende a chorar somente quando um dos pais está em casa para
reforçar o choro. Um cão não pedirá alimento na ausência de um ser humano. Dificil
mente pediremos água quando ninguém estiver na sala para ouvir (e então nos reforçar).
Todos esses casos ilustram um tipo de controle do comportamento exercido pelo meio,
mas um tipo de controle que difere em vários modos da maneira pela qual os estímulos
eliciadores controlam seus respondentes. Exemplificando,não gritamos nosso pedido no
restaurante, mais e mais alto quanto mais alto for o garção. Por outro lado, um aviso
sussurrado pode gerar uma atividade intensa, se aquilo que se diz justifica tal tipo de
atividade. Numa palavra, as leis do reflexo são inaplicáveis ao controle ambiental de
operantes. Um grupo de leis bem diferentes, expressas em termos da história passada de
reforçamento do organismo, governa a emissão seletiva de operantes. Para formular essas
leis,, todavia, precisamos conceituar um número de dimensões para especificar, analisar e ,
em geral, descrever quantitativamente o ambiente dos organismos.
9.1 DIMENSÕES DO ESTIMULO
O ambiente prevalente de um organismo pode ser considerado como o padrão ou a

configuração de todas as energias, presentes num determinado momento, que são capazes
jde entrar em relação funcional com o comportamento. Essas energias são apena^ um
pequeno subconjunto das energias estudadas pelos físicos. Elas se limitam, namaiona,
àquelas que podem ser detectadas por estruturas anatômicas especializadas, receptores,
que os organismos têm para receber certas energias e transformá-las em impulsos elétricos
- 185 -
nervosos. 0 olho é especializado para a recepção de uma faixa limitada de radiação eletro
magnética, o ouvido para uma faixa limitada da pressão do ar causada por vibrações, a
língua e o nariz para certas energias químicas. Existem receptores na pele que detetam a
pressão mecânica, mudanças térmicas, etc. Há receptores nos músculos e articulações do
corpo que detetam o movimento dos músculos e articulaçõesf, aos quais estão incorpo
rados. Uma especificação completa dos padrões de energia eletromagnéticas, mecânicas,
químicas e térmicas que atingem os receptores dos organismos em qualquer momento
dificilmente será feita. Felizmente, isto nemé sempre necessário. Uma vez que o compor
tamento pode estar sob o controle seletivo de partes ou aspectos limitados de configu
rações de energia que constituem o que chamamos ambiente, somente uma pequena
parte selecionada ou aspecto único de energia do ambiente é variada no trabalho experi
mental. O restante do ambiente é mantido tão constante quanto possível. Esses aspectos
ou partes do meio, experimentalmente manipuláveis, são o que chamamos mais comu-
mente estímulos. De todas as leis do comportamento em que os estímulos participam,
até agora vimos somente as leis do reforçamento e da eliciação; outras comporão o
conteúdo deste capítulo e do seguinte.
O estímulo é uma unidade ambiental arbitrária. Quando manipulamos ou mudamos
aspectos limitados do meio e os correlacionamos com o comportamento, estamos mani
pulando essas unidades. Na manipulação do meio visual, por exemplo, frequentemente
restringimos nossas mudanças experimentais a uma das dimensões fundamentais pelas
quais os físicos descrevem a luz. Para os nossos objetivos, a luz pode ser considerada
como uma faixa limitada de perturbação eletromagnética, irradiada a 300.000 km/seg,
em forma de ondas. As ondas de luz podem ser representadas como na Fig. 9-1. O
comprimento de onda (X , Fig. 9-1, lê-se “ lambda” ) é uma dimensão importante do
estímulo, à qual foram correlacionadas respostas diferentes chamadas nomes das cores.
Os comprimentos de onda que constituem a luz formam apenas uma pequena porção de
todo o espectro eletromagnético.
Comprimento
F igura 9-1. A n a tu re z a o n d u la tó ria reg u lar da luz p u ra . O c o m p rim e n to de o n d a ( À ),

isto é, a d iferen ç a e n tre cristas de o n d as sucessivas, é inversam ente p ro p o rc io n a l à
freq ü ê n cia das o n d as n o te m p o e é co rre la cio n ad o com o que ch am am o s de co r, ou
m atiz, d a luz. A am p litu d e está relacio n ad a com a inten sid ad e de luz.
Na Fig. 9-2, vê-se uma dimensão eletromagética mais completa de X .

Quase todos os organismos respondem a diferenças na amplitude ou intensidade das
ondas de luz,mas somente um número limitado de espécies tem receptores especializados
para detetar mudanças em X Pombos, homens,serpentes e macacos são exemplos de orga
nismos que detetam tais mudanças. Outros, tais como o rato e o cão são ditos cegos a
cores porque diferenças em X apenas não controlam o seu responder diferencial. O
receptor que chamamos de olho é convenientemente comparado a uma câmara fotográ
fica porque ambos têm similaridades funcionais (ver Fig. 9-3). Ambos recebem a luz
- as r -
através de um diafragma ajustável. No olho, este diafragma é chamado íris. Ambos, olho
e câmara, têm lentes através das quais a luz passa e que servem para focalizar a luz numa
superfície sensível. Na câmera, essa superfície constitui a emulsão do filme. No olho a
superfície consiste de células nervosas que constituem a retina. Essas células retínicas
transformam a luz em impulsos nervosos.
Quando as ondas de luz da Fig. 9-2 incidem sobre o olho, elas são algumas vezes
referidas como luzes espectrais puras. Essas são as luzes que aparecem no arco-íris e
podem ser reproduzidas no laboratório por um aparelho chamado monocromador. São
ditas puras porque contêm apenas um comprimento de onda. A maioria das luzes, inclu
indo aquelas que atingem o olho refletidas de superfícies como mesas, cadeiras, quadros
negros, gramados estão longe de serem puras neste sentido. Geralmente, mesmo a luz de
uma superfície homogeneamente colorida ou de uma lâmpada é constituida de uma
grande mistura de comprimento de ondas diferentes. Aqueles comprimentos de onda que
são predominantes determinam, usualmente, a nossa resposta de denominação da cor.
Todavia, algumas misturas de luz não são denominadas por seus comprimentos de onda
predominantes. A palavra “púrpura” nunca é usada para n o m e a r uma luz espectral pura de
um comprimento de onda. “Purpura” é o nome de cor para uma mistura de azul e
vermelho. As luzes que chamamos brancas e as superfícies que chamamos cinzas irradiam
misturas heterogêneas de quase todos os comprimentos de onda visíveis. Nenhum com
primento de onda, isoladamente, predomina em tais luzes, mas o rótulo “sem cor” que
frequentemente lhes é dado parece se. uma designação incorreta.
As dimensões visuais do estímulo não se limitam a distribuições de comprimentos de
onda e intensidades diferentes de feixes de luz isolados. As dimensões relevantes que
podem controlar o comportamento podem ser definidas de modo a incluir combinações
espaciais das dimensões fundamentais de comprimento de onda e intensidade. Por
exemplo, as intensidades relativas de duas regiões de luz adjacentes podem ser uma
dimensão poderosa do estímulo controlador que determina a resposta relativa ao brilho
que um observador dará a uma parte do padrão. Olhando a Fig. 9-4, vê-se que, quando a
quantidade de luz refletida pelo fundo (background) varia, as respostas ao brilho do
triângulo central mudam embora este último permaneça constante. Isto é, o observador
relatará brilhos diferentes do triângulo. (Este fenômeno é chamado contraste de brilho).
De fato, para produzir uma resposta de relatar que o brilho do triângulo não foi alterado,
teríamos de Variá-lO de tal modo que, quando a intensidade do fundo fosse aumentada
(mais luz no fundo) o triângulo seia também proporcionalmente aumentado em inten
sidade (triângulo também mais intenso). Na situação ilustrada pela Fig. 9-4, uma resposta
de relatar um brilho idêntico para os triângulos diferentes é obtida somente quando a
ra z ã o entre as intensidades do triângulo e do fundo é a mesma (Wallach, 1948)l O controle
funcional da resposta de relatar o brilho para os triângulos da Fig. 9-4 está claramente
localizado numa variável ambiental composta. Como esta regularidade entre meio e com
portamento é a base sobre a qual atribuimos o “ status” de estímulo aos eventos do meio,
não haveria motivo para não denominar de estímulo esta variável composta. Essa desig
nação, naturalmente, não exclui o fato de que, com outras contingências predominantes,
o triângulo apenas, ou o fundo apenas, possam também funcionar como estímulos
individuais.
Outro exemplo de controle de estímulo complexo é visto nas linhas da Fig. 9-5,
comumente referido como “ ilusão” de Müller-Lyer. Os dois segmentos de linha hori
zontais são julgados de comprimento desigual porque a variável de estímulo que controla
o julgamento não é apenas a simples variável do comprimento da linha hori-
- 187 —
Retina
Figura 9-3. O olho comparado Funcional e esquemáticamente com urna câmara fotográ
fica (segundo Wald, 1950). "
Figura 9-4. Um exemplo de como as relações entre duas partes do campo visual influen
ciam as respostas (Segundo Boring, Langfeld e Weld, 1948).
>----------<
<------->
Figura 9-5. A ilusáb de Müller-Lyer.
188-
zontal. Em vez disso, a dimensão relevante do estímulo é composta, formada do compri
mento da linha horizontal e ângulo dos dois segmentos das extremidades.
Os estímulos sonoros, como os estímulos luminosos, podem também ser analisados
num conjunto de dimensões que os compõem. O som tem uma semelhança superficial
com a luz, apresentando certas propriedades de onda. Mas as ondas do som são pertur
bações na pressão do ar, propagadas lentamente (213,36 m/seg), mais semelhantes às
ondas do Mar, que são produtos de perturbações na pressão superficial da água. As
mudanças na amplitude das ondas sonoras constituem mudanças na intensidade da
energia e estão associadas a alturas (de som) diferentes. A Fig. 9-6 indica várias inten-
sidades de sons em termos de uma escala logarítmica chamada de decibel; a figura
fornece alguns exemplos comuns das fontes dessas intensidades.
A dimensão comprimento de onda mostra-se adequada para descrever os estímulos
sonoros. O som, todavia, é convencionalmente descrito pelo número de cristas ou ciclos
por segundo (cps) em vez de X . O número de ciclos por segundo, ou a freqüência do
som, é a dimensão em que estão baseadas as respostas de identificar a tonalidade. O
homem é capaz de dar respostas diferenciais de tonalidade numa faixa de 20 -20.000 cps.
Outros animais, tais como cães e morcegos, são capazes de detetar freqüências duas ou
três vezes maiores que nosso limite superior de freqüência. O modo pelo qual as respostas
de identificação da tonalidade variam com a freqüência é ilustrado na Fig. 9-7, que dá a
principal freqüência das várias notas do piano.
Tal como uma luz pura contendo apenas um X é rara, também o é um tom puro
contendo somente uma freqüência. Diapasões e osciladores de laboratório são fontes de
tons puros. Os tons de instrumentos musicais contêm uma mistura de freqüências e a
tonalidade é geralmente determinada pelas freqüências predominantes. Sons comuns tais
como latidos, ruídos de tráfego, conversa e música representam misturas muito com
plexas de muitas freqüências audíveis em intensidades aproximadamente iguais (tais
como aplausos e estática de rádio) é chamado ruído branco, por analogia com a luz
branca.
As dimensões foram conceituadas para descrever as energias que compõem partes do
nosso meio químico, mecânico e térmico. Respostas relativas a cheiro e gosto estão
baseadas em mudanças diferenciais na concentração e estrutura molecular de gases no
nariz e soluções na língua, respectivamente. Mudanças na temperatura superficial são
detetadas por certos receptores que estão situados na pele.
Para descrever os estímulos que se originam dos movimentos dos músculos e tendões,
cham ados prop ri ocep tores, surgem problemas experimentais. A mensuração de
mudanças no meio interno é difícil sem se invadir cirurgicamente o organismo. A locali
zação dos proprioceptores e seus receptores associados torna tais mudanças no meio
interno relativamente inacessíveis, tanto para medir como para manipular. Na prática, os
estímulos internos são, portanto, quase sempre mais inferidos que realmente observados.
Note que nesta discussão empregamos um grupo de termos para descrever as dimen
sões de estímulo e outro grupo para descrever as respostas comportamentais correspon
dentes. Embora haja correlações regulares entre esses estímulos e as dimensões da res
posta (descritas extensamente na área da psicologia chamada psicofísica) as denomina
ções dos estímulos e das respostas não devem ser contundidas. Frequência e intensidade
de energia luminosa são dimensões do estímulo; cor e brilho são dimensões da resposta.
Freqüência e intensidade de energia sonora são dimensões do estímulo; volume e altura
são dimensões da resposta. Cheiro, gosto, temperatura e peso são termos de resposta
- 189-
140 Sistem a dc am pliação de alta p o tên cia
Avião - 1600 rpm . 5,5m

120 M artelar em aço , 60 cm
T rovão
C aldeira de um a fábrica
100 M etro, estação local (trem passando)
. Local mais ru id o so em Niagara Falls
I 80
^ R ugido do leão
2STrafego m u ito in ten so , 4,5m
^ Rádio m uito alto
4(j> - C onversação no rm al, lm
T3 — E scritório ru id o so ou uma loja
T3
» 0 E scritó rio m edio
Rua residencial tran q ü ila
•3 Rua p o u co m ov im entad a
•s
f 10 R esidência m édia
c Música b<’m suave
4>
? 20 Sussurro suave, l,5 m
z R uído m ínim o ao ar livre
o
2° 3 0 i 100 1
1,000 I 1 10 ,0 0 0 1
50 50Q 2 Ü Q C 1.5 0 Q Q -. 20.0QQ
F re q ü ên cia (ciclos p o r segundo).
Figura 9-6. Intensidade de alguns sons familiares (segundo Lewis, 1963).
associados com as dimensões de estimulo da estrutura química, energia térmica,

quantidade de força, e assim por diante. O reconhecimento da diferença entre os termos
apropriados para descrever os estímulos e aqueles para descrever as respostas impedirá
bastante confusão e discussão desnecessária.
9.2 GENERALIZAÇÃO DE ESTIMULO
A importância de se ter dimensões quantitativas disponíveis para descrever e manipu

lar os ambientes dos organismos é vista claramente na quantificação do fenômeno com
portamental conhecido como generalização de estímulo. Este fenômeno é observado
numa forma grosseira quando uma criança aprendendo a falar se refere a todos os objetos
peludos como “ gatos” e chama todos os homens adultos de “papai” . Ele é exemplificado
em nosso próprio comportamento, quando acenamos a um estranho por engano porque
se assemelha a um amigo. Nestes exemplos a similaridade de estímulos parece estar
claramente envolvida, mas até que possamos especificar as dimensões quantitativas às
quais relacionar objetos tais corno gatos, coelhos e casacos de pele, uma avaliação precisa
do grau de similaridade de duas quaisquer situações de estímulo é difícil. A disponibi
lidade de dimensões de estímulos do tipo descrito na seção 9.1 permite um estudo mais
sistemático desse tipo de similaridade que pode ser experimentalmente reinterpretada
como se segue. Depois que uma resposta foi fortalecida na presença de uma configuração
- 190 -
C médio
M iC iW ^ A ^ C D E
T e c la d o d o p ian o
t
A ltu ra p a d rã o : 4 4 0 cps
L J ------------------- 1--------------------- 1_____________ I__________________ I______________I_____________ I_____________ L_J
25 50 100 200 500 1000 2000 4000
F re q ü ê n c ia em ciclos p o r seg u n d o
F ig u ra 9-7. F re q ü ê n c ia s d o som de vários to n s do p ia n o (seg u n d o B oring, L angfeld e

W eld, 1 9 4 8 ).
particular do meio, ela ocorrerá também, mas numa extensão menor, quando o meio
estiver ligeiramente alterado de algum modo. A resposta pode desaparecer totalmente
quando a mudança no meio fôr grande demais. A importância dessas proposições é
enfatizar os comentários feitos na introdução deste capítulo: o estado particular do
ambiente na ocasião em que o operante é fortalecido, é um fator importante que
controla a emissão da resposta.
O método para avaliar a importância do ambiente predominante durante o condicio

namento é simples, em princípio. Um determinado operante de algum organismo deve ser
fortalecido com o ambiente num estado ou configuração particular. Após o processo de
aquisição se completar, podem ser feitas variações em algum aspecto bem controlado do
ambiente e a força da resposta pode ser testada na nova configuração ambiental. Na
prática, o experimento oferece bastante complicação para justificar uma descrição um
pouco mais detalhada.
Um pombo faminto pode ser colocado numa caixa do tipo descrito anteriormente
(Fig. 5-11). A aparelhagem é modificada como é visto na ilustração da Parte 2, à p. 121
(segundo Guttman, 1956), de modo que o painel de bicar é transluminado por uma luz
pura vinda de um monocromador. O monocromador permite a seleção precisa e a apre
sentação de qualquer um de um grande número de comprimentos de onda visíveis. A
aparelhagem também permite mudanças rápidas de um comprimento de onda para outro.
Num experimento executado por Guttman e Kalish (1956), os animais foram modelados
a bicar o disco que era transluminado por uma luz amarelo-esverdeada (ver Fig. 9-2) de
550my (my = milimicron = 10“6 cm: uma medida de X . comprimento de onda).
Após alguns treinamentos em crf, os animais foram colocados num esquema de intervalo
variável (IV 1 min). Quando o comportamento havia estabilizado em IV, realizou-se
testes para se determinar até que ponto a luz específica de 550 my- no disco estava
controlando o comportamento. Este teste consistiu de um procedimento de extinção no
qual os animais foram expostos a séries aleatórias de apresentações sucessivas de 30 seg
de 11 comprimentos de onda diferentes, dos quais somente um era o 550 my realmente
- 191 -
no treinamento. Nenhuma outra mudança foi feita no ambiente dos animais. (O
U ia d o
procedimento é visto em notação nos diagramas abaixo).
tre in a m e n to r » s+
1 ( 3 se g )- ]
Í
estab iliza ção em I V T(i min) —* IR —* |^"+
_ L_ [T (3 s e g )—j
S.">50 m ju S 570 $510 m fi

T estes em e x tin ç ã o R -/-» R R -/->
X<30 seg) [£ (3 0 SCg)- * H(30 seg)

Quando os números de respostas emitidas em extinção sob cada um dos estímulos
diferentes foram examinados, eles se apresentaram sob a forma da Fig. 9-8. Essa figura
indica que os animais deram o número máximo de respostas em extinção apenas na
presença do estímulo de treinamento e deram gradualmente menos respostas aos estímu-
los-teste localizados progressivamente além do estímulo de treinamento ao longo da
dimensão X . Esta gradação do responder, observada quando a força da resposta é
avaliada em ambientes algo diferentes daquele em que o fortalecimento original ocorreu,
é conhecida como gradiente de generalização. Em termos técnicos, “o gradiente de
generalização é operacionalmente definido por uma sucessão de decréscimos de um
valor estabelecido de força da resposta” (Guttman. 1956).
A técnica de Guttman-Kalish ilustra bem como procedimentos tais como esquema de
reforçamento e extinção podem ser combinados para avaliar certos fenômenos funda
mentais do comportamento. Por exemplo, considere o objetivo do esquema IV no treino.
Reexaminando a Fig. 7-9, vê-se que o IV produz uma grande persistência face à extinção.
Vários milhares de respostas podem ocorrer antes que a taxa de extinção comece a cair
apreciavelmente. Na generalização, estamos preocupados com a extensão da força
da resposta a condições de estímulo outras que não aquelas ern que o reforçamento
realmente se efetivou. Para fazer os testes necessários para se avaliar esse
extensão, nunca devemos reforçar na presença das novas e diferentes condições de
estímulo. Caso contrário qualquer resposta que observássemos podjria ser atribuível
ao reforçamento direto na presença dos novos estímulos. Mas o uso do procedimento
de extinção enfraquece o comportamento. Como poderemos testar 1 1 valores
diferentes de estímulo em face desse enfraquecimento? A solução para esse problema
se encontra em ( 1 ) fazer a apresentação de cada estímulo-teste diferente rapidamente
(cerca de 30 seg), (2) apresentar os estímulos-teste diferentes numa ordem aleatória, e
(3) usar um esquema IV no treino para desenvolver uma persistência de vários milhares
de respostas potenciaisem extinção, antes que os sinais característicos de
enfraquecimento comecem a ocorrer
- 192-
Comprimento dc onda (milimicrons)
Figura 9-8. Respostas em extinção, emitidas na presença de 11 comprimentos de onda
diferentes projetados um de cada vez na chave. O treino ocorreu apenas em 500m jj
(Guttman, 1956)
Os resultados da Fig. 9-8 confirmam a vantagem de se representar quantitativamente
os estímulos. Suponhamos que o experimento de Guttman e Kalish tivesse sido execu
tado antes de se saber que a luz poderia ser representada por ondas e medida através do
comprimento de onda. Se o pombo tivesse sido treinado a bicar um disco coberto com
papel verde e, então, testado em extinção com papéis verdes e de outras cores no disco,
digamos azul, violeta, vermelho, laranja e amarelo, certamente teriam ocorrido diferenças
no responder a essas cores. Mas, considere como um gráfico igual ao da Fig. 9-8 poderia
ter sido desenhado. O fato de que nenhuma dimensão quantitativa (numérica) existia
para relacionar as diferentes cores umas às outras, teria excluído tal representação
funcional. No nosso exemplo hipotético, não temos base para interpolar os valores da
força da resposta entre duas quaisquer cores empregadas. Na função da Fig. 9-8, fizemos
isso facilmente, conectando as forças da resposta para dois estímulos quantitativamente
adjacentes com uma linha reta. Esta interpolação por linhas retas nos permite prever a
quantidade de generalização a luzes não usadas no experimento. O máximo que
poderíamos fazer com um experimento realizado antes da descoberta de especificações
numéricas da luz por seus cumprimentos de onda, teria sido desenhar um gráfico com
barras do tipo visto na Fig. 9-9. Na falta de um método melhor, as cores da Fig. 9-9 estão
distribuídas alfabeticamente ao longo da abeissa. O fato de nenhuma variável
independente ser designado para o eixo do X da Fig. 9-9 mostra quão deficiente esta
representação teria sido. Aqui, temos alguma noção da importância de dimensões
quantitativas para especificar e relacionar as variáveis independentes em qualquer
ciência. Além disso, o exemplo é útil para mostrar como uma ciência (no caso,
psicologia), frequentemente toma emprestado os métodos e descobertas de outra (no
caso, física), e os explora para seu próprio uso em contextos inteiramente diferentes
daqueles nos quais os métodos foram originalmente desenvolvidos.
- 193
A forma real do gradiente de generalização variará de acordo com as dimensões
particulares do estímulo empregado , o esquema e tipo de reforçamento no treino do
organismo em estudo, e mesmo o valor do estímulo particular de treinamento numa dada
dimensão. .Assim, qualquer busca do gradiente de generalização deve ser abandonada.
Algumas vezes, um “gradiente” pode mesmo não aparecer e uma curva achatada de
generalização é obtida. Quando a freqüência de som é usada num experimento seme
lhante ao de Guttman e Kalish, o grandiente de generalização do pombo para freqüências
de sons apresenta a forma da Fig. 9-10. As curvas da Fig. 9-10 são essencialmente
achatadas.
Fig 9-9. Respostas hipotéticas em extinção, emitidas às várias cores depois de um

treino na presença do verde.
Embora o bicar o disco fosse originalmente fortalecido exclusivamente em 1.000 cps,
todos os tons entre 300 e 3.500 (e também nenhum tom) adquiriram igual poder de
controlar a emissão da resposta. Não fosse o fato, conhecido através de outros experi
mentos, de que o pombo p o d e detetar diferencialmente esses vários sons, seriamos incli
nados a concluir que a dimensão de freqüência é irrelevante em termos comportamentais.
Como tal, seria análoga à porção da dimensão X em torno da região de radiação gama, ou
à dimensão que descreve o nível de tráfego numa rua de Tóquio em relação a esse animal
se comportando em Nova Jersey. Somos forçados a adiar, todavia, uma discussão deta
lhada das variáveis responsáveis pelas diferenças entre as Figs. 9-8 e 9-10 até que os
princípios do próximo capítulo sejam introduzidos.
Freqüência (ciclos por segundo)

Figura 9-10. Gradientes de generalização ao longo da dimensão de freqüência do som
para três animais. Um tom de 1.000 cps estava presente durante o fortalecimento da
resposta de bicar o disco (Jenkins e Harrison, 1960).
-1 9 4 -
Mesmo ao longo da própria dimensão comprimento de onda da luz, o uso de
estímulos de treinamento diferentes de 550m y produz gradientes de formas diferentes.
Blough(1961) obteve os dados apresentados na Fig. 9-11 quando treinou três grupos de
animais em 530 my, 550my e 570my, respectivamente. Como a figura indica, a forma
real do gradiente obtido varia dependendo de onde o estímulo de treinamento se
encontra na dimensão X .
<u
•o
3 30
l igura 9-11. Gradientes dc generalização em torno de cada um dos três diferentes

comprimentos de onda de treinamento. Oito animais deram origem às curvas - dois
com 530 my quatro em 5 5 0 m y ,e dois em 570 m y (Blough, 1961).
Em 530 my, a área maior do gradiente encontra-se à esquerda do estímulo dc treina

mento. Em 550 my por outro háo, encontra-se à direita. Somente em 570 my aparece
um gradiente simétrico. Note que o gradiente em torno de 550 my, na Fig. 9-11 difere
um pouco do originalmente obtido por Guttman e Kalish em 1956 (visto na Fig. 9-8). A
razão dessa diferença parece estar no fato de que Blough introduziu uma precaução
adicional ao coletar seus dados. Sabendo que o olho do pombo é mais sensível a alguns
comprimentos de onda que a outros, ele usou intensidades ligeiramente diferentes para
cada estímulo-teste. A forma do gradiente obtido por Blough sugere que há regiões
circunscritas ao longo do espectro de À nas quais a generalização ocorre mais pronta
mente. “Treinado próximo ao centro de tal região, o animal generalizaria dentro da
região, produzindo um gradiente simétrico e com o topo achatado. Treinado na extremi
dade de tal região, o animal generalizaria em direção à região; na outra direção, sua curva
cairia mais rapidamente, produzindo um gradiente assimétrico” (Blough, 1961, p. 38).
As três curvas da Fig. 9-1 1 sugerem que duas dessas regiões estão centralizadas em
aproximadamente 515 my e 570 my, respectivamente. É tentador igualar a presença
dessas duas regiões às “bandas de cores” que o homem discrimina no espectro. Esses e
outros resultados indicam que o estudo da generalização comportamental promete
elucidar as propriedades fundamentais do olho de organismos infra-humanos.
O paradigma simples da generalização pode ser ampliado, examinando*se os efeitos
produzidos quando mais de um estímulo é usado no treino. Num experimento de Kalish
e Guttman (1957), luzes alternadas de 530 my e 560 my foram usadas durante o
fortalecimento inicial e a estabilização subsequente em IV. O teste de generalização foi
efetuado do modo usual. A curva obtida é vista na Fig. 9-12. Parece que este gradiente é
um composto de gradientes individuais. Um trabalho posterior (Kalish eGuttm an, 1959)
indicou que ele, provavelmente, representa uma simples superposição de dois gradientes
de generalização. Um aspecto importante desse procedimento de treino em mais de um
valor do estímulo é a sua capacidade para ampliar o gradiente de generalização. Usando
ainda mais que dois estímulos de treinamento, este gradiente pode ser ampliado o quanto
- 195-
Comprimento de onda (milimicrons).
Figura 9-12. Gradientes de generalização ao longo da dimensão comprimento de onda,

/
depois do treino na presença de dois estímulos: 530 my e 560 my (segundo Kalish e
Guttman, 1957).
desejarmos, o que, como veremos mais tarde, e bastante signiticante para o ensino de
conceitos gerais à criança.
Fora do laboratório, naturalmente, a generalização nunca é limitada a uma única dimensão
ambiental. Quando ocidentais ingênuos observam que todos os orientais se parecem, está
ocorrendo generalização de um estímulo complexo (o primeiro oriental ou o primeiro
ocidental visto) para outros estímulos “teste” (outros orientais, ou outros ocidentais).
Um estímulo pode ser dito complexo quando mesmo sua descrição parcial envolve mais
dimensões do que seria prático enumerar. As generalizações complexas, como as vistas
fora do laboratório, podem ser inferidas como sendo baseadas em espalhamentos do tipo
da Fig. 9-8, ao longo de cada dimensão que o estímulo de treinamento e aos estímulos-
teste compartilham. Podemos tentar verificar esta hipótese, pelo menos parcialmente,
ampliando nossos estímulos-teste experimentais de modo a incluir mudanças feitas simul
taneamente em duas dimensões de um estímulo-teste. Ao se iluminar um disco de um
pombo com luzes puras de vários comprimentos de onda, estabelece-se uma dimensão de
estímulo bem controlada, X, como já vimos. Na Fig. 9-13, a luz no disco forma uma
espécie de barra. Se este padrão de barra é girado em torno do centro do disco para
qualquer de várias posições, adicionamos ao estímulo uma segunda dimensão indepen
dente - orientação angular do padrão de luz.
- 196-
Verde Amarelo Vermelho Violeta
Figura 9-13. Estímulos criados pela manipulação independente de duas dimensões

ambientais fisicamente definidas.
Suponhamos que um animal seja treinado e subsequentemente estabilizado em um

esquema IV, na presença de um estímulo que pode ser descrito por um determinado
valor de comprimento de onda (digamos 550 my, 4verde” ) e por uma determinada
orientação angular (digamos 0o, “ vertical”). Então, usando estímulos-teste que difiram
tanto em ângulo como em comprimento de onda durante a extinção, um gradiente de
generalização que se estende sobre duas dimensões, pode ser determinado. O tratamento
detalhado dos resultados quantitativos de um experimento deste tipo está além do obje
tivo da presente consideração. É suficiente notar que uma diminuição ordenada da gene
ralização ocorre para os estímulos-teste que diferem em duas dimensões do estímulo
original de treinamento. Esta diminuição é uma função complexa da distância de ambos
os valores dimensionais do estímulo-teste em relação aos valores iniciais do estímulo
original de treinamento (Butter, 1963).
9.3 GENERALIZAÇÃO DA EXTINÇÃO
Assim como os efeitos fortalecedores do reforçamento de uma dada resposta numa

determinada configuração de estimulo difundem-se de modo a incorporar outras configu
rações de estímulo, também os efeitos enfraquecedores da extinção difundem-se para
condições de estímulos outras que não aquela particular sob a qual a extinção foi efe
tuada. Este fenômeno é chamado generalização da extinção. Para observá-lo, iniciamos
com um operante que já existe com alta força na presença de uma faixa de estímulos.
Processa-se, então, a extinção, na presença de apenas um dos estímulos. Quando o
processo de extinção se completa para este estímulo, os outros estímulos de toda a faixa
são testados para se verificara extensão em que eles têm ainda o poder de controlar a
emissão da resposta. Este procedimento pode ser resumido em quatro fases:
Fase I. Fortalecimento inicial de um operante numa
situação de estímulo.
Fase II. Manutenção do operante (usualmente com um
esquema IV) na mesma e em outras situações de
estímulo.
Fase III. Extinção prolongada do operante em apenas uma
das situações de estímulo previamente usadas.
Fase IV. Testes de extinção conduzidos com todos os esti
mulos usados na Fase II.
19/
Homg v l5 o l) executou e:.e experimento e obteve os resultados apresentados na
Fig. 9-14. A porção denominada iinha-base foi obtida na fase II. Nesta fase, pombos
Figura 9-14. Generalização de extinção ao longo do continuum comprimento de onda.

O treino em IV foi efetuado em 1 3 valores, de 510 a 630 mjJ.A extinção ocorreu em
570 m y ( segundo Honig, 1961).
famintos bicavam o disco num esquema de reforçamento em IV que vigorou para 13

comprimentos de onda diferentes no curso do treinamento. Este procedimento é uma
extensão do treinamento empregado por Kalish e Guttman (1957) com dois compri
mentos de onda diferentes (ver Fig. 9-12) e produz uma curva de generalização aproxima
damente achatada, ao longo de todo o continuum do espectro. Na fase 111, Honig
efetuou a extinção exclusivamente em 570 my. Finalmente, o gradiente em forma de U
visto na Fig. 9-14 foi obtido testando-se as taxas de resposta em extinção com os outros
12 estímulos. Sob as condições deste experimento, um gradiente de generalização inver
tido e algo mais achatado é produzido, ao invés daqueles da seção 9.2. É difícil dizer se a
diferença no achatamento indica uma diferença fundamental entre generalização de
extinção e generalização de reforçamento. Nn estudo de Honig, a extinção em 570 mu
- 198-
não foi completada na Fase III; a parte inferior da função em U da Fig. 9-14 mostra que,
em 570 my, a taxa de resposta no teste está bem acima do nível operante zero, normal
mente associado com o operante de bicar a chave.
A generalização de estímulo na extinção e a generalização de estímulo no
re fo rç a m e n to são procedimentos inversos. Um envolve um espalhamento do
enfraquecimento e o outro envolve um espalhamento do fortalecimento. A Tabela 9-1
contrasta seus procedimentos de definição.
Tabela 9-1
UMA COMPARAÇÃO DOS PROCEDIMENTOS DE GENERALIZAÇÃO DE

ESTIMULO NO REFORÇAMENTO E GENERALIZAÇÃO DE ESTIMULO NA
EXTINÇÃO
GENERALIZAÇÃO
REFORÇAMENTO EXTINÇÃO
No iti ício força baixa de R numa faixa de Ss Força alta de R,

numa faixa de Ss
Operação fundamental Fortalecimento de R em um valor de S Enfraquecimento de

R em um valor de S
Teste Numerosos Ss, ao longo de uma faixa, são apresentados e c

procedimento de extinção fica constantemente em efeito.
9.4 ALGUMAS IMPLICAÇÕES DA GENERALIZAÇÃO
Anteriormente, na seção 9.2, destacamos rapidamente alguns exemplos, fora do

laboratório, da generalização de estímulo. Esses exemplos de crianças que confundem
uma situação com outra através de respostas indiscriminadas são casos em que a generali
zação parece impedir a adaptação de um organismo a seu mundo. Mas a generalização é.
quase sempre, uma propriedade muito útil do comportamento. Por exemplo, as habili
dades aprendidas numa situação ambiental podem ser usadas em novas sistuações ambien
tais. Tendo aprendido a pegar uma bola jogada a uma distância dei ,5m, podemos pegá-la
também a 3,0, 6,0 e talvez até 12,0 m. Os pais que ensinam suas crianças a dizerem
“obrigado” em casa estão implicitamente contando com a generalização para que o
“obrigado” seja emitido fora de casa. Nosso sistema educacional está baseado na supo
sição de que as habilidades adquiridas na escola se difundirão em ambientes fora da
escola. Não obstante, o gradiente de generalização está aí para lembrar e acautelar os
educadores de que, quanto mais uma situação de treino se parecer com a situação na qual
o comportamento será necessário mais tarde, tanto mais efetivo será o treino. Escolas c
outras agências usam este princípio quando fazem a situação de ensino mais próxima
possível da “vida real” .
- 199 -
Os resultados vistos nus seções 9.2 e 9.3 fundamentam a conclusão inevitável de que
ambos o reforçamento e a extinção são um tanto específicos ao estado do ambiente
preciominante quando eles ocorrem. O termo 'um tanto’ tem uma significação precisa na
forma dos gradientes de generalização que podem ser observados quando mudanças
controladas numa ou duas dimensões de estímulo, fisicamente especificadas, são feitas.
Generalização, assim, é um conceito estático. Ao contrário de muitos dos fenômenos
comportamentais já familiares (condicionamento, extinção, diferenciação), a generali
zação, em si mesmaj não é um processo. Isto é, ela não é uma mudança no compor
tamento, no tempo, com um procedimento fixo mantido constante. Em vez disso, ela é um
fenômeno que pode ser observado depois do fortalecimento ou enfraquecimento, através
do emprego de uma certa seqüência de operações (por exemplo, as fases da seção 9.3).
Num processo comportamental verdadeiro, o tempo aparece como a variável indepen
dente. Mas, nos gradientes de generalização, a diferença entre os estímulos de treino e de
teste é a variável independente. Embora seja estática neste sentido, veremos no próximo
capítulo como a generalização do enfraquecimento e a do fortalecimento se combinam
no paradigma de discriminação, gerando um dos mais fundamentais processos compor
tamentais conhecidos.
As descobenas de. laboratório sobre a generalização trazem certas implicações para
um velho problema filosófico, o do significado de similaridade. Os comentários lúcidos
de C. E. Osgood ilustram a forma pela qual o método experimental na psicologia pode/
ocasionalmente, fornecer uma re-interpretação moderna de problemas filosóficos tradi
cionais.
“Suponha que perguntemos (como temos muitas vezes perguntado em aulas introdu
tórias de filosofia): O que é mais semelhante a um quadrado vermelho um
quadrado verde ou um círculo vennelho? O psicólogo com uma orientação empírica
cansa-se rapidamente de discutir assuntos como ‘a relação de qualidades únicas’ e
corre ao laboratório para “ averiguar”! Após estabelecer uma reação, qualquer reação,
ao quadrado vennelho, ele testa seu sujeito humano para a generalização ao quadra
do verde e círculo vermelho. Irá o círculo vennelho mostrar mais generalização? Se
assim o for, o círculo vennelho está mais perto do quadrado vennelho que o círculo
verde! Isto significa que temos agora uma escala objetiva para m edir‘similaridade'?
Somente quando estamos interessados na similaridade quando definida pelo comporta
mento de um organismo. E este deve ser um tipo específico de organismo, desde que
a similaridade para o rato, assim definida (ou para o colono australiano, por exem
plo), não seria necessariamente paralela à do Homo Sapiens ocidental.
Isto levanta um problema m enor re la tiv o ao jargão psicológico nós
tomamos conhecimento periódico mas nunca observamos na totalidade. Seguimos o
ímpeto, da nossa linguagem e dizemos que ‘há mais generalização entre esses dois
estímulos porque eles são mais aproximadamente ‘similares’, e então (como o psicó
logo jovem e impetuoso citado acima), afinnamos que 'esses dois estímulos são mais
aproximadamente similares porque há mais generalização entre eles’. Ambas as pro
posições são válidas,, dependendo da definição particular de similaridade. Utilizando
um analisador de freqüência de onda, podemos medir a similaridade física ( proximi
dade no continuum de freqüência) de dois tons e então medir a generalização em
função desta similaridade. Por outro lado, podemos usar um grupo de organismos
como instrumentos de medida da similaridade de tons, como na psicofi' ‘â, o que,
na verdade, c medir contínuos físicos em termos de generalização e disc run in ação.
- 200 -
Observe cuidadosamente, todavia, que não há garantia de que as duas medidas de
similaridade serão paralelas; de fato, raramente o são. A ilustração mais clara disto se
encontra no fenômeno de generalização de oitava. Tanto para o rato como para o
homem, pelo menos, a generalização de resposta a tons separados por uma oitava é
maior que a tons mais próximos no continuum físico de freqüência, e eles soam mais
aproximadamente ‘similares’. Mas, naturalmente, existem aqueles que diriam que o
conceito de similaridade é significante apenas em tennos do comportamento dos
organismos. Neste caso, devemos nos contentar com tantos tipos de similaridades
quantas são as especies e culturas dentro das espécies” (Osgood, 1953, p. 361).
9.5 NOTAS SOBRE O DELINEAMENTO DE EXPERIMENTOS EM PSICOLOGIA

USANDO ANIMAIS COMO SUJEITOS.
U uso de animais como sujeitos em experimentos de psicologia pode ser conveniente
mente datado a partir dos experimentos iniciais de Thorndike sobre aprendizagem em
tentativa e erro. Os próprios comentários de Thorndike sobre as vantagens do uso de
sujeitos animais em experimentos de psicologia são uma boa leitura, mesmo atualmente.
Quando é desejável se obter um melhor controle da história passada e presente de um
organismo do que é possível com um ser humano; quando é desejável investigar faixas
amplas de variáveis como choques elétricos intensos, luz forte, e assim por diante; e
quando exigimos um período de tempo maior do nosso sujeito do que o horário de uni
versitário permita, frequentemente, podemos nos voltar para uma ou outra da grande
variedade de espécies animais à disposição, sem muita perda na generalidade dos nossos
resultados. O objetivo das presentes notas não é tanto considerar o problema da generali
zação dos resultados de experimentos com animais para seres humanos, mas, mais que
isso, fornecei uma fórmula geral para o delineamento de experimentos com animais em
psicologia.
Nota A. Devemos começar com um animal adequado. (Em geral, desejamos que
nossos resultados sejam aplicáveis a uma larga faixa de espécies, incluindo o homem). Isto
é, primeiro, se o problema psicológico em investigação é um que requer comportamento
de escolha ou comportamento instrumental (e praticamente todos requerem), então de
vemos escolher um organismo que emita este comportamento. Devemos, em outras pala
vras, escolher um organismo que tenha operantes. De acordo com este critério, podemos
então escolher vermes anelídeos, camelos ou delfins e não devemos escolher protozoá-
rios, esponjas ou moluscos já que nunca se demonstrou que estes organismos apresentam
comportamentos que seguem as leis do fortalecimento operante. Não precisamos, neces
sariamente, escolher um animal próximo ao homem na escala filogenética, a menos que o
nosso experimento pretenda estudar características comportamentais apresentadas so
mente por esses organismos filogeneticamente superiores . Para muitos problemas em
aprendizagem, discriminação, diferenciação ou encadeamento, animais tão modestos
como o rato ou o pombo comum satisfarão.
Nota B. Tendo selecionado nossa espécie, devemos tratar do problema relacionado
ao tipo de experiência passada que os animais particulares tiveram (ou não tiveram), se
queremos que eles sejam sujeitos apropriados. Evidentemente, se estamos delineando um
experimento para examinar o processo de aquisição e o nosso animal já adquiriu a
resposta selecionada — ou uma muito semelhante - ele não será um sujeito adequado.
Similarmente, se estamos interessados em resultados de extinção, um animal com história
prévia de extinção da resposta especificada se comportará de um modo bastante diferente
- 201 -
de um que não tenha esta história. Frequentemente, em vez de manter um registro de
histórias particulares os psicólogos escolhem animais que não têm qualquer história experi
mental e que foram criados em condições controladas. Esses animais, quando usados pela
primeira vez, são ditos “ ingênuos” experimentalmente. Não é sempre necessário usar tais
animais ingênuos; mas devemos nos certificar de que a história particular de nossos
animais não vai, indevidamente, prejudicar nossos resultados. A uniformidade de nossos
resultados será a nossa justificação final.
Nota C. Finalmente, devemos motivar nosso animal. Aqui, o problema de controle e
mensuração é muito mais fácil que com humanos. Podemos privar nosso pombo de
alimento por, digamos 22 horas, depois do que podemos usar pequenas quantidades de
alimento como um reforçador conveniente; ou podemos esfriar o compartimento de
nosso rato até um nível próximo ao do congelamento, depois do que podemos usar um
breve sopro de ar quente como um reforçador.
As notas A, B e C são sugestões para se conseguir um animal representativo que sirva
como uma preparação experimental para o estudo do compolam ento.
REFERÊNCIAS PARA O CAPITULO 9. '

Blough, D. The shape of some wavelength generalization gradients. /.
exp. Anal. Behav., 1 9 6 1 ,4 ,3 1 -4 0 .
Boring, E. G., Langfeld, H. W., and Weld, H. P. Foundations of psy
chology. New York: Wiley, 1948.
Butter, C. M. Stimulus generalization along one and two dimensions in
pigeons. J. exp. Psychol., 1963, 65, 339-345.
G uttm an, N. The pigeon and the spectrum and other complexities.
Psychol. Rep., 1956, 2 , 449-460.
Guttm an, N., and Kalish, H. I. Discriminability and stimulus generaliza
tion. J. exp. Psychol., 1956, 51, 7 9-88.
Guttm an, N., and Kalish, H. I. Experiments in discrimination. Sci. Am er.,
Jan. 1958, 1 9 8 ,7 8 -7 9 .
Honig, W. Generalization of extinction on the spectral continuum.
Psychol: Rec., 1 9 6 1 ,1 1 ,2 6 9 -2 7 8 .
Jenkins, H. ML, and Harrison, R. H. Effect of discrimination training on
auditory generalization. J . exp. Psychol., 1960, 59, 246-253.
Kalish, H. I., and Guttm an, N. Stimulus generalization after equal train
ing on two stim uli./. exp. Psychol., 1957,53, 139-144.
Kalish, H. I., and Guttm an, N. Stimulus generalization after training on
three stimuli: a test of the summation hypothesis. J. exp. Psychol.,
1 9 5 9 ,5 7 ,2 6 8 -2 7 2 .
Lewis, D.' J. Scientific principles of psychology. Englewood Cliffs:
Prentice-Hall, 1963.
Y ork: Oxford Univer. Press, 1953.
Wald, G. Eye and camera. Sci. Am er., Aug. 1950, 182, 32-41.
Wallach, H. Brightness constancy and the nature of achromatic colors.
. exp. Psychol., 1948, 38, 310-324.
- 202 -
TERCEIRA PARTE
UNIDADES COMPONENTES DO COMPORTAMENTO
10 - DISCRIMINAÇÃO
11 - REFORÇADORES ADQUIRIDOS
12 - ENCADEAMENTOS
Capítulo 10 DISCRIMINAÇÃO
Uma característica marcante dos organismos é a sua habilidade para formar discrimi
nações. Definida como o responder diferencial na presença de situações diferentes, a
discriminação contrasta com a generalização, definida como o responder similar em
situações diferentes.
As discriminações são demonstradas ao nível humano pela habilidade de “distinguir
uma coisa da outra” . Alguns de nós, por exemplo, discriminamos os quadros de Monet
dos de Manet, manteiga de margarina, dois grupos de impressões digitais semelhantes,
dois sinais morse semelhantes. Ao “distinguir uma coisa da outra” estamos fazendo nada
mais nada menos do que demonstrando um responder diferencial em suas respectivas
presenças.
Para distinguir objetos desta forma, uma certa história passada específica parece ser
um pré-requisito. Fazemos estas e outras discriminações tão casual e naturalmente,
todavia, que frequentemente negligenciamos a necessidade desta história passada.
Lembre-se, do capítulo anterior, que, tendo fortalecido uma resposta na presença de um
estímulo, a resposta ocorrerá, embora com menor força, na presença de outros estímulos
relacionados. Se um determinado estímulo é muito semelhante ao estímulo de treino, ele
pode controlar a resposta quase tão bem quanto o estímulo real de treinamento. O
procedimento de discriminação é um método para quebrar o controle generalizado do
responder mantido por uma ampla classe de situações, de modo que as situações muito
semelhantes passem a ser associadas com comportamentos muito diferentes.
Em termos de generalização quantitativa ao longo de uma única dimensão de
estímulo, esta divisão ou quebra determina o estreitamento de um gradiente particular da
força da resposta em torno de um valor de estímulo: um animal é treinado a bicar apenas
um disco verde e não outros, uma criança é treinada a restringir o nome “gato” para um
único subconjunto de animais peludos. O procedimento pelo qual tais efeitos são obtidos
é direto: o reforçamento de um determinado comportamento é restrito a uma dada
situação. Embora este procedimento de tornar o reforçamento de um operante particular
condicional à existência de uma situação o estímuloparticular seja suficientemente gerai
para incluir todas as discriminações, há bastante variações que merecem uma classificação
de discriminações em termos de complexidade, como é indicado pelo número de
situações e estímulos e correlações de resposta associadas requeridas. Em cada um dos
- 205-
quatro exemplos que se seguem, um comportamento diferencial está associado com
diferentes ambientes.
1 . O cinemeiro que discrimina não vai a todos os filmes que são levados ao cinema da
vizinhança. Ele vai (R) a alguns (Sa), e não vai (ausência de R) a outros (S r).
2. DizemosquealgunsgruposdcpcssoassíK) discriminadas quando elas são tratadas de
am modo diferente que outras pessoas são tratadas. Isto é, o grupo discriminado (Sy\^ é
tratado de um modo (R a ), e outras pessoas (S r ) são tratadas de outro modo (R r )
3. O provador de vinhos profissional pode discriminar uma variedade de vinhos que
têm o mesmo sabor para o iniciante. A discriminação do profissional é evidenciada por
sua habilidade em dar um nome particular (Rj R2 , R 3 ........RlOO) Para cada um dc mil
vinhos diferentes ( S j, S2 , S3 , . . S\ .000)-
4. Nas discriminações sutis que um relojoeiro deve fazer quando coloca (Ry) cada
uma de uma dúzia de pequenas peças no lugar apropriado (Sx), a diferença entre a
posição correta e incorreta é medida em frações de milímetros.
Cada um dos quatro exemplos ilustra um nível progressivamente mais complexo de
discriminação. Nas discussões técnicas que se seguem, volte atrás, quando necessário, ao
exemplo correspondente para uma base intuitiva.
10.1 DUAS CONDIÇÕES DE ESTÍMULO, UMA CLASSE DE RESPOSTA
Ao analisar a mais simples de todas as possíveis discriminações, notamos que um

oiganismo emite um certo comportamento com alta torça numa situação e não emite
este comportamento em outra situação. A operação básica para estabelecer tal discri
minação entre duas situações consiste em reforçar um determinado operante na presença,
ou depois, de um estímulo (S^), mas não liberar reforçamento para este mesmo operante
na presença, ou depois de outro estímulo (SA pronuncia-se “esse delta” ). Dois estímulos
usados desta maneira são chamados um par de estímulos discriminativos, um positivo
(SD) e outro negativo (S A ).
Na prática experimental, o procedimento é geralmente complicado pela adição de
várias técnicas de controle. Algumas destas asseguram que a discriminação é formada
entre os dois estímulos desejados e não com relação a outras mudanças espúrias do meio.
Outras fornecem maneiras e meios para a mensuração quantitativa e contínua da força da
resposta durante o processo de discriminação. A necessidade desses refinamentos pode
ser vista no exemplo simples de fornecer um amendoim para cada resposta de puxar a
corrente que o macaco emite, durante um período de 3 min, quando uma luz verde está
acesa e, então, desligar a luz e suspender o reforçamento da resposta de puxar a corrente
durante os próximos 3 min . . . . e assim sucessivamente.
1. Se o intervalo de SA é mantido constante, pode ocorrer uma discriminação
temporal, permitindo que a resposta venha a ficar sob o controle de um período de
tempo fixo de SA . e não das propriedades ambientais de S^ Lembre-se de que os
esquemas de reforçamento em FI demonstram que o tempo, correlacionado deste modo
com contingências de reforçamento, passa a controlar o comportamento efetivamente.
2. Neste procedimento, as contingências de reforçamento em S^ sã'o crf. Em crf
cada uma ae uma série de respostas é reforçada e a taxa de resposta torna-se uma medida
sem significado. Para todos os objetivos práticos, a taxa em crf é inteiramente
determinada pela quantidade de tempo que o animal passa comendo cada amendoim.
Ass;m, quaisquer mudanças que possam ocorrer na força da resposta durante S^ não são
detectadas.
- 206 -
3. O macaco poderia fechar os olhos, nunca olhar para as luzes, e ainda fazer uma
boa discriminação respondendo apenas esporadicamente. A primeira ocorrência de
reforçamento para uma resposta esporádica sinalizaria que todas as outras respostas
seriam reforçadas por um momento. Similarmente, a primeira resposta não reforçada
sinalizaria que todas as outras seriam por um momento extintas. Assim, o animal poderia
basear a discriminação na presença ou ausência de reforçamento ao invés de na presença
ou ausência da luz verde.
Herrick, Myers e Korotkin (1959) utilizaram um procedimento instrutivo,
empregando ratos como sujeitos, no estudo da discriminação entre períodos de luz (S^)
escuros (S ^ ), alternados aleatoriamente. Para evitar a falha 1 , eles usaram períodos de
sA de duração variável (30, 60 ou 90 seg). Para evitar a falha 2 e obter uma medida
significance da taxa de resposta durante a formação da discriminação, eles usaram um
esquema de reforçamento VI 30 seg em S^. O esquema VI em S ^ evitou também uma
discriminação baseada no reforçamento ou não-reforçamento (falha 3) jà que (i) não
reforçado não indicava necessariamente S^ , e (ii) a obtenção de um reforçamento não
significa que as respostas subsequentes seriam necessariamente reforçadas.
Para ajudar a simplificar a inspeção do processo comportamental que resulta de um
procedimento de discriminação desta natureza, as respostas em c as respostas em
podem ser registradas em registradores cumulativos separados. O registrador de S ^ corre
somente enquanto o SD está em efeito, e o registrado de S^ corre somente em S^ . A
Fig. 10-1 mostra os registros de pressão a barra de um rato nas sessões 1 , 6 , 1 1 , 21 e 40
no procedimento de Herrick, Myers e Korotkin. A resposta reforçada foi a pressão a
Tempo
Figura 10-1. Amostra de registros diários de um rato durante alguns dos quarenta dias
de treino discriminativo (Herrick, Myers e Korotkin,1959).
barra. O dia 1 é essencialmente um teste de generalização: o rato foi treinado

originalmente em S ^ e então, no dia 1 , S^ foi introduzido pela primeira vez, alternado
com SD A Fig. 10-1 indica que as taxas em S ^ e S^ foram quase idênticas no dia 1 :
ocorreu uma generalização completa da taxa de respostas de S ^ para S^ (ver Fig. 9-10,
- 207 -
que e um caso comparável). A medida que o treino discriminativo continuou, todavia, as
taxas em e S se diferenciaram. A inclinação em parece aumentar e a inclinação
diminuir através dos 40 dias do procedimento de discriminação.
Vários comentários podem ser feitos sobre os dois processos comportamentais
associados a S ^ e S ^ , respectivamente. O aumento na taxa em SD é, provavelmente um
exemplo do fato de que a exposição a um esquema de intervalo depois de crf sempre
inicia, entre outras coisas, um aumento gradual na taxa (por exemplo, veja as curvas de
RI na Fig. 7-4), que eventualmente atinge uma assintota. Russell (1960) mostrou que se
19 sessões de treino em IV são efetuadas em SD antes do início do treino discriminativo,
nenhum aumento na taxa em SD é visto durante a discriminação propriamente dita. A
mudança na taxa em vista na Fig. 10-1, evidentemente, não é peculiar ac procedimento
de discriminação.
A segunda mudança comportamental, o declínio da taxa em SA é simplesmente o
processo familiar de extinção. Em , a pressão à barra nunca é reforçada e, assim, está
sendo continuamente extinta. O processo de extinção em SA é, sem dúvida, prolongado
por causa dos efeitos da generalização resultantes da manutenção concorrente da força da
pressão à barra em S^. A força da resposta que ocorre em difunde-se para SÀ de
acordo com os princípios da generalização. Assim, o processo de discriminação, um
procedimento onde a resposta é reforçada sob um estímulo (SD) e não sob outro (SA ), é
representado pela diferenciação gradual das forças da resposta nas duas situações de
estímulo.
Para medir o estado do processo de discriminação em qualquer momento
determinado, uma variável composta conveniente pode ser formada, constituída de
ambas as taxas em e S A . Podemos definir o índice de discriminação (ID) como
Taxa em
lD
Taxa em SD + Taxa em
Evidentemente, quando a taxa em SD = taxa em = K (isto é, quando a força da

resposta se generaliza completamente de S para ), o índice torna-se
i -Jl -L
D 2A- 2
A medida que a discriminação prossegue, a taxa em aproxima-se do nívçl operante

(—>0) e a taxa em permanece constante (K), ou aproximadamente constante e o
índice aproxima-se de
i k 1
■D = j = 1
Assim, a faixa útil do índice de discriminação vai de 0,5 (generalização perfeita sem
discriminação) a 1,0 (perfeita discriminação, sem generalização). Valores intermediários
indicam graus intermediários de discriminação. Valores menores do 0,5, se confiáveis,
indicariam uma preferência de taxa para a condição SA .
- 208-
Variáveis compostas como o índice dc discriminação têm um papel importante na
construção científica de teoria. O físico define a densidade de uma substância como
sendo igual a sua massa por unidade de volume (D m/v). A velocidade média de um
corpo em movimento é uma razão entre a distância que o corpo percorre e o período de
tempo (V = d/t). A própria taxa de resposta, número de respostas/tempo, é uma variável
composta, já que envolve a razão de duas variáveis mais simples. A justificativa para se'
formar uma variável composta a certas outras variáveis na ciência são mais simples e
informativas do que aquelas para as variáveis componentes tomadas sozinhas, então, a
variável composta é dita “útil” . No caso do índice de discriminação, parece claro que
nem a taxa em SD, nem a taxa em , sozinhas, poderiam dar uma boa aproximação do
nosso conceito de discriminação. Por outro lado, alguma razão dessas duas taxas parece
estar mais estritamente relacionada com os conceitos de discriminação e podemos esperar
que a razão seja útil no sentido formal descrito. Por exemplo, a Fig. 10-2 mostra que, no
estudo de Herrick, Myers e Korotkin, o índice está de fato regularmente relacionado ao
número de sessões de treino de discriminação. Somos levados a inferir, pela Fig. 10-2,
que o processo de discriminação está virtualmente completo na sessão 1 5, ocasião em que
o índice parece ter atingido sua assíntota (11) 0,93).
CO
6
<D
Q
CO CX
d
e +->cd
+
o
CO
6
<D
cd
X
cd
Figura 10-2. Mudanças no índice de discriminação em quarenta sessões de treino numa

discriminação luz-escuro (segundo Herrick, Myers e Korotkin. 1959).
A discriminação que ilustramos é chamada "'simples’ poique envolve um número

mínimo de respostas (uma) c um número mínimo de condições de estímulos diferentes
(duas) necessárias para demonstrar uma discriminação. A despeito desta simplicidade, tal
procedimento tem se mostrado útil para avaliar habilidades e limitações discriminativas
nos animais. Pfaffman, Goff e Bare (1958) usaram esta técnica para medir a habilidade
do rato em detetar odores. Em S^ , uma concentração controlada de gás odorante era
liberada na caixa de Skinner do rato. Em SD, nenhum odor estava presente. Além disso
em SD as pressões a barra eram reforçadas intermitentemente com alimento, enquanto
em não havia reforçamento. Valores altos do índice de discriminação indicariam que
o ralo estava discriminando o gás experimentalmente introduzido. Valores do índice
- 209 -
próximos de 0,5 indicariam que pouca ou nenhuma discriminação estava sendo feita.
Com o índice igual a 0,5, poder-se-ia dizer que o rato não detetava nenhum odor, uma
vez que ele estaria respondendo na situação como se o gás estivesse ausente. Isto é,
sua taxa em S A seria a mesma que em SD. O lim ia r para a deteção de odor pode ser
definido como a concentração de odor que produz um valor do índice de discriminação
significativamente maior que 0,5. Diminuindo-se gradualmente a concentração de gás ate'
que o Iq caia a um ponto onde não seja mais significativamente diferente de 0 ,5 , o limiar
(mínimo valor detetável) de qualquer odor experimentalmente introduzido pode ser
determinado (Goff, 1961).
Exercício 7.
Delineie um experimento para determinar o som mais fraco que um chimpanzé pode
ouvir. Use apenas uma classe de respostas e esteja certo de não incorrer em qualquer das
três falhas indicadas.
10.2 O PARADIGMA DA DISCRIMINAÇÃO
O protótipo de todas as discriminações é o paradigma definido pelo caso mais

simples. Temos
DADOS: 1. Uma classe de resposta
2. Duas condições de estímulo.
PROCEDIMENTO: Reforçar a resposta numa das condições de estímulo (S ^)e extinguir
a resposta na outra condição de estímulo (S^ ).
PROCESSO: As forças da resposta em S ^ e S^ se diferenciam gradualmente,
ocorrendo um processo de extinção prolongada em S^
RESULTADO:O organismo passa a responder em S^ e não em S^
Ao notar o procedimento dc discriminação, desejamos expressar a
noção de que existe uma contingência diferente para S ^ e S^ .
S”
R P- s+
i
[ 10. 1]
SA SA
or
R />
2a 2b
No diagrama [ 10.1 ] a contingência 1 é lida: “ na presença de SD, se R, então algumas

vezes S + é produzido” . As contingências 2a e 2b (ambas são maneiras de representar a
mesma coisa) são lidas: “na presença de S, se R, então nenhuma mudança no ambiente’.*
A contingência 2b talvez seja lida mais convenientemente como “em S^ nenhuma
resposta é reforçada” . Evidentemente, cm termos de notação, o procedimento de
discriminação simples pode ser definido como a alternação de dois tipos de contingências
e seus estímulos associados, como está representado nos colchetes 1 e 2 de 110 . 1 1.
- 210 -
10.3 DUAS CONDIÇÕES DE ESTIMULO, DUAS CLASSES DE RESPOSTA
Com o passar dos anos, os psicólogos projetaram uma variedade de aparelhos para
testar a capacidade discriminativa dos animais. Muitos desses envolvem pelos menos duas
respostas e pelo menos duas condições de estímulo. Um aparelho popular em sua época
foi a plataforma de saltar de Lashley (Fig. 10-3). Neste aparelho, um rato faminto fica
Figura 10-3. Uma forma da plataforma de saltar paia testar reações discriminativas em
ratos (segundo Lashley, 1938 ; de Munn, 1950).
sobre uma plataforma elevada de frente para janelas à sua direita e à sua esquerda, que
estão cobertas por cartões de papelão com desenhos. No treino preliminar, a plataforma
elevada fica perto das janelas que estão abertas, tendo os desenhos sido removidos. O rato
tem apenas que pular da plataforma, através de qualquer janela, para alcançar o alimento
localizado atrás do aparelho. Quando o rato acaba de comer, ele pode ser pego
novamente e colocado na plataforma para outra tentativa. Gradualmente, a plataforma é
movida para mais longe das janelas, até que uma verdadeira resposta de pular tenha sido
sucessivamente aproximada (modelada). Então, os cartões, que serão usados como
estímulos discriminativos, são gradualmente inseridos para cobrir as janelas, primeiro
parcialmente- e, depois, completamente. Um cartão (algumas vezes chamado cartão + )
será preso levemente por uma mola que o solta se o rato pula em sua direção. Depois do
salto, o rato encontra-se de frente a um delicioso prato de farelo amassado. O outro
cartão (chamado as vezes cartão —), todavia, esta" preso de modo que, se o rato pula em
- 211 -
sua direção, ele cai na rede localizada abaixo. Essa conseqüência serve como punição para
este pulo, além de fornecer uma tentativa de extinção.
Considere um experimento em que dois cartões sejam usados:
□ e El
Esses cartões serão alternados aleatoriamente nos dois lados, em tentativas sucessivas e a
janela que contiver o + estará destrancada, enquanto que a janela que contiver o —estará
fechada. O rato se ajustará a um procedimento desta natureza numas poucas tentativas, o
que pode ser observado no aumento gradual de 0,5 para 1,0 na probabilidade de
respostas ao cartão correto.
Não é difícil descrever as contingências existentes em tais discriminações; a chave é
avaliar inicialmente todas as situações de estímulos possíveis. Os cartões individuais não
são estímulos por si próprios. Apenas, o seu padrão particular e suas posições relativas
ajudam a definir a situação de estímulo em qualquer momento. No presente exemplo há,
antes de saltar, duas possíveis situações de estímulo:
S □ E El
sA %
Uma vez que o experimentador tentará manter todos os outros aspectos do ambiente do
rato constantes, de tentativa para tentativa, não nos preocupamos em incluir esses aspectos
constantes na descrição das duas situações de estímulo. Chamemos as duas situações de
Sa e S 3 . Se ignoramos a rede, as contingências são:
Sa Sb
re --> s + R j. f* [10.2]
RDf* R D^ S +
onde ^ = saltar à esquerda

RD - saltar à direita
S+ = alimento
A comparação das notações para a discriminação simples de | 10.1] e o presente
caso apresentado em | 10 . 2 | leva à conclusão de que 110.2 | é uma discriminação dupla.
Se considerarmos a relaçao dc somente uma resposta num determinado momento ao
reforçamento alimentar, vemos que 11 0 . 2 1 se assemelha a [ 10.1 | inteiramente, mas,
em vez de uma contingência nula prevalecer numa das duas situações, temos uma
segunda contingência agindo em conjunção com uma segunda classe de resposta. O
diagrama 11 0 . 2 1 confirma que os termos S^ e S^ são sempre relativos a uma
determinada resposta e devem, portanto, ser cuidadosamente qualificados quando
usados íora do paradigma simples de [10.1|. Aqui em [ 10.2 [, por exemplo, é razoável
dizer que SA é o S^ para saltar à esquerda bem como o SA para saltar à direita. Da
mesma forma, S 3 é o SD para eo para Rp;. Em geral, quando nos referimos a
alguma situação particular como um S^ ou S-A , a classe de resposta à qual tal
situação serve desta maneira, deveria ser mostrada ou pelo menos estar implícita 110
con texto.
-212-
Figura 1 04. Aparelho de puxar para macacos. Um dos blocos amarrados com barbante
terá alimento escondido atrás (Harlow, 1948).
Embora o delineamento específico de um aparelho de discriminação com duas
respostas, dois estímulos varie para cada espécie diferente de animal, dependendo de suas
capacidades de resposta, as contingências, de discriminação, invariavelmente, obedecem à
form a geral de [10.2| . Macacos, chimpanzés, monos e crianças prestam-se
convenientemente ao uso de aparelhos que requerem respostas de manipulação (ver Fig.
10 -4 ). O fato de que a resposta do organismo possa ser dirigida ao aspecto físico do meio
ao longo do qual o estímulo discriminativo pode ser definido, não deve permitir que se
deixe de levar em conta as contingências comuns em todas as discriminações. Na seção
10 . 1 , examinamos um experimento no qual ratos pressionavam uma barra quando uma
luz estava presente, mas, por conveniência experimental, eles poderiam ter apenas que
correr em direção à luz. Na Fig. 10-4, o comportamento do animal é ‘’dirigido” a um dos
blocos e, além disso, certas propriedades do estímulo, associadas aos próprios blocos,
controlam essa resposta. Mas, em ambos os casos, a correlação de comportamentos
diferentes com ambientes diferentes caracterizam-nos como discriminações.
10.4 m CONDIÇÕES DE ESTÍMULO,
n CLASSES DE RESPOSTA
Aumentando-se o número de estímulos discriminativos usados aumenta-se a
complexidade da discriminação. Considere um caso em que um único cartão positivo, + e
dois cartões negativos,F~le | | | possam aparecer. As situações possíveis antes da resposta
(supondo que em cada situação uma, e somente uma, resposta possa ser reforçada) são:
a b e m B B B B
SA S„ S</ S|>
- 213 -
Em S \ e Sb, o pular a esquerda será reforçado, enquanto em Sc e Sd, o pular à direita
será reforçado. O uso de cartões adicionais negativos e/ou positivos cria ainda mais
situações e pode-se dizer que o grau de complexidade da discriminação aumenta
correspondentemente.
As discriminações podem ser ainda mais complicadas pela especificação de
contingências para mais de uma ou duas classes de resposta. No Wisconsin General Test
Apparatus (visto na Fig. 10-5) os movimentos de apanhar objetos a direita, esquerda e
centro são frequentemente especificados. Pode-se colocar alimento em recipientes rasos,
localizados debaixo de qualquer de três objetos. O arranjo desses objetos serve para
Figura 10-5. O Wisconsin General Test Apparatus. As respostas do experimentador se

limitam a apresentar e retirar a bandeja de estímulo, misturar os objetos na bandeja e
colocar alimento nos recipientes que estão debaixo de alguns blocos. As respostas do
sujeito se limitam a afastar qualquer dos blocos e pegar a comida (se alguma) no
recipiente com alimento, debaixo do bloco deslocado <segundo Harlow, 1949).
definir os estímulos discriminativos. Se apresenta ao macaco a tarefa de escolher um
cubo, em vez de uma pirâmide ou uma esfera e supondo-se que cada objeto deva ser
apresentado em cada tentativa, então as possíveis situações de estímulo são arranjadas em
® â> o & O O íS )
S. Sc Se
® o & \ O (S i & ã> o ®

Sr Sp Sp
três grupos, dependendo da localização espacial do cubo.
- 214 -
10.5 MUDANÇAS CONTINUAS NO COMPORTAMENTO EM FUNÇÃO DE
MUDANÇAS CONTINUAS NUMA DIMENSÃO DO ESTIMULO
Ao apanhar corretamente urn objeto localizado em qualquer parte de uma mesa,

empenhamo-nos numa discriminação que não pode ser facilmente descrita por um
número fixo de respostas, em relação a um número fixo de estímulos discriminativos.
Isto porque, para cada posição do objeto sobre a mesa, um e somente um conjunto de
resposta é otimamente reforçado. Mas existem muitas posições possíveis. Como uma
aproximação, podemos representar uma mesa dividida como um tabuleiro de xadrez,
com fileiras i e colunas j e, desta maneira, designar, artificialmente, um número limitado
de classes de resposta e de estímulos discriminativos possíveis (ver Fig. 10-6). Suponha
que localizemos cada classe possível de estímulos discriminativos pelo seu número na
fileira (i) e seu número na coluna (j).
Coluna j
7/7
Figura 10-6
Então, o objeto, no momento, repousa na fileira 3 e coluna 4. A classe de estímulo

discriminativo que representa essa condição é S3 ?4 e a classe de movimentos de apanhar
que serão reforçados pelo contato com o objeto é denotada correspondentemente como
R3 ,4 . Essa análise pode ser generalizada como a contingência
S,J
[10.3]
Rij
onde S = objeto na posição i, j

R = movimento de apanhar
S+= contato com o objeto
i = número de fileira
j = número da coluna
Uma vez que i e j são variáveis, o Diagrama [10.3] representa um exemplo da

representação funcionai da seção 6.14. As coordenadas espaciais da classe de resposta
715 -
l igura 10-7. Quadros de uma aproximação simulada de um míssil a um alvo estratégico O bicar
de um pombo fornece o sinal de controle (de Swartz, 1963, segundo Skinner, 1960)
~ 216 -
reforçada são uma função contínua das coordenadas espaciais do objeto estímulo. No
presente exemplo, o ângulo e extensão da resposta de apanhar dependem da posição
espacial do objeto. A função é complexa, mas não há razão para se 'suspeitar que o
procedimento básico de discriminação empregado em cada uma das outras seções deste
capítulo não seja o método para formação dessa discriminação, ou melhor, conjunto de
discriminações. As respostas com determinados valores de ângulo e extensão, que caem
em certos limites pequenos, são reforçadas somente quando o objeto está numa certa
posição relativa ao organismo. As respostas cujos valores de ângulo e extensão se desviam
desses limites não são reforçados. ( 0 objeto não é apanhado)* Tal história passada e
subseqüente controle do comportamento que ela confere à posição espacial, c
imediatamente aparente quando “ tateamos” em busca de uma lanterna no escuro, ou
quando procuramos por um lápis que cai debaixo c!e uma mesa, fora da visão.
0 comportamento envolvido quando um operador “rastreia” um alvo móvel é o

exemplo mais sofisticado de tais discriminações. Ao dirigir um automóvel ou apontar
uma arma para um objeto que se move rapidamente, requer-se um conjunto de respostas
que deve variar continuamente com as mudanças constantes das condições de estímulo.
Embora tais discriminações sejam complexas, elas são adquiridas através de uma história
adequada de contingências de reforçamento. O projeto ORCON (ORganic CONtrol), o
resultado de um projeto de pesquisa da II Guerra Mundial, ilustra as sutilezas
discriminate as que podem ser conferidas a um organismo tão pouco ilustre como o
pombo. O objetivo ORCON era treinar pombos para guiar mísseis para alvos
selecionados (Skinner, 1960). Os animais eram colocados no nariz, em forma de cone,
de um míssil, frente a uma tela onde era projetada uma imagem simulada de um possível
alvo inimigo. Presos em jaquetas especiais, os pombos ficavam imobilizados, apenas com
a cabeça e o pescoço livres. Um eletrodo de ouro cobria a ponta do bico de cada pombo.
Zomo a tela em que o animal havia sido treinado a bicar era feita de um material
semicondutor, a localização exata das bicadas podia ser detetada por um curcuito
eletrônico no míssil. A informação assim obtida seria usada para disparar o míssil.
Durante o treino, o reforçamento era contingente a bicadas apenas no centro de um
alvo selecionado. Uma vez que um míssil, movendo-se numa velocidade superior a
960 km/h poderia rapidamente mover o alvo na tela enquanto o animal parasse por
alguns segundos, um esquema intermitente foi usado, mantendo uma alta taxa de bicar.
Alguns quadros de uma aproximação simulada são vistos na Fig. 10-7.0 alvo passa a ser
visto no quadro superior e o pombo começa a bicár. O animal continua a manter o míssil
em curso por vários minutos, como é visto nos outros três quadros. Os pombos foram
treinados, com éxito, a ignorar sinais espúrios que aparecessem em suas telas, tais como
aviões da artilharia antiaérea e nuvens, e a manter o curso de apenas um dos vários alvos
estratégicos particulares que poderiam aparecer no campo de visão.
10.6 DISCRIMINAÇÃO SEM RESPOSTAS EM SA
Em trabalhos anteriores com o procedimento de discriminação simples, Skinner

(1938) relatou que o processo de discriminação seria muito mais rápido se o
procedimento de discriminação fosse efetuado simultaneamente com o fortalecimento
original do operante. Em certos casos extremos, Skinner foi capaz de mostrar que ratos
poderiam formar discriminação luz-escuro imediatamente.
- 217 -
Sugere-se a seguinte explicação para se levar em conta este efeito. Um processo de
discriminação, tal como o descrito na seção 1 0 . 1 , é prolongado principalmente devido ao
processo de extinção que deve ocorrer em S^ . Mas, uma das principais variáveis que
afetam a extensão de qualquer processo de extinção é o número de reforçamentos
obtidos na aquisição (ver seção 5.9). Se poucos reforçamentos são dados antes da
extinção, esta será rápida. No treino discriminativo, a resposta em S^ é devida a
generalização do fortalecimento em S^ * O gradiente de generalização implica em que o
potencial de respostas em S ^ , gerado pela aquisição, será menor que ou igual aquele
estabelecido em S^. Nesta análise, pressupõe-se uma família hipotética de gradientes de
generalização, tais como os da Fig. 10-8. O parâmetro da Fig. 10-8 é o número de
reforçamentos fortalecedores durante a aquisição. Note que, quanto menor o número de
reforçamentos administrados, mais próximo S^ pode estar de SD, sem que ocorram
respostas a S A através da generalização.
No procedimento de Skinner, o treino discriminativo começou com uma luz presente
(SD). A primeira pressão a barra emitida, no nível operante, foi reforçada e S^ foi
imediatamente substituído por um período de 5 min de escuro (S ^ ). Depois do
período de 5 min em , o S ^ foi reintroduzido e novamente a primeira resposta
emitida foi reforçada, seguida pelo aparecimento do S ^ e suas conseqüências de
extinção. Este ciclo foi repetido através do treino discriminativo. Sob essas condições, a
generalização a é negligível, havendo pouco ou nada para extinguir em sua presença.
Devido ao fato de que o responder em S^ não ocorre na aquisição de tais
discriminações, elas são apropriadamente denominadas “sem erro” .
H. S. Terrace (1963 a, b) estendeu essa ténica para demonstrar discriminações sem
erro entre pares de estímulos discriminativos muito próximos no gradiente de
generalização. No trabalho de Terrace, o princípio do mínimo fortalecimento inicial é
combinado com a técnica de usar, inicialmente, estímulos bem diferentes como S ^ e
SA e, então, progressivamente, reduzir as diferenças físicas entre eles.
Dimensão do Lístímulo
Figura 10-8. Família hipotética de gradientes de generalização com o parãmetrc

número de reforçamentos no fortalecimento original. Cada curva representa um número
diferente de reforçamentos no treinamento em S ^ , de 1, 2, 3 ... a n.
- 218-
O treino discriminativo é iniciado com um sA bastante diferente de para evitar
generalização (ver Fig. .10-8). À medida que se prossegue o treino discriminativo, as
diferenças entre e são gradualmente reduzidas, tornando-se o mais e mais
semelhante a SD. Isto resulta em tornar o S ^ cada vez mais próximo do SD nas suas
dimensões comuns de estímulo.
Num dos procedimentos de Terrace, o bicar um disco vermelho foi modelado e
receber poucos reforçamentos. Uma discriminação entre vermelho (S^) e verde (SÀ) foi
estabelecida, virtualmente, com nenhuma bicada em com o seguinte método:
“O bicar a chave é condicionado a uma luz vermelha (Sl^). Seguindo cada um dos
cinco primeiros reforçamentos, a luz da chave era sempre vermelha. Depois do
quinto reforçamento, a chave foi obscurecida por 2 seg, depois do que a luz vermelha
aparecia novamente. Seguindo os 20 próximos reforçamentos, o intervalo (escuro)
foi progressivamente aumentado até o intervalo máximo de 30 seg, com uma média
de 15 seg, ser alcançado. Neste ponto, o S ^ foi introduzido. Inicialmente, SÃ era
uma luz verde fraca com 1 seg de duração. Durante tentativas sucessivas em SA , sua
duração e intensidade foram aumentadas progressivamente, até que a duração de
S A fosse de 5 seg e os brilhos de SD e S ^ fossem iguais” (Terrace, 1963, b, p.
224).
O método de treino discriminativo de fortalecimento mínimo em S&,com redução

progressiva de diferenças entre , parece ter um número de vantagens. Lm
primeiro lugar, parece que tais discriminações são formadas bem mais rapidamente do
que aquelas em que se emprega os procedimentos das seções 10.1-10.5. Segundo, o valor
assintótico de Id é provavelmente mais próximo de 1 ,0 com esta técnica. Terceiro, desde
que poucas respostas, ou mesmo nenhuma, ocorrem em S ^ , não há os efeitos
emocionais característicos da extinção nessas discriminações sem erros. Os distúrbios que
caracterizam esses efeitos emocionais (discutidos mais amplamente no capítulo 18) são
geralmente indesejáveis na aprendizagem de habilidades e discriminações cotidianas.
Então, o método de treinamento de discriminação sem erro pode ter um emprego
importante na tecnologia educacional.
10.7 TEMPOS DE REAÇÃO DISCRIMINATIVOS
A história característica do treino discriminativo S ^ - S A estabelece controle de

estímulo sobre os operantes. A medida que S ^ passa a controlar, progressivamente, seu
operante, o tempo entre o aparecimento de S ^ e a ocorrência do operante diminui. Este
tempo, análogo à latência do reflexo S2 —> R 2 > é chamado tempo de reação
discriminativo (RT). Sob certas condições, o RT discriminativo pode ser um índice da
força de uma resposta, ou do estado de um processo de discriminação. Durante o
treinamento SD - S^ do tipo descrito nas seções 10.1 e 10.2, o RT diminui
progressivamente, aproximando-se - no rato - de uma assíntota de cerca de 1 seg.
Existe uma vasta literatura sobre RTs assintóticos em discriminação humana na
medida em que se relacionam à complexidade da situação de estímulo, número de
contingências possíveis, dificuldades em discriminar S ^ e S ^ , intensidade de SD,
administração de drogas, etc. O RT discriminativo do frear quando ocorre uma situação
onde um acidente pode acontecer, tem sido de algum interesse para as ôsquisas de
- 219 -
segurança de estradas. Como se sabe, este RT pode variar de uma pequena fração de
segundo até vários segundos, dependendo de fatores tais como a concentração de álcool
no sangue, número de horas na direção e presença ou ausência de cafeína no sangue. No
laboratório, os tempos de reação são frequentemente medidos dando-se instruções a um
sujeito humano para pressionar uma chave telegráfica tão rápido quanto possa, depois de
receber um sinal. Tempos de reação da ordem de pequenas frações de segundo (200 —
500 milisegundos) são obtidos com tal procedimento, particularmente se o sinal de
‘Prepare-se” precede o sinal verdadeiro para “ responder” .
“No comportamento cotidiano, a maioria $e nossas respostas não é emitida sob

condições favoráveis tais como as do laboràtório e a necessidade de uma reação
muito rápida é apenas ocasional, como no atletismo, combate militar e controle de
máquinas como o avião e o automóvel. Por várias razões, os valores alcançados em
experimentos humanos de tempo de reação raramente são aproximados, mesmo
nessas circunstâncias. Os sinais de aviso frequentemente estão ausentes;pode-se não
saber de que direção está vindo o estimulo; geralmente, a pessoa está empenhada em
fazer outra coisa quando a resposta é subitamente requerida; a resposta pode
envolver a ação de grandes grupos de músculos em vez de pequenos grupos; o
estímulo pode ser muito fraco, ou tão forte que causa a “imobilização” , e assim por
diante. Então, um grupo de jogadores de futebol americano pode levar em média até
400 mseg para desfazer uma formação de jogo a um sinal auditivo; e o tempo de
reação de motoiistas de automóvel pode aumentar de vários segundos quando a
ameaça de um acidente requer uma mudança do pé do acelerador para o freio”
(Keller e Schoenfeld, 1950, p. 146).
10.8 AS IMPLICAÇÕES DO CONTROLE DE ESTIMULO OPERANTE
Passando do simples para o complexo, tentamos mostrar os métodos pelos quais o

estado do ambiente imediato passa a controlar uma resposta operante. Operantes sob tal
controle são chamados operantes discriminativos. Quando o rato salta para o cartão
apropriado, quando o macaco puxa o barbante correto, quando a criança pega um objeto
e quando freamos o carro diante de uma luz vermelha a resposta emitida está sob um
poderoso controle de estímulo. Logo, é um operante discriminativo e o controle de
estímulo dependerá, em cada caso, de uma história anterior com os tipos de
contingências de reforçamento descritos nas seções de 10.1 a 10.5.
A natureza do controle de estímulo operante é tal que, não apenas a ocorrência da
resposta, mas também certas propriedades d? resposta, podem vir a ser controladas pelo
estímulo, dada uma história passada particular de reforçamento. No controle de
respondentes por eliciadores, as propriedades da resposta tais como magnitude, duração e
latência são uma função fixa do eliciador, determinada pelas leis do reflexo. No controle
de estímulo operante, não existe uma relação única entre a intensidade de S ^ e as
propriedades da resposta tais como duração e RT. Por exemplo, a magnitude da resposta
reforçada pode ser, dentro de amplos limites, qualquer uma que as contingências
especifiquem que seja. Assim, poderíamos construir um operante discriminativo que
imitasse as leis do reflexo. Reforçando-se adequadamente qualquer resposta determinada,
a pressão à barra ou a expressão “por favor” , por exemplo, na presença de uma luz ou
um tom, por exemplo, a força da resposta reforçada poderia ser diferenciada de modo a
- 220 -
R» s+ [10.4]
sr
ser proporciona] à intensidade do estímulo prevalecente. Podemos representar isso, em

notação, como onde y é a força da resposta e x a intensidade do estímulo, sendo y
definido como proporcional a x. Um observador, olhando o organismo assim treinado, e
que não conhece sua história com as contingências de [10.4] poderia ser inclinado a
chamar a resposta observada, Ry, de um respondente. Note que este erro decorre ao se
negligenciar a história passada relevante desse organismo. Para evitar estas interpretações
erradas, deve-se sempre ter cautela ao considerar exemplos de comportamentos fora do
laboratório. Frequentemente, a história passada relevante não pode ser descoberta. Nosso
próprio comportamento discriminativo, por exemplo, é tão familiar, tão automático, que
provavelmente não nos lembramos de como foi adquirido.
Como um exercício instrutivo, considere uma regra de contingência em que o inverso
da lei da magnitude do reflexo poderia ser obtido, tornando-se o y de [ 10 .4| = l/x . O
resultado, agora, seria criar uma R cuja magnitude fosse uma função inversa da
intensidade do estímulo discriminativo na presença do qual ocorreu. Talvez, fique claro,
com este exemplo, porque a magnitude da resposta não é uma medida adequada do
fortalecimento operante. A magnitude da resposta pode ser modelada arbitrariamente,
dependendo das contingências de reforçamento.
Uma vez que uma discriminação operante de qualquer tipo tenha sido formada,
controlar a ocorrência de SP é uma forma de controlar a ocorrência da resposta. Depois de
40 sessões de treino discriminativo, para fazer com que ratos como os de Herrick, Myers
e Korotkin, pressionem uma barra basta somente apresentar a luz. De forma similar, para
fazer com que ratos como os de Pfaffam, Goff e Bare pressionem uma barra,
necessitamos somente retirar o odor de suas câmaras e apresentar ar fresco. Para fazer um
homem se mover, pedimos que ele se mova. Em todos esses casos, a resposta está sob o
controle de um estímulo anterior (a luz, o ar fresco ou o pedido), mas a relação da
resposta com o estímulo difere consideravelmente daquela do respondente com seu
eliciador. Em primeiro lugar, as leis do reflexo não se mantém entre o e sua R.
Aumentos na intensidade de diminuiriam a probabilidade de R, de acordo com o
princípio de generalização. (Tente gritar seus pedidos às pessoas). Em segundo lugar, a
relação entre e R depende da história de discriminação. Essa história dificilmente
pode ser ignorada, porque sem ela um não poderia obter seu status de variável
controladora do comportamento. Para distinguir entre o tipo de controle que os
eliciadores têm sobre seus operantes, dizemos que um estabelece a ocasião para uma
resposta, isto é, é estabelecida uma ocasião onde a emissão de R produz reforçamento.
10.9 A S1GNIFICÃNC1A DAS DIFERENÇAS ENTRE DUAS MÉDIAS
Existem ocasiões em que o comportamento em S ^ e SA é tão semelhante que

assegurar a presença ou ausência do responder diferencial, o sine qua non de uma
discriminação, pode ser difícil. O responder muito similar em SD e em S A pode ocorrer
quando o organismo não adquiriu o comportamento de observação adequado, quando
SD e SA são muito semelhantes, quando influências que tiram a atenção estão
presentes, e assim por diante. Se as diferenças entre as taxas de resposta em S^ e S A são
- 221 -
r
pequenas, o experimentador pode ficar inseguro se qualquer discriminação está sendo

feita.
O problema de avaliar pequenas diferenças numéricas transcende as discriminações.
Sempre que dois grupos de medidas de qualquer tipo são muito semelhantes, ou há
bastante variabilidade entre elas de modo que elas se sobreponham apreciavelmente,
aparece uma necessidade de uma avalização objetiva das diferenças numéricas
observadas. São as-diferenças observadas, embora pequenas, atribuíveis aos efeitos sutis,
mas possivelmente, teroricamente importantes, de condições experimentais diferentes, ou
são apenas o produto de erros casuais de medida?
Considere os dados da Tabela 10-1, indicados como histogramas na Fig. 10-9. Esses
dados são 60 taxas fictícias de resposta que poderiam ter sido obtidas em 60
apresentações de um minuto das condições S ^ e SA 5 alternadas ao acaso. Se isto ajuda a
tornar a discussão completa, considere S ^ como períodos de 1 min de ar fresco e S ^
como períodos de 1 min de concentração muito baixa de gás odorante, e o sujeito
fictício como um dos sujeitos de Pfaffman, Goff e Bare discutidos na seção 10-1. Os
dados das condições em S ^ e S ^ são claramente semelhantes. Há uma superposição
substancial entre os dois histogramas da Fig. 10-9. Muitas respostas são emitidas em SA
Tabela 10-1
NÚMERO DE RESPOSTAS REGISTRADAS EM 60 PERÍODOS DE

1 MIN DE SD E S A , ALTERNADOS AO ACASO. OS VAI ORES DE
SA ESTÃO EM NEGRITO (DADOS HIPOTÉTICOS)
25 21 13 24 29 24 27 16 24 27
30 25 25 23 22 29 23 26 26 25
27 26 25 0 15 28 19 27 23 19
11 27 11 30 28 19 6 26 6 16
37 22 25 25 20 32 23 23 26 24
26 25 8 27 20 31 21 29 22 25
.5
'5c
ocr
tt>
-H
u,
10 15 20 f25
Número de respostas emitidas em
intervalos de teste de 1 min.
1'igura 10-9. Histogramas do número de respostas emitidas em 30 períodos de um
minuto de sA (acima) c 30 períodos <te um minuto dcSD (cmbaivo) Dados fictícios
- 222 -
a discriminação entre ar fresco e odor, se existe, é mínima. Contudo, existem,insinuações
de uma diferença entre o responder em e .A distribuição em SA está mais à
esquerda da discriminação S ^; a distribuição em contém a taxa mais baixa (0
respostas) enquanto a distribuição em contém a taxa mais alta (36 respostas); as
modas das duas distribuições não são idênticas; a média da distribuição em S A é 20,7
respostas/min e a da distribuição em é 24,7 respostas/min.
São as diferenças nestas duas distribuições o resultado de erros casuais de medida ou
elas são, de fato, indicações significantes de uma pequena discriminação? Neste ponto, é
útil lembrar alguns aspectos pertinentes da assim chamada curva normal, discutida na
seção 2.6 e reproduzida na Fig. 10-10. Em particular, desejamos lembrar que entre mais
ou menos um certo número de unidades de desvio padrão, 0 do centro, encontra-se
uma certa percentagem de medidas contidas na área sob tal curva. Para rever, 68 por
cento das medidas se encontram sob a curva entre + 1 O da média central. Uma maneira
Figura 10-10. A curva normal.
alternativa de expressar esta propriedade é dizer que, se estivéssemos retirando

aleatoriamente amostras de medida desta distribuição normal, a probabilidade de se obter
uma medida que se encontre dentro desta região seria de 0,68 e a probabilidade de se
obter medidas que se encontrem fora desta região seria de 0,32. Similarmente, 95 por
cento das medidas estão entre í. 2 O da média. Então a probabilidade de se obter uma
medida fora desta região t 2 O é apenas de 0,05.
Agora, suponha que as nossas medidas da taxa de resposta em S ^ e S à na Fig. 10-9
representem amostras de medidas tiradas de uma população de dezenas de milhares de
medidas potenciais e cuja distribuição seria parecida com a curva normal na Fig. 10-10.
Esta distribuição normal teria um certo O a ela associado que descreveria sua
variabilidade devido a erros de medidas. Se tivéssemos esta distribuição ao nosso alcance
e nos fosse dado ainda uma única medida da taxa de resposta sobre a qual nada
saberíamos, exceto o seu valor e se nos perguntassem, subsequentemente, se tal medida
pertence aquela distribuição, poderíamos dar uma resposta significativa em termos de
probabilidade. Precisamos apenas verificar de quantas unidades C esia nova medida se
desvia da média da distribuição normal e dizer, então, qual a probabilidade de que ela
pertença a esta distribuição. Suponha que tal medida se encontre na região sob a curva
fora da linha limite de exatamente 2 O acima da média. Então, a probabilidade é apenas
0,05 de que ela faça parte da distribuição porque 0,95 (95%) dos valores desta
- 223 -
distribuição estão entre + 2 CJ e somente 0,05 (5%) estão íora. Esta proposição não diz
que a medida dissidente não veio desta distribuição; poderia ter vindo. Somente diz que é
algo improvável que ela tenha vindo. i
Nosso problema presente tem alguns elementos em comum com a avaliação de uma
única medida nova em referência a uma distribuição conhecida. Avaliando nossos dados
de discriminação não temos apenas uma comparação de uma medida com uma distri
buição de medidas, mas uma comparação de duas distribuições separadas (S^ e SA) de
medidas. O que gostaríamos de saber é se a distribuição em S^ difere sistematicamente,
embora pouco da distribuição em S^.
Uma maneira proveitosa de abordar este problema é investigar se as médias das duas
distribuições diferem significativamente uma da outra. Em outras palavras, será que a
diferença de 4,0 entre 20,7 e 24,7 representa apenas flutuações ao acaso na taxa de
resposta momento-a-momento que, por acaso, foi detetada na nossa divisão arbitrária da
sessão em períodos de “S ^ ” e “S A ” e, no que diz respeito ao rato, S ^ e S A
constituem tratamentos iguais? Ou, será essa diferença de 4,0 o resultado das condições
SD realmente terem um efeito diferente de SA sobre a tendência do responder?
Uma maneira laboriosa de determinar a interpretação mais plausível seria fazer mais
sessões adicionais e idênticas do nosso experimento, mas usando um valor para SA que
sabemos estar muito próximo de S ^ para ser discriminavelmente diferente dele (por
exemplo, S ^ sA), de modo que quaisquer diferenças nas taxas em S^ e S ^ teriam
que ser devidas apenas ao acaso. Essas sessões adicionais dariani um grande número dc
novas médias de taxas de resposta em S^ e sA . Poderíamos subtrair a média de da
média de S A para a sessão e obter uma diferença; poderíamos subtrair a média dc SD da
média de SA para a sessão 2 e obter outra diferença e assim, sucessivairente, para todas as
sessões que tivéssemos a paciência de realizar.
Terminaríamos com um conjunto de números, as diferenças entre as médias emSD e
S ^ . Poderíamos fazer um gráfico da distribuição dessas diferenças entre as médias (os
estatísticos nos asseguram que resultará numa curva normal) e calcular o desvio padrão, o
sigma das diferenças entre as médias da amostra, O Md. Note que esta distribuição das
diferenças entre as médias da amostra deve ter o centro em torno de zero se, ao manter
nossas condições experimentais constantes de sessão a sessão, nenhuma discriminação foi
possível entre S^ e sA . As diferenças observadas entre as médias obtidas de sessão para
sessão seriam, neste caso, apenas aquelas resultantes de flutuações no responder, devido a
influências não controladas, mas presumivelmente não sistemáticas, que poderiam ser
tanto positivas quanto negativas em qualquer momento. Com a adição de sessões, elas se
cancelariam mutuamente, deixando-nos uma diferença média entre as médias igual a
zero.
Uma vez com essa distribuição das diferenças entre as taxas médias de resposta
durante períodos de S ^ e S A não discrimináveis, poderíamos, então, comparar o nosso
valor observado de 0,4 com a distribuição das diferenças casuais entre as médias, para ver
se 4,0 está além de 2 (T Md unidades do centro em zero. O método seria o mesmo através
do qual comparamos uma única medida com uma distribuição conhecida.
L)e fato, não é prático e nem econômico repetir estes experimentos de controle
ta.nlas vezes para obter uma estimativa razoável de como a distribuição das diferenças
entre as médias da amostra se apresentaria no caso onde houvéssemos arranjado
anteriormente para que as amostras não diferissem consideravelmente, exceto por acaso.
Na prática, podemos nos valer de uma derivação da estatística matemática que mostra
- 224 -
que uma estimativa do desvio padrão crítico, O Md, pode ser obtido com um pouco dc
matemática aplicada às nossas 30 medidas originais em SD e S A.
O que devemos fazer primeiro é calcular o desvio padrão do conjunto das 30 taxas
observadas em e o desvio padrão do conjunto das 30 taxas observadas em SA dos
dados da Tabela 10-1. Combinamos, então, esses dois desvios padrões obtendo um desvio
padrão combinado (chamado cr D para distinguir de outros desvios padrões) que para os
dados da Tabela 10-1 é =9,15. Neste ponto aplicamos uma fórmula estatística, com cuja
origem não precisamos nos preocupar, para obter uma estimativa de o o desvio
padrão das diferenças entre as médias da resposta em SD que esperaríamos obter se
repetíssemos o experimento por muitas sessões. A fórmula diz que CTj^ é estimado por
cr D /V N - onde N é o número de pares de medidas que temos, neste caso, 30. O
resúltado, 9,15/ V 30 = 1,67, pode ser usado para determinar a probabilidade de que a
nossa diferença média particular observada, 4,0, aparece apenas devido a erros envolvidos
ao se medir as taxas de resposta em S^.
Evidentemente, 4,0 é maior que duas unidades do tamanho de 1,67. Isto é, a
diferença obtida, + 4,00, encontra-se na região (+ 4,00 / 1,67) a unidades acima da
média da distribuição teórica das diferenças esperadas apenas por acaso. (Lembre-se de
que a média desta distribuição teórica, para o caso onde há somente erros casuais em
para perturbar as medidas da taxa da resposta em é zero). Realmente, uma
diferença t£o giande como 4,0 entre duas médias seria esperada surgir devido ao acaso
menos que 5% das vezes. Uma diferença observada tão improvável de surgir devido a
erros casuais de medida é convencionalmente dita estatisticamente significante. É neste
sentido técnico que, quando nos referimos a resultados numéricos neste texto, a palavra
significância é empregada.
Iniciamos com uma certa diferença pequena entre duas distribuições de taxa de
resposta. Utilizando certas propriedades da curva normal e certas derivações da estatística
matemática, fomos capazes de encontrar a probabilidade do que uma diferença entre as
médias de duas distribuições observadas de dados fosse tão grande quanto o seria se
atribuída apenas a erros casuais. Ao fazer assim, avaliamos a significância estatística da
nossa diferença. A técnica usada foi encontrar, primeiro, um desvio padrão combinado
representando a variabilidade em e SA e, segundo, desta estatística derivar o O O
método supõe que números iguais de medidas sejam feitos nas duas condições. Esta
restrição pode ser superada pelo uso de outras fórmulas, algo menos intuitivas,
encontradas em qualquer livro elementar de estatística. Em geral, os métodos para
ístimar a probabilidade de que as diferenças observadas entre duas médias são devidas a
erros casuais de medida são usados onde ( 1 ) as diferenças observadas são pequenas, ( 2 ) a
variabilidade de medidas é alta como um resultado de perturbações não controladas ou
não controláveis, (3) o tempo não permite a replicação do experimento bastante vezes de
modo a fornecer uma base empírica para estimar a confiabilidade das diferenças
encontradas entre as condições experimentais.

Goff, W. R. Measurement of absolute olfactory sensitivity in rats. Amer.
J. Psychol., 1961, 74, 384-393.
Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews
(E d .), Methods of psychology. New York: Wiley, 1948.
- 225-
Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56,
51-65. “ ’
Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in S° and
SA rates during the development of 'an operant discrimination. / .
comp, physiol. Psychol, 1959, 52, 3 5 9 - 3 6 3 .
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. N e w York:
Lashley, K. S. The mechanism of vision X V . Preliminary studies of the
rat’s capacity for detail vision. J. gen. Psychol. 1938, 18, 1 2 3 - 1 9 3 .
Miüenson, J. R. Random interval schedules of reinforcement. J. exp.
Anal. Behav., 1963 6, 4 3 7 - 4 4 3 .
Munn, N. L. Handbook of psychological research on the rat. Boston:
Houghton Mifflin, 1950.
Pfaffman, C., Goff, W. R., and Bare, J. K. An olfactometer for the rat.
Science, 1958, 12 8, 1 0 0 7 - 1 0 0 8 .
Russell, I. S. Analysis of the responding during operant discrimination.
Unpublished doctoral dissertation, Indiana Univer., 1960.
Skinner, B. F. The behavior of organisms. Chapter 5. N e w York: A p-
pleton-Century, 1938.
Skinner, B. F. Pigeons in a pelican. Amer. Psychol., 1960, 15, 2 8 - 3 7 .
Swartz, P. Psychology the study of behavior. Princeton: Van Nostrand,
1963.
Terrace, H. S. Discrimination learning with and without “errors.” J. exp.
Anal. Behav., 1963a, 6, 1 - 2 7.
Terrace, H. S. Errorless transfer of a discrimination across two continua.
J. exp. Anal. Behav., 1963b, 6, 2 2 4 - 2 3 2 .
- 226 -
Capítulo 11 REFORÇADORES ADQUIRIDOS
É fácil notar, mesmo com um exame rápido do mundo que nos cerca, que algumas
das conseqüências especiais que denominamos reforçadoras têm uma primazia mais
natural ou biológica do que outras. Poucos discutiriam que alimento, água e sexo estar
numa categoria diferente mais “ básica” do que livros, dinheiro e automóveis. Mesmo
assim, os organismos, uma vez ou outra, trabalham por todos esses. Podemos distinguir
essas duas categorias pelo modo em que o organismo chega a possuir uma suscetibilidade
ao reforçamento. Para cada indivíduo, existe uma classe de reforçadores cujos poderes
são meramente uma conseqüência biológica da filiação do indivíduo a uma certa espécie.
Esses reforçadores são uma propriedade das espécies tanto quanto as manchas do
leopardo, a pele do gato a cauda do cachorro. As suscetibilidades ao reforçamento que são
c o n stru íd as no organismo deste modo definem os reforçadores primários ou
incondicionados. Eles serão discutidos em capítulos subsequentes sobre Motivação. Para
o presente, voltamo-nos para um segundo grupo de reforçadores, “ secundários” , que
parecem mais variáveis e menos previsíveis de indivíduo para indivíduo, comparados com
os do primeiro grupo.
Dinheiro, carros, lápis, jornais, prestígio, honra e um sem n&mero de outras coisas
arbitrárias que os seres humanos trabalham para obter, constituem uma grande fonte de
reforçadores fidedignos e potentes. Mas essas coisas não têm valor algum para nós quando
nascemos. Claramente, elas devem ter adquirido sua capacidade para reforçar em alguma
ocasião durante a história passada de cada indivíduo. Uma história passada individual é
um pré-requisito; prova disto é aquele adulto ocasional para quem alguns dos refor
çadores convencionais parecem não ter valor algum. Neste sentido, o outro tem pouca
importância para um monge Trapista, um homem primitivo dificilmente lutaria por uma
cópia do New York Times e nem todos gostam de Brahms.
Dinheiro, material impresso e os trabalhos de um compositor particular não têm o
valor universal do alimento, água e sexo, embora para um dado indivíduo sua atração
possa parecer igualmente forte. Como mostraremos em seguida, os reforçadores
adquiridos obtêm seu poder para fortalecer e manter o comportamento em virtude de
uma história passada de associação com reforçadores primários.É sua dependência sobre
essa história condicional para que tenham poder de reforçar que lhes dá o nome de
reforçadores condicionados.
- 227 -
Os reforçadores condicionados parecem ser especialmente difundidos na manutençao
do comportamento humano. Realmente, eles estão ligados com a própria noção de
cultura humana. Contudo, eles são facilmente cultivados em sujeitos animais no
laboratório, onde as condições exatas para o seu estabelecimento e a medida precisa de
suas forças relativas podem ser quantitativamente estudadas.
11.1 AS P R O P R I E D A D E S R E F O R Ç A D O R A S DOS ESTÍ MULOS

DISCRIMINATIVOS POSITIVOS
Antes do fortalecimento da resposta de pressão à barra de um rato faminto ou o

bicar a chave de um pombo faminto, loma-se, geralmente, cuidado para antecipar cada
instante de fornecimento de alimento por um breve clique e um flash de luz que emanam
do lugar onde o alimento é fornecido. Uma vez que o alimento está à disposição somente
após a combinação clique-luz, este procedimento é suficiente para tornar o clique-luz um
estímulo discriminativo positivo (S^) para a resposta de aproximação ao comedouro.
Mas, além de tornar a situação clique-luz um S ^, um produto colateral inevitável deste
procedimento de discriminação é dar ao clique e à luz um poder de reforçar. Este poder é
explorado, permitindo-se que a pressão à barra ou o bicar da chave produzam o S^.
Deste modo, podem-se fornecer à resposta conseqüências mais imediatas do que seria
possível com o alimento em si. O rato leva algum tempo para mover-se da barra para o
comedouro e comer; mas o estímulo clique-luz pode alcançá-lo mesmo antes de ter
retirado as patas da barra. Este tipo de reforçamento imediato, proporcionado pelo
reforçador secundário clique-luz, é essencial para produzir o fortalecimento rápido do
operante (ver Fig. 4-2).
O procedimento para demonstrar o poder reforçador da combinação clique-luz pode
ser representado como uma notação de duas fases: ( 1 ) estabelecer o clique-luz como um
SD pelo método usual de discriminação:
SA
e
Ri ■/> R, -+ S +
2
onde SD = clique-luz
SA = ausência de clique-luz
S+ = alimento
R, = aproximação ao comedouro
(2) Então, em S ^ , permitir que uma resposta não fortalecida anteriormente, por
exemplo, pressão a barra, produza o estímulo discriminativo positivo, S ^, retirando-se,
ao mesmo tempo, o reforçador primário final.
SA [Sn
Ri ■/"* Rj -f> [111]
R 2 ----->
2 1
onde R 2 =• pressão à barra.
-2 2 3 -
Para testar a eficácia do clique-luz como agente reforçador independente, o
reforçador primário deve estar ausente. Na medida em que o alimento ocorrer no final da
seqüência, o fortalecimento de um novo operante (em | 1 1 . 1 | , pressão à barra) pode ser
inteiramente devido à ação do reforçador primário; o clique-luz, por si só, pode ser
irrelevante.
É claro que, durante o teste de 111 - 1 1 , a extinção da resposta de aproximação ao
comedouro procederá concorrentemente comquaisquer efeitos de fortalecimento que c
procedimento possa estar exercendo sobre a pressão à barra. Assim mesmo, o resultado
experimental de 111.1| é inequívoco. A resposta de pressão à barra existindo
anteriormente numa taxa baixa no nível operante, é rapidamente forlalccida apenas pelo
SD clique-luz. A resposta à barra é condicionada a despeito do fato de nenhum alimento
estar sendo apresentado, e*a despeito do fato de a resposta ao comedouro estar,
simultaneamente, em processo de extinção. Na Fig. 11-1, são vistas curvas cumulativas de
quatro ratos neste procedimento. Pela primeira vez na história de condicionamento dos
ratos, cada pressão à barra produziu uma conseqüência especial - o para aproximação
ao alimento., Durante o tempo em que a Fig. 11-1 foi registrada, o alimento nunca
apareceu Comprrada* r.nm curvas de fortalecimento com reforçamento primário (por
exemplo, alimento), as curvas são mais variáveis e mais negativamente aceleradas (ver Fig.
4-2). Da observação do aumento geral na taxa de pressão à barra visto na Fig. 11-1,
todavia, não há dúvida de que tornar o contingente a pressão à barra, serve,
temporariamente, para condicionar o operante. As curvas do fortalecimento apenas pelo
clique-luz tomam a forma geral das curvas de extinção. Isto nada tem de surpreendente
porque, simultaneamente com o condicionamento de R2 (pressão l\ barra) por SD? Rj
(aproximação ao comedouro) está sendo extinta. Logo, o está perdendo,
concorrentemente, seu poder para agir como para Rj e, por inferência, também o
valor reforçador adquirido. Esta perda é uma conseqüência inevitável do teste de
reforçamento secundário.
11.2 COMO AUMENTAR A DURABILIDADE DE REFORÇADORES CONDICIONA

DOS
O princípio do reforçamento adquirido foi entusiasticamente recebido pelos
primeiros behavioristas que viram nele a chave para a explicação das atividades sociais
complexas que, no homem , parecem medrar na ausência de reforçamento primário. O
reforçamento condicionado parecia uma explicacão pronta para comportamentos sociais
tais como o gregarismo ou cooperação e valores sociais tais como a conquista de
prestígio, poder ou riqueza. Mas, na investida para contrapolar os conceitos de
íaboratório sobre reforçamento condicionado para o campo social, raramente se
esclareceu que permaneciam ainda por realizar demonstrações experimentais poderosas
do reforçamento secundário. As curvas de Skinner (1938) (Fig. 11-1) eram uma
demonstração bastante genuína de que os S^s tornavam-se realmente reforçadores
secundários. Mas a produção de comportamentos mantidos pelo S ^ como um reforçador
condicionado era da ordem de 50 respostas em 45 min —uma produção desprezível e,
certamente, uma demonstração não muito convincente de que os reforçadores
condicionados do laboratório poderiam, mesmo remotamente, ser a base dos incentivos
sociais da vida humana. Por algum tempo, as tentativas dos pesquisadores, utilizando
pistas, labirintos e barras, para produzir reforçadores secundários mais poderosos, que
pudessem modelar e manter o comportamento por longos períodos sem os reforçadores
- 229 -
Tempo (minutos)
Figura 11-1. Fortalecimento de um operante cie pressão à barra em quatro ratos
famintos, quando o único reforçamento é o que anteriormente determinava a
ocasião para a aproximação ao comedouro (Skinner, 1938).
primários, obtiveram pouco sucesso. E só recentemente foram descobertas técnicas para

ampliar a durabilidade de reforçadores condicionados a um nível em que se pudesse
atribuir, de forma razoável, ao conceito experimental um papel importante na teoria da
atividade humana.
A habilidade para demonstrar o reforçamento adquirido de uma forma convincente
esperou o desenvolvimento dos procedimentos de reforçamento intermitente, isto é,
esquemas de reforçamento e as especificações de operantes de ordem superior. A
intermitência desempenha dois papéis críticos na ampliação dos efeitos dos reforçadores
condicionados. (1) Usada para programar o reforçamento primário (por exemplo,
alimento) para um operante discriminativo no treino , ela pode construir uma
alta resistência à extinção do operante discriminativo (Rj na cadeia de 111 -11 \ 0
método consiste simplesmente em se alternar o conjunto de contingências.
S” [SA
e |R, -h
2 1
O resultado é o de limitar a emissão de R \ a e, além disso, já que a contingência 2 é

probabilística, desenvolver uma resistência potencial à extinção muito forte de R i em
S^. (2) Usada ao se testar o valor reforçador de S^, a intermitência imposta entre a nova
- 230 -
R a ser condicionada e o SD contingente conserva o poder do reforçador secundário. O
método consiste, simplesmente, em deixar a nova R produzir o probabilisticamente,
R2 -£ -> SD, ou alternativamente, incorporar R em um operante de ordem superior, nR
SD Uma intermitência bem escolhida, aqui, não somente irá conservar o poder de S^,
mas manterá também uma alta taxa de R2 . A conservação do poder de S^, neste
procedimento, deriva de sua infreqüência de ocorrência. não perderá seu controle
sobre R] até que R[ tenha ocorrido um certo número de vezes(jem reforçamento) na
presença de SD. Se SD aparece infrequentemente, Ri temapenas oportunidades
infrequentes para enfraquecer.
Numa variante deste método, empregada por D. W. Zimmerman (1957,1959), ratos
famintos foram treinados a correr numa pista, obtendo alimento na caixa-objetivo, no
final. Uma tentativa na pista iniciava-se quando o rato era colocado na caixa de partida.
Uma campainha soava brevemente, a porta da pista se levantava e o rato podia correr até
a caixa-objetivo. O tempo de reação (RT) entre o som da campainha e a resposta de
entrar na caixa-objetivo foi medido. Até aqui este procedimento consiste de
S"D
R , -------> S +
onde SD = som da campainha na raixa de partida e porta aberta

R i = correr para a caixa objetivo
S+ - alimento
Quando o RT havia se tornado assintoticamente pequeno (depois de cerca de 30
tentativas), o alimento era omitido em algumas tentativas. Isto é, o operante
discriminativo de correr foi colocado num esquema probabilístico de reforçamento:
S”
R, >S '
Nas 60 tentativas seguintes, essa probabilidade foi gradualmente diminuída de 0,5 para
cerca de 0,2. Isto é, no final de 90 tentativas do treino de correr, somente cerca de 1
corrida em 5 terminava com alimento. Nas outras quatro corridas, o rato encontrava a
caixa-objetivo vazia. Mesmo assim, o RT de correr à campainha permaneceu curto; a
campainha e a abertura da porta continuaram a agir como um S& para uma resposta
vigorosa e veloz na pista. A situação neste ponto é reminiscente do nosso próprio
comportamento ao atender ao telefone. Embora somente poucas das chamadas possam
ser realmente dirigidas a nós, o comportamento de atender permanece (como o
comportamento de correr dos ratos de Zimmerman) com alta força.
Seguindo essas 90 tentativas do treino de correr, o alimento foi permanentemente
removido e instalou-se uma barra na caixa de partida. Uma tentativa iniciava-se com o
rato sendo colocado na caixa de partida como de costume, mas agora a campainha e a
abertura da porta tornaram-se contingentes unicamente à pressão à barra. Usando o S^
campainha-abertura da porta como o único reforçamento, Zimmerman modelou
progressivamente um operante FR de 15 pressões à barra em três sessões de 90 min.
Durante as 11 sessões seguintes, a resposta FR 15 foi mantida completamente pelo S^
- 231
contingente, enquanto, em cada tentativa, o comportamento de correr subsequente foi
lentamente enfraquecido em virtude de sua extinção. Este estágio é representado como
R S”
[ 11.2]
R.
2
onde SD= som da campainha na caixa de partida e porta aberta

SA = ausência do som na caixa de partida, porta fechada
R \ = correr para a caixa-objetivo
t^2~ 15 pressões à barra
Exceto pelas diferenças em elementos específicos, os procedimentos de [11.2J e

[11.11 são idênticos. Mesmo assim, antes que o poder de reforçador condicionado fosse
esgotado, os ratos de Zimmerman tinham emitido milhares de pressões à barra e
continuaram trabalhando por 20 horas espaçadas em várias sessões. Curvas cumulativas
da pressão à barra na caixa de partida nas sessões 1 , 5, 11 e 14 são vistas na Fig. 11-2. A
forma dessas curvas indica claramente que o uso do S ^, no procedimento de
Zimmerman, atuou de maneira semelhante ao reforçamento primário, gerando e
mantendo os efeitos característicos de uma especificação FR de resposta. Pausas,
seguidas de taxas altas de pressão à barra, são vistas. A medida que a extinção continua,
as pausas se tornam mais longas. Mesmo assim, quando o organismo responde, todo o
operante FR é tipicamente efetuado nipida e suavemente.
Figura 11-2. Pressão à barra em FR- 15 baseada apenas em reforçamento condicionado

Os traços oblíquos representam a campainha e a porta aberta. O registrador corria
apenas enquanto o animal estava na caixa de partida, antes de produzir o SD
(Zimmerman, "»959).
Os desempenhos apresentados pelos ratos de Ziinmerman devem ser contrastados
com o comportamento dos ratos de Skinner (Fig. 11-1), que emitiram apenas cerca de 50
pressões para o S D e, ao fim de 45 min, pararam de responder. A diferença em potência
entre os reforçadores condicionados, nos dois casos, pode ser atribuída à dupla
intermitência usada por Zimmerman no treino e teste. (1) A conexão probabilística entre
o operante discriminativo (R j) e seu reforçamento primário (alimento) no treinamento
de correr efetuado por Zimmerman, aumentou bastante a resistência à extinção da
resposta de correr ao S ^ (campainha-porta aberta). Assim, o S ^ por si só, permaneceu
no controle do comportamento por um período de tempo maior que em [ 1 1 . 1 ] e reteve,
portanto, seu poder de reforçador condicionado por mais tempo. Os resultados de
Zimmerman implicam em que Skinner poderia ter obtido mais pressões à barra se tivesse
reforçado probabilisticamente a aproximação ao comedouro quando do clique-luz. ( 2 )
Pela incorporação de pressões individuais à barra num operante de ordem superior
constituído de 15 elementos, o total da produção comportamental, medido pelo número
de elementos de pressão à barra emitidos, foi grandemente aumentado (Weissman e
Crossman, 1966). Ao mesmo tempo, a infreqüência de ocorrência do S ^ conservou sua
função discriminativa no controle do correr. .
Os resultados de Zimmerman sugerem que, enquanto o reforçador condicionado
permanece potente, os efeitos de torná-lo contingente a uma resposta parecem indistintos
dos efeitos de tornar um reforçador primário contingente à resposta. Os resultados de
outros experimentos confirmam tal conclusão. Kelleher (1961) tornou o clique de um
comedouro um S ^ para o comportamento de aproximação ao comedouro, em pombos.
Quando apenas o clique foi usado como um reforçador para o bicar a chave em esquemas
FI e especificações FR e drl os animais apresentaram padrões de resposta típicos daqueles
procedimentos com reforçamento primário.
11.3 RECOMPENSAS “TOKEN”
A operação de um tipo de reforçamento condicionado, tipicamente humano, é de

monstrada em estudos em que fichas de pôquer (“tokens”) foram usadas para reforçar
primatas (Wolfe, 1936; Cowles, 1937). As fichas tomaram-se S^s para várias respostas
manipulativas, incluindo o ato de inserí-las na máquina de vender para receber uvas,
laranjas, amendoins e outros reforçadores primários. Foi esta história de associação com
reforçamento primário que transformou as fichas em “ tokens” (dinheiro) com o poder
de reforçar.
Em alguns dos experimentos de Wolfe (1936), chimpanzés foram treinados a inserir
uma ficha branca numa máquina e obter, assim, uma uva. A resposta de inserção foi
modelada através de aproximação sucessiva. Um “token” foi inserido parcialmente na
máquina pelo experimentador e qualquer empurrão, no nível operante, dado pelo chim
panzé, fazia com que o “token” acabasse de cair, aparecendo como resultado uma uva. O
procedimento de modelagem continuou até que os animais pegassem fichas brancas no
chão e as inserissem na máquina de vender uva.
Sc SB
R2 -----> Ri ----- - S '
- 233 -
onde Sg= ficha branca na mão.
Sç = ficha branca no chão
- uva
Rl = inserir ficha na máquina
R2 = apanhar a ficha.
Os animais foram, posteriormente, ensinados a puxar uma barra pesada para obter fichas,
uma tarefa que aprenderam facilmente.
Sq [S-c SB
Kl -----> 1^2 -----► Rj -----> S +
onde So = nenhuma ficha presente
R 3 = puxar uma barra.
Posteriormente, foi estabelecida uma discriminação adicional entre fichas de metal
que nada valiam — isto é, não operavam a máquina de vender, se nela inseridas —e fichas
brancas. Uma breve história com este conjunto de contingências foi suficiente para tomar
os animais indiferentes às fichas de metal.
Em outros experimentos (Cowles, 1937) com um aparelho análogo à plataforma de
saltar de Lashley, na Fig. 10-3, os animais aprenderam discriminações de padrões espe
ciais onde o único reforçamento consistia de ^tokens'.’ Nos experimentos de Cowles, a
resposta era simplesmente a de empurrar para o lado o cartão contendo o padrão correto.
As máquinas de vender ficavam em outra sala, onde, depois que a discriminação havia
sido aprendida (Io — > 1 ,0 ), as fichas acumuladas podiam ser trocadas.
Nesses vários experimentos, os chimpanzés adquiriram novos comportamentos quan
do o único reforçamento imediato eram as fichas. As fichas são distintas de qualquer
outro reforçador secundário apenas por suas propriedades físicas, que as tornam manipu
láveis, estocáveis, etc. Naturalmente, um “token” não é apenas o S^ para uma resposta de
inserção; ele também fornece os verdadeiros meios físicos através dos quais tal resposta
manipulativa pode ser emitida. Uma ficha implica tanto em reforçamento para inserir
como torna possível a inserção. Contudo, os “tokens”, tal como campainhas e cliques,
tornam-se S^s simplesmente porque uma certa resposta é reforçada em sua presença.
11.4 REFORÇADORES GENERALIZADOS
Muitos estímulos discriminativos positivos estabelecem a ocasião para mais de um
único tipo de resposta ser emitido e reforçado. Alguns S^s, de fato, controlam numero
sas respostas, cada uma das quais pode levar a um reforçador primário diferente. Fora do
laboratório, tais situações são encontradas frequentemente. O dinheiro é um exemplo
excelente. Tendo dinheiro, muitas respostas podem ser emitidas, cada uma levando a seu
reforçador próprio e distinto.
S(dinheiro)
^(comprar bilhetes de teatro)
St +
R(comprar um casaco novo)
S2+ [11.3]
R(pedir uma refeição) S3+
- 234
“ Atenção” é, algumas vezes, usado como um nome para um tipo semelhante de S^.
De modo a obter reforçamento para várias respostas verbais, é <juase sempre necessário
que uma pessoa obtenha a “ atenção” de uma outra. Quando o Su atenção é conseguido,
muitas respostas (pedidos, ordens, etc.) podem, então, ser emitidas com a chance de
serem reforçadas. Na ausência de “ atenção” , poderíamos dizer que tais pedidos não são
ouvidos ou notados, o que é equivalente a dizer que eles estão sendo submetidos à
extinção.
Estímulos disc rim in ativos que podem estabelecer a ocasião para mais de uma seqüên
cia resposta-reforçamento estão baseados numa história de associação com mais de um
reforçador primário. No diagrama [ 11.3| por exemplo, o dinheiro foi previamente asso
ciado, através de treinamento - SA+, a entretenimento,calor, alimento, etc. Estímu
los discriminativos associados desta maneira a mais de um reforçador primário e cuja
disponibilidade se torna, então, contingente a um novo comportamento, são chamados
reforçadores generalizados. Embora eles pareçam ter um importante papel na mediação
do comportamento humano complexo, tais reforçadores generalizados não têm sido
estudados extensivamente no laboratório.
EXERCÍCIO 8
Descreva um método para criar um reforçador generalizado para chimpanzés. Use,

como reforçadores primários, alimento, água, remoção da situação experimental. Empre
gue um operante discriminativo diferente para cada reforçador primário. Use “ tokens”
como SD generalizado. Uma vez que o animal possua o " token” , o que determinará o
operante discrim inativo que ele emitirá?
11.5 RESPOSTAS DE OBSERVAÇÃO
Diz-se, às vezes que os estímulos discriminativos têm a propriedade de conduzir

informação a respeito do estado das contingências ambientais efetivas numa dada
ocasião. Assim, quando o pressionar a barra por um rato é reforçado somente na presença
de uma luz, pode-se dizer que a luz fornece informação de que uma certa contingência de
reforçamento esta em efeito. Similarmente,quando a sirene para de tocar conduz informa
ção de que os aviões de bombardeio inimigos se retiram e é seguro sair. Reforçadores
“ tokens” também conduzem informações mas aqui a função informativa está obscurecida
pelas propriedades físicas d o s “ tokens” que lorn am possível a resposta real. Quando a
fechadura automática da porta de um apartamento soa depois que você toca a campai
nha, você é informado de que pode abrir a porta e de que, quando o fizer, encontrará
alguém em casa.
Um tipo diferente de informação é fornecido por sinais indicativos de “não fun
ciona” e “ saiu para o almoço” , luz vermelha do tráfego e sinais de ocupado. Estes são
anúncios de que certos comportamentos não serão reforçados; como tal eles constituem
S^s para esses comportamentos. Pode a informação sobre reforçamento fornecida pelos
S^s e SA s desses exemplos ser encarada como reforçadora em si mesma? Pode-se
fornecer uma resposta melhor fazendo-se referências a experimentos.
No procedimento de discriminação de Herrick, Myers e Korotkin (1959) da seção
10.1 os ratos aprenderam a discriminar entre períodos de luz e escuro alternados aleato
riamente. As contingências eram reforçamento em VI durante S^ (luz) e extinção duran
- 235-
te S A (escuro). Imagine que, em vez de se fornecer automaticamente, uma luz brilhante
como SD e o escuro como SA 9 outro grupo de animais fosse treinado numa condição
intermediária de iluminação fraca, que não mudasse quando cada período de V I se
iniciava e terminava, nem quando cada período de extinção se iniciava e terminava. Em
linguagem vernacular, diríamos que esses animais não teriam meios de dizer se estariam
em VI ou em extinção. Se o período de extinção não fôr muito prolongado, ratos
treinados nessas condições ajustar-se-ão, produzindo uma taxa constante de respostas
tanto em VI como em extinção.
Suponha que, depois de tal estabilização, uma nova contingência seja introduzida
pela primeira vez. Se agora o rato puxasse um cordão localizado em seu compartimento,
a luz fraca seria imediatamente substituída pelo escuro (SA ) ou pela luz clara (S^),
dependendo da contingência que estivesse em efeito naquele momento. O que fizemos
foi dar ao organismo a opção de produzir estímulos discriminativos. O resultado compor-
tamental de tal opção é claro. A contingência age rapidamente para condicionar a respos
ta de puxar a corda (Wyckoff, 1952).
Quando uma resposta permite a um organismo observar uma situação correlacionada
com o estado de suas contingências de reforçamento, referimo-nos a ela com uma res
posta de observação. Ao observar meramente um aspecto do seu ambiente correlacionado
com certas contingências de reforçamento, o animal não modifica qualquer delas, mas
tem agora a oportunidade de evitar respostas não reforçadas.
As respostas de observação estão entre as mais comuns das nossas atividades diárias.
Para discriminar uma nota genuína de uma falsa, certas respostas de observação muito
detalhadas são necessárias. Uma grande parte do treinamento de peritos em notas falsas e
impressões digitais envolve o fortalecimento de respostas de observação que usualmente
permanecem incondicionadas no leigo. O perito deve aprender quais aspectosde uma
situação deve estudar de modo a poder distinguir entre estímulos diferentes que possam
estar presentes do seu ambiente puxando um cordão que produz S ^ o u S A s o perito em
notas falsas pode checar a impressão significante numa nota bancária que a identificará
como genuína ou falsa. Em ambos os casos, a resposta de observação, puxar o cordão ou
examinar a impressão, permite ao organismo fazer uma discriminação que aumenta a
probabilidade de ele ser reforçado.
A habilidade do perito em fazer discriminações, seja entrevinhos, impressões digitais
ou pinturas, é frequentemente vista com algum espanto pelo novato. Para este último,
dois casos seguramente discriminados pelo perito parecem, soam ou têm sabor de “seme
lhante”. O comportamento de observação no iniciante não foi fortalecido, não lhe permi
tindo “ saber onde procurar as diferenças’ . Ao fortalecer o comportamento de observa
ção em humanos, p o d e m o s muitas vezes “ apontar” , com êxito, as diferenças nas situa
ções. Ao apontar os aspectos da situação de que dependem as diferenças entre e SA .
aproveitamo-nos de uma história passada em que o reforçamento foi previamente contin
gente ao olhar na direção em que o dedo aponta.
Contingências análogas modelam respostas de escutar, bem como o comportamento
de observação em outras modalidades sensoriais. Em geral, uma característica importante
de uma resposta de observação ó que ela aumenta a probabilidade de reforçamento para o
comportamento. Isto certamente c verdadeiro para o rato que tem a opção de produzir
seus S^s e s. Se a discriminação do animal é boa, apresentações de S^ e SA irão,
pelo menos, permitir que a resposta seja limitada a SD. Isto tem o efeito de aumentar a
probabilidade geral de reforçamento para a resposta, bem acima do que aconteceria se S^
e S^- distintos não estivessem disponíveis. No basebol, o batedor que observa um movi
mento rnínimo mas característico do lançador prestes a lançar uma bola que descreverá
uma trajetória ci^va tem uma chance meihor de rebatê-la do que teria sem tal S^.
Frequentemente, os S^s e s produzidos pelo comportamento de observação são
cruciais para a ocorrência de qualquer reforçamento. Tente enfiar uma linha na agulha
com os olhos vendados, ou responder a uma questão de prova sem tê-la lido antes. Em
ambos os exemplos, a probabüidade de reforçamento é tão pequena que pode ser efetiva
mente zero na ausência de um comportamento de observação apropriado.
O comportamento de observação é frequentemente encoberto, tal como quando um
homem se senta silenciosamente na presença de um rádio. Ele está ouvindo ou não? Isto
é, ele está observando ou não? Em geral, a resposta a esta questão pode ser obtida apenas
pelo estabelecimento de contingências de reforçamento onde a probabilidade de que o
indivíduo emita certas palavras seria insignificantemente pequena na ausência de um
comportamento de observação anterior. Se perguntarmos o que foi dito no rádio, a
resposta de repetir o que foi dito de fato é tida como evidência prima facie de que o
comportamento de observação deve ter ocorrido.
EXERCÍCIO 9
Faça a anotação das contingências que predominam quando um organismo tem a
opção de produzir e S ^ , como está descrito no início desta seção. Para tômar o
exercício mais simples, suponha que um esquema de probabilidade uniforme seja alter
nado com extinção.
11.6 AS CONDIÇÕES NECESSÁRIAS E SUFICIENTES PARA SE CRIAR

REFORÇADORES CONDICIONADOS
O conteúdo das seções 11.1 — 11.5 implica em que uma condição suficiente para
tornar um estímulo um reforçador condicionado é fazê-lo um S^ através do procedimen
to de discriminação. Existe pouca evidência de que tornar um estímulo um SD seja uma
condição necessária e suficiente para torná-lo um reforçador condicionado. (Myers,
1959; Kelleher e Gollub, 1962). Em várias ocasiões, observamos, que, à medida que um
estímulo perde sua função de SD? ele perde também sua potência como reforçador con
dicionado. Dinsmoor (1950) mostrou que a resistência à extinção de um operante dis
criminative) era a mesma se o operante fosse extinto na presença de seu SD, ou extinto
com o SDcontingente a ele. Outro experimento (Notterman, 1951) mostrou que, quan
to menor o treino discriminativo que o sujeito receba, menor o valor reforçador que o
SD adquiria.' Essas observações sugerem que as funções discriminativas e reforçadoras de
um SD são estreitamente ligadas, se não diretamente paralelas.
Schoenfeld, Antonitis e Bersh (1950) mostraram que a simples associação de um
evento ambiental como um reforçador primário, por si só, é insuficiente para tomar o
evento um reforçador condicionado. Ratos foram treinados a se aproximarem de seus
comedouros recebendo uma pelota de alimento. Após o rato ter pegado a pelota e já
estar comendo-a, urna luz breve (1 seg) era apresentada. Cem associações luz-comida não
conferiu qualquer valor reforçador potencial à luz porque, em testes subsequentes, o
animal não pressionava a barra para produzir apenas a luz.
Indícios sobre as associações necessárias e suficientes para produzir reforçadores
237
Convencional S I inefetivo
S, Q __ D____ 0- ü
st n n n nn n
R-*-S+ 1 1 1 .... i i i
I n te rm ite n te Sd re d u n d a n te
s, __D____ Q. n n n .
s, n n n
R-*-S* I 1 1 1 ... 1. .
Figura 11-3. Aíguns arranjos de emparelhamentos possíveis de estímulos neutros com

reforçamento.
adquiridos foram fornecidos por Egger e Miller (1962, 1963). A representação

esquemática, na Fig. 11-3, de três eventos ambientais, S \, S2 e S+, será conveniente para
compreender seus resultados. Suponha que o S+ possua o poder de reforçar o
comportamento, enquanto S] e S2 não têm originalmente esse poder. Suponha também
que a emisão de uma dada R seja necessária para produzir S+. Algumas das associações na
Fig. 11-3 correspondem de perto a algumas das relações temporais do condicionamento
Pavloviano, descritos na Fig. 3-5. Logo, esperar-se-ia que elas resultassem no
condicionamento clássico de alguns respondentes, ao lado de qualquer valor reforçador
adquirido que elas emprestassem a S \ ou S2 .
O caso da parte superior esquerda da Fig. 11-3 representa o paradigma convencional
para cria r reforçadores condicionados. Cada apresentação de S 1 , se sucedida
imediatamente de R, é seguida de S+. Quando Si não está presente, as respostas não são
reforçadas. Este é o caso do exemplo do clique-luz da seção 11-1 e dos tokens e, em
geral, neste caso Si é submetido a uma história de discriminação com relação a R.
No caso da parte inferior esquerda, S+ vem depois de alguns S^s, mas não de todos.
Para que as respostas sejam reforçadoras, todavia, elas devem ocorrer depois de S \. Este é
o caso intermitente de Zimmerman e também estabelece S \ tanto como um S^ quanto
como um reforçador condicionado.
Em cima, à direita, uma contingência de reforçamento pode ocorrer depois de S j,
mas também em certas outras ocasiões. Se S+ ocorre com a freqüência de 50 por cento
ou mais das vezes sem S j, este caso pão confere poder reforçador a Si (Melching, 1954).
Sj não se torna um SD presumivelmente porque algumas respostas são reforçadas na sua
ausência - uma violação do paradigma de discriminação. Note, todavia, que S2 toma-se
um reforçador condicionado porque contém a mesma relação a R—>S+ que Si no caso
convencional da parte superior esquerda.
- 238-
No caso inferior, à direita, os dois eventos neutros são apresentados quase ao mesmo
tempo (separados de poucos segundos), depois do que uma resposta pode produzir
reforçamento primário;este caso conferirá valor reforçador condicionado a S j,m as não a
S2 (Eggere Miller, 1962, 1963). Parece que S2 é redundante, não fornecendo qualquer
informação nova sobre a ocorrência da contingência de reforçamento. Este resultado
explicaria o insucesso de Schoenfeld, Antonitis e Bersh em tomar a luz um reforçador
condicionado. Em seu experimento, a luz era S2 ,já tendo sido precedida de S], a visão da
pelota ou a pelota na boca, etc.
Uma análise geral dos quatro casos da Fig. 11-3 indica dois fatos relevantes. (1)
Existem vários paradigmas para estabelecimento de S^s e todos os S^s assim estabele
cidos também adquirem o poder de reforçador condicionado. (2) Somente quando um
estímulí é informativo (isto é, correlacionado não redundantemente com uma contin
gência de reforçamento) é que ele se torna um S ^ ou um reforçador condicionado. Os
argumentos discutidos nesta seção devem ser tomados provisoriamente, porque sua gene
ralidade depende da confirmação de paradigmas temporais, respostas e reforçadores pri
mários adicionais.
11.7 O REFORÇAMENTO SECUNDÁRIO NO COMPORTAMENTO SOCIAL
Um estímulo que controla o comportamento com um SD ou reforçador condicio

nado não precisa originar-sc apenas do ambiente inanimado. Outros organismos (ou, os
estímulos que se originam deles) podem agir desse modo também, e aí está um fato de
grande significância para o homem, bem como para outra vida biológica. O comporta
mento social pode ser descrito como o comportamento para o qual os estímulos reforça
dores ou discrimínativos, são, ou foram, mediados pelo comportamento de outro organis
mo. Por “ mediado” queremos dizer ‘que surge de, ou em conexão com’ e não há
qualquer intenção de forçar a conotação da palavra. Não poderíamos nem (1) incluir
como social a liberação de uma pelota pelo experimentador, ao rato que pressiona a barra
pode ser uma situação social para o experimentador, mas não para o rato. nem ( 2 )
excluir como não-social o comportamento do náufrago que fala para si mesmo ou faz
roupas de peles, já que ambas as atividades foram adquiridas socialmente.
A partir do nascimento, os estímulos sociais atuam em grande parte da vida dos
seres humanos. Muitos cientistas, realmente, pensaram que a própria sociedade tem sua
origem na dependência extrema e prolongada da criança. Seja como for, os pais, especial
mente a mãe, estão entre os primeiros reforçadores secundários do tipo social que
aparecem no círculo visual da criança. Sua potência disc rim in ativa e reforçadora é rapida
mente estabelecida pela associação contínua com alimento, calor, alívio da dor, etc. Se,
todavia, a criança é criada por uma enfermeira, então ela se torna o reforçador secundário
sempre presente e comumente se vê que a ligação com a Enfermeira substitui a com a
mãe. Os psiquiatras salientam que, na adolescência e antes, os primeiros objetos sexual
mente interessantes podem ser os pais, irmãos ou irmãs. Dentro do ambiente social
relativamente restrito da criança, os poucos organismos que servem como estímulos
acompanhadores, quando o reforçamento é liberado ou retirado, podem adquirir um
controle amplo e vitalício sobre seu comportamento. Com o aumento da idade, a criança
amplia suas excursões além do lar, aumentando a faixa de reforçadores secundários que
controlam suas reações. Escola, amigos, clubes e atividades relacionadas de todos os tipos
levam-na aos estímulos que são os sinais e acompanhamentos, sempre presentes, do
- 139 -
reforçamento final, os S^s e os[reforçadores condicionados]que são a trama e urdidura
de sua vida na sociedade (Keller e Schoenfeld, 1950, pp. 257-258).
Um rato ensinado a imitar outro rato está demonstrando uma habilidade, social
rudimentar e mostrando a ação de um reforçador social. Miller e Dollard (1941) treina
ram ratos famintos a atravessar uma pista elevada em T, vista na Fig. 11-4. Alguns ratos
Figura 11-4. Uma pista elevada, em T, para estudai a imitação no rato (segundo Miller e
Dollard, 1941).
foram treinados a correr para um cartão branco ou preto. A posição dos cartões era
distribuída aleatoriamente em tentativas sucessivas. Outros ratos foram treinados simples
mente a correr consistentemente para a direita ou para a esquerda. Quando o rato
executava uma corrida correta, ele encontrava alimento num recipiente colocado na base
do cartão. Esses ratos eram chamados de “líderes” eram treinados até que corressem 20
vezes consecutivas corretamente.
Um segundo grupo de ratos foi treinado para seguir os líderes. Em qualquer tentativa
em que seguiam os ratos líderes, os “seguidores” encontravam alimento descoberto num
pequeno recipiente no meio do caminho da pista. Em qualquer tentativa em que não
- 240 -
seguiam os líderes, eles eram retirados da pista por um pequeno período e mais tarde
fazia-se nova tentativa.
As contingências foram efetivas na produção de seguidores. Notou-se que os ratos
imitavam os líderes quando estes viravam na presença ou ausência de cartões brancos ou
pretos, que imitavam os líderes que haviam sido treinados a ir para a direita ou para a
esquerda e que imitavam indiscriminadamente ratos brancos e cinzentos.
A relação social entre um aluno e um professor é, provavelmente, várias ordens de
magnitude mais complexa do que qualquer habilidade social isolada como a imitação,
mas os rudimentos de tal relação prestam-se à análise experimental. Do ponto de vista do
reforçamento social, podemos considerar que o comportamento do professor é reforçado
pelas mudanças no comportamento do aluno. O aluno deve ser quase sempre reforçado
diretamente, ou pela promessa de alcançar certas habilidades úteis ou por ameaça de
punição.
As contingências envolvidas na situação educacional comum são complexas e
raramente formalizadas de um modo consistente. Mas a idéia fundamental - um organis
mo fortalecendo ou participando do comportamento de outro organismo pode ser
demonstrada com pombos, de uma maneira que expõe o processo crítico envolvido.
Na Fig. 11-5, dois pombos estão separados um do outro por um plástico transpa
rente. Antes da demonstração, ambos foram treinados a comer nos seus respectivos
alimentadores. Além disso, o “professor” foi treinado a bicar o disco plástico em reforça
mento internitente com alimento. A demonstração começa com os animais colocados
juntos pehi primeira vez. Cada vez que o professor bica o disco, é liberado alimento para
o “ aluno” . O professor é reforçado por bicar somente quando o aluno está de pé, em
frente ao canto esquerdo. Consoante com sua história, o professor começa a bicar rápida
e indiscriminadamente com relação á posição do aluno. Portanto, no início, poucas
bicadas do professor são reforçadas. Gradualmente, todavia, á medida que a demons
tração prossegue, mais e mais vezes que o professor bica o disco, ambos os animais são
alimentados. O comportamento de ambos vai sofrendo modificação pela interação social.
Logo, um desempenho quase cômico evolui. O professor fica olhando para o aluno como
se esperando que ele se mova até o canto esquerdo. Enquanto isso, o aluno imita suas
atividades a uma ida repetitiva do alimentador para o canto esquerdo. Tão logo o
aluno esteja parado de forma adequada. O professor bica, ambos coiYiem, e o padrão é
repetido.
Pode-se dizer que o professor manifesta um tipo de discriminação social primitiva.
Seu comportamento é reforçado somente quando o aluno está desempenhando um certo
ato — ficar de pé no canto esquerdo. É este ato por parte do aluno que fornece o S ^ para
o professor bicar o disco.
Como tal esta situação precisa também funcionar como um leforçador condicionado
para o professor. Se o professor procura obter alimento, ele deve encontrar um modo de
tomar essa situação possível, pois, inicialmente, o aluno raramente irá ficar no lugar
favorável. Uma interação social sutil está presente: qualquer bicada que o professor dê
quando o aluno está em outro lugar resulta em alimento apenas para o aluno. 0 b ;car
indiscriminado, então, provavelmente fortalecerá comportamentos do aluno outros que
não o ir para o canto esquerdo. “ Esperar” que o aluno vá para o canto esquerdo fica
sendo o único comportamento que o professor tem disponível para dirigir as respostas do
seu aluno. O pombo professor é rápido em descobrir o valor da paciência.
241 -
(Herrnstein, 1964).
As demonstrações simples desta seção ilustram a continuidade existente entre o

comportamento social e não-social. Nenhum princípio novo é necessário para explicar os
resultados das contingências de imitação, ou os resultados da interação dos pombos
professor-aluno. O comportamento imitativo de correr dos ratos seguidores é indistin
guível pela topografia, precisão ou complexidade, de qualquer outro operante de correr
sob controle discriminativo. Do mesmo modo, os comportamentos adquiridos pelos
nombos professor e aluno são apenas os operantes familiares que tratamos em detalhes
no texto. As sutilezas do comportamento socialencontram-se,em grande partenascontin-
gências controladoras que surgem de uma fonte complexa de estimulação proporcionada
por um outro organismo.

Cowles, J. T. Food- t okcns as incentives for learning by chimpanzees.
Comp. psychol. Motiogr., 1937, 14, 1-96.
Thnsmoor, J. A. A quantitative comparison of the discriminative and
reinforcing functions of a stimulus. J. exp. Psychol., 1950, 40,
458-472."
Egger, M. D., and Miller, N. E. Secondary reinforcement in rats as a
function of information value and reliability of the stimulus. J. exp.
P s y ch ol 1 9 6 2 ,6 4 ,9 7 -1 0 4 .
Egçcr, M. D , and Miller, N. E. When is a reward reinforcing? An experi
mental studv of the information hypothesis. J. comp, physiol.
Psychol. , 1963, 56, 132-137.
- 242 -
Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in Sl) and
rates during the development of an operant discrimination. J. com;),
physiol. Psychol., 1959, 52, 359-363.
Ilerrnstein, R. J. “Will.” Proc. Amer. Phil. Soc., 1964, 108, 455-458.
Kclleher, R. Schedules of conditioned reinforcement during experimental
extinction. /. exp. Anal. Behav., 1961,4, 1-5.
Kelleher, R., and Gollub, L. A review of positive conditioned reinforce
ment. J. exp. Anal. Behav., 1962, 5, 543-597.
Keller, I7. S., and Schoenfeld, W. N. Principles of psychology, New York:
Applcton-Century-Crofts, 1950.
Melching, W. H. The acquired reward value of an intermittently pre
sented neutral stimulus. J. comp, physiol. Psychol., 1954, 47, 3 7 0
374.
Miller, N. E., and Dollard, J. Social learning and imitation. New Haven:
Yale Univer. Press, 1941.
Myers, J. L. Secondary reinforcement: a review of recent experim enta
tion. Psychol. Dull., 1958, 55, 284-301.
Notterm an, J. M. A study of some relations among aperiodic reinforce
ment, discrimination training, and secondary reinforcement. J . exp.
Psychol., 1951,41, 161-169.
Schoenfeld, W. N., Antonitis, J. J., and Bersh, P. J. A preliminary study
of training conditions necessary for secondary reinforcement. J. exp.
Ps y ch ol 1 9 5 0 ,4 0 ,4 0 -4 5 . ”
Skinner, B. F. The behavior of organisms. New York: Appletón-Century,
1938.
Skinner, B. F. A case history in scientific method. Amer. Psychologist,
1 9 5 6 ,1 1 ,2 2 1 -2 3 3 .
Weissman, N. W., and Crossman, E. K. A comparison of two types of
extinction following fixed-ratio training. J. exp. Anal. Behav., 1966,
9 ,4 1 -4 6 .
Wolfe, J. B. Effectiveness of token-rewards for chimpanzees. Comp.
psychol. Monogr., 1936, 1 2 , 1-72.
WyckofT, L. B., Jr. The role of observing responses in discrimination
learning: Part I. Psychol. Rev., 1952, 59, 431-442.
Zimmerman, D. W. Durable secondary reinforcement: method and
theory. Psychol. Rev., 1957, 64, 373-383.
Zimmerman, D. W. Sustained performance in rats based on secondary
reinforcement. J. comp. physiol. Psychol., 1959, 5 2 , 353-358.
- 243 -
Capítulo 12 ENCADEAMENTO
Na seção 11.1 vimos como, através do uso de recompensas tokens atuando como
reforçadores adquiridos, seqüências ou cadeias simples de comportamento podiam ser
criadas. A mais simples dessas cadeias foi construída a partir de (1) uma resposta nova,
não fortalecida previamente; (2) um previamente estabelecido; e (3) o operante
controlado por este SP. Em geral, cadeias de qualquer tamanho desejado podem ser
formadas pela inclusão indefinida de um número sempre maior de elementos.
12.1 OS ELEMENTOS DE CADEIAS COMPORTAMENTAIS
Uma cadeia de comportamento operante é suscintamente descrita como uma

seqüência de respostas operantes e estímulos discriminativos tal que cada R produz o SD
para a próxima R. As Rs suscessivas numa cadeia são os seus membros; os S ^s sucessivos
são os elos. Nas cadeias mais simples, o número de membros e o número de elos são
idênticos. O elo de comportamento que envolve o pressionar a barra e o aproximar-se do
comedouro, nosso protótipo de fortalecimento operante, constitui uma cadeia repetitiva
simples desse tipo. O comportamento do rato é estabelecido pelo procedimento
onde S3 = alimento ausente

S2 = clique-luz
S+ = alimento
R3 = pressão à barra
R 2 = aproximar-se do comedouro
R | = comer
- 245-
O elo de [ 1 2 . 1 | é um caso especial de uma cadeia comportamental, aquele em que a
cadeia é repetida indefinidamente. Um e b pode ser considerado uma cadeia que está
“ fechada” por permitir que a “última” resposta produza o SD para a “primeira” . Por
exemplo, no elo de [ 1 2 . 1 ] comer é a última resposta e produz o S ^ 5 ausência de
alimento, para a primeira resposta, pressionar a barra.
O elo de [ 1 2 . 1 ) é representado como sendo composto de três membros da resposta.
Por isto, é convencionalmente descrito como uma cadeia de três membros. Mas o número
real de membros usados para representar uma cadeia comportamental é arbitrário, sendo
ditado principalmente pela conveniência descritiva. Ao discutir o comportamento obser
vado e reforçado, três membros servem adequadamente para ilustrar a natureza enca
deada do ato. Ao mesmo tempo, três membros não são muitos para nos assustarem com
uma quantidade de detalhes. Ainda, para outros objetivos, podemos desejar representar o
ato como se formado por mais membros. Por exemplo, para esclarecer tambe'm a topo
grafia, do ato, poderíamos duplicar o número de membros considerados e expandir
r 1 2 . 1 ] para
[ 12.2]
onde Só = alimento ausente

S 5 “ barra
S4 ~ clique-luz, barra pressionada
S3 = clique-luz, barra solta
S2 - no comedouro
S+ = alimento nas patas
Rè = levantar-se à altura da barra
R 5 = pressionar a barra
r 4- soltar a barra
K3 ~ introduzir-se no comedouro
R 2 = apanhar o alimento
Rj = colocar na boca.
0 diagrama [ 12.2 j representa o mesmo comportamento e o mesmo conjunto de
contingências que [ 12.11, mas 0 poder de ampliação foi dobrado em [12.2 | Levando-se
em conta ainda detalhes topográficos mais sutis e mudanças de estímulo mínimas, a
resolução poderia ser facilmente mais ampliada. Em geral, a composição de uma cadeia
de comportamento pode ser representada como um número indefinido de operantes. O
número não infinito porque, na subdivisão conceituai sucessiva, será inevitavelmente
alcançado um ponto onde a especificação de duas classes topográficas adjacentes será tão
sem elhante que não se poderá observar que as duas classes funcionam
independentemente uma da outra. Isto é, seus membros se sobreporão completamente
- 246 -
nau será possível colocar o animal sob quaisquer condições para diferenciá-los. Neste
ponto, teremos alcançado um limite lógico para a resolução da resposta. Na maior, parte,
o comportamento é subdivido a um nível em que serve melhor para objetivos ilustrativos
de procedimentos. A pressão à barra e a aproximação ao come douro são facilmente
observadas, medidas e reforçadas sem qualquer instrumentação especial. Em última
análise, estas são as considerações que justificam seu status como unidades
conceitualmente discretas.
Uma cadeia tanto pode ser reduzida quanto ampliada. Em princípio, poderíamos
também escrever[ 1 2 . l|como
^ (pressão à barra, ir para comedouro) ------» S + [1 2 3]

S (alimento ausente)
Os critérios para definir uma classe de resposta são que a classe seja especificável como
em 112.3] e que possa ser fortalecida ou mantida, como uma classe, pelo reforçamento.
A questão de se a R especificada em[ 12.3)é reforçável é uma questão experimental. Sua
solução dependerá de muitos fatores, tais como o peso e altura da barra, sua distância
espacial até o comedouro, a nitidez de quaisquer deixas intermediárias usadas para
sinalizar a liberação de alimento, as diferenças individuais entre os ratos, e assim por
dainte. Naturalmente, se esta R já foi sucessivamente aproximada e fortalecida, 112.3] é
uma maneira perfeitamente plausível de abreviar as contingências que irão subsequente
mente, manter este comportamento. Infelizmente, todavia, o diagrama [ 12.3] representa
as contingências de reforçamento frequentemente usadas quando o experimentador tem
pouco tempo para se dedicar a uma modelagem real da resposta. O procedimeto de
1 1 2 .3 ] resulta do “colocar o rato na caixa e esperar que o condicionamento ocorra a seu
próprio modo” . A criança que vai à escola de quem se espera que aprenda meramente
vendo e ouvindo, ou o universitário que recebe um livro e a ordem para aprender o
capítulo 12, são todos vítimas freqüentes de contingências como em [ 12.31 . O resultado
é o mesmo tanto para ratos como para humanos — alguns indivíduos adquirem
o comportamento desejado, outros não. Podemos praticamente dizer, com referência a
[12.3) quando comparado com um arranjo mais deliberado de contingências, que o
organismo aprende apesar da conexão não consistente entre os comportamentos reque
ridos e o reforçamento fornecido.
12.2 O DESENVOLVIMENTO DE UMA CADEIA COMPLEXA
Os princípios com port am ent ais significantes usados no estabelecimento de cadeias

são ( 1 ) aproximação sucessiva de cada membro, ( 2 ) colocar cada membro sob controle
discriminativo, e (3) uso de estímulos com o duplo papel de deixa discriminai iva e
reforçador condicionado, para ligar cada membro ao próximo. Várias proliferações desses
princípios podem produzir cadeias de complexidade e tamanho surpreendentes, mesmo
no rato. O comportamento que pode ser adquirido, frequentemente surpreende o leigo,
embora os princípios sejam simplesmente aqueles que operam na aquisição do pressionai
a barra ou bicar o disco. Em geral, uma complexidade grande no comportamento não
resulta de qualquer complexidade na topografia da resposta, nem mesmo das discrimi
nações requeridas, mas das maneiras complexas em que as várias contingências podem ser
permutadas.
- 247 -
Considere como um rato faminto pode ser treinado a pegar uma bola de gude na mão
do experimentador, depositá-la num buraco localizado a alguma distância, depois puxar
um trapézio em miniatura dependurado em sua caixa e, finalmente, pressionar uma barra
(ver Fig. 12-1). É útil delinear cinco classes de respostas,
R5 = pegar a bola de gude

R4 = carregar a bola de gude e segurá-la acima do buraco.
R3 = deixar cair a bola
R2 = puxar o trapézio
Rl = pressionara barra,
e notar que podemos desejar as Rs encadeadas na ordem R5 , R4 , R 3 , R 2 , Rl- As

situações de estímulo necessárias são mais convenientemente apresentadas no texto. As
seguintes sugestões serão úteis.
1. Fortalecer primeiro os membros que ocorrem mais próximos do reforçamento

primário; isto é, construir a cadeira de trás para frente.
2. Colocar cada operante sob controle de estímulo; isto é, tornar cada operante um
operante disc rim in ativo antes de adicionar outro membro à cadeia.
3. Permitir que o para o operante que foi fortalecido aja como o reforçador da
próxima resposta a ser adicionada. Deste modo, adicionar membros àcadcia um;
de cada vez.
De acordo com a sugestão 1, R \ deve ser condicionada pelos

métodos usuais de fortalecimento operante (ver seção 4.2). Então, aplicando o
princípio 2 , deve-se converter Rj num operante discriminaiivo, reforçando-a na presença
de uma situação (SD) e não na presença de uma segunda situação (S A ). Será útil, como
veremos em seguida, escolher para S ^ uma situação que tenha pelo menos duas
dimensões de estímulo convenientemente manipuláveis. Uma pequena luz em combi
nação com uma campainha suave satisfará. Deixe a cigarra continuamente ligada e faça
com que a ausência de luz sirva comoS A para R \. Quando a discriminação atingir um
ponto onde a luz controla a pressão à barra disc rim in adam ente, as sugestões 3 e 1 podem
ser usadas para fazer com que o puxar o trapézio (R 2 ) produza a luz. O resultado deste
procedimento será, naturalmente, o fortalecimento de R 2 - Até o momento, a campainha
soou continuamente, não importando o estado de iluminação. Mas, depois que R 2 for
fortalecida, a campainha pode ser ligada e desligada, permitindo-se que R 2 seja efetiva na
produção da luz somente quando a campainha estiver presente. Deste modo, o puxar o
trapézio, R 2 , logo ficará sob o controle disc rim inativo da campainha, embora permaneça
sob o controle reforçador da luz.
A adição do restante dos membros resposta(R 3 , R4 , R 5 ) é feita de forma similar,
embora uma certa quantidade de aproximação sucessiva seja necessária. Comece com a
bola de gude colocada perto do buraco, sendo as condições de estímulo campainha e luz
desligadas. As respostas progressivamente mais próximas da bola de gude são reforçadas
imediatamente pela produção do som da campainha e a continuação subsequente da
cadeia. Por aproximação sucessiva, as respostas de tocar a bola de gude, suspendê-la e
deixá-la cair são estabelecidas, sendo todas reforçadas pelo som da campainha. O passo
final é a adição de R 5 . Isto é feito, levando-se a bola de gude, gradualmente, para mais
- 248-
Figura 12-1. Um rato executando uma cadeia de comportamento (segundo Michael,
1963).
longe do buraco e exigindo respostas de carregá-la com duração cada vez maior. Eventual
mente, a cadeia estará completa. A bola de gude está na mão do experimentador; o rato,
quando colocado na gaiola, vai até o experimentador, pega a bola de gude, carrega-a até o
buraco e deixa-a cair. A campainha soa e, então, o rato puxa o trapézio. Acende-se a luz,
o raio pressiona a barra, e o alimento é liberado. As contingências.são:
- 249 -
S5 S4 S3 s2 S|
R., r4 r, r2 Ri -> S H
5 4 3 2
Onde S5 - bola de gude na mão de experimentador, campainha e luz desligadas
S4 = bola de gude nas patas do rato, campainha e luz desligadas
S3 = bola de gude sobre o buraco, campainha e luz desligadas
S2 = nenhuma bola de gude, campainha ligada, luz desligada
Si = nenhuma bola de gude, campainha ligada, luz ligada
S+ = alim en to .
Depois do treino, a cadeia completa será executada suavemente sem os solavan-

:os que sugerem as unidades individuais que foram usadas no seu desenvolvimento.
Dontudo, sem o fracionamento original do comportameento e nessas unidades menores,
a seqüência completa nunca poderia ter sido desenvolvida.
Analisando as cadeias vocais humanas que constituem a linguagem falada, há uma
tendência de se negligenciar a longa história passada que torna possível o desenrolar de
longas sentenças, compostas do que, há muito tempo atrás, eram unidades em si mesmas:
fonemas, sílabas, palavras e frases. A continuidade (fluência) aparente de um episódio de
fala não nos deve distrair do fato de que a falaé um produto de uma história passada de
encadeamento, ém princípio, não diferente desta do rato educado que acabamos de
descrever.
Para amarrar o sapato, a criança se empenha numa cadeia, diferente apenas em
detalhes daquela do rato. Cada operante individual, na cadeia de amarrar, serve para
avançar o cordão para uma posição onde uma resposta ligeiramente diferente pode ser
emitida e reforçada. O reforçamenío final é um nó seguro. No treinamento de uma
criança para amarrar um sapato, operam os mesmos princípios que no treino de um rato
para executar uma cadeia. O melhor seria iniciar a cadeia pelo fim, com o sapato todo
amarrado menos o último aperto do laço. Quando esta resposta estiver fortalecida, o laço
é desamarrado ligeiramente e qualquer resposta que produza o S ^ para o laço final
será forçada. As respostas executadas inapropriadamente simplesmente irão afrouxar o
laço e, então, serão extintas. Na prática, as crianças raramente são ensinadas da melhor
maneira, mas sim, na forma de [ 1 2.3| Os pais são frequentemente desiludidos pela falta
do que chamam de inteligência, quando uma criança não domina tarefas “ simples”
rapidamente. A deficiência não está na habilidade da criança em solucionar problemas, mas
sim na «apreciação dos princípios de encadeamento pelos pais. Uma criança pode
aprender como amarrar um sapato em questão de minutos, se estes princípios são cuida
dosamente seguidos. O ideal é que o processo seja automatizado, com o uso de vários
sapatos, cada um num estado progressivamente mais desamarrado.
O estudante pode perguntar: onde estão as luzes e campainhas na cadeia de amarrar o
sapato? Por que elas foram necessárias para o rato e não para a criança? A discrepância é
apenas aparente. Ao amarrar um cadarço, cada resposta na cadeia produz, naturalmente,
uma situação de estímulo diferente, um cordão que está mais próximo de ser amarrado.
Na caixa de Skinner, o pressionar a barra ou o puxar uma corda não afeta, naturalmente,
o ambiente desta maneira, de modo que o experimentador e obrigado a acrescentar
mudanças de estímulo algo artificialmente. Mas em ambas as cadeias, os S^s e S ^ s são
as forças unificadoras. Quando o cordão está num estado particular, somente certas
respostas podem avançá-lo para o próximo estado. Assim, qualquer estado determinado
- 250 -
do cordão é um para uma classe particular de resposta e um S A para o resto. (Note
que a criança deve aprender a observar o estado atual do cordão para escolher os S ^s
'devantes). Tanto para o comportamento de amarrar os sapatos como para os movi
mentos do rato, o status de encadearqento permanece uma seqüência de respostas
operantes entremeadas com seus S^s.
Pierrel e Sherman (1963) descreveram o treino de uma seqüência exótica de compor
tamento do rato. O rato subia uma escada em espiral, atravessava uma ponte estreita e
subia uma escada de mão. Então, puxava uma corrente ligada a um carro de brinquedo
aberto, subia no carro e pedalava-o até uma segunda escada de mao. Depois de subir esta
escada, ele passava através de um tubo e entrava num elevador. O peso dc rato fazia
baixar lentamente o elevador até a plataforma inicial, onde, como um anticlímax, o
animal pressionava uma barra e recebia uma pelota de alimento pelos seus esforços. Depois
de comer, o rato estava em condições de iniciar novamente a seqüência. O observador
casual, provavelmente, ficaria maravilhado pelo desempenho rápido e seguro desta cadeia,
por um organismo tão insignificante como o rato. Um exame da história por trás de tal
desempenho, todavia, revela que apenas os princípios bem estabelecidos dos capítulos
4-11 foram empregados. O comportamento do rato foi adquirido pelos princípios de
discriminação e modelagem e encadeado pelo uso criterioso de reforçadores condicio
nados.
12.3 A APRENDIZAGEM DE LABIRINTO COMO UM ENCADEAMENTO
O labirinto tem sido associado com a psicologia há muito tempo. Em experimentos

iniciais que datam da passagem do século, animais famintos eram colocados em aparelhos
tais como os vistos na Fig. 12-2, permitindo-se que encontiassem o caminho até o
alimento. O labirinto foi adaptado para sujeitos humanos com os olhos vendados de
modo a permitir que eles traçassem seu caminho com um estilete através dos caminhos
tortuosos, com muitos pontos de escolha, talhados na madeira ou feitos de metal.
Caixa-objetivo Caixa-objetivo
da esquerda da direita Caixa objetivo
partida partida
í igura 12-2. Labirintos representativos. Cada labirinto tem uma caixa de partida e uma
ou mais caixas-objetivos ou saídas, onde o alimento pode ser encontrado. Um ponto no
labirinto a partir do qual dois caminhos sào possíveis e chamado ponto de escolha.
A força da resposta era inferida de mudanças (1) no número de erros ou entradas em
becos sem saída, e (2) no tempo de reação (RT), da caixa de partida até a caixa-objetivo.
Depois de um número variado de tentativas de treino, os indivíduos colocados no ponto
- 251 -
de partida percorriam esses labirintos rapidamente e sem erros. As curvas obtidas quando
erros ou RTs eram representados em função do número de tentativas eram de várias
formas, dependendo da estrutura particular do labirinto usado.Geralmente, à medida que
se realizava mais e mais tentativas, os erros diminuíam progressivamente até zero e os
RTs diminuíam progressivamente, aproximando-se de uma assíntota.
Havia muitas esperanças, originalmente, de que o estudo de animais em labirintos
revelaria os segredos da ação instrumental e forneceria informação fundamental a
respeito do processo de aquisição. Infelizmente, a história confirmou poucas dessas espe
ranças. Em comparação com a topografia de uma pressão à barra ou uma bicada na
seqüência do labirinto constitui uma longa e complex a cadeia, cuja aquisição envolve uma
mistura não analisada de discriminação, diferenciação e reforçamento condicionado.
Como todos esses aspectos do comportamento estarão inestricavelmente misturados
durante o treino, não é surpreendente que a aquisição no labirinto seja gradual em vez de
abrupta. Os labirintos são usados até hoje na pesquisa psicológica de problemas especiali
zados onde o grau de análise requerido é mínimo; mas, a confusão de um grande número
de fatores de aquisição acarreta dificuldades na interpretação de resultados cortiporta-
mentais. O estudante é aconselhado a encarar o comportamento no labirinto como uma
cadeia de elementos resposta h e te ro gê n e o s (isto é, diferentes), que só gradualmente se
tornam ligados em seqüências unitárias de resposta.
12.4 OS EFEITOS DA EXTINÇÃO SELETIVA EM PONTOS DIFERENTES DA

CADEIA
Embora possamos concordar que seqüências complexas de comportamento

operante são adquiridas como cadeiasque crescem gradativamente,é ainda relevante per
guntar se, uma vez formada, uma ação retém todos os aspectos encadeados. Por exemplo,
os membros originais da resposta preservam seu status unitário como respostas? Os
experimentos em que o procedimento de extinção é aplicado seletivamente aos membros
originais de um ato bem condicionado são instrutivos.
Skinner (1938) encadeou a resposta de pressão à barra e a resposta de aproximação
ao comedouro no elo usual (fase a )
__ __ __
Fase a: ^(pressão à barra) S (aproximação s+
^(alim ento Rao comedouro) —► R —
2 Lf (comer
3 ausente)
Ouando esta seqüência estava bem condicionada, introduziu-se a extinção, não se permi
tindo que a pressão à barra produzisse o som do alimentador (fase b). Esta operação de
extinção quebra a cadeia entre cadeia entre os elos 3 e 2.
Fase b: ^(pressão àbarra)

^(alim ento ausente)
Sob essas condições, os S^s para os dois membros finais (aproximação ao comedouro e
comer) não podiam ser reproduzidos e, naturalmente, a pressão à bara no elo 3
- 252 -
enfraqueceu. Quando a resposta à barra alcançou um nível baixo, a cadeia foi restabe
lecida para incluir o elo 2 , permitindo-se que a pressão à barra produzisse o som do
alimentador. Mas nenhuma outra contingência da cadeia foi restaurada (fase c ).
Fase c:
^(pressão à barra) S(som do alimentador)
S(alimento ausente) R(aproximação ao comedouro)—-f-
Os resultados dessas operações seletivas de extinção aparecem nas curvas duplas de

extinção da Fig. 12-3.
Figura 12.3. A extinção separada de membros dc uma cadeia. A

extinção de R (pressão à barra) foi conduzida até a seta. Depois da
seta, tanto R (pressão à barra) como R (aproximação ao comedou-
.o) foram extintas (segundo Skinner, 1938).
Pela figura, parece que depois da reintrodução do som do comedouro (fase c ) , a

resposta de pressão à barra readquiriu força imediatamente e uma segunda curva de
extinção foi gerada. A interpretação desse resultado é a seguinte. Durante a extinção na
fase b , a resposta de pressão à barra (na ligação 3) enfraqueceu; mas a resposta de
aproximação ao comedouro (na ligação 2 ) não, porque esta última estava principalmente
sob o controle do estímulo som do comedouro, que não ocorreu nesta fase. Uma vez
ausente na fase b , o estímulo do comedouro não perdeu suas propriedadas de SD, n e m ,
a p a re n te m e n te , suas p ro p rie d a d e s d e re fo rç a d o r c o n d ic io n a d o . Logo, o restabelecimento
da contingência 3 na fase c restituiu à pressão à barra sua fonte usual de reforçamento
condicionado, o som do alimentador. Durante a fasec, a resposta discriminativa de aproxi
mação ao comedouro enfraqueceu gradualmente através da extinção, e o som do come
douro perdeu, correspondentemente, suas propriedades de S ^, já que não estava sendo
mais emparelhado com alimento (S+).
A demonstração de Skinnci sugere que, na extinção, somente os membros de uma
cadeia até o ponto de fracionamento diminuem em força. A força de membros e S^s além
desse ponto é preservada.
A extinção pode ser aplicada de uma forma algo diferente para demonstrar ainda a
natureza encadeada do comportamento estabelecido. Ratos são inicialmente treinados a
percorrei um labirinto em forma de T (Fig. 12-2), obtendo o alimento que é colocado
numa das caixas-objetivo (digamos, à direita). Quando os ratos vão para o lado direito
consistente e rapidamente, estão prontos para a próxima fase do experimento. O
alimento é retirado da caixa-objetivo, os ratos são colocados diretamente na caixa-
objetivo agora vazia (onde haviam outrora encontrado alimento depois de percorrer o
- 253 -
labirinto), permanecendo ali por um momento. Numa fase final de teste, os ratos são
colocados na caixa de partida com o alimento ainda não presente na caixa-objetivo. O
tempo requerido para percorrer a distância entre a caixa de partida e a objetivo é medido.
O ato de percorrer o labirinto daqueles ratos que tiveram uma história passada de serem
colocados na caixa-objetivo vazia mostra uma extinção rápida, foradonormal. No teste,
estes ratos percorriam o labirinto mais devagar e cometiam mais erros do que cometeriam
se não tivessem tido a oportunidade de “descobrir” que sua caixa-objetivo estava agora
vazia,
Esta redução na força da resposta define um fenômeno conhecido como “extinção
latente” . A escolha desta expressão para descrever o comportamento é baseada numa
interpretação discutível da fase intermediária do experimento, em que os animais são
colocados diretamente no compartimento vazio. “Extinção latente” implica em que esta
fase intermediária é um período durante o qual a extinção do comportamento de percor
rer o labirinto está ocorrendo de forma implícita, ou latente. É tentador dizer que os
ratos param rapidamente de correr no labirinto, em extinção, porque, já tendo t*do
bastante tempo para “ investigar” a caixa-objetivo vazia, eles “ sabem” , antes de correr,
que a encontrarão vazia. Infelizmente, esta explicação baseia-se no futuro como o fator
controlador do comportamento e contém todas as falhas de tais “explicações” , mencio
nadas anteriormente (seção 4.1) Uma interpretação mais simples, embora mais austera,
está baseada na extinção “manifesta” e perdas no reforçamento condicionado. No treina
mento, os ratos aprenderam a percorrer o labirinto.
Treino: __ ___
S(caixa de partida) S(ponto de escolha) S(caixa-objetivo)
R(correr) ----- » R(virar à direita)— ; R(dirigir-se ao recipiente com
T 2 1 alim ento)-----* S +
Na fase intermediária, os ratos estavam na caixa-objetivo, agora vazia, resultando em
alguma extinção verdadeira de R \.
S(caixa de partida)
R( dirigir-se ao recipiente com alimento) — **
1
No teste, toda a cadeia foi submetida a um procedimento padrão de extinção.
Teste:
S(caixa de partida) S(ponto de escolha) S(caixa-objetivo)
R(correr)------^ R(virarà direita)---- R(dirigir-se ao recipiente com
3 ‘ ~2 ' 2 1 alimento) —
Os membros resposta associados com as contingências 3 e 2 foram significativamente
enfraquecidos pela fase intermediária. A explicação dessa diminuição na força é encon
trada na redução drástica do poder reforçador da caixa-objetivo que ocorreu nesta fase.
Na “extinção latente” , esta redução parece regredir por toda a cadeia, diminuindo o
poder reforçador de todos os SDs anteriores.
Os resultados da “extinção latente” e do experimento de extinção seletiva de
Skinner sugerem a seguinte generalização composta de duas partes. Todos os membros de
urna cadeia até o ponto em que, nesta cadeia, um membro tenha'sido submetido a
extinção, sofrem um enfraquecimento, se ou não estes membros foram realmente emiti
- 254-
dos. Por outro lado, nenhum dos membros além do ponto de extinção é enfraquecido. A
generalização é de algum interesse como um método prático para reduzir o comporta
mento não desejado pela simples extinção dos reforçadores condicionados dos quais ele
depende. Se o comportamento não desejado consiste de uma seqüência grande e de longa
duração, tal princípio, se é que ele se mantém para cadeias de qualquer tamanho, deve ser
bem recebido pelos educadores que acham desejável extinguir velhos pontos de vista
antes de ensinar os novos.
12.5 ESQUEMAS ENCADEADOS
Nem sempre é fácil avaliar as forças das várias respostas e reforçadores condicionados
numa cadeia estabelecida do tipo que descrevemos.
(1) O problema da medida. As respostas nessas cadeias são heterogêneas, isto é, as
respostas sucessivas na cadeia diferem uma da outra quanto à forma Quando um rato
rola uma bola de gude até um buraco, puxa um cordão e pressiona uma barra, é pouco
provável que esses comportamentos ocorram com taxas idênticas. As respostas variam na
topografia, duração e esforço requerido. Assim, seria surpreendente se suas taxas de
ocorência fossem comparáveis. Mas uma cadeia, cujos membros correm com taxas
variadas devido às variações topográficas, presta-se pouco como um meio para o estudo
dos efeitos quantitativos que várias operações experimentais, tais como drogas, lesão
fisiológica e esquemas de reforçamento poderiam exercer no comportamento encadeado.
(2) O problema da sensibilidade. Quando essas cadeias estão bem estabelecidas,elas
funcionam como unidades. Isto é o que queremos dizer quando nos referimos aos seus
membros como estando “ ligados” no que eqüivale a um operante de ordem superior. A
estrutura unitária dessas cadeias é uma conseqüência da manutenção dos membros sob o
controle funcional do reforçamento, como fazemos para um operante mais simples.
Embora tenhamos visto que a extinção seletiva é uma forma de revelar a estrutura
essencialmente encadeada de tais atos, muitas operações experimentais parecem afetar a
seqüência como uma unidade. A cadeia como um todo pode variar em força, em função
dessas diferentes variáveis experimentais, mas as forças relativas dos membros individuais
da cadeia permanecem insensíveis a essas variáveis.
Em contraste com a cadeia simples, o esquema encadeado (Ferster e Skinner, 1957)
fornece uma linha-base quantitativa e sensível para avaliar as propriedades de cadeias.
Como as cadeias já descritas, os esquemas encadeados consistem de uma sucessão de
contingências ligadas. Mas, ao contrário dessas cadeias, os esquemas encadeados especi
ficam que cada membro da resposta produz a contingência seguinte probabilisticamente.
Assim, em qualquer ligação única, um número de respostas pode ter que ser emitido para
avançar a cadeia para a próxima ligação. A vantagem disso é que, em qualquer ligação
probabilística, a taxa, frequência ou padrão do responder fornece uma variável depen
dente sensível que pode ser estudada independentemente da taxa, freqüencia ou padrão
dos membros resposta numa ligação em qualquer ponto da cadeia. Além disso, já que os
membros individuais no esquema encadeado podem ser convenientemente especificados
como classes de respostas idênticas (homogêneas), o problema de medida associado com
as topografias heterogêneas em cadeias mais simples é contornado.
Considere um esquema encadeado homogêneo com duas ligações. Lembre-se de
que o termo ligação se refere aosS ^s sucessivos do esquema. Na notação, os colchetes
sucessivos de um diagrama denotam as ligações. Numa cadeia simples, cada ligação c
- 255 -
associada com uma e somente uma resposta, mas no esquema encadeado esta
correspondência um-a-um entre resposta a ligação não está presente.
Um esquema encadeado representativo está abreviado em [ 12A\ .0 bicar a chave de
um pombo na presença de uma luz vermelha produz, num esquema RI, uma luz verde; o
bicar a chave na presença da luz verde produz, num esquema FI, o reforçamento com
alimento.
S(vermelho) S (verde)
R (bicar) RI > R(bicar) FI ^ g+ [12.4]
2 1
0 diagrama [12.4 (descreve uma cadeia de duas ligações mas uma que gera tipicamente
muitas respostas de bicar a chave por reforçamento. Além disso, padrões diferentes de
resposta se desenvolvem nas diferentes ligações, sendo cada padrão apropriado para a
contingência específica da ligação em que ocorre. Assim, as curvas na Fig. 12.4A
mostram que efeitos típicos de RI ocorrem na segunda ligação, a situação luz vermelha;
as curvas naFig 12-4B mostram que efeitos típicos de FI são gerados na primeira ligação, a
situação luz verde. Dois registradores foram usados para obter a Fig. [ 12-4[.Bicadas na
presença da luz vermelha (ligação 2 ) foram registradas num registrador; bicadas na
presença da luz verde (ligação 1) foram registradas em outro. Quando o animal estava na
situação associada a uma determinada ligação, somente o registrador apropriado para esta
ligação era operado.
O procedimento do esquema encadeado tem aplicação na avaliação, em detalhes
quantitativos, do poder reforçador de um reforçador condicionado. Na seção 11.2, está-
vamos preocupados com a durabilidade de um reforçador condicionado: isto é, quanto
tempo um reforçador adquirido retém seu poder de manter comportamentos. Mas a força
de um reforçador condicionado em qualquer momento determinado é,
r
f
' ' f ,
6 min
(A)
(B)
Figura 12-4. Respostas produzidas num esquema encadeado RI 45 seg - FI 45 seg.

Bicadas na chave são as respostas de pombos famintos. O aparecimento de uma luz
verde associada à contingência FI é o reforçamento em (A). O alimento é o reforça-
mento em (B). (Dados não publicados de J. R. Milienson).
- 256-
frequentemente, de igual interesse. Em linguagem coloquial, a força de um reforçador é
porporcional à quantidade de trabalho que o animal despenderá para obter o reforçador.
Uma discussão completa sobre a força de reforçadores encontra-se no capítulo 15. No
momento, é suficiente notar que a taxa em que um organismo trabalha numa situação
(onde seu trabalho tenha, no passado, produzido o reforçador) é urna medida de tal
força. Em geral, um homem que deseja algo “ ardentemente” trabalhará muito para
conseûí-lo. Assim também o pombo. Quando o EI da primeira ligação em 112.41 é
aumentado, ou diminuído, a taxa total de bicadas do animal nesta ligação FI dificilmente
é afetada. Mas sua taxa de bicadas na ligação RI precedente se altera sistematicamente. A
função é suave e é apresentada na Fig. 12-5. A função foi obtida com um procedimento
igual ao de [ 12.4 1 . Em vários meses de experimentação diária, quatro valores de FI na
ligação 1 foram estudados. De acordo com a Fig. 12-5, quanto maior o Fl menos o
animal tende a trabalhar para produzir a ligação associada ao FJ e, assim, por inferência,
menor o valor reforçador a ela associado
Os esquemas encadeados podem ser combinados com especificações de resposta de
ordem superior, formando cadeias tais como V I-R F , V I-drl e F R -F I. O número de
ligações permissíveis pode ir além de dois. Demonstrou-se que cadeias VI-VI-VI-VI-VI
mantêm o comportamento (Kelleher e Gollub, 1962). Muitos fenômenos cómporta-
mentais interessantes ocorrem, encadeando-se uma variedade de procedimentos. O estu
dante interessado pode consultar Ferster e Skinner (1957) e Kelleher e Gollub (1962)
para detalhes adicionais.
Figura 12-5. Respostas por m inuto na segunda ligação de um esquema encadeado duas
ligações em função do esquema FI na primeira ligação (dados não publicados de J. R.
MilIcYjson).
12.6 O COMPORTAMENTO HUMANO COTIDIANO COMO ENCADEAMENTO

No c o m p o rta m e n to hum ano, quase toda ação ou habilidade, desde o
atravessar uma sala até o assobiar uma canção, tem a forma de uma cadeia operante. Tais
cadeias são compostas da maneira em que as séries de movimentos foram combinadas
pelos r-»tos descritos na seção 12.1? Os S^s separam cada movimento simples no desem
- 257 -
penho humano e servem para ligar a seqüência como um todo? A análise sugere uma
resposta afirmativa para ambas as questões.
No comportamento conhecido como caminhar, uma perna é erguida, estendida e
toca o chão. A outra perna, então, repete um padrão semelhante. A cadeia é claramente
algo como
[12.5]
onde So =ambas as pernas apoiadas no chão e R()-erguer a perna esquerda

pés juntos
S6 =perna esquerda acima do chão R6 =estender a perna esquerda
S5 =perna esquerda estendida R 5=abaixar a perna esquerda
S4 =perna esquerda apoiada no chão e pé R4 =erguer a perna direita
esquerdo adiante
S3 =perna direita acima do chão R3 = estender a perna direita
S2 =perna direita estendida R2 = abaixar a perna direita
S\ =perna direita apoiada no chão e pé di- R \ =eiguer a perna esquerda
reito adiante
Nesta cadeia, as descrições dos estímulos podem ser questionadas em termos práticos.
Quando caminhamos, em geral não observamos continuamente a posição de nossas
pernas em uma relação à outra. De quajqucr foram, caminhamos adequadamente no
escuro. Evidentemente, existem eventos dentro do organismo que são parte dos Ss em
cada colchete de [ 12 . 5 ]. Estes elementos internos de cada situação de 112.5 | surgem
dos próprios movimentos do corpo. Mencionamos brevemente, na seção 9.1, os
receptores conhecidos como proprioceptores, que se acham localizados nos músculos c
tendões. Esses receptores têm a propriedade de responder diferencialmente a vários
movimentos de músculòs e tendões. Assim, cada S em 11 2.5 | pode ser descrito mais
completamente, notando-se não apenas o estado do membro em referência ao
ambiente externo como fizemos, mas também o estado exato dc tensão dos conjuntos
particulares de músculos usados. No andar comum, esses estados são usados como as
deixas principais para manter uma seqüência dc movimentos bem coordenada.
Contudo, a sensibilidade muscular não é sempre suficiente, especialmente na
aquisição de seqüências mais complexas, para a coordenação ideal do comportamento.
Ao aprendermos um novo passo de dança, um instrutor pode ter que nos aconselhar a
não olharmos para nossos pés. Nosso comportamento de observar é uma maneira óbvia
de assegurar que colocamos nossos pés “onde deveriam ser colocados” durante a dança.
Mas, o comportamento visual de observar não é incentivado pelos mestres de dança
porque ele viola certos padrões estéticos, retarda a aquisição do controle apropriado pela
propriocepção e torna quase impossível que duas pessoas dancem juntas. Em certas
doenças ou lesões da medula vertebral, os receptores proprioceptivos não operam. Nesles
- 258-
casos, as pessoas continuam a caminhar, mas somente pela observação visual da posição de
suas pernas.
A duplicação de indícios e a superposição informativa comumente encontrada nas
situações é explorada na técnica conhecida como “substituição gradual de controle". As
cadeias são frequentemente formadas utilizando-se elementos bem grosseiros das situa
ções como S^s preliminares. Então, à medida que a aquisição prossegue, os controles são
gradualmente transferidos para porções cada vez mais sutis das situações. Isto pode ser
feito não se liberando o reforçamento quando um comportamento grosseiro de observa
ção é detetado, como no exemplo da dança, ou removendo-se gradualmente certos
aspectos da situação. Por exemplo, ao aprender a dirigir um carro, o novato pode depen
der, inicialmente, de comandos verbais do seu instrutor de direção para manter uma
cadeia suave de comportamento. Esses comandos são vistos entre aspas em 12.6 na
designação dos S^s.
SB
SA [ 12.6]
R a - — > Rn - ---- > Rc -*■ SD
onde S \ “Coloque em marcha lenta”+ carro parado

RA = colocar a alavanca de cambio em marcha lenta
Sb =Pise no acelerador” * alavanca em marcha lenta
Rg =pisar no acelerador
Sç ~“ Solte a embreagem” + motor com rotação moderada
Rç =soltar a embreagem
Sd = “Muito bem!” + carro move-se para a frente
O instrutor pode, gradualmente, começar a omitir os elementos verbais das situações, de

modo que as deixas provenientes do pedal de embreagem e da alavanca de câmbio passem
a atuar diretamente. Os professores, ocasionalmente, se esquecem de que no mundo fora
da sala de aula, deixas verbais faladas e escritas — como as “instruções” de 22.6 são
muitas vezes chamadas — raramente estão presentes. Assim, é importante que no ensino
formal, as deixas verbais usadas no início sejam retiradas antes que o estudantes possa ser
considerado treinado. É esta eliminação gradual de partes de uma situação de S^,
deixando apenas aspectos mínimos do estímulo em controle, que é conhecida como
s u b s t it u iç ã o gradual de controle.
Outros casos de substituição gradual de controle surgem quando um músico aprende
uma composição musical de cor. Inicialmente, as notas individuais escritas na pauta
fornecem os S^s. Na passagem
1
4 *
a cadeia R (tocar FA), R (tocar MI), R (tocar SI), R (tocar LA), é determinada. Inicialmen
te, os membros individuais da cadeia são controlados pela partitura. Eventualmente, toda
via, a partitura é gradualmente removida, as respostas de observar diretamente a partitura não
- 259 -
são incentivadas pelo instrutor e finalmente os próprios sons das notas fornecem todos os
S^s necessários. Em geral, o paia tocar uma nota iião será necessariamente o som da
nota imediatamente procedente, mas, em vez disso, uma combinação dos sons de várias
notas anteriores uma passagem. Assim, por exemplo, a deixa para a execução das nota
E acima, geralmente não será apenas a nota B anterior, mas tal execução estará sob o
controle de uma longa série de notas precedentes, sendo a B apenas a última dessas.
Como seria esperado, portanto, as passagens de execução mais difícil são aquelas que são
semelhantes, isto é, aquelas que contêm seqüências de notas idênticas terminando numa
nota final diferente. Para tocar a nota correta, o único disponível está localizado a
alguma 'istância (nas passagens muito semelhantes, talvez uma meia dúzia ou mais notas
anteriores) é as notas imediatamente precedentes devem, no momento, ser ignoradas.
Uma quebra no encadeamento explica a hesitação que um artista algumas vezes exibe
ao iniciar uma passagem. Não há um único no início da partitura. Um problema
semelhante pode ocorrer na memorização de poesia. Uma vez começada, cada palavra
falada marca a ocasião para a próxima palavra, mas é necessário alguma deixa verbal para
se iniciar. Quando crianças recitam poesia, frequentemente se observa que elas fazem
uma “ pausa” entre as linhas. Este é o resultado de se memorizar linha por linha, de modo
que a última palayra da linha anterior não adquire poder suficiente de para a primeira
palavra da linha seguinte.
12.7 CADEIAS VOCAIS
Não somente a poesia, mas todo comportamento verbal humano (comunicativo) é

encadeado. A sentença é uma cadeia de palavras, sendo que cada palavra falada é uma
resposta que produz um S ^ (o som dessa palavra) que marca ocasião para a próxima
palavra. Não distinguimos os ruídos emitidos por seres humanos como sendo fundamen
talmente diferentes de outros operantec humanos e animais. Num capítulo anterior
(seções 4.10 e 4.11) descrevemos experimentos que indicavam que o comportamento
vocal de crianças e estudantes universitários é fortalecido e enfraquecido de acorda com
as contingências, de reforçamento apropriadas. Desejamos ampliar, nesta seção, o que já
explicamos, indicando, ao mesmo tempo, como a linguagem alcança um status tipica
mente encadeado.
Considerando-se que a linguagem é tão intimamente uma parte aa arte, ciência e
culjura humanas, estudiosos _e cientistas de várias disciplinas têm sido levados a aplicar
seus diferentes pontos de vista e técnicas para analisar a linguagem. O corpo de conheci
mento resultante constitui a lingüística. No presente texto, restringimos nosso interesse a
três problemas “psicológicos” da linguagem: ( 1 ) O que constitui uma descrição compor
tamental conveniente da linguagem? (2) Como este comportamento é adquirido? (3)
Qual é o “ significado” da linguagem? Nesta seção, restringimos nossa atenção aos dois
primeiros problemas, adiando a análise do “ significado” (que é melhor descrito pela
enumeração de condições específicas que controlam as seqüências particulares de lingua
gem) para o capítulo posterior sobre aquisição de conceito.
Na seção 4.10 notamos que, bem cedo na vida da criança, a distribuição da freqüên
cia relativa de vários fonemas torna-se semelhante aos histogramas de fonema para a
comunidade em que a criança está sendo criada. A correspondência é presumivelmente o
efeito de contingências de reforçamento seletivo peculiares a essa comunidade. Embora
tais distribuições possam nos dizer quais são os sons básicos que mais provavelmente
- "GO
serão enunciados por um dado indivíduo, elas fornecem pouca informação sobre a estru
tura do comportamento verbal. Esta estrutura é convenientemente descrita como cadeias
de palavras. Além disso, as próprias palavras faladas são convenientemente representadas
como cadeias de sílabas ou fonemas. Naturalmente, da mesma forma que os membros
resposta no comportamento encadeado do rato relativo à pressão à barra, as unidades de
cadeias verbais também desaparecem nas seqüências que fluem suavemente. Sob certas
condições, a natureza encadeada das palavras é facilmente demonstrável. Na aquisição de
uma palavra nova e difícil, de modo a podermos repetir a palavra corretamente. A palavra
“ Monongahela” , dos índios Delaware, é de difícil pronúncia para estrangeiros. Quando a
palavra é representada como uma cadeia, os S^s dos sons e as Rs de falar são convenien
temente descritos como sílabas [12.7.| Inicialmente, os sons podem ser
[12.7]
lü < h e > Iü < la > S "la '
2 1
produzidos pelo aparelho vocal de um instrutor ou, em princípio, por uma máquina. As
respostas de 112.7Jsão aquelas de um organismo aprendendo a pronunciar a palavra. Na
notação, os elementos falados (R) das palavras são colocados entre colchetes oblíquos
< > ; enquanto os sons (S) das palavras são colocados entre aspas “ ” .
No início da aquisição, os S^s de qualquer ligação determinada em [12.7 |não têm
controle suficiente sobre as Rs desta ligação para produzir seguramente um comporta
mento. O instrutor pode ter que fornecer uma deixa verbal para a sílaba desejada. Por
exemplo, após o erro comum mongonga , o instrutor pode aconselhar um reinicio e,
depois que o aprendiz responde , mo , ele mesmo pode dizer “non” . Sob instruções
apropriadas para imitar, o S “non” provavelmente controlará a R non . Naturalmente,
o instrutor eventualmente removerá essas deixas verbais de modo que a pronúncia correta
se torne independente da sua presença.
Uma nota sobre imitação é aqui inserida entre parênteses. A imitação é, inquestio
navelmente, um método valioso para controlar o comportamento. Mas, como uma
maneira rápida para o processo completo de aquisição, ele pode ser muitas vezes superesti
mado. Os professores frequentemente se surpreendem ao observar que, dando ao aluno
um pouco de informação, frequentemente nada ensinam ao estudante. O desempenho
complicado de um dançarino, de um acrobata hábil ou de um músico não pode ser
colocado no repertório de um novato através da mera imitação. Observar alguém a dirigir
um carro ou pilotar um avião não desenvolve, por si só, estas habilidades no observador.
A imitação é quase sempre útil para aumentar a força de respostas previamente adquiri
das, mas não é tão útil para encadear os membros numa seqüência de qualquer tamanho
ou complexidade.
A natureza encadeada das palavras é claramente exposta em experimentos que alte
ram a sucessão normal de S^s. Se respostas silábicas do tipo visto em [ 12.7 ]não produ
zem seus S^s característicos imediatamente, o padrão da fala rompe-se e se torna caóti
co, sujeito pode começar a garguejar e, em casos extremos, é totalmente incapaz de falar.
No Feedback auditivo com atraso, as relações normais R -* S^ na fala de cada uma das
suas próprias Rs de falar, por cerca de 1/5 de seg. (Lee, 1950). O termo feedback foi
emprestado da linguagem da eletrônica, onde parte de um sinal de saída “out-put” —
(por exemplo, na sua vitrola, parte da energia amplificada que ordinariamente iria para
261 -
seu altofalante) é retornada (feedback) para a entrada — “ input” — (o lugar onde você
coloca a tomada de sua vitrola) do mesmo circuito. Por analogia, uma resposta pode ser
considerada uma saída do sistema comportamental; o ambiente pode ser considerado a
entrada deste sistema. Quando um organismo opera em seu ambiente, emitindo operan-
tes, as mudanças no ambiente produzidas pelas próprias respostas do organismo podem
ser consideradas um feedback para o organismo. A palavra “feedback” , despida de sua
característica eletrônica, é análoga àquelas conseqüências especiais que chamamos refor
çadores primários e secundários.
Imagine um sujeito numa sala á prova de som. Fones de ouvido confortavelmente
ajustados e paredes e tetos que absorvem sons impedem-no de escutar sua própria voz
pela propagação normal através do ar. (Uma recepção muito reduzida é possível através
da propagação nos ossos). Os sons produzidos pelas respostas de falar vão para um
gravador através de um microfone. Eles são retardados pelo simples procedimento de
primeiro gravá-los e, então, uma fração de segundo mais tarde, tocá-los amplificados para o
sujeito. A amplificação serve para anular quase toda a condução óssea de S^s. O eteito
obtido é um exagero daquele observado quando um orador fala para o público, num
sistema de alto-falante, estando o alto-falante localizado a alguma distância de seu micro
fone.
Num caso típico de distorção da fala produzida por este tipo de atraso de som, a
pronúncia de Monongahela torna-se monongahelala. Considere este efeito em relação à
cadeia do diagrama [12.7 |. Na ligação da contingência 1, o sujeito acabou de pronunciar
R < la > e, em circunstâncias normais, ouviria imediatamente S “ Ia” , o final na cadeia.
Mas, devido ao atraso, ele escuta S “he” , que ainda controla outra R < la>. O efeito é
mais pronunciado no final da cadeia porque, na fala normal, o comportamento no meio
da cadeia da palavra mantém-se ligado pelos movimentos imediatamente antecedentes do
aparelho vocal, em adição aos efeitos sonoros produzidos por esses movimentos. A R
final,uma pausa deliberada, é mais dependente do som da sílaba terminal. (A maneira mais
segura de você saber que terminou de falar uma palavra é escutar sua última sílaba).
O método de feedback auditivo com atraso, quando com um atraso fixo, pode não
ser o melhor para quebrar a cadeia da fala. Com a prática, parece razoável que o sujeito
passe a usar os S^s atrasados, uma vez que eles ainda têm uma relação fixa com o
comportamento anterior (sempre 1/5 seg mais tarde). Se o atraso fosse uma média de
intervalos aleatórios igual a 1/5 seg, intervalos esses que variassem de momento a momen
to, esperar-se-ia um rompimento mais completo da cadeia de linguagem falada.
As sentenças podem ser analisadas de forma análoga às palavras. Durante a infância,
a aquisição de sentenças é baseada na ligação de combinações cada vez mais longas de
palavras. Não levando em conta o problema do significado, as cadeias de sentenças
diferem das cadeias de comportamento do rato até aqui consideradas, no sentido em que
seus membros resposta (palavras) são combinados em muitas seqüências diferentes
permissíveis. (Isto também é verdadeiro nas cadeias de sílabas que formam as palavras). A
cadeia “ o cachorro morde o homem” é controlada por uma situação muito diferente da
cadeia “ o homem morde o cachorro”. Logo, as unidades básicas das sentenças (palavras)
não podem ser aprendidas em qualquer seqüência fixa da maneira em que o rato da seção
12.2 aprendeu os membros de sua cadeia. A sentença é construída peça por peça, empre
gando as palavras como unidades. À medida que a criança cresce, a média do tamanho de
suas sentenças faladas aumenta, como é visto na tabela 12 - 1 .
- 262-
Tabela 12-1
TAMANHO MÉDIO DE SENTENÇAS FALADAS EM VÁRIAS IDADES

( s e g u n d o M c C a r th y , 1954 )
Idade (anos) 1.5 2.0 2.5 3.0 3.5 4.0 4.5
Número de 1.2 3.1 3.4 4.3 4.4 4.6
nalavras
Como as unidades de palavras são organizadas em sentenças? O mecanismo parece

ser um encadeamento de operantes discriminativos discretos. Por exemplo, o comporta
mento verbal de uma criança pode ser modelado (de acordo com os princípios dos
Capítulos 7 e 8) de tal modo que a palavra “bola” venha a ser pronunciada, quando
solicitada, na presença de objetos esféricos. Similarmente, pode-se tomar o reforçamento
contingente à emissão de certos sons pela criança (<azul> <vermelho>,<verde >, etc.),
na presença de objetos apropriadamente coloridos. Finalmente, a criança pode ser treina
da a vocalizar < Eu tenho... > nas circunstâncias em que esteja com um certo objeto
para o qual ela tenha aprendido um nome, como aprendeu “bola” . A chave para esta
análise é que cada palavra ou conjunto de palavras fica sob o controle de uma situação
ambiental e s p e c í f i c a , ou, mais exatamente, um conjunto de situações:
S (bola) S (objeto vermelho) S ( de posse de... )

^ ^ b o !a > *S , R< vermelho>----- >-S \ R < E u tenho... > — s+
Embora a criança nunca possa ter completado esta seqüência, a questão “O que você u il
aí? ” pode produzir a nova cadeia, R < eu tenho > lumajR < bola > R < verme
lha> , se os elementos da seqüência — em conjunção com certas regras gramaticais a
respeito de artigos indefinidos e suas posições com relação a outras palavras e as regras
que governam a ordem dos adjetivos e substantivos —já existem no repertório comporta
mental. Naturalmente, não há necessidade de que a criança seja capaz de verbalizar estas
egras; ela precisa apenas empregá-las apropriadamente. Tipicamente, o fortalecimento do
ornportamento de verbalizar regras gramaticais é reservado para os professores de Portu
guês.
12.8 CADEIAS RAMIFICADAS E REPRESENTAÇÃO DO DIAGRAMA DE FLUXO
No estudo das “ recompensas tokens” com chimpanzés, estabeleceu-se uma discrimi

nação entre fichas brancas “com valor” e fichas de metal “ sem valor” (seção 11.3) Numa
variação do procedimento, os chimpanzés tinham que puxar uma barra para obter fichas.
Algumas vezes, eles obtinham uma ficha branca pelo seu esforço, mas outras vezes
obtinham uma de metal. Quando recebiam uma ficha branca, eles a colocavam numa
máquina de vender que fornecia uvas ou gomos de laranja. Mas, nas ocasiões, em que
recebiam fichas de metal, os animais desprezavam-nas e voltavam à barra para uma nova
tentativa. Eles aprenderam que colocar fichas de metal na máquina de vender nunca
produzia o reforçamento.
- 263-
As contingências de puxar a barra para os chimpanzés parecem de alguma forma com
aquelas de um motorista que se aproxima de um cruzamento. O comportamento que o
motorista emite no cruzamento dependerá de ele encontrar uma luz verde, uma luz
vermelha, um sinal para prosseguir ou um policial de trânsito. As conseqüências de
estimulo do comportamento de aproximação do motorista e do comportamento de
puxar a barra do chimpanzé estão sujeitas a um grau de incerteza. Em ambos os casos,
uma determinada resposta — puxar a barra ou aproximar-se do cruzamento —pode levar
a várias situações possíveis. E a resposta apropriada que se segue na cadeia(inserir
a ficha ou puxar a barra novamente; parar ou seguir) dependerá da situação particular em
que de fato ela ocorreu.
Quando uma resposta numa cadeia de comportamento pode, deste modo, levar a
uma de várias situações possíveis, diz-se que as contingências naquele ponto se ramificam.
Notamos as contingências simples, ramificadas, nas seções anteriores, desenhando várias
setas partindo de uma R e indicando as probabilidades de cada conseqüência de estímulo.
Muitos dos problemas cotidianos são mais complexos que aqueles encontrados pelo
chimpanzé e o motorista. Nestes casos, as soluções são encontradas apenas cruzando-se
uma cadeia complexa de tais contingências ramificadas. No problema típico, as contin
gências são compostas de modo a formar uma rede complexa de ramos, sub-elos, interco-
nexões, becos sem saída e rotas alternadas.
E conveniente analisar o arranjo de contingências de reforçamento no caso de reso
lução de um problema mais complexo. Ao achar a diferença entre dois números, uma
criança está resolvendo um “problema” . Para o adulto sofisticado, naturalmente, o
exercício de subtração parece uma execução trivial de uma seqüência comportamental
automática. O sabor de um “problema” há muito se perdeu; todavia, é por essa razão que
uma análise deverá ser esclarecedor a.De fato, o fracionamento do exercício simples revela
uma cadeia bastante complexa de contingências, em que pelo menos três habilidades
comportamentais participam.
Considere o seguinte problema
60048
- 152
Para os objetivos de análise, referir-nos-emos aos inteiros 6 ,0 ,0 ,4 e 8 , que aparecem no

número superior, como inteiros superiores, ou simplesmente “superiores” ; e, aqueles
números 1, 5 e 2, que aparecem no número inferior, como inteiros inferiores, ou simples
mente “ inferiores” . Supomos que quaisquer espaços existentes sob um superior (por
exemplo, aqueles sob o 6 e o último zero à esquerda do mesmo problema) são conside
rados zeros.
Podemos identificar três operantes que o repertório comportamental do invidíduo
deve incluir para que ele execute as várias cadeias que levarão à “solução” do problema.
1. Um repertório de respostas simples de subtração deve estar presente. Uma criança

é treinada para responder “ três” ao comando “subtraia quatro de sete” ; a responder
“oito” ao comando “dezessete menos nove” ; e assim sucessivamente. Em geral, uma lista
de operantes discrim in ativos é adquirida, de modo que a criança pode dar corretamente a
resposta a qualquer subtração onde o “ superior” não é maior que 18 e o “inferior” não
maior que 9. (Acima desses limites, uma subtração será “solucionada” pelo processo a ser
- 264-
descrito). Esta lista de respostas constitui um conjunto de operantes discriminativos
usualmente adquiridos através da aprendizagem de decorar e ditos serem “memorizados” .
As respostas poderiam, naturalmente, ser rapidamente retiradas de uma tabela, mas elas
são usadas tão frequentemente em problemas de aritmética que o procurar numa tabela
atrasaria drasticamente a execução da cadeia de solução.
2. O comportamento de pedir emprestado deve ter sido previamente adquirido. Dado
um “ inferior” maior que seu “ superior”
60048
152
deve-se ser capaz de examinar o primeiro “superior” diferente de zero localizado à

esquerda (60048), e diminuir 1 dele. Deve-se, então, transformar quaisquer zeros existen
tes entre os dois “ superiores” em questão em noves (59948), e finalmente adicionar 10
ao “ superior” cujo “inferior” originalmente o excedia (599 114.81).
3. O indivíduo deve ser capaz de discriminar o maior de dois inteiros. Essa discrimi
nação consiste, primeiro, de uma resposta de observação dirigida para o “inferior” , e,
então, para o “ superior” logo acima dele. Se o “ inferior” é maior do que o “ superior” ,
então uma resposta (pedir emprestado) deve atuar; de outro modo, outra resposta
(subtrair) deverá atuar.
Quando tentamos representar por Rs, Ss e colchetes, as contingências que combi
narão essas tres habilidades componentes de tal forma que produzam uma solução,
encontramos uma dificuldade. Este problema aritmético é relativamente simples quando
comparado com muitos outros problemas numéricos e não numéricos. Contudo, suas
contingências compreendem tantos ramos,sub-elos, ínterconcxões e rotas alternadas, que
nossa notação é sobrecarregada para fornecer uma representação manejávcl. Uma represen
tação menos confusa da estrutura comport am en tal de tais tarefas é necessária.
As respostas e discriminações que o indivíduo faz ao solucionar um problema como a
subtração contêm certa semelhança com as operações que um computador digital realiza
para solucionar problemas similares. A máquina e o homem podem não empregar méto
dos idênticos, mas ambos alcançam uma solução através da aplicação de habilidades
componentes no momento e local apropriados. Os cientistas de computadores desenvol
veram uma notação para descrever o fluxo seqüencial das operações da máquina. Os
elementos desta notação são a caixa de teste (Fig. 12-6) com uma entrada e duas saídas,
correspondendo comportamentalmente a uma discriminação, e a caixa de operação Fig.
12-7) com uma entrada e uma saída, correspondendo comportamentalmente a uma
seqüência fixa de respostas.
entrada entrada
operaçao
saída 2 saída
Figura 12-6 Figura 12-7
- 265-
A Fig. 12-8 é um diagrama de fluxo de testes e operações que descrevem as etapas
que levam à solução do nosso problema de encontrar a diferença entre dois números. Um
sub-elo (visto em pontilhado) descreve o comportamento de observação que precede o
processo real de solução do problema. O comportamento pode circundar várias
Início
Figura 12-8. Diagrama de fluxo comportamental para se encontrar a diferença entre

do::, números
- 266-
vezes esse elo antes de alcançar as condições de que permitem o avanço da cadeia. O
pedir emprestado é visto como um caminho que pode ter que ser percorrido, dependendo
dos resultados do teste do inferior mais à esquerda do diagrama.
O arranjo das habilidades componentes na estrutura vista na Fig. 12-8 garante uma
“ solução” para o problema definido. Comportamentalmente, uma “solução” constitui-se
da produção de uma situação (SD) com certas propriedades. No caso presente, este é
um número que, quando somado a 152 resulta em 60048. Quando um conjunto de
contingências, testes e operações pode ser arranjado de modo a dirigir o comportamento
para a produção inevitável de um da solução, referimo-nos à cadeia resultante como
um algoritmo. Muitos problemas práticos do cotidiano, desde costurar e cozinhar até
calcular e desenhar, são analisados em termos dessas cadeias algorítmicas de comporta
mento.
12.9 CADEIAS DE COMPORTAMENTO ENCOBERTO
Uma das características principais das cadeias de linguagem é a sua capacidade de se

tornarem encobertas, de modo que é difícil dizer por observação direta o que a pessoa
está fazendo, se o estiver, quando está resolvendo um problema “por si mesma” . Como
nos referimos repetidamente ao comportamento como tudo o que se pode observar que
um indivíduo fazendo, existe aí um problema real de definição. Estamos lidando com o
comportamento quando uma criança resolve um problema de subtração “para si
mesma” ? Por inferência, existe uma razão para se acreditar que uma cadeia ramificada
do tipo da Fig. 12-8 realmente está se processando, embora a observação minuciosa da
criança não revele movimento dos lábios, língua, olhos ou bôca. O valor de tal inferência,
naturalmente, encontra-se na sua capacidade de prever e explicar outros compor
tamentos.
Uma das teorias mais interessantes de J. B. Watson (1914-1920) foi a redução do
fenômeno conhecido como pensamento em termos de cadeias de comportamento
encoberto. Watson citou, em apoio a esta teoria, o fato de as crianças, se não punidas por
isto, frequentemente pensarem alto. De fato, uma história de aproximação sucessiva de
respostas cada vez mais silenciosas é necessária para fazer a criança “falar para si mesma” .
Além disso, quando os adultos solucionam problemas difíceis, seus lábios frequentemen
te se movem e se o problema é muito difícil, o indivíduo pode começar a falar aber
tamente. Watson supôs que a evidência para a linguagem encoberta, provavelmente,
poderia ser detetada por instrumentos sensíveis ligados aos músculos usados na
linguagem. Ele sugeriu que, ao se pensar em atividades tais como andar de bicicleta ou
dirigir um carro, ocorrem respostas de pequena escala nos músculos do corpo
normalmente usados nestas atividades.
A teoria de Watson tinha precedentes históricos. Platão havia observado que o
pensamento e a linguagem estavam intimamente ligados a vários autores do século XIX
chegaram quase a antecipar Watson. Mas ninguém antes de Watson atreveu-se a expor a
tese de que todo pensamento era resposta encoberta. Vista com um enfoque moderno, a
posição de Watson pode parecer mais ou menos extrema, dependendo dos preconceitos
filosóficos de cada um. Mas, cientificamente falando, a equação proposta entre pensa
mento e contrações musculares é desnecessária e, talvez, intestável. Todavia, a noção de
que as cadeias de comportamento podem tornar-se reduzidas em magnitude até que não
sejam mais observáveis a olho nu, permanece como uma proposição científica capaz de
- 267 -
gerar experimentos, identificando-se ou não algum ou nenhum “pensamento” com estas
cadeias. Neste sentido, a hipótese de Watson permanece como um desenvolvimento cria
tivo importante na h istória da ciência comportamental.
Infelizmente, pouca experimentação conclusiva resultou da hipótese de Watson. Em
sua própria época, aparelhos de registros sensíveis ainda não haviam sido aperfeiçoados ao
ponto necessário para se fazer as medidas exigidas. Dois experimentos, entretanto, feitos
em 1930, fornecem alguma evidência preliminar de que a resposta encoberta ocorre nos
músculos apropriados quando são dadas, aos sujeitos, instruções para “ pensar” .
Num experimento, colocou-se eletrodos em várias partes do corpo do sujeito (bíceps
direito e esquerdo) e o sujeito foi instruído a imaginar o movimento de um membro
(Jacobson, 1932). As respostas elétricas dos músculos foram registradas num quimógrafo
de movimento rápido (do tipo não cumulativo). Na Fig. 12-9, os registros obtidos do
(A) (A) “Imagine-se erguendo um peso de dez

libras com seu braço direito” .
(B) (B) “Imagine-se erguendo-o com o braço
esquerdo” .
<C>
(C) “ Imagine-se martelando um prego
♦ duas vezes, estando o martelo seguro
pela sua mão direita” .
Figura 12-9. Potenciais musculares registrados do bíceps direito depois de vários tipos
de instruções (segundo Jacobson, 1932).
bíceps direito estão justapostos com as várias instruções que os precedem. As instruções
claramente tiveram um efeito seletivo na atividade do músculo e, como mostra o registro
(B), o efeito foi localizado no braço direito somente quando a instrução se referia ao
braço direito. Durante o registro de (A), (B) e (C ), o experimentador não foi capaz de
detetar qualquer movimento real do braço, a olho nu.
Noutro experimento, os eletrodos foram colocados nos músculos da língua e sob os
lábios. Sob instruções de se “ imaginar” contando, ou lembrando poemas ou canções ou
multiplicando números, os potenciais musculares ocorriam na musculatura da fala do
sujeito. A forma da atividade elétrica, embora reduzida em amplitude, era muito parecida
com a atividade elétrica que ocorreu quando a instrução “imagine” foi substituída pela
instrução de “ fale em voz baixa” . .
Noutros experimentos independentes, os eletrodos foram colocados nos braços de
sujeitos surdomudos, cuja linguagem consiste de gestos com as mãos e dedos. Quando os
mudos eram instruídos a “pensarem” em palavras ou resolver problemas de multiplicação
de forma encoberta, geralmente apareciam potenciais musculares na região do antebraço.
Os potenciais musculares de sujeitos que podiam ouvir e falar foram usados como base
para a comparação. Sob instruções semelhantes, ou sujeitos normais não apresentaram
potenciais nas suas regiões do antebraço (Max, 1937).
Em conclusão, a teoria de Watosn fornece um certo conforto intelectual para o
cientista do comportamento: o pensamento tem um lugar no esquema de eventos com-
portamentais e pode, então, ser descartado como outros fantasmas “mentais” do
passado. Mas os experimentos não fluem imediatamente da posição de Watson, talvez um
pouco devido às dificuldades de se fazer registros musculares. Mesmo as melhores teorias,
frequentemente podem levar a uma complacência que, em vez de favorecer a
- 268 -
pesquisa, pode atravancá-ía. Existem numerosos problemas interessantes a respeito de
cadeias encobertas de resposta, como elas são adquiridas, siia superioridade em eficiência
em relação às cadeias manifestas correspondentes, questões sobre a sua manutenção,
e assim por diante. Mas, enquanto as respostas encobertas forem consideradas apenas
uma “explicação” para o “pensamento” , esses problemas pennanecerão enterrados.
Neste sentido, o trabalho de Hefferline e Keenan (1963), mencionado na seção 8.5 é
animador porque fornece o tipo de neutralidade teórica que promete esclarecer esses
problemas e reabrir a discussão sobre as respostas encobertas, tão audaciosamente intro
duzida por Watson há mais de meio século.

Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New York:
Appleton-Century-Crofts, 1957. Chapter 1 2 .
Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a
small-scale (covert) operant. J. exp. Anal. Behcv., 1963, 6 , 307
315.
Jacobson, E. The electrophysiology of mental activities. Amer. J.
Psychol., 1932, 44, 677-694.
Kelleher, R., and Gollub, L. A review of positive conditioned reinforce
ment. /. exp. Anal. Behav., 1962, 5, 543-597.
Lee, B. J. Effects of delayed speech feedback. J. acoust. Soc. Am er.,
1950, 22, 824-826.
M cCarthy, Dorothea. Language development. In L. Carmichael (E d .),
Manual of child psychology. New York: Wiley, 1954.
M ax, L. W. Experimental study of the motor theory of consciousness.
IV. Action-current responses in the deaf during awakening, kin-
aesthetic imagery and abstract thinking. J. comp. Psychol., 1936, 24,
301-344.
M ichael, J. Laboratory studies in operant behavior. New Y ork: McGraw-
Hill, 1963.
Pierrel, Rosemary, and Sherman, J. G. Train your pet the Barnabus way.
Brown Alum ni M onthly, Feb. 1963, pp. 8-14.
1938.
W atson, J. B. Behavior, an introduction to comparative psychology. New
York: Holt, 1914.
W atson, J. B. Is thinking merely the action of language mechanisms?
Brit. J. Psychol, 1920, 11, 87-104.
- 269-
QUARTA PARTE
CONTINGÊNCIAS COMPLEXAS
13. AQUISIÇÃO DE CONCEITO
14. SOLUÇÃO DE PROBLEMAS E INTELIGÊNCIA

Capítulo 13 AQUISIÇÃO DE CONCEITO
Os princípios elaborados nos capítulos precedentes permitem-nos descrever e classi

ficar uma grande parte do comportamento aprendido de organismos animais e humanos.
Mas se terminássemos nossa avaliação do comportamento com as operações aquisição
simples, discriminação, diferenciação, encadeamento, reforçamento secundário e generali
zação, seriamos, então, forçados a admitir que a parte principal do comportamento humano
complexo permaneceu intata. As atividades que podem ser classificadas como comporta
mentos humanos complexos são, naturalmente, muito diversas. Uma característica que
todos eles parecem compartilhar, todavia, é uma afiliação íntima com a linguagem. De
fato, uma implicação dos capítulos precedentes é de que a existência e o uso da lin
guagem talvez seja o único atributo comportamental do homem que o distingue dos seus
parentes inferiores. Embora possamos concordar que o comportamento inicial de lingua
gem seja adquirido através do processo de aproximação sucessiva e que as palavras tor
nam-se S^s, o “significado” da linguagem, contudo, parece estar além dos conceitos
derivados de animais no laboratório. O próprio termo “significado” apresenta numerosos
problemas de definição. Mas, os aspectos do comportamento humano a que se refere
constituem fenômenos bastante reais. Além disso, é claro que qualquer ciência do com
portamento que pretenda ser amplamente compreensível deve, eventualmente, dirigir-se
para a descrição desses fenômenos. Não podemos ignorar os comportamentos humanos
complexos simplesmente porque eles são pobremente especificados. Na verdade, a prin
cipal razão pela qual eles são tão pobremente especificados é que eles aguardam uma
descrição em termos de uma linguagem geral, compreensivae rigorosa. Assim, a descrição
destes comportamentos complexos em termos da estrutura conceituai de fenômenos
comportamentais simples resultaria, simultâneamente, na sua compreensão e esclareci
mento.
No presente capítulo, portanto, estendemos a análise comportamental para o campo
do comportamento humano complexo. Escolhemos como nosso ponto de partida a área
conhecida como formação de conceito. São tantas as atividades caracteristicamente
humanas que têm sido relacionadas a conceitos —pensamento, compreensão, significado
de palavras, raciocínio, solução de problema — que podemos estar certos de que, se se
pudermos estabelecer um contato experimental aqui, estaremos numa posição favorável
para nos dirigir a uma análise de muitas formas de comportamento humano complexo.
Iniciamos com uma consideração de um tipo de comportamento, desenvolvido no
- 273-
laboratório animal, que compartilha de certas propriedades importantes com o comporta
mento humano conceituai. Novamente, este comportamento de laboratório surge de uma
configuração de operações familiares de aquisição, extinção, discriminação e generali
zação. Devido a suas relações com comportamentos simples e complexos, ele parece
representar uma ligação importante entre as duas classes. A simplicidade relativa dos
fenômenos de laboratório ajudar-nos-á identificar o termo conceito com certas caracte
rísticas precisas de comportamento. Uma vez tenhamos compreendido esta palavra-chave,
alguns experimentos simples com sujeitos humanos, onde os aspectos especiais da lingua
gem não são utilizados, irão elaborar ainda mais a lógica geral do comportamento con
ceituai Finalmente, guiados pelos nossos paradigmas experimentais, poderemos explorar
brevemente os comportamentos humanos complexos associados com termos tais como
compreensão, significado, instrução, percepção e (no próximo capítulo) solução de pro
blemas.
13.1 DISPOSIÇÃO PARA APRENDER (SIMPLES)
No capítulo 10 (Discriminação), notamos que uma classe de discriminação compre

endia duas situações e duas respostas e descrevemos os aparelhos experimentais próprios
para o estabelecimento de tais contingências. Um desses aparelhos, o Wiscosin General
Test Apparatus, foi mostrado na Fig. 10-5. No WGTA, pode-se apresentar a um macaco
ou outro primata vários objetos numa bandeja móvel, sendo que debaixo de um desses
objetos encontra-se um recipiente contendo um amendoim. Suponha que sejam usados
dois objetos: uma cruz de madeira maciça e um objeto em forma de U, também de
madeira maciça. O amendoim é sempre encontrado debaixo da cruz, quer ela apareça à
direita ou à esquerda. As duas contingências possíveis podem ser diagramadas como 1
[13.1]
R E -* S + e Rd ^ s+
2
onde a contingência 1 representa a cruz à esquerda e a contingência 2 representa a cruz à

direita. Uma resposta “ incorreta” (isto é, R q em 1, o u Re em 2) leva à remoção da
bandeja. Depois de um pequeno intervalo, uma das contingências é novamente colocada
em efeito. Uma resposta “ correta” (isto é, Rg em 1, ou Rj) em 2) produz um amendoim
(S+). Após um pequeno intervalo, uma das contingências é novamente estabelecida.
Chamemos de uma tentativa uma única apresentação, pelo experimentador, de uma ou
outra das situações e contingências de fl3 :l|.C o m o que sabemos sobre discriminação,
podemos estar certos de que, dado um número de tais tentativas, ocorrerá um processo
comportamental. Durante as primeiras tentativas, o comportamento do animal não estará
sob o controle da cruz e, logo, Rs incorretas ocorrerão: R p em 1 e/ou Rg em 2.
Eventualmente, todavia, a medida que mais tentativas são realizadas, o comportamento
do animal, gradualmente, passa a ficar sob o controle da localização da cruz. Uma vez
que este processo é gradual, dezenas ou centenas de tentativas, dependendo da espécie e
de diferenças individuais, podem ser necessárias para se atingir um valor assintótico de
aproximadamente 100 por cento de respostas “ corretas” .
1 — no decorrer deste capítulo, Rg, Rç e Rq referir-se-ão a pegar o objeto à esquerda,
no centro e à direita.
- 274-
Até agora, descrevemos apenas um conjunto de contingências de discriminações de
2S— 2R. Denominemos um único conjunto de tais contingências (como em [13.1]),
um problema de discriminação. Suponha que, uma vez o processo de discriminação tenha
atingido sua assíntota, apresentemos uma nova série de congingências. Escolhemos o
novo problema de modo que ele difira das contingências anteriores apenas em relação aos
objetos usados como seus 2 Ss; por exemplo, uma esfera de madeira maciça e um cone de
madeira invertido. O problema, com exceção disso, é idêntico. Qual será a natureza deste
novo processo de discriminação? De fato, é muito semelhante ao primeirc processo. C
animal começa desempenhando pouco melhor do que se e s p e r a r^ pelo acaso. Mas, even
tualmente, ele passa a escolher o objeto correto (agora a esfera) todas as tentativas.
Uma inspeção mais detalhada destes dois processos pode revelar, todavia, um desloca
mento ligeiramente mais rápido em direção à assíntota, no segundo caso.
Esta comparação de dois processos sucessivos de discriminação sugere um interes
sante delineamento experimental geral. Evidentemente não estamos limitados a um.
dois, ou mesmo alguns de tais problemas de discriminação. Podemos continua» a apre
sentar novos problemas, um depois do outro, enquanto pudermos encontrar objetos
diferentes e nossa paciência aguentar. Felizmente para o último fator, descobrimos que, à
medida que apresentamos mais e mais problemas, os processos de discriminação
tornam-se apreciavelmente mais rápidos. Embora dezenas a centenas de tentativas possam
ter sido necessárias para se chegar ao desempenho assintóticonos problemas iniciais, talvez
menos de meia-dúzia de tentativas sejarn necessárias para um desempenho sem erro
quando 100 discriminações tiverem sido aprendidas. Eventualmente, depois de várias
centenas de problemas, descobrimos um resultado notável. O macaco, agora, é capaz de
solucionar qualquer problema deste tipo, imediatamente. Se, por acaso, ele escolhe c
objeto correto na primeira tentativa, ele continua, daí em diante, a escolher o objeto
correto. Sc, por acaso, escolhe o objeto errado na tentativa 1, ele inverte o padrão de
resposta imediatamente e escolhe o objeto correto da tentativa 2 em diante. Em ambos
os casos, o desempenho do macaco é quase sempre perfeito a partir da tentativa 2. De
fato, a apresentação de uma longa série problemas semelhantes erradicou o processo
gradual de discriminação. Ficamos com um animal que soluciona novas discrimi íações
imediatamente. .
O exemplo precedente ilustra o desenvolvimento de uma disposição para aprender
(leaming-set ou L-setj, um paradigma geral estudado extensivamente e assim denominado
por H. F. Harlow. A Fig. 13-1 mostra mais precisamente os resultados obtidos do proce
dimento de disposição para aprender em macacos rhesus. Cada curva da Fig. 13-1 é a
média de um número de processos de discriminação. Os processos são apresentados
apenas nas tentativas de 1-6. A chave logo abaixo do gráfico diz exatamente que dis
criminações são representadas por cada curva. A Fig. 13-1, então mostra com detalhes as
mudanças médias na forma dos processos de sicriminação sucessivas. O processo de
discriminação de 1-8 é gradual e em forma de / e é claro que a sua assíntota se encontra
além da sexta tentativa de aqirsição. O processo médio para os problemasde 9-16 é menos
gradual; a curva é mais inclinada e atingirá sua assíntota mais rapidamente. Os processos
subsequentes são ainda mais inclinados, até o problema 232, depois do que não há um
“processo” propriamente dito. Há somente o resultado: na tentativa 2 o macaco quase
sempre acerta. 1
- 275 -
4 5 6
Tentativas
Discriminações
H i m ii |-8 ------------- 33-132
9-16 ------------- 133 -232
17- 24 *♦+++++•►+ 23 3 -2 8 8
25-32 ------------- 2 8 9 -3 4 4
I igura 13.1. Mudanças cm blocos sucessivos de processos de discriminação de 2S 2 R.

As curvas são os resultados médios de oito macacos, mas podemos supor que sejam
representativas de um único sujeito (segundo Harlw, 1949).
É este resultado comportamental de se apresentar sucessivamente contingências de

discriminação semelhantes — uma habilidade adquirida para solucionar qualquer um de
uma classe de problemas de discriminação semelhantes com eficiência máxima — que
usualmente é descrito como uma (L-set). A natureza adquirida de tal habilidade sugere
que ela pode ter um processo característico próprio. E, realmente, a curva que descreve o
desenvolvimento do I^set pode ser derivada da Fig. 13-1, se usarmos o desempenho na
tentativa 2 como um índice do seu desenvolvimento. A eficiência máxima para solucionar
este tipo de discriminação seria indicada pelo desempenho sem erro na tentativa. 2. Deve
ficar claro que o desempenho na tentativa 1 não pode ser acima de 50 por cento correto.
De imediato, o macaco não tem uma base para discriminar qual dos dois novos objetos é
o correto e, assim, ele apanhará o objeto correto ao acaso. A Fig. 13-2 mostra o nível de
desempenho na tentativa 2 em função do número de problemas previamente apresen
tados. A figura é então, uma descrição conveniente do processo de aquisição do L-set.
Um aspecto importante do processo visto na Fig. 13-2 é o seu caráter gradual e contínuo.
Assim, a habilidade para solucionar um problema de discriminação numa tentativa é
adquirida através de um processo gradual.
- 276 -
N úmero médio de discriminações anteriores.
1'igura 13-2. Um processo de disposição para aprender (L-set), derivado dos dados
da Fig 13-1., baseado no desempenho da tentativa 2.
Ao contrastar o processo de discriminação da Fig. 13-1 e o processo de L-set da Fi<:

13-2, note que na discriminação, a variável independente: o tempo em relação à qual o
comportamento muda com a exposição prolongada a um procedimento constante é
chamada de tentativa. No processo de L^set, por outro lado, a variável independente:
tempo em relação à qual o comportamento muda é chamada de problemas. Note também
que o resultado de cada processo individual da Fig. 13-1 é chamado uma discriminação;
mas o resultado do processo da Fig. 13-2 é um I^set — a habilidade de solucionar um tipo
de discriminação imediatamente.
Não devemos supor que a disposição para aprender seja restrita ao tipo particular de
discriminação descrito em nossos exemplos. Nas discriminações das Figs. 13-1 e 13-2, o
comportamento é gradualmente colocado sob o controle de um entre dois objetos — o
objeto que cobre o amendoim reforçador na tentativa 1. Mas a noção geral de um L-set
consiste de uma habilidade adquirida para solucionar discriminações de uma determinada
classe ao primeiro contato. Assim, o colocar o comportamento sob o controle do maior
entre dois objetos, o objeto verde ou o de forma triangular entre dois objetos, constitui
outros Insets de 2S —2R simples que podem ser convenientemente estabelecidos por um
procedimento semelhante a este descrito. Em geral, podemos supor que o procedimento
de l^set é aplicável sempre que fôr possível se estabelecer um conjunto de problemas de
discriminação relacionados. Apôs o animal ter sido exposto a um subconjunto desses
problemas, ele pode adquirir a habilidade para solucionar todos eles.
Se tentarmos formular o paradigma da (L-set), descobriremos que ele possui um
PROCEDIMENTO •Uma série de discriminações relacionadas é apresentada no

organismo;
PROCESSO : Os processos individuais de discriminação gradualmente
mudam sua forma de lenta e gradual para rápida e abrupta;
RESULTADO : Discriminações novas, mas relacionadas, são resolvidas com
o máximo de eficiência.
- 277 -
O termo Uset é normalmente empregado com referência ao resultado deste paradig
ma.
13.2 ALGUMAS VARIÁVEIS QUE INTERFEREM NA AQUISIÇÃO DA DISPOSIÇÃO

PARA APRENDER (L-SET)
Harlow (1959) fez um resumo das pesquisas sobre a formação do L-set nas quais
usou várias espécies de organismos, incluindo crianças. As crianças testadas nesses proce
dimentos tipicamente superam chimpanzés e macacos no desempenho geral mas elas
também apresentam um processo contínuo de aquisição do L-set. Os primatas inferiores
na escala filogenética ao macaco rhesus — micos e saguis, por exemplo — mostram um
processo de aquisição de Uset mais gradual que o descrito na Fig. 13-2. Mesmo depois de
1000 ou mais problemas, a assíntota de seus processos de L-set é significativamente mais
baixa que o desempenho perfeito. Outros animais, como ratos e gatos, mostram um
aumento da inclinação nos processos sucessivos de discriminação, mas nunca alcançam
resultados sofisticados no Lset dentro dos limites dos experimentos que têm sido
executados. Todavia, recomendamos cautela ao se concluir que L-sets verdadeiros são
uma habilidade privilegiada dos primatas, em vista das dificuldades metodológicas em se
estabelecer ordena omparáveis de “ problemas” de discriminação para animais i n f e r i o r e s
O num ero de tentativas destinado para cada problema afeta nitidamente
a aquisição do L—set Uma vez que os processos iniciais de discriminação são os
mais graduais, um grande número de tentativas é necessário nos primeiros problemas para
que o comportamento atinja um determinado critério, digamos um desempenho 70 por
cento correto. À medida que são dados mais problemas, o processo de discriminação
acelera-se e menos tentativas são necessárias para se chegar àquele mesmo critério. Esta
diferença foi considerada ao se obter as curvas da Fig. 13-1. Para os primeiros problemas
realizaram-se 50 tentativas e para os últimos apenas 6 ou 9 tentativas.E interessante notar,
todavia, que mesmo quando poucas tentativas, por exemplo, 6 , são realizadas para todos
os problemas, o L-set ainda emerge. Desta maneira, mais problemas, naturalmente, são
necessários para compensar o número menor de tentativas por problema. A combinação
ideal tentativa-problema tem que ser ainda elaborada.
A taxa de L-set é uma função da dificuldade dos problemas sucessivos de
discriminação. Harlow manteve todos os problemas na mesma série uniformemente di
fíceis. Uma progressão gradual de discriminação fácil para difícil pode produzir o L-set
mais eficientemente.
13.3 L-SETS MAIS COMPLEXOS
Evitamos usar o termo “ conceito” nas discussões precedentes sobre L-set mas parece
natural perguntar se podemos dizer, em relação a um organismo, que possui um L-set
para o maior de dois objetos, ou para o verde entre dois objetos, que ele possui o
conceito “ o maior de dois” ou “ o verde de dois” . Tais especulações estariam em boa
companhia, porque o próprio Professor Harlow levantou a hipótese de que “ todos m
conceitos tais como triangularidade, vermelhidão, número, e lisura surgem somente da
formação de L-set (Harlow, 1959, p. 5 10).
- 278
Adiando, por enquanto, uma definição rigorosa do termo conceito, apenas sugerimos que
o “ conceito” adquirido nas Figs. 13-1 e 13-2 é “o objeto entre dois debaixo do qual
havia um amendoim na tentativa anterior” . Sua descrição verbal é maior que a dos
conceitos mencionados por Harlow. Falta uma palavra única que o identifique, talvez
porque as contingências que compreendem este conceito são raras 110 mundo fora dos
laboratórios de comportamento dos macacos. Um exemplo de um L-set mais complexo
será útil para esclarecer a relação estreita entre L-set e conceitos.
Uma classe importante de L-sets consiste de discriminações de “singularidade” . Nes
sas discriminações, um grupo de objetos é apresentado. O reforçamento é contingente à
escolha de um único objeto que difira, de algum modo, dos outros objetos do grupo. Tal
discriminação pode consistir das contingências vistas na Tabela 13-1. Estas contingências
contêm dois tipos de objetos, seis situações e três respostas.
Tabela 13-1
UM GRUPO DE CONTINGÊNCIAS DE SINGULARIDADE
SITUAÇÕES RESPOSTA REFORÇADA
S, O A A
s2 Re
A O O
S3 A O A
s< Rc
O A O
Ss A A O
Rd
Sr O O A
Uma vez o sujeito primata tenha adquirido a discriminação a um certo nível do critério,
um novo problema é apresentado. Dois novos tipos de objetos são usados no novo
problema, mas as contingências permanecem de tal modo que a posição do objeto singu
lar entre os três é novamente correlacionada com o reforçamento. Depois de uma série de
vários destes problemas, o macaco adquire uma disposição para aprender que poderia ser
chamada de “escolha o objeto singular entre três”. O sujeito bem treinado na ilustração
da Parte Quatro, p. 271 está demonstrando o comportamento típico desta L-set. O
desempenho sofisticado do macaco rhesus é alcançado somente depois da apresentação
de muitos problemas semelhantes. Estes resultados indicam o grau de sucesso dos proce
dimentos de L-set ao colocar o comportamento operante de animais sob o controle de
relações bem sutis existentes nas situações.
Tal controle comportamental em sujeitos humanos é frequentemente abase sobre a
qual empregamos a palavra “conceito” . Por exemplo, concordamos que uma criança tem
o conceito de propriedade quando ela pode discriminar suas próprias possessões daquelas
de qualquer outra pessoa. Dizemos que uma criança tem o conceito de uma frase substan
tiva quando ela pode escolher frases substantivas entre sentenças não familiares. Similar
mente, creditamos-lhe o conceito de igualdade de número quando ela pode identificar
quantidades iguais em conjuntos não familiares, por exemplo, quando ela pode equiparar
o número de contas numa jarra com o número de maçãs em cima de uma mesa. Todavia
estas ilustrações são apenas sugestivas. Logicamente, precisamos de uma definição mais
- 279 -
rigorosa de “ conceito” se desejamos examinar em detalhes a relação entre L-sets e concei
tos. Será conveniente, portanto, voltarmos a alguns dos primeiros experimentos sobre
formação de conceitos com sujeitos humanos. É aqui que encontramos uma tentativa
explícita para traduzir a formação de conceitos, em sujeitos humanos, em termos com-
portamentais, com a questão sistemática. “ O que uma pessoa faz quando se diz que ela
revela um conceito” ? Quando esta questão puder ter uma resposta satisfatória, estare
mos em condições de determinar os procedimenos pelos quais estes comportamentos
conceituais são adquiridos.
13.4 EXPERIMENTOS SIMPLES SOBRE A FORMAÇÃO DE CONCEITO EM

SUJEITOS HUMANOS
C.L. Hull (1920) tomou como seu ponto de partida o estudo da formação de concei
to a história através da qual uma criança adquire o conceito de “ cachorro” .
Uma criancinha encontra-se numa certa situação, reage a ela aproximando-se e ouve
dizer que isto se chama “cachorro”. Depois de um período indeterminado de intér-
venção, ela encontra-se numa situação algo diferente e ouve dizer que aquilo se
chama “cachorro” . Mais tarde, encontra-se numa situação ainda algo diferente e ouve
dizer aquilo também se chama “cachorro” . Assim o processo continua. As experiên
cias de “cachorro” aparecem em intervalos irregulares (Hull, 1920, p. 5).
Como um resultado dessas “experiências” , surge um momento em que se diz que a

criança possui o conceito de cachorro. A interpretação dada por Hull a este conceito foi
uma “característica mais ou menos comum a todos os cachorros e incomum a gatos,
bonecas e ursinhos” (Hull, 1920, p. 6 ).
Se um conceito consiste de uma característica comum a um grupo diverso de situa
ções, deve ser possível estabelecer condições de laboratório para estudar como o compor
tamento passa a ficar sob o controle das características comuns de um grupo de situa
ções. Como elementos para seus conceitos experimentais, Hull escolheu os 144 caracteres
chineses vistos na Fig. 13-3. A nao familiaridade destes caracteres para seus sujeitos,
universitários americanos, assegurou que nenhum dos conceitos experimentais havia sido
previamente adquirido. De modo a produzir grupos de situações contendo uma carac
terística comum, selecionaram-se grupos de caracteres contendo certos elementos comuns.
Note, por exemplo, que na Fig. 13-3 todos os caracteres na fileira 1 contêm em suas
estruturas, de um modo geral diferentes, o traço comum em forma de escova.
Em geral, cada caráter numa determinada fileira horizontal está relacionado a todos os
outros nessa mesma fileira por possuir algum elemento comum. No experimento, os
caracteres foram combinados em grupos (colunas verticais da Fig. 13-3) de modo que
cada grupo continha um e somente um dos caracteres com um elemento comum parti
cular. Mostrava-se, então, aos sujeitos, os caracteres do grupo 1, um de cada vez e
pedia-se-lhes que dessem a resposta de identificação verbal de acordo com o que se vê na
coluna esquerda da Fig. 13-3. O nome correto era pronunciado pelo experimentador
poucos segundos depois da apresentação de cada caráter. A tarefa do sujeito era nomear
o caráter antes que o experimentador o fizesse. A primeira tentativa, naturalmente, era
diferente, pois permitia que o sujeito tomasse conhecimento do grupo de identificadores
verbais. Quando o critério de duas tentativas perfeitas era alcançado, isto é, quando o
sujeito nomeava corretamente todos os caracteres do grupo 1 duas vezes numa fileira, os
- 280 -
Elemento comum
Identificador Grupo 72 caracteres

verbal 1 2 3 4 5 6 teste
oo r # HÊ s (*& & & ã
yer £ & & & & & & M & & M & .X
f i fa to M
« á í# £
deg -ET
Img i A :
mm&wQíer
£ £ fe ^ ríL £ .3 ? :
chun
Mrn fáíR&fè
vo
na
M & &J£ % M M « ;m a
X \$ * & % £& Z t t â f i i í H
m u m m w k *
Figura 13-3. Os 144 caracteres chineses usados por Hull para estudar a aquisição de
conceito. São mostrados para cada série a resposta de identificação verbal e o elemento
comum (Hull, 1920).
caracteres do grupo 2 eram apresentados até que todos fossem identificados, então os do
grupo 3 e assim sucessivamente, até o grupo 6 .
Uma vez que o sujeito tivesse aprendido a identificar estes 72 caracteres chineses (6
grupos x 12 caracteres por grupo), o experimentador fazia um teste de generalização. Ele
apresentava os restantes 72 caracteres, mas não mais pronunciava o identificador. Seria o
sujeito capaz de identificá-los, mesmo çiunca os tendo visto antes? Hull descobriu que os
sujeitos identificaram corretamente mais de 70 por cento destes novos caracteres. De
fato, os sujeitos frequentemente faziam identificações corretas, embora fossem incapazes
de verbalizar a regra para a inclusão numa classe particular.
No experimento de Hull, cada membro de uma dada classe de S tinha um certo traço
em comum. Smoke (1932) salientou que os conceitos no mundo real raramente, se
alguma vez, consistem de uma classe de situações com elementos comuns explícitos. A
formação de conceito, geralmente, envolveria uma resposta sob o controle de relações
comuns a um grupo de padrões de estímulo. Considere, por exemplo, as figuras da Fig.
13-4 geradas por uma relação bastante artificial sugerida por Smoke. Todas as figuras à
esquerda da Fig. 13-4 são membros da classe de S^ denominada “ dax” , enquanto que
nenhuma das figuras à direita da Fig. 134 é “dax”. A regra para “dax” é um círculo e
dois pontos: um ponto dentro do círculo e outro fora. Smoke descobriu que sujeitos
humanos adquiriam rapidamente o comportamento generalizado de categorizar outros
padrões como “dax” , mesmo quando seu único “treino discriminativo” anterior consis
tisse da apresentação de algumas figuras “dax” e não “dax” apropriadamente indicadas e
com instruções para se observar as diferenças. Embora fossem frequentemente incapazes
-28 1 -
Figura 13-4. Amostras de S ^ s e S s “ dax” (de Kimble e Garmezy,
segundo Smoke, 1932).
de verbalizar a regra para a inclusão na classe, os sujeitos, mesmo assim, podiam identi
ficar corretamente novas figuras “ dax” que não tinham visto antes.
Nos experimentos de Hull e de Smoke, diz-se que os sujeitos adquirem certos con
ceitos. Podemos agora perguntar de que modo estes experimentos demonstram a aprendi
zagem de conceito:
1. Tanto no experimento de Hull como no de Smoke, os sujeitos adquiriram a
habilidade de dar um rótulo verbal comum para qualquer membro de uma classe de
situações.
2 . O comportamento adquirido generaliza-se para novas situações às quais o sujeito
não havia sido exposto antes.
3. A classe de situações é determinada por alguma relação comum — um traço ou
uma regra geométrica complicada.
Partindo desses dados, somos levados a duas conclusões sobre o comportamento de
conceito. Primeiro, diz-se que um organismo revela um conceito quando ele pode identi
ficar qualquer membro de um conjunto de situações relacionadas. Segundo, o organismo
adquire esta habilidade através de uma história explicita de reforçamento (ou instruções
fundamentadas numa história de reforçamento prévio) na presença de um subconjunto
das situações.
E stam o s agora em condições de ver a relação do paradigma do L—set
c o m a f o r m a ç ã o de c o n c e i t o . O p r o c e d i m e n t o de L —s e t é
simplesmente uma maneira sistemática de ordenar a história de reforçamento que conduz
ao comportamento de conceito. Embora os macacos não falem, o comportamento que
eles ad qu irem com os p ro c e d im e n to s de L—set parece precisamente
análogo ao que os sujeitos humanos fazem, em experimentos sobre formação de con
ceito, usando respostas verbais. O macaco escolhe o objeto singular de um grupo de
objetos que ele pode nunca tervistG anteriormente. O homem escolhe o “dax” entre um
grupo de padrões que ele pode nunca ter visto anteriormente. Na vida real, parece que
raramente adquirimos nossos conceitos atravéz da progressão ordenada de um problema
relacionado para outro, a seqüência característica das disposições para aprender. A
criança na escola, em casa e no parque adquire seus conceitos concorrentemente e muito
mais casualmente do que em quaisquer arranjos de procedimento no laboratório.
Todavia, quando ela pode identificar um novo cachorro como um cachorro, ou uma nova
situação social como aquela que requer “boas manpiras” , ela está se empenhando em
comportamentos do tipo produzido pelos vários procedimentos que descrevemos.
- 282-
Note que o termo conceito, como descrito, não se refere a uma coisa. Como discrimi
nação, condicionamento e extinção, o termo refere-se a certos fatos comportamentais e
certas relações entre comportamento e ambiente. A palavra “conceito” denota o fato
comportamental de que uma determinada resposta* está sob o controle de uma classe
relacionada de SDs. Um corolário interessante dessa definição é que ela não separa um
conceito de uma discriminúyão. Podemos lembrar qiie uma discriminação (Resultado) é
um nome para o fato comportamental de que um passa a controlar uma resposta
operante. Mas sabemos que a generalização toma impossível descobrir um caso perfeito
de discriminação onde apenas um controla a resposta. 0 treino discriminativo prolon
gado pode limitar a classe de eventos ambientais qüe estabelecem a ocasião gara a resposta,
mas a classe permanece uma classe. Se tivéssemos sido treinados para dizer “amarelo”
na presença de um certo comprimento de onda da luz a probabilidade da resposta
“ amarelo”permaneceria alta quando pequenas mudanças fossem feitas no comprimento de
onda. Tais resultadçs, que indicam a persistência da generalização mesmo após um longo
treino discriminativo, expressam as limitações na capacidade do organismo de fazer dis
criminações infinitamente refinadas.
Se um conceito também se refere a uma classe de S^s que controlam a emissão de

uma resposta, em que ele difere de uma discriminação? Evidentemente, a diferença é
apenas de grair nos seus limites, a distinção é vaga e arbitrária. Logo, é plausível se falar
ou do concr.tc de amarelo ou da discriminação de amarelo. O emprego da palavra nurti
caso particular será determinado meramente pela extensão da classe de S ^ s controla
dores. Se a classe de S^s parecer relativamente pequena, chamamos o comportamento
uma discriminação; se parecer relativamente ampla é mais provável chamarmos o compor
tamento de um conceito.
Embora a noção de extensão per se seja muito imprecisa para permitir uma distinção
rigorosa entre conceitos e discriminações com base nos comportamentos observados, ela
sugere que a distinção entre os dois pode ser feita em termos de procedimento. Suponha
que estivéssemos interessados em treinar um organismo a fazer discriminações cada vez
mais refinadas entre um determinado triângulo (S^) e todos os outros triângulos. Nosso
procedimento consistiria em apresentar triângulos gradualmente mais semelhantes ao
triângulo S^, sem liberar o reforçamento na sua presença. Com efeito, melhoramos a
discriminação ampliando a classe de s experimentados. Na formação do conceito de
triangularidade, por outio lado, apresentaríamos e reforçaríamos respostas a triângulos
semelhantes ao triângulo original, aumentando, assim, a classe de SD. Isto é justamente o
que Hull fez oara “ oo” , Smoke fez para “dax” e Harlov» fez para a singularidade. Todas
essas variantes de procedimento servem gradualmente para estabelecer a agregação de S^s
que controlam uma determinada resposta, seja o comportamento dc dizer “ oo” , de dizei
“ dax” ou de selecionar o objeto singular. Os procedimentos para formação de conceitos c
discriminações iniciam-se similarmente, com reforçamento na presença de um único S^,
mas eles divergem daí em diante para alcançar seus efeito diferentes. O treino discrimi
nativo limita a classe de S^s controladores, enquanto a formação de conceito amplia a
classe de S^s controladores. A frase de Keller e Schoenfeld (1950) “discriminação inter
classes e generalização intra-classes” é adequada para resumir a característica comporta
mental de um conceito e nos lembra os processos que participaram na sua evolução.
13.3 ESTUDOS SOBRE FORMAÇÃO DE CONCEITO EM AN1MAÍS
De acordo com a análise apresentada até aqui, um conceito representa o controle
adquirido de um conjunto de situações relacionadas (Ss) sobre uma determinada res
posta. Na seção precedente, sugerimos que o método geral para estabelecer este controle
era o uso anterior de um subconjunto de Ss como SDs num paradigma de discriminação.
Esta descrição está de acordo com os procedimentos de treinamento específico de
Harlow e Hull que apresentaram uma série de contingências de discriminação relacio
nadas. A descrição também está de acordo com o procedimento de Smoke, na medida em
que supusermos que suas instruções permitiram que seus sujeitos se administrassem um
treino discriminativo com os padrões de S^ e S A das figuras geométricas que lhes foram
apresentadas. Esses três experimentos representam apenas uma pequena amostra dos
procedimentos de treinamento que satisfazem a definição de um procedimento de
aquisição de conceito. Existem várias maneiras de se arranjar uma história de discriminação
com um subconjunto dos membros de uma classe ampla de Su s relacionados. Na pre
sente seção, consideraremos alguns desses procedimentos adicionais, chamando a aten
ção, ao mesmo tempo, para a variedade de conceitos que têm sido estabelecidos ao nível
infra-humano.
Kelleher (1958) reforçou pressões à chave telegráfica em chimpanzés famintos (num
esquema probabilístico p= 0,01 de reforçamento alimentar) apenas quando certos
padrões visuais estavam presentes num arranjo de 3 x 3 de pequenas janelas de plexiglass
acima da chave. Outros padrões foram associados com contingências de extinção para a
pressão à chave. No treinamento do conceito, 13 padrões de SD e 13 padrões de
foram apresentados numa seqüência aleatória. A Fig. 13-5a apresenta uma amostra de
três dos padrões de SD e três dos padrões de S & . Os registros cumulativos de resposta
abaixo desses padrões mostram um desempenho típico alcançado após um treinamento
extensivo neste procedimento. As três amostras dos padrões de mostram que a classe
de Su foi limitada pela regra “três janelas inferiores iluminadas” . O comportamento da
dois problemas de conceito. Os quadrados escuros correspondem a janelas iluminadas

Os traçõs obliquos representam mudanças de um estímulo para outro. Os padrões e as
respostas cm S^são indicadas por (+ );o s padrões e respostas em S ^ são indicados por
( ) ( Kellenher, 1958).
- 284 -
Fig. 13-5a representa uma discriminação estável já avançada, com as respostas limitadas
principalmente às ocasiões, em que os padrões de estavam presentes. Em (b), foi feito
um teste para o comportamento de conceito, utilizando-se 6 padrões de não fami
liares e 6 novos padrões de S ^ na seqüência de estímulo, sem alterar as contingências de
reforçamento. Três de cada um dos novos padrões são vistos na Fig. 13-5b. Como os
registros cumulativos na Fig. 13-5b mostram, o comportamento não foi perturbado,
indicando que a formação de conceito foi obtida. O comportamento estabelecido poi
uma história de discriminação anterior com um subconjunto de estímulos foi generali
zado para novos membros da classe de
Como no exemplo de Hull com os caracteres chineses, esses padrões de da Fig.
13-5a e b têm elementos comuns — iluminação das trcs janelas inferiores. Um resultado
um pouco diferente foi obtido quando o experimentador tentou desenvolver um con
ceito baseado no número de janelas iluminadas. Os padrões de estímulo na seção superior
da Fig. 13-5c, ilustram as contingências de treinamento do segundo conceito. Aqui, a
classe de é limitada pela regra “ iluminação de três janelas” . Por outro lado, os padrões
de S^' contem duas ou quatro janelas iluminadas. Os registros cumulativos da Fig. 13.5c
indicam a excelente discriminação alcançada no treino, usando-se a seqüência de 13
padrões de SD e 13 padrões de . Todavia, quando 6 novos padrões de e S A foram
introduzidos (Fig. 13-5d), o desempenho deteriorou-se nitidamente. Um número substan
cial de respostas ocorreu na presença dos novos padrões de SA , enquanto se observou
uma diminuição no número de respostas na presença dos novos padrões de S^. O teste
crítico para o comportamento de conceito falhou porque não se demonstrou que o
responder do animal estava sob o controle geral da classe de “ três janelas acesas” .
Este resultado negativo serve para enfatizar o critério para a existência do comporta
mento de conceito. Depois de se estabelecer o controle discriminativo de uma R com um
subconjunto dos membros de uma classe de S, procuramos ver se o controle discrimi
nativo se generalizou de modo a incorporar os membros restantes da classe de S. Os
exemplos descritos nas seções anteriores preencheram o teste requerido; daí, sua
designação como comportamento de conceito. Isto não aconteceu com o segundo proble
ma de conceito de Kelleher (Fig. 13-5d). Daí, concluímos que o segundo problema
resultou apenas numa discriminação, não num conceito. Todavia, há 9!/3!/6! ~ 84
padrões de possíveis de acordo com a regra três-janelas-acesas, e é possível que o
treino com um subconjunto com mais de 13 padrões de fosse bem sucedido no
estabelecimento do conceito (Ferster, 1964).
É conveniente comparar o procedimento do experimento de Kelleher com o para
digm a de L—set p o rq u e am bos p re te n d em ser paradigmas de conceito.
No procedimento de disposição para aprender, o subconjunto de cada c SA s é
arranjado em termos de “ problemas" cada um dos quais contendo algumas contingências
repetidas. Um novo problema geralmente não é apresentado ate que o anterior tenha sido
adquirido de acordo com o critério. No procedimento de Kelleher, todo o subconjunto
de cada e é apresentado num único “problema” . Mas seria fácil re-delinear o
ex p e rim e n to de Kelleher, moldando-o na forma de L-sets, através do
uso de uma série de problemas de discriminação de 2S ---- > IR. Para o conceito 1 ,
podemos apresentar p r im e ir o
■□ ■ ■□ ■
Problema 1: □□□ versus □□□
■■■ ■□ ■
- 285-
até que o índice de discriminação tenha atingido algum valor arbitrariamente alto. Então
apresentaríamos
□n □ ■■■
Problema 2: $ d
□□□ versus S2A ■■■
■■■ □□□
e assim sucessivamente. Nosso teste da aquisição do conceito é feito, automaticamente,
com o início de cada problema porque neste momento o organismo se defronta com S^s
e SA s nunca visto antes.
Poucos experimentos sistemáticos têm sido realizados para testar qual a combinação
de todos os possíveis procedimentos treina mais eficientemente o comportamento de
conceito. O paradigma da disposição para aprender tem a virtude de proporcionar um;i
curva da aquisição de conceito (ver Fig. 13-2) que é uma estimativa do grau dt*
obtenção do conceito em qualquer momento durante o experimento. Mas deve ficar
claro que, na vida real, aprendemos nossos conceitos de maneira similar à dos chimpanzés
de Kelleher para quem várias combinações de S^s e S ^ s apareceram em ordem aleatória.
O fato de os chimpanzés não terem adquirido o conceito de tres-janelas-acesas sugere
que o tamanho do subconjunto dos membros de usados no treino é uma variável
imporatnte na aprendizagem de conceito. Isto parece estar bem documentado. Andrew e
Harlow (1948)treinaram macacos a discriminar um único triângulo de um círculo. Os
macacos foram subsequentemente testados em várias situações diferentes que incluíam
mudanças na orientação do triângulo original, assim como novos triângulos de tamanhos
e ângulos diferentes. Os macacos apresentaram pouca indicação de terem formado o
conceito “ triângulo” com a sua história com um único membro da classe de triângulos.
No estudo de Hull com os caracteres chineses, um grupo de sujeitos aprendeu a identifi
car apenas três grupos de caracteres, ao invés dos seis usuais. Para contrabalançar sua
exposição a um número menor de grupos, os sujeitos tiveram duas vezes mais tentativas
nestes três grupos. Apesar disso, os sujeitos dos três grupos mostraram um desempenho
muito pior ao identificar os caracteres que nunca tinham visto. Dentro de limites, parece
que a formação de conceito depende diretamente do número ou variedade de S^s
empregados no treino.
A técnica experimental conhecida por escolha de acordo com o modelo proporciona
um conjunto de contingências de discriminação bem apropriado para o estudo do com
portamento de conceito em animais, o comportamento de escolha de acordo com o
modelo é estudado convenientemente em pombos, usando um aparelho contendo três
discos para bicar, cada um dos quais pode ser transiluminado por cores ou padrões.Para
o estudo de escolha de matiz, a seqüência de eventos está descrita esquematicamente pela
Fig. 13-6. Durante o treino preliminar, as duas chaves laterais são ocasionalmente ilumi
nadas com luzes de cores diferentes. O bicar uma ou outra chave é, então, reforçado.
Quando o bicar está seguramente sob o controle das chaves laterais iluminadas, a cadeia
de comportamento pode ser ampliada. As chaves laterais são apagadas e apenas a chave
central fica iluminada com uma luz colorida (Fig. 13-6, parte superior). Quando a chave
central iluminada é bicada, ambas as chaves laterais são iluminadas e a chave do centro é
apagada. Uma das chaves laterais — algumas vezes a esquerda, outras vezes à direita —
apresentará o mesmo matiz que a chave do centro apresentou no momento anterior (Fig.
-2 8 6 -
O i O
r- t
P adrão na chave
c e n tra l a té q u e o
anim al o ligue
0
E sco lha à / E scolha à

d ire ita e s q u erd a
o o o
Reforçamento se a escolha for correta. Ca

so contário, um breve “time-out” de todas
as contingências.
Figura 13-6. A seqüência de eventos na escolha de acordo com o modelo. A

iluminação está indicada pelas chaves pontilhadas ou com linhas transversais.
13-6, centro). O bicar a chave lateral que tem o mesmo matiz é reforçado. Uma escolha
incorreta, todavia, é seguida pelo apagar de todas as luzes e “time out” de todas as
contingências por alguns segundos. Após o reforçamento ou o “ time-out” , a luz central
acende-se novamente e uma nova tentativa inicia-se. Experimentos com dois ou três
matb.es indicam que o pombo pode ser treinado a escolher matizes de acordo com o
padrão com uma precisão acima de 90 por cento (Comming e Berryman, 1961). Nenhum
experimento tentou ainda estabelecer um conceito geral de “escolha” usando muitos
matizes e muitos padrões. Para estabelecer o conceito geral de escolha, o comportamento
de bicar a chave lateral teria que ser colocado sob o controle de qualquer padrão apresen
tado imediatamente antes na chave central. Quando tais escolhas são feitas com padrões
nunca vistos no treino, podemos dizer que o comportamento revela um conceito geral de
escolha.
A escolha é apenas um de um número de conceitos relacionados sutis que podem ser
estudados experimentalmente através desta técnica de três chaves. Nas contingências
indicadas pela Fig. 13-7, requer-se um conceito algo mais complicado. O animal deve
bicar a figura que está girada de 90(- no sentido anti-horário, em relação à figura padrão.
O estabelecimento destes conceitos em animais, no laboratório, está ainda no estágio
preliminar. Há razão para se esperar que sua produção aguarde combinações adequadas
dos procedimentos familiares dc aquisição, discriminação e aproximação sucessiva e não
quaisquer novos princípios de comportamento.
- 287-
p -.l ^
OIO ' ' ^ " " ^ p --1
+© d © © n © h
Figura 13-7. Estímulos para o estabelecimento do conceito relacionai de ro

tação de 90^ em sentido anti- horário. O + indica a chave onde a bicada será
reforçada (Goldiamond, 1966)
Que tais conceitos não estão, provavelmente, além do alcance do pombo é sugerido por
uma demonstração interessante feita por Herrnstein e Lovland (1964). Estes pesquisa
dores treinaram pombos a bicar uma chave plástica por alimento apenas quando uma
placa translúcida próxima à chave estava iluminada. Os pombos adquiriram rapidamente
a discriminação de bicar quando a placa estava acesa e não bicar quando estava apagada. No
procedimento final, a placa foi iluminada com projeções de slides coloridos de 35 mm
contendo fotografias de ambientes naturais, incluindo campo, cidades, rios, árvores e
campinas. Cada slide era apresentado por cerca de um minuto. Em metade dos slides,
havia pessoas em várias posturas e posições e essas projeções eram as ocasiões para o
reforçamento intermitente do bicar a chave. Os outros slides não continham pessoas e
eram SA s para o bicar a chave. Centenas de slides diferentes foram apresentados durante
vários meses de treino com essas contingências. Eventualmente, os animais passaram a
iimitar suas bicadas às ocasiões em que os slides com pessoas eram projetados. Quando
um novo grupo de slides foi apresentado, os animais continuaram a bicar predominan
temente quando havia pessoas presentes, embora nunca tivessem visto estes slides antes.
Uma vez que os slides que continham pessoas variavam bastante no número de pessoas
mostradas, suas roupas, se estavam perto ou longe, se adultos ou crianças, pode-se dizer
que os pombos estavam demonstrando um conceito sofisticado de “pessoa” . Mesmo ás
ocasiões em que os pombos erravam eram interessantes. Eles ocasionalmente bicavam
quando os slides mostravam objetos frequentemente associados a pessoas tais como casas,
barcos e automóveis.
13.6 CLASSES ARBITRÁRIAS DE SD: CONCEITOS DISJUNTIVOS
Nas seções anteriores, sugerimos que, quando o comportamento de organismos está

sob o controle discriminativo de membros de uma ampla classe de S^s, esses organismos
estão demonstrando um comportamento conceituai. Indicamos vários tipos diferentes de
histórias de discriminação que permitem estabelecer-se tal controle complexo. Nos con
ceitos discutidos, as classes de controlador podem ser descritas como um conjunto de
estímulos ligados por uma relação comum de arranjo espacial ou estrutura topológica.
Assim, não importando o quão único seja cada animal que constitui a classe de
- 288-
“gato” , cada membro desta classe compartilha de certas relações físicas em comum com
todos os outros membros. 0 mesmo é verdadeiro para os caracteres chineses agrupados
no conceito “oo” , as figuras “dax” etc. Em geral, estas relações comuns caracterizam os
nossos conceitos de objetos tais como “casa” , “livro”, “ mesa” e a letra impressa “E”. Em
outros conceitos como “ maior que” , “proveniente de” , “ à direita de” /é um membro de”*
e “ conduz a” , as relações comuns que ligam todos os S^s não são a estrutura espacial
mas outros tipos de relações que são identificadas pelas próprias respostas verbais que
elas ocasionam . Assim, “ maior que” é uma resposta verbal que identifica a relação
compartilhada pelos membros da classe de controlador.
Deveria ficar claro que os conceitos relacionais são muito difundidos. Apesar disso,
frequentemente pode-se observar que o comportamento está sob o controle de amplas
classes de estímulos cujos membros parecem não ter relações comuns de estímulo. Não
existe, por exemplo, uma relação óbvia de estímulo físico nos S^s para “alimento” . Uma
cenoura, uma ervilha, uma folha de espinafre e um copo de leite aparecem como objetos
extremamente diversos. Levando-se em conta apenas suas características visuais, uma
ervilha parece-se mais como uma bola de gude do que com uma folha; uma cenoura
parece-se mais com um bastão do que com um copo de leite. Uma heterogeneidade
semelhante encontra-se nos cristais brancos de iodo, no bromo líquido vermelho e no gás
incolor conhecido como cloro que constituem, parcialmente, a classe “halogêneo”. O
conjunto de situações apresentadas na Fig. 13-8 controla o comportamento de parar,
embora elas tenham pouca semelhança entre si.
Figura 13-8. Situações de estímulo fisicamente diferentes que controlam a mesma

resposta rparar (Goldiamond, 1966)
Evidentemente, a diversidade nos membros de uma classe ampla de SD não prejudica

sua capacidade de controlar uma resposta semelhante. Podemos demonstrar experimentai-
- 289 -
mente o controle apresentado por uma classe de ampla, mas heterogênea, comum
p ro ced im en to de L —set. Se trein arm o s um m acaco a escolher ou o
triângulo ou a esfera entre dois objetos e nunca apresentarmos um triângulo e uma esfere
juntos, o comportamento do macaco ficará sob o controle de “triângulos ou esferas”
Além disso, o controle se generalizará para novos triângulos e novas esferas. Aqui, a classe
de SD controlador consiste de duas subclasses muito diferentes. Os membros triangulares
são agrupados devido à sua relação geométrica comum e os membros esféricos também.
Mesmo assim, falta uma relação comum entre triângulos e esferas.
Estendendo o procedimento para diversos SDs adicionais, podemos ampliar a classe
de SD do macaco para uma lista indefinida de objetos heterogêneos. Se mantivermos os
novos elementos de SD não relacionados aos antigos, não haverá razão para se esperar
que o macaco generalize para qualquer S novo que decidirmos incluir na classe.
Os exemplos das classes heierogêneas dc S^ do cotidiano e o comportamento do
macaco citado no último parágrafo ilustram o que é conhecido como conceito disjuntivo.
Os membros da classe de S^ ou triângulos ou esferas, ou cenouras ou ervilhas, ou
espinafre ou leite...; ou um guarda de trânsito no cruzamento ou u m a luz vermelha e assim
por diante. Em cada caso, uma resposta está sob o controle de uma ampla classe de S^s
e, portanto, preenche um dos critérios importantes do comportamento de conceitos.
Contudo, a falta de uma única relação comum, algo que una todos os membros da
classe, impede a generalização a novos membros, o que é típico de outros conceitos.
A dificuldade em se incluir novos membros de uma classe de S ^ disjuntivo na base
da generalização pode ser uma das razões pelas quais se diz, algumas vezes, que a humani
dade abomina conceitos disjuntivos (Bruner, Goodnow e Austin 1956). Felizmente,
muitas vezes é possível encontrar uma relação subjacente entre os membros de uma classe
disjuntiva de S^ que pode fornecer a base para a generalização. Por exemplo, os
alimentos, embora diferentes em aparência, têm a propriedade comum de serem substân
cias que são ingeridas pelos organismos vivos e transformadas em constituintes vitais do
corpo. Similarmente, o bromo, cloro e iodo têm a propriedade comum de se combinarem
com metais, formando sais cristalinos brancos que, de fato, são intimamente relacionados
um ao outro.
Nestes e em muitos outros conceitos disjuntivos, uma relação subjacente é revelada
através de uma operação comportamental que transforma os membros de uma classe de
SD, originalmente heterogêneas e diversos, em um novo conjunto de membros homogê
neos e semelhantes. Essas situações novas têm uma relação comum e esta relação fornece
a base para a generalização normal. Algumas vezes, a operação requerida é simples. Para
descobrir se certa substância é um alimento , precisamos apenas ingerí-la e esperar pela
situação transformada resultante. Para descobrir se alguma substância nova é um halo-
géneo, deixamo-la reagir com o sódio e verificamos se um sal cristalino branco “haloge-
nado” é produzido.
Frequentemente, pode ser difícil reduzir classes disjuntivas em conceitos relacionais
subjacentes. Uma parte significante da atividade científica consiste em se tentar fazer
operações em eventos superficialmente diferentes na esperança de transformá-los em
situações que são de fato semelhantes. Grande parte deste livro se dedica à elucidação de
relações subjacentes descobertas nos eventos comportamentais que, superficialmente,
parecem muito diferentes. Por exemplo, um animal bicando um disco e um estudante
opinando apresentam uma relação subjacente.
A procura de relações subjacentes é, de modo algum, limitada à ciência. Considere a
-2 9 0 -
longa tentativa de se descobrir o padrão absoluto para a arte ou a música. Tal padrão, se
pudesse ser encontrado, seria uma regra para relacionar as ocorrências extremamente
diversas do que identificamos como boa arte ou boa música. O fracasso em se encontrai
tais regras pode nos forçar, na exasperação, a concluir que boa música é aquela que os
críticos, dizem ser boa; ou, para citar uma ilustração da psicologia, diz-se, algumas vezes,
que a inteligência é “o que os testes de inteligência medem” . Ninguém descobriu ainda
uma operação para ser realizada em pinturas ou composições musicais que proporcio
nasse um conjunto de situações em que o genial e o medíocre fôssem inequivocamente
distintos. O conceito de genialidade permanece disjuntivo., “ Quando parar” também
retem uma certa arbitrariedade. Não existe uma operação para transformar os diversos
elementos da Fig. 13.8 em elementos que apresentem uma relação de estímulo comum.
A classe é feita pelo homem e a escolha dos elementos de estímulo é arbitraria. Por esta
razão, não há uma base para a generalização quando um novo S é introduzido. Tudo o
que se pode fazer é testar cada novo exemplo à medida que aparece determinando-se a
inclusão da classe apenas pelas contingências de reforçamento. Tal classe é estabelecida
de um modo similar aquele através do qual formamos, no macaco, o conceito de
“triângulo-ou-esfera”.
Em última análise, a única relação comum a todos os tipos de conceitos disjuntjvos é
que seus membros diferentes controlam a mesma resposta. Alguns conceitos disjuntivos,
por exemplo, alimento e halogêneos, têm uma propriedade além, de modo que seus
membros diferentes podem ser transformados e apresentarem uma relação subjacente
comum. Outros conceitos disjuntivos tais como a boa música a inteligência podem ter
uma relação subjacente; outros ainda, tal como o conceito experimental “triângulo-ou-
esfera” , permanecem ihteiramente arbitrários e dissimilares.
13.7 S IG N I F I C A D O E C O M P R E E N S Ã O C O N S ID E R A D O S COMO
INTERRELAÇÕES ENTRE CONCEITOS
O significado de uma palavra (resposta verbal) há muito é tido como relacionado à

formação de conceito, mas a ausência de uma estrutura sistemática para descrever os
conceitos tem dificultado uma análiàe exata da relação. Ao discutir como uma criança
desenvolve o conceito de cachorro, Hull equacionou a formação de conceito com a noção
de significado. Uma criança sabe o significado de cachorro quando pode, apropriada
mente, identificar novos objetos como objetos cachorros. Podemos concordar que o
emprego apropriado de uma resposta verbal para identificar os membros de uma classe de
SD do conceito é parte do que é tido como saber o significado de uma resposta verbal.
Ao equacionar significado com comportamento discriminativo, sentimos que está fal
tando algo. Considere o conceito de leite. Será que concordaríamos que uma criança sabe
o significado de leite quando pode identificar corretamente garrafas de leite, copos de
leite e leite derramado? Pode-se dizer que a criança sabe um pouco o significado de leite
se tudo o que ela pode fazer é identificar membros da classe de S^, mas somos inclinados
a concluir que sua compreensão do conceito não é muito profunda. Analogamente, um
chimpanzé pode^ser treinado a escolher os triângulos entre qualquer grupo de objetos,
mas poucos psicologos empregariam termos como significado ou compreensão ao descre
ver o comportamento observado. Significado e compreensão são, todavia, coisas que
tentamos ensinar nas escolas. Mesmo a ciência e a arte, algumas vezes, procuram por eles.
Logo, é conveniente perguntar que comportamentos a mais podem estar envolvidos
quando se diz que um organismo sabe o significado de, ou comprenede um conceito.
Precisamos primeiro examinar a noção de que um organismo pode adquirir um
conceito que, por sua vez, é formado de dois ou mais conceitos. Usando a nossa termino
logia, uma resposta (verbal ou outra qualquer), pode ser controlada por uma ampla classe
de SD que, por sua vez, pode ser dividida em duas ou mais classes de S^, cada uma
controlando sua prnoria resposta particular. Considere, por exemplo, o conceito de
“gelo” , cujo equivalente é “ água gelada” . A classe de SD para gelo é, evidentemente, a
interseção do conjunto de objetos congelados (C) e o grupo de objetos água (A). Gelo é
então, representado pela região sombreada no diagrama Venn de [ 13.2| .
[13.2]
Poucos dos nossos conceitos cotidianos são tão simples como indica esse diagrama, mas a
maoria dos conceitos adquiridos pelos organismos humanos podem ser analisados em
termos de outros conceitos. Assim, um operante é o < conjunto de respostas>que está
sob o < controle de > suas <conseqüências>. Uma enseada é uma < porção de água><
protegida>, com<£ ancoradouros>. Pai é o < progenitor> do <sexo masculino>. Podemos
mesmo inventar tais conceitos, como no exemplo tigleão =o <filho> de um <tigr^><
macho> e um <leãq> ^ fêm ea^ Muitos desses conceitos são formas generalizadas de
conceito como um conceito c o n ju n t iv o . A natureza composta de um conceito conjuntivo

sugere uma questão experimental, a saber, se uma história anterior com seus conceitos
componentes afeta a aquisição de tal conceito conjuntivo. Um experimento de Kendler e
Vineberg (1954) indica que quando seus componentes são previamente conceituados, um
conceito baseado na sua conjunção é adquirido mais rapidamente. Neste experimento,
cada uma das 32 figuras da Fig. 13-9 foi desenhada num cartão e a tarefa dos sujeitos
era arranjar aleatoriamente, os 32 cartões em duas classes. As respostas de arranjar
foram reforçadas com “certo” ou “errado” de acordo com a regra a qual diferia para os
diferentes grupos de sujeitos.
Dois grupos de sujeitos foram reforçados para agrupar todas as figuras curvas numa
pilha e as figuras retilíneas em outra. Um terceiro grupo de sujeitos foi reforçado para
agrupar todas as figuras acromáticas (sem cor) numa pilha e todas as figuras cromáticas
(coloridas) em outra. Assim, os três grupos de sujeitos aprenderam primeiro a classifi
cação em termos de forma ou cor. Quando isto estava bem aprendido, as regras para o
reforçamento foram mudadas. Os sujeitos do primeiro grupo eram, agora, reforçados para
arranjar todas as figuras grandes num grupo e as figuras pequenas em outro, isto é, um
arranjo pelo tamanho. 0 segundo grupo era, agora, reforçado para agrupar por cores e o
terceiro grupo para arranjar todos os triângulos e crescentes num grupo e todos os
círculos e quadrados em outro. No fim desse treinamento, todos os grupos haviam1
- 292-
Pequeno Grande
Acromática
• C ■ ▲
• C ■ A
5G
Ü © c ü A
O c □ A
c
C ores o-
§
6 c ei A
• n A
C ro m ática ^
*«
*c?
d © c Q A
© c m A
3
circulo crescente quadrado triâgiüo circulo crescente quadmdo tm ngub
curvas rctilín ea s curvas retilín eas
F o rm a
F igura 1 3-9c As 32 figuras usadas p o r K endler e V in eb erg (1954)
p a ra e s tu d a r a aq u isição d e c o n c e ito s co n ju n tiv o s.
aprendido dois conceitos, como se vê na primeira e segunda coluna de conceito na Tabela
13-2. No procedimento terminal, todos os sujeitos foram reforçados para arranjar os
cartões em quatro grupos: curvos pequenos, curvos grandes, retilíneo pequeno,
retílineo grande. Tal arranjo é feito na base de conceitos conjuntivos que consistem de
conceitos de tamanho e forma. O grupo 1 aprendeu este arranjo final mais rapidamente
que o grupo 2, que por sua vez, foi mais rápido que o grupo 3. Os autores concluiram que
a taxa de aquisição do conceito conjuntivo está diretamente relacionada ao número de
conceitos componentes aprendidos previamente.
Tabela 13-2
AS CONDIÇÕES DE TREINO USADAS POR KENDLER E VINEBERG (1954) PARA
ESTUDAR A AQUISIÇÃO DE CONCEITO CONJUNTIVO
Primeiro Conceito Segundo Conceito Terceiro Conceito
Grupo 1 Forma Tamanho Tamanho e forma

Grupo 2 Forma Cor Tamanho e forma
Grupo 3 Cor Tamanho e forma
A C vs O □
Na tarefa final do conceito, no experimento de Kendler e Vineberg, dois conceitos

componentes (tamanho e forma) foram relacionados, por conjunção, para formar um
novo conceito (tamanho-forma). A conjunção é, todavia, apenas uma das muitas
maneiras em que os conceitos podem estar relacionados e uma análise de tais relações
inter-conceito e mais pertinente para o significado ou a compreenção de um conceito.
Argumentamos anteriormente, nesta seção que uma criança que podia identificai
exemplos do conceito de leite, ou o macaco que podia pressionar uma barra sempre que
fosse apresentado um triângulo, não exibiram todo comportamento necessário para que
- 293-
pudéssemos dizer que eles estavam demonstrando compreensão. O tipo de comporta
mento adicional que parece ser requerido está representado esquematicamente na Fig.
13-10 para o conceito de leite.
A Fig. 13-10 é explicada como se segue. Cada um dos círculos do diagrama refere-se
a uma classe de S^s do tipo descrito previamente. Assim, a criança, para quem pode-se
dizer que a Fig. 13-10 tem uma estrutura significante, pode identificar garrafas deleite
copos de leite, leite derramado, e assim por diante. Mas ela pode também identificar
(com respostas verbais diferentes) vacas de vários tipos, cereais de um tipo ou de outro,
queijos, sorvetes e leiteiros. Se ela for uma aluna de ginásio que estuda nutrição, então,
ela poderá ser capaz de identificar o soro, a nata e o cálcio. Mas, igualmente importante,
o organismo humano sofisticado pode dar uma identificação relacionai para uma situação
composta que consiste de um S ^ para o leite e um de qualquer outra classe de S^
indicada. Esta habilidade conceituai está indicada pelas linhas entre os círculos com as
proposições que descrevem a relação. Cada proposição relacionai, todavia, é também um
conceito; na verdade, é o tipo de conceito que encontramos frequentemente nas seções
anteriores. O treino requerido para os conceitos relacionais como “proveniente de” e “é
um componente de” é precisamente análogo ao treino dado ao macaco quando conceitos
como “o singular” , “ o mais alto”, “90 graus de rotação” foram adquiridos. Dizemos que
uma criança sabe o significado, ou tem uma compreensão mais completa de leite quando
ela pode identificar as relações entre os membros da classe de SD que formam o leite e os
membros de várias outras classes de S ^
F ig u ra 13-10. U m a rep re sen tação esq u e m á tic a do c o n c e ito de leite e suas relações
com vário s o u tro s co n ceito s.
Deve ficar claro que a representação estrutural de significado da Fig. 13-10 está
isolada artificialmente. De fato, mostramos apenas as relações entre um único
- 294 -
conceito e um grupo de outros negligenciando as interrelações dos conceitos perifé
ricos com os outros e com todos os conceitos que o organismo' revela. Uma representa
ção completa do repertório conceituai de qualquer indivíduo seria uma tarefa insupe
rável, embora uma amostra limitada de conceitos e suas interrelações possa ser,
possivelmente, descrita,(Reitman, 1965, R. Quillian, manuscrito não publicado).
A Fig. 13-10 é uma maneira grosseira de representar os vários graus de com
preensão. Quanto mais densas as interconexões e maior o número de classes de que
possam ser unidas, mais facilmente diremos que um individuo compreende um con
ceito. A compreensão que uma criança tem de leite difere daquela do administrador da
leiteria ou do especialista em nutrição, principalmente no número menor de conceitos
aos quais a criança pode relacionar o leite. Minha compreensão do meu carro é
incompleta comparada com a do meu mecânico, que pode relacionar a palavra carro a
milhares de outras classes de incluindo, em particular, o que chamamos as partes
do veículo. Contudo, sua compreensão pode terminar com a mecânica da máquina.
Um caso interessante é proporcionado pelo físico que pode ser capaz de analisar
conceitos tais como fricção, aceleração, trabalho e energia a um nível muito mais
básico que o mecânico poderia. Mas quando seu carro não dá a partida, o físico não
estará preparado para repará-lo, a menos que possua conceitos tais como feixe de
mola, vela de ignição, cilindro, distribuidor e suas várias interrelações. As interrelações
entre os conceitos, para qualquer indivíduo, depende da história passada deste indi
víduo: as contingências para o chofer de automóvel estão ligadas a certos conjuntos de
situações, as para o mecânico a um outro e para o físico ainda a outro. As diferenças
entre seus repertórios conceituais sugerem uma distinção de nível embora, frequen
temente seja muito difícil estabelecer, na prática, os níveis relativos de conceitos.
Numerosos autores estudaram uma ou outra relação entre conceitos na tentativa
de esclarecer, em geral, a estrutura relacionai entre os conceitos. Muitos de nossos
próprios conceitos mostram uma estrutura hierárquica interessante (Welch, 1947;
Brown, 1958 a, b). Isto é, o conceito cachorro, por exemplo, pode conter como seus
membros poodles, dalmatas, cães de caça.
S eres
A n im ad o s In a n im a d o s
V egetais A nim ais
Peixes Aves Q u ad rú p ed es
[13.3]
C avalos C oelhos | C ach o rro s]
D alm atas P oodles T erriers
O cach o rro
do o u tro la
do da ru a
-2 9 5 -
terriers e assim por diante. Mas Príncipe, meu dâlmata é tambem um conceito com
pleto. Considere todas as situações em que podemos usar a palavra “Principe” para
identifica-las: o Principe em casa, o Principe fora de casa caçando gatos Principe acor
dado etc. A estrutura hierárquica se estende a ambas direções o Principe não é apenas
um cachorro - é um quadrúpede , um animal e um ser animado (Brown, 1958a). Eviden
temente, as classes de S ^que formam os nossos conceitos podem ser ou conjuntos con
tendo outros conceitos ou subconjuntos de outros conceitos. Por exemplo, ver o dia -
grama 13.3 . Adquirir um repertório verbal que colocará um conceito no seu lugar
apropriado numa hierarquia é uma parte importante do que queremos dizer por com
preender um conceito. n
E por responder às interrelações entre conceitos, ou classes de Su que as respostas
de linguagem têm uma vantagem especial sobre outras formas de comportamento. Para
ensinar uma criança que o leite é proveniente das vacas, não é necessário trazer uma
amostra de leite e uma vaca para a criança e reforçara escolha do leite sob uma série de
contingências análogas às contingências da “escolha do acordo com o modelo” que
usamos com o pombo. Se a criança já adquiriu os conceitos < vaca >< leiteiros > e< é
proveniente de > , isto é, ela emprega as palavras “vaca”, “leiteiros” e “é proveniente
de” , nas situações apropriadas, podemos tratar diretamente com o comportamento
verbal. Podemos, primeiro, fornecer uma deixa verbal e, então, reforçar a sentença
composta: “o leite é proveniente das vacas” . A única vantagem da linguagem é que, ao
contrário de barras, chave e botões, ela proporciona um repertório de resposta portátil
que o organismo pode carregar além das situações originais em que o comportamento foi
modelado. Além disso, quando as respostas de linguagem de um organismo podem ser
colocadas sob o controle discrim in ativo das situações arbitrárias que constituem a palavra
impressa, ou as palavras faladas de um segundo organismo, esta vantagemi adquire ainda
mais força. Mas essa grande flexibilidade no controle e emissão do sistema de
comportamentos que chamamos de linguagem pode ser também uma desvantagem por
apresentar a possibilidade de aquisição de cadeias verbais sem o amplo controle de SD
ambiental colateral característico de conceitos. Uma criança pode adquirir o que
chamamos verbalism os vazios. John Dewey, um conhecido teorista da educação, da
geração de Thorndike, uma vez perguntou a um grupo de crianças escolares o que elas
encontrariam se cavassem profundamente a terra. Foi recebido com olhares vazios. A
professora rapidamente, explicou a Dewey que ele havia feito a pergunta de modo
errado. “ Qual é o estado do centro da terra? ” ela perguntou. A resposta veio em coro:
“Fusão ígnea” . Aqui, uma seqüência verbal estava sob o controle discriminativo das
palavras faladas por um segundo organismo (a professora), mas parece que nenhuma
criança seria capaz de identificar qualquer dos membros das classes de SD <Jusãq> ou <
ígnea>, ou relacionar o conceito <centro da terra>com <cavar na superficie>. Estas são
as diferenças principais entre o que muitos educadores chamam de memorizaçãt de cor e
aprendizado significativo. Muitas crianças aprendem o Juramento à Bandeira sem
compreender sequer uma palavra dele; isto é, sem serem capazes de identificar exemplos
dos conceitos representados pelas várias palavras do Juramento.
A presente análise ajuda a esclarecer o papel da definição na linguagem. Considere
a definição familiar de um operante = uma resposta que está sob o controle de suas
conseqüências. Tal definição é uma proposição de um conceito composto constituído
de < resposta > < sob controle de > e < conseqüências - Os estudantes, algumas
vezes, tentam adquirir a cadeia verbal do lado direito do sinal de igualdade, pre
- 296-
parando-se para serem apresentados com apenas o termo do lado esquerdo, num teste.
Mas muitos instrutores têm expectativas maiores. Uma definição é dita ser com
preendida quando pode ser analisada gramaticalmente, isto é, decomposta em seus
conceitos componentes. Se esta análise é efetuada sucessivamente, conceito por con
ceito, eventualmente, atinge-se um ponto onde os componentes do conceito original
são reduzidos a conceitos simples, em vez de compostos. Cada um desses conceitos
simples so podem ser especificados, fazendo-se uma lista de algumas das situações reais
do ambiente que constituem sua classe S^. Neste nível,diz-se, algumas vezes, que o
conceito ê primitivo. Ilustramos esse tipo de análise conceituai na Fig. 13-11. Esta
figura, como a Fig. 13-10, é apenas uma outra maneira de se representar a estrutura
parcial do significado. Parece que o grande poder de uma definição está na sua
habilidade de codificar um grande número de conceitos e suas interrelações numa
única unidade de comportamento verbal. A definição típica seria um exemplo muito
complexo do tipo de conceito estudado por Kendler e Vineberg.
As notas nesta seção fornecem um indício do que está faltando nas análises expe
rimentais do comportamento de conceito nas seções anteriores. Nestas, os pesqui
sadores, ao treinarem seus animais através da L—set ou de outros procedimentos de
conceito, têm tentado estabelecer apenas um único conceito. De modo a simular a forma
mais simples de compreensão, pelo menos três conceitos
Operante = [Resposta] | S ob o controle de | süãs [conseqüências]
A classe dc jco m p o i | ^ cst^ s°b ° c°n- Urr [:estímulo| que segue uma resposta
r trole de P quando
Qéuma função
de P J
Qualquer coita que um

organism o | faz |
Correr Saltar Dizer “ da” Uma unidade d o | ambientef
Uma j descrição | física das energias presentes a qualquer

tempo dado capaz de controlar o comportamento do orgaaismo
O telefone alimento Três objetos numa

perto de João apresentado a bandeja, diretamente
*oca um pombo em frente de um macacc
Figura 12-11. Uma analise parcial da definição da palavra Operante em alguns dos
seus conceitos componentes. Os conceitos comportamentais importantes estão dentro
dos quadvados c além disso são analisados.
- 297 -
parecem necessários: duas classes independentes de e uma classe a mais de que
conteria, entre seus elementos, situações compostas consistindo de um elemento de
cada uma das duas primeiras classes de S^. Isso seria equivalente a dois conceitos e
um conceito relacionai unindo seus membros. A tecnologia comportamental precisa
ainda ser desenvolvida ao ponto de se poder colocar um número de comportamentos
sob o tipo de controle ilustrado pelas Figuras 13-10 e 13-11, mas um progresso nessa
direção está ilustrado no comportamento do macaco nos dois quadros da Fig. 13-12.
No quadro inferior, o macaco está escolhendo um objeto de forma entre três e seu
comportamento está parcialmente sob o controle da cor da bandeja. Quando esta cor é
mudada, como no quadro superior da Fig. 13-12, o macaco escolhe o objeto de cor
diferente entre os mesmos três objetos. Aqui, dois conceitos relacionais foram desen
volvidos pelos procedimentos de disposição para aprender: “Singularidade de forma” e
‘singularidade de cor” e ambos estão sob o controle discriminativo da cor da bandeja.
Mas mesmo estas demonstrações são pequenas para simular as interrelações complexas
características da “compreensão” . Nestes e em outros experimentos com animais
descritos neste capítulo, apenas um repertório limitado de resposta é desenvolvido.
Parece que a análise experimental das relações de conceitos requer o desenvolvimento
de repertórios de resposta mais amplos que tenham um papel análogo ao do compor
tamento verbal do organismo humano.
13.8 A AQUISIÇÃO DE CONCEITO ATRAVÉZ DA INSTRUÇÃO PROGRAMADA
Uma parte da seção anterior foi especulativa por necessidade, uma vez que a
tecnologia comportamental ainda não alcançou um estágio onde uma avaliação detalha
da da aquisição de conceito complexo e da interação de conceito possa ser feita em
organismos inferiores. Esperamos suplementar nossa informação experimental sobre a
aquisição de conceito através da análise da aprendizagem humana mas, quando nos
voltamos para o lugar onde a aprendizagem humana de conceito mais sistemática
supostamente ocorre, a escola, encontramos muitas generalizações amplas mas poucos
princípios. Todos são a favor da aprendizagem significante e contra a memorização de
cor. Conceitos, concorda-se universalmente, são o que queremos ensinar e não “fatos
vazios” . Mesmo assim, poucos negariam que, enquanto muitas crianças adquirem os
conceitos básicos que são os objetivos dos seus cursos na escola muitas outras não o
fazem. Isto dificilmente seria devido à falta de material conceituai, pois t) currículo
escolar está impregnado de uma variedade de conceitos isolados. Considere alguns
exemplos adaptados de Brownell e Hendrickson (1950): nação, governo, constituição
cidadão (estudos sociais); lei, elemento, imã, feagente, célula, osmose, massa, ácido,
ion/ciência); erosão, latitude, região, mapa (geografia); voz, tempo, flexão, sentenças,
parágrafo (linguagem); divisão, fração, expoente, equação, número base (aritmética);
escala, tom, clave, intervalo, harmonia (música). Entre esta diversidade de material
conceituai seria surpreendente se não conseguíssemos aproveitar algo de um exame
crítico de como estes conceitos são ensinados. Infelizmente, existe, uma dificuldade
dupla: (1) Nenhum método tradicional de ensino garante a aquisição de conceito, e
mesmo assim ( 2 ) algumas crianças parecem adquirir conceitos, independente de qual
seja o método. Isto mostra a impossibilidade de se extrair dos métodos tradicionais de
ensino as condições necessárias e suficientes para produzir a aquisição de conceito. Os
métodos apropriados para as classes heterogêneas não permitem um controle adequado
- 298 -
SpSdo13<,cT,Jw'O
lK,,ín"írlM9,C0mPl“S" P" “ '"l"‘'nW* ”U“‘~
- 299-
das contingências individuais de reforçamento para assegurar o desempenho desejado
em cada organismo
As implicações deste fato levaram B. F. Skinner (1954, 1958, 1961) a considerar
as possibilidades de um método que permitiria um controle melhor das condições de
aprendizagem de cada estudante individual. Skinner propôs que se programasse as
contingências envolvidas no ensino das matérias cm pequenos passos sistemáticos e se
fornecesse reforçamento imediato para os comportamentos corretos. Skinner notou
que os métodos tradicionais não garantiam a resposta do estudante. Ao ministrar uma
aula para o estudante, ao lhe dar como tarefa a leitura de um livro ou mesmo com a
ajuda de material audiovisual sofisticado como aulas televisionadas, o professor não
tem meios de estar seguro de que o estudante está ouvindo ou lendo cuidadosamente.
Em termos comportamentais, diríamos que o professor não tem meios de estar seguro
de que o aluno está respondendo ativamente.
Figura 13-13. Uma máquina de ensinar. O estudante Ir o quadro e escreve sua

resposta. I.ntão. move uma barra para descobrir a resposta correta e compará-la u
resposta ísecunde' Skinner, 195R).
- 300 -
As contingências programadas dc Skinner supunham implicitamente os tipos de
habilidades intelectuais adquiridas nas escolas, e tradicionalmente vistas como idéias,
compreensão, interesses, associações, conhecimento e assim por diante, eram compor
tamentos operantes complexos. Assim sendo sua aquisição e manutenção deveriam
seguir todas as leis de comportamento que já descrevemos. Mas o ensino programado,
baseado nos princípios de aproximação sucessiva, discriminação, etc., exige uma
atenção mais sistemática para as contingências individuais do que as salas de aula
tradicionais permitem. Skinner propôs uma solução para este problema sob a forma de
uma máquina para apresentar seriadamente o material de ensino e para estabelecer as
contingências de reforçamento para o comportamento. A máquina tem três aspectos
essenciais. ( 1 ) O material é apresentado para o estudante em pequenas porções
discretas, chamadas quadros, (2) Este material estabelece a ocasião para algum
operante discriminativo por parte do estudante, tal como escrever uma palavra ou
sentença, preencher uma lacuna ou escolher uma resposta. (3) O comportamento
emitido é reforçado imediatamente, apresentando-se a “ resposta” correta tão logo o
estudante tenha respondido e permitindo-lhe avançar para o próximo quadro. Uma
dessas máquinas usadas por Skinner é vista na Fig. 13-13. Nesta versão, os quadros
estão escritos num disco rotativo, e um quadro dc cada vez aparece no centro da
janela. Depois de ler o quadro, o estudante escreve sua resposta numa tira de papel
exposta através de uma abertura à direita. Ele, então, levanta uma barra que há na
frente da máquina, movendo o que ele escreveu sob uma cobertura transparente e
revelando a resposta correta na janela central. Os quadros individuais são organizados
em pequenos passos seqüenciais. O estudante pode progredir no seu próprio ritmo
através da sucessão de quadros, chamada um programa, cometendo muito pouco erro.
Mas a apresentação de progu.mas desse tipo não se limita apenas a máquinas. Os
aspectos críticos — pequenos passos seqüenciais, resposta ativa e reforçamento ime
diato - podem ser organizados na forma de um livro. Uma amostra de um texto
programado encontra-se, neste livro, no Capítulo 4.
Muito tem sido escrito a respeito dos méritos e possibilidades da instrução
programada. A elaboração de um programa e uma arte delicada e quando um programa
está perfeito o professor programador poderá entrar em contato com um número
indefinido de estudantes individuais através de contingências íntimas de reforçamento.
Apesar da sua natureza individual que prossegue lenta e metodicamente, procurando
estar seguro de que cada ponto é compreendido antes de passar para o próximo. O
teste e revisão repetidos de um programa em estudantes individuais até que ele seja
bem sucedido em ensinar o que pretende, é uma característica da programação que.
com freqüência, falta completamente nos métodos tradicionais de ensino. Essas vanta
gens da instrução programada podem bem ser a base para elevar a qualidade dos
métodos mais convencionais de ensino. Quando há um programa apropriado para
ensinar os conceitos básicos, o professor fica l ivre para discutir pontos sutis, levar os
estudantes à solução de problemas criativos e para treinar as habilidades adquiridas
através da máquina num contexto algo mais relacionado com a vida. A programação
está ainda num estágio inicial para que possamos estimar com exatidâb o quão
radicalmente ela irá mudar nossas práticas educacionais. De qualquer modo, nosso
interesse atual não é este. Estamos interessados no programa como um veículo
experimental para a aquisição de conceitos.
É conveniente classificar o conteúdo verbal .que constitui um quadro em dois tipos
- 301 -
de proposições: regras e exemplos (Evans, Holme e Glaser, 1962). Uma regra pode ser
considerada como uma especificação geral ou definição de uma classe de SU, enquanto
um exemplo pode ser considerado como a ocorrência de um dos membros da classe de
SD. Uma instrução programada pode ser encarada como um arranjo de várias regras e
exemplos, onde algumas porções de cada regra ou exemplo são omitidas, sendo
necessário, então o comportamento por parte do aprendiz para completá-las. Deve
estar claro que uma apresentação de um subconjunto de exemplos associados com um?,
determinada regra é análoga à apresentação de um subconjunto de Ss individuais de
uma ampla classe de e o reforçamento de uma determinada resposta de identifi
cação, digamos, a palavra leite ou a resposta de apanhar o objeto singular.
Considere os quatro quadros de um programa para ensinar alguns conceitos de
imagem em poesia, vistos na Fig. 13-14. Antes destes quadros, os conceitos de
imagem, objeto e similitude foram ensinados através de exemplos. Os quadros 48, 49 e
50 são três exemplos de uma classe de SD que deve ser identificado como símile.
Note que cada quadro é arranjado de modo a permitir que as deixas contextuais
aumentem a probabilidade da resposta requerida. Os três quadros usados como S^s e
para o símile têm certas similaridades, mas também certas diferenças. Uma vez que o
Figura 13-14. Quatro quadros dc um programa delineado para ensinar conceitos
relativos à imagem na poesia ( cortesia de Susan Stitt).
48. Uma imagem que expressa uma similitude entre objetos de classes diferentes, mas
que não significa exatamente o que diz, é chamado um símile. A imagem “a
menina é como uma flor” é u m .......................................................................................
Resposta. Símile
49. Pelo fato de expressar uma similitude entre objetos de classes diferentes mas não
significar exatamente o que diz, a imagem “ a face do homem iluminou-se como o
sol” é um ...................................................................................................................... ..
Resposta. Símile.
50. Um símile não é introduzido apenas pela palavra como, mas pelas palavras ta!
qual, como se ou como quando. Assim, a imagem “o homem está vermelho tal
qual um pimentão” é um ...............................................................................................
Resposta. Símile.
51. Por outro lado, uma frase que expressa a identidade entre dois objeto mas não
significa exatamente o que diz, não é um símile. Assim, a imagem “seus olhos são
estrelas” (é/não é) um símile.
Resposta. Não é_____________ _________________________________________
programador deseja que o conceito de símile seja tão amplo quanto possível, as
contingências de reforçamento são estabelecidas na presença de uma grande variedade
de exemplos da classe de S^. O quadro 51, todavia, é um caso de SA . Na aquisição
de conceito em humanos e em animais, é importante apresentar situações onde não
haja membros da classe de e retirar o reforçamento da resposta ou, como neste
caso, reforçar uma resposta incompatível. O quadro 51 ajuda a estabelecer o que o
símile não é.
- 302 -
Outro exemplo de rormação de conceito é mostrado no quadro da Fig. 13-15.
Posteriormente, neste programa, o estudante encontrará figuras de outros organismos
com e sem seis pernas e com muitos outros aspectos que variam. Mas a palavra inseto
só terá deixas e será reforçada na presença de figuras de organismos com seis pemas.
Eventualmente, o conceito de inseto se generalizará para uma vasta classe de orga
nismos com seis pemas através desta história com um subconjunto dos membros.
Ainda outro exemplo no campo da análise comportamental é fornecido nos
quadros da Fig. 13-16. O conceito a ser adquirido é o de evento resposta. Note que os
quatros fornecem SDs e S ^ s para o conceito. Eventualmente, aparecerá num quadro
onde se pedirá ao aprendiz que induza a definição geral com base na sua história
passada com numerosos exemplos.
Os exemplos de formação de conceito através da instrução programada indicam

que as noções fundamentais da aquisição de conceito discutidas nas seções
anteriores são aplicáveis também à aprendizagem humana. Os exemplos vistos
representam ilustrações razoavelmente simples de como o controle de uma resposta
verbal (símile, inseto, evento resposta) por uma ampla classe de S^s pode ser
estabelecido através da apresentação sistemática de exemplos, com reforçamento 1 para
a resposta verbal desejada. É claro que os conceitos desenvolvidos são conceitos
compostos de outros. O símile é composto de certas relações entre os conceitos de
objeto, similitude e imagem; inseto é a conjunção de organismos e seis pernas evento
resposta é um composto de ação e agente. Num programa completo, cada conceito a
ser adquirido é estabelecido através de um conjunto de contingências apropriadas com
um subconjunto de seus membros e muitos dos conceitos adquiridos são, então,
relacionados entre si através de exemplos compostos apropriados. É este entrelaça
mento de conceitos que parece ser o carimbo da verdadeira compreensão de um
assunto.
Ao se programar a aquisição de conceito surgem algumas questões sistemáticas
relativas ao papel de certas variáveis que o programador tem sob o seu controle. O
programador pode controlar o número de exemplos de e S ^ ; pode controlar sua
1 Note que para sujeitos humanos normais '"obter a resposta 'co rre to ' é frequen
temente um reforçador suficiente. Veja, por exemplo, o programa na seção 4.3.
-3 0 3 -
Figura 13-16. Uma série de quadres delineados para estabelecer o conceito de evento-
resposta. As Rs corretas estão indicadas pelas letras pequenas à direita do quadro
(Mecliner, 1963).
1 . Seu nascimento não foi “um evento-resposta” para você. Você jogar seu chocalho
fora do seu berço foi “um evento-resposta” para você.
Marque as respostas abaixo que descrevem um evento-resposta para. a pessoa ou
animai nelas indicado (nota: você pode marcar qualquer número de sentenças).
a. □ Clara pintou o cabelo de vermelho a

b □ Herman morreu.
c. □ João tem uma cárie.
d. □ Aroldo foi ao dentista. d
e. □ 0 gato miou. e
2 . Quando você bate em alguém, o evento-resposta é seu. Quando outra pessoa lhe
bate, o evento-resposta não é seu.
Para cada sentença abaixo marque o quadrado se a sentença descrever um evento-
resposta para o organismo nela indicado.
a. □ Filipe corre depressa
b. □ Gregório foi atropelado.
c. □ Alice colou no exame.
d. n Maria foi pega colando.
e. n 0 canário perdeu todas as suas penas.
f- □ 0 cachorro pegou o doce no primeiro salto
3. Marque as proposiçoes que descrevem eventos-resposta para você.
a. □ Você resolveu um problema difícil dematemática a
b. □ Seu professor lhe deu uma boa nota.
c. □ Você é um dentista.
d. □ Você está estudand.o para ser um dentista. d
4. A sentença “Um gato corre” refere-se a um evento-resposta.

A sentença “Uma pessoa corre” refere-se a um evento-resposta.
A sentença “O carro corre” não se refere a um evento-resposta.
Marque os eventos-respostas abaixo:
a. □ 0 furacão passou ontem aqui (para o furacão)
b. □ Tom bateu em Harry, (para Tom)
c. □ Tom bateu em Harry, (para Harry)
d. □ O relógio bateu dez horas (para o relógio)
e. □ Você come uma cenoura (para você)
f. □ Um mosquito pica você (para você)
g- □ Um mosquito pica você (para o mosquito)
- 304-
diversidade e suas seqüências. Ào desenvolver alguns conceitos diierentes, ele pode
escolher um exemplo multidimensional concreto, apresentando-o sob vários pontos de
vista , ou pode usar vários exemplos mais simples, apresentando cada um sob o único
ponto de vista. Há pouca informação sistemática disponível a respeito de qualquer
destas variáveis, mas é como um meio experimental que a programação tem potenciais
importantes par elucidar relações fundamentais na aquisição de conceito.
13.9 AS CONSTÂNCIAS PERCEPTIVAS
A noção de uma “coisa” como uma entidade imutável está tão fortemente
arraigada que talvez seja uma surpresa que coisas tão primitivas como objetos possam
ser descritas como conceitos. Imagine que a face de um amigo não seja um único
estímulo visual. Algumas vezes, ele aparece na sombra, outras na claridade. Às vezes,
ele está sorrindo, às vezes franzindo as sobrancelhas. Algumas vezes, você o vê de
perfil, outras, de frente. Além disso, perfis e visões frontais são, por sua vez, uma
coleção de perfis e visões frontais, nenhum dos quais é, alguma vez, exatamente
repetido. Apesar do fato de que você nunca veja a mesma face duas vezes, você não
tem dificuldade para identificar seu amigo. Em linguagem técnica, seu amigo é uma
ampla classe de S^s e você responde similarmente a todos os membros.
Considere o objeto mostrado na Fig. 13-17. Todos os quatro desenhos represen
tam “ a mesma porta” , contudo, os vários padrões que atingem o olho e que constituem
as quatro situações que chamamos “porta” , são bastante diferentes. É claro que para
portas, ou qualquer outro objeto que possamos imaginar, o nosso conceito do deter
minado objeto não consiste de uma única situação, mas de uma ampla classe de
situações. Os exemplos que acabamos de dar são casos do que pode ser denominado
constância do objeto. Apesar das mudanças marcantes na situação, nós retemos uma
resposta constante na presença de todas as suas variantes.
Que tipo de conceito é representado pela constância do objeto? Tomados in
dividualmente, os quatro desenhos da Fig. 13-17 sugerem que o conceito de objeto é
disjuntivo, já que essas quatro situações parecem tão diferentes. Mas a Fig. 13-17 é
apenas uma amostra do conjunto infinito de situações que variam de aberta a fechada,
todas as quais controlam a resposta “porta”. E todas essas situações estão mutuamente
- = r
□
0 0 • • 1
Figura 13-17 Quatro membros da classe de S ^ “ porta” (Gibson, 1950)
- 305-
relacionadas pelo fato de que uma situação Aporta” pode ser continuamente trans
formada em outra. Tal série de transformações relaciona as situações de qualquer
objeto particular.
A constância do objeto é apenas uma classe do que é geralmente chamado de
constâncias perceptivas. Outro exemplo é mostrado através dos dois pedaços de carvão
colocados sobre o papel branco, na Fig. 13-18. Dizemos que o carvão é “preto” e o
papel é “branco” sem levar em consideração a intensidade absoluta de luz que apenas
ou o carvão ou o papel reflete. À sombra, o pedaço de carvão no painel à esquerda da
Fig. 13-18. reflete somente 1 millilambert de luz, enquanto que o mesmo pedaço de
carvão à luz do sol (painel à direita da Fig. 13-18) reflete 100 vezes mais luz. Ainda
Figura 13-18. Um caso de constância de cor neutra. Um pedaço de carvão colocado

sobre uma tolha de papel branco (Hochberg, 1964).
assim, dizemos que o carvão é preto, embora ele agora reflita 10 vezes mais luz que
refletia o papel branco à sombra. A resposta à cor neutra (cinza) depende da
iluminação relativa do objeto com respeito ao seu fundo ou região imediatamente
adjacente. Assim, “preto” é um conceito já que é a resposta na presença de uma classe
ampla de S^s relacionados: objeto que reflete 1 unidade de luz, fundo que reflete 9
unidades de luz objeto que reflete 10 unidades de luz, fundo que reflete 90 unidades;
objeto que reflete 100, fundo que reflete 900; e assim por diante.
Um exemplo final é proporcionado pelo fenômeno conhecido como constância de
tamanho. À medida que uma pessoa caminha em sua direção, você não é capaz de
relatar que sua imagem visual está aumentando de tamanho. Contudo, à medida que
ela se aproxima, a imagem aumenta de tamanho na sua retina, de uma maneira
inversamente proporcional â sua distância de você. Dentro de limites você diz que ela
está do mesmo tamanho, independentemente do tamanho da imagem na sua retina.
Desse modo, o conceito de tamanho é dependente de uma classe de SD onde a regra
para inclusão na classe é uma função complexa do tamanho retínico do objeto mais os
valores de muitas outras variáveis visuais que variam com a distância de um objeto. A
Fig. 13-19 mostra que o conceito de tamanho constante não é controlado pelo
tamanho retínico constante. Os três cilindros da Fig. 13-19 são todos os mesmo
tamanho (meça-os) mas tendemos a classificá-los como progressivamente maiores da
esquerda para a direita devido às mudanças na perspectiva linear, uma das variáveis que
em geral, muda progressivamente com a distância.
Naturalmente, não é por acidente que as constancias de objeto, cor neutra e
tamanho se desenvolvem. Contingências de reforçamento estão frequentemente correla
cionadas com os “objetos” (um pássaro deve se manter fora de todas as situações que
- 306 -
Figura 13-19. Resposta ao tamanho quando determinada por variáveis de distância
(Gibson, 1950).
chamamos “gato”, se quiser viver muito), bem como as variáveis de estímulo com
posto que controlam a constância de cor acromática e a constância de tamanho.
Raramente, consideramos que> um objeto está mudando de cor ou tamanho quando
sua iluminação ou distância muda. Por outro lado, é conveniente classificar aquele
animal que está se movendo rapidamente em sua direção como “grande”, embora o
tamanho de sua imagem seja ainda muito pequeno. Nossos conceitos espelham-se nas
contingências de reforçamento da natureza, embora seja uma especulação interessante
- 307 -
saber se esses conceitos perceptivos são geralmente adquiridos na história passada de
cada indivíduo ou se, tendo sido bem adquiridos pelos seus ancestrais, são agora
uma parte permanente do seu eauioamento de resposta visual.
REFERENCIAS PARA O CAPITULO 13.
Andrew, G., and Harlow, H. F. Performance of macaque monkeys on a

test of the concept of generalized triangularity. Comp, psychol.
Monogr., 1 9 4 8 ,1 9 , 1 -2 0 .
Brown, R. H ow shall a thing be called? Psychol. Rev., 1958a, 65, 1 4 -2 1 .
Brown, R. Words and things. Glencoe, 111.: Free Press, 1958b.
Brownell, W. A ., and Hendrickson, G. How children learn information,
concepts and generalizations. In Learning and instruction, 49th
Yearb., Nat. Soc. Study Ed., 1950, Part I.
Bruner, J., Goodnow, Jacqueline J., and Austin, G. A. A Study of think
ing. N ew York: Wiley, 1956.
Cumming, W. W., and Berryman, R. Some data on matching behavior in
the pigeon. J. exp. Anal. Behav., 1961, 4, 2 8 1 -2 8 4 .
Evans, J. L., Homme, L. E., and Glaser, R. The ruleg system for the
construction of programmed verbal learning sequences. J. educ.
Res., 1962, 5 5 ,5 1 3 - 5 1 8 .
Ferster, C. B. Arithmetic behavior in chimpanzees. Sci. Amer., May
1964, 210, 9 8 -1 0 6 .
Gibson, J. J. The perception of the visual world. Cambridge: The River
side Press, 1950.
Goldiamond, I. Perception, language, and conceptualization rules. In
B. Kleinmuntz (E d .), Carnegie Institute of Technology annual sym
posium on cognition, N ew York: Wiley, 1966.
Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56,
5 1 -6 5 .
Harlow, H. F. Learning set and error factor theory. In S. Koch (E d .),
Psychology: a study of a science, V ol. 2. New York: M cGraw-Hill,
1959.
Harlow, H. F., and Kuenne, M. Learning to think. Sci. Amer., 1949, 181,
3 6 -3 9 . ^
Herrnstein, R. J., and Loveland, D. H. Complex visual concept in the
pigeon. Science, 1964, 146, 5 4 9 -5 5 1 .
Hochberg, J. E. Perception. Englewood Cliffs: Prentice-Hall, 1964.
Hull, C. L. Quantitative aspects of the evolution of concepts. Psychol.
Monogr., 1920, 28, Whole N o. 123.
Kelleher, R. Concept formation in chimpanzees. Science, 1958, 128,
7 7 7 -7 7 8 .
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York:
- 308 -
Kendler, H. H. Basic psychology. N ew York: Appbton-Century-Crofts,
1963.
Kendler, H. H ., and Vineberg, R. The acquisition of compound con
cepts as a function of previous training. / . exp. Psychol. , 1954, 48,
2 5 2 -2 5 8 .
Kimble, G. A ., and Garmezy, N. Principles of general psychology. (2nd
ed .) N ew York: Ronald Press, 1963.
Lysaught, J. P., and Williams, C. M . A guide to programmed instruction.
N ew York: Wiley, 1963.
Mechner, F. Science education and behavioral technology. New York:
Basic Systems, 1963.
Reitman, W. R. Cognition and thought: an information processing ap
proach. New York: Wiley, 1965.
Skinner, B. F. The science of learning and the art of teaching. Harvard
educ. Rev., 1954, 24, 8 6 -9 7 .
Skinner, B. F. Teaching machines. Science , 1 9 5 8 , 128, 9 6 9 -9 7 7 .
Skinner, B. F. Why we need teaching machines. Harvard educ. R e v .t
1 9 6 1 ,3 1 , 3 7 7 -3 9 8 .
Smoke, K. L. A n objective study o f concept formation. Psychol. Monogr.,
1932, 42, Whole N o. 191.
W elch, L. A behaviorist explanation of concept formation. / . genet.
P sych o l , 1 9 4 7 ,7 1 ,2 0 1 - 2 2 2 .
- 309 -
Capítulo 14 SOLUÇÃO DE PROBLEMA E INTELIGÊNCIA
O TERMO “PROBLEMA” SURGIU OCASIONALMENTE nas discussões ante

riores. lhorndike colocou gatos numa caixa quebra-cabeça que continha uma tramela
que pode ser aberta através de vários movimentos (Fig. 1-1). Foi dito que os gatos que
não tinham uma história anterior com as contingências deste aparelho se defrontavam
com um problema — escapar da caixa. Pode-se dizer, assim, que a aquisição de qualquer
comportamento instrumental contem elementos de solução de problema. Nos pro
cedimento de disposição para aprender do último capítulo, descrevemos, conjuntos su
cessivos de contingências discriminativas apresentadas durante o treino como uma série
de problemas de discriminação. Os macacos solucionaram estes problemas e como resul
tado adquiriram a habilidade para resolver novos problemas similares como uma eficiên
cia maior.
14.1 A ESTRUTURA DE UM PROBLEMA E A NATUREZA DE UMA SOLUÇÃO
Os problemas que os gatos de Thorndike e os macacos de Harlow tinham diante

de si diferem em vários aspectos, mas particularmente nas contingências existentes. As
contingências estabelecidas para os gatos eram predominantemehte diferenciações e
para os macacos, discriminações. Logo, a notação de um “problema” não denota
qualquer classe particular de contingências de reforçamento. Discriminações e diferen
ciações podem ser problemas. O fato de se um conjunto de contingências pode ou não
ser interpretado como um problema para um organismo depende dos comportamentos
predominantes quando o organsimo se defronta pela primeira vez com a situação
problema. Os gatos de Thorndike, evidentemente, defrontaram-se com um problema,na
caixa quebra-cabeça nas suas primeiras tentativas. Eventualmente, à medida que o
comportamento que conduzia à abertura da tramela era repetidamente reforçado, a
situação perdia sua característica de problema. Tão logo os gatos eram colocados na
caixa, eles já se encontravam fora dela. Um desenvolvimento semelhante ocorre na
formação da disposição para aprender. O macaco com uma disposição para aprender
de singularidade bem formada resolve imediatamente, qualquer discriminação nova de
singúlaridade. A situação de singularidade não pode mais ser descrita como um “pro
blema” para este organismo.
Essas idéias simples não estão limitadas a grupos de problemas artificiais estabe-
- 311 -
lecidos para animais nos laboratórios de psicologia. Para um aluno de segundo ano
primário
25
-18
constitui um problema, mas um ano ou mais depois isto não será mais o caso.
Similarmente, você pode não achar que / e “^x dx seja problema, dependendo de se
você possui certos comportamentos usualmente ensinados nos textos do primeiro ano
de cálculo. No extremo de um continuum, podemos dizer que sabemos “ como acabar
com as guerras” — um problema desde que uma solução universal ainda não existe. Em
resumo, nenhuma classe de contingências, nem qualquer contingência em particular,
podem ser descritas como um problema até que saibamos que comportamento o organis
mo vai apresentar na presença daquela contingência. Tentemos, agora, descrever este
ponto de vista mais rigorosamente. Para isso, veremos que os conceitos sobre encadea-
mento introduzidos no Capítulo 12 são indispensáveis.
Numa cadeia de comportamento, um organismo emite operantes numa ordem se
qüencial. A ordem particular é controlada pelas conseqüências estabelecidas para cada
operante isolado. Para solucionar um problema de divisão, uma criança bem treinada
realiza a multiplicação, subtração, empréstimo, transporte, etc., numa certa seqüência
que depende do resultado de várias discriminações. Uma criança sem as habilidades
componentes não pode executar a cadeia requerida. Esta criança ilustra a possibilidade
de que, em qualquer situação determinada, pode não existir qualquer cadeia que
produzirá a situação associada com o reforçamento. Isto pode surgir de uma entre
duas maneiras relacionadas. (1) o organismo não adquiriu, no passado, uma parte ou
toda a cadeia necessária para conduzi- lo da situação presente, S^, para a situação
reforçadora, Sb , embora tal cadeia possa ser conhecida por outros organismos. (2) Não
existe qualquer cadeia conhecida cuja execução garanta a transformação de Sa em Sb .
Examinemos, agora, vários problemas representativos.
0 problema na caixa-quebra-cabeça revela certos aspectos interessantes da solução
de problema. Os gatos foram colocados na situação inicial, a caixa fechada, S \ . Alguns
comportamentos foram gerados inicialmente. Os gatos correram, miaram, colocaram
suas patas nas barras, arranharam as bordas dos orifícios maiores, olharam em várias
direções e assim sucessivamente. Muitos destes comportamentos representam operantes
generalizados de uma história passada de reforçamento em situaçõe similares. No
passado, quando colocados num espaço pequeno, os gatos, normalmente, escapavam
olhando ao redor do ambiente, aproximando-se de qualquer orifício, arranhando as
partes soltas do ambiente, e assim por diante. Alguns outros comportamentos, como
miar, estão indubitavelmente estabelecidos na estrutura do gato. Independentemente
de como foram fortalecidos, certos comportamentos, R i, R2, R 3 , R4 ..., surgem na
situação problema inicial. Além disso, embora esses comportamentos não sejam
aleatórios, eles não estão ainda arranjados na seqüência bem ordenada que é emitida
quando o gato, eventualmente, soluciona o problema. O repertório inicial do gato
consiste de um conjunto seletivo de comportamentos que ele traz para a situação e
com os quais ele opera nela. Eventualmente, uma dessas Rs pode ser bem sucedida em
abrir a tramela. Quando isto acontecer, o gato transformou a situação de porta
fechada em porta aberta.
- 312-
SA
R,
R2 S (porta aberta)
R 3 —» R (Sair pela —> Sg (fora da caixa)
R4 Porta)
Na nova situação, S(p0rta abertaV 0 Sat0 tem uma secluência de resposta bem estabele
cida predominante, sair pela poria aberta. Este problema simples ilustra vários aspectos
importantes de solução de problema em geral. (1) Um organismo leva um conjunto de
respostas R j, R2 , R 3 ... para a situação, ou devido à sua história passada com situações
similares ou devido à sua estrutura geneticamente determinada. (2) Essas Rs não são
igualmente prováveis de ocorrerem; algumas (arranhar as bordas de orifícios, miar), têm
maior força do que outras (explorar o teto da caixa; ficar de pé, parada). (3). Uma vez
que uma determinada resposta seja bem sucedida em transformar a situação numa fami
liar, uma seqüência bem estabelecida pode levar o animal à situação reforçadora, Sg.
Thorndike, assim como outros antes dele, referiu-se aos dois primeiros aspectos
descritos como responder por tentativa e erro. O animal emite (“tenta”) muitas
respostas na situação problema, a maioria delas consistindo de “erros”. Eventualmente,
a R “correta” ocorre, ao acaso, e o animal atinge o “sucesso”. Kohler (1925) criticou
- 313 -
esta caracterização da solução de problema. Ele argumentou que a situação de
Thorndike não era represencativa de problemas em geral. Os gatos, dizia Kohler, não
podiam, logo no início, observar a relação entre a tramela e a caixa aberta. Mas muitos
problemas reais, argumentou, permitem ao organismo observar mais aspectos e relações
na situação do que no caso dessses gatos. Assim, Kohler estabeleceu o seguinte
problema para os animais (Fig. 14-1). Uma banana foi colocada do lado de fora da
gaiola do macaco. Havia duas varas de bambu dentro da gaiola, mas nenhuma delas era
bastante comprida para alcançar a banana. Uma vara, todavia, tinha um diâmetro
menor e podia ser facilmente inserida em qualquer das pontas da outra vara com
pondo, assim, uma única vara, bastante comprida para alcançar a banana. Os
macacos de Kohler, quando colocados nesta situação, apresentavam, inicialmente,
comportamentos que haviam sido reforçados no passado. Eles estendiam uma ou outra
vara, movendo-as para frente e para trás em direção à banana. Depois de certa
quantidade de extinção, esta resposta enfraquecia. Neste ponto, alguns animais
sentavam-se calmamente durante um certo tempo, após o que, de repente, encaixavam
as duas varas e puxavam a banana.
Sultão, antes de tudo, agacha-se indiferentemente na caixa colocada um pouco
atrás da grade. Então, ele se levanta, pega as duas varas, senta-se novamente na
caixa e brinca descuidadamente com elas. Ao fazer isso, acontece de se encon
trar segurando uma vara em cada mão de modo que elas ficam em linha reta. Ele
empurra a mais fina em direção à abertura da mais grossa, pula corre em direção
às grades... e começa a puxar a banana em sua direção com as duas varas
encaixadas (Kohler, 1925, p. 27).
Kohler chamou esta solução súbita de insight e sugeriu que isto era uma propriedade
típica da solução de problema. Ele afirmava que Sultão e outros sujeitos resolviam o
problema porque a estrutura do problema tornava-se clara imediatamente e não porque
o comportamento de encaixar as duas varas fosse um operante que predominasse na
situação. Birch (1945) todavia, demonstrou que uma certa história passada é crítica
para solucionar este tipo de problema. Kohler não especificou com detalhes a história
passada de seus macacos.
Birch resolveu pesquisar se a manipulação anterior da vara era essencial. Pegou um
grupo de macacos que nunca haviam tido experiências com varas e estabeleceu-lhes
contingências de um problema idêntico. Ao contrário dos resultados de Kohler,
nenhum desses sujeitos foi capaz de solucionar o problema numa sessão de 30 min.
Birch, então, realizou várias sessões em que permitia que os macacos brincassem com
pequenas varas. Ele observou que os animais passavam, gradualmente, a usar as varas
como extensões de seus braços para cutucar, espreitar, revolver, cavoucar e outras
operações similares. Num segundo teste, todos os animais resolveram o problema das
duas varas em menos de meio minuto. A conclusão é inevitável. A manipulação prévia
das varas é essencial para a solução de um problema que requer isto como uma
habilidade componente; a estrutura lógica da situação não ajudará um organismo
que não possua quaisquer habilidades para utilizar esta estrutura.
A natureza encadeada dos comportamentos componentes que constituem a
solução de um problema nos ajuda a explicar a característica súbita das soluções
observadas por Kohler, e outros. Uma vez que o organismo tenha produzido uma
-3 1 4 -
situação que é uma deixa para uma seqüência bem estabelecida de corpporamento, o
problema termina. Uma vez que Sultão havia transformado aquelas duas varas
pequenas numa mais longa, o problema chegou a um fim, o que nos permite supor,
razoavelmente, que Sultão possuía uma história anterior de cutucar objetos com varas
de vários tamanhos.
14.2 QUEBRA-CABEÇAS
P ara estudar a solução de problemas em sujeitos humanos, os psicologos atribuem

uma variedade de tarefas aos seus sujeitos. Algumas delas são os quebra-cabeças. Um
quebra-cabeça muito conhecido é visto na Fig. 14-2. 0 sujeito é instruído a unir os
nove pontos com quatro linhas retas sem tirar o lápis do papel e sem retraçar uma
linha. As linhas podem se cruzar, se necessário. A maioria dos sujeitos tenta resolver o
problema com um grupo de operantes de conectar os pontos, traçando as linhas na
Figura 14-2. O quebra-cabeça dos nove pontos

periferia. Essa seqüência falha, todavia, e outra resposta emerge com alta força -
traçado de uma diagonal. Esse novo comportamento é de pouca ajuda, já que a
diagonal mais as três linhas periféricas deixam ainda um ponto isolado. Muito rapi
damente, então, o sujeito exaure seu repertório usual para lidar com tais “ problemas”
e, neste ponto, ele concordará que aquilo é realmente um quebra-cabeça. Uma solução
para o problema dos nove pontos consiste dos prolongamentos de linhas além dos limites
da matriz do ponto (veja o apêndice deste capítulo).
O fato de esta solução simples requerer algum tempo e, frequentemente, não ser
de todo alcançada, mostra um aspecto importante dos quebra-cabeças. Muitos pro
blemas ou quebra-cabeças são difíceis de serem resolvidos porque eles tendem a
controlar respostas muito fortes mas inapropriadas. Os quebra-cabeças, frequen
temente, parecem-se com situações passadas em que certas respostas eram adequadas e
reforçadas. O problema dos nove pontos por exemplo, é muito semelhante a uma
situação que contem apenas oito pontos (imagine que o ponto central da Fig. 14-2
não existe) e que poderia ser facilmente “resolvida” , traçando-se quatro linhas na
periferia. A emissão repetida de comportamento inadequado numa situação problema é
comumente chamado disposição, usado no sentido em que dizemos que alguém está
- 315-
Tabela 14-1
OS PROBLEMAS DA JARPA DE ÁGUA (LUCHINS 1942)
CAPACIDADES DAS JARRAS
NÚMERO DO PROBLEMA A B C QUANTIDADE REOUERIDA
1 29 3 _ 20
2 21 127 3 100
3 14 163 25 99
4 18 43 10 5
5 9 42 6 21
6 20 59 4 31
7 23 49 3 20
8 15 39 3 18
9 28 76 3 25
10 18 48 4 22
11 14 36 8 6
“ disposto a alguma coisa” . O restringir as respostas de traçar linhas à periferia da

matriz dos nove pontos é um exemplo de disposição. Muitos problemas podem ser
resolvidos apenas através de respostas não usuais, assim, é conveniente instruir as
pessoas que solucionam os problemas de um modo que sua variabilidade de compor
tamento aumente. É fácil demonstrar que a disposição está sob o controle da história
de reforçamento do organismo. Luchins (1942)' solicitou aos sujeitos que solucio
nassem uma série de problemas numéricos que requeriam a mensuração da quantidade
de água através de várias jarras de medidas. A Tabela 14-1 mostra 11 desses problemas.
O problema 1 foi um exemplo introdutório. Mostrou-se ao sujeito que, para obter 20
unidades de água (o valor da coluna mais à direita), ele teria que encher a jarra de 29
unidades e derramar 3 unidades, 3 vezes. O sujeito, então, trabalhava nos outros dez
problemas. Note que (excluindo o exemplo introdutório) todos os problemas, exceto o
número 9, estão de acordo com a regra B menos A menos 2 C: encha primeiro, a jarra
maior, B; então, derrame 1 jarra A e 2 jarras C. Os problemas de 7 a 11, todavia, têm
uma solução alternativa usando apenas duas jarras, o que pode ser interpretado como
uma cadeia mais simples de comportamento. Contudo, sujeitos do primeiro ano
primário até ao nível de pós-graduação raramente empregaram a solução das duas
jarras. Sua história de reforçamento nos problemas de 2 a 6 tornaram a seqüência de
três jarras forte o bastante para dominar todas as outras cadeias.
A noção de disposição aparece no célebre problemas dos dois cordões, visto na
Fig. 14-3. A situação inicial, S ^, consiste de dois cordões pendurados no teto de um
quarto praticamente vazio. A situação reforçadora terminal, Sb , consiste das duas
pontas dos dois cordões amarradas uma à outra. Todavia, a distancia entre os dois
cordões é muito grande para que o sujeito alcance um deles enquanto segura a ponta
do outro. Numa versão do problema, o único objeto a mais, presente na situação
experimental era um relé magnético. A solução do problema é mostrada na Fig. 144.
-3 1 6 -
O sujeito amarrou o relé ao cordão e colocou-o em movimento, como um pêndulo.
Assim, ele poderia pegar o cordão em movimento, enquanto segurava o outro, e as
duas pontas podiam ser facilmente amarradas. Os sujeitos que tiveram uma sessão
anterior em que foram instruídos a usarem o relé
Figura 14-3. O problema dos dois cordões. Os dois cordões devem ser amarrados um
ao outro, embora estejam muito afastados para se segurar um enquanto se pega o
outro.
Figura 14-4. Uma solução para o problema dos cinco cordões. O Sujeito amarrou o
relé a um cordão e colocou em movimento.
como um componente de um circuito elétrico mostraram-se muito deficientes na

solução deste problema (Birch e Rabinowitz, 1951)- Novamente aqui, uma certa
história passada (usar o componente elétrico como um componente elétrico) impediu
os comportamentos necessários para a solução do problema (usar o compoennte
elétrico como um peso).
Como um exemplo final, considere os problemas dos palitos de fósforo da Fig.
14-5. Os problemas dos palitos de fósforo ilustram um aspecto comum a muitos
- 317 -
(A) (B) (C) (D) (E)
L L _
LLLI
LL! LU ___U LLUU II II
LI LU LULU U LU
Figura 14-5. Os problemas dos palitos de fósforo de Katona (1940). Em A - C mova
três palitos e produza uma nova figura que tenha um quadrado a menos que a
figura original. Em D, produza uma nova figura com apenas cinco quadrados, movendo
tres palitos. Em E, mova dois palitos e produza uma figura com quatro quadrados.
(Ver as soluções no apêndice deste capítulo)’
problemas, a saber, a solução a ser alcançada é especificada apenas de uma forma

geral.A legenda da Fig. 14-5 diz quais as propriedades gerais que a solução deve ter
mas não expecificada, em detalhes, a situação terminal, S3 . Com exceção do problema
dos nove pontos, nossos problemas e quebra-cabeças anteriores especificavam a si
tuação reforçadora exata, Sb, em vez de sua estrutura geral. O macaco solucionava o
problema quando a banana estava na gaiola; 0 problema dos dois cordões era resolvido
quando os cordões eram amarrados. Mas os problemas dos palitos de fósforo são
solucionados apenas quando a contagem de quadrados é igual ao número requerido.
Para esses problemas, existem várias soluções aceitáveis, com muitas maneiras para se
chegar até elas. (Veja 0 apêndice deste capítulo).
143 ESTRATÉGIAS DE PROCURA DE HEURÍSTICAS
A nossa caracterização geral de problemas enfatizou sua natureza encadeada ou

composta. Mas a análise da maioria das amostras de problemas das seções anteriores
não requer um encademaento detalhado. Ampliemos portanto, o conceito de um
“problema” . Consideremos o cadeado de segredo da Fig. 14-6. A maioria dos cadeados
de segredo deste tipo têm 50 ou 100 posições discretas, mas 5 serão suficientes para a
nossa ilustração. Pode-se dizer que um homem para quem tal cadeado barra a entrada
para alguma situação reforçadora está diante de um problema se ele não tem a
seqüência dc comportamentos à disposição para abrir o cadeado. Por outro lado,
pode-se executar um algoritmo sistemático (ver seção 1 2 .8 ) para abrir o cadeado tente
Figura 14-6. Um cadeado de segredo de cinco posições.
-3 1 8 -
cada combinação até você ser bem sucedido. Esta, provavelmente, é a noção de
comportamento de tentativa e erro que Kohler e outros psicólogos atribuíram a
Thorndike ao criticarem sua análise da solução de problema pela falta dos elementus
para uma solução estruturada. Contudo, Thorndike nunca relatou que os gatos se
empenhavam em todos os comportamentos possíveis em todas as seqüências possíveis.
De fato, os gatos restringiam sua atenção aos orifícios e partes moveis da caixa
quebra-cabeça, apresentando um conjunto altamente seletivo de comportamentos. Mas
um problema de um cadeado de segredo ilustra um responder mais puro por tentativa
e erro. Assim, um cadeado de 50 números, que se abre quando a seqüência correta de
3 números é girada, exigirá 50^/2 (= 62,500) seqüências a serem tentadas, em média,
antes de se abrir. Se cada seqüência dura 6 seg, o tempo médio para abrir este cadeado
será de 4 dias detrabalho contínuo. É óbvio porque tal cadeado serve como uma
proteção, mesmo embora quase todas as pessoas tenham uma cadeia algorítmica
apropriada forte que, eventualmente, poderia abrí-lo.
Uma estrutura em árvore é uma maneira conveniente de representar as seqüências
de comportamento nesse tipo de problema (Fig. 14-7),. Os círculos ou nódulos numa
Situação original, SA
Sigura 14-7. Uma estrutura em árvore representando alguns dos comportamentos e

situações resultantes que surgem do girar os números do cadeado da Fig. 14-6. O
“ segredo” (3,5,4) é visto como linhas pontilhadas que ligam os círculos cheios. Por
questão de espaço, apenas algumas das ramificações do terceiro nível (inferior) são
mostradas.
estrutura em árvore representam as situações que podem ser produzidas pelas várias
respostas disponíveis para o organismo. Assim, o nódulo superior é a situação original,
onde nenhum número foi ainda girado. Os 5 primeiros números possíveis são vistos
como nódulos no nível imediatamente inferior. Analogamente, os 25 nódulos no
próximo nível representam o conjunto de situações que resulta do girar ainda um
outro número. As possibilidades no nível inferior, resultantes do girar um terceiro
número, são tantas (125) que podemos representar convenientemente apenas uma
amostra destas no diagrama. Na árvore da Fig. 14-7, as linhas representam as respostas
operantes de girar. A estrutura nos proporciona uma maneira de representar as
situações possíveis que podem surgir quando todas as respostas disponíveis em um
problema são especificadas e todas as suas conseqüências resultantes conhecidas.
Examinando a Fig. 14-7, fica claro que um homem que deseja abrir este cadeado terá
que percorrer muitas ramificações até que ocasionalmente, acerte.
- 319 -
Muitos outros problemas podem ser representados na torma de uma árvore de
seqüências operantes e suas situações resultantes. Se um simples cadeado de 5 números
pode levar a tantas ramificações possíveis (125), como será que um indivíduo sempre
resolve problemas realmente difíceis tal como descobrir uma boa jogada no xadrez,
integrar uma função, provar um teorema da lógica? As situações possíveis que
resultam de apenas doze tipos distintos de respostas conduzidos a um nível de
seqüência igual a 12 é 1212 Evidentemente, a tentativa e erro simplesmente não
seriam suficientes para solucionar um problema de qualquer dificuldade.
Suponha que houvesse alguma maneira da pessoa que soluciona o problema limitar
suas operações alternativas. Isto é, suponha que se dissesse ao indivíduo .que o primeiro
número no tipo de cadeado da Fig. 14.6 comumente é 3. Em geral, os problemas que
são solúveis têm associadas a eles várias regras ou heurísticas que permitem que o
organismo restrinja sua topografia de resposta a certos grupos de operações. Essas
heurísticas são geralmente caracterizadas como regras práticas que ajudam a limitar a
seqüência de comportamento. Ao contrário de um algoritmo, seu emprego não garante
uma solução, mas frequentemente ajudam a encontrá-la. Podemos supor que os gatos
de Thorndike exibissem tais heurísticas quando limitavam sua atenção aos orifícios e
partes móveis da caixa quebra-cabeça. No passado, estas respostas compensavam com
maior freqüência do que outros comportamentos. Uma heurística possível para o
problema do cadeado de segredo pode ser a observação de que, algumas vezes, as
pessoas fecham um cadeado e deixam o último número da combinação na posição.
Isto não é sempre verdadeiro, mas pode servir como uma heurística útil. Nos pro
blemas complexos, é conveniente diagnosticar se está ocorrendo um retrocesso ou um
progresso em direção à solução. Isto é, se se está “ ficando quente” . À medida que
retrocedemos de é frequentemente possível interpretarmos as situações interme
diárias (nódulos) como mais próximas ou mais distantes da situação terminal, Sg-
Suponha que coloquemos um homem com os olhos vendados numa sala grande e
digamos-lhe que sua tarefa é atirar um dardo na mosca çlo alvo. A localização da caixa
de dardos e o alvo não lhe é conhecida. Permitimos ao nosso sujeito duas respostas,
caminhar e atirar os dardos. Concordamos em avisá-lo, todavia, depois de cada passo
que ele dá, se ou não está chegando mais perto da caixa de dardos. Além disso, uma
vez que ele chegue até a caixa e comece a atirar os dardos, avisá-lo-emos se os seus
lançamentos estão próximos ou distantes do alvo. Isto é uma versão do brinquedo de
chicote-queimado (“ você está ficando mais quente”) e se o nosso alvo não fôr muito
pequeno, o nosso sujeito solucionará este problema rapidamente. Mas, é óbvio que um
homem que não receba os S^s progressivos (“ avisos”) ao longo do caminho poderá
nunca solucionar o problema.
Em geral, uma análise da solução de problema tem a forma de (1) notar as
heurísticas apropriadas que restringem a topografia da resposta a serem usadas e as
situações que valem a pena ser exploradas; (2 ) notar as discriminações intra-problema
importantes que devem ser feitas para que se possa detectar se uma resposta colocou o
organismo mais perto ou mais longe da situação terminal.
Se estes são realmente os componentes críticos do comportamento de solução de
problema, deve ser possível incorporá-los na estrutura de uma máquina que poderia,
então, resolver problemas semelhantes. O comportamento desta máquina pode ser de
interesse por várias razões. Primeiro, ela poderia verificar a suficiência do conjunto de
heurísticas e discriminações que podemos supor como necessárias para qualquer con-
- 320 -
junto determinado de problemas. Segundo, variando as jcaractensticas da maquina
poderemos descobrir um meio de desenvolver um solucionador de problemas mais
eficiente c, então, aplicar essas descobertas à prática educacional. Devido à sua rapidez
de operação (25.000 ou mais operações por seg), o computador digital é ideal para
explorar esses modelos de solução de problemas. As representações das situações
podem ser programadas, várias operações correspondentes às respostas do organismo
podem ser simuladas e uma estratégia para transformar sucessivamente uma situação
em outra pode ser construída na máquina. Newell e Simon (1963) descreveram um
programa dc computador chamado General Problem Solver (GPS) para tratar com
certos quebra-cabeças e problemas. O programa emprega uma variedade de estratégias
de procura heurística e testes de discriminação para avaliar se as situações recém-
criadas representam um progresso em direção à situação terminal, S b -
Um dos seus problemas é o domínio da lógica simbólica. Pode-se pedir à máquina
que prove que (Rl>\P). ( ^ .R ^ Q ) é equivalente aO; ,(^ Q.P). Dá-se à máquina a
mesma informação que um universitário possui, a saber, uma dúzia de regras para
transformar os símbolos através da adição de termos, supressão de termos, mudanças
das conexões, dos sinais, dos grupos, e assim por diante. O programa que torna o
computador um solucionador de problemas proporciona-lhe a habilidade de aplicar
essas regras (responder) e discriminar as diferenças entre as situações que ela produz. E
o mais importante, talvez, o programa proporciona-lhe um número de heurísticas para
dirigir sua procura através da árvore do problema. Uma heurística conveniente restringe
o GPS de tentar transformar uma situação (nódulo) se esta fòr mais difícil de
transformar do que uma situação anterior (nódulo). O GPS constrói os seus próprios
critérios de dificuldade de transformação. O GPS espera que as diferenças entre as suas
situações sucessivamente geradas, S j, S 2 , S3 e a situação terminal, S[$, diminua á
medida que prossegue trabalhando através de suas séries de transformações. Se isto não
acontecer, o GPS volta a um nível superior (em direção à S \ ) e percorre uma nova
ramificação. Outra heurística força o GPS a abandonar uma ramificação quando esta
vai abaixo dc uma determinada profundidade (a diminuição vertical na Fig. 14-7) e a
situação Sb ainda não apareceu. O GPS parece resolver seus problemas tão bem quanto
estudantes universitários e, talvez mais importante, frequentemente incorre nos
mesmos tipos de erro. Outros programas para solucionar demonstrações geométricas,
jogar xadrez c damas, integrar c estabilizar linha de montagem tem sido projetados,
todos empregando as idéias de estratégias de procura dc heurística.
14.4 IDENTIFICAÇÃO DO CONCEITO
Quando um indivíduo adquiriu um conjunto dc conceitos pelos métodos do

Capítulo 13, a sua habilidade em induzir ou identificar qualquer conceito particular
através da inspeção de apenas alguns membros S^ do conceito pode ser de interesse.
Apesar de certas semelhanças dc procedimento entre a aquisição de conceitos e a
identificação de conceito, o último é mais propriamente tratado no contexto da
solução de problema. Na identificação de conceito, temos um sujeito que já adquiriu
todos os conceitos empregados no experimento. O processo de aquisição de conceito
está bem sedimentado. Suponha que mostremos a um sujeito uma figura de um
pássaro, um avião e um balão e pedimos-lhe que “ identifique” (nomeie) o "conceito”
(a classe de So) que eles exemplificam. O sujeito adquiriu há muito tempo atrás o
- 321 -
conceito dc fc‘objeto voador” através de uma história de discriminação com lais
objetos.Agora, sua tarefa é simplesmente apresentar o comportamento verbal ad
quirido, dando o nome k4objeto voador” . Em geral, a tarefa do sujeito na identificação
dc conceito consiste cm examinar um número de situações e induzir o conceito delas
(isto ó, propor uma regra geral para a classe de S^). Ele é informado, para cada
situação, se esta é ou não um caso da classe de desconhecida. Nesta tarefa,
tipicamente o sujeito emprega estratégias, ou seqüências sistemãticas de respostas,
que levam à identificação correta.
Bruner, (ioodnow e Austin (1956) apresentaram os 81 cartões vistos na Fig. 14-8

aos seus sujeitos. Esses cartões variavam de quatro maneiras; (1) o número de figuras
(1, 2 ou 3 );(2) a cor das figuras (vermelha, verde ou preta); (3) a forma das figuras
(... cru/, círculo ou quadrado ) c, (4) o número de linhas periféricas (1, 2 ou 3).
Primeiro, mostrava-se ao sujeito um determinado cartão (digamos, aquele com três
círculos vermelhos c duas 1in lias periféricas, 30V2p) e dizia-se-lhe que esse era um caso
positivo de um conceito que ele deveria identificar. O sujeito era, então, avisado dc
que poderia escolher cartões adicionais entre os 80 restantes para obter informações.
Depois dc cada escolha, ele era avisado se o cartão particular que escolhera era ou não
\j ê J
OO OO □ □ 5 ± l
o o o ooo □□□
□
□ [
o o
FIH
fc>oo] o o o >□□□ ••• 1 pm aj
o
I ° I Dl FI ■Ti 2 J E I a JI
□□ i
llllll
01
o o o o
fp<x>l l 0 0 ° l !□□□ l - l Ml
Figura 14-8. Um conjunto de cartões usados para estudar a identif icação de conceito.
As formas variam em (1) número, (2) forma, (3) cor, e (4) número de linhas
periféricas (Bruner, Goodnow e Austin, 1956).
um caso do conceito. Quando a tarefa consistia de identificar conceitos conjuntivos

(círculos vermelhos, duas figuras verdes, etc.), a maioria dos sujeitos adotou uma
estratégia que consistia em escolher cartões que variavam em uma e somente uma
dimensão do cartão positivo inicial conhecido. Dessa maneira, cada seleção eliminava
um ou mais conceitos. Um exemplo dos tipos de seqüências de éscolha usando essa
estratégia seria o seguinte:
- 322-
30V2p (+) o exemplo inicial positivo dado
20V2p (+) primeira escolha: elimine “três” figuras como um
elemento relevante.
3 QVerde2 p (—) segunda escolha: retenha o “vermelho” como um
elemento relevante.
3±V2p (—) terceira escolha: retenha o “circulo” como um
elemento relevante.
30Vlp (+) quarta escolha: elimine “duas linhas periféricas”
como um elemento relevante.
Logo: o conceito é “ círculos vermelhos” .
Bruner, Goodnow e Austin demonstraram que um número de variáveis, tal como o
tipo do conceito a ser identificado, a maneira em que os 81 cartões eram expostos e o
número de exemplos que se permitia aos sujeitos escolherem, afetava o tipo de
estratégia sistemática empregada.
14.5 A MENSURAÇÃO DE HABILIDADES PARA SOLUCIONAR PROBLEMA:
TESTES DE INTELIGÊNCIA
Talvez, nenhuma palavra seja tão mística em toda a psicologia quanto “inteli
gência” . É uma palavra que todos empregam mas dificilmente definem. Desde 1905, os
psicólogos mantêm a curiosa “ posição de preparar e defender os testes de inteligência
e, então, negar sua responsabilidade por eles, dizendo que “ ninguém sabe o que a
palavra realmente significa ” (Wechsler, 1958). Veremos que a solução de problema
proporciona um veículo conveniente para tratar o tópico inteligência. Em todos os
testes que se propõem a medir a inteligência, veremos apenas uma série de problemas
proposta a um sujeito e várias medidas do seu desempenho registradas.
A idéia de um teste de inteligência, ou como preferirmos chamá-lo, um teste de
solução de problçma, suigiu originalmente de considerações puramente práticas. Em
1904, o psicólogo francês Alfred Binet foi encarregado de preparar um teste que
apontasse aquelas crianças cujas deficiências em solucionar problemas tornava im
provável que elas pudessem tirar proveito da instrução regular da escola. O testes
resultante de Binet era uma série de problemas com gravuras, blocos de madeira,
tabuleiros, etc., próprios para serem administrados a uma criança de cada vez. Este foi
o primeiro teste de inteligência que obteve sucesso. Durante a Primeira Guerra Mundial,
surgiu uma necessidade premente nos Estados Unidos de avaliar as habilidades para
solucionar problemas de vários milhões de convocados o mais rápido possível. Testes
de lápis e papel que poderiam ser administrados, simultaneamente, a um grupo de
recrutas foram desenvolvidos para suprir essa necessidade e foram aplicados na seleção
de homens para várias tarefas. Com o tempo, estes testes de grupo passaram a ser
universalmente empregados. Muitas escolas, atualmente, usam seus resultados para
selecionar estudantes. Universidades e escolas de pós-graduação confiam enormemente
nos seus escores para decisões sobre admissão. Nossa preocupação, todavia, não é com
a aplicação prática de tais testes. Desejamos, em vez disso, averiguar certas con
tribuições que os testes de inteligência têm fornecido à nossa análise dos compor
tamentos humanos de solucionar problema.
Qual é a natureza dos problemas usados nos testes de “inteligência”? Não há
melhor maneira de descrevê-los do que através de exemplo. No teste típico, aparece
um número de subtestes destinados a avaliar várias habilidades para solucionar
- 323-
Se X vem antes
/ 2 /s a/ / / (“ ba (“ bhJ S_B_ de U no alfabeto,

marque oA abaixo
/ Qual bandeira é igual à da esquerda? Caso contrário,
/ marque o B
/
/
ixioiyioioixioioioi i i ii ii r n
Quantos blocos B
existem? Complete a série tie Sx e Os
L
Copie esta figura
Ache o caminho da saída começando
Marque o grupo de letras diferente
pelo circu'o
CCZO AC BC SC LC RC MA
Se quatro IáF:s «ustam 50

centavos, quantos você compraria
com 1 cruzeiro?________ INICIO h
1 i L
□ □ ffl H B ffl
XL
esta para Assim como esta para.
Figura 14-9. Amostras de itens do tipo usado nos testes grupais de lápis e papel para
habilidades dc solucionar problemas (Kimble e (.arme/y, 1963 ).
p r o D l c m a . Uma amostra de um conjunto de itens é apresentada na Fig. 14*9. Os itens

da Fig. 14-9 testam uma variedade de habilidades. Alguns problemas baseiam-se
principalmente em habilidades de linguagem, outros em habilidades discriminativas e
perceptivas. A maior parte procura empregar itens que testem habilidades gerais para
solucionar problema e a habilidade para aplicar conceitos amplos e disposição para
aprender. Esse ideal, todavia, nunca c completamente realizado.
Os escores obtidos com testes de solução de problema deste tipo nos dizem algo
sobre as habilidades relativas para solucionar problema de indivíduos num determinado
grupo cultural. No restante desta seção (1) examinaremos algumas cias variáveis a que os
escores têm sido relacionados, e (2) faremos uma análise mais detalhada dos próprios
escores.
Um dos resultados melhor documentado é a função que relaciona os escores de
solução de problema à idade do sujeito. Curvas típicas que ilustram a relação básica
em cinco sujeitos que foram testados e re-testados em várias idades são vistas na Fig.
14-10. Os cinco indivíduos bastante diferentes da Fig. 14-10 continuaram a progredir
em suas habilidades para solucionar problemas no decorrer de um período de 25 anos.
Por volta dos 25 anos, a taxa de aumento na habilidade de solucionar problema
começa a diminuir para alguns sujeitos, mas não todos. A população em geral mostra
uma queda aguda antes dos treze anos e apenas um ligeiro acréscimo na habilidade de
solucionar problema entre os 20 e 50 anos.
Suponha que desejemos relacionar o escore de solução de problema de um
indivíduo com o escore de pessoas da sua idade. Para isto, é necessário administrarmos
um determinado teste para muitos indivíduos da mesma idade. Uma vez tenhamos os
- 324-
escores do grupo, podemos comparar os escore^ de qualquer indivíduo com aqueles
dos outros no grupo. Um aspecto interessante ^destes escores de teste é que eles se
apresentam aproximadamente com uma distribuição normal.
Idade (anos)
I•igurn 14-10. Habilidade para solucionar provlcina cm tun^ão da idade( Baylcy,

1955 ).
Isto é, se testarmos bastante indivíduos, as frequências relativas em que os vários

escores possíveis ocorrem podem ser descritas pela curva em forma de sino da parte
superior da Fig. 14-11. Nas seções 2.6 e 10.9, vimos que existe uma relação íntima
entre o desvio padrão e a percentagem de medidas que caem nas várias regiões da
curva normal. Fssa relação permite-nos estabelecer a escala de percentil vista logo
abaixo da curva. Se, por exemplo, olharmos detalhadamente a Fig. 14-11, veremos que
o ponto +2 O em relação à média corresponde ao percent il 98. Um escore no
percentil 98 indica que apenas 2% dos escores são maiores do que seu valor. Simi
larmente, o ponto +1 c está no percentil 84, a média no percentil 50, e assim por
diante.
Um método ainda mais comum de expressar a habilidade relativa de solucionar
problema é encontrar um “Quociente dc Inteligência” , definida como
escore obtido na solução de problema
01 - 100------------------;--------------------------------------
escore médio na solução de problema
O escore do indivíduo é o numerador deste quociente. O denominador do quociente é

o escore médio na solução de problema do grupo de indivíduos da mesm* idade. (Os
escores de crianças são geralmente comparados com os de outras crianças da mesma
idade; os escores de adultos são usualmente comparados com os de outros adultos sem
levar em conta a idade, na suposição de que a habilidade média de solucionar
problema varia muito pouco depois dos vinte anos). Se o escore de um indivíduo é o
mesmo que a média do grupo, então, o numerador é = ao denominador e o QI
calculado é 100. A relação entre o índice de 01 e a faixa de percentil é vista na Fig.
14-11. O desvio padrão do índice de QI é cerca de 16 pontos de QJ. Assim, um
indivíduo cujo QI é calculado como 1 16 está cerca de 16 acima da média do seu
grupo de idade e, portanto, encontra-se no percentil 84. Apenas 16 por cento dos
indivíduos do seu grupo de idade terão um escore mais alto.
Percent is (cent is)

■
I.. . . I ,. ..I . . . . I,... I . . .. I.. . mi n, i l i M, 111.il ni .lii iili
60 70 80 90 100 110 120 130 140
Quocientes de inteligência
Figura 14-1 1. Relações entre escores de solução de problema, percentis e o índice de

QI (segundo Cronbaeh, 1963).
Muitos pesquisadores têm criticado a derivação, e o uso subsequente de um único

número como o QI, do desempenho em problemas com o aqueles da Fig. 14-9. Dois
indivíduos podem obter escores de QI idênticos de 116 (digamos) apesar de suas
habilidades de solucionar problemas poderem ser radicalmente diferentes. Para ilustrar,
fazendo-se referência à Fig. 14-9, um sujeito pode solucionar os problemas dos blocos
ocultos com um alto grau de proficiência, mas se sair muito mal nos problemas que
requerem a completação da série de letras. O outro indivíduo pode apresentar um
repertório inverso habilidades superiores para a série de letras combinadas com pouca
habilidade para solucionar os problemas de relações espaciais. Mas, ao somar os escores
de ambos os testes obtemos o mesmo total para os dois indivíduos. Uma grande parte
de resistência a uma análise mais refinada do desempenho em diferentes tipos de
problemas, provavelmente, é devida à noção histórica de que “ Inteligência” representa
uma capacidade fixa do organismo para solucionar problemas de todos os tipos. Não
há uma evidência total, mas estudos recentes indicam que a habilidade de um
indivíduo para solucionar problemas é melhor representada como um grupo de habi
lidades de solucionar problemas. Thurstone (1945) sugeriu o que ele chama uma
análise de perfil (ver Fig. 14-12). As habilidades de um indivíduo para solucionar
problemas são caracterizadas com o sendo constituídas das oito habilidades básicas
vistas na parte superior ua Fig. 14-12. Esse perfil fornece muito mais informações
sobre as habilidades de um indivíduo para solucionar problemas que qualquer escore
de QI, mas a análise pode ser ainda insuficiente. Alguns pesquisadores, atualmente,
sugerem que 120, em vez de 8 habilidades básicas para solucionar problemas, podem
- 326-
Percentual Ver- Numé- Abs- Fspa- Mecá- 1 scri- Sole- Scntcn-
bal rica trata ciai | nica ta tração ças
1 1 1 h 1111111
90
75
60
50
40
25 ■
10
17 60 «0 76 91 55 15 16
Percentil
Figura 14-12. Um perfil típico das habilidades de um indivíduo hipotético para

solucionar problema. (Bennett, Seashore e Wesman, 1951).
ser necessárias para descrever o desempenho de um indivíduo satisfatoriamente. Com

um número tão grande como 120, podemos bem indagar em que sentido a palavra
“básico” pode ser aplicada.
O contexto em que os lestes de inteligência se desenvolveram raramente levou os

pesquisadores a procurar maneiras de modificar os comportamentos de solucionai
problema que eles iso!aram. Todavia, é bem conhecido que a “preparação” ou o treino
das habilidades especiais que fazem parte dos problemas de Ql, pode aumentar os
escores significativamente. Se a fig. 14-10 é examinada cuidadosamente, veremos que
a idade em que o aumento na habilidade de solucionar problema começa a diminuir
coincide precisamente com a época em que muitos indivíduos terminam o seu treino
escolar íormal. Mas embora a educação formal contribua enormemente para o au
mento na habilidade geral de solucionar problema com a idade, não se fez ainda uma
tentativa ampla de “modelar” habilidades de solucionar problema do tipo avaliado nos
testes de QL Parece que, se estas habilidades são básicas em qualquer sentido, um
programa sistemático, iniciado na tema idade, para modelá-las através das técnicas
discutidas nos capítulos anteriores seria conveniente.
14.6 CORRELAÇÃO, TESTE DL CONFIABILIDADE F VALIDADE
Em várias partes ao longo deste texto, o termo “correlação” foi empregado no

sentido de “relação” . Foi dito que os reflexos de correlações entre eliciadores e
- 327 -
respondentes; que o reforçamento está correlacionado com a ocorrência de um operan
te especificado. 0 sentido dado ao te mio foi o de relação ou dependência. A
contração pupilar está estritamente relacionada à (depende de) (lashes de luz; a
liberação de alimento está estritamente relacionada ao (depende de) bicar a chave. Em
geral, quando uma variável é dependente de outra, pode-se dizer que ela está correla
cionada com esta; o contrário, como veremos, não é necessariamente verdadeiro. Na
descrição mais completa de relações ou correlações particulares entre duas variáveis,
somos, tipicamente, levados à representação gráfica. As correlações que constituem as
leis do reflexo são descritas pelas funções que relacionam as propriedades do eliciador
às propriedades do respondente. As correlações que constituem as leis do fortaleci
mento operante tomam a forma de uma curva da taxa de resposta em função do
tempo.
Quando falamos de duas variáveis que são correlacionadas, é importante separar as
noções de como e quanto elas estão correlacionadas. Perguntar sobre como duas
variáveis estão correlacionadas é indagar sobre a forma da relação entre elas. A medida
em que uma variável aumenta, a outra aumenta, diminui, ou permanece inalterada? A
relação é melhor representada por uma linha reta, uma curva simples ou uma curva
complexa com depressões e picos? As páginas anteriores podem ser consultadas, pois
contêm amostras de uma larga variedade de formas.
Perguntar sobre o quanto duas variáveis estão correlacionadas é indagar sobre a
precisão com que somos capazes de predizer o valor de uma delas sabendo o valor da
outra. A resposta ao “quanto” é independente da resposta ao “como” . A forma de
relação poderia ser linear, curvilínea ou qualquer outra e, mesmo assim, a variabilidade
na medida poderia ser tão grande que pouco mais que uma predição grosseira poderia
ser efetuada. O contraste entre uma forma altamente definida e um grau baixo de
correlação eslá ilustrado nos dados hipotéticos da Fig. 14-13. Nove medidas de U
aparecem para cada valor de X na Fig. 14-13. Os valores médios dos Ys estão
conectados por uma linha reta. F^ evidente que X está diretamente relacionado a Y e a
forma da relação é indiscutivelmente linear. 0 grau de correlação é, todavia, baixo.
Onde o valor de X é 2, por exemplo, os valores de Y variam de menos de 1 a mais do
que 3. Fm geral, a previsão de Y a partir de X, na Fig. 14-13 é deficiente. Para
melhorar o grau de correlação na Fig. 14-13, os valores de Y par,, qualquer valor de X
deveriam estar mais próximos. Isto ê, os valores de Y teriam que ser muito menos
variáveis.
Nas várias relações gráficas, ou correlações, descritas nas páginas anteriores, a
variável no eixo horizontal é tipicamente uma variável independente (medida e mani
pulada), enquanto a variável no eixo vertical é tipicamente uma variável dependente
(medida, mas não diretamente manipulada). Ao tratar estas relações funcionais, dirigi
mos nossa atenção principalmente para a forma das correlações isto é, “ como” as
variáveis estão relacionadas. 0 grau de correlação, isto é, a habilidade preditiva ou o
“ quanto” as variaveis estão relacionadas., foi considerado ser alto devido ao controle
experimental cuidadoso, dispositivos precisos de mensuração, e assim por diante.
Algumas vezes, acontece que não há quaisquer manipulações experimentais dispo
níveis para se determinar como uma variável é influenciada por mudanças sistemáticas em
outra. Nesse caso, podemos ser forçados a basear-nos nas relações entre duas variáveis
dependentes. O grau de correlação entre as variáveis nestas relações entre duas variáveis
dependentes não pode ser tomado como certo. Nenhuma das variáveis está
328
X
Figura 14-1 3. Relação linear hipotética entre duas variáveis.
sob o controle experimental direto e, já que somos, frequentemente, incapazes de

controlar influências que podem afetar uma ou outra de maneiras complexas, muito
mais variabilidade nos dados deve ser esperada. Tivemos pouca ocasião para discutira
relação entre duas variáveis dependentes neste texto, mas sua avaliação é um empreen
dimento comum, frequentemente, com importância prática. Os escores que um indi
víduo obtém num teste padronizado de lápis e papel de solução de problema e sua
taxa de progresso como uma pessoa que está sendo treinada para uma tarefa são
ambos variáveis dependentes do desempenho. Mesmo assim, se as duas variáveis são
altamente correlacionadas, as predições sobre uma delas podem ser feitas conhecendo-
se o valor da outra.
O grau de correlação entre duas variáveis dependentes pode variar de muito baixo
- onde conhecer o valor de uma é de pouca ajuda para prever o da outra - a muito
alto - onde sabendo-se o valor de uma torna possível predizer com precisão qual será o
valor da outra. Entre estes extremos encontram-se todos os graus de correlações
intermediárias. Por exemplo, há algum grau de correlação entre altura e peso (ambas
variáveis dependentes); pessoas altas tendem a pesar mais do que pessoas baixas. Mas o
grau de correlação está longe de ser perfeito, desde que se pode prever apenas
aproximadamente o peso de um homem a partir de sua altura. Os estatísticos
desenvolveram um índice numérico, ou coeficiente, para indicar o grau de correlação.
O coeficiente vai de -1 até + 1 , passando pelo zero. Mais 1 representa o caso onde
duas variáveis estão diretamente relacionadas e pode-se prever perfeitamente uma delas
a partir da outra. Valores altos de uma acompanham valores altos da outra, valore:
intermediários acompanham valores intermediários e assim por diante. Menos 1 íe-
presenta o caso onde as duas variáveis estão inversamente relacionadas e perfeitamente
previsíveis. Valores altos de uma acompanham valores baixos da outra e vice-versa.
Uma correlação igual a 0 representa uma relação aleatória entre duas variáveis;
conhecer o valor de uma não é de ajuda alguma para predizer o valor da outra.
329
Coeficientes intermediámos representam graus intermediários de previsibilidade. A Fig.
14-14 indica graficamente os tipos de íelações que estão associadas aos vários valores
do coeficiente de correlação. Nosso X e Y poderiam ser quaisquer duas variáveis
dependentes relacionadas: por exemplo, escore no teste de lápis e papel (X) versus
realização no trabalho (Y ), ou altura (X) versus peso (Y).
Figura 14-14.
As correlações entre duas variáveis dependentes frequentemente apresentam pro

blemas de interpretação que estão ausentes quando a variável X de uma relação c uma
variável independente. Sabe-se que a habilidade de solucionar problema na criança, por
exemplo, está correlacionada com o comprimento do dedão do pé. A medida que a
criança cresce, sua capacidade de solucionai problemas aumenta ao mesmo tempo que
seus ossos estão aumentando de comprimento e, assim, os dois mostram uma correla
ção significante. Isto pode ajudar o estudante a ver que, embora a correlação moslre a
relação causai em alguns casos, ela não significa, necessariamente, que uma das duas
coisas correlacionadas causa a outra (Hebb, 1958, p. 237). Aqui existe uma terceira
variável independente, a idade do indivíduo, que é funcionalmente relacionada a ambas
as variáveis, acarretando, assim, uma correlação entre elas.
Duas correlações subordinam-se ao conceito e mensuração da inteligência. ( ! ) A
habilidade relativa de um indivíduo para solucionar um tipo particular de problema
numa ocasião correlaciona-se, até certo grau, com sua habilidade relativa para solu
cionar esse tipo de problema numa ocasião posterior. Não tosse por essa consistência
intra-classe na habilidade de solucionar problema, não haveria um conceito de inte
ligência. (2) A partir do quão bem um indivíduo resolve os problemas a, b, c n
podemos predizer como ele resolverá os problemas a \ b \ c’........ n \ Sem esta
consistência inter-classe na solução de problema não haveria uma medida da inte
ligência. Desde Binet, o tratamento prevalente da inteligência tem sido uma tentativa
contínua de melhorar o grau de correlação inter-classe através de seleções cada vez
melhores dos problemas a, b, c....... n. Isto é, os psicólogos têm se preocupado com o
estabelecimento de grupos padrões de problemas (a, b, c, n, chamados problemas
testes, ou testes de Ql) cuja correlação, com outros grupos de problemas ( a \ b \ c'......
n \ cormimente, a realização na escola, universidade ou no trabalho, ou mesmo outros
testes de 01) sein aim
A medida da intengencia, como todas as medidas, depende de dois requerimento:
a mais que, por meio de análise, vê-se que envolvem correlações. O primeiro requeri
mento estipula que os instrumentos de medida sejam confiáveis, isto é, que o seu uso
repetido proporcione resultados similares. Uma régua é confiável quando suas medidas
repetidas de uma mesa fornece resultados que concordam exatamente entre si. Simi
larmente. se um leste de solução de problema é um instrumento de medida confiável,
seu u>r repetido deve levai ao mesmo valor para a habilidade de solucionar problema
- 330 -
de um determinado indivíduo. O requisito confiabilidade é, com eteito, uma neces
sidade para um alto grau de correiação entre os resultados do teste em ocasiões
diferentes. Dada uma única medida, devemos ser capazes de predizer a próxima: ela
deverá ser aproximadamente a mesma. A confiabilidade depende, parcialmente, das
condições constantes de medida e, parcialmente, do próprio ato de medir que afeta
desprezívelmente o que está sendo medido. A confiabilidade de um teste de solucionar
problema é geralmente mais baixa do que a de uma régua porque muitas operações
podem facilmente ocorrer entre as medidas, m udando o desempenho de solução de
problema do indivíduo. Por exemplo, práticas demasiadas em vários problemas afetará
a concordância das medidas repetidas de 01. Além disso, o instrumento de medida
afeta dc algum modo, o que está sendo medido: a aplicação repetida de testes de QI
pode afetar os e s c o r e s - o sujeito torna-se “versado em teste” .
Um segundo requerimento imposto às medidas é que elas sejam úteis a qualquer
objetivo para o qual são feitas. A utilidade, no contexto de medida, é chamada
v a lid a d e . Se temos um piano na rua e queremos estar certos, antes de carregá-lo por
très lances dc escada, que ele passará através de uma certa porta, será melhor medir o
seu lado mais largo. Comparando esta medida com as dimensões da porta, seremos
capazes dc predizer se podemos entrar com o piano. Poderíamos fazer muitas outras
medidas do piano - poderíamos determinar o seu valor na praça ou pesá-lo - mas
nenhuma dessas medidas seria válida para os nossos objetivos presentes. Bias não
seriam convenientes para aquilo que pretendíamos fazer, no m omento, com o piano.
Segue-se, portanto, que elas não, seriam medidas válidas para o “ passar atlavés da
porta’1.
A validade é uma forma simulada de correlação pois, no exemplo que acabamos de

descrever, a largura do piano é a variável que está mais correlacionada com a
possibilidade dc passá-lo através da porta. O peso é menos correlacionado e, a menos
que, nos pianos, o valor na praça e o ta m anho sejam relacionados, o valor na praça,
provavelmente, terá uma relação aleatória (0) com esta possibilidade.
Algumas vezes, a validade pode assumir a forma de uma estimativa do grau dc
correlação entre uma dimensão da medida ( D j ) cuja utilidade já íoi bem estabelecida e
uma dimensão da medida (D 2 ) diferente c pior estabelecida. Este problema surge
frequentemente quando o método de medida existente envolve dificuldades práticas e
um segundo método mais simples e rápido é proposto. Se desejarmos medir uma
grande área de terra, veremos que é impraticável (mas, em princípio, possível) medir o
seu perím etro com uma régua. Em vez disso, adotamos um procedim ento de medida
totalmente diferente e mais rápido, usando equipamento ótico de medida. A
justificação para este m étodo é sua alta correlação com os resultados obtidos quando,
de fato, usavam-se réguas para conferir os valores medidos.
A validade exigida de um escore de teste de inteligência é desse tipo. Certas
dimensões de medida vigentes existem na forma do desempenho na escola, habilidades 110
trabalho, e assim por diante. Mas, frequentemente, é impraticável avaliar todas as
habilidades de solucionar problemas numa criança, ou medir, o repertório com pleto de
solucionai problema 110 trabalho num indivíduo. Poderíamos até desejar prever o
desempenho de um homem antes de ele assumir o trabalho. O teste de QI é proposto
como um dispositivo rápido de medida que procura medir os aspectos de uma dimensão
complexa da solução de problema de uma maneira mais simples, através de operações de
lápis e papel. O grau em que os testes de QI reaJizam isso é dado pelo grau de correlação
- 331 -
entre seus escores e o desempenho, no trabalho ou na sala de aula, pa solucionar
problema. Quanto mais alto o grau de correlação, maior a validade (utilidachdo escore
do lápis e papel.
APÊNDICE DO CAPITULO 14.
Figura 14-15. Solução do quebra-aibrça tios nove pontos.
(A) (B) (C) (D) (E)
LL U LLU JJJJ _IJ_ LLLL

U U LI Li LI LI LI IJ
Figura 14-16. Soluçòes para os problemas dos palitos de lòstoro.
Bayley, Nancy. On the growth of intelligence. Am er. Psychologist, 1955,

10, 805-818.
Bennett, G. K., Seashore, H. G., and Wesman, A. G. Counseling from
profile. A case book for the Differential Aptitude Tests. New York:
Psychological Corp., 1951.
Birch, H. G. The relation of previous experience to insightful problem
solving. J . comp. Psychol., 1945, 38, 367-383.
Birch, H. G., and Rabinowitz, H. S. The negative effect of previous
experience on productive thinking. J. exp. Psychol., 1951, 41, 121 —
125.
- 332 -
Bruner, J. S., Goodnow, Jacqueline J., and Austin, G. A. A study of
thinking. New Y ork: Wiley, 1956.
Cronbach, L. J. Educational psychology. New York: Harcourt, Brace
and World, 1963.
Hebb, D. O. A textbook of psychology. Philadelphia: Saunders, 1958.
Katona, G. Organizing and memorizing: studies in the psychology of
learning and teaching. New York: Columbia Univer. Press, 1940.
Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts,
1963.
Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd
ed.) New York: Ronald, 1963.
Kohler, W. The mentality of apes. New York: H arcourt, Brace, 1925.
Luchins, A. S. Mechanization in problem solving: The effect of Einstel-
lung. Psychol. Monogr., 1942, 54, No. 248.
Newell, A., and Simon, H. GPS, a program that simulates human thought.
In E. A. Feigenbaum and J. Feldman (E d s.), Computers and
thought, New York: McGraw-Hill, 1963, pp. 279-293.
Thurstone, L. L. Testing intelligence and aptitudes. Hygeia, 1945, 53,
32-36.
Wechsler, D. The measurement and appraisal of adult intelligence, Balti
m ore: Williams and Wilkins, 1958.
- 333-
QUINTA PARTE
DINÂMICA DO REFORÇAMENTO
15. MOTIVAÇÃO I
16. MOTIVAÇÃO II
17. CONTINGÊNCIAS AVERSIVAS
18. COMPORTAMENTO EMOCIONAL

Capítulo 15 MOTIVAÇÃO I
A motivação do comportamento é geralmente interpretada como o conjunto de

d e t e r m i n a n t e s ou c a u s a s d o c o m p o r t a m e n t o . Ma s d e v e t e r
ficado claro, nos capítulos anteriores, que a elaboração das causas do comportamento
é o campo de toda a psicologia. Desde os reflexos até a solução de problemas
complexos, um objetivo unificador da ciência tem sido uma elaboração experimental
das causas ou “leis” do comportamento. O tópico “Motivação” , se é que devemos
distingui-lo dos procedimentos e processos dos capítulos anteriores, deve compreender
as causas de comportamento até aqui negligenciadas, ou deve oferecer fenômenos
novos para análise. Antes de nos dedicarmos a um tratamento experimental da
motivação, é útil inserir algumas notas sobre c#usa e efeito na ciência, em geral, e na
psicologia, em particular.
15.1 CAUSA E EFEITO E A NOÇÃO DE L E I CIENTÍFICA
Os termos “causa” e “efeito” têm uma. longa história de uso em todas as

tentativa sistemáticas para explicar a natureza tanto filosófica quanto científica. Os
termos são parte de nossa linguagem cotidiana para descrever os aspectos de furacões,
revoluções, epidemias, assassinatos e acidentes aiéreos, assim como eventos mais triviais
do dia-a-dia nas relações humanas. Podemos, aissim, ficar surpresos em descobrir, ao
voltarmo-nos para a literatura científica contemporânea, a falta evidente desses termos.
Em seu lugar, podemos encontrar referência apenas a relações entre variáveis,
correlação de eventos c “ leis” relacionando fenômenos. Não que o cientista tenha
perdido o interesse nas causas de seus fenômeno^. É que, simplesmente, tudo o que ele
encontra após executar experimentos são relaçõ-es entre eventos ou variáveis. Para ele,
descobrir as causas de um fenômeno y é equivailente a descobrir quais outras variáveis
u, v, w, x, e assim por diante, estão sistematica mente (funcionalmente) relacionadas a
y- . .
Toda a ciência está cheia dc exemplos de relações funcionais que se propõem a
ocupar o lugar de noções mais ordinárias de canisa e efeito. Considere a lei de llookc:
enquanto o limite de elasticidade não é excedido, a distensão de um corpo é
diretamente proporcional à força nele aplicada- A lei pode ser resumida como a
relação entre duas variáveis, Força -----^ Distensão. A relação seria descrita mais
- 337-
extensivamente por um gráfico em que as unidades de força (a variável independente)
são representadas em função das unidades de distensão (a variável dependente).
Podemos, se desejarmos, considerar a causa de qualquer distensão particular como
sendo a força particular que atua no corpo. Mas, ao chamar a força de causa da
distensão, não acrescentamos qualquer informação adicional à própria relação fun
cional. De fato, enquanto a lei descreve a forma exata da relação para inúmeras forças
e distensões, a designação de causa é limitada à proposição lógica - se uma força, então
a distensão.
Na relação
Aquecer a água até 100°C—» água ferve,
a aplicação de calor pode ser considerada como causa da ebulição. Mas se persistirmos
em perguntar “ por que” a água ferve quando suficientemente aquecida, estaremos nos
referindo a uma outra relação funcional entre a pressão do vapor da água e a
temperatura. Exatamente a 100°, segundo nos dizem, a pressão de vapor da a'gua é
igual à da atmosfera. Isto pode ou não satisfazer nossa curiosidade sobre a ebulição da
água mas, em qualquer caso, a forma das respostas que obteremos para qualquer
“ porque” a mais será a mesma - mais relações funcionais.
As relações são igualmente importantes para o processo explanatório na ciência
biológica. O acasalamento de moscas de fruta, em que macho e fêmea têm olhos
brancos, gera invariavelmente filhos de olhos brancos.
Casal de pais de olhos brancos —> prole de olhos brancos.
Existe uma relação funcional entre a cor dos olhos dos pais e a cor dos olhos dos
filhos.
Todas essas relações funcionais revelam uma lógica comum. Se considerarmos a
variável antecedente nessas relações como x e a conseqüente que é produzida como y
sua lógica parece ser:
Se x, então y
e seu corolário
Se não y, então não x.
Assim, se uma força (x) é aplicada, então observaremos distensão (y). Mas, se
nenhuma distensão foi observada (não y), então a força não deve ter sido aplicada
(não x). Similarmente, se a temperatura da água sobe a 100 ° (x) então a água ferve
(y). Além disso, se a água não está fervendo (não y), então a temperatura deve estar
abaixo de 100° (não x). Finalmente, se ambos os pais têm olhos brancos (x) então
todos os filhos terão olhos brancos (y). Mas, se os filhos não tem olhos brancos (não
y) então os pais não poderiam ter, ambos, olhos brancos (não x).
Não devemos ficar desapontados ao aprender que as leis cientificas dão uma
representação exata da natureza somente quando certas condições são alcançadas. As
leis científicas se mantêm num'contexto, algumas vezes amplo, algumas vezes estreito,
dependendo da generalidade da relação particular; mas nenhuma lei científica é
verdadeira sob todas as condições. Além do limite de elasticidade, a lei de Hooke falha
e a distensão não é mais proporcional à força aplicada. A menos que certas variáveis
tais como a pressão atmosférica e a pureza da água sejam mantidas constantes, a água
- 338-
nao ferve a 100° A irradiação da mosca de fruta complica as relações de heredita
riedade.
Nas leis descritas, os termos x ey das relações funcionais são conceitos baseados
em quantidades observáveis. A intimidade pela qual tais conceitos estão ligados a
observáveis é a razão porque tais leis são chamadas empíricas. Podemos observar t
medir eventos que são conceituados como forças e distensões de corpos, temperatura e
estados da água, reprodução sexual e cor dos olhos das moscas de frutas. Os tipos de
explicação proporcionados por leis empíricas devem ser contrastados com explicações
pré-científicas. Antes da descoberta das leis que relacionam a atividade de micro
organismos à doença, esta era frequentemente atribuída à demônios alojados no corpo.
Por muito tempo, acreditou-se que o comportamento animal e humano era devido às
almas e espíritos animais. Nessas explicações pré-científicas a doença e o compor
tamento eram relacionados a eventos hipotéticos (demônios e almas), que eram livres
para assumir quase toda propriedade que o teorista lhes desejava impor. A falta de
restrições sobre a natureza hipotética desses conceitos tornou possível que eles, em
princípio, explicassem tudo. Mesmo assim, sua imunidade à não-confirmação por
qualquer procedimento colocou-os na posição paradoxal de, na verdade, nada ex
plicarem.
Em contraste com o vazio de tais explicações fictícias, a relação funcional da
ciência possui habilidades poderosas para a predição, interpretação e controle da
natureza. Quando existe uma lei funcional entre x e y , se soubermos o valor de x
podemos predizer o valor de y. Tendo a lei à mão, sempre que suspeitarmos que x e y
estão agindo no mundo cotidiano, estamos em condições de interpretar eventos reais
fora do laboratório. Finalmente, se pudermos manipular x como desejarmos, então
temos os meios de controlar y como desejarmos. No modelo da relação funcional,
temos o poder e a versatilidade do empreendimento científico revelados de um modo
surpreendente.
15.2 CAUSAS FICTÍCIAS DO COMPORTAMENTO
Quando examinamos as causas tradicionais do comportamento notamos que três
classes principais de causas fictícias dominaram o campo.
Numa delas, o comportamento é explicado por referência a eventos observáveis
que são fortuitamente correlacionados com ele, tal como a posição dos planetas no
nascimento, a direção das linhas na palma da mão, a proeminência relativa de várias
protuberâncias no crânio. Embora tanto o comportamento quanto o “ agente causai”
sejam observáveis, qualquer relação entre eles não é sistemática e, assim, qualifica-se
como “ acidental” em vez de “regular” .
Na segunda, o comportamento é frequentemente atribuído a eventos supostamente
localizados no sistema nervoso central (cérebro e medula). Quando dizemos que um
homem é esperto porque tem “ cérebro” , que não pode trabalhar porque seus nervos
estão esgotados, ou que precisa fazer um exame da cabeça quando age estranhamente,
estamos invocando eventos causais aparentemente localizados dentro da estrutura
nervosa. Na prática, todavia, raramente se faz a observação real desses eventos. Nestes
exemplos, o sistema nervoso existe apenas como um repositório para explicações
fictícias do comportamento. As propriedades das causas hipotéticas são especificadas
apenas a grosso modo e nenhuma relação específica é observada ou teorizada entre
elas e o comportamento observado.
- 339 -
Na terceira, o comportamento é comumentc “explicado” por processos mentais
ii*ternos hipotéticos. Diz-se que fechamos uma porta porque a “ queremos” fechada,
que assobiamos uma melodia porque temos um “ ímpeto” para assobiar, lemos um
livro porque “ sentimos vontade” de lê-lo. Pelo fato de tais proposições parecerem tão
naturais e inofensivas, é difícil notarmos que elas implicam numa forma de causa e
efeito que difere marcaritemente das leis da seção 15-1. Contudo, em cada “vontade” ,
ímpeto” ou “ sentimento” interno não observável está sutilmente designado o status
de uma causa de algum comportamento. Aqui, novamente, estas “ causas” não possuem
quaisquer propriedades independentes que possam ser relacionadas ou pela teoria ou
pela observação, ao comportamento real a ser explicado. O “ ímpeto” e a “vontade”
são fictícios porque são inferidos inteiramente do comportamento que se propõem a
explicar.
O surgimento de uma psicologia científica é, em grande parte, uma mudança de
causas fictícias do comportamento para causas funcionais. Basta que examinemos os
vários procedimentos e processos dos capítulos anteriores para encontrar várias dessas
relações funcionais. Como um prelúdio para a análise dos fenômenos de motivação,
será útil faz.cr uma revisão desses paradigmas comportamentais familiares dc modo a
enfatizar como seus procedimentos constituem uma classe importante dc causas com
portamentais.
15.3 HISTÓRIA PASSADA COM CONTINGÊNCIAS DE CONDICIONAMENTO E

EXTINÇÃO COMO CAUSA DO COMPORTAMENTO
Na medida em que uma história passada com os vários paradigmas de condicio

namento operante é uma maneira eficaz dc modificar o comportamento de um
organismo, uma história particular deve ser considerada uma causa genuína do com
portamento. Assim, o reforçamento anterior pode causar o aparecimento de uma
cadeia comportamental e o declínio de outro comportamento na situação. Ao con
trário, o não-reforçamento (extinção) do comportamento pode levar à ausência ou
baixa probabilidade de algum comportamento. Combiirmdo os procedimentos de
extinção c condicionamento, passamos para causas mais complexas. O controle exer
cido sobre o comportamento por S^s pode ser compreendido apenas com referência a
uma história passada de treino operante discriminativo. O surgimento de uma nova
forma de comportamento pode, quase sempre, ser explicada apenas pelas condições
especiais de reforçamento estabelecidas por aproximações sucessivas. Certos padrões
temporais característicos da resposta requerem uma histórica passada específica com
um esquema de reforçamento intermitente.
As causas do, ou aquilo que controla o comportamento, nesses exemplos,
encontram-se na maneira em que o comportamento esteve relacionado ao reforçamen
to, no passado. Como as causas da distensão de uma mola, ebulição da água e cor dos
olhos da mosca, essas causas são melhor descritas sob a forma dc relações funcionais.
Aqui, as relações são entre um determinado grupo de contingências, aplicadas anterior
mente, e o aparecimento de mudanças comportamentais. As mudanças de compor
tamento que estão associadas a essas histórias passadas ocorrem, caracteristicamente, no
tempo. Logo, as curvas que chamamos de processos comportamentais são as descrições
fundame itais dessas leis.
Uma idéia prevalentc em todas essas causas c a noção de que certos efeitos
- 340 -
comp ort amen tais são condicionais a uma certa história de condicionamento e extinção.
Alguns casos gerais estão resumidos na Tabela 15-1, dc modo a incluir os paradigmas
operantes dos capítulos anteriores. Note que cada caso pode ser reduzido a uma
combinação de apenas dois ingredientes: condicionamento e extinção. A variedade de
comportamentos que podem ser adquiridos e mantidos através dessas operações, e a
complexidade dos controles ambientais sobre o comportamento que a sua correlaçãc
com estímulos pode induzir, atestam a potência notável dessas duas operações opostas.
Tabela 15-1
ALGUMAS CAUSAS DO COMPORTAMENTO QUE SE ENCONTRAM NA HIS

TÓRIA DE REFORÇAMENTO DO ORGANISMO
CAUSA SIMBOLICAMENTE EFEITO
1. Uma resposta tem uma Força alta de R
história de ser seguida por R
/eforçamento
2. Uma resposta tem uma

historia de extinção R+> Força baixa de R
SD
3. Uma história passada R -± , SD controla a ocorrência de
com o procedimento de
R, e toma-se um reforçador
discriminação S*
R -h
R ^ S + Ry -/-> R x-b
4. O comportamento (R^) r 2-> r 2-» 5 + R2-b
deve sua existência a uma Uma nova unidade de com
história prévia de refor- portamento é adicionada ao
ç mento de seus ancestrais s+ R.,
repertório
ÜLn*
relacionados
(Estágios sucessivos no tem
po -* )
5. Uma história passada Um padrão característico

com uma contingência pro- ' K ò de respostas no tempo
babilistica particular
- 341 -
15.4 MOTIVOS E REFORÇADORES
Apesar de todo o seu poder, os procedimentos da Tabela 15-1 são inúteis a menos
que as conseqüências ambientais que eles proporcionam ao comportamento sejam do
tipo especial que denominamos reforçadores. Nas discussões anteriores, tomamos como
seguro o poder reforçador de eventos tais como alimento e água, adiando até agora
uma análise das variáveis que modulam suas propriedades reforçadoras. É a elaboração
dessas variáveis que constitui o campo da motivação.
Podemos questionar, de início, o que essa definição de motivação tem em comum
com as concepções mais clássicas de motivação como o estudo de necessidades,
vontades, aspirações, interesses, desejos, impulsos e outras energias ou motivos do
comportamento. Para o presente, notaremos apenas que estas necessidades e desejos e
outros motivos parecem estar intimamente relacionados ao conceito de reforçadores.
Quarido se diz que um organismo “necessita” de alimento ou água, a inferência de
necessidade é usualmente feita a partir da observação de que é provável que um
organismo, que tenha estado sem alimento ou água por um período, coma e beba.
Diz-se que uma pessoa “ deseja” beber se ela pede água ou que, de outra forma, se
empenha num comportamento que tenha anteriormente produzido água. As necessi
dades e desejos referem-se ao fato de que, devido a um periodo de sua ausência,
alimento e água tornaram-se reforçadores.
Fazemos uma restrição à nossa análise experimental de motivação identificando
como seu domínio a análise dos reforçadores primários apenas. A restrição serve para
excluir aqueles reforçadores cujo poder reforçador depende de uma história passada de
condicionamento, em particular, do paradigma de discriminação No linguajar comum,
naturalmente, os motivos não são sutilmente distinguidos na base de se eles se referem
a reforçadores primários ou secundários. De fato, um motivo pode referir-se a quase
todos os “ porquês” do comportamento. Uma necessidade de superar os outros, um
desejo dc atenção e um desejo de possuir um automóvel caro ou status social podem
todos qualificar-se como motivos legítimos. Não obstante o linguajar comum, as leis
que governam tais motivos são aquelas que governam os reforçadores adquiridos.
Consequentemente, tais motivos adquiridos são mais apropriadamente tratados como
fenômenos de condicionamento. O dinheiro, um bom exemplo de um tal motivo, é
satisfatoriamente descrito como um reforçador positivo generalizado adquirido. Sua
significância reforçadora depende de sua história ou paradigma de discriminação onde
sua presença estabeleceu a ocasião para Rs que, eventualmente, produziam refor
çadores primários. Atenção; necessidade de poder, afiliação, realização; competição e
muitos outros motivos sociais parecem se adequar ao paradigma de reforçamento
secundário descrito no Capítulo 11. Logo, teremos poucas novidades para adicionar a
sua análise neste capítulo.
O problema dc como estudar os motivos adquiridos foi solucionado no Capítulo
1 1 , através da formulação de um conjunto de princípios para converter qualquer
situação de estímulo arbitrária num reforçador condicionado. Ao estudar os re
forçadores primários, preocupar-nos-emos com a elaboração de um número de variáveis
que se mostram intimamente relacionadas ao aumento e diminuição no valor de tais
reforçadores. Como uma ajuda para ampliar o conceito de reforçamento primário do
estudante, apresentaremos, nas discussões que se seguem, uma variedade de re
forçadores primários diferentes.
- 342 -
15.5 OPERAÇÕES DE IMPULSO
Uma operação fundamental que afeta o poder ou valor reforçador de todos os»
reforçadores primários positivos conhecidos é o procedimento de privar o organismo
do reforçador por um período de tempo. Numa primeira aproximação, digamos que o
valor reforçador de um reforçador aumenta diretamente à medida que aumenta a
duração da privação.
Nas discussões anteriores sobre os efeitos do condicionamento (Pavloviano e
operante) partimos do princípio que as variáveis de privação foram reguladas para dar
um valor reforçador moderado aos estímulos usados como reforçadores. Embora
trabalhando por trás do cenário até agora, as variáveis de privação têm, de fato, um
papel central em tomar possíveis os processos comportamentais que estudamos. A
existência deste novo grupo de variáveis, do qual o comportamento depende tão
criticamente, tem duas implicações para análise comportamental que nãopodemos ignorar.
(1) O comportamento é multi-determinado. Um cavalo pode não beber a água que lhe
é apresentada porque não foi privado de água, ou porque nunca adquiriu o compor
tamento de beber água no cocho. Mas, se ele bebe, então deve ser porque possui o
comportamento necessário e está privado de água. Nem privação, nem o con
dicionamento passado apenas, serão suficientes para causar padrões de comportamento.
(2) Uma operação de privação aumenta o valor reforçador de uma classe de
estímulos dos quais muitas cadeias de comportamento podem depender. Quando
privamos um homem de alimento, aumentamos a probabilidade de que ele coma. Mas
aumentamos também a probabilidade de que ele peça alimento, caminhe para uma
certa rua onde. há um restaurante, entre num mercado e assim por diante. Nas
explicações tradicionais de motivação este aumento concomitante na força de muitos
comportamentos é a base para se considerar a privação como uma forma de dirigir,
“ impulsionar” o organismo para o reforçador. Contudo, usado deste modo, o conceito
de “ impulso” tem pouco mais que um valor metafórico. Se o organismo não adquiriu
o comportamento que o levará ao reforçador, a privação por si própria não resultará
em reforçamentos.
E conveniente despir o termo impulso de suas conotações comuns e dar-lhe uma
redefinição técnica que enfatize a habilidade de certas operações em estabelecer
reforçadores. A palavra impulso é usada para indicar que, como um resultado de
alguma operação efetuada no organismo (por exemplo, privação), algum S torna-se um
reforçador, S+. Assim definido, impulso é uma palavra como reflexo, significando uma
certa relação entre variáveis. Se concordarmos em empregar a palavra apenas neste
sentido técnico, devemos ter cuidado e evitar dizer que um organismo respondeu por
causa de um impulso. Sendo uma relação entre alguma operação e o comportamento,
um impulso não pode causar qualquer comportamento.
Pode-se efetuar operações apropriadas de privação para cada reforçador primário.
A observação casual sugere, e experimentos confirmam, que muitas outras operações
têm efeitos semelhantes à privação de reforçadores. Exercício forçado, diminuição da
temperatura da sala, injeção de insulina, lesões cirúrgicas numa região localizada do
cérebro, estimulação de alguma região do cérebro; administração de certas drogas,
oferecimento de aperitivos, introdução de um animal que está comendo junto ao
primeiro todos podem tornar o alimento um reforçador e, assim, são operações de
impulso.
- 343-
Assim como existem várias operações para estabelecer e aumentar o valor dos
reforçadores, também há operações de impulso para reduzir ou eliminar o valor do
reforçador. Podemos chamá-las de operações de redução do reforçador. A mais univer
sal delas é a saciação - apresentação repetida do reforçador até que ele perca o seu
poder de reforçar. Certas drogas, a injeção de sangue de animais saciados, eventos que
produzem emoção, lesões numa parte localizada do cérebro e estimulação numa
determinada região do cérebro, reduzem o valor reforçador do alimento.
Cada reforçador primário tem suas próprias operações particulares de estabele
cimento e redução do reforçador. O paradigma [15.1| esquematiza algumas operações
que tornam a água um reforçador.
Privar de todos os líquidos

Forçar a excreção
Injetar atropina - [15.1]
Alimentar com sal
Obstruir os dulos salivares
Estimular o cérebi o em certa região
Há uma forte tendência para se dizer que essas operações de impulso tornam o
organismo “sedento” e, portanto, ele bebe. Mas a “sede” é um agente causai dúbio.
Tudo o que vemos é que um número de operações tem um efeito similar tornam a
água um reforçador. Como conceitos explicativos, o termo “ sede” e seu correlativo
“ fome” dificilmente são sustentáveis, simplesmente porque eles não apontam qualquer
relação empírica ou teórica entre o comportamento e outros eventos observados ou
especificados. Mesmo como termos descritivos, eles podem prender em armadilhas o
descuidado. Quando dizemos que um homem está “sedentô” quando o vemos beber,
ou “ faminto” quando o vemos comer, estamos inferindo que água e alimento tor
naram-se reforçadores por alguma operação de privação. Mas, de fato, as pessoas
comem e bebem por muitas razões. Elas podem encontrar varias pressões sociais para
assim o fazer, podem fazê-lo para reduzir a ansiçdade, ou podem fazè-lo tal como uma
criança que bebe seu leite ou come seu espinafre para chegar a reforçadores como a
sobremesa.
15.6 PERIODICIDADES NO VALOR DO REFORÇAMENTO
Considere a seguinte lista alfabética de alguns dos mais conhecidos

reforçadores primários para sujeitos humanos e certos animais superiores
Água Atividade Sexo

Alimento Atividades maternas Sono
Amor,e Afeição Calor
Ar Novidade
O estudo experimental dos reforçadores primários começa com a observa

ção de que todos os itens desta lista, algumas vezes, são reforçadores e outras não.
Essa variabilidade é facilmente vista num reforçador como o alimento, cujo valor
reforçador passa por ciclos medidos em horas; é menos facilmente vista no ar, cuja
-3 4 4 -
periodicidade são ciclos pequenos de respiração dos animais, medidos em segundos ou
menos. Todavia, o fato geral é claro — algumas vezes, alimento, água, ar, sexo e assim
por diante são reforçadores, outras não o são. A análise experimental da motivação é
uma tentativa sistemática de relacionar essa variabilidade a variáveis observáveis no
ambiente presente ou passado do organismo. Em resumo, pesquisamos as leis
comportamentais da motivação.
A determinação da natureza cíclica dos reforçadores primários é o primeiro passo
em tal análise. Nem os homens, nem os animais comem continuamente. Quando
provido com um estoque inesgotável de alimento, q rato normal come periodicamente.
A natureza cíclica do comer é vista na Fig 15.1 . Cada resposta de pressão à barra
Figura 15.1. Comportamento cíclico de alimentação apresentado pelo rato (Anliker e

Mayer, 1956)
emitida pelo rato produz uma pequena pelota de alimento e uma contingência de
reforçamento contínuo é mantida permanentemente em efeito. Pode-se observar na
Fig. 15.1 que uma “refeição” inicia-se com uma taxa de pressão constante, mantida
entre 3-5 horas (portanto, comendo). Daí em diante, a taxa de pressão-comer declina,
terminando usualmente numa completa cessação de pressão-comer por umas 6 horas.
Deixando-o beber água quando preferir, o rato produz ciclos característicos de
beber e não beber, como indicam as curvas cumulativas do beber da Fig. 15-2. Há
relativamente poucas respostas de beber entre as 6 e as 18 horas, isto é, durante o dia
O beber, então, aumenta gradualmente e, em geral, atinge o seu máximo por volta de
meia-noite.
- 345-
ligura 15.2. Curvas cumulativas do beber para quatro ratos. O gráfico mostra
períodos de beber e não beber água destilada que estava constantemente disponível
(Young e Richey, 1952).
O sono humano é caracterizado por periodicidades que mudam nas várias idades.
A Fig. 15-3 mostra graficamente como os ciclos mudam à medida queosujeito
humano envelhece. O ciclo muda tanto seu período (número de “sonecas” por dia)
como sua fase (quando a primeira “soneca” começa) com a idade.
15.7 PARADIGMAS DE PRIVAÇÃO E SACIAÇÃO
A descoberta de uma perioricidade regular no valor reforçador representa apenas o

início de uma análise experimental da motivação. Um progiesso maior é alcançado
quando se obtém o controle direto dos ciclos. A operação de privação é fortemente
identificada com motivação porque a supressão de reforçadores primários é um
método universal para variar o valor reforçador de todos os reforçadores primários
conhecidos. Quando privamos um organismo de uma classe de reforçadores primários
por um período fixo de tempo e, então, permitimos o acesso ao reforçador, podemos
observar o efeito que a nossa operação de privação tem sobre o comportamento. No
caso de alimento e água, o comportamento real de consumir o reforçador é quase
sempre de interesse.Depois de um período de privação, um animal come e bebe uma certa
quantidade de alimento e água e, então pára. Dizemos, assim, que o animal está
saciado. A descrição comportamental desse processo de saciação assume,
- 346-
Um ano
Quatro auos
Dez anos
Adulto
I I I I
18 meia-noite meio-dia 18
Figura 15.3. Ciclos de sono em idades diterentes (Kleitman, 1963).
convenientemente, a forma da mudança na taxa de uma resposta que produz alimento

ou água em contingências de crf. Uma vez que cada resposta é reforçada, a taxa de
comer é indicada pela taxa de emissão dessa resposta.
As curvas de saciação de alimento não têm todas a mesma forma, mas a forma
mais comum parece ser a de uma taxa constante de comer seguida por uma cessação
um tanto abrupta (Smith e Smith, 1939 ; Reese e Hogenson, 1962). Na Fig. 15-4, são
vistas várias curvas de saciação da resposta de bicar uma chave de um pombo,
reforçada com alimento. As curvas foram obtidas depois de vários períodos de
privação de alimento, como indicado.
Por apresentarem uma diminuição na taxa, as curvas de saciação podem ter uma
semelhança superficial com as curvas de extinção. A forma de uma curva de saciação
é, todavia, caracterizada por uma cessação muito mais abrupta da taxa (ver Fig. 15-4).
Além disso, se a cadeia de comportamento adquirido é examinada com atenção,
notar-se-á que ela permanece intacta à medida que o processo prossegue. O processc
de extinção, por outro lado, está associado com uma desintegração marcante da cadeia
de comportamento.
O paradigma da saciação pode ser esquematizado como se segue:
DADOS: 1 - Privação de um reforçador primário (ou alguma outra operação

apropriada para estabelecer o reforçador).
2 —Um comportamento apropriado, previamente fortalecido por este
reforçador.
PROCEDIMENTO: R -> S +
PROCESSO: Uma taxa razoavelmente constante de R, seguida por uma cessação
abrupta.
RESULTADO: Cessação da taxa de R.
-3 4 7 -
Figura 15.4. Curvas individuais de saciação de alimento. As curvas estão assinaladas
com o número de horas de privação anterior de alimento. Um traço oblíquo acima
de cada curva indica que o animal não comia após a resposta de bicar (Reese e
Hogenson. 1962).
Note que, em geral, o resultado também difere do resultado da extinção.

Enquanto a extinção volta o comportamento ao nível operante, a saciação volta-o a
um nível próximo de zero que pode ser inferior ao nível operante. Saciados de todos
os outros reforçadores, os organismos frequentemente vão dormir.
15.8 A MENSURAÇÃO DOS IMPULSOS
Frequentemente, referimo-nos ao fato de que um indivíduo está mais fortemente

motivado algumas vezes do que outras e, de fato, inferimos um continuum de força
motivacional. Podemos traduzir essa proposição numa equivalente relativa a um
continuum de força do impulso. A noção de que um impulso pode variar em força, de
- 348-
um valor muito baixo a um valor muito alto, parece referir-se, principalmente ã
observação de que os reforçadores primários podem variar suas forças de valores muito
baixos a muito altos. Assim dizemos que uma pessoa está fortemente motivada para
alimento quando o alimento é um reforçador forte para o comportamento
instrumental daquela pessoa. Similarmente, uma pessoa que está altamente motivada
para o sexo empenha-se frequentemente em comportamento que produz reforçadores
sexuais. Note que, nestes exemplos, apesar de falarmos em termos dc uma alta força
de motivação, tudo o que realmente observamos é a capacidade de um conjunto
particular de reforçadores primários fortalecer e manter o comportamento. Na medida
em que se puder demonstrar que essa capacidade varia de baixa a alta, dependendo das
circunstâncias, podemos indicar o seu valor por uma variável que chamamo, dc valor
reforçador primário dos estímulos.
Como podemos medir o valor reforçador dos estímulos? Parece que não há uma
maneira de medí-lo, salvo pela medida dos efeitos comportamentais dos estímulos
quando eles são contingentes a respostas operantes. Assim, muitas das medidas
comportamentais familiares citadas nos capítulos anteriores, tais como a taxa de
resposta e resistência à extinção, serão úteis para avaliar a força da motivação. Segue-se
uma curiosa implicação dessa versatilidade. O comportamento que o experimentador
escolhe para medir não pode, sozinho e em si mesmo, determinar que fenômeno está
sob estudo. A pressão à barra, ó bicar uma chave e a vocalização “estou com fome”
têm significado somente quando estão associados a outros eventos. Em termos mais
gerais, esta é a razão porque a própria disciplina da psicologia não pode ser definida sõ
como o estudo do comportamento. Ela é considerada mais adequadamente como o
estudo do comportamento na medida em que este se relaciona com o ambiente. Em
capítulos anteriores, as taxas de respostas de operantes representativos foram usadas
fre q u e n te m e n te para estudar o condicionamento, extinção, discriminação,
encadeamento e outros fenômenos, dependendo do procedimento particular imposto
ao organismo quando o comportamento estava sendo medido. Agora, descobrimos um
outro emprego para as medidas operantes. Quando os parâmetros de condicionamento
são mantidos constantes e o comportamento está relacionado a operações de impulso,
as propriedades do comportamento que está sendo emitido podem servir como uma
medida do valor reforçador relativo (ou fprça) de reforçadores primários. Note bem
como essa estratégia experimental é contrária àquela utilizada em capítulos anteriores,
onde as operações de “impulso” eram sempre mantidas constantes e as contingências
de reforçamento eram manipuladas. Empregando aquela metodologia a taxa de
comportamento era tomada geralmente para representar a força do comportamento.
Na metodologia da motivação, a taxa de comportamento será frequentemente tomadc
para representar a força do reforçador. Evidentemente, o “significado” dc
comportamento é derivado apenas pela consideração da variável ou variáveis às quais c
comportamento está sendo relacionado. Discutiremos abaixo algumas técnicas
comportamentais que têm sido usadas para medir o valor reforçador primário dos
estímulos e, assim, por inferência, a motivação. Ao mesmo tempo, ilustraremos uma
variedade de respostas e reforçadores primários diferentes.
1. Resistência à saciação
Nossa intuição nos diz que quanto “mais sedentos” estivermos, mais água
- 349-
poderemos consumir c que quanto mais “ famintos” estivermos, mais alimento
poderemos comer. Como podemos quantificar essas impressões? Uma forma é
examinar as propriedades do processo de saciação em relação à duração de tempo em
que se tenha impedido a um indivíduo o acesso a todos os reforçadores de uma certa
classe. Com efeito, examinamos curvas de saciação obtidas a vários graus de privação.
Suponha que, depois de um período de privação, estabeleçamos uma contingência de
modo que alguma cadeia arbitrária de comportamento possa produzir o reforçamento.
Então, ou o tempo que o organismo leva para alcançar algum critério arbitrário de
taxa baixa ou o número de respostas reforçadas emitidas antes de ser atingido o
critério de taxa baixa, proporcionariam uma medida da resistência à saciação. É
evidente que, se contingências de crf estão em efeito e se a quantidade de
reforçamento é mantida constante, a última medida seria equivalente à quantidade de
substância consumida. A resistência à saciação é calculada de modo análogo à
resistência, à extinção (seção 5.5). Usando o me'todo de resistência à saciação, Siege
(1947) mediu a quantidade de água bebida pelos ratos num período de 5 minutos em
função de quanto tempo os animais haviam sido privados de água. A reiação obtida é
vista na Fig. 15-5. De 0 até 48 horas de privação, a resistência à saciação, medida pela
quantidade de água consumida, aumentou. A taxa de aumento, todavia, parece
diminuir depois de 12 horas. Resultados similares podem ser obtidos para privação de
alimento. Com períodos muito grandes de privação, todavia, a quantidade de alimento
ingerido declinará, presumivelmente como um resultado da contração do estômago e
inanição. Dentro de certos limites, entretanto, a resistência à saciação aumenta à
medida que o tempo de privação aumenta.
A resistência à saciação, embora uma técnica útil, não é sempre inteiramente
‘satisfatória para medir o valor reforçador. Uma dificuldade encontra-se nas
complicações fisiológicas que ocorrem com longos períodos de privação, causando,
N ú m ero de h o ras de privação de água
Figura 15-5. Quantidade de água ingerida por ratos num pen'odo teste de 5 minutos
m função do número de horas em que não tiveram acesso a qualquer líquido
(segundo Siegel, 1947).
-3 5 0 -
algumas vezes, um consumo reduzido. Outra dificuldade surge se desejarmos saber
quão forte é o reforçador em vários pontos do processo de saciação. Em qualquer
nível de privação, um organismo pode comer ou beber numa taxa constante e alta até
que o processo chegue a uma cessação abrupta (Fig. 15-4). Logo,é difícil avaliar a
força momentânea do reforçador através da inspeção do processo dc saciação. As
curvas de saciação tendem a diferir principalmente nos seus pontos terminais, c não
nas suas inclinações (Fig. 15-4). Então, somos forçados a esperar até que a saciação
seja alcançada para sabermos quão faminto ou sedento o animal estava no início.
2. Taxa de respostas reforçadas intermitentemente.
Uma técnica em geral mais conveniente para medir o valor reforçador é observar a
taxa de resposta apresentada por um organismo quando o comportamento está sendo
intermitentemente reforçado. Um esquema de intervalo, por exemplo, pode ser
programado para fornecer uma taxa de reforçamento bastante baixa, de modo que o
comportamento possa ser mantido sem a ocorrência de saciação por um longo período
de tempo. Skinner (1938) usou essa técnica para avaliar os efeitos comportamentais de
quantidades especificadas de alimento dadas aos ratos, antes do teste. Primeiro, os
ratos foram privados de alimento por 23 horas e, então, durante vários dias, foram
alimentados com quantidades diferentes de alimento logo antes do teste com as
contingências de intervalo. Os resultados para um desses ratos aparecem na Fig. 15-6.
Os números associados a cada curva referem-se à quantidade de alimento, em gramas,
dado ao rato previamente. É evidente que, quanto mais o rato se alimentava
imediatamente antes do trabalho, menor era a taxa de resposta no esquema.
F. C. Clark (1958) estudou os efeitos de vários graus de privação de alimento
sobre as taxas de respostas “estabilizadas” , em intervalo variável (IV), em ratos.
Figura 15-6. Quatro registros diários de um rato sob contingências de intervalo,

privado por 23 horas, e alimentado com diferentes quantidades de alimento
imediatamente antes do teste (Skinner, 1938).
- 351 -
Vários IVs diferentes foram usados. Clark obteve as curvas da Fig. 15-7 quando
representou a taxa de respostn dos ratos em função das horas de privação. O efeito do
aumento de privação foi o dc aumentar a taxa de resposta sob todos os esquemas de
IV. A maneira pela qual a privação e os esquemas de reforçamento interagem para
determinar as taxas de resposta da Fig. 15-7 é de algum interesse. A similaridade na
forma das curvas da Fig. 15-7 significa que a privação interagiu com o esquema IV de
modo que, cm todos os níveis de privação, a razão entre a taxa num IV c a taxa no
outro IV era uma constante. Por exemplo, com 5 horas de privação, a taxa em ÍV-3
era cerca de 4 R/min. e em IV-1 era 2,5 vezes isto, cerca de 10 R/min. Quando a
privação foi aumentada para 20 horas, as duas taxas eram aproximadamente 6 e 15
respectivamente, de modo que a taxa em IV 1 era ainda 2,5 vezes maior do que a
taxa em IV-3.
No experimento de Clark, o intervalo máximo de privação foi de 23 horas. Heron
e Skinner (1937) pesquisaram sobre a privação alimentar prolongada, em ratos, que se
estendia até a morte do animal. Eles descobriram que a taxa de resposta reforçada
com alimento em IF aumentava progressivamente durante o período de inanição até
atingir um máximo, depois do que declinava rapidamente e logo se seguia a morte
como resultado da inanição. A taxa máxima não ocorreu no mesmo ponto para todos
os ratos. No experimento de Heron e Skinner, ela ocorreu entre 4 e 12 dias. O
resultado apoia as teorias que equiparam a motivação a um deficit corporal
T em po de privação (h o ras)
Figura 15-7. Taxa média de resposta em IV em função do tempo de privação. O
parâmetro é o IV médio (Clark, 1958).
- 352-
(“necessidade” ). Embora o deticil alimentar do rato continue a aumentar através da
privação, parece que o valor reforçador do alimento não aumenta. Veremos mais tarde
quais outras medidas comportamentais substanciam essa conclusão.
3.Resistência à extinção.
A taxa dc resposta durante a extinção e outras medidas de resistência à extinção

(seção 5.5) têm sido usadas, com freqüência, para medir os efeitos comportamentais da
nrivação e outras operações similares. Crocetti (1962) treinou ratos com 7 horas de
privação de alimento a pressionar uma barra, reforçando-os com alimento. Os sujeitos
foram, então, distribuídos em cinco grupos e cada grupo foi extinto depois de uma
duração diferente de privação. Na Fig. 15-8, é visto o número total de respostas
emitidas por cada grupo, depois de 3 horas de extinção. A curva mostra o aumento
usual na taxa de resposta à medida que o tempo de provação aumenta. Mas observe
que a forma dessa curva difere daquelas da Fig. 15-7. Diferenças como essas levantam
o problema sistemático de qual índice comportamental representa melhor o valor do
reforçador. No presente, não há uma solução definida para esse problema e os teoristas
são frequentemente forçados a adotar a posição de que as medidas que se
correlacionam melhor entre si representam melhor a força do reforçamento.
H oras d e Privação
I igura 15-8. A relação entre horas de privação e o número de respostas dc pressão à

barra durante a extinção (segundo Crocetti. 19 ^ A
4. Aquisição
Poderíamos esperar que, com um aumento no poder do reforçador, houvesse

um aumento concomitante na velocidade do processo de aquisição. Quando a aquisição
envolve uma longa cadeia de respostas (por exemplo, o comportamento de percorrer
uma pista) ou uma discriminação, essa predição é verificada. Broadhurst (1957)
treinou ratos a percorrerem, submersos, um labirinto equivalente ao labirinto cm Y. Os
ratos eram submersos na caixa de partida, aí ficando por alguns segundos
permitindo-se, então, que nadassem debaixo d’agua até ao ponto de escolha. Lá.
- 353-
era-lhes apresentada uma discriminação luz-escuro, com contingências do tipo discutido
em relação ao aparelho de saltar de Lashley (seção 10.3). Se, no ponto de escolha, o
rato nadasse para o lado claro, encontrava uma porta aberta que permitiria o acesso
para um lugar seco. Se, todavia, nadasse para o lado incorreto, encontrava uma porta
trancada e tinha de nadar de volta para o ponto de escolha e, então, dirigir-se para o
outro braço do Y para sair. Todo o procedimento foi efetuado debaixo d’água. O
procedimento é, esquematicamente,
onde Sa = na caixa de partida, porta fechada

Sb = na caixa de partida, porta aberta Rg =nacjar para 0 ponto de escolha
$D = H O RD = virar à direita
Se = Í~IB RE “ virar à esquerda.
S+ = lugar seco
onde Tx é a variável independente, a privação de ar por Tx segundos. Broadhurst
variou também a diferença de intensidade entre as duas partes do estímulo visual do
ponto de escolha. Quanto maior essa diferença, mais fácil a tarefa discriminativa (Frick,
1948). Logo, uma grande diferença de iluminação corresponde a uma discriminação
“fácil”; uma diferença pequena corresponde a uma discriminação “ difícil” .
Figura 15-9. Número de escolhas discriminativas corretas em 100 tentativas de

aquisição em função da privação anterior de ar. Os dados são de tres discriminações
que variam em dificuldade (segundo Broadhurst, 1957).
- 354 -
Os resultados da aquisição são apresentados na Fig. 15-9. E visto o número de
escolhas corretas em 100 tentativas de aquisição das duas discriminações. Para a
diferença grande de iluminação (discriminação “fácil”), podemos resumir os resultados
dizendo que, quanto maior o tempo de privação de ar, mais eficiente era o
desempenho de aquisição. Mas quando uma pequena diferença de iluminação era usada
(discriminação “difícil”), a aquisição era mais eficiente num valor médio (2 seg.) de
privação de ar e menos eficiente com privações maiores e menores. Se esse resultado
puder ser generalizado, parece que com tarefas difíceis é possível ter-se muito mais
motivação para um desempenho ótimo. Certamente, as diferenças na forma entre as
duas curvas da Fig. 15-9 indicam que o método de aquisição deve ser usado
cauteiosamente como uma medida da força do reforçador. Por exemplo, um resultado
bem diferente foi obtido numa situação que requeria o nadar debaixo d’agua, em linha
reta, sem contingências discriminativas. Então, numa faixa de privação anterior de ar
de 0 a 10 seg, os ratos nadavam tanto mais rápido quanto maior a privação anterior de
ar.
5. Superar obstáculos.
Quanto mais reforçador um estímulo, é de se esperar que um organismo supere

mais obstáculos, impedimentos e barreiras para produzir o reforçador. Esta é a razão
da Caixa de Obstáculo de Colúmbia vista na Fig. 15-10. Um rato é colocado na caixa
de partida e uma grade eletricamente carregada é interposta entre ele e o alimento,
água ou um companheiro localizado na caixa objetivo (o rato foi previamente treinado
a correr para a caixa objetivo sem receber qualquer choque elétrico). Se o rato
atravessa a grade, ele tem um breve acesso ao reforçador e é, então, recolocado na
caixa de partida para outra tentativa. O número de vezes que ele atravessa a grade
eletrificada em 30 minutos fornece uma medida da força do comportamento. Warden
(1931) pesquisou sobre vários reforçadores primários e procedimentos de privação com
este aparelho. Ele acreditava que esta era uma maneira de comparar objetivamente as
forças máximas de vários reforçadores primários. Um grupo interessante das funções de
Warden aparece na Fig. 15-11.
Figura 15-10. A caixa de Obstáculo de Columbia. Há uma grade eletrificada (B) entre
o compartimento do rato (A) e um reforçador colocado na caixa objetivo (C)
( segundo Warden, 1931, de Harlow, 1948 ).
- 355-
Através dessas funções, vemos que se as operações são efetuadas por bastante tempo, o
comportamento que produz o reforçador chega a uma força máxima e, então, declina.
Warden supôs que as alturas relativas dos máximos poderiam ser interpretadas como
significando que impulsos para água e alimento são mais fortes do que o impulso
para sexo. Mas, esta conclusão é justificável? Devemos nos lembrar de que as funções
comportamentais dependem de muitas variáveis além daquela particular que o experi-
Dias d e privação
Figura 15-11. Número de travessias de uma grade eletrificada em função dos dias de
privação do reforçador primário apropriado (segundo Warden, 1931).
mentador está pesquisando. O valor reforçador, em particular, depende de fatores tais

como a qualidade e quantidade de reforçamento. A conclusão de Warden suponha que,
de algum modo, esses fatores haviam sido equacionados para sexo, alimento e água, de
maneira que a privação era a única variável na situação. Mas até que ponto, além do
mais trivial, pode-se afirmar que (digamos) exposições de 10 segundos a um
rato-femea, um recipiente de água e um pedaço de queijo são iguais? E mesmo que
fosse encontrada alguma forma para igualar dois reforçadores, os processos de saciação
associados a cada classe de reforçador são, quase certamente, tão diferentes que a
média de travessias numa sessão de 30 min refletiria uma composição diferente de
valores reforçadores para cada reforçador. Essas considerações indicam que a classifica
ção de Warden dos impulsos para água, alimento e sexo não deve ser tomada muito
seriamente. A questão de qual impulso é o mais forte pode nem mesmo ser
experimentalmente significante.
6 . Técnica do Trabalho Máximo.
- 356-
A técnica do trabalho máximo é semelhante, em linhas gerais, à caixa de obstácu
lo, mas evita um dos efeitos colaterais indesejáveis desta última — a contaminação dos
resultados pelos efeitos emocionais do choque elétrico. A técnica do trabalho máximo
está baseada na noção de que, quanto mais forte o reforçador, mais trabalho o indivíduo
efetuará para obtê-lo. Hodos (1961) delineou um procedimento engenhoso no qual um
organismo trabalha num esquema de reforçamento em razão, onde o valor real da ra
zão aumenta progressivamente com cada reforçamento sucessivo. Num experimento, a
sessão iniciava com uma razão 2 e cada reforçamento sucessivo aumentava à razão de
mais 2, de modo que os animais deveriam emitir 2 respostas para o primeiro reforçamen
to, 4 para o segundo, 6 para o terceiro, e assim por diante. Eventualmente, atinge-se
uma razão tão alta que o animal se recusa a continuar trabalhando. O ponto em que is
to ocorre é chamado de “ponto de quebra”, definido no trabalho de Hodos como 15 mi
nutos sem nenhuma resposta. Usando ratos como sujeitos e leite condensado para o re
forçamento, Hodos manipulou o esquema de privação de seus sujeitos, alimentando-os
todo dia apenas com alimento suficiente para manter o peso de seu corpo numa percen
tagem fixa de seu peso com alimento livre. Assim, um rato mantido a 80 por cento de
seu peso normal está fortemente privado; um rato mantido a 95 por cento de seu peso
normal está apenas um pouco privado. Este procedimento é comumente empregado pa
ra controlar a privação de sujeitos experimentais, e alguns acham que ele permite um
controle um pouco melhor da motivação do que men tendo os sujeitos com uma dura
ção fixa de privação, digamos 23 horas. A medida do comportamento usada por Hodos
foi o número de respostas na última razão completada antes do ponto de quebra. Esta
razão final é a razão máxima que o rato poderia completar sob as condições do experi
mento. A Fig. 15-12 mostra que, à medida que os ratos estavam mais privados, eles com
pletavam uma razão máxima maior. Interpretamos isso como significando que com uma
privação maior o rato apresentará maior quantidade total de trabalho.
7, Adulteração do reforçador.
Quando estamos ligeiramente famintos, somos muito seletivos com relação aquilo
que comemos. Eventualmente, à medida que ficamos mais famintos, nossos padrões so
bre aquilo que aceitaremos serão menos exigentes. Se estivermos com uma privação mui
to grande, comeremos qualquer coisa. Essas impressões sugerem que o impulso poderia
ser medido pela quantidade de uma substância desagradável que pode ser misturada com
o alimento de modo a fazer o organismo parar de consumir o alimento adulterado ou
de trabalhai por ele.
Os pesquisadores com interesse nas relações cérebro-comportamento tem comu

mente recorrido à destruição experimental (lesões) de pequenas regiões localizadas do-
sistema nervoso a fim de localizar regiões específicas do cérebro associadas a comporta
mentos específicos. Numa região profunda do cérebro (o núcleo ventro-medial do hipo-
tálamo) tal destruição experimental produz um íimal que, depois de reabilitar-se da ci
rurgia, come vorazmente. Num período dc dois meses, ele dobrará o seu peso se tiver
acesso contínuo ao alimento. (Teitelbaum, 1955 ). Embora tais ratos “operados” comam
quantidades enormes de alimento e se tornem obesos, Miller, Bailey e Stevenson (1940)
mostraram anteriormente que esses ratos nao trabalham para obter alimento em esque
mas de razão tanto quanto trabalhariam ratos normais.
- 357 -
120
Rato SO
R ato 77
I 80-
X»
100 95 90 85 80
P ercentagem do peso com a lim e n to livre
Figura 15-12. Razão máxima que produz o leite e que os ratos emitirão, em função
do grau dc privação de alimentos (Hodos, 1961).
Essa é uma das várias descobertas a mostrar que a quantidade de alimento consumido
(resistência à saciação) e o trabalho realizado pela obtenção de alimento não estão
perfeitamente correlacionados. Miller, Bailey e Stevenson tomaram os dados da razão
como significando que os ratos obesos não estavam tão “ famintos” quanto os ratos
normais, embora, se o alimento estivesse livremente disponível, eles consumissem
relativamente muito mais alimento.
Teitelbaum utilizou o método de adulterar o alimento do rato com uma pequena
quantidade fixa de quinino (uma substância que sujeitos humanos acham amarga) para
averiguar interpretação de Miller, Bailey e Stevenson. Ele descobriu que, durante os
dois meses depois da operação, quando os ratos estavam se tomando obesos, o quinino
não detinha seu consumo anormal de alimento. Em outras palavras, durante este
período no qual os ratos turnavam-se muito gordos, o alimento era um reforçador
forte. Mas, uma vez que os ratos tornavam-se obesos, uma quantidade de quinino
muito pequena para afetar o consumo de alimento pelos ratos normais, detinha
completamente o comer dos animais obesos. Parece que o alimento é menos
reforçador para o rato completamente obeso do qus para o rato normal. Mesmo assim,
se se dá acesso continuo a alimentação não adulterada, o animal obeso comerá muito
mais— sua resistencia à saciação é maior que a do normal.
8. Preferência.
Suponha que seja possível emitir uma, mas não ambas, de duas cadeias de
comportamento. Na medida em que um organismo emite o comportamento que
produz um reforçador em vez de e m itir o comportamento que produz um outro,
dizemos que já tem uma preferência pelo primeiro reforçador. Se a quantidade de esforço
para completar ambas as cadeias é aproximadamente a mesma, tal preferência poderia ser
considerada como uma expressão do valor reforçador superior do primeiro reforçador.
Assim, o comportamento de preferência torna-se um método para avaliar o valor re-
forcador relativo de dois ou mais reforçadores.
- 358-
Quando as glândulas supra-renais de ratos são removidas cirurgicamente, ocorre uma
mudança drástica na balança iònica de sódio e potássio. A menos que uma grande
quantidade de sódio seja ingerida diariamente, o animal logo morrerá. Quando a operação
é realizada, os ratos mudam sua preferência normal por água para soluções salinas (clo
reto de sódio) e ingerem grandes quantidades de solução salina, conseguindo, assim
manterem-se vivos e sadios. Esta mudança de comportamento é a evidência de que a
operação age de modo a aumentar o valor reforçador do sal.
Sumário.
Descrevemos brevemente vários métodos, mostrando que vários tipos de compor

tamento variam de uma maneira ordenada com mudanças na privação, saciação e ope
rações associadas. Parece existir um conjunto de medidas comportamentais que, dentro
de certos limites, covaria com a privação do reforçador.Por exemplo, quando se aumenta
a privação de alimento, o indivíduo trabalha mais depressa num esquema de intervalo de
reforçamento alimentar, realiza um total maior de trabalho (razão progressiva), supera
mais obstáculos e adulterações do reforçador ou adquire mais rapidamente uma nova
habilidade. Resumimos isto no Diagrama 115.21.
I 15.2|
Operação de estabele
cimento do reforçador
Mais trabalho é realizado
Um reforçador de qualidade inferior
é tolerado
Maior preferência pelo reforçador.
A covariação sistemática em um número de medidas comportamentais independentes

em relação a uma única operação (por exemplo, privação) fornece uma base para a
introdução de um conceito que irá resumir e denominar essa covariação. O termo valor
reforçador, para o qual, intencionalmente, adiamos uma definição formal até agora, é
justamente este conceito. Pode-se dizer que o valor do reforçamento denota a covariação
dos comportamentos do lado direito de [ 15.2]. Estamos agora em condições de fundir os
Diagramas [15.1] e [15.2], pois o significado do lado direito de [15.1 ] é expresso mais
exatamente por [15.2]. Similarmente, o lado esquerdo de [15.2] é mais adeauadamente
referido em [ 15d} .
O verdadeiro conceito de impulso pode agora ser formalmente definido como a
conjunção (relação) dos termos dos Diagramas [15.1] e [15.2]. Isto e\ um impulso c a
relação entre uma operação de estabelecimento do reforçamento e o valor reforçador de
uma classe de estímulos. Mas podemos, agora, apreciar a grande diversidade de in
formação que o termo “ impulso” contém. O conceito traz consigo um grû de complexi
dade que não déve ser esquecido quando usarmos a palavra impulso sozinha. Se, de fato,
- 359-
compreendermos completamente o seu status como um conceito abstrato dc compilação,
será pouco provável que o empreguemos metaforicamentcTio sentido de “ incitação” ou
força que “ dirige, impulsiona o organismo” , ou como uma causa do comportamento.
Similarmente, evitamos referências à sua “ localização” (já que uma abstração não tem
’‘localização”) ou sua “ satisfação” (pois, como pode uma abstração scr satisfeita? ).
Nenhuma das metáforas de uso comum é apropriadamente aplicada ao conceito de
ilmpulso que explicamos. O termo mostra uma relação complexa e significa, nada mais
nada menos, que Diagramas como [ 15.1 ] e 115.2].

Ànliker, J., and Mayer, J. Ôperant conditioning tèchnique for studying
feeding patterns in normal and obese mice. /. appl. P h y s i o l 1956,
8, 667-670.
Broadhurst, P. L. Emotionality and the Yerkes-Dodson law. /. exp.
Psychol, 1957, 54, 345-352.
Clark, F. C. The effect of deprivation and frequency of reinforcement on
variable interval responding. /. exp. Anal. Behav., 1958, 1, 221
228.
Crocetti, C. P. Drive level and response strength in the bar-pressing ap
paratus. Psychol. Rep., 1962, 10, 563-575.
Frick, F. C. An analysis of an operant discrimination. / . Psychol., 1948,
2 6 ,9 3 -1 2 3 .
(E d .), Methods of psychology, New York: Wiley, 1948.
Heron, W. T., and Skinner, B. F. Changes in hunger during starvation.
Psychol. Rec., 1937, 1, 51-60.
Hodos, W. Progressive ratio as a measure of reward strength. Science,
1961, 134, 943-944.
Kleitman, N. Sleep and wakefulness, (rev. and enlarged ed.) Chicago:
Univer. of Chicago Press, 1963.
Miller, N. E., Bailey, C. J., and Stevenson, J. A. F. Decreased “ hunger"
but increased food intake resulting from hypothalamic lesions.
Science, 1950, 11 2 ,2 5 6 -2 5 9 .
Reese, T. W., and Hogenson, Marilyn J. Food satiation in the pigeon.
/. exp. Anal. Behav., 1962, 5, 239—245.
Siegel, P. S. The relationship between voluntary water intake, body
weight loss, and number of hours of water privation in the rat
/. comp, physiol. Psychol., 1947, 40, 231-238.
1938.
Smith, M argaret F., and Smith, K. U. Thirst-motivated activity and its
extinction in the cat. /. gen. Psychol., 1939, 21, 89-98.
Teitelbaum, P. Sensory control of hypothalamic hyperphagia. J. comp,
physiol. Psychol., 1955, 48, 156-163.
-3 6 0 -
Capítulo 16 MOTIVAÇÃO 11
Diz-se frequentemente que os drives (1) ativam ou dáo energia ao organismo, e (2)
dirigem-no para um objetivo. Em vista de nossa definição no capítulo anterior de drive
como sendo uma relação sumária entre dois grupos de observáveis (veja diagramas (15.1)
e(15.2) , somos forçados a rejeitar a noção metafórica de que um drive por si sò possa
ativar ou dirigir um organismo. Contudo, não devemos ser tão drásticos ao ponto de
rejeitar tôdas as idéias que envolvem a ativação e direção. A partir da análise, algumas
podem se referir a propriedades fundamentais do comportamento, que negligenciamos
até agora em nossa discussão de motivação. *
16.1 ASPECTOS DE ATIVAÇÃO F DIRECIONAIS DA MOTÍVAÇÃO
Na terminologia presente, a ativação pode ser interpretada como um aumento na

chamada atividade difusa geral do organismo. Tal atividade, no rato, compreende toilete,
locomoção, fungar, mudanças dc posição, “exploração” e assim por diante. Realmente, o
nível operante de respostas incondicionadas, estudado em capítulos anteriores, é uma
forma desse tipo de atividade. Como nem o reforço passado nem o presente, para essas
atividades, estão aparentes, os comportamentos são frequentemente mencionados como
atividade espontânea. “ Espontâneo” é provavelmente um nome mal empregado desde
que, como veremos, essas atividades podem ser experimentalmente controladas em
alguma extensão. Referir-nos-emos a elas, daqui em diante, como atividades gerais.
Um aparelho conhecido como roda de girar (ou roda de atividade) tem sido usado,
desde o início do século, para estudar a atividade geral em pequenos mamíferos (ratos,
cricetos e camondongos). A roda (fig.16-1) é quase sempre ligada à gaiola-viveiro do
organismo e o animal c livre para entrar na roda a qualquer hora e correr. A questão de
se a motivação está relacionada à ativação é abordada de uma forma direta pelo estudo da
relação de várias operações de drive à atividade de correr na roda. Um resultado
representativo é a descoberta de Richter (1922), de que a atividade aumenta
regularmente com a privação de alimento até o terceiro dia de privação (72 hr), depois do
que: continuando a inanição, advem uma diminuição da atividade de correr.
Muito pouco trabalho foi feito para explorar os efeitos da privação de água na
atividade na roda de girar, \ evidência existente sugere uma atividade aumentando
progressivamente como função do aumento de privação (Hall, 1961).
- 361 -
Figura 16-1. Uma roda de atividade.
Na seção 15.6, vimos que o valor reforçador de reforçadores primários é periódico. A

periodicidade que uma rata mostra na receptividade sexual está correlacionada com
periodicidade na secreção de hormônio sexual e ovulaçao (chamada ciclo estrual) e é vista
muito claramente na atividade de correr. Um ciclo de atividade típico de uma rata
madura aparece na fig. 16-2. Pode ser visto que aproximadamente cada 4 dias a rata é
extremamente ativa. Medidas fisiológicas correspondentes mostram que é precisamente
durante êste período ativo que ocorre a ovuiação, colocando a fêmea maximamente
susceptível à inseminação. Durante este período, diz-se que a fêmea está no “cio” e é
então mais receptiva a avanços sexuais do macho. Durante as partes de baixa atividade do
ciclo, todavia, a fêmea provavelmente resistirá à copulação e lutará contra avanços do
macho. Então, para a rata, existe uma correlação íntima entre atividade geral e valor
reforçador do sexo.
Um outro aparelho, que registra um conjunto algo diferente de atividades gerais é o
estabilímetro (Fig. 16-3). O estabilímetro consiste de uma gaiola (quase sempre
triangular) cujo piso é montado sobre um sistema de suspensão pneumática. Pequenos
movimentos na gaiola e mudanças no equilibrio pelo animal inovem o piso ligeiramente,
mudando o equilíbrio da pressão do ar. Essas mudanças são transmitidas a uma pena
registradora que permite um registro permanente da atividade a ser mantida. Os
movimentos registrados não são necessariamente do mesmo tipo que os movimentos de
- 362-
4
correr na roda. e portanto não devemos tomar como um paradoxo que alguns
investigadores tenham relatado que as privações de alimento e água afetam apenas
ligeiramente, ou nada, as atividades registradas em estabilímetros. Em geral, os tipos de
atividades medidos pela roda parecem ser alterados pela privação, enquanto os medidos
em estabilímetro são muito menos afe+ados. Bolles (1963) suspeitou que essa diferença
significasse que atividades específicas diferentes eram diferencialmente afetadas pela
privação. Com a ajuda de vários assistentes, ele observou periodicamente as atividades de
dois grupos de ratos, por um número de dias, em suas gaiolas. Uma vez por hora, os
experimentadores olhavam brevemente cada rato, e clci^sificavam o que ele estava
fazendo em uma de seis atividades: dormindo, descansando quietamente, de pé em um
local, fazendo toilete, comendo, bebendo. Um grupo (faminto) foi alimentado com 10 g
de alimento uma vez ao dia. Como resultado, esse grupo experimentou uma perda de 15
a 20 por cento em relação ao peso com livre acosso ao alimento. O outro grupo tinha
acesso irrestrito ao alimento e assim foi chamado de grupo ad lib. O regime de privação
de alimento resultou em desvios do padrão de atividade do ad lib. Os ratos famintos
faziam mais movimentos (levantar e locomover) e descansavam mais quietamente que os
ratos ad lib. A privação de alimento parece, assim, mudar o padrão de atividade,
aumentando algumas atividades e diminuindo outras.
O nível operante da resposta, isto é , a atividade operante antes de fortalecida, é
sensível a operações de privação. Crocetti (1962) obteve a curva vista na Fig. 16-4,
quando registrou o nível operante de ratos que pressionavam uma alavanca sob cinco
- 363-
valores diferentes de privação de alimento. A comparação da curva da fig. 16-4 com a da
fig. 15-8 (ambas contendo dados dos mesmos ratos) mostra que a privação de alimento
afetou o nível operante de pressão à barra na mesma maneira que afetou a resistência à
extinção da resposta após o seu fortalecimento experimental.
Figura 16-3. Um estabilimetro para registrar movimentos de pequenos

animaisOiarlow, 1948).
A evidência apresentada de várias fontes sugere que algumas operações de drive

aumentam realmente certas atividades, mesmo que essas atividades nunca tenham sido
diretamente relacionadas ao reforçador primário associado com a operação de drive
utilizada. Embora esta proposição possa ser generalizada para incluir muitos reforçadores
primários, não ê verdadeira para todos. Por exemplo, certas deficiências de vitamina estão
associadas com uma diminuição e não com um aumento de atividade (Hall, 1961). Ao
tentar compreender como as operações de privação estão relacionadas a atividades, alguns
presquisadores apelam para a evolução das espécies. Na história evolutiva das espécies,
pareceria que uma espécie que se torna mais ativa quando foi mais privada de substâncias
vitais devia ter uma certa vantagem de sobrevivência sõbre uma espécie que não tivesse
esta tendência. O tornar-se mais ativo devia levar o organismo a achar alimento ou água
que um indivíduo mais inativo poderia nunca descorir.
Quando nos voltamos para a análise da chamada propriedade diretiva das operações
de drive, notamos que a idéia expressa é menos experimental que de interpretação. Uma
operação de drive é direcional no sentido em que age seletivamente no comportamento
associado com uma dada classe de reforçadores, e não em todos os comportamentos
igualmente. Assim, a privação de alimento afeta maximamente comportamentos
reforçados com alimento, a privação de água afeta maximamente comportamentos
reforçados com água, e assim por diante. Afetando-se seletivamente os reforçadores,
certos comportamentos vêm a ter maior probabilidade de ocorrência que outros. Por
exemplo, quando um chimpanzé, que tenha sido altamente privado de alimento e apenas
ligeiramente privado de uma companhia, é colocado numa situação onde pode
desempenhar ou uma cadeia de comportamento que leva ao alimento (digamos,
pressionar uma alavanca) ou uma que leva a um companheiro (digamos, entrar em um
compartimento onde seu companheiro está confinado), provavelmente fará o primeiro.
-3 6 4 -
Figura 16-4. Nível operante da taxa de pressão à barra em relação a horas
de privação de alimento ( segundo Crocetti, 1962)
Esta é a essência da direção, e realmente a direção baseia-se parcialmente na operação de

drive. Mas outra condição crítica para a direção baseia-se na história passada de
condicionamento. A menos que exista o comportamento para levar ao reforçador, a
operação de drive não dirigirá o organismo para ele. O melhor que fará será mudar o
padrão de atividade geral, ou fazer com que a aquisição ocorra mais rapidamente; por si
só, a operação de drive não tem poder de dirigir.
O exemplo do chimpanzé levanta o problema interessante sòbre o que acontece se
suas operações de drive são executadas simultaneamente, e as cadeias de comportamento
são topograficamente incompatíveis. Isto é, consideremos um chimpanzé privado tanto
de alimento quanto de sexo, e colocado em uma situação onde a execução de um
comportamento que leva a um reforçador impede a obtenção do out o. Se o animal corre
para seu companheiro, desliga seu de alimento. Se começa a pressionar a alavanca
para o alimento, uma porta se fecha bloqueando sua passagem para o companheiro. Esta
é uma das situações frequentemente descritas como um conflito de motivos. Quantas
vêzes nos vemos forçados a escolher entre um reforçador e outro? Na presente
terminologia, a situação revela-se semelhante ao método de preferência usado para avaliar
valores relativos de reforço. Talvez o conflito seja, então, melhor descrito como um
conflito entre valores de reforço.
16.2 INCENTIVO
A qualidade e quantidade de um reforçador, duas variáveis relacionadas, estão

associadas de perto com o valor do reforço. Já vimos como um alimento pode ser
adulterado com quinino para diminuir seu valor reforçador. A qualidade de um
reforçador alimentar pode também ser adversamente afetada pela mistura com uma
porção de celulose não metabolizada. Jsto constitue, com efeito, uma diluição do reforço
e como tal é uma maneira de variar o valor reforçador mantendo constante o volume da
substância ingerida. A diluição, naturalmente, é particularmente conveniente para
manipular o valor reforçador de líquidos. Guítman (1953) reforçou a pressão à barra por
- 365 -
ratos famintos, com uma gota de solução de sacarose em um esquema IV. A medida que
a concentração de sacarose na solução aumentava, a taxa de pressão à barra aumentava,
alcançando um máximo quando a concentração de sacarose era de 32%. Concentrações
acima dês te valor produ/iam um declínio na taxa de resposta.
Os efeitos comportamentais da quantidade de reforçador podem ser estudados de
várias maneiras. Se o reforçador é alimento, e a qualidade é mantida uniforme, o volume
pode ser variado. Km geral, ratos adquirem cadeias de labirinto mais rápido e estabilizam
em urna assíntota mais baixa de erros por corrida, quando recebem mais alimento por sua
performance. A quantidade pode também ser estudada pela variação do tempo de acesso
ao reforçador. Sujeitos ratos correm mais rápido paia um companheiro se se permite que
permaneçam mais tempo com ele: pombos bicam mais rápido se se permite mais tempo
de acesso ao grão reforçador contingente.
Os efeitos comportamentais da variação da quantidade e qualidade de reforço
primário podem ser categorizados sob o rótulo de funções de incentivo Como um
substantivo, incentivo ó um sinônimo de reforço, mas, como um adjetivo, podemos usá-lo
para denotar a classe de variáveis que mudam o valor reforçador através de mudanças nas
propriedades do estímulo reforçador. Para um sumário e interpretação dos vários efeitos
comportamentais que as variáveis de incentivo podem ter, o estudante interessado pode
consul tar Cofer e Applcy (1964).
16.3 FATORES FISIOLÓGICOS NA MOTIVAÇÃO
Temos tido pouca oportunidade para mencionar as propriedades do sistema nervoso

neste tratamento dos princípios comportamentais. Esta negligência não deve ser vista
como uma negação de que estruturas e funções nervosas estão ligadas aos vários
comportamentos que descrevemos. Em vez disso, isto advém do reconhecimento de que
o imenso volume de informação que constitue a ciência comportamental deve, por
necessidade, ser dividido em partes algo arbitrárias. Psicologia, Sociologiae Antropologia
constituem tais divisões: assim fazem as disciplinas híbridas de genética do
comportamento e psicologia fisiológica. Embora tenhamos notado em outro lugar que as
leis do comportamento não podem ser subordinadas ou substituídas pelas leis de
fisiologia (ou química, ou mecânica, ou física nuclear) o sistema nervoso esta
intimamente envolvido em todos os fenômenos comportamentais. Um cérebro e medula
intactos, funcionando, são um pré-requisito para tôdas as leis do fortalecimento operante
c muitas das leis do reflexo.
Evidentemente, os fenômenos naturais transcendem as fronteiras arbitrárias de
disciplinas. Assim, o comportamento envolve um complexo de eventos físicos,
‘ ioquímicos, psicológicos, fisiológicos e sociológicos. A posição que adotamos é ditada
pela conveniência: a psicologia preocupa-se com relações funcionais entre meio e
comportamento. Leis relacionando comportamento à função nervosa levam-nos do
território estritamente psicológico para o da fisiologia. Mas sempre que o comportamento
é a variável dependendo de estudos de fisiologia, êles contribuem para o nosso
conhecimento de comportamento e fisiologia; daí a designação psicologia fisiológica. Em
um tratamento introdutório de psicologia, todavia, a psicologia fisiológica deve ser vista
como uma especialidade avançada, que não pode ser tratada com certo grau de
profundidade. Resolvemos introduzir alguns de seus achados no contexto de motivação,
porque o quadro que está emergindo do mecanismo fisiológico subjacente ao reforço
- 366-
ajuda a compreender o conceito comportamental de drive. Us estudos fisiológicos
prometem dar-nos o conceito de valor reforçador, com um referente físico, em várias
estruturas anatômicas, e a juntar um número de operações de drive ambientalmente
diversas, descobrindo seus efeitos comuns no organismo.
Mecanismo de comer e beber. Na elaboração gradual dos mecanismos corporais
associados com a alimentação, encontramos um exemplo representativo da procura de
eventos fisiológicos subjacentes a fenômenos comportamentais. Mais precisamente, essa
procura diz respeito a certos eventos e processos internos que acompanham mudanças no
poder reforçador de alimento. Desde a antiguidade até tempos recentes, pensava-se que o
estado do estômago tinha um papel importante no controle do valor reforçador do
alimento. O fato de as “ caimbras de fome” frequentemente acompanharem
informações de grande fome em humanos levou a investigações sôbre as relações entre
câimbras de fome, contrações do estômago e fome. Cannon e Washburn (1912)
estudaram contrações do estômago usando uma técnica simples em que um sujeito
humano engolia um pequeno balão de borracha. Uma vez no estômago, o balão era
inflado, e qualquer contração estomacal que ocorresse apertava o balão. As variações
resultantes de pressão do ar no balão eram por sua vez transmitidas a uma pena
registradora. O sujeito pressionava uma chave telegráfica sempre que sentia câimbras de
fomel. Cannon e Washburn mostraram que as contrações estavam bastante
correi aciona das com o relato de câimbra de fome, e concluíram que essas contrações
eram a causa da fome. A hipótese ganhou atenção imediata porque parecia oferecer um
mecanismo simples e direto para comer e beber. Mas logo foi visto que pacientes que não
tinham estômago comiam de maneira normal, e relatavam “ fome” embora nunca
tivessem contrações de estômago. As implicações dessas observações foram ampliadas em
experimentos que mostraram que ratos comiam normalmente, embora os nervos do
estômago fôssem isolados cirurgicamente do cérebro. Outras observações mostraram que
as contrações de fome eram abolidas pelas primeiras mastigadas de alimento, embora o
alimento continuasse a ter um alto valor reforçador muito depois que as contrações
cessavam. No fim, a teoria de fome de contração do estômago teve que ser abandonada,
porque não explicava muitos dos fatos do comportamento de comer.
Um mecanismo mais complicado foi indicado pelos primeiros experimentos de

Tschukilshew (citado em Templeton e Quigley, 1930) em que a transfusão de sangue de
animais privados de alimento para animais bem alimentados aumentou a motilidade do
estômago do receptor. Experimentos mais recentes mostraram que a transfusão de sangue
entre ratos famintos e saciados (Fig. 16-5) afeta o consumo de alimento dêsses animais. A
alimentação e o jejum parecem mudar algum aspecto do sangue, o que, por sua vez,
afetaria mecanismos cerebrais, levando a uma mudança no valor reforçador do alimento.
Mayer (1953) teorizou que uma variável mediadora possível é a concentração relativa de
glicose arterial e venosa, e que as células no cérebro onde essa concentração pode ser
“medida” situam-se em uma região restrita do hipotálamo (Figc 16-6).
1. Os tèrmos "fo m e " e "sêde" são usados no seu sentido descritivo com o palavras
breves para significar que alimenxo e água, respectivamente, têm alto valor
reforçador.
- 367-
Trabalho experimental independente confirmou que certas estruturas no hipotálamo
estão intimamente relacionadas ao poder reforçador do alimento. Km uma subseção
anterior, descrevemos efeitos comportamentais causados pelo dano experimental na
região ventromedial do hipotálamo. Ratos com destruição nessa região comem demais e
tornam-se obesos. A estimulação elétrica dessa região do cérebro também tem efeito no
comportamento motivado por alimento.
I igura 16-5. Quando sc transfere o sangue de um rato faminto pura um

bem alimentado, o consumo de alimento 6 alterado (Sanford, 1961).
Finos eletrodos podem ser implantados no cérebro em localizações bem precisas, sem
lesar estruturas vizinhas. Os eletrodos são guiados no tecido nervoso através de um
buraco perfurado no crânio, e então colocado um pedaço de plástico cimentado no
crânio, cobrindo o buraco. Finalmente, o couro cabeludo é costurado. Depois de alguns
dias de recuperação da operação, o animal operado recupera a saúde normal. O animal
não parece de modo algum importunado pela adição dos eletrodos, e vive normalmente.
Através dos eletrodos implantados, podem ser aplicadas correntes elétricas diminutas à
estrutura do cérebro onde estão localizadas as pontas dos eletrodos. Os efeitos
comportamentais de tal corrente elétrica são então medidos. Quando a região
ventromedial do hipotálamo é assim estimulada, o consumo de alimento diminui. Foram
encontradas outras áreas do cérebro onde a estimulação leva um animal “saciado” a
começar a comer. O quadro dos mecanismos fisiológicos subjacentes á privação e
alimentação ô complexo e ainda fragmentário. Nenhuma estrutura corporal única medeia
o valor reforçador do alimento. O estômago, o sangue, o cérebro e provavelmente outros
sistemas corporais interagem para determinar quando o alimento será reforçador.
Pode-se contar uma história experimental análoga para o mecanismo de beber, mas
podemos indicá-la somente brevemente. As primeiras explicações foram centralizadas no
papel da secura relativa da garganta e boca e na importância das secreções salivates. Boca
e faringe secas eram igualadas a sede. Trabalhos posteriores mostraram que a salivação
poderm não ser crucial desde que animais tanto bebiam como paravam de beber
normalmente mesmo quando seus dutos salivares eram fechados. Ao contrário, em
- 368-
I igura 16-6. Diagrama esquemático do cérebro humano (Rosenzwcig,
1962).
experimentos em que a água que os cachorros bebiam nunca alcançava seus estômagos,
mas saía por uma fistula no pescoço (Fig. 16-7), cachorros privados de água continuaram
a beber indefinidamente; embora suas gargantas e bocas fossem mantidas constantemente
molhadas. A atenção experimental mudou gradualmente para o papel da água contida
nas células do corpo. Um pequeno deficit de concentração normal de água nas células do
corpo c sangue parece ser um fator crítico no beber (Gilman, 1937). O trabalho recente
tem se dedicado à localização de centros cerebrais no hipotálamo que regulam o
comportamento de beber e parar de beber.
Voltamo-nos agora à uma breve descrição de alguns métodos pelos quais os
psicofisiologistas tentam descobrir a lógica da mecânica corporal interna. Suas principais
técnicas são (1) estimulação do tecido nervoso por corrente elétrica ou por substâncias
químicas ou drogas, (2) destruição cirúrgica ou farmacológica ou isolamento de áreas
I igura 16-7. (Segundo Rosen/woig, 1962).

consideradas cruciais, (3) registro de atividade elétrica local no cérebro, (4) modificação
de aiguma estimulação encontrada na função normal, enquanto se deixa outros aspectos
intatos (tal com o o experimento de beber simulado da Fig. 16-7), (5) medidas de
numerosas variáveis fisiológicas em relação ao com portamento (tal com o nível de glicose
no sangue c água contida nas células), (6) comparação de processos comportamentais
com processos fisiológicos (por exem plo, a comparação do processo de saciação com
contrações no estômago mostrou que os dois não eram paralelos, indicando que um,
provavelmente, não é subjacente ao outro).
Os métodos dos psicofisiologistas podem levar a importantes descobertas
comportamentais. Olds e Milner (1954) implantaram eletrodos profundamente em
cérebros de ratos com o objetivo de verificar se a estimulação em uma região associada
com o sono facilitaria ou dificultaria a aquisição de operantes simples. Os investigadores
ficaram surpresos ao descobrir que a estimulação, por si só, tinha um efeito marcante no
comportamento do rato.
No experimento teste que estávamos realizando, o animal foi colocado em uma

grande caixa com os cantos rotulados A, B, C e D. Sempre que o animal ia para o
canto A, era dado um choque elétrico fraco em seu cérebro pelo experimentador.
Quando o teste foi realizado no animal... êste continuou voltando para o canto A.
Depois de vários retornos no primeiro dia, finalmente foi para um lugar diferente e
dormiu. No dia seguinte, todavia, parecia mais interessado no canto A.
Neste ponto supusemos que o estímulo devia provocar curiosidade; não
pensávamos ainda nisto como recompensa. Experimentação continuada ccm o
mesmo animal logo indicou, para nossa surprèsa, que essa resposta ao estímulo era
mais do que curiosidade. No segundo dia, depois que o animal havia adquirido o
ligura 16-K Rdlo t.*stimulamlo-sc em uma faixa ik' Skinner (seguiuU* Okls. 1956).
-370-
hábito de vdtar ao canto A para ser estimulado, começamos a tentar levá-lo para o
canto B, dando um choque elélrico sempre que ele tomava um passo nessa direção.
Em questão de cinco minutos o animal estava no canto B. Depois disso, o animal
podia ser dirigido para quase todos os pontos na caixa ao desejo do experimentador.
Cada passo na direção certa era pago com um pequeno choque; com a chegada no
lugar apontado, o animal recebia uma série mais longa de choques (Olds, 1956).
Evidentemente, a estimulação do cérebro estava agindo como um reforçador com o

qual o comportamento operante podia ser rapidamente modelado. Depois o animal foi
colocado na caixa de Skinner (Fig. 16-8) e se permitiu que ele estimulasse seu próprio
cérebro em qualquer taxa que escolhesse. Altas taxas de resposta foram emitidas sob
contingências crf. As similaridades entro a recompensa de estimulação do cérebro e
reforçadores positivos mais convencionais tais como alimento e água são pronunciadas.
Como outros reforçadores positivos, a recompensa de estimulação do cérebro mantém
operantesRF, gerando alta resistência à extinção depois de contingências intermitentes, e
permite poderoso controle de esquema (Pliskoff, Wright e Hawkins, 1965). Por outro
lado, os ciclos de privação e saciação da recompensa de estimulação do cérebro parecem
ser mensuráveis em segundos, em vez de horas ou dias.
Trabalho adicional por Olds e outros indica que não há um, mas um número de
locais, no cérebro, onde a estimulação elétrica exerce efeito reforçador (Olds, 1962).
Muitos desses são os mesmos lugares que parecem, de outros experimentos, estar ligados
ci eficácia do alimento, sexo, atividade e outros reforçadores primários.
16.4 REFORÇADORES PRIMÁRIOS ADICIONAIS
Muitos dos princípios de comportamento elaborados nos capítulos anteriores vieram

dos estudos em que os reforçadores primários consistiam de alimento para organismos
privados de alimento, ou, ocasionalmente, água para indivíduos privados de água. Água e
alimento são reforçadores poderosos e seguros e suas privações fornecem uma operação
direta e exata para ativar sua força. Todavia, há uma quantidade de outros reforços
primários que, ao contrário de água e alimento, não são essenciais para a vida do
organismo. Nesta seção, consideraremos brevemente reforçadores primários tais como
atividade, novidade, exploração, manipulação, afeição e contato corporal. A importância
de alguns desses reforçadores primários foi reconhecida apenas recentemente. Em muitos
casos, ainda temos muito o que descobrir sõbre as operações que determinam suas forças
reforçadoras. Em outros casos, tais como exploração, novidade e afeição, a especificação
real da classe de estímulos reforçadores está longe de ser estabelecida. Embora êsses
problemas apresentem dificuldades reais para o desenvolvimento do conceito de drive nos
termos desses reforçadores, êles não diminuem a importância empírica de tais
reforçadores em modificar e controlar o comportamento. Muito do comportamento dc
sêres humanos, que vivem em uma sociedade onde fome e privação de líquidos são raras,
parece estar muito distante de drives associados com privação de alimento ou água. É
provável que a análise de reforçadores primários adicionais mostre ser essencial para
interpretar a complexa motivação humana.
1. Atividade. Numa seção anterior, consideramos várias técnicas para medir as
chamadas propriedades de ativação da privação de alimento, sexo e água. Além dêsse
controle sobre a atividade geral, parece que a privação de atividade, por si só, serve como
-371 -
uma operaçao de drive para atividade. Por exemplo, um rato confinado em uma pequena
câmara onde seus movimentos são restritos, irá, dando-se-lhe acesso a uma roda de correr,
correr uma quantidade quase proporcional ao tempo em que esteve, anteriormente,
confinado. A atividade é, assim, uma função que aumenta com as horas de confinamento
(Hall, 1961). O valor reforçador de atividade aumentado depois de confinamento pode
ser demonstrado também por um aparelho, o estabilímetro (gaiola de balanço). Quando
colocados em uma gaiola de balanço depois de longos períodos de inatividade forçada,
ratos movem-se muito mais que o usual. Kagan e Barkun (1954) mostraram que ratos
pressionavam uma alavanca para ter acesso a uma roda em que pudessem correr.
Aparentemente, a atividade pode servir como um reforçador primário para respostas
operantes.
2. Exploração. Em condições normais, os organismos preferirão quase sempre
colocar-se em uma situação nova. Isto é particularmente verdadeiro quando a situação
nova apresenta uma oportunidade para “exploração”. É bem conhecido que um rato
faminto, quando introduzido em uma situação nova que contém alimento, irá
invariavelmente “explorar” a situação antes de comer. Isto sugere que o valor reforçador
da exploração suplanta o do alimento, pelo menos inicialmente. Como uma
demonstração experimental desse reforçador, imagine um labirinto T em que um dos
braços contém um elaborado labirinto tipo “ tabuleiro” (Fig. 12-2), e outro braço contém
uma caixa pequena e comum no fim. Ratos que não estão privados nem de alimento nem
de água irão correr consistentemente para o lado que tem o labirinto em tabuleiro se se
permite por um breve período de tempo que “explorem” o labirinto em tabuleiro
quando chegam a ele.
Estímulos novos não precisam ser tão complicados como o labirinto em tabuleiro.
Ratos e camondongos pressionarão uma alavanca se cada pressão produz um breve flash
operante discriminativo de empurrar um painel a/.ul (segundo Murray,

1964, baseado na descrição de Butler, 1953).
- 372 -
importante em se um rato pretere pressionar uma aJavanca qut liga uma luz, ou
pressionar a outra alavanca que desliga uma luz (Lockard, 1963).
Reforçadores capazes de fortalecer o comportamento algo vagamente denominado
“curiosidade” foram demonstrados por Butler (1953). Macacos novos foram colocados
em uma caixa opaca em penumbra com duas janelas cobertas, uma azul e outra amarela.
Empurrar a janela amarela não tinha nenhum efeito, mas o empurrar a janela azul abria-a
por 30 seg, mostrando várias cenas (Fig. 16-9). Algumas cenas tais como um grande
cachorro rosnador, não eram reforçadoras e levavam um pequeno empurrão. Outras
cenas, como visão do laboratório e experimentador, outros macacos e objetos de
brinquedo móveis tinham valor reforçador apreciável. Os macacos confinados
rapidamente discriminavam a côr do painel e produziam as cenas reforçadoras
frequentemente. Esse comportamento parece conter alguma relação com privação, desde
que quanto mais o animal era confinado na caixa sem oportunidade de produzir uma
cena, maior sua taxa de resposta quando dada a oportunidade. Butler (1957) encontrou a
função vista na fig. 16-10, quando a pressão ao painel era reforçada em um esquema IV
com a visão, por 12 seg; de uma colônia de macacos.
Crianças novas gastam muito tempo com “brincar” e manipular objetos. Essa
manipulação parece ter propriedades reforçadoras intrínsecas e não precisa ser
dependente da associação com outros reforçadores primários. Harlow (1950) demonstrou
que macacos irão desmanchar quebra-cabeças mecânicos do tipo visto na Fig. 16-11, sem
nenhum reforço adicional . Parece que êsses macacos resolverão os problemas meramente
pelo gosto de resolvê-los. É por isto que tais reforçadores são chamados intrínsecos. Por
um período de 10 hr. de observação, Harlow notou que o número de quebra-cabeças
abertos diminuía progressivamente, sugerindo um processo de saciação.
3. Contato físico para organismos jovens: reforçadores de "afeição" : Pode-se
suspeitar que o contato físico com a mãe deve ser um reforçador para um organismo
jovem. Tal reforçador teria, obviamente, utilidade biológica para manter o organismo
jovem perto de sua mãe onde alimento, abrigo e proteção poderiam ser encontrados
No. de horas de privação da exploração visual.
I igura 16-10. Taxa de resposta cm IV reforçada por uma breve exposição a

uma cena visual com função de horas de privação visual ( Butler,!957).
- 373 -
Pesquisa realizada por Harlow demonstrou que o contato do corpo é um reforçador
muito poderoso, e além disso não depende de reforços primários adicionais de alimento,
abrigo e proteção com os quais é normalmente associado. O contato, por si sô, é um
reforçador primário poderoso e específico. Harlow (1960) criou macacos jovens em
completo isolamento de suas mães. Das observações do reflexo de segurar, em macacos
bebês (Fig. 16-12), Harlow suspeitou que poderia ser construída uma mãe “sub-rodaga”
(substituta) que poderia fornecer certos aspectos do contato físico que as mães
verdadeiras fornecem.
Figura 16-11. Quebra-cabeças mecânico que macacos resolverão sem

qualquer reforço adicional (Harlow, 1950).
O reflexo de segurar e tocar é eliciado por um objeto cilíndrico; então, objetos do tipo na
Fig. 16-13 foram colocados nas gaiolas dos bebês macacos desde o nascimento. Esses
objetos cilíndricos (mães substitutas) eram idênticos em construção exceto por suas
cabeças (um aspecto determinado mais tarde como irrelevante) e suas superfícies. Ambos
os objetos foram construídos de arcabouços de arame, mas o arcabouço de arame de um
estava coberto por uma camada grossa de tecido , enquanto o arcabouço do outro estava
exposto. Harlow referiu-se ao objeto coberto de tecido macio como “mãe de pano” ; e o
outro objeto ele chamou de “ mãe de arame”. Os macacos criados em gaiolas contendo
ambas essas mães substitutas permaneciam muito tempo de sua vida infantil em contato
com a “ mãe de pano” , segurando-se a “ ela” muito à maneira do reflexo de segurar da
Fig. 16-12. Por outro lado, eles ignoravam virtualmente a “ mãe de arame”.
Para determinar se o reforçador de contato constante fornecido pela “mãe de pano”

dependia da história de associação com reforço de alimento, alguns macacos mamavam
de uma mamadeira inserida no “ tórax” da macaca de arame e o restante mamava de uma
mamadeira da macaca de pano. Mas a associação da mãe de arame com alimento não
modificou a preferência do infante macaco por segurar-se na mãe de pano. O número de
horas gastas com as duas mães para os dois grupos de macacos é visto na Fig. 16-14. Os
macacos alimentados na mãe de arame passavam menos tempo nela do que os macacos
alimentados na mãe de pano. Na Fig. 16-13 vemos como alguns macacos resolviam o
-374-
problema de alimentar-se de Uina mãe enquanto t i n h a » t a t o com a outra. Em outros
experimentos, Harlow demonstrou que o valor reforçador da mãe de pano perdurava até
dois anos. Essas descobertas atestam a grande durabilidade desse reforçador. As
propriedades reforçadoras críticas da substituta parecem ser (1) sua forma cilíndrica e (2)
sua maciez. Quando se usou uma tábua chata coberta de tecido, esta não gerou os efeitos
vistos pelo cilindro coberto de pano da Fig. 16-13. O “ abraço” não era possível com uso
da tábua.
I igura 16-1 2. Reflexo de segurar, em macacos rhesus recém-nascidos,

eliciado por um objeto cilíndrico (Harlow, 1960 ).
Harlow indicou que o privar os bebês macacos de suas mães* ou de mães substitutas
apropriadas, pode interferir marcantemente com respostas emocionais e padrões de
companhia, mais tarde . Evidentemente, a disponibilidade do reforçador de contato no
início da vida é crítica para a ocorrência normal de certos padrões de comportamento na
vida adulta. O trabalho de Harlow fornece um início impressionante neste problema
muito difícil dos efeitos de experiências iniciais em comportamentos maduros
posteriores. Desde Freud, os psicanalistas têm enfatizado que certas experiências iniciais
críticas são de grande importância para o ajustamento de padrões emocionais de sêres
humanos adultos; mas, através de experimentação controlada, a exploração dessas idéias
tem sido difícil. O paradigma de Harlow pode oferecer um esquema útil para testar
algumas dessas idéias.
- 375-
1*igura 16-13. Macaco rhesus jovem mamando dc um objeto de arame
cilíndrico, enquanto agarra-se a um objeto semelhante coberto com tecido
(Harlow, 1960).
Idade média em dias
Figura 16-14. Horas, por dia, passadas com as mães substitutas de pano e
arame em várias idades, em dias (Harlow, 1960).
16.5 DRIVES ADQUIRIDOS
No tratamento presente de motivação excluímos completamente uma discussão

sôbre reforçadores adquiridos. Justificamos essa exclusão baseados em que as
propriedades dos reforçadores condicionados eram bem explicadas através de uma certa
história passada com contingências comportamentais de discriminação. Neste capitulo e
no capítulo 15 limitamos nossa atenção a operações outras, que não aquelas na história
passada de condicionamento do organismo, que afetam os reforçadores. Se, todavia, fosse
possível criar um reforçador que (1) desse evidência de ser um reforçador terminal de
uma cadeia de comportamento e (2) uma vez criado, fosse sensível a várias operações de
estabelecimento e redução muito à maneira pela qual os reforçadores primários são,
teríamos que concordar que tal reforçador alcança as condições necessárias para um drive
adquirido. Ao contrário dos reforçadores condicionados do capítulo 11, esses
reforçadores adquiridos não seriam dependentes de reforço primário subsequente para
que sua força continuasse. Dois fenômenos comportamentais, retirados de contextos algo
diferentes, parecem permitir uma consideração tentativa como drives adquiridos deste
tipo.
1. Imprinting. Certos objetos em movimento, se apresentados no início da vida,
podem adquirir propriedades reforçadoras para espécies cujos filhotes são capazes de se
locomover logo depois do nascimento. Os primeiros relatórios descrevem o
comportamento exibido por gansos, patos e pintos e outras aves, de “seguir” certos
objetos em movimento. Hess (1958) descreveu as primeiras observações do zoologista
austríaco Konrad Lorenz:
“Em uma fazenda perto de Viena, Lorenz dividiu um grupo de ovos postos por
uma gansa em d d s grupos. Um grupo foi chocado pela gansa; outro grupo foi
chocado por uma incubadeira. Os gansinhos chocados pela gansa imediatamente
seguiram sua mãe pela fazenda. Os outros, todavia, não viram sua mãe. A primeira
coisa que eles viram foi Lorenz. E então seguiram Lorenz pela fazenda (Hess, 1958,
p. 81)” .
Figura 16-15. Um aparelho usado no estudo de imprinting. Consiste de

uma pista circular na qual um pato chamariz pode ser movimentado. No
desenho, é visto um patinho seguindo o chamariz (Hess, 195 9).
-377 -
Esse fenômeno, no qual uma experiência no início da vida dos gansos influenciou seu
comportamento mais tarde, Lorenz chamou de “imprinting”. Logo foi estabelecido que a
experiência tinha que ocorrer durante um período crítico no início da vida do organismo
para ser efetivo. Trabalhes subsequentes devotados ao imprinting têm demonstrado que
os tipos de objetos que podem fazer surgir tais comportamentos dc seguir são tão
arbitrários como caixas de papelão ou esferas em movimento. Esses trabalhos posteriores
tem tentado qualificar as condições sob as quais ocorrerá o imprinting.
Horas por dia
I-igura i 6-16. Teste positivo de resposta dc preferencia para o objeto-teste

(Hess. 1959).
Têm indicado também que “seguir” é simplesmente uma manifestação de que um certo
objeto tornou-se um reforçador poderoso. Qualquer comportamento instrumental que
traga a ave jovem a uma maior proximidade com o objeto é fortalecido.
O aparelho utilizado por Hess (visto na Fig. 16-15) consiste de uma pista circular
fechada de Plexiglass na qual um pato chamariz pode ser movido por um motor a várias
velocidades. Um patinho, nascido poucas horas antes, c colocado na pista e o modelo
começa a mover-se em volta da pista. Em alguns experimentos, um som sai de um alto
falante de dentro do modelo. A operação de imprinting consiste de 1 hora, ou menos, de
exposição ao objeto em movimento. Mais tarde, os patinhos, são testados para
determinar preferência de resposta para o modelo de imprinting em comparação com
outros objetos. Um achado surpreendente é que a operação de imprinting deve ocorrer
durante um período de idade para ser efetiva na determinação da preferência. A fig.
16-16 mostra isto graficamente. Para o caso de patinhos selvagens, uma idade de 13-16 h
depois do nascimento dá o máximo de imprinting. Parece que, além de 30 h depois do
nascimento, o imprinting já não é possível nesta espécie.
A fim de estabelecer que o objeto “ imprinted” age como outros reforçadores,
Hoffman, Searle, Toffcy e Kozma (1966) modelaram uma resposta de bicar na chave que
produzia uma iluminação breve (5 seg) do objeto “ imprinted” em movimento. Em seus
- 378-
estudos, a arbitrariedade do objeto “imprinted” foi enfatizada. 0 ubjeto era uma
mamadeira de leite sendo levada em um vagão de um trem modelo. Os patinhos recebiam
uma exposição, anterior ao imprinting, à mamadeira de leite e mais tarde adquiriram as
Rs de bicar a chave quando cada bicada produzia um aparecimento breve da mamadeira
em movimento como reforçador. Subsequentemente, uma razão 5-1 foi mantida. Os
sujeitos que não tiveram exposição anterior ao imprinting à mamadeira não bicavam a
chave, mostrando que a operação de imprinting foi essencial para a criação desse tipo de
reforçador.
Embora o objeto “imprinted” pareça adquirir propriedades reforçadoras, essas
podem não durar indefinidamente. Hoffman, Toffey, Searle e Kozma mediram a
quantidade de tempo pelo qual os patinhos “imprinted”, vivendo constantemente no
aparelho, mantiveram a visão da mamadeira de leite pelo bicar da chave. Os
experiment adores descobriram que, à medida que os animais cresciam, tendiam a
trabalhar cada vez menos pelo objeto. Alguns resultados típicos são vistos na Fig. 16-17.
Por volta de 60 dias, o valor do objeto em movimento como reforçador havia quase
dissipado completamente. Um fato interessante é o de que o reforçador podia ser
restabelecido temporariamente através de choque nos patinhos, ou pela apresentação de
outros estímulos geradores de emoção.
Dias após a incubação
Figura 16-17. Quantidade média de tempo por dia, em que um objeto em

movimento foi mantido à vista como uma função da idade dos patinhos. A
operação de “ imprinting” com este objeto havia sido executada
anteriormente, cada ponto representa uma média de 3 dias entre trés
sujeitos (H.S. Hoffman, dados não publicados).
Os resultados dos estudos de imprinting sugerem que o procedimento de imprinting é

uma operação que cria uma classe de reforçadores que se parecem com o objeto
“ imprinted” . Como esse novo reforçador é um reforçador terminal de uma cadeia de
comportamentos, suas propriedades se parecem mais com aquelas dos reforçadores
- 379-
Figura 16-18. Rato viciado toma injeção de droga à vontade, pela pressão à
barra. A solução de droga vem pelo tubo e então, através de uma cânula
cronicamente implantada, penetra na veia jugular. Uma corrente em uma
coleira impede que o tubo gire quando o animal se move na gaiola (segundo
Weeks, 1964).
primários do que com as de reforçadores secundários. Ao contrário de um reforçador
condicionado, não é sujeito a um procedimento de extinção, nem serve como um
para uma resposta que produza um reforçador subsequente mais primário.
2. Vício Sabe-se bem que a administração repetida de certas drogas cria uma
dependência em sua administração contínua. Além disso, essas drogas (tal como o ópio e
seus derivados morfina, heroína e demorol) vem a adquirir propriedades reforçadoras
poderosas. Os humanos que desenvolvem tais dependências, chamadas de vícios, tudo
farão para obter injeções da droga. A despeito de sua prevalência na sociedade moderna,
as condições que controlam o vício (suas causas e curas) rião são bem entendidas.
Estudos recentes com sujeitos animais têm utilizado técnicas de resposta de operante
livre para estudar o poder reforçador dessas drogas depois do vício. 0 principal objetivo
desses estudos é clarificar as condições que estão relacionadas ao vício.
A operação que cria o reforçador de vício consiste da apresentação repetida
(usualmente por injeção) de morfina e outros compostos em doses gradualmente
maiores. Como uma conseqüência dessa série de administrações, a droga adquire
poderosas propriedades reforçadoras. 0 vício experimental tem sido produzido em ratos
e macacos por êsse método de aumentar gradualmente a dose da droga. As propriedades
do reforçador adquirido da droga foram estudadas permitindo-se a um rato viciado os
-3 8 0 -
meios para administrar o narcótico em si próprio (Weeks 1964). O rato viciado trabalhava
numa caixa de Skinner onde cada pressão à barra inicialmente produzia injeção
controlada de um narcótico selecionado. O sistema de injeção consistia de um tubo e
uma cânula pela qual a droga era levada, em solução, diretamente para a veia jugular do
rato (Fig. 16-18). Os resultados mostram que ratos viciados adquirem a R de pressionar a
alavanca quando isso leva a várias quantidades de morfina. Curvas típicas de RF
associadas com razões variando entre 10 e 400 pressões à barra para uma única injeção
demonstram a natureza extremamente poderosa do reforçador morfina. Embora
ocorressem periodieidades de pouca duração no vdor reforçador adquirido (efeitos de
saciação), a duração a longo prazo do reforçador era indefinida. Um macaco trabalhando
sob condições semelhantes a essas descritas para o rato permaneceu viciado por 21 meses
(Weeks 1964). A técnica revela-se promissora em trazer resultados que podem sugerir os
procedimentos a serem usados no controle das propriedades do reforço de drogas, uma
vez que tenha ocorrido o vício.
O controle dos reforçadores de vício tem implicações óbvias para o controle de
de vícios em humanos.
REFERÊNCIA PARA O CAPÍTULO 16
Bolles, R. C. Effect of food deprivation upon the rat’s behavior in its

home cage. / . comp, physiol. Psychol., 1963, 56, 456-460.
Butler, R. A. Discrimination learning by rhesus monkeys to visual-
exploratory motivation. J. comp, physiol. Psychol., 1953, 46, 95-98.
Butler, R. A. The effect of deprivation of visual incentives on visual
exploration motivation in monkeys. J. comp, physiol. Psychol.,
1957, 50, 177-179.
Cannon, W. B., and Washburn, A. L. An explanation of hunger. Amer.
J. Psychol., 1912, 29, 441-452.
Cofer, C. N., and Appley, M. H. Motivation: theory and research. New
York: Wiley, 1964.
Crocetti, C. P. Drive level and response strength in the bar-pressing
apparatus. Psychol. Rep., 1962,10, 563-575.
Gilman, A. The relation between blood osmotic pressure, fluid distribu
tion, and voluntary water intake. Am er . J. Physiol., 1937, 120,
323-328.
Guttman, N. Operant conditioning, extinction, and aperiodic reinforce
ment in relation to concentration of sucrose used as reinforcing
agent. J. exp. Psychol., 1953, 46, 213-224.
Hall, J. F. Psychology of motivation. New York: Lippincott, 1961.
(E d .), Methods of psychology, New York: Wiley, 1948.
Harlow, H. F. Learning and satiation of response in intrinsically moti
vated complex puzzle performance by monkeys. J. comp, physiol.
Psychol., 1950, 43, 289-294.
Harlow, H. F. Primary affectional patterns in primates. Amer. J. Ortho-
- 381 -
psychiat., 1960, 30, 676-684.
Hess, E. H. Imprinting in animals. Sci. Amer., 1958, 195, 81-90.
Hess, E. H. Imprinting. Science, 1 9 5 9 , 130, 133-141.
Hoffman, H. S., Searle, J. L., TofTey, Sharon, and Kozma, F. Behavioral
control by an imprinted stimulus. J. exp. Anal. Behav., 1966, 9,
177-189.
Kagan, J., and Berkun, M. The reward value of running activity. J. comp,
physiol. Psychol., 1954, 47, 108.
Lockard, R. B. Some effects of light upon the behavior of rodents.
Psychol. Bull., 1963, 60, 509-529.
Mayer, J. Glucostatic mechanism of regulation of food intake. New
England J. Med., 1953, 249, 13-16.
M urray, E. J. Motivation and emotion. Englewood Cliffs: Prentice-Hall,
1964.
Olds, J. Pleasure centers in the brain. Sci. Amer., Oct. 1956, 195, 105
116.
Olds, J. Hypothalamic substrates of reward. Physiol. Rev., 1962, 42,
554-604.
Olds, J., and Milner, P. Positive reinforcement produced by electrical
stimulation of septal area and other regions of rat brain. J. comp,
physiol. Psychol, 1954, 47, 419-427.
Pliskoff, S. S., Wright, J. E., and Hawkins, T. D. Brain stimulation as a
reinforcer: intermittent schedules. J. exp. A n a l Behav., 1965, 8,
7 5 -88.
Richter, C. P. A behavioristic study of the activity of the rat. Comp.
Psychol Monogr., 1922,1, No. 2.
Richter, C. P. Animal behavior and internal drives. Quart. Rev. B iol,
1927,2, 307-343.
Rosenzweig, M. The mechanisms of hunger and thirst. Chap. 3 in L.
Postman (E d .), Psychology in the making. New York: Knopf,
1962.
Sanford, F. Psychology, a scientific study of man. Belmont, Calif.: W ads
worth, 1961.
Templeton, R. D., and Quigley, J. P. The action of insulin on the mobility
of the gastro-intestinal tract. Amer. J. Physiol , 1930, 91, 467-474.
Weeks, J. R. Experimental narcotics addiction. Sci. Amer., Mar. 1964,
210, 46 -5 2 .
- 382-
Capítulo 17 CONTINGÊNCIAS AVERSIVAS
Nossas discussões sobre o comportamento operante têm, até aqui, lidado exclusiva
mente com casos em que, pela manipulação da correlação entre uma classe especifica
da de resposta c eventos tais como alimento c água, ocorrem certas mudanças no
comportamento. Aquisição, discriminação, esquemas dc reforçamento, diferenciação,
aproximações sucessivas e encadeamento são as denominações dos procedimentos
específicos que ditam a forma precisa da correlação resposta-reforçamento. O termo
impulso agrupa as variações 110 comportamento operante que estão sob o controle dc
operações que alteram o valor reforçador daqueles reforçadores. Em todos os diversos
procedimentos tratados, o comportamento é mantido por reforçadores que são
definidos como estímulos que têm a habilidade de aumentar a probabilidade das
respostas que seguem. Volt amo-nos, neste capítulo, para uma nova classe de estímulos
reforçadores que não preenchem essa definição de reforçadores positivos, embora
modifiquem c mantenham o comportamento de maneira característica.
17.1 REFORÇADORES NEGATIVOS
Pouco mais do que a observação casual é necessária para se detetar que, sob
circunstâncias apropriadas, a re m o ç ã o de certos eventos ambientais exerce efeitos
comportamentais poderosos. Observamos que as aves encontram abrigo durante as
tempestades, os cães dirigem-se para a sombra quando o sol do verão incide sobre eles
e as pessoas fecham as janelas quando o barulho do tráfego está alto. Nesses exemplos,
o comportamento emitido remove ou termina algum evento ambiental tal como chuva,
calor e luz, c barulho, listas observações sugerem a existência de uma classe distinta de
eventos reforçadores. Como a operação que define esses eventos como reforçadores
(sua remoção) e oposta, cm caráter, àquela dos reforçadores positivos (definida por sua
apresent ação), eles são conhecidos como re fo rç a d o re s n e g a tiv o s (S~ ). Em geral, os
reforçadores negativos constituem-se daqueles eventos c u jo té rm in o (ou redução 11a
intensidade) fortalecerá c manterá operantes.
Os reforçadores negativos incluem os eventos que, no linguajar comum, chamamos
de “ irritantes” , “ desconfortáveis” , “ dolorosos” , “ desagradáveis” , “nocivos” c assim por
diante. A maioria desses termos envolve um domínio de referência não compor tame n-
tal que, provavelmente, não será adequado para uma análise funcional. Com um
-383-
sinônimo para reforçador negativo, o termo “ aversivo” é mais neutro que qualquer um
desses adjetivos e tem a vantagem dc sugerir a noção apropriada de “evitar” , “mover-se
para longe de ” ou “ fugir de” uma situação. No laboratório, os estímulos aversivos
têm, tipicamente, a forma de choques elétricos, imersão prolongada na água e certas
intensidades de luz, som e temperatura,
17.2 CONDICIONAMENTO DE FUGA
Podemos verificar a qualidade aversiva de qualquer estímulo tornando sua remoção

contingente a um operante até então não condicionado. Se a força deste operante
aumenta, subsequentemente, diz-se que o estímulo é aversivo.
elétrico
Figura 17-1. Labirinto em T para estudar o comportamento de fuga (segundo
Meunzinger e Fletcher, 1936).
Um experimento de Muenzingcr c Fletcher (1936) é representativo deste procedi

mento de fuga. Um rato foi colocado num labirinto cm forma de T, que continha um
piso de grades eletrificadas. O piso estava ligado a uma fonte de modo que, enquanto
o animal permanecesse na grade, um choque contínuo era administrado cm suas patas
(Fig. 17-1). Uma cobertura sobre o labirinto (não mostrada) impedia o rato de escapar
do choque pulando para fora do aparelho. Mas, havia uma maneira de fugir - o animal
podia se livrar do choque correndo consistcntcmentc para um determinado braço do
T.
O comportamento no labirinto cm T é comumente medido cm cada tentativa pela
contagem do tempo que o rato leva do início até o braço sem choque ou pela
contagem do número de vezes que o animal se dirige para o braço “ incorreto”
- 384-
( “erros” ). Nas primeiras tentativas, o virar para a esquerda ou direita são igualmente
prováveis, mas à medida que a aquisição da resposta dc virar para o lado seguro
prossegue, as respostas para o lado “ incorreto” diminuem. Vemos a tendcncia media
de 25 ratos na Fig. 17-2. Podemos inferir a partir da diminuição do número de erros
na curva da Fig. 17-2 que a resposta de virar para o lado seguro ocorreu depois de 100
tentativas de treinamento.
() processo comportamental representado na Fig. 17-2 exige que ampliemos o
nosso conceito de fortalecimento operante. As respostas podem ser fortalecidas ou
pela produção de reforçadores positivos ou pela terminação de reforçadores negativos
(S"~ ). A última variante é
s"-
R ----->S0
Blocos de dez tentativas

Figura 17-2. Percentagem de respostas incorretas em 100 tentativas de treino de fuga
(segundo Muenzinger, e Fletcher, 1936).
Uma resposta (R) conduz o organismo de uma situação aversiva, S para uma
diferente, menos aversiva, s0.
17.3 PARÂMETROS DE S“
A Fig. 17-3 esquematiza os eventos, variáveis e relações inerentes às contingências de
fuga no reforçamento negativo. As variáveis independentes de maior interesse na Fig.
17-3 são (1) a intensidade de estímulo aversivo prevalente, (2) a duração do período com
estímulo ausente, (3) a quantidade em que a intensidade é reduzida
depois da resposta, (4) a natureza da intermitcncir, se alguma, existente entre R e a
terminação ou redução de S'", e (5) o atraso, se algum, que intervém entre uma R c- o
término ou redução subsequente do estímulo.
- 385-
duração do redução parcial
período sem na intensidade
intensidade
estímulo / do estímulo
I— I contingência ! atraso na
intermitente ! terminação
R
j~*- tempo de reação
Figura 17-3. Variáveis nus contingcncias dc fuga.
Se uma fonte dc estimulação aversiva é adicionada â aparelhagem da caixa de

Skinner, a pressão à barra torna-se conveniente para o estudo do reforçamento
negativo. A caixa de Skinner tem o mérito dc deixar o animal livre para responder a
qualquer momento. Em conseqüência, a taxa dc resposta torna-se disponível como
uma medida dependente sensível e ampla dos efeitos comportamentais cm sujeitos
individuais. Para objetivos especiais, o tempo dc reação, RT (ver Fig. 17-3) pode
suplementar tais medidas dc taxa.
Um procedimento usado por Dinsmoor e Winograd (1958), serve como uma
demonstração-protòtipo, assim como ilustra a ação dc alguns parâmetros dc S Ratos
aprenderam a pressionar urçia barra quando este era o único comportamento que
desligava choques clctricos liberados através das grades do piso do seu compartimento
experimental. O choque era desligado por 2 minutos após a pressão à barra (duração
do período sem estímulo), depois do que a estimulação aversiva era restabelecida.
Pressões na ausência de choque não tinham conseqüências especiais. 0 procedimento é
simplesmente
Quando o RT entre S e R diminuiu ate um valor assintótico baixo, uma contingência

dc IV 30 seg foi adicionada ao procedimento:
As respostas eram efetivas para a fuga do choque apenas depois que o choque estivesse
ligado por uma duração média de 30 seg. O procedimento gerou uma laxa moderada c
constante de pressão à barra na presença do choque. O padrão do comportamento
assemelha-se à resposta reforçada com alimento em IV
Dinsmoor c Winograd exploraram os efeitos da variação da intensidade dc S
sobre esta linha-base de resposta dc fuga em IV. Sua técnica foi a dc iniciar a sessão
com uma determinada intensidade de S—presente, digamos lOOjLiamps, obseivar a fre
qüência de resposta por um período de tempo suficiente para obter uma medida
-386-
confiável da taxa, depois dc mudar para um valor diferente dc S , digamos 400
y amps, e repetir o processo. Numa sessão de 2 horas, eles puderam obter medidas da
taxa de fuga para seis valores diferentes de intensidade de S .
O comportamento de um rato durante uma parte da sessão aparece na Fig.
17-4. O registro cumulativo mostra que cada valor dc intensidade de choque controla
uma única taxa de resposta de fuga. O efeito comportamental da mudança de um valor
dc intensidade para outro (marcada pelos traços) c quase instantâneo: independente de
sua taxa anterior, o animal muda abruptamente para uma taxa, apropriada à nova
intensidade dc choque.
Quando a taxa total dc resposta é colocada cm função da intensidade dc choque,
restrita a Fig. 17-5A. Essa função foi obtida do inesmo rato cuja curva cumulativa
aparece na Fig. 17-4. A Fig. 17-5A indica que, na faixa estudada, à medida que a
intensidade do choque aumenta a taxa de resposta dc fuga tambem aumenta
continuamente.
Figura 17-4. Respostas de fuga em IV acumuladas para intensidades diferentes de

choque (Dinsmoor e Winograd, 1958).
As Figs 17-5B e 17-5C documentam os resultados dc experimentos semelhantes

com outros agentes aversivos. A Fig. 17-5B ilustra os efeitos do aumento da
intensidade de um som sobre a taxa de pressão à barra em IV de fuga, cm gatos. Os
resultados da Fig. 17-5C loram obtidos dc um grupo dc ratos que, pressionando um
painel sob contingências dc IF, terminavam luzes de várias intensidades. Tanto o painel
(B) como o painel (C) da Fig. 17-5 demonstram que os máximos no comportamento
de fuga ocorrem quando a intensidade do estímulo aversivo c muito grande. O
declínio nas respostas associado com eventos aversivos muito intensos não c bem
compreendido. Pensa-se que ele seja devido a um efeito supressivo geral (cmocional)
dos estímulos aversivos fortes.
- 387 -
choquc elétrico Nível do ruído luz incandescente (milliamberts)
(microamperes) (millivolts) a
(A) (B) (C)
Figura 17-5. Taxa de resposta de fuga em função da intensidade do estímulo
aversivo. A abscissa está em unidades logarítmicas (A) Dinsmoor e Winograd,
1958; (B) Barry e Harrison, 1957; (C) Kaplan 1952.
Será conveniente fazer um paralelo ocasional entre o reforçamento positivo c

negativo. A que variável, no campo do reforçamento positivo, podemos perguntar,
corresponde a intensidade dc um estímulo aversivo? Superficialmente, a intensidade
dc um reforçado negativo parece análoga à magnitude de um reforçador positivo. A
intensidade dc S e a magnitude dc S 1 são, ambas, propriedades de estímulo do
reforçador e o aumento cm ambas as variáveis gera aumento nas respostas (ver seção
J6.2). Mas, uma análise mais profunda do papel funcional que essas duas variáveis
desempenham no reforçamento negativo e positivo, respectivamente, sugere que a
analogia é apenas superficial. O principal efeito do aumento na intensidade de uma
luz, um som, ou um choque, de um valor baixo para um valor alto, c que o
reforçamento do comportamento lorna-se possível através do término da nova
intensidade. O aumento na intensidade de um S tem, assim, a lógica de uma
operação de estabelecimento dc reforçamento: torna possível o fortalecimento do
comportamento. Assim, na presença de uma intensidade fraca de luz, um rato não
apresentará o condicionamento de uma resposta que termine a luz. Assim, também,
com um pequeno valor de privação dc alimento, uma resposta que produz alimento não
será fortalecida. Por outro lado, valores altos de ambas intensidade do choquc e
privação de alimento tornam possível usar a terminação do choque e apresentação
de alimento como reforçadores para condicionar operantes. Se as funções das Figs.
17-5 e aquelas na seção 15.8 forem examinadas, será encontrado um paralelo na
maneira em que as horas de privação e a intensidade de S controlam o comporta
mento. Tais considerações implicam num status conceituai interessante para os
estímulos aversivos. Sua apresentação é simultaneamente uma operação de impulso e
negaiivameuíe reforçadora.
Há, naturalmente, uma variável no campo do reforçamento negativo que corres
ponde à magnitude dc S 1. Considere a duração do tempo que decorre entre o término
de um estímulo aversivo e seu restabelecimento subsequente, indicada como a duração
do período sem estímulo na Fig. 17-3. Fis aqui uma variável independente que
corresponde estritamente à magnitude ou duração de S*. Quanto maior a duração do
período com o, estímulo aversivo ausente, maior a força da resposta de fuga. Usando
uma contingência de fuga em crf e medindo o Kl da pressão à barra ao S
Dinsmoor e Hughes (1956) obtiveram o gradiente de reforçamento de fuga reproduzi
do na Fig. 17-6. Quando as pressões à barra produziam um período longo sem cheque.
-38 8-
o rato respondia prontamente ao aparecimento do clioque. Mas, quando períodos
pequenos sem choques eram a conseqüência do pressionar, os RTs ao aparecimento do
choque eram longos, indicando que estes valores pequenos de duração do período sem
choque proporcionavam pouco ou nenhum reforçamento. Não c necessário que um
operante termine completamente um estímulo aversivo para que seja fortalecido. A
1 igura 17-6. Tempo dc reação (RT) de fuga em função dc vários valores de duração
do período sem choque (segundo Dinsmoor e Hughes, 1956).
simples redução do nível de intensidade do estímulo c quase sempre suficiente para

condicionar e manter o comportamento operante. Pequenas reduções na intensidade,
quando contingentes à pressão à burra, formam a base dc um procedimento para medir
o nível de estimulação aversiva que um organismo irá tolerar (Weiss e Latics, 1959,
1963). Neste procedimento, cada pressão à barra produz uma pequena diminuição na
intensidade de um estímulo aversivo prevalcntc. Um período fixo de tempo sem uma
única pressão à barra produ/ um pequeno aumento na intensidade do estímulo. As
relações entre R e S éstão ilustradas esqucmulicamentc na Fig. 17-7. A primeira R
emitida na Fig. 17-7 reduz a intensidade de S um pouco. Uma segunda R segue logo
a primeira R e a intensidade diminui um pouco mais. 0 critério de tempo, então,
decorre sem que alguma resposta ocorra e, como resultado, esse S 6 aumentado um
pouco. Passa-se mais um período sem uma R e outro aumento em S ocorre. As
próximas 6 Rs ocorrem com freqüência suficiente para diminuir a intensidade aversiva
ao nível dc zero. Subsequentemente, a intensidade aumenta por três ve/.es na ausência
de outras respostas emitidas.
S“
i i_________ i i i i
0 seg. f -
Tempo i______ i______ i--------- 1--------- ‘--------- 1--------- 1--------- 1---------L-
F ig u r a i 7-7.
-3 8 9 -
liste procedimento age dc modo a originar um estado dc equilíbrio. O organismo
conserva uma taxa de resposta que mantém a intensidade de S * dentro de uma
pequena faixa de intensidades (usualmente baixa). Quando o S~ é choque elctrico, esse
equilíbrio é denominado nível de tolerância ao choque. O nível real mantido varia
com um número de parâmetros do procedimento e é sensível à administração de
certos agentes farmacológicos, tais como analgésicos c anestésicos. A Fig. 17-8 ilustra a
estabilidade comportamental típica que esse procedimento gera. Além disso, a figura
mostra o resultado comportamental da administração intravenosa de uma pequena
quantidade dc morfina num macaco rhesus trabalhando neste procedimento. (A Fig.
17-8 significa um registro bem detalhado e ampliado do contorno de S'” da Fig.
17-7). A injeção dc morfina é seguida rapidamente por um aumento da tolerância ao
choque a um novo nível de intensidade, que pcrmanccc pelos 40 minutos restantes
apresentados. O efeito confirma as propriedades clínicas bem conhecidas da morfina, e
sugere que o procedimento fornecc um instrumento experimental adequado para medir
as propriedades analgésicas dc várias drogas.
25
20 *
"3
d>
2 3
- , 0i f
-5
Figura 17-8. Efeito da administração intravenosa de sulfato de morfina, 0,25 mg/kg,

sobre o nívei de tolerância ao choque. O registro ê iido da direita para a esquerda
(Weitzman, Ross, Hodos e Gaiambos, 1961).
17.4 ESTÍMULOS AVERSIVOS CONDICIONADOS
Quando fugimos de um carro que vem cm nossa direção, desviamo-nos de um

murro intencional e saímos de um campo dc golfe ao ver nuvens dc tempestade, nosso
comportamento toma a forma dc fuga dc estímulos que não são aversivos em si
mesmos. Veículos em nossa direção, braço levantado c uma nuvem escura são eventos
cujo significado deve ser adquirido de algum modo. Parece existir uma classe de
estímulos aversivos adquiridos que podem ser apropriadamente chamados de reforçado
res negativos secundários. Para analisar a maneira pela qual os estímulos adquirem
propriedades de reforçadores negativos secundários, leremos que recorrer aos conceitos
do condicionamento clássico. Acontece que uni evento ambiental originalmente neutro
adquire propriedades aversivas se ele é emparelhado, de maneira Pavloviana, com
eventos como choques, sons intensos e luz. Estes últimos agentes aversivos tem uma
função comportamental dupla. Eles lèm tanto o status dc reforçadores negativos
primários (S ^), como o de eliciadores incondicionados (S 2 ) do aumento na íaxa
cardíaca, respiração rápida e outros respondeutes. Quando u mS j é emparelhado com
- 390 -
um desses eventos S 2 , S\ passa a (1) evocar uma CR semelhante a R2 pelas leis do
condicionamento respondente; c (2) adquirir poder aversivo.
A maneira através da qual as propriedades dc reforçadores negativos são conferidas

às situações anteriormente neutras pode ser demonstrada, no rato, com o aparelho
visto na Fig. 17-9. Dois compartimentos estão separados por u m a porta que pode ser
aberta, deixando uma barreira entre eles. Cada compartimento tem um piso gradeado
através ao qual podem ser liberados choques. Lâmpadas e alto-falantes fornecem sinais
quando desejados. Uma vez que conseqüências especiais podem ser contingentes ao
pular a barreira de um compartimento para o outro, isto e, ao ir e voltar para um e
outro compartimento, o aparelho é comumcntc conhecido como caixa do vai-e-vem.
Figura 17-9. Uma caixa do vai-e-vem para o estudo do controle de estímulo aversivo
(segundo Miller, 1951).
- 391 -
Brown c Jacobs (1949) colocaram ratos num compartimento de uma caixa do
vai-e-vcm e emparelharam um tom pulsantc h luz (S j) com 6 seg. dc choque
inevitável (SJ). Vinle e dois emparelhamentos de Sj c S2 foram administrados cm um
período dc dois dias. O choquc foi então permanentemente desligado e testaram-sc as
propriedades aversivas de Sj. A porta entre os compartimentos foi levantada, S\
apresentado e estabelecida uma contingência tal que qualquer tentativa dc pular para o
outro compartimento terminava o Sj toin-luz. 0 efeito das tentativas dc teste foi
condicionar o saltar a barreira. Desde que o choquc nunca foi apresentado no teste, esse
condicionamento deve ter sido a conseqüência da fuga do Sj tom-luz. E desde que os
ratos normalmente não tentam escapar dos tipos de tons c luzes usados neste
experimento, a operação de emparelhar os tons c luzes com o choquc deve ter sido
crítica.
Ao testar o reforçamento positivo condicionado (seção 11.1), podemos lembrar,
permitiu-se que um novo operante produzisse um S^, mas o reforçamento primário foi
removido. O novo operante foi inicialmente fortalecido em virtude do contingente,
mas, à medida que o tempo passava, o perdia o seu poder de reforçador
condicionado, uma vez que não mais estabelecia a ocasião para o reforçamento
primário. Esla perda apareceu como um declínio eventual na força do novo operante.
Um aumento similar e uma queda na probabilidade de um novo operante ocorrcin ao
se testar o podor de um estímulo aversivo condicionado. No teste da caixa do
vai-e-vcm, cada vez que tom + luz é apresentado sem choque, ocorre uma tentativa dc
extinção Pavloviana. Isto é, o tom + luz perde algumas das propriedades cliciadoras
que lhes foraih conferidas pelos emparelhamentos prévios com o choque. Com a
extinção do poder eliciador dc Sj ocorre uma redução gradual no poder de S\
reforçar negativamente uma resposta. O resultado, naturalmente, é que, cm ccrto
ponto, os ratos param de pular a barreira quando Sj é apresentado. No experimento
de Brown e Jacobs, o RT de pular a barreira ante o aparecimento de S\ diminui nas
20 primeiras tentativas do teste; então, nas 20 tentativas subsequentes, o RT começa a
aumentar, indicando que o poder controlador do tom-luz está diminuindo. Precisamos
ter essas relações dchcadas cm mente quando lidarmos com os fenômenos das seções
seguintes.
17.5 CONDICIONAMENTO DE ESQUIVA
O fenômeno do comportamento de esquiva levanta um problema geral con

cernente ao lugar da intenção na metodologia científica. Dizemos que viramos o
volante de um carro que derrapa, na direção oposta à derrapagem, para evitar uma
batida; que se constrói uma ponte de um certo modo para evitar sua queda; que um
veado foge a fim de evitar um lobo que o persegue. O termo “para” , ou “ a fim de” ,
dá uma certa qualidade intencional ao comportamento. O objetivo de um determinado
ato e, consequentemente, sua explicação aparente, é fornecido numa proposição das
conseqüências aversivas ou indesejáveis que teriam ocorrido se não fossem evitadas pelo
ato. As explicações propositais ou teológicas são geralmente rejeitadas pelos cientistas
com o argumento de que tais explicações propõem que um evento futuro (e, logo, não
existente) seja a causa de um evento presente (existente) e porque as explicações
propositais nada adicionam aos fatos. Dizer, por exemplo, que uma pedra cai ao chão
a fim de retornar a seu lugar natural de repouso, a terra, nada mais diz que a
- 392-
proposição puramente descritiva: as pedras caem na terra. E, além disso» por parecer
ser uma explicação suficiente, a proposição teleológica tende a desencorajar um exame
adicional do fenômeno, pospondo assim uma análise funcional.
A explicação, na ciência, é um assunto complexo e de muitas facetas, mas alguns
estudiosos acham que ela pode ser reduzida a (1) descrições extensas dos eventos em
questão, incluindo suas relaçBes com outros eventos; e (2) familiaridade com estas
descrições e relações. A explicação científica, de acordo com este ponto de vista, é cm
grande parte um problema de fornecer relações entrelaçadas entre os fenômenos da
experiência sensorial. Eventualmente, essas relações tornam-se tão familiares que
parecem lógicas, ou auto-evidentes. Assim, as “ reformulações radicais” de uma geração
são o “bom senso” da geração seguinte. Compare este tipo de explicação com a do
tipo proposital. Embora achemos estranho, 300 anos depois de Galileu, pensar que as
pedras possuem um desejo de retornar à terra, frequentemente, content am o-nos em
considerar o comportamento como sendo dirigido pela vontade ou intenção. Todavia,
assim como o propósito é irrelevante para “explicar” a queda das pedras, também o é
para a análise do comportamento. Dizer que os organismos respondem para (a fim de)
produzir reforçadores não traz mais informação do que dizer que eles respondem
quando suas respostas são frequentemente seguidas por reforçadores.
Frequentemente, propõem-se explicações teleológicas para o comportamento de
esquiva. Ao dizermos que nos abrigamos, quando vemos uma nuvem de tempestade
para não ficarmos molhados, estamos implicitamente invocando uma explicação
proposital para o nosso comportamento. Todavia, nossa proposição (ou crença) não
constitui uma explicação no sentido técnico descrito (a saber, uma proposição de
alguma relação funcional entre o comportamento que está sendo descrito e alguma
outra variável), mas é meramente uma reproposição dos fatos — quando o céu está
escuro e trovejando, movemo-nos de um certo modo. A esquiva de um evento
ambiental que ainda não aconteceu (a chuva) dificilmente pode controlar o com
portamento presente. Supor que isto poderia acontecer é criar o problema lógico de
como explicar um evento em termos de outro evento que ainda não ocorreu. Em vez
disso, procuramos uma explicação (descrição) do comportamento em termos de
variáveis que (1) atuam por ocasião do comportamento, e (2) agiram, no passado, em
condições similares. Ao fazer isto, baseamos nossa explicação nos conceitos intro
duzidos nas três seções anteriores.
Iniciamos nossa análise do comportamento de esquiva com uma demonstração
experimental do fenômeno. Talvez encontremos, no exame cuidadoso dos eventos
comportamentais que ocorrem na situação de esquiva, algumas relações invariantes nas
quais possamos basear uma explicação mais aceitável do fenômeno.
Brogden, Lipman e Culler (1938) colocaram cobaias em rodas de atividade
individuais. Um tom de 1000 cps era apresentado ao animal e, 2 seg mais tarde, um
choque era administrado através do piso da gaiola. Se o animal corresse na roda,
fazendo-a girar 2,5 cm ou mais quando o som se iniciava, ele poderia evitar o choque.
O girar a roda através da corrida também terminava o som. Note a estrutura básica
para os paradigmas de esquiva. Primeiro, ocorre algum evento ambiental de “ aviso” (o
tom); então, após um lapso de tempo, segue-se um segundo evento ambiental, aversivo.
Enquanto isso, há uma contingência estabelecida — por um experimentador ou pela
natureza - de modo que, se uma resposta especificada ocorre entre o aparecimento do
primeiro estímulo e o aparecimento do estímulo aversivo, o estímulo aversivo é
omitido e o primeiro estímulo é terminado.
- 393-
- No experimento de Brogden, Lipman e Culler, as cobaias aprenderam a girar a
roda, e, assim, evitar o choque em quase todas as tentativas. A Fig. 17-10 relaciona o
aumento observado na percentagem das respostas de girar a roda com o número médio
de dias em que cada percentagem particular foi atingida.
100 "7*-----------
s
s
ss
80 *
/
//
/ //
/
S' 60 /
s
**s
*
I s/
$ 40 s*
//
y
20
/S
\\
V\
\\
\\\\
\
2 4 6 8
Média do número de dias de treinamento
Figura 17-10. Aquisição do comportamento de esquiva. Dados de quatro cobaias
(segundo Brogden, Lipman e Culler, 1938).
Os fatos sobre a esquiva são claros, mas sua representação é um outro problema. É
evidente que o fortalecimento comportamental observado não é condicionamento
operante por reforçamento positivo, desde que nenhum reforçador positivo era
contingente à resposta. Parece pouco provável que o girar a roda tenha sido
condicionado classicamente, uma vez que a resposta tem um caráter de emissão. Mas
será conveniente considerar a possibilidade. O paradigma
Si ——> Rj
[17.1]
S2 -----> R-2
onde S j = tom dc 1000 cps

S r- choque elctrico
Rj = não médida
R^ = correr, pular, guinchar, etc.
C = semelhante a R 2 ,
K
- 394 -
aparentemente, e adequado. Note, todavia, que o Diagrama [17.11 não descreve o
efeito que o correr na roda (CR) tem sobre o choque (Sj). No verdadeiro
condicionamento Pavloviano, a CR não impede a ocorrência de S2- Quando um
cachorro passa a salivar ante um som, a salivação não evita a ocorrência de alimento.
O fato de a resposta condicionada na esquiva evitar a ocorrência de S2 pode ou
não ser significante. Brogden, Lipman e Culler supuseram que se o correr que eles
observaram era realmente uma CR, então a omissão do choque não deveria fazer
qualquer diferença no comportamento de correr. O procedimento Pavloviano é
meramente uma prescrição para emparelhar dois eliciadores. Realizou-se, então, um
segundo experimento em que o tom de 1000 cps era apresentado e, 2 seg mais tarde,
o choque era administrado como no primeiro experimento. No segundo experimento,
todavia, as respostas de correr que ocorriam antes do choque não tinham efeito na
liberação subsequente do choque. O experimento, então, proporciona um empare-
lhamento estrito de um S\ e S j. Se a resposta de correr é condicionada pelos
princípios Pavlovianos, deveríamos esperar que o novo reflexo S\ CR (Tom-Correr)
aumentasse em força.
Os resultados do experimento, vistos na Fig. 17-11, são nitidamente diferentes
daqueles do primeiro experimento, vistos na Fig. 17-10. Durante o segundo experi
mento, a força da resposta de correr flutuou, aumentando vagarosamente até um
máximo (cerca de 50 por cento das tentativas diárias no 13o. dia) e, então, declinando
até um nível baixo, próximo de zero, lá pelo vigésimo d ia (5000^ tentativa), quando o
experimento terminou. Contraste este resultado com o desempenho de 100 por cento
dos animais no primeiro experimento (Fig. 17-10) depois de apenas 8 dias (120
tentativas). O fracasso em se condicionar o correr através de um procedimento
Pavloviano elimina a possibilidade de que o condicionamento de esquiva seja um tipo
de condicionamento respondente.
dias de treinamento
1- iguni 17-11. Percentagem dc respostas dc correr, quando o correr não evita S?
(segundo liroirden. I ipinan c Cuiier, 193S). ~
- 395-
O condicionamento de esquiva nem é um fortalecimento operante por refor
çamento positivo nem um caso de condicionamento Pavloviano. Seria um tipo de
treino de fuga? Se examinarmos com atenção os dois experimentos de Brogden,
Lipman e Culler descobriremos que ambos fornecem condições necessárias para se
estabelecer um reforçador negativo secundário. No primeiro experimento, o expe
rimento de esquiva, o correr antes da apresentação do choque terminava o tom. Na
seção 17.4, mostramos que esta contingência servia para fortalecer o operante, R.
sr
R — > s0
onC*e ^ = um estímulo aversivo condicionado

R = um operante
So = uma situação em que S\ nãoestá presente,
Essas condições, afirmamos agora, são exatamente aquelas encontradas durante o
condicionamento de esquiva. No primeiro experimento de Brogden, Lipman e Culler, o
choque era evitável; mas (crítico para esta análise) o tom de aviso de 1000 cps era
também terminado pela resposta operante. Por haver sido emparelhado com o choque
em tentativas anteriores ao desenvolvimento do comportamento de esquiva, o tom
adquiriu características aversivas condicionadas. Assim, era a terminação do estímulo
aversivo condicionado, o tom, e não a não-ocorrência do choque que reforçava a
resposta de correr. A esquiva de S2 era um subproduto da fuga do reforçador negativo
secundário.
Podemos agora notar o procedimento para o condicionamento deesquiva. Ele se
reduz a uma contingência de fuga em que um operanteéreforçadopelotérminode
um reforçador negativo secundário:
s;
T ----->S2-
R -----> S0
Agora, podemos ver que o permanecer ao ar livre na presença de nuvens e trovões

fornece estímulos que, no passado, foram correlacionados com a queda da chuva. O
procurar um abrigo nos permite fugir desses estímulos de aviso, sendo a esquiva da
chuva um subproduto. Similarmente, o veado que não consegue correr do lobo (S) é
peg o (Sf). Se o veado ainda estiver vivo na próxima vez que um lobo aparecer,
qualquer resposta do veado que remova o lobo do seu ambiente imediato é reforçada
pelo término de um reforçador negativo secundário.
Uma implicação significante do comportamento de esquiva deve ser examinada.
Quando a resposta que remove S\ ocorre, S^- é consequentemente omitido. Que
brando-se a correlação S\ - S^T dessa maneira, esperamos que S\ perca gradualmente
sîas propriedades aversivas condicionadas e que, como resultado disto, a resposta de
esquiva não seja mais emitida, permitindo que S2 reapareça. Através de um novo
emparelhamento, S^T renova o caráter aversivo de S \. Dados experimentais apoiam a
-3 9 6 -
previsão teórica de que o comportamento de esquiva é, de fato, cíclico (Wertheim,
1965). A restauração ocasionai das propriedades aversivas de S\ significa que o
emparelhamento de Sj^ SJ* é, na realidade, intermitente. A intermitência, pro
vavelmente, mantém a força aversiva de S\ bem melhor do que se Si fosse
correlacionado toda vez com SJ, pelas mesmas razões porque um estímulo inter
mitentemente emparelhado com alimento é um reforçador positivo secundário mais^
durável. À medida que prossegue o treino de esquiva, os emparelhamentos de S\ e S2
tornam-se cada vez menos freqüentes, enquanto a durabilidade aversiva de Si continua
a aumentar. Em certo momento, pode se alcançar um ponto onde toda a vida restante
do indivíduo não seja bastante longa para que a correlação S j, S f ocorra novamente.
Esta discussão sobre a esquiva tem se restringido aos casos em que o S\ terminado
é um estímulo de aviso externo. Casos mais sutis de condicionamento de esquiva
ocorrem quando o próprio comportamento do organismo adquire caráter aversivo,
como no grupo de contingências conhecido por procedimento de Sidman (Sidman,
1953). Podemos fornecer, aqui, apenas um esquema do que talvez seja a variante mais
simples desse procedimento. Se um estímulo aversivo breve é liberado para um
organismo depois de T unidades de tempo sem o aparecimento de uma dada resposta,
temos a seguinte contingência em efeito:
[17.2]
Em [17.2], S~ poderia ser um choque elétrico, R poderia ser a pressão à barra,

Tx poderia ser qualquer valor fixo, de uns poucos segundos a vários minutos. Choques
elétricos são liberados a menos que uma resposta seja emitida. O procedimento define
uma contingência de esquiva que não contém um estímulo de aviso explícito (Si)
anterior à ocorrência de ST. Os animais adaptam-se a esse procedimento respondendo
numa taxa moderada e recebendo poucos dos possíveis choques que seriam liberados
(Verhave, 1959). A Fig. 17-12 mostra registros cumulativos do comportamento gerado
por este procedimento. Evidentemente, a ausência de um Sj de aviso explícito não
impede a aquisição e manutenção do comportamento eficiente de esquiva.
Nossa primeira explicação do comportamento de esquiva depende tão criticamente

da noção de um Sj sendo emparelhado com um SJ, que podemos, à primeira vista,
perguntar como a esquiva de Sidman se coloca neste quadro. Mesmo no procedimento
de Sidman, todavia, existe a possibilidade de um emparelhamento de certos eventos
com S~. Considere o comportamento de um rato no início do treino, antes do
desenvolvimento do comportamento eficiente de esquiva. Choques estão sendo libe
rados frequentemente. Ocasionalmente, uma pressão à barra em nível operante é
emitida, pospondo assim, o choque. Voltemos nossa atenção para o que o rato está
fazendo no momento em que recebe o choque. Ele pode estar colocando o focinho
nos cantos da gaiola, investigando as paredes da caixa, descansando imóvel, e assim por
diante. Embora não possamos dizer, com certeza, exatamente o que o animal estava
- 397-
Figura 17-12. Registros cumulativos da resposta de esquiva —pressão à barra durante
a primeira sessão de treino. Os traços verticais indicam choques. O valor de T era de
30 seg. (Verhave, 1959). X
fazendo ao receber um choque, podemos dizer, com toda certeza, o que ele não estava
fazendo. Ele não estava pressionando a barra. Se estivesse, não receberia o choque.
Logicamente, todo comportamento, exceto pressão à barra, pode ser emparelhado com
choques da mesma maneira que dada ocorrência de S\ de aviso nas situações de
esquiva convencional é primeiro emparelhada com o choque. O efeito desse empare-
lhamento de comportamentos com choques na situação de esquiva de Sidman é fazer
com que uma grande parte do próprio comportamento do animal adquira propriedades
aversivas condicionadas. Depois de um certo tempo, muito do próprio comportamento
do rato, exceto sua pressão à barra, adquire o status de Si de aviso auto-administrado.
Se o rato “ foge” do seu próprio comportamento aversivo, nada há que possa fazer,
exceto pressionar a barra. Pressionando a barra, ele obtém o subproduto usual de
eventos aversivos condicionados - isto é, a esquiva de um reforçador negativo
condicionado.
17.6 PUNIÇÃO
Quando um reforçador negativo é contingente a um operante podemos falar de

punição deste operante. Uma criança que toca uma chama é queimada, um homem que
atravessa na frente dos carros é atropelado; ambos os organismos são punidos por agir
de uma dada maneira numa dada situação. No laboratório, a contingência de punição
pode ser estabelecida pelo fornecimento de um estímulo aversivo controlado seguindo
a ocorrência de uma resposta. Por exemplo, pressões à barra ou bicadas na chave,
previamente fortalecidas acima do nível operante pelo reforçamento positivo, podem,
-398-
agora, ser punidas apresentando-se cnoques na pele após sua ocorrência. A sociedade
usou, e ainda usa, o procedimento de punição, numa variedade de maneiras, para
desencorajar certos comportamentos dos seus membros. A palmatória não desapareceu
completamente de nossas escolas; espancamos nossos filhos quando eles se comportam
“mal” ; e a punição é ainda o principal instrumento da justiça. O procedimento de
punição parece ser usado frequentemente não porque funcione tão bem, mas porque
(1) tem um efeito imediato; e (2) sua liberação e/ou efeitos colaterais são quase
sempre positivamente reforçadores para a pessoa que administra a punição. Os
psicólogos clínicos e os psiquiatras referem-se aos indivíduos que são positivamente
reforçados ao punir os outros, como sádicos. Adiaremos a discussão das condições que
podem fazer surgir o comportamento sádico para o próximo capítulo.
Os efeitos imediatos da punição são facilmente observados. Uma criança que ri na
igreja pode ser imediatamente silenciada por um beliscão; um cachorro i.ue pula nas
visitas pode normalmente ser controlado por uma pancada com o jornal. Ambós,
criança e cachorro, provavelmente não serão permanentemente- curados de seus
comportamentos indesejáveis através da punição. No momento, todavia, o compor
tamento indesejável é temporariamente suprimido e essa supressão serve para propor
cionar reforçamento positivo imediato para o comportamento do punidor, tornando»
então, mais provável que ele puna no futuro.
A supressão temporária do comportamento produzida pela punição pode ser
facilmente demonstrada no laboratório, onde suas características quantitativas podem
ser apuradas. Num dos primeiros experimentos de Skinner (1938), ratos famintos
foram treinados a pressionar uma barra que produzia alimento num esquema de
reforçamento em I F . A pressão à barra foi então extinta, retirando-se o alimento.
Alguns dos ratos foram punidos durante os 10 primeiros minutos de extinção. A
punição foi na forma de um tapa forte nas patas dianteiras, liberados pela própria
barra, depois de cada pressão. O tapa consistia de um movimento inverso rápido e
forte da barra, provocado por um martelo que nela batia após cada pressão. O efeito
desses 10 min de tapa pode ser visto, comparando-se os processos de extinção de dois
Primeiro dia Segundo dia

Tempo (min)
ligura 17-13. Os eleitos dc uma punição leve (tapa) no processo de extinção operante
(Skin tier, 1938).
-399 -
grupos de ratos na Fig. 17-13. Está bem claro, na Fig. 17-13, que os tapas reduzem
imediatamente o responder para bem abaixo de sua taxa normal de extinção. Após os
10 min de tapas a taxa de respostas permaneceu, no primeiro dia, bem abaixo daquela
dos ratos não punidos. Esta supressão de resposta é um resultado típico da punição e
é uma especificação parcial dos efeitos emocionais da punição. Até agora, os resultados
confirmam nossa expectativa sobre a punição — ela suprime o comportamento e tem
efeito* imediato. No segundo dia de extinção, todavia, o grupo punido respondeu mais
rapidamente que o grupo não punido, de modo que,no fim de dois dias, o número
total de respostas de pressão à barra em extinção, para os dois grupos, era o mesmo.
Somos forçados a concluir que a punição leve, tal como um tapa nas patas
durante alguns minutos, não suprime permanentemente o processo de extinção
operante; simplesmente adia-o. Fosse nosso desejo eliminar a pressão à barra comple
tamente, não poderíamos usar esse procedimento, já que seu efeito é transitório.
Devemos ser cuidadosos para não supergeneralizar com base nesta única demons
tração. A punição não tem um efeito simples sobre o comportamento. Seus efeitos
dependem de muitos parâmetros do estímulo aversivo - sua força e duração, por
exemplo. Se um poderoso choque elétrico tivesse sido usado, em vez de um tapa leve.
e/ou tivesse a contingência de punição permanecido por várias horas em vez de poucos
minutos, o comportamento seria suprimido por muito mais tempo do que o foi. Além
disso, o número total de respostas no processo de extinção teria sido significantemente
atenuado, embora o tempo para alcançar o nível operante pudesse não ter sido
afetado. A menos que a punição tenha sido extremamente intensa, todavia, uma vez
que cesse, o comportamento eventualmente ressurge. Somente com estimulação
aversiva extremamente forte, a punição pode reduzir permanentemente o compor
tamento para o nível zero (Holz e Azrin, 1963). Os diferentes efeitos que a punição
pode ter sobre a resposta, dependendo da forçado estímulo aversivo, aconselham
cautela ao se fazer qualquer generalização superficial sobre os efeitos da punição.
irs
Figura 17-14. Representação do labirinto usado por Whiting e Mowrcr

(1943).
-4 0 0 -
No procedimento empregado por Skinner, apenas uma única resposta, a pressão à
barra, podia produzir o reforçamento positivo. Quando várias respostas podem
produzir o reforçamento positivo na mesma situação, a punição de uma resposta pode
facilitar o deslocamento do comportamento e, se efetuada criteriosamente, ajudar a
aquisição de novos padrões de comportamento. Num experimento de Whiting e
Mowrer (1943). ratos famintos aprenderam a percorrer o labirinto visto na Fig. 17-14.
Os ratos colocados na caixa de partida, rapidamente, adquiriram a cadeia de correr
para a caixa objetivo através do caminho curto. O comportamento está de acordo com
a Lei do Menor Esforço: dadas duas ou mais cadeias alternativas para o mesmo
reforçador, o organismo escolhe aquela que requer menos trabalho. Após a aquisição,
três procedimentos foram comparados em termos de sua habilidade para forçar os
ratos e usarem o caminho longo. Para um grupo de ratos, A, uma barreira de vidro foi
colocada no meio do caminho curto, de forma que os animais só podiam atingir a
caixa-objetivo através do caminho longo. Para um segundo grupo, B, retirou-se o
reforçamento para o percorrer o caminho curto e este só era dado se os ratos usassem
o caminho longo. Para um terceiro grupo, C, uma placa eletricamente carregada foi
colocada no meio do caminho curto, liberando um choque para os ratos que tentassem
usá-lo. Contudo, se os ratos passassem pelo choque, eles encontravam alimento.
Whiting e Mowrer obtiveram diferenças marcantes nas taxas de ajustamento a esses
procedimentos. Os ratos punidos do grupo C passaram a usar o caminho longo depois
de uma média de apenas 6 choques. O grupo da barreira foi 82 vezes à barreira antes
de mudar consistentemente para o caminho longo. 0 grupo B, sob extinção simples,
correu 230 vezes à caixa objetivo vazia através do caminho curto, antes de preferir o
longo. Evidentemente, punir uma resposta pude ajudar bastante na aquisição de outra
resposta disponível.
Esse resultado tem sido corroborado por outros experimentos. Se escolhas
incorretas são punidas e escolhas corretas são positivamente reforçadas, num labirinto
T, a aquisição é mais rápida do que se apenas se reforçar positivamente as respostas
corretas (Warden e Aylesworth, 1927). Deve-se tomar uma precaução na interpretação
de tais resultados. Embora a aquisição de comportamento possa ser acelerada pela
punição de formas indesejáveis da resposta, existe pouca evidência para indicar o que
acontece ao novo comportamento adquirido quando cessa a punição do compor
tamento indesejável. No estudo de Warden e Aylesworth, por exemplo, poderíamos
perguntar se haveria um aumento temporário nos “erros” caso os choques para as
respostas incorretas cessassem depois da aquisição.
Esses estudos sugerem uma conclusão prática. Se a punição é empregada na
tentativa de eliminar certos comportamentos, então qualquer que seja o reforçamento
que o comportamento indesejável tenha produzido, ele deve tornar-se disponível
através de um comportamento mais desejável. Apenas punir as crianças por um “mau
comportamento” na sala de aula pode ter pouco efeito permanente, salvo gerar uma
aversão duradoura pelo estudo. Os reforçadores para o “mau comportamento” devem
ser analisados e a sua obtenção deve, talvez, ser permitida através de respostas
diferentes, ou em outras situações. Se não se permite oportunidade suficiente para
atividade física às crianças, por exemplo, elas, provavelmente, serão superativas na sala
de aula, com efeitos prejudiciais para o ensino. Recessos freqüentes, contingentes ao
trabalho produtivo, em conjunção com a punição consistente da atividade indesejável,
pareceria ser uma aplicação prática dos resultados de Whiting e Mowrer. Even-
-401 -
tuaimente, a necessidade de se administrar estimuiação aversiva desapareceria, à médida
que o comportamento punido desaparecesse e fosse substituído por formas de
comportamento mais desejáveis. Mas, para que isso aconteça, parece importante
proporcionar uma alternativa recompensadora para as respostas punidas.
Uma classe de comportamento para a qual a punição pode ter efeitos muito
complicados é o comportamento que é adquirido e mantido por contingências
aversivas. Qual, por exemplo, é o efeito da punição no comportamento estabelecido de
esquiva do tipo descrito na Fig. 17-12? A evidência que temos no presente indica que,
se o comportamento é punido com o mesmo estímulo que o animal foi previamente
treinado a evitar, essa punição não reduz a força do comportamento. Em vez disso,
pode aumentar sua força! Se a punição é um estímulo aversivo diferente, entretanto,
ela terá seu efeito supressivo usual (Church, 1963; Solomon, 1964).
Um ponto crítico a ser retirado da presente discussão sobre punição é a
complexidade de seus resultados. Os efeitos da punição dependem de muitos fatores
para podermos escrever um simples paradigma de Procedimento, Processo e Resul
tados. Os Processos e Resultados dos Procedimentos de punição são variáveis e
condicionais ao tipo de comportamento que esta sendo punido, assim como aos
estados de muitas variáveis que operam no ambiente presente e passado do indivíduo
punido. Até que se desenvolvam leis gerais de punição, os subprodutos emocionais que
acompanham a estimulação aversiva sugerem que o seu emprego no controle prático
do comportamento humano deve ser efetuado com bastante cautela.
Muito do que chamamos punição nas atividades humanas toma uma forma algo
diferente da apresentação de um estímulo aversivo primário (incondicionado). Quando
punimos uma criança por mentir privando-a de seu jantar, ou quando mandamos um
homem para a cadeia por ter roubado, as conseqüências punitivas são na forma da
remoção de reforçadores positivos (condicionados e incondicionados). Ferster (1958)
estudou alguns efeitos comportamentais da remoção de um estímulo discriminativo
positivo contingente a certas respostas. No treino preliminar, a pressão à barra de
chimpanzés famintos era reforçada com alimento, num esquema de intervalo variável,
numa situação (S^), mas nunca era reforçada numa segunda situação (S^ ), As
situações eram alternadas periodicamente. Este é um procedimento padrão de dis
criminação, com reforçamento intermitente em S ^ Quando uma discriminação estável
havia sido estabelecida, o procedimento foi modificado de modo que o S ^ só aparecia
(o SD só terminava) seguindo taxas altas de resposta. A remoção do SD era
contingente a um certo padrão de respostas de pressões à barra, isto é, taxas altas. Pela
inibição das taxas altas, os chimpanzés foram capazes de evitar períodos de SA . O
efeito da contingência de Ferster foi produzir taxas de resposta anormalmente baixas
(inibição de taxas altas) que somente voltavam ao normal quando a contingência de
“punição” era retirada. É possível que a “punição” deste tipo evite alguns dos efeitos
emocionais colaterais indesejáveis dos estímulos aversivos incondicionados, merecendo
mais estudo como uma técnica adequada para controlar o comportamento.
17.7 MASOQU1SMO
Diz-se que certos indivíduos procuram punição. Os psicólogos clínicos e o?

psiquatras, referem-se a tais indivíduos como masoquistas. Que tipo de história de
condicionamento poderia ter dotado os estímulos aversivos primários usados na
-402-
punição de propriedades positivamente reforçadoras? Muenzinger (1934) mostrou que
tal inversão do valor de reforçamento pode ocorrer mesmo em nível infra-humano. Ele
treinou ratos famintos a correrem num labirinto em T, dando-lhes choque e depois
alimento, ao escolherem o braço designado. Esses ratos adquiriram a cadeia de
percorrer o labirinto mais rapidamente que os ratos controle que eram alimentados
mas não recebiam choque por escolherem o braço designado. Neste experimento e em
outros semelhantes, o choque é usado como um para respostas que são, depois,
positivamente reforçadas. Uma escolha correta no labirinto é seguida por um choque
que estabelece a ocasião para continuar até o alimento. Este procedimento deve, assim,
ser contrastado com aquele do choque para respostas em ou “ incorretas” . Às
contingências são:
R(escolha correta) - s~
R (aproximar-se) -
Sob essas condições, mesmo choques moderadamente fortes podem adquirir o status
de S^s para a aproximação ao alimento e, assim, o status de reforçadores positivos
condicionados. Num paradigma convencional de discriminação S^ - S ^ , Holz e Azrin
(1961) liberavam choques para a resposta de bicar a chave, em pombos, reforçada com
alimento em S^ mas não em S^ . Eles descobriram que o elemento de punição em S^
passou a controlar taxas apreciáveis de resposta. No teste, quando a punição era
administrada durante o S ^ , os animais começavam a trabalhar rapidamente, como se
estivessem em S^, embora nenhum alimento fosse liberado para tal resposta em S^ .
Esses animais de Muenzinger e de Holz e Azrin realmente pareciam ser masoquistas.
Eles pareciam trabalhar para serem punidos. Quando apreciamos a história que
transforma choques elétricos, em SDs para respostas que podem ser positivamente
reforçadas, talvez estejamos em vias de compreender as causas do masoquismo
humano.
REFERÊNCIAS PARA 0 CAPITULO 17

Barry, J. J., and Harrison, J. M. Relations between stimulus intensity
and strength of escape responding. Psychol. Rep., 1957, 3, 3-8.
Brogden, W. J., Lipman, E. A., and Culler, E. The role of incentive
in conditioning and extinction. Amer. J. Psychol., 1938, 51, 109
117.
Brown, J. S., and Jacobs, A. The role of fear in the motivation and acqui
sition ot responses. J . exp. Psychol., 1949, 39, 747-759.
Church, R. M. The varied effects of punishment on behavior. Psychol.
Rev., 1 9 6 3 ,7 0 ,3 6 9 -4 0 2 .
Dinsmoor, J. A., and Hughes, L. H. Training rats to press a bar to turn
off shock. J. comp, physiol. Psychol., 1956, 49, 235-238.
Dinsmoor, J. A., and Winograd, E. Shock intensity in variable interval
escape schedules. J . exp. Anal. Behav., 1958, 1, 145-148.
Ferster, C. B. Control of behavior in chimpanzees and pigeons by time
out from positive reinforcement. Psychol. Monogr., 1958, 72,
Whole No. 461.
- 403 -
Holz, W. C., and Azrin, N. H. Discriminative properties of punishment.
J. exp. Anal. Behav., 1961, 4, 225-232.
Holz, W. C., and Azrin, N. H. A comparison of several procedures for
eliminating behavior. J. exp. Anal. Behav., 1963, 6, 399-406.
Kaplan, M. The effects of noxious stimulus intensity and duration during
intermittent reinforcement of escape behavior. J. comp, physiol.
Psychol., 1952, 45, 538-549.
Miller, N. E. Learnable drives and rewards. Chap. 13 in S. S. Stevens
(E d .), Handbook of experimental psychology. New York: Wiley,
1951.
Muenzinger, K. F. Motivation in learning: I. Electric shock for correct
responses in the visual discrimination habit. J. comp. Psychol.,
1934,17, 439-448.
Muenzinger, K. F., and Fletcher, F. M. Motivation in learning, VI.
Escape from electric shock compared with hunger-food tension in
the visual discrimination habit. J . comp. Psychol., 1936, 22, 7 9 -9 1 .
Sidman, M. Two temporal parameters of the maintenance of avoidance
behavior by the white rat. J. comp, physiol. Psychol., 1953, 46,
253-261.
Skinner, B. F. The behavior of organisms. New York: Appleton-Cen-
tury, 1938.
Solomon, R. L. Punishment. Amer. Psychologist, 1964, 19, 239-253.
Verhave, T. Avoidance responding as a function of simultaneous and
equal changes in two temporal parameters. J. exp. Anal. Behav.,
1959,2, 185-190.
Warden, C. J., and Aylesworth, M. The relative value of reward and
punishment in the formation of a visual discrimination habit in
the white rat. J. comp. Psychol., 1927, 7, 117-127.
Weiss, B., and Laties, V. G. Titration behavior on various fractional
escape programs. /. exp. Anal. Behav., 1959, 2, 227-248.
Weiss, B., and Laties, V. G. Characteristics of aversive thresholds m ea
sured by a titration schedule. J. exp. Anal. Behav., 1963, 6, 563
572.
Weitzman, E. D., Ross, G. S., Hodos, W., and Galambos, R. Behavioral
method for study of pain in the monkey. Science, 1961, 133, 37-38.
Wertheim, G. A. Some sequential aspects of IRTs emitted during Sidman-
avoidance behavior in the white rat. J. exp. Anal. Behav., 1965, 8,
9-15.
Whiting, J. W. M., and Mowrer, O. H. Habit progression and regression
— a laboratory investigation of some factors relevant to human
socialization. J. comp. Psychol., 1943, 36, 229-253.
-404-
Capítulo 18 COMPORTAMENTO EMOCIONAL
Uma das distinções mais antigas é a classificação geral do comportamento humano

em emoções e paixões, de um lado, e atos racionais e voluntários do outro. No
entanto, esta dicotomia respeitável e constrangedora pouco tem feito para desenvolvei
a análise experimental dos comportamentos considerados emocionais. Quase sempre,
eles permanecem simplesmente como comportamentos que não podem ser explicados
por causas conhecidas. A emoção tem sido, com efeito, uma categoria de com
portamento do tipo “cesto de lixo” e os vários fenômenos aí depositados têm
apresentado uma forte resistência à integração sistemática. Realmente, muitos
psicólogos atuais, desencorajados por fracassos persistentes na formulação de um
conceito positivo de comportamento emocional, gostariam de afastar o termo
“emoção” do vocabulário conceituai da ciência. Eles - prefeririam interpretar os
fenômenos emocionais como estados especiais de motivação ou atividade geral.
Nenhuma dessas tentativas mostra-se completamente satisfatória porque, como ve
remos, uma dissecação conceituai cuidadosa do comportamento emocional revela
certas características únicas, não incorporadas por outras rubricas comportamentais
unificadoras. Na presente análise, portanto, reteremos o conceito de emoção, usando-o
com referência a certas mudanças amplas no comportamento operante; que resultam
da aplicação de operações ambientais bem definidas. Mas, antes de elaborar essas
relações, discutiremos um número de soluções tradicionais para os problemas que têm
sido atribuídos ao campo da emoção.
18.1 É A EMOÇÃO UMA CAUSA DO COMPORTAMENTO OU UM EFEITO

COMPORTAMENTAL?
Antes do fim do século dezenove, pensava-se que a emoção era um estado interno
do organismo que, quando induzido, causava um comportamento apropriado por parte
deste organismo. Assim, do ponto de vista tradicional ou clássico, a emoção era uma
causa do comportamento. Ouando, por exemplo, um veado vê um urso (S), surge o
mêdo (um estado corporal) que é seguido por uma R apropriada, correr. Similarmente,
um homem quando contrariado (S), torna-se zangado (estado corporal) e sua raiva
torna-o agressivo, R.
Os comportamentos manifestos supostamente induzidos por estados emocionais
- 405 -
foram classificados bem cedo, e Charles Darwin escreveu um tratado clássico des
crevendo sua utilidade biológica. O medo, por exemplo, induzindo à precaução, pode ter
salvo a vida de muitos animais na história da evolução. Assim também a raiva
pode ter sido útil para destruir certas barreiras físicas que evitavam a conclusão de uma
cadeia de comportamento que levaria a um reforçador biologicamente significante.
Outras emoções, tal como a alegria, Darwin supôs serem úteis para o objetivo de
comunicar a outros organismos próximos que nenhuma ação agressiva viria, e que os
comportamentos cooperativo, sexual e outros seriam agora seguros e reforçadores.
Darwin descreveu as posturas elaboradas c os respondentes pelos quais as emoções de
raiva, medo e alegria são “expressas” nos animais (Fig. 18-1). Poderiam ser iden
tificados padrões de resposta bem definidos que eram, de alguma forma, peculiares à
espécie e, mesmo assim, apresentavam elementos comuns entre as espécies. O
enrijecimento dos lábios de um homem com raiva, revelando seus dentes caninos, era
interpretado como um vestígio da retração da boca dos animais que preparam seus
dentes afiados para atacar um agressor. Hoje, raramente mordemos quando com raiva
mas esse padrão de vestígio ainda está conosco.
As explicações de Darwin enfatizam o que podemos chamar de aspectos
Figura 18-1. Hostilidade e nl'ah ií ida do cm animais. (1) Hostilidade no cão. (2)
Afabilidade no cão. (3) Hostilidade no gato. (4) afabilidade no gato (de Darwin,
1872, segundo Yoimc, 1%1). " "
- 406-
topográficos do comportamento emocional. William James, escrevendo no fim do século
dezenove, estava mais interessado na seqüência de causa e efeito na emoção. Em
particular, ele estava interessado em refutar a idéia de que os estados internos
causassem o comportamento emocional. James propôs que as mudanças somáticas na
emoção (respondentes fisiológicos) não eram a causa do comportamento manifesto,
mas sim o resultado de padrões comportamentais que eram eliciados diretamente pela
situação. “ 0 bom senso diz: perdemos nossa fortuna, ficamos tristes e choramos*
encontramos um urso, assustamo-nos e corremos; somos insultados por um rival,
ficamos com raiva e lutamos” (James, 1890). James argumentou, todavia, que a
“ proposição mais racional é que nos sentimos tristes porque choramos, raivosos
porque lutamos, medrosos porque trememos e não que choramos, lutamos ou
trememos porque estamos tristes, zangados ou com medo, como seria o caso” (James,
1890). James inverteu, assim, a seqüencia clássica dos eventos na emoção.
Na explicação de James, assim como em todas as tradicionais, o “sentimento” de
emoção, fosse uma causa ou um efeito, tinha um papel crítico.
“fi quase impossível, para mim, pensar que tipo de emoção de medo restaria se
não estivessem presentes o sentimento da aceleração dos batimentos cardíacos e da
respiração ofegante, do.tremor dos lábios e dos membros enfraquecidos, dos arrepios e
das contrações viscerais. Pode-se fingir um estado de raiva e não se apresentar uma
excitação no peito, não ficar com a face vermelha, não se dilatar as narinas, não
ranger os dentes, não se ter um impulso para a ação vigorosa...? E, tal como na
tristeza, o que seria dela sem suas lágrimas, seus soluços, sua sufocação do coração e
suas dores no peito? ” (James, 1890).
A descrição de James implicava em que os estados corporais que acompanham os
comportamentos emocionais ofereciam uma base para definir as emoções.
Nas décadas de 1920 a 1930, Walter Cannon, um fisiólogo, contestou as sugestões
de James de que as emoções eram distinguidas por estados corporais especiais. Cannon
argumentava que ( 1 ) os estados fisiológicos para muitas emoções diferentes eram
muito semelhantes e não podiam ser distinguidos; raiva e ansiedade, por exemplo,
proporcionavam mudanças idênticas em muitos respondentes. (2) Os respondentes da
emoção ocorriam em estados não emocionais, tais como exposição a um vento gelado,
exercício pesado e febre. (3) A droga adrenalina, quando injetada em sujeitos
humanos, produz os respondentes típicos de medo (dilatação dos bronquíolos,
constrição dos vasos sanguíneos, liberação de açúcar do fígado, aumento nos batimen
tos cardíacos, cessação da função gastro-intestinal, etc.) embora os indivíduos assim
injetados não relatassem emoção (Cannon, 1927).
Cannon aduziu outra evidência para provar que o “ sentimento” de emoção não
poderia ser apenas o resultado de mudanças respondentes que ocorrem em situações
emocionais e, então, apresentou uma teoria própria. Os eventos internos que
relatamos como “sentimentos” são mediados por uma região especial do cérebro, o
tálamo. Sua hipótese foi baseada nos efeitos de lesões e estimulação elétrica dessa
região do cérebro no comportamento emocional.
18.2 TRÊS CONCEITOS DE EMOÇÃO
Eventos internos. Apesar das diferenças entre as teorias de Darwin, James e

Cannon, em todas elas eventos privados não observáveis (“sentimentos” ), acessíveis
somente ao indivíduo que está experimentando, ocupam uma posição proeminente. Os
-4 0 7 -
Diagramas da Fig. 18-2 resumem esses pontos de vista históricos. (Lê-se ->com o “ conduz
Clássico"---- S -----►
emocional
James (1890)—S
Comportamento
emociona]
Eventos
Cannon (1927)- S
emociona]
Figura 18-2. Representação esquemática de três teorias históricas da causação
emocional.
Surge um problema metodológico na determinação de como tratar os chamados

“sentimentos” de emoção, aqueles eventos tão vivamente descritos por James na p .407
Podemos concordar que tais sentimentos realmente caracterizam a emoção, mas
como iremos medí-los e controlá-los? E, na ausência de uma observação direta, como
podemos pelo menos estar certos de que o sentimento de medo que Smith diz que
tem é o mesmo sentimento de medo que Jones diz ter? Um indivíduo adquire tais
respostas verbais, como “estou com medo” , “estou triste” , “estou feliz” , através do
reforçamento pelos pais e outros adultos quando, em criança, ele vocaliza essas frases
na presença de certas situações, ambientais. Por exemplo, ao ver uma criança tremer e
chorar na presença de um objeto não familiar, um pai pode ser inclinado a dizer “você
está com medo” , e a criança, desse modo, poderia adquirir a resposta “estou com
medo” . Uma história análoga prevaleceria para outras “emoções” . Mas a comunidade
que modela o nosso repertório verbal de “emoção” nunca olha dentro de nós para
tornar o reforçamento contingente ao responder discriminativo na presença de um
estado fisiológico particular e bem definido. Quaisquer que sejam os elementos de S^s
internos que estiveram presentes por ocasião do reforçamento inicial, eles são
p re su m iv e lm e n te os mesmos eventos internos que estão presentes quando o adulto, mais
tarde, relata seu estado emocional; mas esses eventos discriminativossão privados e
permanecem para sempre privados para cada um de nós.
A inacessibilidade de nossos sentimentos ao exame de outras pessoas não os torna
de todo irrelevantes. Eles permanecem inúteis como sugestão para onde e quando o
cientista procurar as variáveis, relações e conceitos significantes do comportamento
emocional. É como um dado científico que eles não alcançam o critério de
observabilidade da ciência, já que esse critério estipula que os dados sobre os quais a
ciência constrói suas leis devem ser acessíveis a todos os que desejam observá-los.
Quando a emoção - como a aprendizagem, memória, motivação e outros fenômenos
psicológicos tratados em capítulos anteriores — encontra uma tradução em termos
comportamentais que todos podem validar, está preparado o estágio para sua análise
experimental.
- 408-
O problema dos eventos privados é particularmente enfatizado na emoção apenas
porque o comportamento emocional manifesto é frequentemente acompanhado por
mudanças viscerais (estômago, coração, pulmões, etc.) e glandulares intensas e amplas.
Sejam ou não esses eventos mais fortes quando se diz que o comportamento e
“emocional” , a metodologia para o estudo da emoção é exatamente a mesma que a de
outros processos comportamentais. Os sentimentos que podem acompanhar os eventos
viscerais sempre apresentam o problema de serem privados e, portanto, de exclusão
científica, por mais vívidos_que possam ser para a pessoa que os está experimentando.
Uma suposição razoável é a de que os eventos privados inacessíveis que chamamos de
sentimentos estão correlacionados com estados fisiológicos particulares que são aces
síveis à observação, dada a instrumentação necessária. É realmente recomendável
dirigir-se para dentro do organismo e investigar as propriedades dos processos
fisiológicos concomitantes com o comportamento manifesto e isto desempenha um
papel importante no desenvolvimento de um quadro compreensivo de qualquer
fenômeno comportamental. Mas tal investigação fisiológica não substitui a necessidade
de uma informação sólida sobre o comportamento e seus determinantes ambientais.
Padrões reflexos. Se desviarmos nossa atenção dos eventos privados, descobrimos
que o problema da seqüência de situação, sentimento e comportamento não mais nos
preocupa da mesma maneira que preocupou James e Cannon. Desde que os sentimen
tos reais não são mensuráveis ou manipuláveis diretamente, não é de interesse crítico,
para nós saber se eles ocorrem antes, depois ou ao mesmo tempo que o com
portamento. J. B. Watson, o homem que tanto preparou a psicologia para a análise
moderna do comportamento, parece ter sido um dos primeiros a ver isso e, em seus
escritos, encarava a emoção como padrões especiais de respostas, eliciados inicialmente
por estímulos incondicionados. Esses padrões, ele notou, poderiam ser ligados a
estímulos previamente neutros, através de procedimentos de condicionamento
Pavloviano. Partindo de estudos em recém-nascidos, Watson concluiu que havia somente
tres de tais padrões que legitimamente eram qualificados como emoções padrões X, Y
e Z. A Tabela 18-1 resume o esquema de Watson. Evidentemente, os três padrões
emocionais primários da Tabela 18-1, X, Y e Z, são os protótipos do que mais
comumente chamamos de raiva, medo e alegria. De acordo com Watson, todas as
outras emoções são baseadas nessas três, como misturas ou combinações que surgem
através de procedimentos complexos de condicionamento Pavloviano.
Watson preparou uma demonstração simples para mostrar como o condiciona
mento amplia os controles da emoção. Para uma criança Albert de 11 meses de
idade, Watson mostrou um rato (S j) nunca antes temido e emparelhou a presença do
rato com umas poucas apresentações de um som alto súbito (S 2 ), produzido pela
batida de um martelo numa barra metálica. O som amedrontava a criança (síndrome Y
de Watson), e servia como o eliciador incondicionado num paradigma Pavloviano. Em
certo ponto, o rato (S \) passou a eliciar, em Albert, uma CR que era muito
semelhante ao comportamento Y: chorar, gritar, retrair-se, etc. A forma condicionada
de medo pode ou não ser exatamente idêntica ao medo incondicionado. Para enfatizar
esse ponto, a CR baseada nos reflexos de medo incondicionado é geralmente referida
como ansiedade. Em experimentos posteriores, Watson mostrou que essa ansiedade
condicionada podia ser lentamente extinta pelo método usual — apresentação de
S\ (o rato) sem o S2 (o som alto).
Uma das vantagens importantes do tratamento das emoções feito por Watson com
-409-
relação ao de seus predecessores é que ele formulou a pergunta: quais são as causas
externas do comportamento emocional? Como o próprio Watson frisou, “nunca
ocorreu a James ou a algum dos seus seguidores neste aspecto, especular, e muito
menos experimentar, sobre a gênese das formas emocionais de resposta” (Watson,
1930, p. 142). A demonstração de Watson de que as emoções estavam ligadas aos
princípios do condicionamento Pavloviano foi um primeiro passo para a sua análise
experimental. Realmente, o capítulo presente pode ser chamado de Alguns efeitos
complexos do condicionamento Pavloviano, mas nós seguimos a tradição discutindo
esses efeitos como “emoções” .
TABELA 18-1
A DEFINIÇÃO WATSONIANA DAS EMOÇÕES DA CRIANÇA COMO

PADRÕES REFLEXOS (Compilada por Tolman, 1923)
ELICIADORES RESPONDENTES
RAIVA (X)
Impedir os movimentos da criança segu- Chorar, gritar, endurecer o corpo. Movi-
rando sua face ou cabeça; ou segurar mentos coordenados de golpear e bater
seus braços fortemente junto ao corpo. das mãos e braços. Levantar e abaixar
pés e pernas. Prender a respiração.
MEDO (Y)
Remover subitamente todos os meios de Retenção súbita da respiração. Segurar -
sustentação (deixar cair das mãos para se (reflexos de segurar). Piscar os olhos,
ser segura por um assistente). Som alto. Franzir os lábios. Chorar.
Empurrar de repente ou balançar leve
mente (logo que começar a dormir ou
logo que acordar). Puxar de repente o
cobertor (quando está adormecendo).
ALEGRIA (Z)
Acariciar ou manipular uma zona eró- Se a criança está chorando, ela para de
gena. Fazer cócegas, balançar, embalar chorar. Aparece um sorriso. Ela emite
suavemente. Dar tapinhas leves. Colocar sons.
em decúbito ventral no joelho do assis
tente.
Operantes interrompidos. Outro passo conceituai deve ser dado para simplificar a
análise experimental de fenômenos emocionais. Watson endossou o ponto de vista
(como fez Darwin) de que as emoções primárias eram padrões complexos de resposta
in condicionada e tomou três de tais padrões como “ fundamentais”. Mas qual a
justificativa que ele possuia para limitar-se justamente a esses três em particular? Um
som alto — por exemplo, um tiro de pistola à queima-roupa — produzirá o padrão de
-410-
susto (Fig. 18-3) c uma imensidão de outros respondentes. O padrão é completado em
cerca de 1/2 scg, e contém muitos dos aspectos de um breve ataque de emoção. Mas,
por que não c chamado de uma emoção? Assim, também a tosse, o soluço, o espirro,
o lacrimejar dos olhos por causa de uma partícula de poeira, os sintomas da alergia
chamada febre do feno, a palpitação e o enrubescimento depois de exercícios pesados,
e a indigestão depois de comer muito, todos envolvem padrões complexos de
respondentes. Contudo, poucos os chamariam de emoções. O que há de especial com as
reações X, Y, Z que elas, e não esses outros padrões, devem receber um status
especial e ser denominadas “emoções”? Nenhuma resposta satisfatória foi dada, ainda,
a esta questão. Não foram encontrados critérios adequados que possam distinguir os
reflexos emocionais dos reflexos não-emocionais. Na sua ausência, podemos supor que
a definição de emoção encontra-se em outro lugar que não nas características especiais
de certos padrões reflexos.
Um aspecto primordial de todas as emoções é a ruptura, distúrbio, intensificação
ou mudança geral que ocorre em qualquer de uma variedade de comportamentos
arbitrários nos quais um indivíduo possa estar empenhado no momento em que ocorre o
que nòs chamamos de uma situação emocional. Realmente, um homem amedrontado é
mais facilmente identificado pela depressão marcante de todas as suas atividades usuais
l iguni 1R-3. Resposta dc susto a uni tiro dc pistola (Lands c Hunt, 1939).
do que por mudanças cardíacas, respiratórias ou digestivas especiais. Um homem com

raiva é o epitome de um homem com o comportamento interrompido. E improvável
que um indivíduo muito zangado prossiga o que estava fazendo antes de tornar-se
zangado. Agora ele se volta a novos comportamentos; o mais provável é que ele
estrague coisas à sua volta, faça réplicas verbais fortes e emita operantes com força não
usual. Prometa a uma criança uma atividade especialmente atrativa e ela poderá,
literalmente, pular dc alegria. Muitos dos comportamentos presentes da criança são
temporariamente interrompidos e outros podem ser intensificados. E o caráter especial
- rr* -
dessas mudanças amplas, e rião dos padrões reflexos ou dos estados corporais, que se
mostrará o esquema mais conveniente para estudar as emoções.
As operações que fazem aparecer essas mudanças amplas consistem de dois tipos
principais: ( 1 ) a apresentação ou término de reforçadores primários poderosos, e ( 2 ) a
apresentação de estímulos que foram previamente associados com tais reforçadores
poderosos através do condicionamento Pavloviano. As mudanças amplas em muitos
comportamentos operantes associadas com essas operações poderiam ser interpretadas
como mudanças simultâneas no valor reforçador de praticamente todos os reforçadores
primários do organismo. A destruição e o estrago adquirem tal valor reforçador para o
indivíduo zangado que, momentaneamente, nada mais é importante. O homem que
está amedrontado ou desgostoso perde o apetite e o desejo sexual. As pessoas
enamoradas estão frequentemente tão envolvidas com os seus reforçadores recém-en-
contrados que elas “vivem dc amor” exclusivamente, por um período de tempo,
negligenciando o alimento e não se empenhando em outras atividades de rotina.
Pareceria que a emoção, como a motivação, classifica um grupo de operações que
modulam o valor reforçador de reforçadores primários e mudam a atividade geral do
organismo. Assim, não devemos nos surpreender em saber que muitas autoridades,
atualmente, tratam os dois tópicos como uma área unificada. De qualquer forma, há
diferenças nas espécies de operações historicamente atribuídas aos dois campos. As
operações universais antecedentes associadas à motivação são privação e saciação. Na
enioção, as operações antecedentes são mudanças abruptas de estímulo. Além disso, o
medo, a raiva e a alegria implicam em mudanças difusas, não específicas, no valor de
todos os reforçadores; fome e sede implicam em mudanças algo mais específicas num
grupo mais restrito de reforçadores.
18.3 0 PARADIGMA DA ANSIEDADE
Uma parte significante da análise da emoção como uma quebra das atividades
operantes rotineiras de um indivíduo surge dos estudos de um fenômeno de
laboratório conhecido como ansiedade experimental. A ansiedade é produzida por uma
variante da variação de Watson do condicionamento Pavloviano: um estímulo original
mente não aversivo (S l) é emparelhado com um estímulo aversivo (S J). A ansiedade é
medida observando-se os efeitos que o emparelhamento tem sobre quaisquer atividades
operantes em que o organismo possa estar empenhado. Desde que somos limitados na
faixa de estímulos aversivos que poderíamos desejar apresentar para um organismo
humano, geralmente podemos escolher entre macacos, ratos c pombos para serem
sujeitos. Para manter esses animais em atividades operantes por períodos substanciais,
podemos privá-los de alimento ou água e, então, treiná-los a pressionar uma barra ou
bicar uma chave com reforçadores positivo intermitente. Uma vez completado esse
treino, temos um organismo que manterá uma taxa moderada de comportamento
operante por um longo período de tempo, uma preparação a partir da qual podemos
administrar procedimentos de condicionamento Pavloviano
Um experimento clássico de ansiedade condicionada, é o de W. K. Estes e B. F.
Skinner (1941) usando um procedimento Pavloviano superposto a um operante
reforçado intermitentemente, como salientamos. Certos refinamentos dc procedimento
foram introduzidos por Hunt c Brady (1951, 1955) e e sua técnica experimental que
descreveremos. Eles treinaram ratos privados dc líquidos a pressionar uma barra poi
-41 2-
água ò, então, coíocaram o comportamento sob um esquema IV de reforçamento com
água. Quando o comportamento em IV se tornou estável, foram feitos jmparelhamen-
tos Pavlovianos, periodicamente, com um clique (S j) soando por 5 min, seguido por
um choque elétrico breve (S2 ) nos pés do rato.
(A) Resultado típico durante (B)Primeira tentativa de

um período de 15 min. condicionamento.
(C) Resposta emocional condicionada
Legenda
Clique introduzido em C,
terminado pelo choque
em S após 5 min.
Tempo
I'igura lfl-4. A resposta cie ansiedade condicionada ((’AR) no rato, como aparece
tipicamente no comportamento operante de pressionar a barra positiva e intermiten
temente reforçado (Hunt e Bradv, 1951).
-413-
Algumas das mudanças comportamentais típicas que se seguiram podem ser vistas
nas curvas cumulativas de pressão à barra da Fig. 18-4. Estas curvas descrevem
distúrbios no operante reforçado por água que estava ocorrendo, distúrbios estes que
surgiram devido ao emparelhamento Pavloviano de S\ comS 2 . Na Fig. 18-4A, o rato
estava trabalhando estavelmente na barra. Os reforçamentos com água não são vistos,
mas vários foram fornecidos durante o período visto em (A). A primeira tentativa de
condicionamento Pavloviano (S i, S2 )é vista em (B). Note que, neste estágio, o clique,
S i, não tinha efeito perceptível na pressão à barra. O choque, todavia, quando
apareceu, resultou numa breve diminuição da taxa, mas logo o rato estava novamente
trabalhando com estabilidade. O procedimento de emparelhamento foi repetido em
intervalos. Depois de alguns emparelhamentos, ocorreu uma mudança que pode ser
vista na parte central, à esquerda, na Fig. 18-4. O rato começou a responder
irregularmente e com taxa reduzida durante o clique. Enquanto isto, a resposta original
ao choque começou a se adaptar (seção 18.9), de modo que o choque, em si, afetava
cada vez menos a pressão à barra. Depois de um número de emparelhamentos (em
baixo, à direita, na Fig. 18-4), ocorre uma cessação quase completa de pressão à barra
no período de clique. O comportamento operante em processo foi quase completa
mente interrompido pelos emparelhamentos; havia se desenvolvido a ansiedade condi
cionada, na forma de uma supressão condicionada da pressão à barra positivamente
reforçada. A observação do rato durante o período de clique, revelou os reflexos
característicos do medo: retração, tremor, palpitação, imobilidade, defecação e micção.
A ansiedade condicionada tem sido verificada em um número de espécies e com
um número de esquemas de linha-base de reforçamento positivo. O resultado geral é
uma supressão do responder desenvolvido durante o estímulo de aviso. A supressão é
duradoura; pombos mantiveram-na após um período de 2 anos de descanso (Hoffman.
Fleshier, e Jensen, 1963). Logicamente, então, os efeitos do procedimento de
ansiedade são consistentes e duráveis. Mas há alguma razão para se acreditar que o que
estamos estudando em animais no laboratório tem alguma coisa a ver com a ansiedade
como a conhecemos no homem?
Resta ver se o que é chamado ansiedade pelo pesquisador no laboratório é

relevante para as especulações sobre ansiedade no homem. Certamente não compre
endemos, do ponto de vista clínico, precisamente o que é a ansiedade no homem,
enquanto que o pesquisador no laboratório pode especificar um significado. Tomar
emprestada a palavra ansiedade para os nossos experimentos reflete o julgamento
de que os experimentos contêm os aspectos básicos do que acreditamos, embora
sem prova adequada ainda, de estar envolvido na ansiedade humana” (Schoenfeld, p.
75).
Voltemo-nos para alguns aspectos adicionais da ansiedade condicionada. É fácil

verificar que a supressão condicionada ocorre no seu máximo para o estímulo de aviso
particular (S i) que foi usado no emparelhamento Pavloviano. Mas também ocorre
alguma supressão para estímulos semelhantes a S j, mesmo que esses nunca tenham
sido previamente emparelhados com choque. Pode-se demonstrar um gradiente de
generalização para a supressão condicionada, testando-se a extensão de supressão
ante estímulos relacionados com o S\ real usado no treino, embora diferentes.
Hoffman e Fleshier, (1961) estudaram essa generalização da supressão condicio-
- 414 —
300 450 670 1000 1500 2250 3400
F re q ü ên cia (ciclo s p o r seg u n d o )
Figura 18-5. Gradientes de generalização de supressão. O índice de supressão usado

tem as seguintes propriedades: quando o índice é igual a 1.0, a supressão em Si é
total; quando é 0, não há distúrbio durante S\; e quando é menor que 0, há
intensificação da taxa em IV durante S\. Os números à esquerda de cada gradiente
indicam as sessões incluídas.
nada em pombos cuja resposta de bicar era mantida por um esquema de refor
çamento com alimento em IV 2 min. Um tom de 1000 ciclos foi usado como
Si e um choque elétrico no corpo do animal como S2 - Após repetidos empare-
lhamentos de Si e S2 , o bicar a chave foi suprimido em Si. Então, o choque foi
permanentemente interrompido, tons de várias freqüências foram apresentados no
decorrer de 25 sessões-teste e qualquer supressão a eles foi medida. A Fig. 18-5, de
um animal típico, mostra que no decorrer das sessões 1-5 (a curva superior acima),
ocorreu, quase completa supressão a uma faixa ampla de tons; o gradiente é achatado.
Nas sessões subsequentes o gradiente tornou-se gradualmente mais inclinado, à medida
que o animal restringia o bicar a chave, bicando na presença daqueles tons mais
remotos do S\ dc treino. Mas, mesmo depois de 25 sessões sem choques, ainda ocorria
uma supressão quase perfeita para o Sj original do treinamento. Esses gradientes de
generalização indicam, primeiro, que a ansiedade pode se espalhar para condições
muito diferentes daquelas que originalmente a produziram e, segundo, que a ansiedade
condicionada, uma vez produzida, pode ser extremamente resistente à extinção.
Podemos resumir a informação apresentada sobre ansiedade experimental em seu
paradigma.
DADOS: Um operante, previamente fortalecido com reforçamento positi
vo, um eliciador aversivo incondicionado, um estímulo‘‘neutro”
PROCEDIMENTO: (1) um operante é mantido num esquema intermitente de
reforçamento positivo, por exemplo R - ü > S'h
( 2 ) Enquanto as contingências de reforçamento positivo
permanecem em vigor, S\ é ocasionalmente emparelhado com
S2 •
-41 5-
PROCESSO: Ocorre uma supressão gradual da taxa de R sempre que
S\ é apresentado.
RESULTADO: R é suprimida em alguma extensão mensurável durante S] e
outros Ss relacionados.
Nossa avaliação do paradigma de ansiedade experimental revela que o emparelha-
mento de um estímulo previamente neutro com um estímulo aversivo, enquanto o
organismo está empenhado em outras atividades, produz certos efeitos drásticos, e
duráveis naquelas atividades. Geralmente, as “outras atividades” têm se restringido ao
comportamento mantido por esquemas dc reforçamento intermitente. Um perfil mais
completo dos efeitos emocionais incluiria informações sobre discriminação, diferencia
ção, encadeamento, solução dc problema, esquiva e outras linhas-base comportamen
tais. Existem razões para se esperar efeitos característicos em cada um desses casos.
Frequentmente, diz-se que a ansiedade moderada facilita a solução de problema,
enquanto que a ansiedade forte a dificulta. Os procedimentos de ansiedade condicio
nada permitem testes objetivos dessas e de outras afirmações. Os efeitos dos
procedimentos de ansiedade condicionada são seguramente mais complexos do que
qualquer proposição simples de “supressão” . Já se sabe que o procedimento de
emparelhar S j , S J >quando superposto a uma linha-base dc esquiva, pode gerar
facilitação da resposta, em vez de supressão. (Sidman, 1960).
A ansiedade experimental, na forma dc supressão da resposta intermitentemente
reforçada, tem se mostrado um instrumento de utilidade prática para o estudo de
diversas variáveis experimentais. Brady e Hunt (1955) descobriram que podiam
eliminar temporariamente a ansiedade experimental liberando corrente suficiente, no
cérebro do rato, para produzir convulsões (um procedimento chamado de ECC o
“choque cletroconvulsivo” , comum na prátioa psiquiátrica). A supressão condicionada
é previsivelmente afetada por tranqüilizantes que controlam os sintomas da ansiedade
humana. Outros pesquisadores têm estudado os efeitos de várias lesões cerebrais na
supressão condicionada, na busca de estruturas do sistema nervoso central que são
críticas para o comportamento emocional (Brady, 1961, 1962).
18.4 RAIVA
A ansiedade diz respeito à apresentação de reforçadores negativos. Uma forma

bem diferente de distúrbio comportamental ocorre quando reforçadores positivos são
removidos. Já tivemos ocasião de fazer referência (seção 5.1) ao breve aumento que
ocorre na taxa de resposta quando uma cadeia de comportamento operante é
abruptamente quebrada pela extinção. No rato, esse aumento na taxa da resposta
fortalecida é acompanhado por uma variedade dc outros comportamentos cujas
características morder o manipulandum da resposta, agitação extrema, excitamento
violento implicam como emocionais.
Essas observações têm seus corolários nos comportamentos agressivos apresentados
por sujeitos humanos com raiva. Gates (1926) entrevistou estudantes universitárias e
lhes pediu para fazerem uma lista das circunstâncias que tipicamente as tornavam
iradas. As moças citaram recusas de convites, atraso de amigos aos encontros, discar
um número errado no telefone, falhas na operação de relógios, canetas c máquinas de
escrever, atraso de ônibus ou elevadores ou perda de dinheiro, como os precipitadores
mais comuns. Cada uma dessas situações produzia tendência fortes para retorquir
-416-
verbalmente, causar danos físicos a alguém, quebrar objetos, retirar-se vigorosamente
da situação, gritar e xingar. Cada uma das causas citadas implica numa extinção súbita
de um comportamento previamente reforçado, a interrupção abrupta de uma cadeia de
comportamento.
Azrin, Hutchinson e Hake (1966) planejaram uma técnica para medir experimen
talmente a duração e frequência de comportamentos agressivos que resultam da
interrupção de uma cadeia dc comportamento. Nesta técnica, um pombo faminto foi
treinado a bicar uma chave por alimento. Quando o pombo experimental havia
adquirido o comportamento de bicar a chave, um segundo pombo “ alvo” , imobilizado
numa caixa especialmente construída, foi introduzido no compartimento experimental
(Fig. 18-6). À caixa que continha o pombo-alvo foi montada de maneira que um
interruptor, colocado sob a caixa, desligava, sempre que esta era sacudida vigorosamen
te. A montagem foi cuidadosamente equilibrada, de modo que os movimentos normais
espontâneos do pombo-alvo eram insuficientes para acionar o micro-interruptor, ao
passo que, quaisquer ataques vigorosos que o pombo experimental dirigisse ao corpo
exposto do pombo-alvo seriam registrados. Os ataques ocorreram dentro da previsão.
Sempre que as contingências de reforçamento eram mudadas abruptamente de crf para
extinção, o pombo experimental, invariavelmente, atacava, o alvo. Os ataques eram
viciosos e agressivos, durando ate 10 minutos.
Os resultados paralelos da interrupção de uma cadeia de comportamento reforça
do, tanto em animais como em homens, confirmam a generalidade do paradigma de
frustração. Seu procedimento é, simplesmente, uma extinção abrupta de um operante
após reforçamento contínuo. Seus resultados são mudanças amplas na topografia do
comportamento, acompanhadas por mudanças no valor reforçador da destruição,
estrago e outros atos agressivos.
São esses comportamentos de raiva condicionados da mesma maneira que o medo
foi condicionado na seção anterior? Num estudo relevante Leitenberg, (1966) treinou
Proteção
Ajuste Moi a de compressão

da força
1 igura 18-6. R epresentação csqu em ática da aparelhagem para medir o a taq u e

(Azrin, H u tch inso n e Hake, 1966).
- 417 -
ratos, a pressionarem uma barra com relorçamento positivo num esquema IV . Durante
a sessão, foi apresentado um ‘‘estímulo de aviso” (S i), seguido poucos minutos mais
tarde por um segundo estímulo (S^ 2 ),que indicava que um período de extinção para a
pressão à barra havia entrado em efeito. O procedimento é análogo ao procedimento
de ansiedade condicionada, mas um estímulo correlacionado com extinção ( S 4 )
substitui, aqui, o choquc (SA). Depois de poucos emparelhamentos, os ratos de
Leitenberg, aumentaram suas respostas no estímulo de “ aviso” , embora tal aumento na
taxa não produzisse mais reforçamento. _
Podemos especular que essa facilitação da taxa de resposta representa uma
“resposta condicionada dc raiva” , mas o procedimento de Leitenberg, é apenas
sugestivo. Muitos aspectos do comportamento não foram medidos para que possamos
estar certos de que, durante o estímulo de aviso, a probabilidade de comportamentos
agressivos tais como o ataque ou o responder anormalmente intenso pode também ter
sido aumentada.
18.5 ELAÇÃO
Medo e raiva são aproximadamente descritos como emoções negativas, já que

dependem da apresentação de reforçadores negativos ou remoção dc reforçadores
positivos. Mas o comportamento emocional não se limita puramente aos exemplos
negativos. Watson identificou “a síndrome Z” como um padrão reflexo incondicionado
resultante da estimulação dc zonas erógenas ou associadas com alimentação (lactente)
Na conversa casual, identificamos os comportamentos como alegres, excitados, agradá
veis e assim por diante. Nosso objetivo, aqui, será mostrar que essas termos implicam
na existência de um outro grupo de distúrbios operantes que, como a ansiedade, estão
estritamente associados com certos procedimentos dc condicionamento Pavloviano.
Todos já viram uma criança encantada pela promessa da chegada de coisas boas.
Mesmo o adulto pode “vibrar” com boas notícias. O eão tem um mecanismo típico, o
balançar a cauda, para indicar seu entusiasmo quando acolhe seu dono ou quando
está perto de ser alimentado ou acariciado. Tais observações sugerem que os efeitos do
reforçamento positivo não se limitam ao fortalecimento e manutenção do comporta
mento (-perante. Um S+ ou um estimulo que precede S+ 5 parece gerar algum distúrbio
comportamental que pode ser chamado de “alegria” ou “elação” . Podemos imaginar
facilmente+um procedimento de elação condicionada no qual um S\ é emparelhado
com um S2 enquanto o organismo está trabalhando numa atividade operante. É mais
difícil predizer os efeitos desta operação. Um homem de negócios trabalhando
diligentemente 11a sua agenda diária quando sabe que acertou na bolsa dc valores e a
dona de casa, no meio dos afazeres domésticos, assando uni bolo, quando fica sabendo
cjue ganhou uma passagem de graça para o Havaí, provavelmente terão suas atividades
interrompidas. Contudo, é uma questão experimental saber como esta interrupção
difere daquelas chamadas de ansiedade c raiva. A questão implica num programa
sistemático de pesquisa envolvendo numerosas linhas-base c, talvez, muitos procedi
mentos diferentes dc emparelhamento de S i,S 9 . No presente, temos a oferecer apenas
uma informação experimental restrita acercada realidade da elação condicionada.
Herrnstein e Morse (1957) treinaram pombos a bicar uma chave por alimento e,
então, estabilizaram a resposta na chave num procedimento que gerava uma taxa
muito baixa dc bicar. Lies reforçavam apenas aquelas respostas espaçadas de pelo
- 418 -
menos 5 min (drl 5 min, ver seção 8 . 6 ). Quando a taxa de resposta parecia estável,
um paradigma Pavloviano foi superposto às contingênicas operantes. S\ era uma
mudança na cor da chave seguida depois de algum tempo por S2 , uma apresentação
“livre” de alimento, idêntica ao reforçamento usado para manter a linha-base, exceto ,
que a apresentação “livre” de alimento não era contingente a uma bicada na chave. O
procedimento de Herrstein e Morse produziu uma mudança dramática na taxa de bicar a
chave durante S]. Antes do procedimento Pavloviano, uma taxa muito baixa e
razoavelmente constante de bicar havia sido mantida Depois do procedimento
Pavloviano estar em efeito por algumas sessões, todavia, taxas altas de bicar desenvol
veram-se durante S \. A Fig. 18-7 mostra os registros cumulativos da sessão 11 para
seis sujeitos. Em a, o S\ era apresentado, (f indica a apresentação de , alimento).
Neste experimento, S\ era prolongado por 1 min além dc s j e terminava em b
embora, aqui, nos preocupemos somente com os efeitos da taxa de a a f. A Fig. 18-7
indica que a maioria dos animais mostra um aumento da taxa a (S \) que dura,pelo
menos, até f (S 9 ). 0 aparecimento rápido do efeito parece anular a possibilidade de
que o aumento da taxa seja devido a qualquer relação supersticiosa do bicar com 0
reforçamento livre.
I 8-7. Segmentos de uma hora de “elação” condicionada (Herrstein c Morse,
-419-
Experimentos semelhantes usando uma linha-base reforçada em IV com alimento e
estimulação cerebral positivamente reforçadora (ver seção 16.3) como também
demonstram uma facilitação condicionada (Fig. 18-8) durante um estímulo que
consisten temente precede a estimulação cerebral (Brady, 1961).
Um efeito ainda mais sutil desse tipo geral foi observado por Pliskoff (1963). 0
comportamento pode ser mantido sob vários esquemas IV. alternados diferentes, sendo
que cada IV fica em efeito por um tempo limitado e cada IV é correlacionado com
um estímulo especial. Sc um estímulo de aviso (S j) é apresentado antes da mudança
(S 2 ) de um IV com um intervalo médio maior entre as oportunidades de reforçamento
para um comum intervalo médio menor (digamos IV 2 min para IV 1/2 min), podem
ocorrer certas mudanças no responder durante o estímulo de aviso. Quando a mudança
é de um intervalo médio longo para um pequeno, como acabamos de descrever, o
organismo está, na verdade, mudando de um esquema menos favorável para um mais
favorável. O procedimento de Pliskoff produziu uma supressão moderada na taxa dc
resposta durante o estímulo de aviso, sugerindo que uma operação dc “elação” pode
nem sempre aumentar as atividades operantes.
I igura 18-8. 1 acilitação condicionada numa linha-basc cm IVm reforçada com alimento
resultante do emparelhamento de S| com um choque cerebral positivamente reforçador.
(Brady, 1961)
O estabelecimento das condições gerais que produzem supressão e daquelas que
produzem facilitação esperam por mais trabalho experimental sobre os efeitos emocio
nais gerais dc $3 c do emparelhamento de Sjs com S+s em outras linhas-base
comportamentais. Os poucos estudos descritos indicam como as emoções positivas
podem ser encaradas como mudanças condicionávcis no comportamento operante em
processo.
Esta seção c as duas precedentes completam nossa análise dos efeitos comporta
mentais dc três categorias de operações produtoras de emoção. As operações são
reflexas, os comportamentos operantes. Mesmo assim, ao contrário dos fenômenos
operantes comuns, esses que denominamos “emocionais” referem-se a mudanças em
operantes que não são produzidas diretamente pela alteração de suas conseqüências de
reforçamento. Nenhum dos efeitos da ansiedade, raiva ou elação torna o reforçamento
- 420 -
positivo mais provável ou o reforçamento negativo menos provável. O rato “ ansioso”
na Fig. 18-4 recebe choquc caso haja ou não supressão. O pombo “ com raiva” que
bica seu companheiro vigorosamente não restabelece, através disso, o reforçamento. O
rato “ alegre” dc Brady (Fig. 18-8) não acelera a ocorrência da estimulação cerebral
por responder rapidamente. Assim, embora as mudanças medidas no comportamento
sejam mudanças nas taxas de operantes, elas não são controladas diretamente pelas
contingências de reforçamento dc nenhum dos operantes afetados.
Dizer que um efeito emocional não é útil, aqui e agora no ambiente de laboratório
do animal, ou no ambiente do homem civilizado, para influenciar a probabilidade dc
reforçamento, não significa que ele não possa ter sido alguma vez útil para influenciar
a probabilidade de reforçamento e que não possa ser útil cm outros ambientes. Fm
particular, o comportamento emocional pode ter sido extremamente útil para os
ancestrais do indivíduo cujo comportamento emocional estamos agora testemunhando.
As sugestões de Darwin a respeito da utilidade biológica dc comportamentos emocio
nais no ambiente natural já foram salientadas (p. 406). Tais especulações estão de
acordo com os fatos conhecidos dc que os rcspondent.es emocionais são mediados por
partes do sistema nervoso que, na maioria, são filogcncticamcntc mais velhas que as
partes desse sistema que controlam as capacidades para adquirir comportamentos
operantes complexos. Os comportamentos emocionais parecem estar entre aqueles
comportamentos primitivos cujas potencialidades estão estabelecidas c, como outros
reflexos, eles estão sob o controle de princíoios Pavlovianos cm vez de operantes.
18.6 UM MODFLO PARA RFPRFSFNTAR H INTKRRIi Lm^ juinak FLNOMFNOS

HMOCIONAIS
Descrevemos três padrões dc distúrbios nos comportamentos operantes estritamen

te ligados a remoção ou à apresentação de reforçadores, embora, cm muitos casos,
estejam intimamente relacionados a procedimentos Pavlovianos. Uma vez que os efeitos
comportamentais produzidos parcccm lembrar, dc certo modo, os comportamentos
que em nós mesmos chamamos de ansiedade, raiva c elação, mantivemos esses termos
para denominar esses três paradigmas. Nossa intuição nos diz, todavia, que, mesmo que
esses três paradigmas correspondam realmente aos fenômenos humanos, eles não
chegam a comcçar a esgotar o campo da emoção. Palavras como tristeza, humilhação,
desapontamento, vergonha, culpa, penúria, embaraço, piedade, amor, ternura, conten
tamento e euforia sugerem que há muitas variantes emocionais sutis não consideradas
na nossa classificação geral de medo, raiva c elação.
Uma variedade de considerações diferentes tem sido fornecida por filósofos c
psicólogos para esquematizar e representar vários fenômenos emocionais (Plutchik,
1962). O esquema teórico a ser elaborado aqui 6 tirado de duas idéias históricas: (1)
que certas emoções diferem entre si apenas em intensidade, e ( 2 ) que certas emoções
podem ser consideradas como compostas dc outras, mais fundamentais. A primeira
idéia é clara. Raiva, cólera c aborrecimento, por exemplo, são palavras que parecem
denotar diferentes intensidades de um distúrbio de tipo semelhante. A segunda noção,
misturar emoções “ puras” para formar outras, c mais sutil. Há três séculos, Descartes
argumentava que todas as emoções eram derivadas dc seis paixões básicas: amor, ódio,
desejo, alegria, tristeza e admiração, embora ele não tenha dado nenhuma justificativa
para a escolha dessas seis, em particular, como básicas. Outros autores fornecem outras
-421 -
istas cujo tamanho varia dc três a várias dúzias dc emoções básicas. Nenhum critério
satisfatório para selecionar as emoções primárias ou fundamentais foi ainda encontra
do, nem foram analisados detalhadamente os métodos de composição.
Nossa consideração começa com a afirmação dc que os três padrões citados por
Watson (Tabela 18-1) e descritos como mudanças operantes nas três seções precedentes
constituem os três padrões emocionais fundamentais. Seu status fundamental deriva-se
do fato de que ( 1 ) em sua forma incondicionada, seus procedimentos exaurem as
possibilidades de apresentação c remoção dc reforçadores primários positivos e
negativos, e ( 2 ) em sua forma condicionada, seus procedimentos exaurem as possibili
dades de paradigmas Pavlovianos simples. A Tabela 18-2 resume as operações
Pavlovianas c alguns dos seus efeitos comportamentais conhecidos. Na Tabela 18-2, um
traço diagonal em S c uma abreviação da notação que indica o término do evento
estímulo reforçador. Pode-se observar que a coluna à esquerda da tabela exaure as
combinações possíveis dc um S\ com a apresentação ou termino de S+ ou S .
Existem quatro possibilidades lógicas, mas agrupamos duas delas na premissa dc que os
efeitos comportamentais de se terminar um reforçador negativo ou apresentar um
reforçador positivo sejam bastante semelhantes para permitir um tratamento conceituai
semelhante. Uma segunda suposição que simplifica é feita ao se negligenciar as diferenças
entre reforçadores particulares positivos ou negativos. Assim, a “elação” produzida
pelo emparelhamento de um S\ com um reforçador sexual não é distinguida. no
esquema da Tabela 18-2 da elação produzida pelo emparelhamento de um S\ com um
reforçador alimentar. Essas suposições constituem trabalhos hipotéticos cuja utilidade
somente a experimentação futura poderá determinar.
Tendo estabelecido três emoções “ primárias” , podemos nos voltar para o problema
de representar outras emoções. Na Fig. 18-9, as três emoções primárias aparecem como
vetores de um modelo geométrico.
Tabela 18-2
AS OPERAÇÕES EMOCIONAIS PRIMÁRIAS E ALGUNS DE SEUS EFEITOS

COMPORTAMENTAIS
OPERAÇÃO DE NOME COMUM EFEITOS SOBRE A ATIVIDADE

EMPARELHAMENTO DA OPERANTE
PAVLOVIANO “ EMOÇÃO”
Supressão de operantes positivamente

Ansiedade reforçados, Facilitação de operantes nega
tivamente reforçados.
Elação Facilitação dc alguns operantes. Pouca

informação disponível.
Raiva Aumentos na magnitude de alguns ope

rantes. Valor reforçador de ataque e des
truição àumentado.
- 422-
S-
I igura 18-9. o sistema de coordenada emocional. Um modelo para repre

sentar diferenças dc intensidade nas operações emocionais fundamentais.
Este quadro de referência nos permite representar a noção de que algumas emoçõe:>,
aparentemente, diferentes, podem ser consideradas como correspondentes a diferenças nv
intensidade do reforçador positivo ou negativo em que estão baseadas. As emoções
retratadas nos extremos de cada vetor são baseadas nos valores mais fortes dos
reforçadores incondicionados relevantes e os termos usados para descrever os
comportamentos são escolhidos apropriadamente. À medida que nos movemos em
direção à origem, a intensidade diminui. Seguimos Plutchik (1962), ao supor que, à
medida que a intensidade diminui, os efeitos comportamentais tendem a desaparecer e
ser menos claramente distinguíveis. Isto é indicado pela escolha de um sistema que
converge em direção a um ponto (a origem) onde as três emoções se encontram. Deve
ficar claro que um grande número de termos da linguagem comum de emoção poderia ser
colocado em algum ponto nessa estrutura, da qual são vistos apenas três níveis (alto,
médio e baixo).
Muitos fenômenos comportamentais aos quais aplicamos o termo emoção não
encontram um lugar na Fig. 18-9, qualquer que seja o nível de intensidade que
escolhermos. Esses, sugerimos, podem ser considerados como casos de emoções primárias
misturadas. Como as emoções primárias se misturam? De duas formas principais: (1) um
d eterm in a d o S \ é emparelhado sucessivamente com duas ou três primárias,
esquematicamente (por exemplo)
S„S+; S 1,S“ ; S „ S “ ; S 1,S+; . . .
(2) Um determinado S\ c emparelhado com um S2 que compreende dois ou mais

reforçadores primários d i f e r e n t e esqucmaticamente (por exemplo)
S lJS ± \ S l9S ± \ S l9S ± \ S u S ± \ . . .
- 423 -
Como uin exemplo 0a primeira mistura, consideremos o efeito que ocorre quando
uma criança rouba um doce. O doce na mão é um S| para o S+ doce na boca; mas c
lambém um S] para punição (S ), que lem uma alta probabilidade de ocorrer. Kssa
combinação particular (um S\ emparelhado primeiro com um S"1 e depois com um S")
ocorre muito frequentemente na natureza para que seus efeitos tenham um único nome,
culpa. A análise de Plutchik sugere que, de uma maneira análoga, o orgulho deve ser uma
mistura de raiva e alegria. Logicamente, casos mais complicados podem ocorrer com
outras misturas das três emoções primárias. Hm alguns casos, os efeitos não se fundem e
falamos de emoções mistas Variando independentemente as probabilidades dc ocor
rência de cada um dos S2 S, podem ser adquiridas outras sutilezas nos padrões de compor
tamento emocional. Assim como o quúnico atualmente prepara compostos que não
existem na natureza, emoções experimentais que não surgem comumente no mundo
natural podem ser geradas por várias operações compostas de condicionamento.
O caso cm que S2 6 composto de elementos tantos positivos, como negativos (S^)
ilustra um tipo de situação psicológica de conflito. Se uma dada situação incluc
elementos tanto positivos quanto negativos, os comportamentos dc aproximação c
esquiva podem existir, ambos, com uma alta força e diz-se que há um confltio entre
Juas cadeias incompatíveis de comportamento: aproximar-se versus afastar-se. Uma
criança que ordinariamente evita ou foge de espinafre pode ser colocada numa situação
de conflito se se lhe diz que a sobremesa depende de ela comer o espinafre. O tonar o
espinafre-no-estômago um S ^ para respostas que produzem sobremesas dá ao espinafre
um certo valor de reforçador positivo que pode ou não superar a aversão original. Um
exemplo de um confltio ainda mais forte aparece num experimento dc um psiquatra,
Julcs Masscrman (1946). Gatos famintos foram colocados numa caixa contendo
alimento no seu extremo. Os gatos logo passaram a se aproximar c comer o alimento
sempre que colocados na caixa, lím tentativas posteriores, colocou-se um tubo para
conduzir ar comprimido perto do alimento, de tal modo que-, assim que o gato
estivesse quase pegando o alimento para comer, uma violenta corrente dc ar era
dirigida para a sua cabeça. Masserman descreve o efeito comportamental deste
emparelhamento do comportamento de aproximação reforçado positivamente com um
estímulo aversivo, como “ pânico” . No dia seguinte, c subsequente, esses gatos
recusaram-se a se aproximar do alimento. A corrente dc ar foi, então, removida
permanentemente (extinção Pavloviana), mas muitos gatos nunca mais se aproximaram
do alimento, preferindo a fome. Masserman caracterizou estes gatos como “neuró
ticos” e sugeriu que um procedimento dc conflito deste tipo deve ser o fator
subjacente dc muitas neuroses humanas. Uma interessante observação colateral foi
feita. Antes do início do experimento, as preferências alcoólicas dos gatos foram
testadas, ofcrcccndo-sc-lhcs leite puro numa tigela c leite misturado com álcool cm
outra. Antes dc experimentar o procedimento de conflito, os gatos invariavelmente
preferiam leite puro, mas depois de experimentar o procedimento de conflito os gatos
de Messerman apresentaram uma preferencia marcante pelo leite “ alcoolizado” .
Misturas ou compostos emocionais podem ser produzidos por procedimentos
Pavlovianos ainda mais complicados. Certos padrões emocionais, aparentemente, depen
dem de operações dc condicionamento bem complexas, muitas das quais não são
possíveis sem outras histórias anteriores de condicionamento, ainda mais complicadas.
Considere o caso da remoção não apenas dc um único S+, mas de um reforçador
generalizado (seção 11.4). Removendo tal reforçador, removemos efetivamente uma
- 424 -
variedade de reforçadores positivos. Mas sem a his Uri a que primeiro torna um S um
reforçador generalizado, os efeitos emocionais particulares dc sua remoção não são
possíveis. O caso cm pauta, acreditamos, tem uma relação estreita com o fenômeno
que chamamos de “ tristeza” . A morte dc um amigo, a perda de um bom emprego c
eventos semelhantes provocam a tristeza porque, dc uma só vez, uma variedade de
reforçadores c perdida, parccc razoável que esse padrão raramente seja visto cm
animais, porque os reforçadores generalizados são mais comumentc criados nas
sociedades humanas. Mas todos conhcccm o cão que, com a morte do seu dono,
apresenta comportamentos bastante parecidos com nosso próprio comportamento dc
tristeza. Na medida em que as operações sejam plausíveis, pode ser possível gerar esses
ou comportamentos similares em outras espccics. As emoções que usualmente supomos
serem características do homem podem ser peculiares para nós, não porque os animais
sejam incapazes de possuí-las, mas porque suas condições geradoras raramente, ou nunca,
surgem fora das sociedades humanas.
18.7 MEDICINA PSICOSSOMÁTICA
Definimos emoção como a associação entre certas mudanças amplas nos comporta
mentos operantes cm processo e a apresentação ou remoção dc reforçadores. Como
uma relação abstrata entre eventos, a “emoção” , tal como o impulso, não pode causar
nada — sentimentos, comportamentos ou mudanças fisiológicas. No entanto, as
operações que dão origem a certos comportamentos emocionais, podem, se efetuadas
frequentemente, provocar mudanças corporais patológicas agudas. Assim, uma emoção
forte e prolongada pode ser correlacionada com hipertensão, bronquite asmática,
úlcera gastrointestinal, dores de cabeça c outras doenças. Tem sido reconhecido, há
algum tempo, que certas doenças tem suas origens cm situações dc tensão; isto c,
situações cm que figuram estímulos aversivos fortes e/ou prolongados que fazem surgir
comportamento emocional forte e prolongado. Os executivos são propensos a úlceras e
certas doenças cardio-vasculare?. 0 surgimento da asma, c', algumas vezes, associado a um
evento amedrontador na infância c pode ser subsequentemente instigado por cicunstân-
cias moderadamente amedrontadoras. Em geral, a ansiedade crônica c quase sempre
correlacionada com um número dc sintomas somáticos patológicos, desde a acne até o
distúrbio gastrointestinal grave.
A medicina psicossomática se especializa no diagnóstico c tratamento de doenças
que parecem resultar dos mesmos procedimentos que produzem certos comportamen
tos emocionais condicionados. A realidade das doenças psicossomáticas pode ser
demonstrada de forma dramática em animais no laboratório, onde podem ser
produzidas situações emocionais aversivas cujos efeitos são letais para o sujeito. Nos
experimentos dc Brady, Porter, Conrad e Mason (1958), macacos foram treinados a
evitar choques elétricos, através da pressão dc uma barra, emprcgando-sc um
procedimento semelhante ao da esquiva dc Sidman visto no Diagrama 17.2. Os
choques eram programados a cada 20 seg. e os macacos eram expostos ao procedimen
to por 6 horas consecutivas, após o que havia 6 h. dc descanso c, então, 6 h. de
esquiva c assim por dainte, indefinidamente, dia após dia. Uma luz vermelha era
correlacionada com as 6 h. do período dc esquiva.
O comportamento de esquiva típico gerado por esse procedimento é visto na Fig.
18-10. Note que poucos choques foram realmente administrados no período dc 6 h
-425-
Uma hora
1 igura 18-10. Uma porção da curva acumulada dc pressão à barra, mostrando o

comportamento dc esquiva na 18a. sessão experimental consecutiva do procedimento
de esquiva repetitiva com 6 h. dc* esquiva e 6 h. de descanso, üs choques são
indicados por pequenos tiacos verticais nos rceislros (Bradv, Porter, Conrad, e
Mason, 1958). ' *
de esquiva. Depois de poucas semanas, a morte inesperada de muitos dos sujeitos deu
ao experimento uma parada abrupta. A autópsia revelou que os .animais haviam
sucumbido por úlceras duodenais perfuradas. Quando esses resultados foram obtidos,
eles sugeriam que o procedimento de esquiva poderia ter sido o agente causai na
produção da úlcera e morte dos macacos. Mas outra possibilidade era de que a úlcera
fosse um resultado dos efeitos dos choques elétricos recebidos, dia após dia, e que a
contingência de esquiva fosse supérflua.
‘‘Para testar essa possibilidade, preparamos um experimento controlado ,

usando dois macacos em “ cadeiras conjugadas'’; nas quais ambos os macacos
recebiam choques mas somente um podia evitá-los. () macaco “executivo’' ou
experimental poderia evitar os choques para si mesmo c para o outro através da
pressão à barra. A barra do macaco dc controle era ineficaz. Assim, ambos os
animais estavam sujeitos a mesma tensão ÍTsicci (i.c; ambos recebiam o mesmo
número de choques ao mesmo tempo), mas apenas o macaco “ executivo" estava
sob a tensão psicológica de ter que pressionar a barra” (Brady, 1958).
— 426 —
Uma figura do aparelho err. que os dois animais ficavam por várias semanas durante o
teste de esquiva é mostrada na ilustração da Parte Cinco ( p.335), o animal executivo
emitia uma taxa alta dc resposta de esquiva durante os períodos de 6 h. dc esquiva c
respondia pouco durante o período de 6h. de descanso. O macaco de controle, por outro
lado, raramente pressionava a barra durante o período de esquiva ou de “ descanso” , já
que sua b arra estava associada com a contingência nula. No experimen
to de controle conjugado, todavia, somente o animal executivo sucumbiu de úlceras.
Os macacos dc controle, sacrificados no dia da morte dc seus pares “executivos”, não
apresentaram qualquer produção dc úlcera, sugerindo assim que o fator letal eram
realmente as contingências dc esquiva prolongada, e não o choquc em si. Estudos
subsequentes indicaram que um fator crítico para a produção dc úlceras por esse
método é a escolha de um ciclo dc 6 h de esquiva — descanso. Outros ciclos não
produziram ulceração (Brady, 1958).
Do ponto de vista da presente análise do comportamento emocional, notamos que
o animal executivo é o único dos dois que recebe um emparelhamento Pavloviano
consistente. Apenas para ele, a não ocorrência de uma pressão à barra cm 20 seg
(R20”) é suficiente para proporcionar uma situação (S j) que c consistentcmcnte
emparelhada com choques. Seu parceiro de controle, todavia, recebe choques ocasio
nais, mas esses nunca são consistcntcmentc emparelhados corn qualquer situação
determinada (S j) no seu ambiento. Portanto, o paradigma de ansiedade condicionada é
preenchido apenas pelo macaco executivo.
18. 8 O SISTEMA NERVOSO AUTÔNOMO
Sir Charles Sherrington comentou que, das áreas onde a psicologia c a fisiologia se
encontram, uma c a emoção. Ccrlamenle, nenhuma análise da emoção seria completa
sem alguma descrição das grandes mudanças fisiológicas que ocorrem sob paradigmas
Pavlovianos de emoção. Alguns psicólogos endossam o ponto de vista de que o
território psicológico dos fenômenos emocionais e exaurido pela análise dos padrões
reflexos c perturbações dc operantes que são produzidos pelos procedimentos que
descrevemos nas seções anteriores. Tal ponto de visla pode ser tecnicamente correto,
dependendo da definição pessoal de psicologia, mas impõe limites disciplinares
arbitrários que não correspondem aos fenômenos naturais em si mesmos. Notamos em
algum ponto, neste texto, que os limites entre as disciplinas científicas são quase
sempre traçados de forma muito arbitrária e é óbvio que um cientista interessado nos
fenômenos emocionais pode utilizar-se da análise comportamental, da fisiologia do
reflexo, da endocrinologia, da neurofisiologia, assim como de outras disciplinas
relacionadas. Numa abordagem introdutória à psicologia, nossa obrigação c descrever
os principais efeitos comportamentais das várias mudanças ambientais. Mas não nos
aprofundamos muito no assunto, notando apenas brevemente alguns dados ncuiotisio-
lógicos que ajudam a pintar um quadro mais completo do fenômeno em discussão.
A noção de que cada emoção está associada a um padrão único dc respondentes
autônomos aparece na passagem de William James citada anteriormente (p.407).
Todavia, esses vários padrões podem frequentemente ser muito semelhantes e uma
medida bem detalhada de muitos respondentes pode ser necessária para discernir suas
diferenças (Ax, 1953). Em nossa discussão introdutória sobre os reflexos e o
condicionamento Pavloviano simples, salientamos que os procedimentos Pavlovianos
- 427 -
Olho
Glândula lacrimal
Membrana mucosa do nariz e palato
Glândula sub-maxilar
Glândula sublingual
Membrana mucosa da boca
Glândula parótida
tsôtago
Lstômago
Vasos sanguíneos
abdominais
Fígado
Pancreas
Intestino Delgado
' Intestino grosso
/ Reto
Glândula suprarenal
Rim
Bexiga
Órgãos sexuais
Medula
Genitália externa
I igura 18-11. O lado direito do sistema nervoso autonomo humano ( Kimblc e (iarmezy, 1963)
-42 8-
parecem mais apucavcis aqueles respondentes internos que são mediados por uma parte
do sistema nervoso chamada sistema nervoso autônomo (“auto-regulador”) (SNA),
representado diagramaticamcntc na Fig. 18-11. O SNA conduz impulsos elétricos do
cérebro e medula para os órgãos viscerais, nunca ao contrário. O SNA se divide
funcionalmente em duas partes. Uma é chamda o sistema simpático e é vista em linhas
pontilhadas na Fig. 18-11. A outra, o parassimpático (para significa paralelo a),
encontra-se anatomicamente acima c abaixo do simpático c é visto cm linhas cheias na
Fig. 18-11.
Os fatos que se seguem são dc importância. Primeiro, os órgãos servidos pelo SNA
são precisamente aqueles que, como já indicamos, produzem respondentes,condiciona
dos c incondicionados. O respondeu te respirat ório, o respondents salivar e a taxa
cardíaca são velhos amigos do condicionamento Pavloviano. Nos últimos cinqüenta
anos, os pesquisadores russos mostraram meticulosamente que o funcionamento de
quase todos os órgãos neste diagrama é suscetível aos procedimentos de condiciona
mento clássico. O SNA é tão iiHimamcnte ligado ao condicionamento Pavloviano que
se poderia encará-lo como o aparelho anatômico para o condicionamento deste tipo.
Um segundo ponto de interesse é a diferença dc tunção servida pelas duas partes

do SNA. Note que as fibras em linhas cheias (parassimpáticas) vem tipicamente dc
origens únicas e vão diretamente para seus órgãos sem interconcxão ou interação. Hsse
fato anatômico é refletido no fato fisiológico dc que partes diferentes do sistema
parassimpático operam individualmente. As fibras simpáticas (pontilhadas), todavia,
vão primeiro para uma cadeia de junção comum (a estrutura vertical longa, vista
parlalcla ao lado direito da medula na Fig. 18-11), onde interagem antes de chegar até
seus órgãos. F,stc fato anatômico é refletido por uma unidade do sistema simpático, tal
que suas fibras afetam todos os órgãos dc uma vez.
Finalmente, podemos observar que cada órgão individual na Fig. 18-1 1 tem fibras
tanto pontilhadas quanto cheias que chegam até ele e é assim sujeito a influências dc
ambas as partes: simpática e parassimpática. Mas os efeitos dessas duas partes em cada
órgão não são os mesmos. De fato, eles são tipicamente opostos. Isto se dá cm parte
porque as duas partes liberam produtos químicos diferentes nos seus pontos terminais
no órgão. O sistema simpático libera uma substância muito parecida com a adrenalina,
enquanto os nervos parassimpáticos liberam uma substância diferente,chamada acctilco-
lina. A Tabela 18-3 resume alguns efeitos principais das duas divisões do sistema
autônomo.
Fm certa época, pensou-se que a ansiedade e medo eram eicitos principalmente

simpáticos, enquanto a raiva era um efeito principalmente parassimpático. Acredita-se,
agora, que o quadro é muito mais complexo e que o resultado de Iodas as operações
emocionais c a produção de efeitos simpáticos e parassimpáticos. Quaisquer diferenças
fisiológicas existentes entre as emoções devem ser devidas a padrões diicrentes de
respondentes; isto e, a diferenças sutis na ação simpática e parassimpática. Fsses
padrões de respondentes autônomos associados com o comportamento emocional
constituem aquilo que é algumas vozes chamado de substrato autônomo das emoções.
-429-
Tabela 18-3
AÇÃO RESPONDENTE AUTÔNOMA (Segundo P. T. Young, 1961)
NERVOS ESTRUTURAS NERVOS

SIMPÁTICOS SOMÁTICAS PARASSIMPÁTICOS
Dilata a pupila I ris Contrai a pupila

Inibe a secreção (ilandulas salivares Facilita a secreção
Reflexo pilomotor Cabelo
Aumenta a secreção Glândulas sudoríp iras
Contrai Artérias superficiais
Acelera Coração Inibe
Dilata bronquíolos Pulmão Contrai bronquíolos
Secreta glicose Fígado
Inibe a secreção gástrica Estômago Facilita a secreção
e peristal tis mo gástrica e peristatismo
Contrai expelindo Baço
eritrócitos
Secreta adrenalina Medula da suprarenal
Inibe a atividade Intestino delgado Facilita a atividade
de músculos lisos dc músculos lisos
Contrai Artérias viscerais
Relaxa músculos lisos Bexiga Contrai músculos lisos
para expelir
Relaxa músculos lisos Colo c Reto Contrai músculos lisos
para expelir
Contrai, neutralizando Artérias dos órgãos Dilata, causando ereção
a ereção sexuais externos
Contrai no orgasmo Vasos deferentes
Contrai no orgasmo Vesículas seminais
Contrai no orgasmo Útero
Deve ser mencionado que um número de demonstrações mostra que a indução

artificial do substrato respondente da emoção não produz tipicamente as outras
propriedades comportamentais da emoção. Por exemplo, a injeção da droga adrenalina
(que atua imitando a ativação simpática) em animais não dá origem às interrupções
operantes características da ansiedade, cólera c alegria. Sujeitos humanos que recebem
injeção dc adrenalina relatam uma emoção simulada: eles se sentem “ como se”
estivessem com raiva, “como se” estivessem alegres, “ como se” estivessem com medo,
e assim sucessivamente. Uma demonstração realizada por Schactcr c Singer (1962)
indica que esta indução artificial do substrato respondente do comportamento
emocional influencia a sensibilidade do indivíduo a situações emocionais. Assim,
estudantes universitários injetados com adrenalina apresentaram comportamentos mais
fortes de raiva numa situação geradora de raiva,. mas também mostraram comporta
mentos mais eufóricos numa situação de alegria do que estudantes não injetados.
Parece que a indução dc respondentes da emoção pode sensibilizar o organismo para as
operações de emoção.
-430-
18 9 CONTROLE EMOCIONAL, MATURIDADE EMOCIONAL E COMPORTAMEN
TO EMOCIONAI PATOLÓGICO ____
Sc as cmoçocs envolvem comportamentos cliciados, então que lipo do autocon
trole pode ser exercido sobre eles? Como nossos operantes estão sob o controle dr
suas conseqüências c porque somos capa/es dc observar esse fato, somos inclinados a
tradu/ir isto como um controle que “ nós'’ temos sobre eles Mas os respondentes não
estão sob o controle dc suas conseqüências. Já notamos como os efeitos dc supressão c
facilitação dos procedimentos emocionais frequentemente não se relacionam às conse
qüências reforçadoras de tal forma que parecem não-adaptativos e inúteis. Mas os
reflexos emocionais dc uma pessoa são frequentemente aversivos para outros indi
víduos e para ela mesma e a sociedade civilizada exige algum controle sobre o
comportamento emocional. A mudança usual nos padrões emocionais, da infância ate
a fase adulta, c caracterizada por um aumento maior no controle do comportamento
emocional, frequentemente, chamado dc maturidade emocional. Como ela c consegui
da? Aparentemente, existem pelo menos três maneiras principais de se chegar a tal
controlo.
Quando uma situação que produz comportamento emocional c repetidamente
apresentada, a magnitude da resposta diminui com tempo. Este c o fenômeno
conhecido‘como adaptação ou habituação, citado cm nossas discussões iniciais sobre o
condicionamento operante. A introdução de um organismo numa situação nova
frequentemente produz comportamento de medo: retrair-sc, imobilizar-sc, dcfecar,
urinar, etc. Mas a introdução repetida do organismo nessa mesma situação resulta
numa diminuição gradual dos efeitos. Diz-se que o indivíduo sc adaptou, ou se
habituou à situação.
Na sociedade, um método importante de modificar o comportamento emocional é
o de adaptá-lo. Um organismo sujeito ao procedimento dc extinção depois de um
esquema de reforçamento intermitente não mostra a taxa dc resposta aumentada ou
outras mudanças que chamamos de raiva. Depois que tal organismo tiver tido uma
história de extinção após reforçamento intermitente, seu comportamento de raiva está
ausente porque ele sc adaptou há muito tempo e, agora, dizemos que ele tem uma
“alta tolerância à frustração” . Vemos efeitos análogos na conduta humana. As crianças
choram c gritam quando seus brinquedos são removidos. Os adultos (usualmente)
mostram reações mais moderadas. O adulto típico já teve uma longa história de perder
coisas: teve alguns anos dc adaptação f*.s asperezas da extinção c reage correspondente
mente menos. Frequentemente, falamos na superação de nossos medos, indicando que
a sua habituação ocorrc no tempo ccrto. A adaptação não ó limitada a eventos
aversivos, entretanto. Mesmo coisas boas da vida podem perder sua atração se nos
tornamos “acostumados” a elas.
Uma segunda forma de controle ocorre quando disfarçamos nossos respondentes
encobrindo-os com operantes opostos. Assim, diz-se a uma criança não deve chorar e
lamuriar, embora ela possa “sentir” . Na sociedade ocidental, o homem deve reter as
lágrimas, mas a mulher pode chorar. Comportamentos manifestos de medo são
frequentemente repreendidos c somos induzidos a apresentar operantes que ocultem
nossos medos. Sempre que somos advertidos para aguentar firmes, somos encorajados a
contra-atacar, com um operante oposto, o respondente reflexo de csmorecimcnto que
ocorre na “ fossa” . A facc “ inexpressiva” c uma habilidade necessária para o bom
jogador de pôquer, mas não é provável que ocorra uma habituação suficiente para
abolir completamente o substrato respondente inobservado gerado por uma seqüência
- 431 -
real de cinco cartas. Bssa sobrevivência de respondentes autônomos na ausência dc
outros comportamentos (tal como a expressão facial) características da emoção é a
base do detetor de mentiras que, na relidadc, c um detetor dc respondentes
autônomos. Esse dispositivo consiste de um aparelho para medir a taxa cardíaca, a
respiração, resistência da pele, tensão muscular c outros respondentes. Quando são
feitas perguntas para um suspeito, suas respostas podem consistir dc operantes que
mascaram qualquer reação emocional externa. Mas a mensuração de seus respondentes
autônomos pode desmascará-lo se ele estiver “ mentindo” , já que um homem que
cometeu recentemente um crime, provavelmente, apresentará efeitos seletivos dc
ansiedade para as palavras que descrevam as ccnas c os eventos do crime.
Uma terceira forma de controle sobre a emoção consiste da esquiva, de um lado,
ou produção, dc outro, de situações que evocam o comportamento emocional. Quando
evitamos um inimigo que provavelmente nos fará raiva, ou paramos de jogar golfe
porque jogamos mal continuamente, ou quando vamos a um restaurante onde
frequentemente temos uma boa refeição, evitamos ou produzimos certos reforçadores.
Mas, como um subproduto, podemos tambem escapar dc, ou produzir alguns dos
nossos próprios comportamentos emocionais. Nesse sentido, pode-se dizer que exerce
mos controle sobre nossas emoções.
H evidente, com esta consideração breve desses três métodos de controle emocio
nal, que o nosso controle sobre os nossos respondentes emocionais carccc do grau de
controle que temos sobre nossos braços, pernas ou cordas vocais. Talvez seja útil
apreciar essa diferença na nossa educação das crianças c no nosso tratamento com
outras pessoas.
A sociedade está repleta de situações geradoras de raiva e ansiedade. Desde a infân
cia , encontramos proibições e conflitos, ameaças e frustrações. Algumas são caprichosas;
outras parecem necessárias para a ocorrência ordenada das atividades humanas. A
maioria dos indivíduos consegue sair dessa história com um repertório de habilidades
para evitar eventos aversivos c produzir reforçadores positivos, o que c suficiente para
manter a raiva e a ansiedade em níveis toleráveis. Mas alguns indivíduos, talvez
porque suas histórias contenham uma quantidade incomum dc controle aversivo, ou
talvez porque, geneticamente, são mais sensíveis a operações geradoras dc raiva ou
ansiedade, não adquirem as habilidades suficientes para um ajustamento satisfatório às
contingências da sociedade. Já discutimos os casos que caem no terreno da medicina
psicossomática. Muitos outros indivíduos humanos demonstram efeitos drásticos dc
operações de raiva c ansiedade prolongadas que não podem ser chamadas de doença no
mesmo sentido que úlceras, hipertensão c asma. Uma ausência prolongada de situações
geradoras dc elação pode tambem tet efeitos adversos, especialmente se o empobreci
mento ocorre cedo na vida. As crianças que são criadas, desde o nascimento, cm
instituições quase sempre recebem comida c cuidado suficientes para sua saúde geral,
mas podem não receber a estimulação afetiva e o carinho que as outras crianças obtêm
dos pais. Se falta esta estimulação afetiva durante os seis primeiros meses dc vida. esses
bebês frequentemente se tornam crianças c adultos extremamente apáticos (Spitz,
1957). As crianças tornam-se abatidas, desinteressadas, mostram estupor, falta de
apetite c desenvolvimento físico rctardado.Tais crianças parecem não ter a intensidade
usual de comportamento de alegria, bem como dc medo e raiva. L:m resumo, todos os
seus comportamentos emocionais parecem estar altamente atenuados. Algumas delas
-432-
nunca desenvolvem níveis normais dc reforçadores positivos e, assim, tem que ser
mantidas cm instituições por toda a vida.
Existem vários outros estados comportamentais patológicos aos quais os homens
são propensos c cujas causas são mais sutis e pobremente compreendidas. As pessoas
que apresentam efeitos comportamentais dc ansiedade por longos períodos dc tempo
nas situações complexas que surgem na sua vida cotidiana, são quase sempre chamadas
“neuróticas” . O comportamento emocional prolongado do tipo denominado ansiedade
constitui uma interferência marcante nos outros operantes e pode-se dizer que um
neurótico é “ desajustado” simplesmente porque, cm vez de se empenhar cm operantes
que podem produzir reforçadores positivos, ele apresenta as supressões características
da ansiedade. Se as supressões persistem por longos períodos, a eficiência do indivíduo
nas atividades normais pode ser bastante reduzida. Outros indivíduos desenvolvem
padrões de comportamento que são tão patológicos ou perigosos para a sociedade cm
geral que essas pessoas tem que ser institucionalizadas, para sua própria segurança ou a
da sociedade. Numa ampla classe de patologia do comportamento conhecido como
psicose, os reforçadores positivos normais podem perder o seu valor ou inexistir de todo.
Alguns psicóticos têm que ser mimados, outros não têm qualquer “interesse” em alguma
coisa, outro relatam o aparecimento de situações que não estão de fato presentes
(alucinações), outros mostram uma generalização de ansiedade para quase todas as
situações, outros ainda apresentam em alta força comportamentos como assassinatos e
violação, que estão ausentes no repertório civilizado típico. A reabilitação e cura de
indivíduos que apresentam patologias de comportamento dessa magnitude são problemas
sociais graves, embora as causas precisas da maioria de tais comportamentos permaneçam
obscuras.
Durante a idade média, os comportamentos bizarros eram atribuidos a influencias do
diabo e as pessoas que apresentavam tais comportamnetos eram queimadas como
bruxas, encarceradas c sujeitas a outras brutalidades destinadas a exorcizar o diabo. A
crueldade do homem para com seu semelhante é agora mais lúcida do que na história
inicial do tratamento de indivíduos perturbados. Durante o século dezenove, surgiu
uma atitude mais esclarecida. Os indivíduos que apresentavam patologias de comporta
mento passaram a ser encarados como “ doentes” em vez de possessos. Em vez de
presos, eles eram enviados a hospitais.
Os hospitais são um avanço significante em relação as prisões. Mas uma implicação
significante pode ser retirada da psicologia moderna: as causas e curas dos comporta
mentos patologicos diferem muito das doenças organicas. Só muito recentemente, as
patologias do comportamento passaram a ser encaradas como produtos de histórias
incomuns de condicionamento. Como tal, suas curas exigem um tratamento comporta
mental e não médico. Foi o psiquiatra de Viena Sigmund Freud que reconheceu que as
causas de certos comportamentos patológicos encontram-se na história passada remota
do indivíduo. Alem disso Freud salientou que frequentemente, o indivíduo é incapaz
de descrever os eventos críticos do passado que levam à patologia. Um aspecto
importante do método psicoanalítico de Freud, assim, envolvia o fornecimento de
SDs verbais para aumentar a probabilidade de o paciente relatar incidentes de seu
passado que poderiam ter uma relação com o distúrbio atual. Para Freud, parecia óbvio
que o tratamento consistisse parcialmente em fazer o próprio paciente saber qual era a
sua história relevante. Tal ponto de vista tem relação com o que conhecemos sobre
a extinção e adaptação de efeitos emocionais.
- 433 -
Não podemos pretender que tenhamos chegado a uma compreensão clara (le
exatamente quais tipos de histórias levam a patologias diferentes e quais tipos de ação
devem ser efetuadas para reeducar os indivíduos em padrões de vida mais reforçadores.
Contudo, os princípios comportamentais básicos do tipo descrito neste livro serão
seguramente úteis para ajudar a formar uma base experimental sólida para a psicologia
clínica e a psiquatria. Isto porque, tal como a prática da medicina orgânica deriva-se das
descobertas de processos químicos, bioquímicos e fisiológicos, fundamentais, assim
também a prática da psicoterapia deriva-se das descobertas de processos comportamentais
fundamentais.
18.10 UM INDICK DE MUDANÇA EMOCIONAL

Apresentamos, aqui, um método simples para medir a supressão ou facilitação da
taxa de resposta operante devido ao emparelhamento de um S\ com um S+ ou S . 0
método consiste em se observar a taxa de resposta no período imediatamente antes de S\
ser a p re se n ta d o e, e n tã o , co m p arar essa taxa com a taxa de resposta
durante S \. Por exemplo, seS j dura 5 min, poderíamos medir convenientemente a
taxa durante os 5 min imediatamente precedentes a Sj e comparar esta com a taxa
durante o próprio Sj. Na Fig. 18-12, isto seria feito, comparando-se a taxa de a a b.
com a taxa de b a c. Um índice adequado de interrupção comportamental durante Sj
é
j _____ c — b______
e (c — b) + {b — a)
onde Ie é definido como o índice de mudança emocional. Deve ficar claro que c-b é o
número de repostas durante S\ e b-a o número de respostas num período de controle
imediatamente antes de S\ e de duração igual a S j. Quando o responder durante S\
e o período de controle é igual (nenhum efeito de S i), então Ie - 0,5. Quando
c-b < b-a, ocorreu supressão e o Ie encontra-se entre 0 e 0,5, dependendo de quão
completa foi a supressão. No caso onde ocorre facilitação em S j, c-b > b-a, então
1,0 < Ie >0,5. Evidentemente, Ie varia de 0 (supressão completa) a 1,0 (facilitação
completa: inexistência de resposta no período de controle, todas as respostas em S]).
Tempo (minutos)
Figura 18-12. O cálculo dc um índice de supressão.
-434-
EXERCÍCIO 10.
Porque é dificil uma emoção como um padrão de comporta
mento particular?
EXERCÍCIO 11
Discuta as similaridades e ediferenças entre motivação e emoção.
EXERCÍCIO 12
Faça a notação do procedimento atribuído a Pliskoff na seção 18.5
Ax, A. F. The physiological differentiation between fear and anger in
humans. Psychosom. Med., 1953, 15, 433-442.
Azrin, N. H., Hutchinson, R. R., and Hake, D. F. Extinction-induced
aggression. J. exp. Anal. Behav., 1966, 9, 191-204.
Brady, J. V. Ulcers in executive monkeys. Sci. Am er., 1958, 199, 95
100.
Brady, J. V. Motivation-emotional factors and intracranial self-stimula
tion. Chap. 30 in D. E. Sheer (E d .), Electrical stimulation of the
brain. Austin: Univer. of Texas Press, 1961.
Brady, J. V. Psychophysiology of emotional behavior. Chap. 10 in A. J.
Bachrach (E d .), Experimental foundations of clinical psychology.
New York: Basic Books, 1962.
Brady, J. V., and Hunt, H. F. An experimental approach to the analysis
of emotional behavior. J. Psychol., 1955, 40, 313-324.
Brady, J. V., Porter, R. W., Conrad, D. G., and Mason, J. W. Avoidance
behavior and the development of gastroduodenal ulcers. J. exp.
Anal. Behav., 1958, 1 ,6 9 -7 2 .
Cannon, W. B. The James-Lange theory of emotions: a critical examina
tion and an alternative theory. Am er. J. Psychol., 1927, 39, 106
124.
Darwin, C. The expression of the emotions in man and animals. London:
Murray, 1872.
Estes, W. K., and Skinner, B. F. Some quantitative properties of anxiety.
J. exp. Psychol., 1941, 29, 390-400.
Gates, G. S. An observational study of anger. J. exp. Psychol., 1926, 9,
325-336.
Herrnstein, R. J., and Morse, W. H. Some effects of response-inde
pendent positive reinforcement on maintained operant behavior. J.
comp, physiol. Psychol., 1957, 50, 461-467.
Hoffman, H. S., and Fleshier, M. Stimulus factors in aversive controls:
the generalization of conditioned suppression. J. exp. Anal. Behav.,
1 9 6 1 ,4 ,3 7 1 -3 7 8 .
-435-
Hoffman, H. S., Fleshier, M., and Jensen, P. K. Stimulus aspects of
aversive controls: the retention of conditioned suppression. J. exp.
Anal. Behav., 1963, 6, 575-583.
Hunt, H. F., and Brady, J. V. Some effects of electro-convulsive shock
on a conditioned emotional response ( “anxiety” ). J. comp,
physiol. Psychol., 1951, 44, 88-98.
James, W. Principles of psychology. Vol. II. New Y ork: Holt, 1890.
Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd
ed.) New York: Ronald, 1963.
Landis, C., and Hunt, W. A. The startle pattern. New Y ork: F arrar and
Rinehart, 1939.
Leitenberg, H. Conditioned acceleration and conditioned suppression in
pigeons. J. exp. Anal. Behav., 1966, 9, 205-212.
Masserman, J. Principles of dynamic psychiatry. Philadelphia: Saunders,
1946.
Pliskoff, S. S. Rate change effects with equal potential reinforcements
during the “warning” stimulus. J. exp. Anal. Behav., 1963, 6,
557-562.
Plutchik, R. The emotions: facts, theories, and a new model. New Y ork:
Random House, 1962.
Schacter, S., and Singer, J. E. Cognitive, social, and physiological
determinants of emotional state. Psychol. Rev., 1962, 69, 379-399.
Schoenfeld, W. N. An experimental approach to anxiety, escape, and
avoidance behavior. Chap. 5 in P. Hoch and J. Zubin (E d s.),
A nxiety. New York: Grune and Stratton, 1950.
Sidman, M. Normal sources of pathological behavior. Science, 1960,
1 3 2 ,6 1 -6 8 .
Spitz, R. A. No and yes. New York: International Univer. Press, 1957.
Tolm an, E. C. A behavioristic account of the emotions. Psychol. Rev.,
1 9 2 3 ,3 0 ,2 1 7 -2 2 7 .
Watson, J. B. Behaviorism, (rev. ed.) Chicago: Univer. of Chicago
Press, 1930.
Young, P. T. M otivation and emotion. New York: Wiley, 1961.
-436 -
TABELA DE PARADIGMAS COMPORTA MENTA IS
TABELA DE PARADIGMAS COMPORTAMENTAIS
Nome Dado Procedimento Processo Resultado
o do Um eliciador, S2 Apresentar S2 repetidamente R2, a resposta eliciada, dimi A força do reflexo é diminuida
nui em magnitude, aumenta temporariamente
em latência, etc.
amen Dois eliciadores, Sj Emparelhar repetidamente S\ S\ passa a controlar uma nova Sj evoca seguramente a CR
ano e S2 com S2 resposta (CR) semelhante a R j
mento 1. Um operante R R S+ 1. Aumento na taxa de R para um novo valor estável

com freqüência 2. R incorpora-se a um eio de comportamento
v 0 3. A variabilidade topográfica de R diminui
2. Um reforçador
adequado
Uma R anteriormen R --------- /------------------- 1. Diminuição de R Os processos comportamentais

te fortalecida 2. Desintegração da cadeia de aproximam-se do estado de
comportamento nível operante
3. Aumento na variabilidade
da forma e magnitude de R
ção Uma classe de com 0 reforçamento é aplicado pa 1. Fortalecimento das varian As variantes reforçadas apre
portamento com for ra um conjunto de variantes tes reforçadas sentam-se com uma força alta
ça v 0 dentro da classe, 0 resto é sub 2. Enfraquecimento daquelas
metido à extinção variantes que passaram por
extinção
nação 1. Uma classe de Reforçar a R numa das condi A força da resposta em eS 0 organismo passa a responder
resposta ções de estímulo (S^) e extin- gradualmente se diferencia, em e não em S
2. Duas condições guir a R na outra condição de ocorrendo um processo de ex
de estímulo estímulo (S) tinção prolongada em S
ão para Contingências de dis Apresentar uma série de pro Os processos de discriminação Discriminações novas, mas re
criminação adequa blemas relacionados de discri do indivíduo mudam gradual lacionadas, são resolvidas com
das minação mente de lentos e graduais pa eficiência máxima
ra súbitos e abruptos
TABELA DE PARADIGMAS COMPORTAMENTAIS - CONTINUAÇÃO
Nome Dado Procedimento Processo Resultado
1. Uma R previa R S+ Taxa constante de R seguida 0 reforçador perde tempora

mente fortaleci por uma cessação abrupta do riamente o seu valor reforça
da responder dor
2. Organismo priva
do de uma classe
de reforçadores
ona Um estímulo aversi Permitir que uma R termine A força de R aumenta S” controla a ocorrência de R
e tuga vo, S” s-
ão Uma contingência de Extinção abrupta Aumento no valor reforçador da destruição e dano.

reforçamento contí A probabilidade de comportamento agressivo aumenta.
nuo
Adaptação, ao choque elétrico, 414
de emoções, 431, 432
Adquiridos, drives, 377—381
Adquiridos, reforçadores, 227
força de, 256
Adrenalina, na emoção, 430
Adulteração de alimento com quinino, 358
Agressão, 417, 418
Alegria; 410 ver também Elação, Paradigma de,
Algoritmo, 2 6 7 ,3 1 8 —319
Alimento, privação de atividade geral, 361
Alma, 2 4 -2 5 , 26
Alucinações, 433
Ambiente, 126
Animais em experimentos de psicologia, 201—202
habilidades para formar conceitos, 284—2 8 8 ,299
Animais, espíritos, 24
Ansiedade, paradigma de, 412—416
superposto ao comportamento de esquiva, 415, 416
Antropomorfismo, 27
Aparelhagem, balão para o estômago, 367
barra de deslocamento de resposta, 167
caixa de obstáculo de Columbia, 355
caixa quebra-cabeça, 28
caixa de Skinner com barra, 32, 78
caixa do vai-e-vem, 391
câmara para pombo, 110,121
de desenhar com espelho, 175
estabilímetro, 3 6 2 -3 6 4
para o estudo do vício, 380
Labirinto, 251
Labirinto em T para o estudo de fuga, 284
máquina de ensinar, 300
pista de correr, 154
plataforma de saltar, 211
de puxar o cordão, para macacos, 213
roda de atividade, 178, 362
Wisconsin general test, 274
Aproximação-esquiva, conflito de, 424—425

Aproximação sucessiva, 169,170
no treinamento discriminativo, 248
do comportamento de razão fixa, 171
Aritmético, solução de problema, 265—267
Assíntota, de uma função, definida, 69
do processo de discriminação, 209
Atenção, como comportamento de observação encoberto, 237
como reforçador condicionado, 342
como reforçador generalizado, 235
Atividade geral, 3 6 1 ,3 6 4
ciclos sexuais e, 363
espontânea, 361—365
no estabilímetro, 362—363
nível operante de, 361, 363—365
padrão e privação de alimento, 364
privação de alimento sobre, 361
roda de, 362
para estudo de esquiva, 393
Auto-estimulação do cérebro, 371
Aversivos, estímulos, 383, 384
condicionados, 3 9 0 -3 9 8
incondicionados, 384
Beber, periodicidades no, 345, 346
Brincar como reforçador, 373
Cadeias de comportamento
adição de membros resposta,a, 248, 250
e o andar, 2 5 7 -2 5 9
desempenho de passagens musicais como, 259
e desenvolvimento de sentença, 262
elementos de, 245
elocução gramatical como, 263
encoberta, 267—269
extinção seletiva aplicada às, 2 5 2 -2 5 4
heterogêneas (definidas), 252
homogêneas (definidas), 255
em labirintos, 251—252
ligações (definidas), 245
linguagem, 260—263
membros (definidos), 245
processos no desenvolvimento de, 2 4 7 -2 4 8
ramificadas, 263
resolução em, 245—247
de respostas vocais, 250, 260—263
rompimento devido a S^s atrasados, 261
e saciação, 347
na solução de problema, 312—321
Caixa do vai-e-vem, 341

Causa do comportamento, 23
anedótica, 27
nos casos patológicos, 433
concepções medievais de, 24
emoção como, 405—407, 424
extinção como, 114
fictícia, 339
futuro como, 392
histórias de condicionamento passado, 340—341, 433
motivos, 342
variáveis de privação, 343
Causa e efeito, na Ciência, 337, 338
seqüência de, na emoção, 407
Cerebrais, lesões,
e impulso para alimento, 358
e supressão condicionada, 414, 416
Cérebro (diagrama). 360
Choque elétrico
intensidade e taxa de fuga, 3 8 6 -3 8 8
redução parcial de, 388—390
S" no treinamento de fuga, 384
Choque eletroconvulsivo, 416
Coeficiente de correlação, 330
Comer, mecanismos fisiológicos no, 367 periodicidade no, 345
Comportamento
agressivo, 416—418
categorias de Aristóteles, 24
emocional, 405
encoberto, 237
instrumental, 28
operante de observação, 148 —449
predição e controle do, 31
reflexo, 25
supressão de, 3 5 8 -4 0 0 , 434
topografia de, 86—87
Comportamento de esperar, 176—178
Comportamento de esquiva,
aquisição de, 3 9 2 -3 9 8
efeitos do paradigma de ansiedade sobre, 416
de respondentes emocionais, 431
sem estímulo de aviso, 396—298
e ulceração, 4 2 5 -4 2 7
Comportamento instrumental, 27—29, 77
Comportamento de observação, 1 4 8-149
Comportamento proposital, 75—77
Comportamento respondente,
definição genérica de, 160
eliciação de, 41—42
Comportamento social, 239—242
Compreensão; ver Significado
Conceito
aquisição de, 273
e aquisição de discriminação, 282—283
conjuntivo, 292
como controle por relações de estímulo, 281
disjuntivo, 288—291
de força do reforçador, 359
impulso, 343—344, 358
de pessoa, 288
de propriedades conjuntivas, 2 9 2 -2 9 3
relacionai, 279
de rotação anti-horária, 2 8 7 ,2 8 8
estrutura hierárquica de, 295
Conceito, formação de; ver Conceito, aquisição de
Conceitos
ensinados nas escolas, 301
de impulso, 359
interdisciplinares, 366—367
nas leis científicas, 39, 43
simples vs. compostos, 297
de transformação, 306
Condicionamento
comparação entre o Pavloviano e o operante, 97
fuga, 3 8 4 -3 8 8
Pavloviano, das emoçòes, 410
na ansiedade experimental, 4 1 2 -4 1 4
nas emoções mistas, 424
tempo, 63—64
usando S", 3 9 0 -3 9 2
Condicionamento clássico; ver Condicionamento Pavloviano
Condicionamento retroativo, 64
Condicionamento Pavloviano, 53—59
na ansiedade experimental, 412—416
das emoções, 65—66
nas emoções mistas, 410—411
intefvalo S\ — S2ótimo no, 63
procedimentos de emparelhamento no, 62—64
relações temporais no, 62—64
substituição de estímulo no, 57, 64—66
no treinamento de reforçamento secundário, 238
Condicionamento respondente; ver Condicionamento Pavloviano
Condicionamento de retardo, 64
Condicionamento salivar, 53—56
Condicionamento temporal, 63—64
Condicionamento de traço, 63
Condicionamento verbal, 92—94
Conflito
de aproximação-esquiva, 424—425
de motivos, 365
Constâncias perceptivas, 305—308
Constructo hipotético
força do reflexo, 4 2 —43
Contingências comportamentais, 127 ver também Esquemas de
Reforçamento
agrupadas, 141 —142
na aquisição de significado, 2 9 5 -2 9 6
aversivas na sociedade, 432
em cadeias, 245
como causas do comportamento, 342
discriminação, 139, 210
na disposição para aprender, 274
duração de, 1 3 3 -1 3 4
escolha de acordo com o modelo, 286
filogenéticas, 3 0 7 -3 0 8 , 364, 406, 420—421
fuga, 385
funcionais, 140—141
imitativas, 240—241
múltiplas, 1 3 0 -1 3 2
negativas, 137—138
nulas, 132
probabilísticas, 1 3 8 -1 3 9
punição, 398—402
ramificadas, 263—267
repetitivas, 135—136
Contingência de reforçamento contínuo (crf), 79
supersticiosa, 94
Continuidade de comportamento, 159,178
Contrações no estômago, papel no comer, 367
Contraste de brilho, 187—188
Controlado, experimento, 66 -68
Controle do ambiente
por estímulos não relacionados, 291
sobre operantes, 185
Controle do comportamento; ver Causas do Comportamento;
Controle do Ambiente
Controle, das emoções, 431—434
experimental, 66
SD ; ver Discriminação
Correlação
coeficiente de, 330
grau vs. forma de, 327—328
Covariância, de medidas motivacionais, 359

Culpa, 424
Curiosidade, comportamento de, 372
Curva Normal, 51—52
Curvas de respostas acumuladas
construção de, 80
empilhadas, 145
Definição, como uma estrutura de significado, 296—297
Deixas Verbais, 259
Delineamento de grupo, 104—106
Detetor de mentira, 431
Desvio padrão, 223
Diferenças individuais, 247
na solução de problema humano, 3 2 4 -3 2 5
Diferenciação, 1 6 4 -1 8 0
da força do responder, 164-165, 169
progressiva; ver Aproximação sucessiva
Discriminação, baseada em reforçadores intrínsecos, 355
baseada no reforçamento condicionado, 234
classificada por complexidade, 206
contingências de, 210
de formas, 286
índice de, 208
luz-escuro, sob a água, 3 5 3 -3 5 5
de odor, 2 0 9 -2 1 0
como uma operação de teste, 265
processo de na formação da, 274—278
sem erro, 2 1 7 -2 1 9
social, 241
Discriminativo, operante, 220
Discriminativo, tempo de reação, 2 1 9 -2 2 0
Dispersão de medidas; ver Variabilidade nas medidas
Disposição para aprender; - L - SET 274—278
relação com experimentos de formação de conceitos em
sujeitos humanos, 282
singularidade, 279
variáveis que afetam a aquisição de, 278
Distribuição de freqüência relativa, cálculo de, 4 8 -5 2
Drive ver Impulso e o paradigma de elação, 418—420
Drogas, e comportamento emocional, 430—431
efeitos sobre o comportamento, 156
e nível de tolerância ao choque, 390
vício, 38 0 -3 8 1
Dualismo, 24
Durabilidade de reforçadores condicionados, 2 2 9 -2 3 3
Elação, 418—421
Hiciador, 37
Emoções, 405
mistas, 4 2 2 -4 2 5
primárias, 422
Emparelhamento simultâneo de estímulo, 62
Enfraquecimento do comportamento; ver Extinção
Escolha de acordo com o modelo, 286—288
Escolha de matiz, em animais, 287
Esquecimento, 1Q8—112
Esquemas encadeados, 255—257
Esquemas de reforçamento,
condicionado, 233
descrição teórica dos, 180
encadeados, 255—257
intervalo fixo (IF), 144—147
intervalo randômico (IR), 147
intervalo variável (IV) 149
como linha-base para o estudo da emoção, 412—413
com S“, 286
probabilidade uniforme, 149-151
no estabelecimento de reforçadores condicionados poderosos, 230-231
de operantes RF, 1 72-173
razão fixa (RF); ver Operante de Razão fixa
no treinamento de discriminação, 2 0 6 -2 0 7
e variabilidade da resposta, 155
Esquiva condicionada, 392—398
Estabilímetro, 362—363
Estados estáveis; 1 5 5 -1 5 7 ver também Linhas-base
de intensidade do choque, 390—392
Estados fisiológicos
da emoção, 407
Estampagem, 377—380
Estimulação cerebral como reforçador, 370—371
Estimulação intracraniana, 370—371, 420
Estímulo, 185
aversivo, 383
condicionado, 3 9 0 -3 9 8
incondicionado, 383—384
concepção de Descartes, 24
controle, nos conceitos, 282—283
definição de, 126
dimensões, 1 8 5 -1 9 0
discriminativo, 205
habilidade para reforçar, 228—229
privado, 407—409
eliciador, 4 0 -4 1
generalização, 190—201
gradiente; ver também Generalização da Extinção
gradiente, 192-196;
intensidade, nas emoções, 421—423
luminoso, 185—188
neutro, 59
novo, como reforçador, 372—373
redescoberta de Whytt, 25
redundância, 239
reforçador; ver Reforçadores; Reforçamento
similaridade, 190, 199—201
sonoro, 189—190
substituição, 57—58
Estímulos sonoros, 189—190
Estratégias de procura de herurstica
Experiência anterior, 374—376 sobre o desenvolvimento emocional posterior, 432
Experimental, método, 66—70
Experimento, definido, 69
Experimento conjugado, 427
Experimento do macaco executivo , 3 3 5 ,4 2 5 —427
Explicação, ver também Causas do comportamento
causai, 41—42
concepção de Pavlov, 26
proposital, 392—393
teleológica, 392—393
vazia, 41
Expressão das emoções, 406
Extinção, 149
aplicada a elementos de cadeias, 252—255
como uma causa do comportamento, 340—341
do choro da criança, 112—114
definição de, 112
efeitos emocionais na, 99
e esquecimento, 100—112
generalização de, 197—198
latencia, 254—255
mudanças na taxa de resposta durante, 100
mudanças topográficas em, 101 —102
processo de, 99
punição durante, 398—400
recuperação espontânea da, 106
resistência à, 1 0 2 -1 0 6 , 1 1 6 -1 1 9
esforço da resposta e, 104
quantidade de reforçamento e, 104
de respostas emocionais patológicas, 433
numa tentativa, 107
ao testar a generalização de estímulo, 192
ao testar o poder de estímulos aversivos condicionados, 392

nos testes de reforçamento secundário, 228—229
variabilidade do comportamento na, 101—102
Extinção latente, 254—255
Fatores fisiológicos,
no beber, 369
no comer, 367—369
Feedback, 261
Feedback auditivo com atraso, 261
Fome, 344
Fonema, 90, 96—97
Força do comportamento, 115
Freqüência, distribuição de, 48—52
Freqüência, polígono de, 49—50
Frustração
adaptação à, 431
paradigma de, 416
Fuga, de S" condicionado, 396—397
treinamento, 3 8 4 -3 8 9
General Problem Solver, 3 2 0-321
Generalização; ver também Estímulo, generalização de
de extinção, 197—199
gradiente de, 190—196, 218
da supressão condicionada, 321—323
Habliidades; na solução de problemas,
Habituação; ver Adaptação
Hipótálamo, papel do, no comportamento de comer, 368
Histograma, 4 9 - 5 0
de taxas de resposta em S^ e S, 222
Ilusão de Müller-Lyer, 1 8 7-1 8 8
Imitação, 240-241
Implantação de elétrodo no cérebro, 368
Impulsos
adquiridos, 377—381
para atividade, 371
comparação das forças de, 355—356
conceito de, 3 4 3 -3 4 4 , 359
como direcionador do comportamento, 364—365
como energia, 361—365
e fatores fisiológicos, 3 6 6 -3 7 1
mensuração de, 248—360
Inanição em ratos, 351—352
Incentivo, 365—366
índice
do desempenho discriminativo, 208
do rompimento emocional, 434
índice de supressão, 434
Indução; ver Resposta, indução de
Informação
fornecida por estímulos discriminativos, 3 2 4 -3 2 7
na identificação de conceito, 321
Insight, na solução de problema, 314
Instrução programada, 80—83t., 298—305
máquinas de ensinar, 300
quadros na, 300
como um veículo para o ensino de conceitos, 302—305
Inteligência, 3 2 3 -3 2 7 , 3 30-331
e idade, 3 2 4 -3 2 5
mensuração de, 331
quociente de, 3 2 5 -3 2 6
L-set. ver Disposição para aprender
Labirinto
comportamento de fuga em 384
reforçadores exploratórios em, 372
Latência
de respondentes, 38, 40
de respostas condicionadas, 61
Lei do condicionamento, de Pavlov, 25
Lei do efeito, 28, 33, 88
Lei do limiar, 40
Lei do menor esforço, 169, 401
Leis
conceitos nas, 39
do estímulo-respostas, 25
generalidade científicas das, 39
limitações científicas, das, 342
do reflexo, 40
como relações funcionais, 337—339
uso científico, 3 3 7 -3 3 8
Lesõse; ver Cerebrais, lesões
Limiar, 210
de respondentes, 38,40
Linguagem
como cadeias, 261 —263
nas interrelações de conceito, 296
problemas gerais para a psicologia e, 260
Linha-base; ver também Estados estáveis
Para o estudo da emoção, 412
Linhas-base comportamentais, 156—157
Líquido •
privação de e resistência à saciação, 34 9 -3 5 1
Luz como um estímulo aversivo, 387
Luz, reforçamento com, 373
Mãe substituta, 374
Masoquismo, 402
Média, de uma distribuição de freqüência, 49
Mediana de uma distribuição de freqüência, 49
Medicina psicossomática, 425—427
Medidas
confiabilidade de, 331
de impulso, 3 4 9 -3 6 0
de supressão comportamental, 434
validade de, 3 3 1 -3 3 2
Medo, 410t., 429, 3 3 1 -3 3 2
Medo condicionado, 412—416
Moda de uma distribuição de freqüência, 49
Modelo, dos fenômenos emocionais, 421
hidráulico de Descartes, 24
Morfina, efeito sobre o nível de tolerância ao choque, 390
vício experimental de, 380—381
Motivação, 337
distinguida da emoção, 412
fatores fisiológicos na, 366-3 7 1
Motivos de comportamento, 342
Necessidade, 352—353
Neurose, 433
Nível operante, mensuração do, 79
Notação diagramática de fluxo, 265—266
Notação diagramática de fluxo de computador, 265—266
Olho, comparado a uma câmara, 186, 187, 188
Opção, para produzir estímulos discriminativos, 236
Operações de impulso, adrenalectomia, 358—359
pré-alimentação, 3 5 1 -3 5 2
privação, 343—344
de alimento, 352, 356
de água, 341
de ar, 354
e reforçadores líquidos, 344
saciação, 344
Operante; ver também Resposta
comportamento, 77
condicionamento; 95—96 ver também fortalecimento operante
controle de estímulo, 220—221
definição genérica de, 162—163
fortalecimento, 75—98
como causa do comportamento, 340—341
com S', 385
estereotipia do comportamento; ver também mudanças de variabilidade
leis do, 87
mudanças de variabilidade no, 86—87
paradigma, 89
processo, 90
por reforçamento condicionado, 229
métodos para criar, 170

de ordem superior, 1 7 0 -1 7 3 , 177
de pequena escala, 173—175
razão fixa (RF), 1 7 0 -1 7 3 , 177, 2 3 0 -2 3 2
relação com operações de computador, 265
rompimento na emoção, 410
Parâmetros, definidos, 118—119
do reforçamento negativo, 385
Patológicos, fenômenos emocionais, 433
Pausa após o reforçamento, IF, 144—147
RF, 171, 172
Pensamento, como solução de problema encoberta, 267—269
Perceptivas, constâncias, 305—308
cor neutra, 306
forma, 305—306
tamanho, 306—308
Periodicidades no valor do reforçamento, 344—346
Pista de correr, 154
Potencial muscular na imaginação, 267—269
Pré-alimentação, como uma operação de impulso, 351—352
Preferência, experimento de, 358—359
Privação, operações de, 343—344
Privação de exploração visual, 373
Probabilidade de reforçamento, 70—72
Problema, como um conjunto de contingências de discriminação, 274
definição de, 285, 311—312
Problemas de singularidade, 279
Procedimento de razão progressiva, 357
Procedimento de titulação; ver Choque elétrico
Processos comportamentais, 56
definição de, 70
Processo de ensino, como interação social, 242
Processos mentais, 3 0 -3 2
Propriedades ondulatórias da luz, 186
Proprioceptores, 189
no encadeamento, 275
Psicofísica, 30
Psicologia, definição de, 37
Psicologia fisiológica, 366
e o estudo da emoção, 427
técnicas em, 3 68-371
Psicose, 433
Psicoterapia, 4 3 3 -4 3 4
Punição, 398—402
como um auxílio para a aquisição de compostamentos alternativos, 401
nas instituições educacionais, 401
como um SD, 403
Quantidade de reforçamento comparada com o período sem choque, 389
Quebra-cabeça, caixa de, 27—29
Quebra-cabeças, 315—318
Como reforçadores para macacos, 318
Raiva, 416—418
Raiva condicionada, 418
Rastreamento, 2 1 5 -2 1 7
Receptores, 185
Recompensas token, 233—234
Recuperação espontânea da extinção, 106
Reflexo condicionado, 25—26, 55
comparado com o reflexo incondicionado, 6 0 -6 2
como um princípio explicativo, 37
de segunda ordem, 61—62
contribuição de Pavlov, 25
fadiga do, 41
incondicionado, 3 7 -4 5
comparado com o condicionado, 60—62
padrões, na emoção, 409—410
de segurar, 375
relações, 38
Reforçadores adquiridos, 227
água, e estados da boca, 369
e centros hipotalâmicos, 369
e fatores celulares, 369
alimento, e contrações do estômago, 367
e centros hipotalâmicos, 367
e glicose no sangue, 367
atividade, 371
ausência de normais, 433
condicionados, 227
negativos, 237—239
contato corporal, 432
contato físico, 373—376
definição de, 88
estimulação cerebral, 370
exploração, 372
força de, 3 4 1 -3 4 2 , 3 4 8 -3 6 0
na emoção, 412
sexuais e atividade geral, 363
periodicidades na, 344—346
generalizados, 234—235, 342
incondicionados, 227
intrínsecos, 3 7 1 -3 7 5
luz e escuro, 372
morfina, 380—381
negativos, 383
terminação de, 422 t.

como eliciadores, 390
por objeto estampado, 377—380
primários, 227, 342, 344—345
qualidade e quantidade, 365—366
secundários, 227
terminação de, 422 t.
valor; ver Reforçador, força de
Reforçadores exploratórios, 372
Reforçadores generalizados, 234—235
Reforçador negativo condicionado, 390—392
Reforçadores negativos, 383
terminação de, 422
Reforçamento; ver também Diferenciação
circularidade do, 88—89
de comportamento contínuo, 178—179
condicionado e choque elétrico, 403
contingência; ver Contingência comportamental
crf, 143, 1 4 9 -1 5 0
definição de, 4 8 8 -4 8 9
generalização de, 199
intermitente, 143
não contingente, 418—419
de taxas de resposta, 152, 176—178, 418—419
social, 239—242
de sons humanos e animais, 90—92
Reforçamento diferencial de taxas altas (drh) 178
Reforçamento diferencial de taxas baixas (drl), 176,178
Reforçamento seletivo; ver Diferenciação
Registrador cumulativo, 80—83
Relações funcionais, 337 -3 3 9
Repertório, comportamental, inicial, 3 1 2 -3 1 3
como habilidades na solução de problema, 264—265
Repertório comportamental, de respostas de linguagem, 298
Representação gráfica tridimensional, 117
Resistência à extinção de operantes RF, 173
após reforçamento de probabilidade uniforme, 155
após IV, 153
Resistência à saciação, 349—351
Respondentes autônomos, 407—427
na emoção, 406—407
ocultos por operantes, 431—432
Resposta, classe*, definição de, 159—164
condicionada, 56—58
denominação de cor, 186
diferenciação, 164—180
dimensões, 160—162
emitida, 79
força, 206, 2 5 5 -2 5 6 , 350
indução, 175
de observação, 235—237
operante, 33, 8 7 ,1 2 4 —126
probabilidade, 33, 114—116
reflexa, 25
respondente, 37
taxas de, 33
mudanças na relativa, 84—85
variabilidade, após um esquema IV, 155
após um esquema de probabilidade unif orme, 156
variantes, distribuição de reforçadas, 167
Respostas de observaççao, 235—237
Retenção, de comportamentos verbais ver Esquecimento
de supressão condicionada, 414
Ruído, como um estímulo aversivo, 387
Ruído branco, 189
Saciação, 344
curvas de, 348
de reforçadores intrínsecos, 373
resistência à, 349—351
Sadismo, 398
SD, 206
SA ,2 0 6
Secreções psíquicas; ver Condicionamento salivar
Sede, 344, 3 6 8 -3 6 9
Sensibilização de respostas emocionais, 431
Sentenças, como cadeias de comportamento, 262
Sentimentos, como eventos internos, 407—409
Sidman, procedimento de, 397—398
Significado, como comportamento interconceitual, 291—298
de taxas de resposta, 3 4 8 -3 4 9
Significância estatística, 225
Sílabas sem sentido, 109—111
Similaridade; ver Estímulo, similaridade
Simulação de computador na solução de problemas humanos, 320—321
Sistema de coordenada retangular, 66—67
Sistema nervoso autônomo, 65, 427—430
Sistema parassimpático do SNA, 429
Sistema simpático do SNA, 429
Solução de problema, como cadeias ramificadas, 263—267
definição de soluções em 317—318
testes de, 323—324
Solução salina, como reforçador para o rato adrenalectomizado, 359
Somação temporal, 42
Sono, efeito sobre o esquecimento, 111
periodicidades no, 346
Sucessivos, extinção e recondicionamento, 107—108
Superstição, 94—95
Supressão condicionada, retenção da, 414, 4 1 5 ,4 1 6
Tempo de reação, assintótico, 219—220
para o aparecimento de reforçadores negativos, 385
em experimentos de labirinto, 251—252
na pista de correr, 154
Tentativa e erro, responder por, 312—314
Teoria dos conjuntos, 1 6 3-16 4 , 1 8 0 -1 8 3 , 292
Teoria da evolução, 27
Teorias, da emoção, 405—407
Testes estatísticos, de diferenças entre duas médias, 221—225
Texto programado, 301
Time-out, de estimulação aversiva, 388—389
como punição, 402
Tonalidade, 198
Topografia do comportamento, 161
Transformações de conceitos disjuntivos, 290
Valor de reforçamento; ver Reforçador, força de
Variabilidade nas medidas, 45—52
após o fortalecimento operante, 86—87
na extinção, 102
Variável composta, 209
Variável dependente, definição de, 66—67
taxa de resposta como, 33
Variável independente, definição de, 66—67
Variáveis intervenientes; ver Variável composta
Vício, 3 8 0 -3 8 1
Wisconsin general test apparatus, 214, 274
Zeitgeist, 29—30

Princípios de Análise Do Cpto - Millenson, J. R. (1967)

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Princípios de Análise Do Cpto - Millenson, J. R. (1967)

Enviado por

Direitos autorais:

Formatos disponíveis

J. R.

Obtura- Retículo de difração

Título original: Principles-of Behavior Analysis

THI MACMILLAN COMPANY, NLW YORK

Library of Congress catalog card number: 67 15540

Montagem: Afonso Rocha

A maior parte do livro PRINCÍPIO S DE A N Á L IS E DO C O M PO R TAM EN TO fo i

O objetivo deste livro é fornecer uma introdução rigorosa à Psicologia Experimental

NOTA AOS ESTUDANTES......................................................................................... 19

PRIMEIRA PARTE: A REGULARIDADE DO COMPORTAMENTO..................... 21

CAPÍTULO 1 - UM BACKGROUND PARA A ABORDAGEM CIENTÍFICA AO

1.1 Primeiras tentativas para explicar e classificar o comportamento hum ano..... 23

CAPÍTULO 2 - COMPORTAMENTO REFLEXO (ELICIADO)........................... 37

2.1 A fórmula S - R .................................................................................................... 37

CAPÍTULO 3 - CONDICIONAMENTO PAVLOVIANO ....................................... 53

3.1 Reflexos condicionados e a natureza de um experim ento................................. 53

CAPÍTULO 4 - FORTALECIMENTO OPERANTE............................................... 75

4.1 Introdução ao comportamento proposital.......................................................... 75

CAPÍTULO 5 - EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE....... 99

5.1 Mudanças na taxa de resposta durante a extinção.............................................. 100

SEGUNDA PARTE: AS UNIDADES FUNDAMENTAIS DE ANÁLISE............... 121

CAPÍTULO 6 - NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTÍ­

6.1 Respostas e eventos ambientais............................................................................ 124

CAPÍTULO 7 - REFORÇAMENTO INTERMITENTE......................................... 143

7.1 Contingência de intervalo.................................................................................... 144

CAPITULO 8 - A ESPECIFICAÇÃO DA RESPOSTA.......................................... 159

8.1 A definição de classes de resposta............................................... ..................... 159

CAPÍTULO 9 - CONTROLE AMBIENTAL............................................................ 185

9.1 Dimensões do estím ulo....................................................................................... 185

TERCEIRA PARTE: UNIDADES COMPONENTES DO COMPORTAMENTO .... 203

CAPÍTULO 10 - DISCRIMINAÇÃO........................................................................... 205

10.1 Duas condições do estímulo, uma classe deresposta......................................... 206

CAPITULO 11 - REFORÇADORES ADQUIRIDOS................................ 227

11.1 As propriedades reforçadoras dos estímulos discriminativos positivos.......... 228

CAPÍTULO 12 - ENCADEAMENTO........................................................... 245

12.1 Os elementos de cadeias comportamentais............................................. ......... 245

QUARTA PARTE: CONTINGÊNCIAS COMPLEXAS.............................................. 271

CAPÍTULO 13 - AQUISIÇÃO DE CONCEITO ......................................... 273

13.1 Dispc' íção para aprender (simples)................................................................... 274

CAPÍTULO 14 - SOLUÇÃO DE PROBLEMA E INTELIGÊNCIA........................ 311

14.1 A estrutura de um problema e a natureza de uma solução............................ 311

QUINTA PARTE: DINÂMICA DO REFORÇO......................................................... 335

CAPÍTULO 15 - MOTIVAÇÃO I ................................................................................ 337

15.1 Causa e efeito e a noção de lei científica......................................................... 337

CAPÍTULO 16 - MOTIVAÇÃO I I ............................................................................... 361

16.1 Ativação e aspectos direcionais da motivação.................................................. 361

CAPÍTULO 17 - CONTINGÊNCIAS AVERSIVAS................................................... 383

17.1 Reforçadores negativos........................................................................................ 383

18.1 É a emoção uma causa do comportamento ou um efeito comportamental? .. 405

ÍNDICE ANALÍTICO.......................................................................................................... 437

UMA PSICOLOGIA INTRODUTÓRIA PODE SER INTERPRETADA COMO UMA

1. UM BACKGROUND PARA A ABORDAGEM

1.1 PRIMEIRAS TENTATIVAS PARA EXPLICAR E CLASSIFICAR O COMPORTA

O ponto de vista de Descartes simboliza o novo interesse num mecanismo que

1.3 - REFLEXOS CONDICIONADOS OU ADQUIRIDOS

Contudo, apesar de seu próprio interesse declarado na relação meio e resposta,

L4 - A TEORIA DA EVOLUÇÃO E O COMPORTAMENTO ADAPT ATIVO

De certo modo, o trabalho de Pavlov representa o auge da doutrina mecanicista de

“ A teoria da evolução levantou o problema da Psicologia animal porque ela exige

Em 1898, Edward L. Thorndike, da Universidade de Columbia, publicou os

I igura 1-1. A caixa quebra-cabeças utilizada por Thorndike para estudar a

Quatro elementos do trabalho de Thorndike sobre o comportamento instrumental

Em 1913, Watson publicou um trabalho, atualmente clássico, definindo a psicologia

CAPÍTULO 6 - NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTÍ

Tempo ------ 1------ 1ii------ 1------1i----- j------ 1------

Sobressalto Barulho alto Taxa cardíaca aumenta, múscu

2.6 - VARIABILIDADE NAS MEDIDAS: RESUMO DOS DADOS COM DISTRIBUI

3.2 - O PARADIGMA PAVLOVIANO: UM MÉTODO ESQUEMÁTICO DE REPRE

Cabeça

0 ---------- 1---------- 1___i_i_i___ Y