Escolar Documentos
Profissional Documentos
Cultura Documentos
MILLENSON
p r in c íp io s d e
ANÁLISE DO
COMPORTAMENTO
A mais moderna e sistemática coleção de princípios elementares
universais que existem para a modificação do comportamento
K
l V
dor
§
L
* tf) 1__
■4
k l :
\
\
Monocromador Fonte de Luz
ÍHesbiirUÍ
PRINCÍPIOS DE ANÁLISE
DO COMPORTAMENTO
J.R. MILLENSON
PRINCÍPIOS DE ANÁLISE
DO COMPORTAMENTO
T ra d u ç ã o de
A lin a de A lm e id a Souza
D io u e tie K ezende
COORDENADA
THESAURUS
© Copyright, J. R. Milleonson, 1967
MCMLXXV
Todos os direitos, em língua portuguesa no Brasil, reservados de acordo com a lei. Nenhuma parte
deste livro pode ser reproduzida ou transmitida de qualquer forma ou por qualquer meio, incluindo
fotocópia, gravação ou informação computadorizada, sem permissão por escrito da editora
COORDENADA / THESAURUS EDITORA DE BRASÍLIA LTDA. SIG Q. 08 LOTE 2356 -
FONE: (061) 344 3738 - FAX: (061) 344 2353 - Brasília - DF.
Para
VIVIENNE
PREFÁCI O À EDI ÇÃO BRAS I LEI RA
J. R. M.
1
J. S. Bruner, The process of education. Cambridge: Harvard llnivrr Press 196^ n ^
SU M Á RIO
-1 9 -
sistemática das relações entre o comportamento e suas variáveis controladoras. Por essa
razão, será melhor que você tente colocar de lado seus preconceitos sobre as ações das
pessoas e, em particular, seu sistema de representação dos assim chamados processos
mentais internos. Tente, assim, abordar a matéria com um ponto de vista novo, conten
tando-se, inicialmente, em fazer perguntas ingênuas tais como “ O que o organismo
observado estava fazendo? ” e “O que se relaciona consistentemente com o que ele
fazia? ” No início, seu progresso pode parecer lento mas ele será sempre seguro.
J. R. M.
- 20-
PRIMEIRA PARTE
A REGULARIDADE DO COMPORTAMENTO
Quando Sócrates ouviu falar das novas descobertas no campo da anatomia, que se
propunham a provar que as causas dos movimentos corporais eram derivadas de um
engenhoso arranjo mecânico dos músculos, ossos e articulações, disse: “ Isto dificilmente
explica porque estou sentado aqui, numa posição recurvada... falando com vocês”
(Kantor, 1963). Passaram-se 2.300 anos desde este comentário de Sócrates e nos séculos
subsequentes, as causas do comportamento humano foram atribuídas a marés, espirito
divino, posição das estrelas e, com freqüência, simplesmente ao capricho. Nos últimos
cem anos, surgiu uma ciência do comportamento trazendo um conceito estrutural novo,
com novas atitudes em relação às causas do comportamento. Uma breve história dos
eventos que levaram ao desenvolvimento desta ciência é uma introdução apropriada para
seu estudo. Assim como não existe um modo melhor de entender as atividades presentes
de uma pessoa do que estando a par de sua história passada, também não há melhor meio
de entender as atividades presentes de uma ciência do que através do conhecimento do
seu passado.
- 23 -
As observações e classificações de Aristóteles e dos estudiosos gregos que o seguiram
foram um início substancial na tentativa naturalística de entender as causas do compor-'
tamento humano. Mas a nova ciência declinou com o desaparecimento da civilização
helênica. O início da Era Cristã e da Idade Média produziu um clima intelectual pobre
para o desenvolvimento da observação e pesquisa: o homem voltou sua atenção para os
problemas metafísicos. Os Padres da Igreja iniciaram e os teólogos medievais comple
taram uma transformação conceituai de uma das “qualidades” puramente abstratas de
Aristóteles numa alma sobrenatural a quem as causas do comportamento humano eram
atribuídas. Encarando esta alma como imaterial, insubstancial, e sobrenatural, um
dualismo definitivo foi estabelecido entre alma e corpo. Colocando as causas do compor
tamento numa região não observável do espírito, este dualismo inibiu o estudo natura-
lístico do comportamento. Então, por um longo período de tempo, as ciências do
comportamento permaneceram adormecidas. Temos que pular adiante para o século
dezessete, no tempo de Galileu e o surgimento da física moderna para retomar os fios
que eventualmente, deram-lhes uma estrutura científica.
As teorias do filósofo e matemático Renè Descartes (1596-1650), contemporâneo
francês de Galileu, representam uma quebra parcial da explicação metafísica do compor
tamento. Tomando como modelo as figuras mecânicas dos jardins reais de Versailles que
se moviam e produziam sons, Descartes sugeriu que o movimento corporal era o
resultado de causas mecânicas semelhantes.
As máquinas nos nrdins reais operavam baseadas em princípios hidráulicos. A água
era bombeada em tubos fechados para impulsionar os membros das figuras, produzindo
movimentos, ou era conduzida através de aparelhos que emitiam palavras ou músicas
quando a água passava. Descartes imaginou que animais e homens eram, na realidade, um
tipo de máquina complicada, analogamente construída. Ele substituiu a água das figuras
reais pelos espíritos animais, um tipo de substância intangível, elástica e invisível; e supôs
que os espíritos fluíssem nos nervos de tal modo que entravam nos músculos causando,
assim, sua expansão e contração e, por sua vez, fazendo os membros se movimentarem.
Algumas das Figuras Reais estavam arrumadas de maneira que, se os visitantes
passassem por cima de ladrilhos escondidos, o mecanismo hidráulico atuante fazia as
figuras se aproximarem ou se afastarem. Descartes tomou essa resposta mecânica como
modelo para explicar como um estímulo ambiental externo poderia causar um movimento
corporal. Uma ilustração (ver la. Parte, p.21) num dos seus trabalhos, mostra o retraimentc
de um membro de um homem próximo de uma chama. De acordo com Descartes, “a má
quina do nosso corpo é assim formada” de tal modo que o calor de uma chama excita
um nervo que conduz essa excitação ao cérebro. Do cérebro, os espíritos animais são
transmitidos ou refletidos de volta ao membro, através do nervo, aumentando o músculo
e causando assim a contração e retraimento (Fearing 1930).
O desejo de Descartes de encarar o comportamento humano como determinado por
íorças naturais foi somente parcial. Hle limitou sua hipótese mecânica para certos com
portamentos “ involuntários” e supôs que o resto era governado pela alma, localizada no
cérebro. A alma guiava inclusive os mecanismos dos comportamentos “ involuntários” ,
mais ou menos do mesmo modo que uma máquina poderia dirigir as Figuras Reais. A
despeito deste dualismo e a despeito de sua escolha de um princípio hidráulico, as
formulações de Descartes representaram um avanço no pensamento inicial sobre o com
portamento. A teoria do corpo como um tipo específico de máquina poderia ser testada
por observação e experimentação. Hsta foi a propriedade seriamente omitida nas
- 24
explicações medievais. Ao'restabelecer a idéia de que, pelo menos, algumas das causas do
comportamento humano e animal poderiaim ser encontradas no ambiente observável,
Descartes estabeleceu as bases filosóficas que eventualmente iriam justificar uma
abordagem experimental do comportamento.
1 .2 - A AÇÃO REFLEXA
Pouco antes do início do século XX, Ivan Pavlov, fisiologista russo, estava
pesquisando as secreções digestivas de cães. No curso desses experimentos, notou que
enquanto a introdução de alimento ou ácido, na bôca, resultava num fluxo de saliva, a
mera aparição do experimentador trazendo alimento poderia também eliciar um fluxo
similar. Pavlov não foi, de modo algum, o primeiro homem a fazer observações deste
tipo. Mas parece ter sido o primeiro a suspeitar de que seu estudo detalhado poderia
fornecer um indício para a compreensão do comportamento ajustado e adaptado dos
organismos. Foi esta visão que o ievou ao estudo sistemático desses reflexos, os quais
chamou de reflexos condicionais, porque eles dependiam ou eram condicionais a um
evento prévio na vida do organismo. A aparição do experimentador não eliciava origi
nalmente a saliva. Somente depois que sua aparição era frequentemente associada com
alimento ou ácido, ela apresentava esse efeito. A contribuição particular de Pavlov foi
mostrar experimentalmente como os reflexos condicionais eram adquiridos, como
poderiam ser removidos (extintos) e que faixa de energias do ambiente era efetiva em sua
produção. Pavlov, em tempo, apontou uma lei geral de condicionamento: depois de uma
-2 5 -
associação temporal repetida de dois estímulos, aquele que ocorre primeiro, eventual
mente, passa a eliciar a resposta que, normalmente, é eliciada pelo segundo estímulo.'
Esta lei continua conosco até hoje, ligeiramente modificada.
Três aspectos gerais do trabalho de Pavlov merecem nossa atenção. Primeiro, ele não
estava satisfeito em observar simplesmente os aspectos gerais do condicionamento, como
muitos outros fizeram antes dele (c. f. Hall e Hodge, 1890). E^m vez disso, ele prosseguiu
para verificar a generalidade do fenômeno usando muitos estímulos e muitos cães. Foi
somente depois de numerosas demonstrações que ele codificou numa lei o que havia
descoberto -- lei esta aplicável, pensou ele, a todos os estímulos e a todos os organismos
superiores. Segundo, Pavlov, preocupou-se com os aspectos mensuráveis ou quantitativos
do fenômeno. Essas quantidades mensuráveis, tais como a quantidade de saliva e o
número de emparelhamentos do retlexo, foram úteis por permitirem uma análise deta
lhada do condicionamento. Um terceiro aspecto do trabalho de Pavlov foi sua natureza
sistemática. Limitando seus estudos aos efeitos de numerosas condições sobre uma única
grandeza (quantidade de saliva), Pavlov assegurou que suas descobertas experimentais
pudessem ser interrelacionadas e, consequentemente, mais significativas.
Pavlov viu claramente como se deve proceder na explicação do comportamento.
“o naturalista deve considerar somente uma coisa: qual é a relação desta ou daquela
reação extema do animal com os fenômenos do mundo externo? Esta resposta pode
ser extremamente complicada em comparação com a reação de qualquer objeto
inanimado, mas o princípio envolvido permanece o mesmo.
Estritamente falando, a ciência natural tem por obrigação determinar somente a
conexão precisa que existe entre um dado fenômeno natural e a resposta do organis
mo vivo a este fenômeno (Pavlov, 1928, p. 82)” .
-26 -
naturalistic*) do comportamento voluntário. Naquele ano, Charles Darwin propôs a teoria
da evolução, dizendo que o homem era membro do reino animal e que diferenças entre o
homem e outros animais eram quantitativas e somente uma questão de graus. Assim um
conhecido historiador da Psicologia colocou a questão;
- 27 -
pressionar uma barra ou abrir uma porta erguendo uma tramela, foram escolhidos por sua
co n v en iên cia e ex atid ão de observação. Uma vez que qualquer um destes
comportamentos podia ser organizado de modo a servir como instrumento que
produziria a fuga da caixa, Thorndike os chamou de comportamentos instrumentais.
-2 8 -
modificado chegou até nossos dias. Thorndike notou que, quando os animais eram
inicialmente colocados na caixa quebra-cabeça, eles apresentavam muitas respostas difusas
de debater-se. Eventualmente, um desses comportamentos difusos poderia, por acaso, fazer
funcionar o mecanismo de fuga. A porta, então, abrir-se-ia, permitindo ao animal sair da
caixa e o b te r um a pequena quantidade de alimento. Thorndike observou que o
comportamento, que inicialmente permitia ao animal sair, era apenas um dos muitos que ele
executava na situação. Assim, à medida que o animal era repetidamente submetido à
situ açã o , ele passava a a p re s e n ta r menos comportamentos supérfluos, até que
eventualmente não apresentasse, praticamente, nenhum daqueles mal sucedidos.
Thorndike concluiu disto que os resultados bem sucedidos do passado, ou efeitos do
comportamento, deveriam ter uma influência importante na determinação das tendências
comportamentais presentes do animal. Thorndike chamou isto —a capacidade dos efeitos
passados do comportamento modificarem os padrões do comportamento animal — a lei
do efeito. Esta lei sobrevive ainda hoje como um princípio fundamental na análise
fundamental e controle do comportamento adaptativo.
1 .6- O ZEITGEIST
Thorndike forneceu um novo método experimental e com sua ajuda formulou o que
logo seria aceito como uma lei básica do comportamento adaptativo. Do mesmo modo
que Whytt, 1 50 anos antes, deixou o conceito de reflexos parcialmente no estado de fato
observado e parcialmente no estado de interpretação supérflua, assim tambémThórndike
deixou a lei do efeito. Na sua proposição do princípio, Thorndike não estava satisfeito em
considerar o “efeito” como uma mera fuga do confinamento ou mero acesso ao
alimento. Mas em vez disso, sentiu necessidade de inferir que o sucesso levava ao prazer e
a satisfação, e que estas eram as causas verdadeiras das mudanças observadas no compor
tamento. Deste modo, ele deixou a explicação a cargo de estados mentais hipotéticos,
prazer e satisfação, os quais não eram mais reais do que a “alma” de Descartes. Para
Thorndike, como para seus contemporâneos, o comportamento de um gato escapar de
uma caixa quebra-cabeça não era importante como comportamento, mas somente como
um meio de esclarecer os processos mentais e associações de idéias do animal.
T h o rn d ik e foi, então, fiel à sua época e suas tradições considerando o
comportamento principalmente interessante pelo que podia revelar sobre algum outro
sistema. O que as épocas e as tradições impõem aos mais originais pensadores são
frequentemente denominadas de Zeigeist. Os grandes homens de uma era erguer-se-ão
acima de Zeitgeist de algumas maneiras mas, mesmo assim, serão por ele acorrentados de
outras maneiras. Descartes superou-o quando propôs uma teoria mecanicista original
sobre o movimento do corpo. Que ele foi acorrentado pelo Zeitgeist, é evidente, pela sua
permanência no dualismo “ mente-corpo” . Vimos o Zeitgeist em Whytt, que redescobriu
o princípio do estímulo, mas não foi capaz de eliminar a alma como a causa final dos
reflexos que observou. Pavlov estudou os reflexos condicionados, um fenômeno cuja
importância foi negligenciada durante séculos. Mesmo assim, vimos que Pavlov estava
preso pelo Zeitgeist; ele manteve o ponto de vista de que os reflexos condicionados,
embora, claramente, um fenômeno comportamental, eram de interesse para a
compreensão do cérebro ao invés do comportamento. Agora, vemos o Zeitgeist em
Thorndike, que realizou alguns dos primeiros experimentos sobre o comportamento
“voluntário” , mas explicou suas descobertas através da associação de idéias. De fato, o
-2 9 -
princípio do Zeitgeist penetra de tal forma todas as ciências que podemos tomar como
regra geral que todo trabalho humano será colorido pelas teorias e ponlos de vistas
aceitos em sua época. Assim, embora a grandeza de um homem consista em libertar-se de
certas maneiras de pensar estabelecidas e ver o que ninguém antes dele viu claramente,
ou, do mesmo modo, ele não escapará completamente do clima social, filosófico e 1
cultural no qual trabalha.
1.7 - A PSICOLOGIA PERDE A SUA MENTE
Thorndike introduziu o comportamento adaptativo no laboratório e, assim fazendo,
descobriu a importância da le i do efeito. Os estudos de Thorndike sobre o compor
tamento surgiram do seu interesse, como Psicólogo, nos processos mentais. Será instru
tivo, neste ponto, examinar a disciplina da Psicologia que, na primeira metade do
século vin te, fundir-se-ia com outras contribuições históricas da ciência do
comportamento. A pesquisa psicológica experimental iniciou-se em meados do século
dezenove como uma disciplina derivada da fisiologia dos órgãos dos sentidos. De fato, os
pioneiros Herman Helmholtz, Johannes Müller e Wilhelm Wundt eram todos físicos e
fisiologistas. Estes primeiros psicólogos experimentais adotaram as categorias de
comportamento descritas por Aristóteles mas, de um modo diferente deste, eles estavam
interessados no comportamento, apenas, na medida em que esclarecia os processos
mentais. Logo, o trabalho dos primeiros psicologistas representava uma tentativa para
tornar os métodos experimentais naturalísticos, introduzidos por Galileu, compatíveis
com as doutrinas metafísicas da Idade Média.
Foi Wundt que, em 1879, fundou o primeiro laboratório de Psicologia em Leipzig.
Podemos considerar o seu sistema como representativo das atividades desta nova
disciplina, a qual tinha menos de vinte anos quando Thorndike estava fazendo seus
experimentos com gatos e pintos na Colúmbia. Wundt advogou que a psicologia era a
ciência da experiência; e, como tal%seu objeto de estudo abrangia sentimentos,
pensamentos e sensação. Ele formulou a doutrina de que o método da Psicologia era
introspectivo, um exame dos processos conscientes do organismo em experiencia. Logo,
Wundt esquematizou o problema da Psicologia como “(1) a análise dos elementos dos
processos conscientes, (2) a determinação de como esses elementos são conectados e (3)
a determinação das leis de conexão” (Boring, 1929, p. 328, ital. omitidos). Os expe
rimentos que Wundt e seus seguidores realizaram dão uma imagem melhor do conteúdo
da psicologia do que as definições fornecidas por Wundt. A maioria dos trabalhos foi
classificada sob o título de sensação humana e dizia respeito ao sentido visual em
particular. Numerosos experimentos mediam as intensidades mínimas de luz que um ob
servador poderia detectar sob várias condições. Outros estavam voltados para as menores
mudanças ambientais necessárias para um observador relatar diferenças apenas percebidas
çm luminosidade, cor e distância dos objetos. Tais pesquisas vieram a ser chamadas de
experimentos de limiares em Psicofísica. Psico— porque as sensações eram consideradas
estar sob estudo; física - porque mudanças físicas no ambiente eram manipuladas e
medidas experimentalmente. Audição, tato, gosto, olfato e o sentido do tempo também
foram pesquisados, assim como o tempo de reação, atenção e sentimento. A memorização
de vários tipos de sílabas sem sentido era um método para tratar a associação de idéias e
deduzir as propriedades da memória.
Embora se afirmasse ser a psicologia uma ciência dos conteúdos, processos e atos
mentais, o que de fato ela investigava era o comportamento. Associações de idéias eram
- 30-
inferidas a partir da aprendizagem de sílabas sem sentido; sensações idênticas eram inferi
das de observações do comportamento quando um sujeito humano agrupava dois objetos
ambientais diferentes em contextos diferentes (por exemplo, duas amostras de papel
cinza sob diferentes condições de iluminação); a velocidade do processo mental era
inferida do tempo de reação do indivíduo. Assim, não foi paradoxo algum o fato de que
quando Thorndike veio a fazer uma observação mais detalhada da associação de idéias,
estivesse livre para escolher animais como sujeitos. Se o comportamento dos
organismos humanos poderia levar à inferência sobre o processo mental, por que não o
comportamento animal? Logo, aconteceu que o trabalho de Thorndike ajudou a intro
duzir os métodos de pesquisa animal na Psicologia. Aí eles pejmanecem ao lado dos
descendentes metodológicos da psicologia sensorial clássica e da Psicologia introspect iva
do século dezenove.
Mas, talvez o homem que mais contribuiu para esclarecer a relação entre o
comportamento e Psicologia foi John B. Watson. O primeiro trabalho deste psicologista
americano dizia respeito às modalidades sensoriais que o rato usa na aprendizagem de um
labirinto. À medida que Watson continuava seus estudos com animais, tornava-se mais e
mais preocupado com o ponto de vista predominante de que o comportamento era
significativo somente quando esclarecia processos mentais ou conscientes. Ocorreu a
Watson que os dados do comportamento tinham valor em si mesmos e que os problemas
tradicionais da Psicologia — imaginação, sensação, sentimento, associação de idéias —
poderiam ser todos estudados estritamento por métodos comportamentais.
O ponto crítico de Watson era o de que a psicologia deveria ser objetiva —isto é, ela
deveria ter um objeto de estudo que, como nas outras ciências, fosse independente do
observador. A Psicologia clássica, tentando estabelecer como seu objeto a auto-
observação, carecia de um observador independente, localizado fora do sistema em
consideração. A adoção do comportamento como objeto a ser observado deu à nova
psicologia o observador independente necessário.
O programa de Watson tinha um grande alcance e era para sua época, notavelmente
sofisticado. Ao enfatizar o comportamento como um objeto independente de uma
ciência dirigida para a previsão e controle do comportamento e a análise microscópica
do ambiente e comportamento em termos de estímulo e resposta como a maneira para a
compreensão eventual de padrões complexos do comportamento, o programa de Watson
preparou a base para nossos pontos de vista modernos.
- 31 -
1 . 8 - 0 FIRME ESTABELECIMENTO DE UMA ANÁLISE EXPERIMENTAL DO
COMPORTAMENTO
Os primeiros experimentos de Thorndike sobre o comportamento animal e a
definição de Psicologia dada por Watson, como uma ciência do comportamento,
introduziram a pesquisa animal na Psicologia,Mesmo assim, o ‘status’ científico da nova
Psicologia era precário. No princípio dos reflexos condicionados formulado por Pavlov,
Watson pensou ter encontrado um mecanismo explicativo para muitos dos ajustamentos
complexos e sutis de organismos adultos, inclusive o homem, aos seus ambientes. Mas a
tentativa de forçar todos os comportamentos no modelo do reflexo foi um fracasso.
Watson não soube apreciar a importância daJei do efeito de Thorndike, principalmente,
pode-se supor, devido ao excesso de bagagem conceituai com que Thorndike envolvera a
questão. O ponto de vista de Watson de que a tarefa de uma ciência preditiva do
comportamento fosse a compilação de todas as correlações estímulo-resposta hereditárias
e adquiridas que um dado organismo exibisse, desviou a atenção da procura de leis gerais
do comportamento. Neste vácuo teórico, conceitos mentalistas tradicionais continuaram
a sobreviver. O rigor experimental do behaviorismo estava fora de questão, mas sua meto
dologia corria o risco de ser estéril.
“Vinte anos de “método de ciência natural” sustentados pelo behaviorismo fracas
saram em fornecer uma formulação sistemática consistente e útil. Os dados experi
mentais refletiam muitas propriedades arbitrárias dos aparelhos. Conclusões acei
táveis com qualquer grau de generalidade referiam-se a aspectos, características ou
capacidades limitantes. Enquanto muitas dessas eram bastantes válidas, poucas eram
logicamente convincentes e preferências pessoais levavam a muitas ‘ciências’
individuais do comportamento” (Skinner, 1944; p. 276).
-3 2 -
Sob essas condições experimentais, um rato faminto deixado só na caixa, logo viria a
pressionar a barra com uma taxa constante e moderada até que um dado número de
pelotas de alimento liberadas começasse a saciar o animal. A situação experimental
utilizada por Skinner e sua abordagem aos problemas do comportamento foram únicas
em muitos aspectos. Skinner viu a necessidade de encontrar uma variável dependente
sensível e exata. Isto é, algum aspecto quantitativo do comportamento que pudesse variar
numa ampla faixa e ter uma relação ordenada e regular com as variáveis ambientais
passadas e presentes, relação esta que pudesse ser formulada em termos de uma lei. Sua
descoberta de que a freqüência de ocorrência da resposta de pressionar a barra durante
um intervalo de tempo (sua taxa) satisfazia essas condições, foi o principal avanço em
direção a uma análise sofisticada do comportamento individual.
A abordagem de Skinner aos problemas do comportamento diferia, de certo modo,
daquelas dos seus precursores assim como de seus contemporâneos que trabalhavam com
a psicologia animal. Como proposição fundamental, ele sustentou que uma ciência do
comportamento poderia ser o que chamou de descritiva ou funcional; isto é, poderia
limitar-se a descobertas de relações ou correlações entre variáveis mensuráveis. Skinner
também argumentou que as pesquisas deveriam ser sistemáticas, no sentido de que as
relações obtidas estivessem ligadas por um ponto comum. Limitando suas observações às
formas pelas quais uma única variável dependente (a freqüência por unidade de tempo de
um ato arbitrário mas, mesmo assim, representativo) mudavam com as condições
ambientais variadas, Skinner manteve seu próprio trabalho altamente sistemático.
Um objeto de estudo, frequentemente, espera instrumentos para colocar o
observador em melhor contato com ele. Skinner inventou um registrador que realiza um
registro visual das respostas sucessivas através de um ligeiro deslocamento vertical de uma
pena, movendo-se horizontalmente no tempo. À medida que o experimento progride, um
gráfico de respostas acumuladas é desenhado em função do tempo. Esse registrador
cumulativo de respostas torna possível um registro de alta qualidade do processo
comportamental para inspeção imediata que funciona para os behavioristas de uma
maneira não diferente da que o microscópio funciona para o biologista.
As contribuições metodológicas reais de Skinner para a ciência moderna do
comportamento são numerosas e podemos apresentar, aqui, somente um esboço de
algumas das mais importantes. Ele reconheceu a antiga dicotomia entre ações reflexas e
voluntárias ou, como chamou mais tarde, operantes. Mas mostrando que o princípio de
Pavlov se aplicava ao fortalecimento dos reflexos, enquanto a lei do efeito de Thorndike
descrevia o fortalecimento de operantes, ele colocou ambos os tipos em perspectiva
harmoniosa. Formulou, tambérq um vocabulário preciso cujos termos foram definidos
com referência aos fatores observáveis que ele media e manipulava. Nessa terminologia
está a base do nosso quadro conceituai moderno.
Desde o inicio, Skinner enfatizou a importância da predição e controle detalhados
do comportamento individual, ao invés de diferenças gerais entre grupos de animais. Suas
próprias pesquisas foram invariavelmente caracterizadas por um grande número de
medidas em poucos organismos, sendo a reprodutibilidade do processo sob estudo o teste
de sua validade. O enfoque de Skinner na taxa de uma resposta operante representativa
evitou muitos dos problemas associados com as medidas mais indiretas do compor
tamento. Thorndike observou o número de erros cometidos e o tempo gasto para
alcançar o sucesso no seu quebra-cabeça, mas nenhuma dessas era, na realidade, uma
propriedade real do comportamento instrumental que estava sendo adquirido. Se dese
jamos treinar um cão a pular através de um aro, por exemplo, não estamos interessados
- 33-
nos erros que ele comete, mas no seu comportamento de pular através do aro. Os erros são
medidas de comportamentos outros que não aqueles que estamos investigando. Questões
interessantes sobre se um dado ato ocorrerá ou não, ou com que freqüência ocorrerá,
nunca poderiam ser respondidas em termos de erros ou escores de tempo. O dado básico
de Skinner, a taxa de respostas, está relacionado de perto com a probabilidade de
ocorrência do comportamento e tem sido especialmente útil em fornecer respostas a
questões sobre a probabilidade da resposta.
Com o passar dos tempos, Skinner ampliou sua base empírica. Combinações de
respostas e organismos outras que não o pressionar a barra por ratos têm sido estudadas.
A expectativa original de que este ato seria característico do comportamento operante,
de um modo geral, tem sido aparentemente confirmada. Além disso, as relações que
Skinner obteve garantem, em muitos casos, o título de princípios comportamentais, já
que elas parecem manter-se para um grande número de organismos, incluindo o homem,
e para todas as respostas que podem ser classificadas como operantes.
O trabalho de B.F. Skinner nos leva a um ponto próximo da nossa conceituação
moderna de ciência do comportamento. Estamos ainda muito perto desse período his
tórico, muito envolvidos em nosso próprio Zeitgeist, para termos a perspectiva necessária
para determinar os pontos fracos no sistema de Skinner. Nos capítulos que se seguem,
todavia, veremos que a ciência do comportamento, atualmente restabelecida de um modo
firme como uma ciência natural, está se expandindo em muitas áreas de pesquisas. Talvez,
a prova mais convincente de que essa ciência se desenvolveu encontra-se no surgimento
recente de uma tecnologia do comportamento esboçada diretamente a partir dela. Como
veremos, as aplicações de técnicas do comportamento estão sendo ampliadas a pesquisas
de drogas, treino de animais, guerras, tratamento do comportamento humano anormal e
educação.
1.9 - REVISÃO
-34-
geral e previsível como aquelas do reflexo. Aiiistória da análise do comportamento revela
que os homens estão bastante enclinados a adotar interpretações supérfluas sobre o
com portam ento, ao invés de aceitar a realidade das descrições do próprio
comportamento. Quase todo contribuinte da ciência compartilhou de algumas
superstições da sua época sobre o comportamento que estava pesquisando.
-3 5 -
Capítulo 2 - COMPORTAMENTO REFLEXO (ELICIADO)
2.1 - A FÓRMULA S - R
R 2 = / ( S2)
^ssa fórmula diz que uma certa resposta reflexa, R 2 (chamada um respondente). é uma
função de (isto é, depende de) um evento estímulo S2 (chamado um eliciador)1. Essa
-37 -
fórmula expressa uma relação ou correlação importante, entre dois eventos. No de
correr deste capítulo, examinaremos esta correlação em detalhe.
Um dos experim entos de Sherrington serve de ilustração. Ele conectou um
músculo da perna de um gato a um aparelho para medir a contração deste músculo.
Anteriormente, sob anestesia, o cérebro do gato havia sido desconectado da medula. (No
estudo dos reflexos, as influências que não estão sob o controle direto do expe-
rimentador são frequentemente removidas cirurgicamente. Neste caso, separar o cérebro
da medula espinhal remove qualquer efeito possível que o cérebro possa ter sobre o
músculo em estudo.) Choques elétricos breves de várias intensidades foram, então, apli
cados a um nervo sensorial que se sabia estar envolvido em um arco reflexo neste
músculo.
A Fig. 2. 1 ilustra os resultados hipotéticos do tipo que Sherrington poderia ter
obtido, à medida que aumentasse gradualmente a intensidade do choque em sete tenta
tivas sucessivas. Algumas das propriedades de um reflexo típico estão representadas: por
exemplo, se observarmos, na Fig. 2.1, que a linha relativa ao tempo se desloca da esquerda
para a direita, observaremos primeiramente que o choque mais fraco (o choque mais fraco e
localizado na extrema esquerda) não elicia um respondente. Valores de choque não
suficientes para eliciar uma resposta . Mas para estarmos certos, apresentamos o mesmo
valor do choque novamente na tentativa 3. Desta vez, obtemos uma resposta. Este valor
do choque se encontra no que chamaremos a região de penumbra ou limiar: é o bastante
forte para, algumas vezes, eliciar um respondente e outras vezes não. Continuando nossas
apresentações de choque de maior intensidade observamos um número de efeitos inte
ressantes: (1) cada apresentação de choque é seguida por (elicia) um respondente, (2)
choques eliciadores mais fortes são seguidos por respondentes mais fortes, (3) os res-
pondentes ocorrem mais rapidamente após eliciadores mais fortes; isto é, o tempo entre o
eliciador e o respondente, chamado latência, é menor quando o eliciador é mais forte.
Respondente A .k A A h
região de penumbra
■
Choques elétricos
no músculo JL JL
T em p o ►
- ----- 1-----1-----1-----1---- J-----1-----1-----1-----1-----1----- 1——J----- L——i---------- 1------------- l
-3 8 -
A descoberta de relações e propriedades como essas ilustradas na Fig. 2. 1 é um dos
objetivos permanentes da ciência. Quando relações quç se mantém entre os valores de um
evento (tais como intensidades de choque) e valores de outro evento (tais como a mag
nitude ou rapidez de movimento do músculo) podem ser isoladas ou reproduzidas dia
após dia, experimento após experimento, frequentemente falamos da regularidade da
natureza. De um modo figurado, estamos dizendo que a natureza parece ser limitada por
certas leis cuja descoberta é o principal objetivo da pesquisa científica.
Devemos qualificar cuidadosamente essa última proposição * todavia, porque parece
certo que as relações ou leis da natureza não são como conchas numa praia, esperando
por nós para ajuntá-las numa cesta científica.
Antes de podermos estabelecer leis relacionando nossos conceitos, é preciso termos
formulado, pelo menos numa primeira aproximação, os nossos conceitos. A descoberta
das leis do reflexo foram precedidas por quase trezentos anos de uma evolução gradual
do conceito de estímulo, iniciando-se com Descartes. Então, a ciênciaé uma operação
similar ao funcionamento de uma armadilha. Em estágios pré-científicos, nossa intuição e
experiência ingênua levam-nos a suspeitar que uma certa ordem existe na natureza a
especulamos qual a natureza desta ordem. (Por exemplo, consideremos a suposição de
Descartes de que o comportamento involuntário era como uma máquina.) Então,
começamos a perturbar um pouco a natureza, isto é, a fazer experimentos e, assim,
mudar o curso natural dos eventos de modo que possamos obter uma idéia melhor do
que pode acontecer com um fenômeno particular.
Mas mesmo para fazer um primeiro experimento exploratório, necessitamos,
geralmente, definir nosso fenômeno de um modo mais preciso, bem como decidir sobre
o que alterar e onde procurar pelos efeitos de nossa alteração experimental. Os resultados
do nosso primeiro experimento permitir-nos-ão definir nossos termos ainda mais preci
samente. Deste modo, modificamos continuamente os nossos conceitos. Ao mesmo
tempo, enriquecemo-los, relacionando-os a outras coisas que são conhecidas. Além disso,
tendo refinado nossos conceitos na base de experimentos, somos levados a novos experi
mentos. Diz-se, às vezes, que um bom experimento responde uma velha questão e levanta
duas novas. Não há um ponto final para esse processo (o qual é a ciência) uma vez que
estamos continuamente refinando e redefinindo os nossos conceitos e continuamente
relacionando uns aos outros.
-3 9 -
primárias do reflexo. Essas leis não são deformuladas em termos de qualquer eliciador
particular como o choque elétrico, ou de qualquer respondente particular como um
determinado movimento muscular. Elas são, ao invés disso, formuladas genericamente
em termos de estímulos eliciadores (qualquer eliciador) e respostas (qualquer res
pondente). Formulando-as assim, obtemos uma generalidade adequada, mas com sacri
fícios de detalhes particulares. Por exemplo, a relação exata entre a intensidade do
estímulo e a magnitude do respondente varia de reflexo para reflexo. Algumas vezes, a
relação é quase diretamente proporcional, de modo que numa ampla faixa de intensidade
de estímulos, dobrando-se a intensidade do estímulo, a magnitude do respondente será
dobrada, e assim por diante. Em outros reflexos, um aumento de dez vezes na inten
sidade do estímulo seria necessário para produzir o dobro da magnitude do res
pondente. Nossas leis do reflexo primário são expressas de tal forma que essas diferenças
ficam encobertas.
Os eliciadores sempre podem ser especificados por uma dimensão de intensidade.
E n tã o , eliciadores do tipo do choque podem ser fracos, moderados, ou de maior
intensidade. Eliciadores do tipo da luz para respostas pupilares podem variar de intensidades
tão fracas, que mal podemos ver, a intensidades tão altas que a luz torna-se dolorosa. Como
notamos, energias abaixo de um certo nível na dimensão da intensidade são insuficientes
para eliciar qualquer resposta. À medida que a intensidade é gradativamente aumentada,
encontramos uma região em torno da qual valores da intensidade podem ou não eliciar
um movimento. Essa região de indeterminação onde a intensidade pode ou não ser o
bastante forte para eliciar um respondente é a região de penumbra do limiar. Podemos
formular essa informação mais especificamente numa lei:
1. Lei do limiar. Existe uma faixa de intensidade abaixo da qual nenhuma resposta
ocorrerá e acima da qual uma resposta sempre ocorrerá. Dentro dessa faixa as respos
tas ocorrerão com alguma incerteza. Um ponto arbitrário, nessa região de incerteza
(digamos, aquela intensidade que elicia a resposta 50 por cento das vezes) é chamado
de limiar, intensidade acima desse ponto são chamados estímulos eliciadores.
À medida que a intensidade do estímulo é aumentada a resposta ocorre sempre e é
graduada em relação ao estímulo. Então, eliciadores fortes eliciam rapidamente res-
pondentes fortes e de longa duração. Eliciadores fracos são seguidos mais lentamente por
respostas fracas e de curta duração. A maior parte dessa informação pode ser represen
tada por duas leis do reflexo:
2. Lei da Intensidade-Magnitude. A medida que a intensidade de um estímulo eli
ciador é aumentada, a magnitude do respondente eliciado também aumenta.
3. Lei da latência. À medida que a intensidade do estímulo eliciador é aumentada, o
tempo (latência) entre o aparecimento do estímulo eliciador e o aparecimento do
respondente diminui.
As leis do reflexo são importantes para definir o conceito de reflexo. Pode-se dizer
que um reflexo é uma correlação entre uma mudança em parte do ambiente e uma
propriedade comportamental, tal que as três leis muito especiais que descrevemos
acima sejam válidas. Esquematicainente, um reflexo pode ser representado assim
S2 —^ R-2
- 40 -
onde S2 representa um eliciador, —> representa “causa pelas leis do reflexo” e R2
representa a mudança comportamental produzida. Nessa fórmula vazia nada é dito sobre
como R 2 depende de S2 . Tal fórmula pode ser considerada extremamente geral (ela
descreve toda ação reflexa) e muito pouco precisa (ela nâo especifica os detalhes de
qualquer ação reflexa particular). A seta — > pode ser lida elicia, onde elicia é defini
do como 'conduz à, pelas leis do reflexo” . O termo elicia é de alguma importância na
ciência do comportamento porque denota um grupo muito específico de leis causais
entre ambiente e comportamento, isto é, as leis do reflexo. Então, S2 pode ser dito um
estímulo eliciador, uma mudança no ambiente que está correlacionada com o compor
tamento através das leis do reflexo. Similarmente, R 2 *o respondente, é definido como
uma resposta eliciada. E útil reservar a palavra eliciar para a definição precisa formulada
acima. Nos capítulos subseqüentes empregaremos o termo estímulo repetidamente em
conjunção com um tipo diferente de controle sobre o comportamento. Mas distingui-
remos tal controle pela omissão cuidadosa do qualificador "eliciar" naquele contexto.
Certas leis, chamadas leis secundárias do reflexo, codificam uma informação adicio
nal. Uma delas é a lei da fadiga do reflexo. Quando um respondente é repetidamente
eliciado muitas vezes por segundo, por uma intensidade de estímulo constante, a mag
nitude do respondente declina gradualmente, e eventualmente a resposta pode cessar de
todo. Esse fenômeno é chamado façiiga do reflexo e é visto esquematicamente na Fig.
2- 2 .
Pf Ílílririnnnnnri-------------- ------------------
-41 -
das não eliciam respondentes. Diz-se que esses valores baixos de energia estão abaixo do
limiar, e são chamados subliminares. Todavia, se apresentarmos dois ou mais desses
subliminares em sucessão rápida podemos, sob certas condições, produzir um res-
pondente. Esse fenômeno é visto esquematicamente na Fig. 2-3. É como se as duas
intensidades subliminares se somassem para formar um único eliciador. A somação tem
poral, vista na Fig. 2-3, define exatamente o que queremos dizer por esses conceitos que
chamamos de reflexos, estímulos eliciadores e respostas eliciadas.
Podemos notar em relação a isto que a palavra eliciar é frequentemente tomada sem
crítica, como sendo idêntica a “ causar”. (Por exemplo um estímulo luminoso pode ser
dito “ causa”, de um comportamento pupilar.) O termo “causa” é uma palavra antiga
usada, às vezes, na história da filosifia e da ciência para denotar uma relação necessária e
suficiente entre eventos. A palavra parece ter sido empregada para descrever um evento
X, sempre que X se relaciona a um evento Y, de tal forma que se há o evento X entáo o
evento Y ocorrerá; e se não Yf então não X. Tente essa fórmula. Faça de Y um
respondente, digamos uma contração muscular, “causada” por um estímulo-choque que
chamamos X. Logicamente, é certo que: se o choque, então a contração. É também certo
que, se não observarmos a contração (não Y ), então não terá havido um dado estímulo, o
choque (não X). É, então, evidente que, logicamente, um estímulo eliciador pode ser dito
“ causar” uma resposta na ação reflexa, mas é também claro que essa proposição oferece
pouca informação sobre a natureza exata da relação causai. Em geral necessitaremos de
uma descrição mais detalhada da relação entre o comportamento e suas causas do que é
possível por uma mera proposição da sua sucessão lógica na fórmula X e Y. Logo, o
termo eliciar é preferível ao termo “causar” no presente contexto —não porque seja algo
mais objetivo ou lógico que a palavra “causar” — mas porque “eliciar” contém uma
grande proporção de todas as leis primárias e secundárias do reflexo. Evidentemente,
quando chutamos uma bola “causamos” sua “resposta” de viajar no ar. Mas as leis que
governam essa “resposta” são as leis do movimento, de Galileu enão as leis do reflexo, de
Sherrington.
-4 2 -
para fatigar o reflexo. Uma característica importante dos reflexos é encontrada na o d-
servação de que, nos momentos em que o limiar é baixp (uma pancada muito fraca é
efetiva) a magnitude de R.2 para um dado valor de S2 (padrão) será alta, a latência será
curta e o número de S2 sucessivos necessários para fatigar o reflexo será grande. Ao
contrário, naqueles momentos em que o limiar é alto (uma pancada forte é necessária
para qualquer movimento), a magnitude de R2 para um valor padrão de S2 será baixa, a
latência será longa e apenas poucos S2 sucessivos serão necessários para fatigar o reflexo.
Essa associação sistemática ou co-variância das propriedades do reflexo (limiar, mag
nitude, latência, etc.) levaaurna interessante construção lógica. Somos levados a
identificar essa co-variância e inferir que existe uma entidade hipotética que intervém
entre o estírtiulo e o respondente. Deduz-se que esta entidade, a ser designada como força
do reflexo, determina a variação sistemática, ou co-variância de cada propriedade do
respondente. No caso do reflexo, o cons true to força do reflexo é definido por essa
co-variância de tal modo que grandes magnitudes, latências curtas, limiares baixos, R 2
fatigadas lentamente, etc; representam reflexos fortes. Ao contrário, pequenas mag
nitudes, latências longas, limiares altos, R2 rapidamente fatigadas, etc. constituem refle
xos fracos. Note que o constructo não é definido exclusivamente em termos dos valores
respondente. Ele incorpora (no limiar) também o valor do eliciador. Então, uma R2 de
graitde magnitude não precisa necessariamente representar um reflexo forte. Ela pode
bem ser o resultado de um reflexo fraco sendo testado com um S2 intenso. O construto
força do reflexo é representado na Fig. 2.4.
Magnitude
Limiar
Diz-se que o construto da Fig. 2-4 é hipotético, simplesmente porque não é dire
tamente observado. Ninguém viu a força de um reflexo; o que vemos são meramente as
mudanças no comportamento. Mas o fato de mudanças comportamentais estarem corre
lacionadas umas às outras induz-nos a agrupá-las como reflexões de uma entidade
única subjacente. O formar construtos como a íorça do reflexo apresenta certos riscos,
particularmente ao se determinar propriedades para o construto hipotético que vão
muito além das observações que lhe dão origem. Ainda assim a construção hipotética é
um tipo importante e persistente de formação de conceito em todas as ciências e sua
justificação encontra-se na sua utilidade. No caso particular da força do reflexo, ela entra
como um conceito útil na formação de outras leis num sistema de comportamento.
(Lembre-se, primeiro devemos ter nossos conceitos, então, chegar às nossas leis.) Por
exemplo, drogas, doenças do sistema nervoso central e eliciação simultânea de outros
reflexos todos causam mudanças concorrentes nas grandezas que definem a força do
reflexo. Então, é conveniente representar essas leis correlacionadas por um único termo,
força do reflexo. Veremos outros exemplos desse tipo de representação e composição de
relações em capítulos seguintes.
-4 3 -
2.5 - EXEMPLOS COMUNS DE REFLEXOS
Às observações que são resumidas como leis do reflexo são mais facilmente feitas em
músculos cirurgicamente isolados de influências outras que não aquelas do eliciador em
estudo. Embora estudemos reflexos em músculos cirurgicamente preparados para obter
mos precisão de controle, os reflexos são facilmente vistos em formas qualitativa no
comportamento intacto de todos os animais, desde o homem às espécies mais inferiores. A
ilustração de Descartes relativa ao retraimento do membro de um homem de uma chama
(ver p. 1) é um reflexo humano intacto. Outros são as eliciações de lágrimas pelo sumo de
cebola, espirro devido à pimenta no nariz, flexão do joelho devido a uma pancada no
tendão patelar, descarga de saliva quando alimento é colocado na boca, mudança no
batimento cardíaco devido a um som alto,e assim por diante. Todos esses reflexos estlo
de acordo com o nosso modelo fundamental, ou paradigma,
S2 —> R 2
Tabela 2.1
SEQÜÊNCIA COMUM DE REFLEXOS
- 44 -
Uma vez ou outra, esses reflexos têm sido chamados de involuntários, involuntário é um
termo histórico empregado para expressar grosseiramente a natureza automática e
eliciada de certos comportamentos. Desde a análise quantitativa de Sherrington sobre o
reflexo, o conceito original de eliciação tem sido bastante refinado. Parece criterioso,
assim, substituir.o mais velho e o mais vulgar dos termos “involuntário” pelo mais exato
“eliciado” , que compreende todas as leis do reflexo em sua definição. Essa substituição
eventual de um termo pobremente especificado, que, com freqüência, foi associado a um
quadro pré-científico de referência, é uma ocorrência comum e típica na ciência. Por
outro lado, algumas vezes, uma análise científica retem a velha palavra mas imprime-lhe
um significado novo e preciso. A ciência reteve do vernáculo as palavras força em física,
elemento em química e motivo em psicologia, mas tem mudado e expandido bastante os
seus significados. Mas não é sempre fácil separar as conotações de conceitos pré-
científicos e, algumas vezes, uma nova palavra ajuda na mudança conceituai. A velha
palavra, então, será deixada de lado para morrer lentamente pelo desuso. Tal é o caso da
palavra “involuntário” em psicologia.
- 45-
cada vez o resultado numénco das nossas operações de medida. Embora tenhamos siao
cuidadosos em bater no mesmo ponto cada vez, em chegar a posição original da perna e
em dar ao sujeito um descanso breve entre as pancadas, observamos contudo, que a
magnitude do respondente é 4,25 cm numa tentativa, 4,12 cm em outra, e 431 numa
terceira. Ficamos um tanto perdidos em relação a qual medida particular devemos relatar
como sendo o valor verdadeiro da magnitude do respondente a uma pancada de 70,00 g.
O que foi iniciado como uma simples tarefa tomou-se mais complicado do que
supúnhamos originalmente.
Suponha agora que decidamos fazer algum tipo de média de nossas medidas e chamar
essa média a magnitude do respondente a uma pancada de 70,00 g. Somamos nossos
valores
4,25
4,12
4,31
12,68
e, então, para dar a cada medida uma representação igual na média, dividimos pelo
número de medidas que temos, neste caso, 3. Obtemos o seguinte número 4.2266... uma
vez que não era possível originalmente ler nossa régua mais do que 0,10 arredondamos
nossa resposta para duas casas decimais, relatando a magnitude da flexão do joelho como
4,23 centímetros.
Mas considere agora o que realmente foi feito através de uma coisa simples como tirar
a m édia das m edidas. Com que base é-nos permitido somar os nossos valores
e dividir pelo número de medidas e chamar isso o valor ‘ verdadeiro”? Descobriremos
que a questão não é facilmente respondida. Porque não escolhemos, por exemplo, o
resultado intermediário entre todas as medidas como o "verdadeiro", neste caso 4,25 ?
Uma dificuldade ainda mais importante apresenta-se quando tentamos medir
novamente a flexão do joelho no dia seguinte e descobrimos que, embora nossas medidas
sejam novamente próximas umas das outras (digamos, 4,00, 4,25, 4,19), elas não são
exatamente os mesmos valores que os do dia anterior. Que números tomaremos agora
como o valor verdadeiro do respondente para 70,00 g? . Não somente os erros de medida
presentes, mas condições não controladas tais como temperatura, umidade e o quanto
nosso sujeito dormiu na noite anterior podem estar afetando nossas medidas. Não é
provável que possamos sempre controlar completamente todas as influências que têm um
efeito perturbador em nossas medidas. Somos forçados, por fim,a concluir que o valor
“verdadeiro” do respondente é apenas fictício e que não existe nenhuma operação para
descobrí-lo.
Na prática, naturalmente, a situação não é tão ruim quanto a tornamos aqui. De fato,
nossas medidas são todas razoavelmente próximas uma das outras e frequentemente
podemos computar apenas tal média, ou média aritmética. Uma vez tendo essa média
aritmética computada, podemos tomá-la como nossa melhor estimativa da magnitude do
respondente e considerar como irreal nossa procura de um e somente um valor
verdadeiro.
A média ou média aritmética é um dos conceitos mais primitivos da estatística
embora comum em todas as ciências. Este conceito torna possível a abstração de um
valor, a partir de um número de medidas repetidas, o qual é tomado para representar
todo o grupo de medidas. Então, podemos medir várias vezes o ponto de ebulição do
- 46-
álcool etílico e concluir que o ponto médio de ebulição é igual a 78°C. Ou, podemos
observar, durante uma hora, a freqüência de carros que atravessam uma ponte em
intervalos de 5 minutos sucessivos e concluir que a taxa média é igual a 31 carros por 5
min. Justificamos esta média apelando para certas propriedades gerais das medidas que
examinaremos agora.
A justificativa para o uso de uma média é melhor observada olhando-se de perto
algumas propriedades das medidas repetidas de R2- Suponha que obtivemos 20 valores
para a magnitude de R 2 , em centímetros, que são registrados na Tabela 2-2.
Tabela 2-2
MAGNITUDE DE RESPONDENTES DE FLEXIONAR O JOELHO, EM CENTÍME
TROS, EM 20 APLICAÇÕES SUCESSIVAS DE UMA PANCADA NO JOELHO
1 4,25
2 4,12
3 4,31
4 4,00
5 4,25
6 4,19
7 3,96
8 4,05
9 4,12
10 4; 19
11 3,88
12 4,25
13 4,19
14 4,19
15 4,12
16 4,05
17 4,31
18 4,44
19 4,20
20 3,92
Desejamos agora apresentar ou representar esses dados brutos numa forma que
revelará algumas de suas propriedades, à primeira vista. Para esse objetivo, a primeira
manipulação que frequentemente se mostra útil é agrupar as medidas em classes mais
amplas do que aquelas nas quais são originalmente dadas. Suponha que agrupemos os
resultados da Tabela 2-2 em categorias de décimos de centímetro. Então, poderíamos
estabelecer o grupo de categorias mostrado no lado esquerdo da Tabela 2-3. Essas
categorias têm uma faixa de um décimo de centímetro. Na Tabela 2-3 os números das
tentativas em que o respondente ocorreu numa dada categoria são colocados na coluna
do lado direito.
-4 7 -
A Tabela 2-3 reduz nossos dados a 7 categorias de 3,80 a 4,49. As 20 medidas
individuais iniciais foram reduzidas a 7 categorias de medidas. Perdemos alguma precisão
(4,00 não pode mais ser distinguido de 4,05 na Tabela 2-3), mas ganhamos alguma
economia na representação. O ganho não é grande com apenas 20 medidas originais, mas
seria muito grande se tivéssemos começado com 20.000.
Tabela 2-3
Um outro sumário útil poderia ser feito se nossos dados fossem mostrados
graficamente. Um número de esquemas visuais tem sido sugerido como auxilio na
representação de dados do tipo que temos aqui. Consideremos uma classe deles. É
possível, em primeiro lugar, espaçar regularmente os vários valores de nossos grupos de
medidas numa linha horizontal, chamada o eixo do x ou abscissa. Segundo, podemos
colocar uma linha vertical que intercepta a abscissa (chamada o eixo do V, ou ordenada)
para representar o número ou freqüência de medidas. Dessa maneira, se colocamos um x
para cada uma de nossas medidas em tal referência (chamada um sistema de coordenada
Cartesiana ou retangular) obteremos a representação pictorial da distribuição dos valores
vista na Fig. 2-5.
Alguns aspectos da Fig. 2-5 são de interesse particular. Primeiro, notamos que exis
tem exatamente 20 X. Então, cada medida aparece como um único X na Fig. 2-5 e o
número total de X é o número de medidas tomadas.
Um segundo aspecto da Fig. 2-5 é a sua forma. Parece avolumar-se em volta de um
valor central e ser grosseiramente simétrica. Essa característica de muitas medidas
repetidas justifica o uso de um único valor médio para resumir todo o grupo de medidas.
Atrás desse valor “médio” , tacitamente se esconde uma figura mais ou menos como a
Fig. 2-5. Diz-se que o número que indica o valor prevalente de uma distribuição de
freqüência, tal como a Fig. 2-5, representa um índice da chamada tendência central da
distribuição. Mas podemos notar que existem várias possibilidades de escolha para índices
- 48-
de tendência central. Dessas, uma simples seria escolher a categoria contendo maior
freqüência (maior número de X). Quando se escolhe o valor da tendência central dessa
Ordenada
TItíJ 10
t Moda
Figura 2-5. Medidas hipotéticas da .o r
o X
flexão do joelho (categorizadas em n X
décimos de centím etro) representa V X
c XX
das como uma distribuição de fre
qüência num sistema de coordenadas XXX
XX XXX
retangulares. X X X X X X X. - Abscissa
1.0 2.0
Magnitude da flexão do joelho
(centímetros)
-49 -
3,50 4 ,5 0
Magnitude da flexão do joelho
(centímetros)
Figura 2-6. Mais duas representações de
distribuições de freqüência (A) como
histogram a e (B) como polígono de
freqüência. Os dados são derivados da
Figura 2-5.
Magnitude de R 2
pode ser calculada, descobrindo-se a maior (em nossos dados originais do reflexo 4,44) e
subtraindo desta o menor escore obtido, 3,88. Com tais dados à mão, a operação resulta
num valor 4,44 — 3,88 = 0, 56. Tal estatística é chamada amplitude da distribuição. A
amplitude é fácil de ser calculada, mas não é tão útil como desejaríamos. Sua dificuldade
é que uma única medida muito extrema muda-a drasticamente. Por essa razão, preferimos
dizer que a amplitude é uma estatística que não tem estabilidade.
Outra medida mais sofisticada da dispersão de uma distribuição é possível,
aproximando-se, em primeiro lugar, os dados resumidos pelas Figs. 2-5 e 2-6 com o tipo
de curvas matematicamente suaves, em forma de sino, vistas na Fig. 2-7. Essas curvas
suaves são simétricas e são chamadas curvas normais. O estudante curioso pode muito
bem estar interessado em saber como essas curvas suaves da Fig. 2-7 foram descobertas,
mas infelizmente sua derivação matemática não pode ser tratada aqui. Devemos nos
contentar em dizer que elas parecem aproximar, razoavelmente bem, muitos tipos de
medidas repetidas, das quais nossa magnitude do respondente é uma. Um índice
adequado para a dispersão ou variabilidade pode ser encontrado através do exame
acurado da forma das duas curvas da Fig. 2-7. Se iniciamos no extremo mais à esquerda
de cada curva, devemos observar que, inicialmente, a curva é côncava crescente. Então,
para ambas as distribuições, a curva passa através de uma região em que é quase uma
linha reta. Finalmente, continuando em direção à direita, as curvas adquirem uma forma
côncava decrescente, alcançando eventualmente, um máximo no ponto rotulado de
média. Já que essas curvas normais são simétricas, uma análise correspondente pode ser
feita iniciando-se na extremidade direita e movendo-se para a esquerda. Os dois pontos
simétricos em que as curvas mudam de concavidade crescente para concavidade
decrescente são chamados os pontos de inflexão e estão localizados nas setas horizontais
na Fig. 2-7. Esses pontos localizados tomam-se bons marcos para caracterizar a dispersão
das distribuições (compare a distância entre os dois grupos de setas da Fig. 2-7 colocados
nesses pontos). E, embora sejam difícies para um julgamento a òlho nú, não é difícil
calculá-los a partir de medidas reais.
Deveria ser notado que os pontos de inflexão estão relacionados à média da
distribuição, tal que quanto maior dispersão de uma curva normal, tanto mais dis
tante da média estão esses pontos. Em outras palavras, quanto maior a dispersão, mais
os pontos de inflexão serão desviados da média. Essa idéia de desvio está incluída
no nome usualmente dado aos pontos de inflexão da curva normal, os pontos de
desvio padrão. O desvio padrão (abreviado 0 , ou sigma) é a distância da média a qual
quer um dos pontos de inflexão. A grande vantagem desses pontos como índices de
dispersão da distribuição sobre outras medidas (por exemplo a amplitude) é que eles
dividem a distribuição normal de uma maneira extremamente útil, como é visto na
Fig. 2-8. Em particular, o resultado é que para dados que podem ser aproximados
por uma curva normal, cerca de 34 por cento das medidas cairão na região entre
—1 O e a média; e cerca de 34 por cento cairão na região + 1 O e a média. Assim, cerca,
de 68 por cento das medidas estarão contidas dentro da média de 1 10. Similarmente,
cerca de 95 por cento estarão contidas dentro de í_ 2 Qe acima de 99 por cento dentro
de± 3Q. Então, existe uma relação bastante exata entre o desvio padrão e a percentagem
de medidas a serem encontradas nas diferentes regiões da curva, um fato não verdadeiro
para a amplitude ou outras medidas comuns de variabilidade. Métodos de computação
para estimar qualquer grupo de medidas são encontrados em numerosos textos ele
mentares de estatísticas e não serão descritos aqui.
- 51 -
Figura 2-8. Curva normal dividida por seu desvio padrão, mostrando a porcentagem de
medidas contidas em cada região.
Transformações para distribuições de freqüência relativa. Uma transformação muito
útil e simples é frequentemente feita nas medidas originais quando se lida com
distribuições. Em vez de se fazer diretamente gráficos do número real de eventos numa
dada categoria, frequentemente divide-se o número observado numa dada categoria pelo
número total de medidas que se tem. O resultado dessa operação é sempre um número
menor do que ou igual a 1, que é chamado a freqüência relativa desta categoria. Por
exemplo, com referência à Tabela 2-3, podemos dividir o número total de medidas na
categoria 4,20 - 4,29 (4) pelo número total de medidas (20) e obteremos 4/20 - 0,2, a
freqüência relativa nessa categoria particular. Uma maneira útil de pensar sobre a
freqüência relativa é considerá-la como a proporção das medidas totais que ocorrem
numa dada categoçia. Se multiplicarmos este número por 100, obtemos a percentagem de
todas as medidas que caem na categoria particular. Um grupo de tais percentagens, ou
freqüências relativas, fornece-nos uma maneira conveniente para comparar duas
distribuições quando o número total de medidas em cada uma não é necessariamente o
mesmo. Note que a curva da distribuição de freqiência relativa ou de distribuição de
percentagem tem o mesmo modelo, ou forma, que a curva de distribuição das freqüências
reais observadas da qual ela foi derivada.
EXERCÍCIO 1: Transforme a distribuição da Fig. 2-5 numa distribuição de freqüência
relativa.
-52 -
Capítulo 3 - CONDICIONAMENTO PAVLOVIANO
Por volta de 1903, PAVLOV, fisiologista russo, interessou-se pelo fenômeno que
primeiro chamou de “ secreções psíquicas’.. Pavlov descreve o ponto de partida de suas
pesquisas na seguinte citação:
Desde o início, estava claro para Pavlov que algum tipo de associação entre o reflexo
salivar S2 —> R 2 e eventos arbitrários como vasilhas de alimento e ruído de passos era
responsável pela capacidade destes evocarem “secreções psíquicas” . A primeira e mais
importante contribuição de Pavlov para a ciência do comportamento foi sua descrição e
elaboração das condições necessárias e suficientes para essa associação. Através de um
estudo sistemático do respondente salivar de cães, Pavlov descobriu que, se qualquer
mudança ambiental arbitrária (digamos. S j) precedia direta e exatamente o reflexo
eliciador de salivação, S] poderia por si só vir a produzir a salivação.
-5 3 -
Figura 3-1. Representação de uma situação Pavloviana para
condicionar a resposta salivar num cão (Paviov, 1928).
“Em primeiro lugar, familiariza-se um cão normal com a situação experimental até
que não apresente nenhum distúrbio quando colocado em arreios e deixado sozinho
numa sala especialmente construída para eliminar estímulos indesejáveis externos.
Uma pequena abertura ou fistula é feita na pele da mandíbula, perto do conduto de
uma das glândulas salivares. Quando a fistula cicatriza, um tubo de vidro é cuidado
samente cimentado externamente na fistula de modo a drenar a saliva sempre que a
glândula for ativada. Do funil, a saliva então flui para um vidro ou cai, gota a gota,
numa plataforma de registro levemente equilibrada. A magnitude das respostas aos
vários estímulos pode ser medida pelo volume total ou número de gotas secretadas
numá dada unidade de tempo. O experimentador, que fica sentado numa sala ad
jacente, pode fazer suas medidas, aplicar os estímulos desejados (incluindo alimento)
e observar o comportamento do cão através de uma janela” (Keller e Schoenfeld,
1950, pp. 16-17).
- 54 -
Tahela 3-1
TEMPO DECORRIDO
ENTRE O APARECIMENTO
DO TOM E A
NÚMERO DE EMPARELHAMENTOS GOTAS DE SALIVAÇÃO SUBSEQUENTE
PRÉVIOS DE ALIMENTO-TOM SALIVA (SEGUNDOS)
X Y Z
1 0
10 6 18
20 20 9
30 60 2
40 62 1
50 59 2
-5 5 -
chamar os primeiros de ‘reflexos da espécie", uma vez que são característicos das
espécies e os últimos de ‘reflexos do indivíduo’, já que eles variam de animal para
animal numa mesma espécie, e no mesmo animal variam em ocasiões diferentes e sob
diferentes condições” (Pavlov, 1927, p. 25).
Si
S2 -> R 2
CR [3-11
- 56-
Note certas características de tal paradigma. O Dado frequentemente contém umo
descrição do estado comportamental anterior ao Procedimento. Aqui,é necessário ter-se
dois eliciadores, ou dois reflexos intactos, antes que se possa começar. O Procedimento é
uma descrição suscinta do que os experimentadores fazem. (Notaremos, com freqüência,
que é útil representar o aspecto do procedimento de nossos paradigmas comportamentais
através de símbolos). O Processo diz brevemente o que acontece no tempo com os
aspectos significativos do comportamento, à medida que aplicamos o nosso proce
dimento. Uma descrição de um processo compor tamental adquire, tipicamente, a forma
de um gráfico, com o tempo no eixo horizontal (X) e alguma propriedade do compor
tamento do organismo no eixo vertical (Y). Discutiremos isso mais completamente numa
seção posterior. Finalmente, o Resultado é o estado final do processo. Quando o compor
tamento cessou de mudar significantemente sob o determinado procedimento, o resul
tado foi alcançado. Nas subseções seguintes, elaboraremos alguns dos mais importantes
aspectos do paradigma pavloviano.
A reiaçáo de CR com R2. Podemos considerar um acidente histórico o fato de Pavlov
iniciar sua pesquisa sobre o condicionamento com um reflexo que gerava uma CR muito
semelhante àR2,incondicionada. Tanto CR como R 2 envolvem a produção de secreção
das glândulas salivares. Realmente, não é provável que o observador casual detecte qual
quer diferença entre a salivação condicionada e a incondicionada. A similaridade entre
CR e R 2 no reflexo salivar é, provavelmente, responsável pela crença geral, perpetuada
até aos tempos modernos, de que CR é R2- Mas Pavlov sabia que isto não era verdade.
Não somente a magnitude de CR era diferente de R 2 , mas a composição química real da
saliva diferia entre CR e R 2 . Pavlov preferiu ignorar as diferenças entre CR e R2 e se
concentrar nas similaridades. Isto é frequentemente uma estrategia segura na pesquisa
científica preliminar Foi o gênio de Galileu que o permitiu ignorar as pequenas dife
renças na velocidade de queda de objetos leves e pesados em favor de uma teoria que os
idealizava caindo na mesma velocidade. Ele fez isso em face de uma teoria bem esta
belecida da natureza que exigia exatamente a conclusão oposta. Ao formular um
princípio teórico que afirmava ser CR = R 2 , Pavlov estava empregando a estratégia de
Galileu de ignorar pequenas diferenças. S i,ele supòs, passa a eliciar o respondente de S2
como um resultado de seu emparelhamento com S2-
P^sse princípio, conhecido como o princípio de substituição de estímulo (Sj substitui
S2 ), tinhauma grande atração em termos de suas aparentes (1) generalidade, (2) sim
plicidade, e (3) capacidade para explicar outros fenômenos. Uma vez que estes aspectos
são característicos dos nossos melhores conceitos na ciência, não é surpreendente que o
princípiode substituição de estímulo fosse adotado por John Watson e outros primeiros
behavioristascomo base paraexplicar todo comportamento. Na substituição de estímulo
eles pensavam ver o mecanismo subjacente aos padrões complexos de comportamentos
aprendidos e hábitos compostos. Consideremos o programa arrojado de Watson para'uma
análise experimental do comportamento: “dado o estímulo, podemos predizer a resposta;
iada a resposta, podemos predizer o estímulo” .Neste quadro de referência era natural
considerar a ligação dos novos estímulos com as velhas respostas (substituição de
estímulo) como um princípio poderoso para criar novas seqüências de comportamento.
Watson acreditava que o comportamento complexo humano e animal representava o
embasamento e a composição de reflexos condicionados. Devido à importância teórica da
substituição de estímulo nas teorias de Pavlov e Watson, os pesquisadores posteriores
ignoraram as diferenças entre CRs e &2S Por algum tempo. Contudo, por duas razões, o
princípio da substituição, de Pavlov, não resistiu ao teste do tempo.
-5 7 -
(1) Embora Watson propusesse que todo comportamento poderia ser visto como
uma interação e composição de reflexos condicionados, a proposição não conduziu a
novas formas poderosas de prever e controlar o comportamento. O teste de todos os
conceitos científicos é o seu emprego na previsão, controle e organização da matéria prima
da natureza. No início, a substituição de estímulo parecia ser útil para ordenar o
comportamento, mas à medida que os anos se passavam ela permanecia estéril na previsão
e controle. Mesmo os homens que o haviam empregado muito entusiasticamente
começaram a duvidar de sua natureza fundamental. Eventualmente, com uma nova ex
ploração da lei do efeito de Thorndike, tornou-se claro que grande parte do com
portamento não cabia dentro do modelo Pavloviano. Mas esta é uma história que fica
para o próximo capítulo.
(2): À medida que dispunha de mais e mais informações sobre o condicionamento
descobriram-se casos em que a CR era apenas ligeiramente diferente de R2 mas, em
alguns casos era exatamente o oposto. Um experimento realizado por Notterman,
Schoenfeld e Bersh (1952) empregando sujeitos humanos é ilustrativo. No seu estudo, S]
era um tom audível e S2 um choque elétrico suave, liberado na mão esquerda do sujeito.
Esses pesquisadores mediram a taxa cardíaca respondente com um aparelho um pouco
diferente do conhecido como um eletrocardiógrafo familiar em muitos consultórios
médicos. Em vez de manter seus sujeitos numa situação pavloviana (Fig. 3-1), eles
sentaram-nos em cadeiras comuns, instruindo-os para permanecerem tão quietos quanto
possível por cerca de 90 min. Durante este período, os experimentadores registravam a
taxa cardíaca de seus sujeitos enquanto apresentavam tons e choques. Notterman,
Schoenfeld e Bersh encontraram evidência clara de uma taxa cardíaca (CR) depois de 11
emparelhamentos de choque e tom. Todavia, enquanto a resposta incondicionada ao
choque (R 2 ) era uma aceleração da taxa cardíaca, a resposta condicionada (CR) envolvia
uma diminuição dessa taxa. Embora um trabalho posterior (Zeaman e Smith, 1965)
mostre que as diferenças entre CR e R2 na taxa cardíaca estão estritamente relacionadas
a diferenças respiratórias correspondentes, a disparidade entre as formas dos
comportamentos condicionado e incondicionado permanece.
Exemplos extremos como este levaram-nos a ver de uma forma diferente o
condicionamento pavloviano ou clássico. Em quase todos os casos de uma suposta
substituição de estímulo, existem diferenças marcantes entre CR e R2- Em muitos casos,
elas estavam ocultas devido as medidas grosseiras tomadas quando os pesquisadores
estavam somente interessados no condicionamento como um fenômeno de substituição.
Abreve história da substituição de estímulo é exemplo interessante do crescimento
contínuo da ciência. Um conceito pode influenciar por alguns anos ou décadas porque
parece fornecer comorto intelectual e prometer a ordem da natureza. Mas, a menos que
cumpra a sua promessa, eventualmente, ele dará lugar ao peso da evidencia experimental.
Durante seus dias de glória, todavia, tal conceito pode dirigir pesquisas de maneiras que
efetivamente colocam vendas nos cientistas em relação a fraqueza do conceito. É quase
como se, para dar ao conceito uma “chance”, ignoremos por um tempo, certas discre-
pâncias, certa indeterminação em sua definição. Essa permissividade temporária no
estágio inicial da exploração é justificada a longo prazo porque muitos de nossos con
ceitos bem estabelecidos passaram através de tal iniciação e emergiram fortes e lógicos
por causa dela. O próprio reflexo é um bom exemplo disso, e assim são muitos conceitos
da ciência física que sobreviveram ao teste do tempo.
— 58 —
A importância do Reflexo S \ ---- > R i Pavlov sugeriu que S \ -----> R \ deveria ser
um reflexo “biologicamente mais fraco” do que S2 ---- > R2 para que o con
dicionamento clássico ocorresse. A noção “de fraqueza biológica” não está inteiramente
clara. Presumivelmente, é uma maneira de dizer que, se as energias de S \ e S2 fossem de
algum modo igualadas, então R \ seria sempre menor ou ocorreria menos frequentemente
do que R 2 . Um fato relacionado que Pavlov enfatizou foi que o condicionamento é maií
fácil de ser observado (embora não necessariamente mais fácil de ser obtido) quando S]
não elicia inicialmente R2 - Deveria estar claro que, se S \ elicia R2 antes do condiciona
mento, então o efeito do emparelhamento de Sj e S2 pode ficar obscuro. Assim, na
maioria dos experimentos de condicionamento, toma-se o cuidado de selecionar um Si
que não tenha a capacidade original de eliciar R 2 - Diz-se que tal S] é neutro com
respeito a R 2 - Um S \ neutro é especialmente desejável se, durante o condicionamento,
vamos procurar pela CR no mesmo lugar onde observamos R 2 . Contudo, a neutralidade
inicial de S\ em relação a R2 não é um aspecto necessário para a ocorrência do condi
cionamento clássico, como Long (1941) demonstrou algum tempo atrás. Num dos ex
perimentos de Long, um tom de 1/7 seg. de duração foi usado como S\ e um breve
flash de luz como S2 . Em ambos os casos, o respondente de piscar os olhos em sujei
tos humanos foi medido. Tanto a luz como o tom eliciava o piscar desde o inicia Mas
depois dos emparelhamentos, o S] tom sozinho, passou a eliciar duas piscadas suces
sivas. A Fig. 3-2 dá um exemplo de um dos registros de Long quando S] era
apresentado.
- 59 -
de comportamentos diferentes, dependendo das várias histórias passadas de emparelha-
mento com S2 s diferentes. Este resultado pode ser representado diagramaticamente
como
R
CR'
S, CR” [3.2]
CR
\ •
etc.
Assim, um tom emparelhado independentemente com um choque, uma luz e alimento
pode simultaneamente evocar CRs de mudanças na taxa cardíaca, piscar de olho e
salivação, respectivamente. Essa constelação inteira de comportamentos evocados por um
unico estimulo pode ter importância para o nosso estudo da emoção como veremos num
capítulo posterior. Naturalmente, deveria ser enfatizado que, no Diagrama 13-21 Rj é
um sumário de todos os comportamentos inicialmente eliciados por Si - Embora fre
quentemente limitemos nossas discussões sobre o condicionamento a uma ou duas res
postas, o condicionamento é um fenômeno que invade todo o sistema compor tamental
de um indivíduo. Quando examinamos uma única resposta em detalhe, assim o fazemos
porque julgamo-la representativa do que está ocorrendo em geral no sistema de resposta e
não porque seja tudo o que está ocorrendo. Tentar pesquisar o sistema total de uma vez
nos sobrecarregaria com detalhes não controláveis. Tomamos uma amostra representativa
e tentamos explorá-la em profundidade. Essa é outra estratégia de pesquisa que tem tido
sucesso na pesquisa científica embora tal sucesso evidentemente, dependa de quanta sorte
temos ao escolher uma amostra que seja realmente representativa de um fenômeno em
geral. O fato de que a CR e R 2 salivar sejam tao semelhantes e tão dominantes no caso
de Pavlov sugere a possibilidade de que a sua amostra não fosse tão representativa como
ele poderia té-lo desejado.
É S -|-----> CR um "Novo Reflexo"? No velho princípio de substituição,
S] ---- > R 2 era visto como o novo reflexo “condicionado” . Embora possamos preferir
representar os efeitos do condicionamento clássico como a formação de uma CR para S 1
ainda temos de encarar a questão sistemática de se S \ — > CR é um reflexo, ou um outro
tipo de correlação estímulo resposta. Existe muito pouca evidência experimental dispo
nível que trata do assunto, mas o pouco que temos indica que ele não é de fato um
reflexo verdadeiro.
Em primeiro lugar, aumentos na intensidade de S\ não resultam em aumentos na
magnitude de CR, ou em decréscimos na sua latência. Ao contrário, o máximo de
magnitude de CR e sua latência mínima são obtidos com o valor exato de S\ empregado
no condicionamerto (Mostofsky, 1965). Valores mais ou menos intensos resultam em
CRs mais fracas. Por outio lado, lembremo-nos do Capítulo 2 onde foi dito que as leis de
magnitude *: latência do reflexo especificam uma simples proporcionalidade entre a
intensidade de S2 e a força de R 2 -
- 60 -
Segundo, a laténcia da CR adquirida para S \ é geralmente mais longa do que a
latência dos respondentes (R is) associados com aquele mesmo S i . Isto pode ser demons
trado atrave's do emparelhamento de uma luz (S \) com uma corrente de ar na pálpebra
(S2 ). Originalmente, tanto Si como S2 eliciam o piscar de olho. Como resultado do
emparelhamento, Si passa a evocar duas piscadas de olho distintas, uma R i seguida por
uma CR. Usando esse procedimento com sujeitos humanos, Grant e Norris (1947) iden
tificaram várias regiões modais de latência, como mostra o histograma da Fig. 3-3. Esses
Latência (milisegundos)
Figura 3-3. Distribuição da latência de todas as respostas de piscar o olho eliciadas por
uma luz forte no curso de um experimento de condicionamento com sujeitos humanos
(segundo Grant e Norris, 1947).
61
Este reflexo foi omtido após
s S i ----- CR ter sido formado.
................
j s2 ------------ *- R* J
Figura 3-4. Procedimento de Ordem ---------------------- J
Frolov para estabelecer o
condicionamento de segunda
ordem. I) S i— -------- R|
^C R '
II) S0 ^ -------- - R 0
S, XI S,
S, JZL S, rz L
(A) “Sim ultâneo” Figura 3-5. Algumas relações (B) Retardo
temporais possíveis entre S j
e S 2 no condicionamento
Si
clássico.
s, ___EL_
S, St
(C) Traço (D) Retroativo
-6 2 -
O primeiro caso (A) talvez seja o tipo mais comum e é referido na literatura de
condicionamento como condicionamento “simultâneo” . O S i é curto e seu aparecimento
ocorre cerca de 1/2 seg. antes de S2 . Na Fig. 3-5A, S\ termina antes de S2 ; todavia Si
pode ultrapassar S2 sem alterar os resultados. Outro procedimento temporal empregado
no condicionamento clássico é visto na Fig. 3-5B. O Si é iniciado antes de S2 e per
manece por um intervalo de tempo considerável. Quase no final de S j, S 2 é apresentado.
Este é chamado um procedimento de retardo.Étambém possível, sob as condições de
Pavlov, obter-se CRs com retardos até de vários minutos. O caso ilustrado na Fig. 3-5C é
semelhante ao condicionamento “simultâneo” exceto que S\ é apresentado mais cedo e
termina antes da apresentação de S2 . Este é o procedimento que Frolov usou em seu
experimento de segunda ordem. Este caso é referido como um procedimento de traço, na
suposição de que um “traço” de S\ permanece no sistema nervoso do organismo depois
que S] termina. Se o tempo entre S\ e S2 não for muito grande (uns poucos minutos) é
possível se formar CRs para S\ através do procedimento de traço.
Quão longo pode ser o tempo entre S] e S2 antes que o condicionamento se torne
impossível? Nenhumá resposta geral é possível, pois isto depende do reflexo particular
S2 — R2 , das intensidades de S\ e $2 e de muitos outros fatores. Uma questão
relacionada é mais fácil de ser respondida: qual é o intervalo ótimo entre o aparecimento
de S\ e o aparecimento de S2 ? Isto é, que intervalo permite asCRsmais consistentes?Um
estudo realizado por Wolfle (1932) usando a retração do dedo a um choque elétrico
como S2 ---- ^ -R 2 gerou a curva vista na Fig 3-6. Note que a percentagem máxima de
CRs ocorreu em
o
•8 «I
c O
(Xíca de 1/2 segundo e esse valor é frequentemente tido como sendo o intervalo ótimo de
S i ------ S2 . Poucas CRs foram registradas em 0 seg. (simultaneidade verdadeira). Os
valores negativos do intervalo S i ----- S2 (aqueles a esquerda de 0 na Fig. 3-6) apresen
tam algum interesse teórico. Eles representam o caso (visto na Fig. 3-5D) em que S\ vem
-6 3 -
depois (!) de S2 - Esse é o procedimento chamado de condicionamento retroativo. Con
corda-se atualmente que o procedimento de condicic. jnento retroativo não resulta na
formação de uma nova CR para S\ e a Fig. 3-6 apoia este ponto de vista. Da nossa análise
na seção anterior, poderíamos esperar, todavia, que S2 (agora o primeiro estímulo)
adquirisse uma CR. Embora tal resultado não seja consistente com a noção de Pavlov de
que o estímulo anterior deva pertencer a um reflexo biologicamente mais fraco ele seria
compatível com uma análise do condicionamento clássico puramente em termos de
relações temporais entre estímulos.
Um procedimento final, não visto na Fig. 3-5, ocorre quando S2 é apresentado
periodicamente sozinho, sem qualquer Si . Num experimento, Pavlov alimentou um cão
regularmente em cada 30 min. Nenhuma mudança de estímulo precedia a alimentação.
Quando esta rotina de alimentação estava bem estabelecida, o alimento foi totalmente
retirado, medindo-se os efeitos. Sob essas condições observou-se que a salivação
começava aproximadamente no fim do período de 30 min, o período em que o alimento
normalmente viria. Pavlov chamou esse procedimento de condicionamento de temporal
com base na analogia de que o intervalo de tempo desde a alimentação anterior
passava a atuar, de alguma forma, como um S\.
-6 4 -
uma pancada no tendão patelar. É possível que esses pesquisadores estivessem procuran
do por uma CR muito parecida com a R2 , original. O condicionamento clássico pode ter
sido algo distorcido por muitos anos devido a procura de CRs somente ao longo de
dimensões mais óbvias de R 2 - O fato é que podem existir CRs em dimensões compor-
tamentais diferentes de R2 - Realmente, é bem conhecido que o condicionamento clássico
é um fenômeno que invade muitos aspectos do sistema comportamental de resposta do
organismo. Moore e Marcuse (1945) mostraram que quando vários sistemas compor-
tamentais são examinados, as CRs são vistas mais claramente em alguns desses (como
respiração, salivação e taxa cardíaca) do que em outros (atividade motora ou geral). A
Fig 3-7, um dos registros de Moore e Marcuse, tomados de um porco colocado num
arreio Pavloviano e previamente sujeito a tons (S i) emparelhados com biscoitos (S 2 ) é
ilustrativa.
Coração __________________________________________
A lim entação________________________ ___________________
Tom (480 )
A lim e n to ----------------------------------------*-------------------------------------------- ----- .
Tempo (seg.^.................. - ............... -...... -.....-............................ -........ -
— 65 —
para a compreensão do comportamento. O fato de que nossas emoções pareçam seguir as
leis de Pavlov, ao invés ua lei do efeito de Thorndike fornece um indício da possível
importância do condicionamento clássico. Em vez de serem as unidades de compor
tamento aprendido como Watson concebeu, pode ser que os estados emocionais
classicamente condicionados acompanhem e sejam mesmo essenciais para a manutenção
de muitos de nossos padrões de comportamento. Mas, no momento, isso é uma mera
especularão e uma apresentação mais detalhada deve esperar um capitulo posterior.
-6 6 -
mudam drasticamente, elas alteram as propriedades do reflexo. A idade do animal, sua
saúde e o grau de privação de alimento são influências semelhantes. O melhor que
podemos fazer é mantê-las tão constantes quanto possível durante o curso do experi
mento. Este é, então, um segundo significado de um experimento controlado: mantemos
constantes muitas influências no nosso fenômeno em questão.
60-
ct
•Í5
1
•8 40 -
BO
O
20-
-6 7 -
Suponha que tentemos representar nossas variáveis e nossos resultados num sistema
de coordenada retangular bidimensional como na Fig. 3-8. Designamos a variável
independente para o eixo horizontal (eixo do X) e a variável dependente para o eixo
vertical (eixo do Y). (Essa localização da variável dependente é exatamente oposta aquela
de um histograma. Ver Fig. 2-6.) Várias propriedades da Fig. 3-8 são interessantes de se
notar. (1) Sempre damos aos nossos eixos rótulos informativos descrevendo nossas
variáveis. (2) Marcamos distâncias iguais nos eixos e fazemos com que essas distâncias
representem aumentos iguais de nossas variáveis. (3) As escalas dos eixos (X) e (Y) não
precisam ser as mesmas. (4) O zero coincide para ambos os eixos onde as linhas
coordenadas se encontram no ponto chamado de origem.
80
>< 60
a
.fe
13
40
20
10 20 30 40 50
Número de emparelhamentos sucessivos X
O último passo é conectar os pontos com linhas retas. Com esta operação, obtemos a
Fig. 3-10, que chamamos a curva ou função que relaciona o número de gotas de saliva ao
número de emparelhamentos prévios alimento-tom, numa faixa da variável independente
que varia de 0 a 60 emparelhamentos. A forma de tais curvas ou funções é de algum
in tere sse . No p re sen te caso, vemos que além do ponto que representa 30
emparelhamentos não ocorre muita mudança na variável dependente. Quando uma
função alcança um valor limite em torno do qual flutua daí em diante, dizemos que
alcançou a assíntota. Presumivelmente, mesmo que quiséssemos continuar com milhares
de emparelhamentos adicionais, obteríamos, aproximadamente, apenas 60 gotas em cada
teste.
-6 8 -
Linha assintótica
>
73
oo
a>
T3
ão
OD
- 69 -
3.6 - INTRODUÇÃO AOS CONCEITOS ELEMENTARES DE PROBABILIDADE
Muitas das coisas que os psicólogos registram e observam ocorrem aquém da certeza
perfeita, mesmo quando todas as condições de experimentação e observação são tão
cuidadosamente controladas quanto possível. Por exemplo, em qualquer tentativa teste
antes de assíntota de aquisição ser atingida, a apresentação do S\ no experimento de
Anrep (ver figura 3-4) poderia não ter gerado nenhuma CR. Se imaginarmos qualquer
tentativa teste realizada antes da assíntota, teríamos de admitir que haveria uma
incerteza muito real ligada à predição de se ou não qualquer CR ocorreria para S\.
Naturalmente, à medida que o número de tentativas prossegue, a incerteza diminui
Diz-se que um respondente condicionado está complementamente adquirido quando suas
chances de ocorrer depois de S\ tom aram-se certas ao máximo. O que é verdadeiro para
os reflexos condicionados é verdadeiro para muitos outros eventos comportamentais e
não comportamentais. Algumas vezes, uma pessoa comerá o que é colocado diante dela,
outras vezes não. Algumas vezes, um trem chegará atrasado; algumas vezes, chegará
pontualmente. O que gostaríamos de ter seria uma régua ou um instrumento de medida
com o qual pudessemos representar e comparar, de uma maneira precisa, a certeza de
eventos tais como CRs, comer sobremesas, chegada de trem. Felizmente, encontramos
este instrumento no conceito matemático de probabilidade. Para o presente objetivo,
consideraremos a probabilidade de um evento como um número que podemos associar a
este evento, um número que caracterizará a certeza relativa do evento sob condições bem
definidas de observação.
A fim de determinar esse número para um evento, devemos primeiro estabelecer um
grupo de condições padrão sob o qual iremos procurar pelo evento. Um dos tipos de
condições padrão envolve uma certa operação (procedimento) que executamos tal como
jogar uma moeda, apresentar um S{ ou ordenhar uma vaca. Num segundo tipo as
condições padrão são estabelecidas pela natureza e meramente fazemos nossas obser
vações em ocasiões definidas. Assim, podemos observar se o trem local das 7h34min.
chega ou não pontualmente, ou podemos observar o número de carros que cruza a ponte
George Washington numa determinada hora. Por conveniência, daqui em diante referir-
nos-emos a qualquer tipo de condições padrão de observação simplesmente como a
observação padrão.
Denominaremos de resultados os eventos de interesse que surgem quando fazemos as
observações padrão. Por exemplo, ao apresentar um estímulo e procurar por um res
pondente (uma observação padrão), podemos observar a ocorrência de uma flexão do
joelho (um resultado). Ao atirar uma moeda, podemos estar interessados na ocorrência
de “cara” (um resultado). Em geral, sempre que a ocorrência de um determinado evento
ou resultado não é perfeitamente certa, isto pode significar que, ao se fazer a observação
padrão algum outro evento ocorreu, evento este diferente daquele no qual estávamos
principalmente interessados. Assim, se estivéssemos interessados no evento “cara” ao
jogar uma moeda, o evento “coroa” seria aquele que ocorre sempre que o evento “cara”
não ocorre. Para aplicar as noções de probabilidade deveremos classificar todos os resul
tados possíveis de uma observação padrão.
No caso de uma moeda de dois lados, os resultados possíveis são óbvios. Mas quantos
resultados possíveis poderiam resultar da observação de carros ou da ordenhação de uma
vaca? Nesses casos, seria útil classificar o grande número de possibilidades em um
-7 0 -
número fixo e pequeno de categorias. Por exemplo, ao medir a produção de leite
podemos achar conveniente preocuparmo-nos apenas com o fato de se Mimosa dará 0 —
0 — 21, 2 — 41 ou mais do que 41 toda manhã, ao ser ordenhada. A ordenha é a
observação padrão e quebramos arbitrariamente os eventos possíveis em apenas três
resultados. Parece que esse é um procedimento arbitrário e que poderíamos ter escolhido
dois (algum leite ou nenhum leite), ou mais do que três resultados, estabelecendo mais
categorias. Nos experimentos de condicionamento, quase sempre perguntamos se uma
resposta condicionada é ou não observada após cada apresentação de um estímulo. Aqui,
a observação padrão é a apresentação de um estímulo e existem dois resultados — uma
resposta de nenhuma resposta. Mas poderíamos escolher uma característica da resposta
para examinar (digamos, sua magnitude) e categorizá-la tal como fizemos com a
quantidade de leite produzido pela manhã. O ponto importante de todas essas
classificações é que elas nos permitem tomar cada resultado real da observação padrão e
classificá-lo em uma ou outra categoria de resultado.
Uma vez fixadas quais as categorias de resultado que nossa observação padrão deve
ter, seguimos adiante. Nosso próximo passo para medir a certeza de qualquer resultado
particular pode consistir em se fazer a observação padrão algumas vezes a fim de se obter
uma idéia de quão frequentemente o resultado em questão ocorrerá em relação a outros
Figura 3-11. Razáo de freqüência de “ caras” numa seqüência de atirar uma moeda.
Note a escala comprimida (logarítmica) do eixo horizontal. (Cramér, 1955).
- 71
vezes. Se tomarmos agora a razão entre a freqüência dos resultados observados do evento
em questão, e a freqüência total de resultados observados, obteremos um número entre 0
e 1. Este número dos dá alguma noção da certeza do evento em questão. Assim, a
razão da freqüência de caras no total de eventos de atirar moedas é 53/100 = 0,53.
Analogamente, a razão da freqüência de CRs nas apresentações de S\ ê 45/50 = 0,90.
Desses exemplos deveria ficar claro que as razões de freqüência podem ser calculadas
sempre que tivermos obtido freqüências de determinados eventos e freqüências de
todos os eventos. A idéia de uma razão de freqüência nos aproxima muito do nosso
índice desejado de certeza. Mas uma outra característica da razão de freqüência deve ser
notada. Uma razão de freqüência está sujeita aos erros usuais de medidas discutidas na
seção 2.6. Isto é, as razões de freqüência observadas variarão de algum modo em blocos
diferentes de observações padrão. Mas, a medida que fazemos mais e mais observações
padrão, algo interessante ocorre com a razão de freqüência: ela tende assintoticamente a
se aproximar de um valor limite. A Fig. 3-11 mostra como isto acontece quando jogamos
uma moeda e observamos os valores da razão de freqüência de ‘ caras ’, à medida que se
faz mais e mais observações padrão. Evidentemente, estamos chegando cada vez mais
perto de uma assíntota^ neste caso 0,50. A assíntota de uma razão de freqüência é
definida como a probabilidade do evento.
A faixa de variação desse número que chamamos probabilidade é de 0 a 1. Uma
probabilidade 0 indica que nunca em qualquer observação padrão anterior, o evento em
questão foi observado. Geralmente probabilidades próximas de 0 estão associadas com a
previsão de que é improvável que um resultado do tipo em questão ocorra em qualquer
tentativa determinada da observação padrão e que em muitas tentativas no futuro, ele
ocorrerá apenas algumas vezes. Probabilidades próximas de 0,5 significam que o resultado
em questão ocorre aproximadamente metade das vezes que a observação padrão é feita e
em conseqüência, essa é a nossa previsão para o futuro. À medida que a probabilidade se
aproxima de 1 ficamos cada vez mais certos de que deveremos observar o resultado em
questão. Finalmente em 1, dizemos que estamos certos de que o resultado ocorrerá.
Assim, a nossa convicção de que o sol nascerá amanhã recebe uma expressão quantitativa
dada por uma probabilidade igual a 1 ,0 , já que toda observação no passado resultou em
“o sol aparece” . O resultado “o sol não aparece” , todavia, tem até agora uma freqüência
igual a 0 e, então, uma probabilidade 0. Esse valor expressa nossa falta de confiança em
prever esse resultado. Uma maneira útil de representar a escala de probabilidade é vista na
Fig. 3-12.
N unca Perfeitamente
aconteceu certo
. Pode ou não
acontecer
^ Baixa 2 Alta
Probabilidade
- 72 -
Cramér, H. 77:./ elements of probability theory. Wiley: New York, 1955.
Dashiell, J. F. Fundamentals of general psychology. (3rd ed.) Boston:
Houghton Mifflin, 1949.
Grant, D. A., and Norris, E. B. Eyelid conditioning as influenced by the
presence of sensitized Beta-responses. / . exp. P sychol, 1947, 37,
423-433.
Hilgard, E. R., and Marquis, D. G. Conditioning and learning. New
York: Appleton-Century-Crofts, 1940.
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New Y ork:
Appleton-Century-Crofts, 1950.
Long, Lillian D. An investigation of the original response to the condi
tioned stimulus. A rch . Psychol., (New Y ork) 1941, No. 259.
Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.
Moore, A. U., and Marcuse, F. L. Salivary, cardiac, and motor indices of
conditioning in two sows. J. comp. Psychol., 1945, 38* 1-16.
Mostofsky, D. (E d .) Stimulus generalization. Stanford: Stanford Univer.
Press, 1965.
Notterman, J., Schoenfeld, W. N., and Bersh, P. J. Conditioned heart rate
response in human beings during experimental anxiety. /. comp,
physiol. Psychol., 1952, 45, 1-8.
Osgood, C. E. M ethod and theory in experimental psychology. New
York: Oxford Univer. Press, 1953.
Pavlov, I. P. Conditioned reflexes. London: Oxford Univer. Press, 1927.
Pavlov, I. P. Lectures on conditioned reflexes. New Y ork: International
Publishers, 1928.
Prokasy, W. F. (E d .) Classical conditioning: a symposium. New Y ork:
Appleton-Century-Crofts, 1965.
Schlosberg, H. A study of the conditioned patellar reflex. J. exp. Psychol
1928, 1 1 ,4 6 8 -4 9 4 .
Wolfle, H. M. Conditioning as a function of the interval between the
conditioned and the original stimulus. J. gen. Psychol., 1932, 7,
• 80-103.
Young, F. A. Studies of pupillary conditioning. J. exp. Psychol., 1958,
55, 97 -1 1 0 .
Zeaman, D., and Smith, R. W. Review of some recent findings in human
cardiac conditioning. Chap. 19 in W. F. Prokasy (E d .), Classical
r *in'nning. New York: Appleton-Century-Crofts, 1965.
-7 3 -
Capítulo 4 - FORTALECIMENTO OPERANTE
quando um gato ouve um rato, volta-se para a fonte do som,vê o rato, corre em
sua direção e lança-se sobre ele. Sua postura em cada estágio, mesmo na seleção do
pé que dará o primeiro passo, é determinada por reflexos que podem ser
demonstrados um a um em condições experimentais. Tudo que o gato tem a fazer é
decidir se persegue ou não, todo o resto está preparado para isso pelos seus reflexos
posturais e locomotores” (Skinner, 1957, p. 343).
Por trás da proposição ilusoriamente simples de “tudo que o gato tem a fazer e
decidir” encontra-se o ponto de partida para uma ciência daqueles comportamentos cujas
ocorrências não estão relacionadas reflexamente à presença imediata de um eliciador ou a
uma história de emparelhamento de dois eliciadores.
- 75
que chamaremos, por enquanto, “propositais” . Desde o trabalho pioneiro de Thorndike
com gatos e pintos sobre aprendizagem, os psicólogos têm, progressivamente, persistido
na procura de relações entre o comportamento proposital e outros eventos.
Em geral, a procura dessas relações não nos conduziu ao longo dos mesmos caminhos do
reflexo. Contudo, uma abordagem funcional já foi iniciada. Considere o problema no
desenvolvimento de tal abordagem: como procedemos para encontrar as variáveis ou
eventos aos quais o comportamento proposital possa estar significantemente
relacionado?
Inicialmente, devemos proceder por intuição e observação grosseira. Se tivermos sorte,
podemos cumprir nossa tarefa ajudados por uma especulação filosófica avançada. Vinte e
cinco anos antes de Thorndike,o filósofo britânico Herbert Spencer escreveu o seguinte.
“Suponha, agora, que ao estender sua cabeça para apanhar uma presa de difícil
alcance, uma criatura falhe rapidamente. Suponha que, ao lado do grupo de ações
motoras aproximadamente adaptadas para alcançar a presa a esta distância... um
pequeno movimento do corpo para a frente (ocorre). O sucesso, ao invés do fracasso,
será alcançado... Quando as circunstâncias se repetem, esses movimentos musculares
que foram seguidos por sucesso são provavelmente repetidos: o que foi inicialmente
uma combinação acidental de movimentos será agora uma combinação que tem
probabilidade considerável” (Spencer, 1878).
Na proposição de que “aqueles movimentos musculares que foram seguidos por
sucesso são provavelmente repetidos” , Spencer estava enfatizando que o que um or
ganismos faz agora está, de algum modo, relacionado com as conseqüências do que o
organismo fez no passado. Aqui, então, está a deixa que Thorndike, e mais tarde Skinner,
deveriam seguir extensivamente.
O comportamento proposital é aquele que é quase totalmente definido por suas
conseqüências. Considere a Tabela 4.1. Em cada ato ali citado, o objetivo do compor
tamento está relacionado de perto com as conseqüências. Dizemos que amarramos um
Tabela 4.1
ALGUNS COMPORTAMENTOS “PROPOSITAIS” DOS ANIMAIS E HOMENS, SEUS
ASSIM CHAMADOS PROPÓSITOS, E SUAS CONSEQÜÊNCIAS PASSADAS REAIS.
-7 6 -
EXERCÍCIO 2.
Transforme cada um dos comportamentos e propósitos da Tabela 4.1 em propo
sições equivalentes que expressem simplesmente o comportamento presente e o com
portamento passado com suas conseqüências.
“ Durante a guerra, os russos usaram cães para bombardear tanques. Um cão era
treinado para se esconder atrás de uma árvore, arbustos ou outro esconderijo
qualquer. Quando um tanque se aproximava e passava, o cão corria ao seu lado e
uma pequena mina magnética, presa às suas costas era suficiente para danificar o
tanque ou incendiã-lo. O cão, naturalmente, tinha que ser substituído” (Skinner,
1956, p. 228).
Apenas uma das duas possíveis descrições é satisfatória aqui. O cão corre na direção
ao tanque devido a certas conseqüências passadas de correr na direção de tanques.
(Presumivelmente eles eram ali alimentados ou acariciados, etc.) Nesse exemplo extremo
é fácil rejeitar a proposição alternativa de que os cães corriam na direção dos tanques
para serem explodidos. Mesmo assim, a ilustração é útil para estabelecer o princípio geral
de que o futuro não determina o comportamento.
Em resumo, uma classe muito real e importante de comportamentos surgida de
situações que parecem envolver escolha ou decisão, é chamada comportamento
proposital. Esse comportamento, deve ficar claro de uma vez, inclui-se na categoria de
Descartes de ‘'voluntário” e constitui a ação que os antigos chamavam “intencional” .
Nossa análise presente, indica que esse comportamento está de algum modo relacionado
com suas conseqüências controlado por elas. Por essa razão, daqui por diante, deveremos
substituir o antigo termo proposital pelo termo “ instrumental” de Thorndike, ou “ ope
rante” de Skinner. Chamar o comportamento de “ instrumental” ou de “ operante” sugere
que, operando no ambiente, o comportamento é instrumental na obtenção de conseqüên
cias. Nenhum desses termos implica o mesmo quadro conceituai indesejável que o termo
“ proposital” , mesmo assim ambos tentam aprender a noção fundamental de que as
conseqüências passadas de tal comportamento são um de seus determinadores impor
tantes.
- 77 -
Para os objetivos da presente análise, as características significativas da caixa são ( 1 )
uma bandeja para o fornecimento de uma pequena pelota de alimento para o rato e ( 2 )
uma alavanca ou barra, projetando-se da parede da frente, que, quando pressionada para
baixo com uma força de cerca de 10 g, fecha um micro-interruptor, permitindo um
registro automático desse comportamento. Os aspectos significantes do rato são os
seguintes: ( 1 ) é sadio e foi acostumado a comer uma refeição por dia, por volta da mesma
hora em que se encontra na caixa. (2) Foi previamente adaptado a essa caixa e, durante
este período de adaptação, o alimento era ocasionalmente fornecido na bandeja. Agora,
ele se aproxima prontamente da bandeja de alimento e come-o sempre que este'está
disponível.
Figura 4.1 - Uma câmara experimental baseada na caixa originalmente usada por B. F.
Skinner para o estudo do comportamento instrumental no rato e outros pequenos
mamíferos (Will Rapport).
-7 8 -
não dependam, em grande parte, da construção da caixa para que ocorram. Não obstante,
eles parecem ser emitidos na ausência de qualquer estímulo específico. Por essa razão,
eles são frequentemente referidos como respostas emitidas.
A observação dos comportamentos emitidos por um animal na situação onde
nenhuma conseqüência especial está sendo fornecida para qualquer resposta é conhecida
como a observação do nível operante. Os registros do nível operante servem como uma
importante linha base em relação à qual deveremos, mais tarde, comparar os efeitos da
liberação de conseqüências especiais para uma ou mais respostas emitidas.
Depois de 15 minutos de observação dessas várias respostas emitidas, iniciamos o se
guinte procedimento. Cada vez que observamos que o rato pressiona a barra, imediatamente
fornecemos uma pelota de alirtiento na bandeja. Agora, pela primeira vez na história do rato,
o comportamento de pressionar a barra tem a conseqüência especial de produzir
alimento. Não será necessário esperar muito para ver os efeitos dessa nova contingência
no com portam ento do rato. Logo o animal estará ativamente ocupado com
comportamentos de pressionar a barra e comer. Algumas mudanças ou modificações bem
marcantes em seu comportamento ocorrem no espaço de poucos minutos.
Na linguagem comum, dizemos que o rato aprendeu a pressionar a barra para obter o
alimento. Tal descrição contribui pouco para a proposição de que o rato está agora
pressionando a barra frequentemente e está obtendo alimento. 0 que desejamos fazer é
descrever em detalhe, e tão quantitativamente quanto possível, as mudanças no
comportamento as quais resultam da simples operação de liberar uma conseqüência
especial, para apenas uma das atividades normais do indivíduo que ocorre na situação.
Para fazer isso, consideremos quatro maneiras complementares de encarar as mudanças
no comportamento do rato quando, como o foi aqui, um de seus comportamentos é
selecionado e recebe uma conseqüência favorável.
- 79
Tabela 4-2 (continuação)
Neste diagrama, a taxa aumenta constantemente de um valor baixo
próximo de___________ para um valor alto próximo d e --------------------
Um aumento na taxa é chamado aceleração positiva. A aceleração
positiva é vista neste diagrama/no diagrama do quadrado acima (marque
qual).
A aceleração negativa refere-se a um (a )-----------------------------------------
na taxa.
A aceleração negativa é vista no diagrama deste quadro/no do quadro
acima (marque qual).
Para registrar outros eventos que ocorrem enquanto c animal está
respondendo, a pena move-se rapidamente 4para o sudeste'' e retorna
novamente. No diagrama à esquerda, a pena traçou uma linha d e ------
para____Nesse ponto, a pena retornará imediatamente para---------------
A pequena marca diagonal ("traço ou risco") e m --------------------------
____foi feita pelo mesmo movimento da pena como mostrado ein d — e.
A marca ou risco “sudeste” é frequentemente usada para indicar que
uma resposta produziu alguma conseqüência especial.. No diagrama
deste quadro, essas respostas foram registradas somente pela marca
vertical e m ---------------- - e ----------------- •
No diagrama deste quadro, uma resposta recebeu uma conseqüência
especial e m --------------
N a p rá tic a , o traço vertical feito por uma umca resposta é muito
pequeno para ser facilmente identificado. Entretanto, podemos usar
a --------------------- da curva em qualquer ponto como um indicador váli
do da taxa de resposta.
No diagrama, a taxa foi mais alta entre_____ e ________zero entre -
— e ------ -- e de um valor intermediário entre____e _____ _________
T abela 4-2 (continuaçao)
Quando os degraus são tão pequenos que nao podemos contar as respos
tas, podemos ainda determinar o número de respostas entre dois p o n to
no registro usando uma escala.
No diagrama deste quadro, a porção vertical da escala à direita nos diz
que aproximadamente respostas foram emitidas entre a e b
/ /
no registro cumulativo à esquerda.
£ | '00 Se o papel se move muito devagar, não será possível medir acuradamen
,1' g>50 te o tempo entre duas respostas, mas ainda assim podemos determinar o
S 5 10
Sl ------- 1------- L_ tempo passado entre dois pontos escolhidos^
M inutos No diagrama deste quadro, a porção horizontal da escala à direita nos
diz que as respostas a e b do registro cumulativo à esquerda ocorreram
com um intervalo de aproximadamente minutos.
d
No diagrama a esquerda, após completar cerca de 100 respostas entre a
e b , o animal parou por um curto p e r í o d o J " q
f ----- - " ~ e então emitiu cerca de ---- -- ------------- respostas entre c e d
/a ££ ----5------»
10
aM M inutos
D
&
s vezes, uma curva cumulativa e usada para registrar a progressão de um automóvel em movimento e, então,
ação indica a velocidade do movimento. Quando uma curva cumulativa é usada para registrar o comporta
nima! a inclinação indica---------------------
de resposta” significa o número de respostas por unidade de tempo. Num registro acumulativo, o número
ostas pode ser determinado pela distância percorrida pela pena na direção-------------
gistro cumulativo o tempo é indicado pela distância percorrida pela pena na direção--------------------------------- —
TABELA 4-2
UMA SEQÜÊNCIA DE INSTRUÇÃO PROGRAMADA SOBRE COMO LER UM
REGISTRO CUMULATIVO DA RESPOSTA (ADAPTADO DE SKINNER. 1959).
Tempo (minutos)
Figura 4.2 - Algumas curvas típicas de respostas acumuladas obtidas de ratos famintos
no dia do fortalecimento de uma resposta de pressão a barra pela primeira vez. Como
cada resposta produz uma pelota de alimento, os traços de alimento estão omitidos
(Skinner, 1938).
-84 -
As freqüências dessas atividades durante o nível operante e durante o fortalecimento
estão representadas nos histogramas da Fig. 4.3.
Rp Rf Rc Ra Rb Ri
COMPORTAMENTOS
Figura 4.3 - Freqüências relativas de vários comportamentos que ocorrem numa caixa
experimental antes e depois do fortalecimento do comportamento de pressionar a barra
Olhando a Fig. 4.3, vemos claramente que não apenas a taxa de pressão a barra
aumentou, mas as taxas das outras atividades não associadas com alimento na situação
diminuíram.
- 8b
alimento. Antes do fortalecimento da pressdo à barra, essas duas respostas ocorrem de tal
modo que, quando o animal emite uma delas, é provável que ele repita essa rnesma
resposta novamente em vez de emitir a outra (Frick e Miller, 1951). Assim, uma
seqüência bastante típica de pressão à barra (Rp) e respostas de aproximar-se da bandeja
(Ra), no nível operante, pode ser:
Rp Rp Ra Rp Rp Rp Ra Ra Ra . .
Rp Ra Rp Ra Rp Ra . ..
e dificilmente será visto outro padrão (Millenson e Hurwitz, 1961). Não se sabe quão
rapidamente esse processo ocorre, mas sob condições favoráveis, parece provável que s ja
quase tão instantâneo quanto a mudança na taxa absoluta de pressão à barra.
Um indivíduo nunca emite um ato duas vezes exatamente da mesma forma. Assim
como cada vez que escrevemos nosso nome, fazemo-lo ligeiramente diferente, assim
também cada vez que o rato pressiona a barra, ele o faz de um modo ligeiramente
diferente. Algumas pressões são feitas com a pata esquerda, algumas com a direita,
algumas vom o nariz e algumas com o ombro. Mesmo assim, agrupamos todos esses casos
e dizemos que a classe de respostas que chamamos pressões à barra é constituída de todas
as possíveis maneiras de pressionar uma barra. Durante o fortalecimento de tal classe de
resposta, estamos realmente fortalecendo esses casos individuais de respostas, cada uma
das quais difere ligeiramente de seus semelhantes.
Esse fortalecimento dos membros da classe de comportamentos que constituem a
pressão a barra tem um efeito marcante na forma final em que o comportamento se
estnbelece. Enquanto inicialmente, no nível operante, o rato tende a pressionai a barra de
muitas maneiras diferentes, depois do fortalecimento, tende a fazê-lo de poucas maneiras.
Em outras palavras, os casos individuais tornam-se cada vez mais semelhantes. Expressa
mos este resultado dizendo que a topografia do comportamento se restringe durante o
fortalecimento instrumental. A topografia de uma resposta refere-se à maneira pela qual o
animal emite a resposta. Estritamente falando, a topografia parece dizer respeito aos
músculos realmente empregados no momento da ocorrência da resposta. 0 registro de
tais eventos, todavia, apresenta dificuldades. Como uma tentativa para fazer isso, pode-se
empregar uma câmara para fotografar o animal no momento em que a resposta é con
cluída. Guthrie e Horton (1946) tiraram fotografias de gatos e cães quando o comporta
mento que produzia uma conseqüência especial era o de inclinar uma vara que estava no
centro da caixa do animal. A Fig. 4.4 ilustra alguns exemplos extremos da estereotipia do
comportamento depois do fortalecimento. Cada animal adota uma topografia idiossincrá
tica e só se afasta dela em qualquer ocasião determinada apenas em detalhes. Um
exemplo surpreendente de estereotipia humana no comportamento instrumental apren
dido é visto na Fig. 4.5.
— 86 —
‘r f t i ' t f h d i d i
Figura 4.4 - Desenhos das respostas de dois gatos e um cão em emissões sucessi
vas de uma resposta de inclinar uma vara (Kimble, 1956, segundo Guthrie e Hor
ton, 1946).
A pressão à barra, o puxar a corrente, explorar com o nariz, inclinar uma vara e assim
por diante são atos convenientes escolhidos pelos experimentalistas para estudar esses
efeitos. A adequação desses comportamentos para o estudo do fortalecimento operante
depende criticamente da sua capacidade de serem modificados como foi descrito. For
malmente, esses e outros comportamentos, assim fortalecidos, são definidos como
operantes. Os quatro efeitos do fortalecimento constituem o que chamaremos, daqui por
diante, de leis do fortalecimento operante. Pressões à barra e outros comportamentos
simples dos animais são escolhidos para estudar essas leis porque eles são facilmente
observados e medidos pelo experiinçntador e facilmente executados em várias taxas pelo
organismo. No decorrer deste texto, continuaremos a ampliara aplicabilidade dessas leis
e do termo operante muito além de pressão à barra e ratos.
- 87 -
Na sua lei do efeito, Thorndike enfatizou a importância de certas consequencias
espeicais do comportamento. Eventos que eram “ satisfatórios” , dizia ele, e que seguiam o
comportamento, atuavam de modo a fixar aquele comportamento. Embora chamar
tais eventos de satisfatórios possa, à primeira vista, parecer uma especificação indepen
dente e útil das conseqüências especiais, o fato é que fornecer uma definição satisfatória
para “satisfatória' 1 é difícil. No caso do animal, não temos uma maneira de saber se um
evento é satisfatório, salvo pela observação de se ele atua no comportamento de acordo
com as leis do fortalecimento operante. No caso do ser humano podemos pensar que a
satisfação possa ser facilmente identificada, mas tente definir o termo. Coisas satisfa
tórias são aquelas das quais gostamos, mas quais são essas coisas? Em última instância, as
coisas de que gostamos são aquelas que trabalharemos para obtçr. Mas dizer que trabalha
remos por elas é outra maneira de dizer que faremos por elas o que o nosso rato fará
“ por” alimento. Somos, então, levados à conclusão de que a definição dessas conse
qüências especiais é melhor concebida em termos de seus efeitos especiais no comporta
mento.
-8 8 -
Uma conseqüência é sempre uma mudança no ambiente de um indivíduo. A apresen
tação de alimento para nosso rato foi uma mudança 110 seu ambiente previamente sem
alimento. A conseqüência de pedir um copo d’água pode ser um novo ambiente onde o
copo d’água aparece na mão de um amigo. A conseqüência de tirar o telefone do gancho
é um novo ambiente que agora inclui o sinal de discar. Poderíamos estender tais
exemplos indefinidamente. Note, nosso ambiente foram definidas, no contexto dos
reflexos e do condicionamento Pavloviano, como estímulos. É, então, evidente que, ao
falar de um certo grupo especial de conseqüências, nada mais estamos fazendo do que
delimitando, pelos seus efeitos especiais sobre operantes, um certo subconjunto de
estímulos. Podemos convencionalmente definir aqueles estímulos que, ao seguirem o
comportamento operante, atetam-no através das leis do fortalecimento operante, como
estímulos reforçadores (S+) ou simplesmente reforçadores. A operação de apresentar um
reforçador denominaremos de reforçamento.
Diz-se, algumas vezes, que os tenros operante e reforçamento são circulares. Parece
que cada um é definido em termos do outro. Reforçadores parecem ser definidos como
aqueles eventos que fortalecem operantes; mas operantes parecem ser definidos como
aqueles comportamentos que são suscetíveis de fortalecimento pelos reforçadores. O
“pequeno experimento imaginário’ que se segue mostra como a circularidade pode ser
quebrada.
- 89 -
DADO : 1 — Uma resposta operante sendo emitida numa freqüência maior
do que zera
2 - Um reforçador apropriado.
PROCEDIMENTO: Seguir cada emissão do operante selecionado com o estímulo refor
çador.
R -> S+
Onde R representa uma classe de resposta operante (constituída de r j, r 2 . . . rn), S+
representa um estímulo reforçador e a seta é lida como “ produz” ou “conduz a”.
-9 0 -
é suficiente para descrever completamente o progresso. Todavia, uma mudança impor
tante que ocorre é a mudança na freqüência relativa dos diferentes sons pronunciados, à
medida que o bebê cresce. Assim, na França, os fonemas envolvidos no r francês e as
vogais nasais são fortalecidos pela comunidade que reforça — os pais da criança, seus
companheiros de brinquedos e, eventualmente, seus professores. Em países de língua
inglesa, um grupo diferente de fonemas é modelado em palavras por uma comunidade
reforçadora diferente. O resultado desse fortalecimento pode ser inferido de um grupo de
histogramas semelhantes aos da Fig. 4.3, porém mais complicados. Na Fig. 4.6, são vistos
os histogramas das freqüências relativas de 12 fonemas vocálicos (veja o Apêndice A
neste capítulo, para sua explicação) para crianças de várias idades e adultos. Podemos
inferir que o reforçamento desses sons ajusta a sua freqüência àquela da comunidade
adulta.
JZ t
i Ie£«AeoDoUu i I e C s A e o o o U u
Uma prova mais direta dos efeitos de se reforçar sons produzidos pela criança surge
de experimentos de laboratório. Num experimento, o comportamento de bebês de 3
meses de idade foi observado enquanto eles permaneciam em seus berços. Durante duas
sessões de observação, um experimentador adulto recurvava-se sobre o berço a uma
distância um pouco maior do que 30 cm da criança e permanecia relativamente sem
movimento e sem expressão. Durante esse período, um segundo observador registrava a
freqüência de sons produzidos pela criança. Em duas sessões subseqüentes, o procedi
mento foi o nesmo, exceto que o primeiro experimentador seguia cada som que não
fosse choro com um^sorriso”, três sons utsk” e um leve toque aplicado no abdomen da
criança com os dedos da mão”. (Rheingold, Gewirtz e Ross, 1959, p. 28). Isto, natural
mente, é apenas:
- 91 -
apareciam, e sons CR aos estímulos que haviam sido previamente emparelhados com
esses eliciadores. Mrs. Hayes tentou seguir o seguinte procedimento
o p PI _j_
°1 (visão do alimento) (g ri to excitado) S (alimento) [4.1]
- 92 -
fortalecimento de, digamos, 30 min. com um reforçador fraco terá pouca possibilidade
de competir.
Num delineamento experimental interessante, baseado nos trabalhos iniciais de W.
Verplanck (1955) um assistente de pesquisa de graduação foi usado como um (‘ ator**
para tentar fortalecer certo comportamento de conversa em alunos de graduação
(Centers, 1963). O assistente e o sujeito eram colocados numa sala, ambos esperando
ostensivamente serem chamados para um experimento de psicologia. Na verdade, este era
o experimento. Durante esse tempo, o assistente estabelecia uma conversa com o sujeito
que de nada suspeitava e, em vários períodos, reforçava diversos tipos de conteúdo de
conversa, tais como demonstração de opinião, fornecimento de informação e perguntas,
com concordância -e atenção especial. Enquanto isso, sem conhecimento do sujeito, a
conversa estava sendo gravada e observada através de um espelho unidirecional.
A “ conversa” experimental durava 30 min. sendo dividida em três períodos de 10
min. Durante o primeiro período, ou nível operante, o assistente procurava não demons
trar concordância ou fornecer respostas informativas às opiniões e perguntas do sujeito.
Durante os 10 minutos seguintes, o período de fortalecimento comportamental o assis
tente concordava com, ou parafraseava favoravelmente, todas as demonstrações de
opinião emitidas pelo sujeito. Além disso, ele expressava atenção, simpatia, e compreen
são para todas as informações propostas e reforçava todas as perguntas ou dando a
informação solicitada ou concordando e aprovando, se era isto o que a pergunta indicava
desejar. Durante os 10 min. finais, o assistente ou discordava das opiniões do sujeito ou
permanecia silencioso depois que elas eram verbalizadas. Ele ignorava as informações
fornecidas e era o mais alheio possível às questões.
Os resultados do reforçamento de concordar (fortalecimento) indicaram claramente
que a freqüência de demonstração de opinião e fornecimento de informação, em relação a
todas as proposições, aumentou. Além disso, nenhum sujeito notou este condiciona
mento de seu comportamento. Por razões desconhecidas aos experimentadores, o fazer
perguntas não mostrou qualquer fortalecimento e assim, de acordo com a nossa defi
nição, ele não constitui uma classe operante.
Num nível diferente de desenvolvimento, Brackbill (1958) fortaleceu com sucesso
uma resposta de sorrir em bebês de 4 meses de idade, utilizando o contato físico como
reforçamento.
O próprio cientista está empenhado num empreendimento que exige, frequente
mente, a emissão de muitos operantes, poucos dos quais são reforçados. Comporta
mentos que levam à proposição de novas relações, ou de uma nova ordem entre os
conceitos, uma descoberta de um novo fenômeno e assim por diante, são reforçados pela
comunidade científica. Entre os reforçadores proeminentes para os behavioristas, está a
ordem observada quando se vê que algum comportamento de um indivíduo está regular
mente relacionado às suas conseqüências, como no caso da pressão a barra pelo rato da
seção 4.2. Essa lembrança de que o próprio pesquisador é um organismo que se com
porta, sujeito às leis do fortalecimento operante, caracteriza o desenho visto na Fig. 4.7.
A verificação das leis do fortalecimento operante no comportamento humano é
importante, porque isto mostra que apesar das diferenças aparentes muito grandes entre
homem e animal existem certas similaridades funcionais. São essas similaridades que, em
úítima instância, justificam o nosso estudo da psicologia através do comportamento de
organismos inferiores. Afinal de contas, o Psicólogo está principalmente interessado no
comportamento humano, o a mais exatamente dos comportamentos, que são cornparti-
93 -
Figura 4.7 - Rapaz, este cara está condicionado. Cada vez que eu pressiono a barra, ele joga
uma pelota aqui dentro” . (Adaptado com permissão de Jester Columbia College).
4.11 - SUPERSTIÇÃO
Dizer que o reforçamento é contingente a uma resposta pode significar apenas que
ele segue a resposta e não implica necessariamente numa ligação física direta entre a
resposta e o reforçador. O reforçamento pode ser mediado pelo comportamento de um
experimentador, ou por algum outro aparelho automático. 0 efeito do reforçamento no
comportamento é indiferente aos meios pelos quais a correlação temporal entre R e S+ é
efetuada. O poder automático do reforçamento em fortalecer o comportamento nos
lembra que, do mesmo modo que o condicionamento Pavloviano, sempre que as condi
ções temporais para o procedimento de fortalecimento operante são alcançados (na selva,
no lar, no laboratório), é provável a ocorrência de modificações no comportamento.
Quando nos lembramos de que o processo de fortalecimento é quase sempre virtual
mente instantâneo, não nos surpreenderíamos ao descobrir que o fortalecimento do
comportamento pode ocorrer mesmo em situações onde existe apenas uma coincidência
fortuita entre uma dada R e a ocorrência do S+. No experimento realizado por Skinner
(1948), um pombo faminto foi colocado numa caixa não diferente daquela vista na Fig.
- 94 -
4.1. Não havia, no entanto, uma barra nesta caixa e o alimento consistia dc pequenas
porções de grãos misturados que poderiam ser fornecidos através do alimentador. Cada
15 segundos, o alimento era automaticamente apresentado ao pombo, não importando o
que ele estivesse fazendo no momento. Sob essas condições, 6 entre 8 pombos rapida
mente desenvolveram respostas caracteristicamente diferentes mas estereotipadas. Um
pombo desenvolveu um movimento circular contrário aos ponteiros do relógio, comple
tando duas ou três voltas entre os refçrçamentos. Um segundo pombo repetidamente
estendia sua cabeça em direção a um dos cantos superiores da gaiola. Outro apresentou
um movimento de “balançar a cabeça'’ no plano vertical. Os outros três pombos desen
volveram uma variedade de outros movimentos bizarros da cabeça e do corpo,
característicos.
O processo de fortalecimento casual é, em geral, aparente. Por acaso, o animal estava
executando alguma resposta no momento em que o alimento era fornecido. Essa coinci
dência fortalece essa resposta e, assim, torna-a mais provável de reaparecer novamente e
ser reforçada uma segunda vez. Uma vez iniciado, o processo se perpetua. Como Skinner
salientou, pode-se dizer que o experimento demonstra um tipo de superstição.
“O animal comporta-se como se existisse uma relação causai entre seu compor
tamento e a apresentação do alimento, embora tal relação não seja real. Existem
muitas analogias no comportamento humano. Os rituais para mudar a sorte de
alguém com cartas são bons exemplos. Poucas conexões acidentais entre um ritual e
as conseqüências favoráveis são suficientes para estabelecer e manter o comporta
mento, apesar dos muitos casos não reforçados. Um outro exemplo é o do jogador de
boliche que lança a bola fora da pista, mas continua a se comportar como se estivesse
controlando-a através da curvatura e torsão de seu braço e ombro. Esses comporta
mentos não têm, naturalmente, efeito real algum sobre a sorte de alguém ou sobre a
bola a meio caminho fora da pista, tal como, no presente caso, o alimento apareceria
com a mesma freqüência se o pombo nada fizesse —ou, estritamente falando, se ele
fizesse outra coisa qualquer” (Skinner, 1948, p. 171).
Tabela 4.3
CONDICIONAMENTO CONDICIONAMENTO
PAVLOVIANO OPERANTE
Sr
PARADIGMA OU
CR R -» S ^
PROCEDIMENTO
Fortalecimento de uma R
Formação de alguns com
RESULTADO já existente no repertório
portamentos novos (CR) a
comportamental.
Sl
Probabilidade da CR a S\ Taxa de R, forma de R or
COMO É MEDIDO magnitude da CR, latência dem seqüencial relativa a
da CR. outras Rs que ocorrem
-9 6 -
APÊNDICE A
SÍMBOLO EXEMPLO
j o i na palavra fria
1 o i na palavra fácil
/
e o a n/á palavra mesa
X intermediário entre o á de já e o é em fé
c o o na palavra nó
0 como em vou
V o o da palavra porque
u como o u na palavra uva
-9 7 -
Hayes, C. The ope in ourM ause ifevv Y ork H arper and Row, 1951.
Irwin, O. C. Infant spcech: development of vowel sounds. / . speech
hearing Disorders, 1952, 1 7 ,2 6 9 -2 7 9 .
Mednick, S. A. Learning. Englewood ClifTs: Prentice-Hall, 1964.
Millenson, J. R., and Hurwitz, H. M. B. Some tem poral and sequential
properties of behavior during conditioning and extinction. /. ex p .
Anal. Behav., 1 9 6 1 ,4 ,9 7 -1 0 5 .
Osgood, C. E. M ethod and theory in experimental psychology. New
York: Oxford Univcr. Press, 1953.
Rhcingold, II. L., Gewirtz, J. L., and Ross, H. W. Social conditioning of
vocalizations in the infant. /. comp, physiol. Psychol., 1959, 52,
68 -7 3 .
Skinner, B. F. The behavior of organisms. New York: Appleton-Cen-
tury, 1938.
Skinner, B. F. Superstition in the pigeon. / . exp. Psychol., 1948, 38,
168-172.
Skinner, B. F. Walden two. New York: Appleton-Century-Crofts, 1948.
Skinner, B. F. A case history in scientific method. A m e r. Psychologist,
1 9 5 6 ,1 1 ,2 2 1 -2 3 3 .
Skinner, B. F. The experimental analysis of behavior. Am er. 5c/., 1957,
45, 343-371.
Skinner, B. F. Cumulative Record. New Y ork: Appleton-Century-Crofts,
1959.
Spencer, H. The principles of psychology. New Y ork: D. Appleton,
18/78.
Verplanck, W. S. The cçntrol of the content of conversation. / . abnorm.
soc. Psychol., 1955, 51, 668-676.
-9 8 -
Capítulo 5 - EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE
-9 9 -
5.1 MUDANÇAS NA TAXA DE RESPOSTA DURANTE A EXTINÇÃO
Figura 5-1. Uma curva de extinção para uma resposta de pressão a barra anteriormente
reforçada (De Skinner, 1938 dados de í7. S. Keller e A. Kerr).
/ -
5.2 - MUDANÇAS T0P0GJRAFICAS E ESTRUTURAIS NA EXTINÇÃO
- 101 -
Reforçando, com aliipento, a colocação do focinho na fenda, a freqüência desse
comportamento foi primeiro aumentada acima do nível operante. Subsequentemente, o
colocar o nariz na fenda foi extinguido, refortalecido, reextinguido e refortalecido nova
mente. Confirmando os resultados de Guthrie e Horton (1946) com a resposta de inclinai
uma vara em gatos e cães, Antonitis notou que o ângulo e a posição da resposta tendiam
a se tornar estereotipados durante o fortalecimento: o animal limitava suas respostas a
uma região restrita da fenda. A extinção, entretanto, produziu uma variabilidade no
comportamento de colocar o focinho na fenda pelo menos tão grande quanto a que foi
observada durante o nível operante: o animal variou suas respostas sobre o comprimento
inteiro da fenda. Finalmente, o refortalecimento resultou em maior estereotipia (respos
tas mais restritas) do que o fortalecimento original havia produzido.
Resultados similares foram obtidos por Notterman (1959), que estudou a força com
que um rato pressionava a barra durante o nível operante, fortalecimento e extinção.
Uma descoberta adicional emergiu dos dados de Notterman. Os registros individuais
revelaram forças ocasionais, emitidas durante a extinção, que excediam qualquer obser
vação anterior, tanto no nível operante como no fortalecimento. Retornaremos a essa
descoberta mais tarde, nas discussões de diferenciação e habilidades.
O elo ou cadeia de comportamento estabelecida pelo reforçamento degenera-se
quando se retira o reforçamento para os operantes. Frick e Miller (1951) forneceram a
ratos 300 reforçamentos espaçados durante 5 sessões pelo pressionar uma barra, no
aparelho mostrado na Fig. 5-4. (Note que a bandeja de alimento, neste aparelho, está um
pouco mais distante da barra do que na caixa-protótipo usada por Skinner, já descrita).
Após o 300^ reforçamento, obteve-se um registro de 24 horas de extinção para cada
rato. Durante a extinção, Miller e Frick observaram a degeneração da cadeia... Rp Ra Rp
Ra . . . fortalecida. À medida que a extinção progredia, começavam a suceder-se pressões
à barra (Rp Rp, etc.) e idas à bandeja (Ra Ra etc.). Houve pouca tendência para o padrão
se tornar aleatório durante a extinção. Ao contrário, o padrão fortalecido de Rp Ra Rp
Ra . . . gradualmente, deu lugar ao padrão do nível operante, o de ocorrências repetidas
da mesma resposta. Talvez deva ser enfatizado que este resultado não foi, de modo
algum, forçado logicamente. O elo de comportamento poderia ter simplesmente dimi
nuído em freqüência durante a extinção, embora permanecendo intacto.
Em resumo, o efeito do procedimento de extinção é induzir um processo gradual de
comportamento cujas mudanças incluem diminuição na freqüência da resposta,
aumento na variabilidade da forma e intensidade da resposta e quebra estrutural da
seqüência do comportamento. Estas são todas propriedades importantes da extinção e
serão mencionadas frequentemente, daqui por diante, como mecanismos explicativos.
- 102 -
Foto célula
A maneira pela qual os valores reais dessas medidas são obtidos é ilustrada na Fig
5-5, onde a curva de extinção da Fig. 5-1 reaparece.
Figura 5-5. Uma curva de extinção da pressão à barra apòs o fortalecimento. No ponto a
nenhuma resposta havia sido emitida por cinco minutos consecutivos (segundo Skinner,
1938, dados de F.S. Keiler e A. Kerr).
- 104-
Peso da barra (gramas)
sujeito foi submetido a um procedimento idêntico e completo. Por completo,queremos
dizer que o comportamento dq sujeito foi medido em cada valor empregado para a
variável independente. Ouso dei vários sujeitos e a média dos resultados é apenas uma
tentativa de eliminar erros aleatórios de medidas, que perturbam todo experimento.Em
certos estudos comportamentais, contudo, é impossível sujeitar o mesmo indivíduo a
mais do que um valor da variável independente sem introduzir novas variáveis pertur
badoras. Este é geralmente o caso quando a resistência à extinção é a variável dependen
te. Para medir os valores da resistência à extinção para cada um dos vários valores de
nossa variável independente, teríamos que obter várias curvas de extinção do organismo.
Mas, após o fortalecimento original num valor determinado da variável independente,
existe apenas uma curva de extinção. Para obter outra deveríamos, ou fortalecer c
comportamento ou usar outro sujeito. 0 primeiro caso é justificado somente se ascurvas
sucessivas de extinção depois do fortalecimento e refortalecimentos repetidos fererr-
idênticas. Acontece, contudo (ver seção 5.6) que elas não o são. Na verdade, elas são
sistematicamente diferentes. Então, não temos outro recurso para adotar senão o de usar
um sujeito diferente ou grupo de sujeitos para cada condição experimental.
Consequentemente, Capehart, Viney e Hulicka extinguiram a resposta de um rate
numa barra de 5 gramas, outro numa de 40 gramas e um terceiro numa de 70 gramas.
Deste modo, eles evitaram o problema de como obter curvas de extinção inicial para
o mesmo rato em todos os três pesos da barra. Mas, ao fazerem isso, eles introduziram
uma nova fonte de erro de medida: as diferenças individuais entre os sujeitos devido a
outros fatores como diferenças genéticas ou diferenças não controladas na história pas
sada. Para fazer uma média dessas diferenças individuais entre os sujeitos, média esta que
poderia obscurecer qualquer efeito que o esforço da resposta pudesse ter, os pesquisado
res replicaram essencialmente o experimento 9 vezes mais e fizeram uma média de seus
resultados, usando, ao todo, um total de 27 sujeitos (9 ratos para cada uma das três
condições diferentes). Embora a suavidade da sua função que relaciona a resistência à
extinção ao peso da barra ateste o sucesso de sua estratégia, seus resultados (e todos os
resultados simillares) devem ser interpretados com cautela. Em seu experimento, nenhum
sujeito experimentou os três valores da variável independente na extinção. Logo, a gene
ralização do resultado para qualquer organismo individual depende da suposição de que,
se fosse possível obter uma curva de extinção inicial para os três valores diferentes da
variável independente num único indivíduo, os resultados de tal procedimento correspon
deriam aos resultados obtidos ao se sujeitar indivíduos diferentes às diferentes condições
experimentais. Em geral, procuramos evitar essa suposição sempre que possível e recor
-105-
remos a tais funções de grupo (das quais a Fig. 5-6 é um exemplo) somente quando,
como neste caso, aparentemente não tivermos outra escdha. Sempre que tivermos uma
escolha, é preferível realizar um experimento completo com um sõ sujeito, expondo-o a
todas as condições em que estamos interessados. A confiabilidade de nossos resultados
pode, então, ser avaliada através de replicações completas de nosso experimento com
sujeitos adicionais.
A extinção pode ser prolongada até que a taxa de um operante anteriormente for
talecido tenha alcançado um nível baixo. Se o sujeito (por exemplo, um rato numa caixa
de Skinner) é, então, retirado da situação e colocado de volta um pouco mais tarde, outra,
curva de extinção (menor) será obtida (ver Fig. 5-7).
Mesmo que nenhum fortalecimento tenha ocorrido entre as duas sessões de extinção,
ocorre uma certa quantidade de aumento espontâneo na força da resposta.
A quantidade de recuperação espontânea (quando medida pela resistência à extinção
da segunda curva de extinção) depende, até certo ponto, do intervalo de tempo entre o
fim da primeira extinção e o início da segunda. Os efeitos da recuperação espontânea
podem ser vistos num intervalo tão pequeno quanto 15 min entre as duas sessões de
extinção, na situação de pressionar a barra. O efeito aumenta até cerca de 2 horas de
intervalo, depois do que nenhum aumento adicional na recuperação espontânea ocorre.
Os fenômenos da recuperação espontânea têm sido assunto para muitas especulações,
mas seus pressupostos mecanismos estão além da perspectiva de uma proposição intro
dutória.
- 106 -
5.5 CONDICIONAMENTO E EXTINÇÃO SUCESSIVOS
10
10 20 30 40 50 60
Minutos
Esses resultados podem ser extrapolados para além de dez sessões. Parece que apenas
poucas sessões a mais seriam necessárias para que o animal alcançasse o que é chamado
extinção numa tentativa. Na extinção numa tentativa, apenas uma única resposta é
emitida após a retirada do reforçamento. A mudança no comportamento torna-se
abrupta e parece razoável concluir que o organismo passa a discriminar o procedimento
de extinção como tal. Poucas respostas em extinção é a regra, no nível humano. Muitas
de nossas próprias respostas mostram uma diminuição rápida, quando cessa o reforça
mento. Não continuamos a inserir moedas numa máquina de cigarros ou de doces
quebrada, quando não obtemos aquilo que pagamos. Ouando abrimos a caixa do correio
e descobrimos que está vazia, não continuamos a abri-la. Como os ratos de Bullock e
Smith, aprendemos a esperar pelo nosso reforçamento.
Resultados tais como os de Bullock e Smith não deixam dúvidas de que os processos-
de extinção sucessiva são diferentes. De fato, eles formam um subprocesso progressivo, à
medida que tendem a uma assíntota de uma resposta por período de extinção O que
acontece, contudo, se cada período de extinção é prolongado até alcançar a taxa de nível
operante? Será cada extinção sucessiva ou pouco mais rápida, que a precedente? Pouca
informação existe para responder à questão com autoridade, mas dados não publicados
coletados por J. L. Kerr e J. R. Mülenson (1957) mostraram que, quando a pressão à
barra de um rato era extinta até ao ponto onde duas sessões consecutivas fossem iguais
ou menores do que a taxa ao nível operante, um efeito similar ao de Bullock e Smith era
- 107 -
jLinda obtido. A Fig. 5-9 mostra o resultado desse procedimento para um animal efetuado
em quatio desses ciclos de condicionamento e extinção.
50
s
*8 40
30 60
Minutos
- 108-
Existem' ainda resultados mais surpreendentes que apoiam a noção de que a mera
passagem do tempo entre o condicionamento e a extinção tem, espantosamente, pouco
efeito. Um grupo de pombos foi treinado, no aparelho visto na Fig. 5-11, a bicar uma
chave ou disco iluminado, obtendo alimento. Depois do fortalecimento da resposta de
bicar a chave, os animais foram transferidos para o biotério. Quatro anos mais tarde.
retomaram ao aparelho e foram testados no procedimento de extinção. Embora os
pombos não tivessem visto o disco por mais de 1.400 dias, eles começaram a bicá-lo,
imediatamente e deram centenas de respostas em extinção (Skinner, 1950).
Existe uma vasta literatura sobre o esquecimento do comportamento verbal humano.
Antes do início do século vinte, Ebbinghaus memorizou listas das chamadas sílabas sem
- 109-
BIK NAX
Figura 5-12. Uma lista de sílabas sem sentido para o estudo da aprendizagem ZUR KIB
verbal e esquecimento. JEK VOD
ZOT MEF
YIN BEW
Sílabas sem sentido são facilmente esquecidas. Outros materiais verbais não são tão
rapidamente perdidos. A Fig. 5-14 mostra curvas de esquecimento para três tipos de
materiais: poesia, prosa e sílabas sem sentido.
Porque as curvas de extinção de animais mostram efeitos tão pequenos depois de
passado longo tempo, enquanto um homem pode esquecer mais da metade do que ele
aprende em poucas horas? É essa uma superioridade não esperada do rato e do pombo
em relação ao homem? Talvez seja, mas encontramos uma explicação mais conveniente
ao considerarmos a atividade que interve'm duranie a passagem do tempo nos dois tipos
de experimentos. Nos experimentos com animais, o animal é removido da situação ex
perimental e tem pouca chance de emitir respostas que se assemelhem ao operante
-110-
fortalecido. No biotério, os animais não experimentam quaisquer situações muito seme
lhantes às de sua caixa de treinamento. O homem, por outro lado. após memorizar
trechos de palavras - sejam palavras sem sentido, prosa ou poesia - não é abruptamente
removido de seu ambiente verbal. Ao contrário, ele continua a usar palavras (aprendidas)
e a experimentar situações com um certo grau de similaridade com o ambiente onde a
memorizaçãov/'riginal foi feita. Sempre que as situações mudam radicalmente depois da
aquisição, o esquecimento não é tão grande. As habilidades de datilografia são apenas um
pouco afetadas depois de um ano ou mais sem se praticar. Longe da máquina de escrever,
as chances de uma pessoa executar respostas similares à datilografia são pequenas. Nadar
e andar de bicicleta são duas ilustrações adicionais de habilidades que são retidas por
]ongos períodos sem prática.
Sempre que uma resposta especial é fortalecida num novo ambiente, diferente de
qualquer um encontrado na situação cotidiana, o esquecimento é reduzido. Isto é verda
deiro tanto para o homem como para jó animal. É difícil transportar um homem, abrup
tamente, de uma situação de aprendizagem para um outro ambiente completamente
diferente. Jenkins e Dallenbach (1924) tentaram fazer isso. Seus sujeitos aprenderam
uma lista de sílabas sem sentido logo antes de dormir. Os sujeitos foram, então, acorda
dos em vários intervalos após a aprendizagem e solicitados a se recordarem da lista que
- 111 -
mento ocorre devido à similaridade de outros comportamentos com o comportamento
aprendido e à similaridade dos ambientes durante o fortalecimento e o esquecimento.
R, ou R -fr
- 112 -
primeiros 18 meses de vida. Sua saúde melhorou, então, consideravelmente e ele
adquiriu peso e vigor.
O S, agora exigia o cuidado e a atenção especiais que lhes haviam sido dados
durante os meses críticos. Ele impunha alguns de seus desejos, especialmente na hora
de dormir, através de um comportamento de birra para controlar as ações de seus
pais.
Os pais e uma tia revezavam-se para colocá-lo na cama à noite e à tarde, na hora
da sesta. Se o pai (ou a mãe) deixava o quarto depois de colocar o S na cama, elo
gritava a esperneava até que o pai (ou a mãe) voltasse ao quarto. Assim, não se podia
deixar o quarto até que S dormisse. Se o pai (ou a mãe) começava a ler enquanto
estava no quarto, S gritava até que o material de leitura fosse posto à parte. Os pais
sentiam que S gostava deste controle sobre eles e que se esforçava durante o tempo
mais longo possível para não dormir. Em qualquer ocasião, os pais estavam gastando
de meia hora a duas horas, cada vez que colocavam a criança para dormir, esperando
no quarto até que dormisse. ^
Após um parecer médico a respeito da condição física de S, foi decidido retirar
o reforçamento desse comportamento de birra. Consistente com o princípio de
aprendizagem de que, em geral, o comportamento que não é reforçado será extinto,
um dos pais ou a tia colocava o S na cama dê uma maneira agradável e relaxada.
Depois dos agrados característicos da hora de dormir, deixava-se o quarto e se
fechava a porta. O S gritava e chorava, mas o pai (ou a mãe) não voltava ao quarto. A
duração dos gritos e do choro era medida a partir do momento em que a porta era
fechada.
Os resultados são vistos na Fig. 5-16. Pode ser observado que S continuou gritando
por 45 min na primeira vez em que foi colocado na cama, na primeira série de extinção.
55
50
45
40
0 35
1 30
O 25
.S _ 20
O"O
1 2 3 4 5 6 7 8 9 !0
Vezes '■m que a criança foi colocada para dormir
Figura 5-16. Duração d< . oro em duas se'rires de extinção em função d; ocasiões
sucessivas de ser colocado na c.-una (Williams. 1
- 113
O S não chorou a segunda vez que íoi posto na cama. Isso talvez seja atribuível à sua
fadiga de chorar na ocasião 1. Pela décima sessão, o S não mais choramingava, esperneava
ou chorava quando os pais deixavam o quarto. Em vez disso, ele sorria quando eles
saiam. Os pais notaram que ele emitia sons alegres até cair no sono.
Cerca de uma semana mais tarde, o S gritou e esperneou após a tia tê-lo colocado na
jama, provavelmente refletindo uma recuperação espontânea do comportamento de
birra. A tia reforçou, então, o comportamento de birra, voltando ao quarto do S e lá
permanecendo até que ele dormisse. Foi, então, necessário extinguir o comportamento
uma segunda vez.
A Fig. 5-16 mostra que a segunda curva de extinção é semelhante a primeira. Ambas
as curvas são similares às curvas de extinção obtidas com sujeitos subhumanos. A segunda
série de extinção atingiu o zero na nona ocasião. Nenhuma birra posterior, na hora de
dormir, foi relatada durante os dois anos seguintes.
Deve ser enfatizado que o tratamento, neste caso, não envolveu punição. Tudo o que
se fez foi suspender o reforçamento. Ocorreu, então, extinção do comportamento de
birra.
Nenhum pós-eíeito ou efeito colateral indesejável desse tratamento foi observado.
Aos três anos e 9 meses de idade, S parecia ser uma criança cordial, expressivae“ esperta”.
O uso do procedimento de extinção é geral, então, para enfraquecer a força de
qualquer operante. Em capítulos posteriores, veremos outras numerosas maneiras de
manipular a força do comportamento. Mas apenas com a aplicação simples de duas
operações principais —reforçamento e extinção podemos variar amplamente a força do
comportamento. A força do comportamento é um conceito importante na psicologia
devido a sua relação estrita com a probabilidade de ocorrência do comportamento.
Quando uma resposta existe com alta torça, sua freqüência é alta e a probabilidade de que
seja emitida em qualquer tempo determinado é também alta. Estas são, simplesmente,
maneiras diferentes de dizer a mesma coisa. Essa afirmação é verdadeira para homens e
animais. A análise do comportamento operante é, de modo geral, o estudo da forma e,
mais particularmente, da probabilidade de ocorrências de tais comportamentos. Se admi
timos que os conceitos do reflexo possam explicar os mecanismos simples da execução de
comportamentos tais como postura, caminhar e correr, então o território que resta para a
exploração psicológica parecer ser o inicio dos operantes. Logo, nosso interesse cen
traliza-se em situações que proporcionem uma escolha de comportamentos. Mesmo na
simples caixa de Skinner, onde frequentemente uma única resposta é medida, a escolha
está presente na “ liberdade” aparente do animal de responder ou não responder. Em
geral, nossa preocupação é com as causas do comportamento ou, em termos mais téc
nicos, com os controles sobre a emissão de respostas. Embora uma seqüência de compor
tamento possa estar integrada, de um modo reflexo, do inicio até o fim podemos ainda
estar interessados em saber porque ela começou. Embora todo este livro consista numa
série de respostas propostas a esta questão, já podemos perceber que as operações de
condicionamento e extinção fornecem dois princípios explanatórios poderosos. Uma
resposta pode não ocorrer, por exemplo, porque foi extinta.
“ Um aspirante a escritor que tenha enviado vários originais aos editores, tendo-os
todos rejeitados, pode dizer que ‘não consegue escrever nem mais uma palavra'. Ele
pode estar parcialmente paralisado com o que é chamado ‘câimbra de escritor’. Ele
pode ainda insistir que ‘deseja escrever’ e podemos concordar parafraseando-o: sua
- 114 -
probabilidade extremamente baixa de resposta é devida principalmente à extinção.
Outras variáveis continuam efetivas e, se a extinção não houvesse ocorrido, elas
produziriam uma alta probabilidade” (Skinner, 1953, pp. 71-72).
Figura 5-17. O poder da extinção. (Desenhado por Opie, 1961, The New Yorker
Magazine, Inc.).
-11 5-
ele e por outros. O ‘erotomaiuaco' frequentemente se ocupa com comportamento sexual
O dipsomaníaco’ bebe frequentemente" (Skinner, 1953 p. 62)
Embora nossa análise sobre c ■Míinção esteja muito longe de ser completa neste
capítulo, ela ilustra alguns dos principais efeitos conhecidos da retirada do reforçamento
na força do comportamento.
i- 0
5 40 70 10 20 30 40 50 60 70 80 90
Peso da barra (gramas) N úmero dc reforçamentos
(A) ( 8)
Figura 5-18. (A) Resistência à extinção em função do peso da barra (Capehart. Viney, e
Hulicka, 1958). (B) Resistência à extinção em função do número de reforçamentos
prévios (adaptado de Perin, 1942, e Williams, 1938).
-116-
a resistência à extinção da pressão, à barra, no rato, com o número de reforçamentos
prévios, que fortaleceram a resposta. Poderíamos supor, para o objetivo da presente
discussão que o experimento representado por (A) e (B) na Fig. 5-18 tivessem sido
efetuados no mesmo laboratório, com o mesmo aparelho e com as condições controladas
de modo que as únicas diferenças entre (A) e (B) consistissem das manipulações da
variável independente indicada.
Podemos iniciar nossa análise com a observação de que ambos os gráficos corres
pondem a nossa fórmula simples de um experimento: uma variável independente ligada a
uma variável dependente. Há, contudo, uma relação interessante entre os dois exemplos
da Fig. 5-18. Ambos (A) e (B) apresentam a mesma variável dependente, resistência à
extinção. Além disso, um exame mais detalhado revela que (A) e (B) têm um ponto em
comum. Para ver isso, considere a noção, implícita em (A), de que muitas variáveis foram
mantidas constantes; somente o peso da barra foi variado. Analogamente, implícita em
(B) está a noção de que muitas variáveis foram mantidas constantes; somente o número
de reforçamentos foi variado. Contudo, em (A) uma das variáveis mantidas constantes é a
variável independente de (B) e uma das variáveis mantidas constantes em (B) é a variável
independente de (A). Especificamente, todos os sujeitos em (A) receberam 90 reforça
mentos, enquanto que todos os sujeitos em (B) tinham uma barra que pesava 15 gramas.
Portanto, tem um ponto em comum: o ponto que representa 90 reforçamentos com uma
barra de 15 gramas.
O elo entre (A) e (B) da Fig. 5-18 torna-se mais claro com a representação gráfica de
ambas as funções num mesmo sistema de coordenadas. Será útil empregar um sistema de
coordenadas tridimensional, uma vez que há duas variáveis independentes e uma variável
dependente. Examine a representação tridimensional de (A) e (B) na Fig. 5-19. Nesta
figura, a Fig. 5-18A é mostrada como um polígono sombreado no plano xy enquanto
que a Fig. 5-18B é mostrada como uma seção cônica traçada no plano zy.
Figura 5-19. Representação das duas funções da Fig. 5-18 como duas superfícies num
sistema de coordenadas tridimensional.
-117-
As duas superfícies interceptam-se nos seus pontos comuns x = 15,2 90. (O fato de que
os limites das curvas das duas superfícies não coincidam precisamente pode ser explicado
pelas várias diferenças nos dois experimentos além das duas variáveis em consideração).
A Fig. 5-19 é um mapa que mostra o território da resistência à extinção limitado por
essas duas variáveis independentes. O mapa mostra que as duas funções da Fig. 5-18
fornecem informação compor tamental acerca dos efeitos do peso da barra e número de
reforçamentos somente numa pequena região do espaço possível.
A representação espacial da Fig. 5-19 sugere que o território pode ser mais eficiente
mente estudado num experimento onde ambas as variáveis independentes sejam manipu
ladas juntamente de modo a cobrir uma porção maior do espaço experimental. Uma
manipulação desse tipo poderia ser uma extensão do experimento de Capehart, Viney e
Hulicka (1958) onde o número de reforçamentos fosse manipulado juntamente com o
peso da barra. A especificação dos grupos para as várias combinações das variáveis inde
pendentes pode ser feita de acordo com o esquema que vem descrito na Tabela 5-1.
Tabela 5-1.
Especificação dos grupos de um Experimento para Estudar os Efeitos conjuntos do
Número de Reforçamentos Anteriores e Peso da Barra sobre a Resistência à Extinção.
A 50 5
B 50 15
C 50 30
D 100 5
E 100 15
F 100 30
G 300 5
H 300 15
I 300 30
As curvas hipotéticas da Fig. 5-20 sugerem que tipo de resultado pode ser obtido se
os grupos que recebem 30, 90, e 270 reforçamentos fossem estudados, usando-se os três
pesos da barra. Na Fig. 5-20, a representação é bi-dimensional, sendo que o valor de uma
das variáveis independentes (número de reforçamentos) é mostrado simplesmente como
um numeral pequeno à direita de cada curva. Essa representação é uma alternativa para a
Fig. 5-19. Representações bi-dimensionais como a da Fig. 5-20 são frequentemente en
contradas na literatura e são conhecidos como famílias de curvas, ou a forma paramétrica
da representação funcional. Essa última terminologia é uma forma aceita de se mencionar
as variáveis independentes que se sabe ou se acredita serem relacionadas a uma dada
variável dependente. “Parâmetro” é virtualmente sinônimo de “variável independente”
embora seja empregado especificamente para denotar as variáveis independentes
relacionadas a uma variável dependente comum.Os parâmetros da resistência à extinção
mostrados na Fig. 5-20, são, portanto, peso da barra e número de reforçamentos
-118-
200
150-
EXERCÍCIO 4
-119-
Capehart, J., Viney, W., and Hulicka, I. M. The efícct of effort upon
extinction. J . comp, physiol, Psychol., 1958, 51, 505-507.
Ebbinghaus, H. Memory (Translated by H. A. Ruger and C. E. Bussen-
ius). New York: Teachers College, 1913.
Frick, F. S., and Miller, G. A. A statistical description of operant condi
tioning. Amer. J. Psychol., 1951, 64, 20-36.
Guilford, J. P. General psychology. P rinceton: ,D. Van Nostrand, 1939.
Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New Y ork: Rine
hart, 1946.
Hearst, E. Resistance-to-extinction functions in the single organism.
J. exp. Anal. Behav., 1961, 4, 133-144
Hurwitz, H. M. B. Periodicity of response in operant extinction. Quart.
J. exp. Psychol., 1957, 9, 177-184.
Jenkins, J. G., and Dallenbach, K. M. Oblivcsccnce during sleep and
waking. Amer. J. Psychol., 1924, 35, 605-612.
Keller, F /S ., and Schoenfeld, W. N. Principles oj psychology. New Y ork.
Appleton-Century-Crofts, 1950.
Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts,
1963.
Kimble, G. A. Principles of general psychology. New York: Ronald
Press, 1956.
Mowrer, O. H., and Jones, H. M. Extinction and behavior variability as
functions of effortfulness of task. J. exp. Psychol., 1943, 33, 3 6 9
386.
Notterman, J. M. Force emission during bar pressing. J. exp. Psychol.,
1959, 58, 341-347.
Perin, C. T. Behavior potentiality as a joint function of the amount of
training and the degree of hunger at the time of extinction. J. exp.
Psychol., 1942, 3 0 ,9 3 -1 1 3 .
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950,
57, 193-216.
Skinner, B. F. Science and human behavior. New York: Macmillan,
1953.
Williams, C. D. The elimination of tantrum behavior by extinction
procedures. /. abnorm. soc. Psychol., 1959, 59, 269.
Williams, S. B. Resistance to extinction as a function of the num ber of
reinforcements. J. exp. Psychol., 1938, 23, 506-522.
-120-
SEGUNDA PARTE
- 123-
Os psicólogos estão principalmente interessados nas relações entre as atividades dos
organismos e outros eventos no mundo. Um sistema de notação que emprega eventos
ambientais e eventos comportamentais como termos fundamentais seria conveniente para
descrever inúmeros procedimentos psicológicos e, como veremos, tomaria possível uma
comparação analítica das operações. O esquema de notação esboçado em detalhe neste
capítulo é derivado de um sistema descrito inicialmente por F. Mechner (1959) e elabo
rado por Vicki Mechner (1963). Ao contrário do exemplo químico, a notação
comportamental que esboçaremos esquematiza somente aspectos de procedimento da
experimentação. Nesse sentido ele se assemelha à notação da eletrônica. Nesta, um
circuito é representado por símbolos e o resultado de tal circuito, quando uma voltagem
lhe é aplicada, deve ser descrito por funções que relacionam as variáveis independentes e
dependentes que operam no circuito. Ao ser usada, a presente notação poderia igual
mente ser suplementada com funções que relacionem as variáveis independentes
(mudanças em eventos ambientais) com as medidas do comportamento.
Ao nível da presente consideração, não tentaremos dar definições formais ou
rigorosas para as unidades que empregaremos para descrever os procedimentos
comportamentais: estas podem ser encontradas em outros capítulos. O nosso interesse
aqui é somente fornecer de uma maneira concisa e com o mínimo de comentários, vários
instrumentos de notação através de exemplos e problemas que ilustram os poderes,
características e limitações principais da notação R e S que é amplamente usada no
decorrer deste texto,
Em todos esses exemplos, algum organismo fez alguma ;oisa. De modo geral,
..entamos especificar a resposta em termos dos movimentos que o organismo faz, ao invés
de em termos das conseqüências desses movimentos. Então. “João rebatei a bola”
implica e que João levantou os braços de uma certa maneira e em corespondéncia com a
direção em que a bola vinha e, como uma conseqüência, a bola é rebatida. É impor;ante,
ao princípio, separar os eventos com portam entais de suas conseqüências.Portanto, ( 1 ) é
escrito melhor assim: “ Joao levantou o bastão” : e (3) é ('sciito melhor “ Eu movi minhas
-124-
pemas em tal e tal direção, segurando uma bandeja em minhas mãos e, eventualmente,
cheguei à mesa”. Chegar à mesa foi uma conseqüência do comportamento de mover as
pemas.
Note-se que, em cada exemplo, um organismo foi identificado. Seguiremos a
convenção de que cada especificação de uma R identificará o organismo para o qual o
evento e uma R. Deste modo, evitaremos confundir a R de um organismo com aquelas de
um outro.
Uma regra simples para identificar eventos respostas num texto de linguagem comum
é selecionar os verbos de ação. Já que uma resposta é um ato, os verbos de ação estão em
geral (embora não invariavelmente) associados a eventos resposta.
Os seguintes exemplos ilustram alguns eventos que não são eventos resposta.
Em (7), João nada fez. Houve uma ação sobre ele. Em ( 8 ), o furacão não é um orga
nismo, então não pode emitir respostas, tal como as conceituamos. Em (9), o governo
não consiste de um organismo individual que sofreu o colapso. O comportamento de um
indivíduo não está sendo descrito pelo colapso do governo. Rejeitamos (10) porque
morrer é um evento comportamental único para cada organismo e as respostas devem ser
eventos repetíveis. Em (11), o dormir, embora um fenômeno comportamental interes
sante, não deve ser interpretado como um evento resposta. Finalmente, a proposição que
diz “Jorge ficou cansado” é uma especificação grosseira de algum estado interior de
Jorge, mas não uma descrição de algo que ele esteja fazendo e, assim, não é um evento de
resposta.
Escreveremos os eventos resposta de várias maneiras. Podemos representá-los com
um R maiúsculo com um índice numérico ou em forma de letra e especificar, à parte,
ima chave com sua identidade verdadeira, como no exemplo
-125-
^(levantou)
e
^(correu)
Note que três pontos seguem cada uma dessas situações descritas. Isto porque
qualquer situação pode sempre ser descrita indefinidamente com maiores detalhes. Feliz
mente, precisamos descrever apenas os aspectos da situação nos quais estamos interes
sados. Na maioria das vezes, estes serão as mudanças no ambiente e que ocorrem de
-126-
uma situação para outra. Note também a ausência de quaisquer verbos de ação na
descrição de situações ambientais. A penúltima (17), parece ser uma exceção. Contudo, a
picada é uma situação (S) para o macaco (embora seja uma resposta da pulga). Esta
ilustração enfatiza a importância de se identificar sempre para cada evento R ou cada
evento S a que organismo Rs e Ss estão se referindo.
As situações (Ss) são escritas de forma semelhante às Rs. Podemos subscrever um número
ou uma letra como em
Embora muitas mudanças ocorram no ambiente num determinado momento, elas todas
constituem uma e somente uma situação: uma situação com muitas mudanças. Deve-se
depreender dessas considerações que, logicamente, só uma situação, em cada momento,
pode existir para qualquer organismo. Será conveniente usar o sinal + para combinar
mudanças separadas no mesmo evento S.
- 127 -
estímulo para esse evento R. Considere (19). Se você pressionar, R, o botão de partida,
então, o motor funcionará, S (funcionar). Em (20): Se você disser uma palavra, R, então,
você estará na cama sem o jantar, S(na cama + sem o jantar). Note que mudamos “você
será mandado” em (20) para a forma “você estará” . A mudança acentua a idéia crítica de
que os eventos ambientais acontecem para o organismo. Em (20), o mandá-lo para a
cama poderá envolver eventos resposta da parte de outro indivíduo (por exemplo, sua
mãe) mas desde que estamos discutindo você, este é um evento S para você. É muito
importante manter um quadro de referência consistente na notação de contingências. No
momento, vamos supor que podemos notar os eventos R e S de um e somente um
organismo de cada vez. Assim, não podemos misturar os eventos comportamentais de
dois organismos no mesmo diagrama e chamá-los Rs. No exemplo (21), se a maçaneta é
girada para a esquerda, R(girar para a esquerda), então a porta se abre S(porta se abre).
Os exemplos (22) e (23) também cabem na forma se R, então S.
De um modo geral, uma contingência especifica a dependência de uma mudança
ambiental de um evento anterior de comportamento. Embora as contingências sejam
muito frequentemente especificadas no tempo futuro (veja os exemplos prévios) deve
estar claro que elas são regras baseadas em observações feitas no passado. Podemos
usualmente ler a dependência dada por uma contingência com: se Rf então S. Uma
maneira equivalente de descrever essa dependência de S sobre R é observar que, numa
contingência comportamental R conduz a S, ou R produz S. Estas últimas formas tem
uma utilidade tão geral que existe um símbolo especial, -> , cujo significado é conduz a
ou produz. Então, podemos escrever os exemplos de contingências de (19) a (23) como
se segue.
(19a) R (pressionar)-----> S (m otor funciona)
(20a) R a -----> S a
-123-
(27) Quando acordei, podia ouvir Joseila já movimentando-se na cozinha.
(28) Se continuar a chover, a lavoura será destruída.
S, [ 6. 1]
- 129 -
onde Sa = leite à sua frente
R = beber
Sb - sobremesa
O diagrama [ 6 . 1 1 é lido: quando o copo de leite estiver à sua frente e, se você o beber,
então ganhará a sobremesa. O diagrama [ 6.1 | é o tipo mais simples possível de diagrama
de contingência a ser escrito na notação. Ele mostra duas situações, uma inicial e uma
segunda —as conseqüências de R. Ele especifica um evento resposta. Embora os diagra
mas que se sucedem sejam mais complicados, todos eles contêm como elementos a idéia
expressa em [ 6 .1 1 Isto é, em alguma Sa, se uma R é emitida, entio Sg ocorrerá. As
contingências que se adaptam ao diagrama [ 6.1 j são melhores lidas como:
quando ou
enquanto ou R -----> SB
durante ou SA
logo após se então
Raramente encontramo-nos numa situação onde possamos fazer apenas uma coisa
que tenha conseqüências. Normalmente, existem diversos comportamentos que podería
mos desempenhar em cada situação, muitos dos quais poderiam produzir mudanças
significantes no ambiente, ou conseqüências. Por exemplo, ao estar sentado diante da
máquina de escrever, lá estão quarenta ou mais teclas que podem ser batidas, cada uma
produzindo uma conseqüência diferente. Poderíamos também colocar e tirar o papel,
apagar as letras com a borracha, mudar a fita, etc. Além disso, se o telefone estiver perto,
poderemos telefonar. Se uma segunda pessoa estiver próxima, podemos solicitar seus
préstimos e sermos atendidos. Pode-se continuai enumerando indefinidamente várias
atividades possíveis nessa situação, todas com conseqüências distintas. Resolvemos este
problema na notação escrevendo somente quantas dessas contingências desejarmos notar
e isto é feito com a simples adição de Rs nos colchetes. Assim, se estivermos interessados
em notar as contingências do bater em qualquer tecla de uma máquina de escrever e
produzir uma letra, ou do discar um número num telefone, ou do pedir um copo de água,
poderíamos escrever:
Sa (na máquina de escrever, perto do telefone, amigo próximo)
Rl (bater na tecla) S(ietra) ^ 2\
R2 (discar o número) -» S (aiguem responde)
R3 (pedir água) —> S(um copo com água é trazido)
-130-
SA
Ri SB
R 2 —>
[6.3]
R .3 SD
R4 sE
SA
R{ ----r—> Sb
R2 — 1 [6.4]
R a- 1
Para um exemplo mais específico, considere as maneiras pelas quais podemos chamar um
garção à nossa mesa. Podemos chamar “garção” , podemos fazer um sinal ao garção mais
próximo com as mãos ou podemos meramente olhar na direção do garção, fixando
nossos olhos nos dele.
- 131 -
(nao luí garçao à nossa mesa)
S(o garção vem) [6.5]
(cli am a r o ga rç ão) _____
R(olhar o garção)
0 diagrama | 6.5 | ilustra um método útil de especificar Sa, a situação inicial. Para produ
zir o diagrama 16.5 [ escrevemos primeiro todos os com portam ento* envolvidos. Então,
escrevemos a conseqüência principal, “ o garção vem até nós’\ Finalmente, para d eter
minar o melhor método de especificar Sa, verificamos apenas qual seria o oposto da
conseqüência. Neste caso, é simplesmente ‘‘nenhum garção à nossa mesa” . Quando
casos,complexos, contêm muitos Ss, é frequentemente útil obter o oposto de cada S, pois
o oposto pode dar uma pista de como iniciar o diagrama.
Nos diagramas 6.1 a 6.5, Rs produziram Ss. Sempre que uma R conduzia a uma nova
situação, esta era incluída num colchete vertical ao longo da situação em vigor. Mas,
nesses diagramas, a conseqüência S foi escrita sozinha, fora do colchete. Um S fora de um
colchete usualmente indica que nenhuma contingência especial (em que estamos interes
sados) se mantém nessa situação. Então, o significado de Sg sozinho em 16.1 Jé o mesmo
que:
Aqui se infere que a R em questão, R (beber)’ n^° m a*s tem quaisquer conseqüências
especiais uma vez o organismo alcance Sg. Assim, a ausência de qualquer R detenninada,
num colchete, implica que se esta R fôr emitida durante aquele S, nenhuma conseqüência
especial ocorrerá. A ausência de quaisquer conseqüências especiais para uma R define um
caso especial de uma contingência e é chamada de contingência nula. Assim, a ausência
de qualquer R determinada em qualquer colchete implica que a contingência nula está
em ação para esta R durante o S deste colchete. Além disso, o aparecimento implica na
contingência nula de um S fora de um colchete nesta situação para todas as Rs em con
sideração.
Ocasionalmente, em alguma situação, digamos S, desejamos enfatizar que uma R que
anteriormente tinha uma conseqüencia, não a tem mais. Uma maneira de fazer isto seria
simplesmente omitir a R do colchete que inclui Sa ^ mas para enfaiizar, pode ser ade
quado escrever:
S*
R R
os quais são ambos lidos: durante Sa, R não mais produz quaisquer conseqüências espe
ciais. Ambos são equivalentes a
Sa ou [S„
* todas as q u atro form as ilustram m aneiras diferentes de escrever a contingência nula.
- 132 -
6.7 A DURAÇÃO DAS SITUAÇÕES E DAS CONTINGÊNCIAS
As situações não duram indefinidamente, façamos ou não alguma coisa para muda
las. Podemos subir num ônibus somente enquanto ele permanece no ponto. Podemos
acenar para o garção enquanto ele está à vista, mas eventualmente ele desaparece e
nossos sinais não são eficazes. As crianças frequentemente têm um limite de tempo para
beber o leite. Depois disso, não haverá sobremesa, independentemente do que elas façam.
O fato de que muitas situações e contingências tenham uma duração de tempo definida a
elas associada, leva à introdução do símbolo T que representa a duração dc tempt'). O uso
de T é direto. A situação (S j), que dura um tempo T, e escrita:
SA
T -* S n
Nenhuma contingência foi escrita nesses colchetes já que nenhuma conseqüência para
quaisquer comportamentos foi especificada. Se houvesse sido especificada alguma, então
as Rs teriam sido colocadas nos colchetes.
Algumas vezes, apenas um valor aproximado de T é conhecido. Então, se estamos
esperando que alguém saia da cabine telefônica para que possamos fazer uma chamada,
não podemos estar certos de quanto tempo a situação de S(cabine tejefônica ocupada)
- 133-
durará- O máximo de que somos capazes, nessas condições, seria estimar uma media do
tempo de espera, digamos 5 minutos, em media. Uma média de T, assim especificada, é
escrita T, onde o - indica “em media”. T é usado exatamente da mesma maneira que
T. Por exemplo:
O diagrama 6.7 ilustra mais duas características da notação. Primeiro, as setas sempre se
originam nos Ts (ou Rs), nunca nos Ss. Quando um S sucede outro, a seta deve vir de um
T (ou de- R). Segundo, a posição vertical de T e S, num colchete, é irrelevante. Um pode
estar abaixo ou acima do outro. Os eventos dentro de um colchete entram em ação
simultaneamente.
Quando mais de uma ocorrência de uma dada resposta é necessária para produzir
alguma conseqüência S, este fato pode ser indicado de uma ou duas maneiras. Antes de
tudo, o evento, comportamental associado com a contingência pode ser definido em
termos do número de elementos requeridos. Então, o exemplo “ escreva uma palavra no
quadro negro 100 vezes e, então, você pode ir para casa” , poderia ser notado assim:
Ra Sa
Si
Rn.a ^ Sa
S,
on de s j = dent ro da sa1a de au 1a
Ra = escrever uma palavra
Sa = permissão para sair
n = 100
Assim como o T, algumas vezes pode-se conhecer apenas o valor médio de a. Quando
somente o número médio de respostas requeridas para uma mudança S é conhecido,
escrevemos n.
-134-
6.9 CONTINGÊNCIAS REPETITIVA.
SA Sb
Ra |T -
2
, 16.8|
onde S a " à máquina de escrever, teclado em repouso.
Ra - ^ater numa tecla
S[} a letra aparece
j pequena fração de segundo.
No diagrama 16.8 | representamos o fato de que numa situação S^, podemos bater numa
tecla e produzir uma marca na página e na outra S b , não podemos obter esse efeito
batendo na tecla. Para nos referirmos às duas contingências distintas (uma das quais,
naturalmente, é o caso nulo) subscrevemos os numerais 1 e 2 embaixo dos colchetes.
Outros exemplos de contingências repetitivas simples são:
- 135 -
(31)A ave recebe uma apresentação de 3 seg de alimento cada vez que bica o disco.
(32)Você pode encher sua caneta tintoiro colocando-a no tinteircr e empurrando o
émbolo. (Aqui, o T da contingência 2 é bem longo, dependendo do quanto você
escreve).
(33)Cada pressão no gatilho faz a arma disparar um tiro.
Similarmente, você pode obter muitas garrafas de uma máquina de Coca-Cola, inserindo
as moedas, mas você deve remover cada garrafa para que a próxima moeda seja eficiente.
Em resumo, há dois modos principais de reciclar uma contingência repetitiva: através
da passagem de tempo (indicado por T ^ ) } no por meio de um evento resposta (indicado
por R -----1 )
6.10 FAC1LITAÇÃO
136-
onde S24 =■término da linha
$23 - a letra aparece
Ra = pressionar o soltador de margem
Rb = bater na tecla
T - pequena fração de segundo
Rj -----> R 2 *
- 137-
o tempo está intimamente ligaao às contingências negativas, porque é sempre alguma
duração de inatividade que produz as conseqüencias.
Ao considerar as contingências negativas, é útil levar em conta todos os
comportamentos possíveis, exceto a R determinada, como uma classe única de
comportamentos. Embora essa classe seja, em geral, muito diversa e não bem
especificada, podemos estar certos de que, pelo menos, não incluirá R como membro.
Para indicar esse conjunto complementar de comportamentos que não inclui R comc
membro, empregamos o símbolo R (lê-se “ R barra”) para referirmo-nos a todos os
comportamentos, exceto R. Desde que, como notamos, é sempre uma certa duração de R
(não executar R) que produz as conseqüências, devemos sempre subscrever um T para R.
Assim, “a menos que paguemos nossa conta de telefone dentro de duas semanas, a partir
do momento em que a recebemos, o telefone será cortado” é diagramado assim
[6.10]
on(^e Sa = recebimento da conta
R = pagar a conta
T = 1 4 dias
Sb = telefone cortado
Note que R não está representada na chave como qualquer comportamento específico.
Todavia, sua R complementar está especificada na chave, embora apareça no diagrama
real apenas por implicação (isto é, se a quantidade de T de R não ocorre, então fT deve
ocorrer). Assim, R é sempre definida em relação a R de modo que uma ou outra deve
ocorrer, mas, evidentemente, ambas não podem ocorrer. Em [6.10 [ se a quantidade T de
R ocorrer, então, o telefone será cortado, mas se.R ocorrer, então nada de especial
acontecerá. Uma vez que R não está representada em [6.10,] isto significa que R está
numa contingência nula com relação a S a e Sg e, realmente, isto é verdadeiro. Não
pagá-la (duas semanas de qualquer coisa, exceto pagá-la) resulta nas conseqüências.
Como um guia geral, observar-se-á, frequentemente, que Sg nessas contingências
negativas, é um evento aversivo ou indesejável. Logo, 6.10 pode ser tido como uma
prescrição para a produção de eventos aversivos. Logicamente, isto significa que é
também uma prescrição para evitá-los e é isto precisamente o que desejávamos notar
quando introduzimos este tipo de exemplo.
- 138-
Em geral, quando o comportamento pode ter um número de conseqüências possíveis,
devemos escrever
onde S\ = chuva
T24 = 24 horas
5 2 = dia de sol
5 3 = mais chuva
6.13 DISCRIMINAÇÕES
-139-
§
R(vermelha) -r S
4(alimento)
y(pressionar)
S" [6. 11]
R(alaranjado)
(girar a roda)
- 140 -
depende de S, mas, a mçjios que o objeto seja encontrado sempre no mesmo lugar, S sera
variável. O diagrama [6.13 (representa este caso
Sc [6.13J
Rj, * S2
0 tempo (T) tem sido usado como referência à duração de situações e contingências.
Algumas vezes, é útil representar por um único T a duração de um conjunto inteiro de
contingências. Para indicar essa possibilidade, uma nova facilidade notacional deve ser
desenvolvida. Considere que a época dos morangos vá de março a setembro, isto é, 7
meses. Se você vai à mercearia durante esta época, encontrará morangos anunciados e em
exposição. Se você perguntar se há morangos para vender, receberá uma afirmativa.
Naturalmente, a mercearia não permanece aberta 0 dia todo. A loja abre às 9 horas e fecha
às 18 horas. Aqui, temos dois ciclos de tempo independentes. Primeiro, temos a época
dos morangos que dura 7 meses e a época em que não há morangos, que dura 5 meses.
(9 horas) T( 15 horas) __
[ (mercearia aberta) S(mercearia fechada)
Precisamos conseguir uma maneira de combinar as situações e ciclos de tempo. O diagra
ma 6.14 mostra esta representação. Aqui, os colchetes aparecem agrupados dentro de
colchetes.
- 141 -
0 T 7 meses e o T 5 meses aplicam-se à duração de todas as contingências neles incluídas.
T 2 é incluído apenas para permitir a reciclagem do seu pedido de morangos. Provavel
mente, leva um certo tempo para que você profira as palavras e tenha a primeira caixa em
suas mãos. Então, você pode pedir novamente e receber outra caixa. O exemplo mostra
um agrupamento tríplice. Uma vez que uma e somente uma situação pode estar presente
em qualquer tempo, Sg inclui muitos dos elementos de S\
- 142-
Capítulo 7 REFORÇAMENTO INTERMITENTE
- 143-
ou mais tentativas o jogador perde a vez. O cinemeiro inveterado, talvez raramente vcj«
um bom filme, mas seu comportamento de ir ao cinema semanalmente permanece forte.
Neste capitulo, analisaremos alguns dos princípios do reforçamento intermitente que
foram isolados no laboratório com sujeitos animais e humanos e mostraremos alguns dos
muitos procedimentos possíveis. ( 1 )
As fases transitórias b c c são ilustradas com dados reais na Fig. 7-2. Esta figura repre
senta as sessões 2, 3 c 4 da resposta de bicar o disco (chave) de um pombo, que recebia
alimento de acordo com o procedimento condicionamcnto-cxtinção descrito acima. As
curvas da Fig. 7-2 foram “empilhadas” ; isto c, foram tiradas do seu sistema de coorde
nadas usual e colocadas horizontalmente mais próximas, para economizar espaço e faci
litar a comparação. As taxas reais de resposta em qualquer momento e também o número
de respostas acumuladas emitidas cm qualquer momento podem ser estimados por com
paração com a pequena chave inserida na parte inferior direita da figura.
O procedimento descrito é uma das várias maneiras possíveis em que um experi-
mentador pode programar contingências de reforçamento em relação ao tempo. No caso
em questão, o experimentador estabeleceu um intervalo fixo de tempo entre o último
reforçamento c o restabelecimento da contingência de reforçamento. Até que esse inter
valo fixo tenha passado, nenhuma resposta pode ser reforçada. Tal procedimento fixa o
tempo entre o reforçamento e a próxima contingência de reforçamento e, por isso, é
apropriadamente denominado um esquema de Intervalo Fixo (abreviado por IF). Note,
todavia, queo intervalo de tempo entre o recebimento de quaisquer dos reforçamentos
reais nao c fixo.
- 144-
Reforçamento (tempo)
(1) Faz-se necessária uma palavra a respeito do delineamento dos experimentos sobre
reforçam ento interm itente discutidos neste capítulo. É típ ic o desses experimentos que os
sujeitos sejam inicialm ente treinados num esquema c rf de reforçam ento. Somente
q u a n d o uma taxa estável de resposta é estabelecida sob as condições c rf o
e x p e r im e n ta d o r in tr o d u z as in te rm itê n c ia s desejadas.
- 145-
Embora o valor mínimo deste intervalo seja o tempo fixo entre um reforçamento e o
estabelecimento de uma contingência, seu valor real depende de quão rápido a resposta
ocorre depois que a contingência entra em efeito. O elemento básico aparece em notação,
assim
DIA
24 68 144
O O O
-146-
Num experimento, pombos famintos foram expostos 16 horas por dia a contin
gências de reforçamento com alimento em IF -3 0 min, em 144 dias consecutivos, repre
sentando uma história experimental dc mais de 1.300 horas. O comportamento de bicar a
chaye foi mantido através do experimento e verificou-se a natureza transitória de certos
efeitos de IF Na Fig. 7-3, as mudanças no padrão de resposta são ilustradas através do
registro de comportamento de um animal durante intervalos interreforçamento selecio
nados, obtido nas sessões 24, 68 e 144. A mudança progressiva de uma ondulação gradual
para uma ondulação abrupta é evidente.
IR 4 min
Figura 7-4. Registros cumulativos de animais em IR 4 min, obtidos nas sessões iniciais
(4a. ou 5a.) e Finais (15a., 17a. ou 20a.) (Millenson, 1963).
Contingências em IF não são raras na vida cotidiana. O conteúdo de uma panela
ferve, aproximadamente, após um certo tempo fixo que o calor é aplicado. Os ônibus que
andam no horário reforçam a espera dos passageiros no ponto em intervalos fixos. O fato
dc o IF não manter um nível constante de comportamento num período de tempo é,
com freqüência, um obstáculo importante para o seu uso no controle prático do compor
tamento. Em cursos universitários, onde a principal contingência estabelecida é um
exame final, muitos estudantes trabalham muito pouco durante o curso. Poucos dias
antes do exame final, ocorre um frenesi de atividades.
Suponha que os intervalos de tempo entre o reforçamento e a próxima contingência de
reforçamento tenham durações aleatórias e sejam imprevisíveis. O resultado é um novo
tipo de procedimento chamado esquema de Intervalo Randômico (IR). Este esquema
pode ser especificado apenas pelo intervalo médio entre o reforçamento e o restabele
cimento da contingência. Para dar alguma indicação da variação em intervalos que pode
ser encontrada, num esquema de IR 1 min, por exemplo, cerca dc 95% dos intervalos
entre o reforçamento e as contingências de reforçamento cairão na faixa de 0 a 2
minutos. A exposição inicial a um procedimento IR após uma história em crf, produz
somente os dois primeiros estágios de transição descritos para a IF na Fig. 7-1. O resul-
- 147 -
tado final em IR é uma taxa de resposta estável e uniforme, cujo registro cumulativo não
apresenta desvios sistemáticos de uma linha reta (ver Fig. 7-4).
- 148 -
segue as leis do comportamento operante, mas ele nem sempre é facilmente medido. No
procedimento de Holland (1958), sujeitos humanos foram instruídos a examinar um
marcador e relatar (pela pressão de uma chave telegráfica) cada deflexão observada a
partir de um ponto zero. Ambos, marcador e sujeito, todavia, estavam num quarto escuro
e o marcador podia ser visto somente após a pressão de uma segunda chave telegráfica
que fornecia iluminação por uma fração de segundo. Deste modo, Holland estabeleceu
um operante convenientemente mensurável que se correlacionava com o comportamento
de “ observar” do sujeito; para olhar o marcador, o sujeito tinha que pressionar uma
chave. Para colocar o comportamento de pressionar a chave sob um esquema similar ao
de intervalo randômico, o experimentador programou deflexões no ponteiro (reforça
mentos) separadas por diferentes intervalos de tempo. Os intervalos não eram propria
mente randômicos, mas tinham durações variadas. O procedimento é um exemplo do que
é chamado um esquema de Intervalo Variável (TV). Sob as condições de Holland, o
esquema manteve taxas de pressionar a chave (resposta de observação) superiores a uma
resposta por segundo. Holland pesquisou os efeitos da mudança do intervalo médio entre
asdeflexões programadas do ponteiro. Começando com um intervalo médio de 15 seg,
ele aumentou progressivamente o intervalo médio para 30 seg, 1 min e, finalmente, 2
min, em várias sessões consecutivas. A fig. 7-5 mostra os resultados obtidos com um de
seus sujeitos, um homem alistado ha Marinha dos Estados Unidos. Os padrões de taxa
observados estão de acordo com qs estudos animais sobre os efeitos comportamentais
deste esquema (Ferster e Skinner, 1957). Os resultados de Holland na Fig. 7-5 indicam,
além disso, que o IV produz uma taxa de resposta que tende a aumentar à medida que o
intervalo médio entre as deflexões (reforçamentos) diminui. Uma implicação interessante
desta descoberta é que, se as deflexões forem transitórias (isto é, se durarem apenas
pouco tempo), então menos deflexões serão perdidas (isto é, mais serão observadas)
quando o intervalo médio entre elas for pequeno. Então, um homem que observa uma
tela de radar onde os sinais raramente ocorrem tem uma boa chance de perder um sinal
transitório crítico quando este aparece , porque é provável que sua taxa de observação
seja baixa. Os resultados da Fig. 7-5 sugerem a possibilidade de se inserir sinais artificiais
suplementares para manter a taxa de observação alta, ao nível que assegurará a detecção
de todos os sinais críticos.
7.2 PROBABILIDADE DE REFORÇAMENTO
- 149 -
reforçamento 1 , após intervalos fixos, randômicos e variáveis, durante os quais essa
probabilidade era 0. Mas o campo dos esquemas dc refo.çamento não é, de modo algum,
restrito a misturas temporais, embora complexas, dos extremos superiores e inferiores da
probabilidade de reforçamento.
É possível, por exemplo, construir um esquema no qual a probabilidade de reforça
mento para uma determinada resposta seja a mesma o tempo todo. Certas situações da
vida real aproximam-se desses esquemas de probabilidade constante ou uniforme de
reforçamento. Os resultados de se atirar uma moeda não viciada ocorrem em tais
bases probabilísticas. Numa aposta, por exemplo, uma série de lançamentos pode ser
feita e eventualmente obtém-se o reforçador desejado, digamos, cara. Todavia, a cara
pode não aparecer em um grande número de lançamentos, embora a probabilidade de se
obter cara, em qualquer lançamento, seja uniformemente constante e igual a 1/2. A
Tempo (minutos)
Figura 7-6. Taxas dc respostas acumuladas quando o bicar c reforçado num esquema dc
probabilidade* uniforme (dados de J. Farmer).
- 150 -
imprevisibilidade de um lançamento de moeda é característica da probabilidade uniforme
dc contingências de reforçamento. Apostar e jogar, em geral, são realmente probabilís-
ticos deste modo. Se o bom tempo é tido como um reforçador e o comportamento de ir
ao piquenique é efetuado, o reforçamento ocorre probabilisticamente. Podemos
consultar o departamento de meteorologia para confirmar o número de dias bons previs
tos para junho. Mas, embora a probabilidade de que faça bom tempo possa ser muito
alta, nosso comportamento de ir ao piquenique pode, ainda assim, não ser re fo rç a d o com
um dia bom.
Geralmente, partimos do princípio de que, em qualquer período de tempo determi
nado, é vantajoso para o indivíduo ganhar tantos reforçamentos quanto possível. Na
extensão em que esta generalização é verdadeira, diante de um esquema de probabilidade
uniforme a melhor estratégia é responder tão frequentemente quanto possível. Se somos
pagos para achar conchas bonitas numa praia, quanto mais conchas examinarmos, mais
conchas bonitas encontraremos. Isto é verdadeiro seja qual fôr a probabilidade de encon
trar conchas bonitas. Algumas praias podem permitir-nos uma probabilidade mais alta do
que outras, mas, em qualquer praia, será vantajoso para nós examinar tantos espécimes
quanto possível . Outro modo de dizer isto seria afirmar que é vantajoso que o nosso
comportamento de examinar/tenha a máxima taxa possível.
Um pombo faminto, exposto a um esquema de probabilidade uniforme de reforça
mento com alimento desta natureza, rapidamente se ajustará a uma estratégia ótima, se a
probabilidade fixada não foi muito baixa. O esquema gera taxas de resposta extrema
mente altas ("Brandauer, 1958).
A figura 7-6 é uma amostra de alguns resultados típicos obtidos neste esquema, onde
a probabilidade de receber alimento por bicar era de 1/25. Em alguns momentos na Fig.
7-6, o pombo estava bicando a uma taxa de três por quatro respostas por segundo p o r
oeríodos consecutivos. Quando Sidley e Schoenfled (1964) expuseram pombos a vários
valores de probabilidade dc reforçamento variando de 1 até 1/160, obtiveram a interes
sante função da Fig. 7-7. Fm seu estudo, a taxa total de respostas foi maior quando a
2.50-
fz.oo1
I 1.50-
O
8 1.0 0 -
od
0.50
- 151 -
1.3 NOTAS TEÓRICAS SOBRE ESQUEMAS DE REFORÇAMENTO
Podemos resumir a importancia sistemática das seções 7.1 e 7.2 pela observação de
que um esquema é um conjunto de regras que especificam: ( 1 ) quando estabelecer uma
contingência de reforçamento; (2) quanto tempo mantê-la em vigor; (3) qual valor da
probabilidade de reforçamento atribuir a ela. Quando as variações nessas três condições
são permutadas com os diversos parâmetros de resporta a serem discutidos no próximo
capítulo, as possíveis variações de procedimento para manter operantes tornam-se
enormes. Pressionados no sentido de economizar representações, os teóricos têm desen
volvido representações tais como as da Fig. 7-8 para descrever e relacionar os vários
Probabilidade uniforme
^ de 1/5___________
- 152-
os esquemas trequentemente sâo programados de modo a liberar reforçamentos numa
ocasião cm que o indivíduo, provavelmente, estaria respondendo como um certo tipo de
taxa, alta ou baixa, dependendo do esquema particular, Dc acordo com a lei familiar do
fortalecimento operante, o comportamento que ocorre imediatamente antes do reforça
mento tem sua probabilidade aumentada ou mantida. Nossa analogia com a concha
levou-nos à conclusão dc que, num esquema de probabilidade uniforme, por exemplo,
quanto mais alta a taxa dc resposta, tanto mais provável torna-se um reforçamento num
determinado intervalo curto dc tempo. Neste tipo de esquema, então, uma taxa alta de
resposta frequentemente precederá o reforçamento.
Os esquemas de intervalo, logicamente, apresentam, no conjunto, uma contiguração
diferente. Nestes, admitindo-se que o organismo responda pelo menos uma vez por
intervalo, taxas mais altas não aumentam a probabilidade do reforçamento. Isto porque o
restabelecimento da contingência dc reforçamento no intervalo é independente do com
portamento do animal. Ela é estabelecida por um relógio no caso de um esquema IF, e
por um contador Geiger ou outra fonte aleatória no caso do esquema IR.
Nada que o animal faça pode apressar a liberação do reforçamento. De fato, quanto
mais tempo o organismo esperar antes dc responder, maior a probabilidade de reforça
mento quando finalmente ele responder. Num esquema IF por exemplo, a probabilidade
de reforçamento c igual a 1 /se o organismo esperar todo o período de IF^ antes de
responder (veja o painel IF, Fig. 7 -8 ). Essas relações entre esperar c, então, responder,
sugerem que os esquemas dc intervalo agem dc modo a retardar a taxa dc resposta.
- 153-
Os esquemas de probabilidade uniforme de reforçamento também produzem maior
resistência à extinção do que crf. Um experimento feito por Weinstock (1954) dizia
respeito à extinção do comportamento após valores diferentes de probabilidade de refor-
çamento no treinamento. Um aparelho com uma pista, semelhante ao visto na Fig. 7-10
-154-
que levou mais tempo para que seu comportamento de correr fosse enfraquecido pela
extinção. Na faixa das probabilidades pesquisadas, portanto, a diminuição da probabili
dade de reforçamento aumentou a resistência à extinção, medida pela volta da veloci
dade do correr ao nível operante. Note que esta proporcionalidade inversa não pode ser
mantida abaixo de algum valor mínimo de probabilidade porque, se a probabilidade de
reforçamento se torna muito pequena (aproximando-se de 0 ), o fortalecimento original
será impossível.
Por que as contingências intermitentes aumentam a resistência à extinção? Uma
explicação prende-se à observação de que, depois de uma história de reforçamento inter
mitente, a extinção não parece muito diferente do procedimento de fortalecimento real.
Durante um reforçamento intermitente de qualquer tipo, ocorrerão períodos de extinção
quando nenhum reforçamento estiver disponível para a resposta. Nesse sentido, toda a
história de reforçamento intermitente do animal lhe diz que um período de extinção
leva, eventualmente, ao reforçamento. Na verdade, o esquema ensinou perseverança ao
animal.
7.5 OUTROS EFEITOS COMPORTAMENTAIS DO REFORÇAMENTO INTERMI
TENTE /
Os esquemas de reforçamento são, obviamente, procedimentos que manipulam taxas
de resposta. É bastante surpreendente que a maioria de nossas informações sobre seus
efeitos comportamentais seja derivada de análises de taxas de resposta durante e em
seguida à exposição a eles. Ainda assim, é válida a questão de como tais procedimentos
afetam a constelação total de comportamentos de um indivíduo. Uma resposta parcial
poderia ser na forma de proposições que descrevem como os esquemas afetam proprie
dades do comportamento tais como a topografia da resposta, a magnitude da resposta a
ordem seqüencial do responder, etc.
Lane e Shinkman (1963) estudaram os efeitos de um esquema IVsobre a amplitude
e duração do p ia r no pinto. Este operante foi inicialmente fortalecido pelo reforça
mento de cada piar no pinto, por um pintinho faminto, com uma breve apresentação de
alimento. Seguindo-se esse treino, o piar foi reforçado intermitentemente num esquema
de IV 100 segundos. Na fase final do experimento, o piar foi extinto. Os resultados
mostraram que a duração e amplitude da resposta de piar eram altamente estereotipadas
durante o crf, tomando-se significativamente mais variáveis durante o procedimento IV
Mas a extinção produziu um nível ainda mais alto de variabilidade nas medidas das
respostas.
Quando a duração da pressão à barra de um rato foi analisada sob esquemas de
probabilidade uniforme, notou-se que ela era extremamente estereotipada sob crf, algo
mais variável durante contingências de probabilidade uniforme e extremamente variável
na extinção (Millenson, Hurwitz e Nixon, 1963).
Os dados parecem apoiar a generalização de que a variabilidade de comportamento
parece aumentar progressivamente sob condições de crf, esquemas intermitentes e extin
ção, nesta ordem.
-155-
terísticos associados a eles. Desta maneira, examinamos os processos de condicionamento
Pavloviano e operante e da extinção. Neste capítulo vimos que os estados transitórios —
que são os produtos iniciais da exposição a esquemas de reforçamento —constituem um
conjunto distinto de processos comportamentais. Embora tais processos sejam impor
tantes no estudo do comportamento, seus pontos finais são, pelo menos, de igual impor
tância. Assim, um reforçador é definido tanto em termos de sua capacidade de manter
0 compoitamento nos padrões característicos do esquema como em termos de sua capa
cidade de aumentar as taxas de respostas durante o processo de fortalecimento operante.
A manutenção do comportamento por contingências intermitentes aproxima-nos dos
nossos próprios comportamentos cotidianos, muitos dos quais foram fortalecidos ou
adquiridos no passado remoto e mantidos, daí em diante, por reforçamento intermitente.
No laboratório, esta manutenção permanente do comportamento pode ser melhor
descrita pelos chamados estados estáveis. As medidas comportamentais atingem estados
estáveis ao final de seu “ processo’' ou aspecto transitório. Por exemplo, as curvas da
sessão 144 da Fig. 7-3, provavelmente, representam um estado estável do comportamento
sob as contingências de IF Similarmente, as curvas de IV da Fig. 7-5 parecem ser
representativas do desempenho final nesses tipos de esquemas. Um esquema IV ou IR
pode gerar taxas estáveis moderadas de resposta por longas sessões, dia após dia, indefini
damente.
O fato de que os esquemas podem levar a estados estáveis de comportamento, que
podem ser mantidos indefinidamente, sugere que esses estados podem servir como
linhas-base adequadas, a partir das quais pode-se avaliar os efeitos de numerosas variáveis
sobre o comportamento. A noção de uma linha-base é bastante familiar. O nível operante
foi usado como linha-base para determinar se o fortalecimento de uma resposta ocorreu.
Podemos usar um desempenho que está sendo mantido no momento por um esquema
como uma linha-base. Em capítulos posteriores, os efeitos das mudanças de estímulo,
contingências interpoladas e de outros procedimentos em tais linhas-base ajudarão a
definir muitos conceitos psicológicos importantes. Como uma ilustração da técnica geral,
devemos nos contentar, no momento, com uma demonstração do efeito de uma droga
tranquilizante sobre o comportamento estável. Dews (1955) estudou o efeito do pento
barbital no responder estável de pombos em IF Depois de ter exposto os pombos às
contingências IF 15 minutos o bastante para o surgimento de um padrão estável, Dews
injetou pequenas quantidades de droga nos animais durante certas sessões. Observou,
então, os efeitos no padrão de IF Neste experimento, a variável independente foi a
quantidade de droga injetada e a variável dependente foi a mudança no comportamento a
partir do estado normal cm IF (ver Figs. 7-2 e 7-3). Para estar certo de que qualquer
efeito observado pudesse ser atribuído apenas à droga e não ao distúrbio causado pela
propria injeção, uma solução salina foi injetada nos animais em outras sessões Até um
certo nível de concentração de droga, Dews não observou efeitos no comportamento — o
desempenho continuou semelhante aquele sob o IF normal. Com concentrações acima de
1 mg de pentobarbital, ocorreu uma mudança significativa. A taxa total foi reduzida em
cerca de 75%, e a ondulação característica do IF foi praticamente perdida, sendo substi
tuída por uma taxa de resposta constante e muito baixa através do intervalo fixo.
Este é um exemplo relativamente simples dc uma sub-areada ciência do compor
tamento aplicada muito ampla e em expansão, conhecida como psicofarmacologia — o
estudo da ação de drogas no comportamento. Muitas firmas farmacêuticas mantêm atual
mente laboratórios comportamentais exclusivamente para o estudo dos eteitos de novas
-156-
drogas no comportamento animal. Na exploração de uma nova droga, muitas linhas-base
devem ser usadas. Uma droga não afetará todos os padrões de comportamento da mesma
forma. Até aqui, não mencionamos muitos estados de línha-base, mas os seguintes pro
cessos que estudamos terminam em estados estáveis estatísticos, que podem ser usados
como linhas-base:
L Esquemas de intervalo
2. Esquemas probabilísticos
3. Condicionamento e extinção sucessivos
4. A própria extinção
5. A seqüência comportamental vista em elos simples de comportamento
6. A topografia e magnitude do comportamento sob crf.
- 157-
Capítulo 8 A ESPECIFICAÇÃO DA RESPOSTA
- 159 -
suas leis, generalizações e, previsões. A conceituação dc comportamento em termos de
tais classes, análogas aos conceitos de classe dc outras ciências, é, assim, uin
pré-requisito para uma ciência do comportamento capaz de descobrir leis, fazer
generalizações e previsões.
Em se tratando do comportamento, podemos algumas vezes iniciar, classificando
numa única categoria um conjunto de comportamentos que são correlacionados com o
mesmo estímulo. Assim, podemos observar as flexões sucessivas da perna, em resposta a
um toque bem definido no joelho e, embora notando suas diferenças, decidir chamar de
resposta patelar à classe (conjunto) de todos os movimentos que ocorrem com uma
duraçüo entre os limites de 1/5 a 1 seg. e que caem numa faixa de ângulos ( a ) de 5 a 30
graus (ver Fig. 8-1). Ao admitirmos essa classe, nossa esperança é incluir todos, ou quase
todos os comportamentos que estão de fato correlacionados com este eliciador parti
cular. Obtivemos os movimentos sucessivos através da eliciação repetida, usando o
mesmo estímulo eliciador com intensidade, duração e localização fixas, e assim por
diante Embora a classe, que é assim formada, pareça ser um agrupamento de movi
mentos aparentemente semelhantes, sua definição formal é apenas a classe de movi
mentos que ocorre a um dado estímulo.
Figura 8-1. Diagrama esquemático da faixa de movimentos que inclui todos os compor
tamentos que são chamados “ Reflexos Patelares” .
- 160 -
restrições, limites e condições ao longo de certas dimensões, de modo que todas as
“ coisas” que desejarmos chamar mesas e comportamentos do tipo X, respectivamente,
incluir-se-ão, com certeza, nessas classes. Assim, as mesas deveriam ter, digamos, um ou
mais pés (uma condição), deveriam ser feitas de material sólido, ao invés de líquido ou
gasoso (uma restrição), ter uma superfície plana (uma restrição), ter um comprimento
maior que 30 cm e menor que 35 m (um limite), e assim por diante. Da mesma forma, os
comportamentos do tipo X poderiam incluir, digamos, qualquer movimento para baixo
(uma restrição) do braço esquerdo (uma condição) que esteja entre 15 a 100 gramas de
força (um limite) e que não exceda a 1/2 seg. de duração (uma restrição) e assim por
diante.
Mencionamos exemplos de dimensões do comportamento tais como posição,
duração e força da resposta, em seções anteriores. Essas dimensões foram usadas para
descrever a variabilidade de comportamento no nível operante, fortalecimento, extinção
e esquemas de reforçamento. Algumas dimensões como posição, ângulo, localização e
orientação do comportamento são chamadas dimensões topográficas, uma vez que uma
relação de seus valores em qualquer momento determinado especificará a forma exata do
comportamento. A especificação do valor dessas dimensões, em qualquer momento
determinado, dá o tipo de informação fornecida por uma fotografia do organismo surpre
endido em ação. Tendo apreendido a forma estática do comportamento através das
variáveis topográficas, podemos usar as dimensões dinâmicas tais como a velocidade,
força, duração e taxa de repetição do comportamento para descrever, ainda mais, uma
amostra particular do comportamento. Em princípio, uma amostra de comportamento
poderia ser completamente descrita por uma especificação dos valores de todas as
dimensões pertinentes ao comportamento. Esta descrição, em relaçio a uma e-xplicação
mais completa, estaria, sem dúvida, precisamente na mesma relação que há entre um
instantâneo e um filme. Na prática, uma descrição exaustiva do comportamento rara
mente é tentada. Quando a topografia ou forma é de interesse principal, deve-se recorrer
ao uso de dispositivos para fotografar o comportamento, mas uma análise quantitativa de
uma ou duas dimensões comportamentais representativas será, em geral, preferida. No
caso do reflexo patelar, a especificação da classe de comportamento em termos de apenas
duas dimensões parece suficiente para uma aproximação adequada. Uma dessas
dimensões constitui o ângulo da perna em relação à posição de descanso; a outra
dimensão é a duração do movimento. Em geral, a especificação experimental de um
fragmento do comportamento nunca é mais que parcial, sendo que os valores de muitas
dimensões ficam indeterminados.
Para formar as classes ou unidades para expressar as leis, generalizações e previsões
do comportamento emitido, uma estratégia diferente daquela usada para definir respon
dentes deve ser adotada. No comportamento não eliciado, podemos iniciar pela definição
de um conjunto algo arbitrário de comportamentos que preenchem certas restrições e
condições e que caem dentro de certos limites ao longo das dimensões especificadas da
resposta. Nossos critérios originais para agrupar certas amostras de comportamento
podem estar baseados em pouco mais do que a observação superficial de que o conjunto
de comportamentos, que cai no que descrevemos como tipo X, poderia ser uma classe de
algum interesse. Tendo formado essa classe arbitrária, deve-se solicitar agora - não um
eliciador, porque não existe um - mas um reforçador, para a confirmação de que a classe
que arbitrariamente selecionamos funcionará realmente como uma unidade. Isto é, pros
seguimos aplicando a operação de reforçamento em fragmentos sucessivos do comporta
- 161 -
mento tipo X, como definido. Cada membro da classe será, sem dúvida, um pouco
diferente de qualquer outro e, por essa razão, é chamado uma variante. Preparamo-nos
para tais diferenças ao especificar os limites (e não valores exatos) dentro dos quais
reforçaríamos. Se o reforçamento, agora, afeta o comportamento de modo a fortalecer
seletivamente uma classe de comportamentos, estamos certos ao referirmo-nos a esta
classe como uma classe de resposta operante, ou mais simplesmente como um operante.
Considere alguns exemplos. Poderíamos definir os limites de uma certa classe de
movimentos e tentar reforçar todos os movimentos dentro dos limites. O reforçamento
de uma classe de extensões do braço ocorre nos movimentos de pegar. As palavras são
exemplos proeminentes da formação de classes arbitrárias de resposta. Todos os sons que
caem dentro de certos limites aceitáveis (portanto, são produzidos pela ação muscular
dentro de certos limites aceitáveis), constituem as palavras faladas "por favor". Quando
uma criança enuncia e pronuncia as palavras corretamente (isto é, emite uma variante que
cai na classe desejada), o reforçamento é liberado e a classe de movimentos que produz
por favor é fortalecida.
Na natureza, parece pouco provável que o reforçamento seja sempre contingente
um conjunto restrito de limites do modo descrito acima. No laboratório, o reforçamento
poderia ser tornado contingente a um subconjunto restrito de comportamentos definidos
pelas limitações dimensionais. Mas, mesmo aí, as unidades são estimadas de modo mais
geral, classificando juntos todos os movimentos que atuam, pelas leis da mecânica
simples, para produzir uma mudança específica no ambiente. Portanto, todos os movi
mentos que pressionam uma barra, ou um disco, ou uma chave telegráfica, ou que
conduzem um rato do início ao fim de uma pista, giram uma roda, ou colocam açúcar
numa chícara de café, servem para limitar efetivamente a topografia do organismo de tal
modo que se consegue uma estimativa da classe topográfica especificada. Isto é verdade,
simplesmente porque há limites nas maneiras possíveis de se fazer todas essas coisas. Se
construímos nosso aparelho com cuidado, os comportamentos possiveis que poderiam
produzir as mudanças ambientais especificadas serão bastante limitados e, portanto, for
çados a terem uma forma razoavelmente semelhante. (Os comportamentos de enfiar linha
numa agulha são mais limitados que os de fechar uma porta). Na medida em que restrin
gimos nossas dimensões, os comportamentos que constituem a classe terão semelhanças
topográficas da mesma forma que os respondentes tem naturalmente. Todavia, a única
exigência formal para um operante é que ele seja uma classe de comportamento susce
tível, como classe, de reforçamento. Se especificamos uma classe que não pode ser
fortalecida ou mantida pelo reforçamento de seus membros, tal classe não constitui uma
resposta operante, seus membros não são variantes da resposta e, presumivelmente, não
se presta para o uso no estudo do comportamento operante. Isto é verdade se uma
especificação dos limites do comportamento fôr feita em termos de limitações dimensio
nais ou de alguma mudança ambiental necessária que o comportamento deva produzir.
Operantes, ou respostas operantes (respostas, para simplificar, se você se lembra de que
respostas não significam “ responder a” ), então, são as classes de comportamento, suscetí
veis ao reforçamento, que formam as unidades fundamentais de análise de uma grande
parte das ações humanas c animais.
Na definição de operantes como uma classe de comportamentos sensíveis de reforça
mento, nenhuma lógica exclui a definição de subclasses ou superclasses de operantes
contidos em ou que contem qualquer classe operante particular, previamente
definida. Esta flexibilidade no modo pelo qual os conjuntos comportamentais básicos
- 162-
podem ser subdivididos em “ conjuntos” menorjs, ou combinados para formar conjuntos
maiores, será de grande importância quando examinarmos os limites extremos aos quais
os conceitos de operante podem ser estendidos. Portanto, a definição de um operante,
em si mesma, não coloca qualquer restrição 3obre a amplitude de uma classe de resposta,
em termos da quantidade de comportamento abrangida por ela. Como veremos na seção
8.5, classes que consistem de contrações musculares muito breves para serem observáveis
pelo sujeito que as emite, podem vir a funcionar como operantes. No outro extremo,
seqüências longas de ações parecem funcionar como classes únicas de operantes. Sob
algumas condições, será possível falar de tricotar um suéter, escrever um livro, ou caminhar
para o trabalho, como operantes. Extensões do conceito de operante a tais operantes de
grande escala só agora estão sendo exploradas no laboratório.
- 163-
Na prática, pude-se verificar que muitos desses subconjuntos r ^ r j — podem ser operan
tes em si mesmos, pela definição anterior. Desde que, todavia, a definição de um
operante depende de se observar o fortalecimento pelo reforçamento e desde que o*
fortalecimento é definido em relação a outros comportamentos (ver seção 4.4), o limite
até o qual o fracionamento e/ ou subdivisão da classe R pode ser ampliado é estabelecido
pelo ponto no qual não é possível fortalecer um dado subconjunto ri sem igual fortaleci
mento de qualquer outro ij. Evidentemente, isto determina o limite inferior da definição
de uma classe de operante.
Uma operação oposta é admissível. Dado o operante R, é possível descobrir (ou
criar) um superconjunto R de ordem superior, que contém todos os membros de R, além
de outros comportamentos.
\ssim, embora os movimentos para pressionar uma barra possam funcionar como um
operante, os movimentos de pressionar uma barra vinte e cinco vezes podem funcionar
como um operante de orc1em superior, R. Da mesma forma, os movimentos de pressionar
uma barra, seguidos pelos movimentos de puxar uma corrente, podem funcionar como
um operante de ordem superior. Novamente, os limites aos quais os operantes podem ser
estendidos dessa maneira são estabelecidos apenas pelos limites da suscetibilidade com
portamental ao reforçamento.
8.3 O PARADIGMA DA DIFERENCIAÇÃO
- 164-
(A)
» 1
^3 17 21 25 29 33 37
1 i
41 45495357
(B)
o 8 8 I 1l 1i 1 i i
13 17 21 25 29 33 37 41 45 49 53 57
Intensidade das pressões, em gramas
- 165-
O procedimento dc diferenciação resultou no aparecimento e estabilização de um
conjunto de novos comportamentos. Como isto ocorreu? Dois processos com piemen ta
res parecem ser responsáveis. Primeiro,observe que, no momento em que foi colocada em
efeito, a nova condição de 36 g incorporava algumas forças existentes (veja a extremidade
direita da Fig. 8-2A). Esperar-se-ia que o fortalecimento desses comportamentos com
forças maiores que 36 gramas os manteria. Se esta condição não tivesse sido alcançada,
quase que certamente teria ocorrido a extinção normal. Então, em segundo lugar, o
mínimo de 36 g excluiu muitas forças anteriormente reforçadas. Quando pressões à barra
com essas forças anteriormente reforçadas foram emitidas sob o procedimento de 36 g no
mínimo, elas foram extintas. Lembre-se que um dos resultados do procedimento de
extinção é um aumento na variabilidade do comportamento (seção 5.2). A extinção das
forças de 21-36 gr anteriormente reforçadas, tenderia, assim, a produzir novas forças,
tanto superiores quanto inferiores àquelas usualmente emitidas.A emissão de forças muito
baixas não teria conseqüências no experimento presente, mas a emissão de forças muito
altas teria conseqüências reforçadoras e, logo, seria fortalecida. Eventualmente, esses dois
processos —( 1 ) extinção diferencial e ( 2 ) fortalecimento diferencial —que interagiam ao
longo da dimensão força, conduziram à estabilização comportamental na forma do histo-
grama (B) da Fig. 8-2.
A extinção teve um papel duplo, crucial nessa diferenciação de pressões à barra mais
fortes. (1) Agiu de modo a trazer novas e excepcionais variantes da resposta, algumas das
quais com possibilidades de serem reforçadas. (2) Agiu de modo a enfraquecer o compor
tamento ao longo da porção da dimensão onde o reforçamento havia sido suspenso.
Como outros paradigmas comportamentais, a diferenciação tem uma definição
completa apenas na especificação de seu dado, procedimento, processo e resultado.
- 166 -
Dimensão comportamental
Um caso semelhante au da Fig. 8-3D foi descrito por Keller e Schoenfeld (1950).
Uma máquina de jogo foi modificada para permitir uma medida precisa de quanto o
êmbolo era puxdo antes de ser solto. Variações nos limites inferiores superiores da
resposta foram exploradas e o reforçamento para as variantes corretas era um 1flash?'de luz
após a liberação do êmbolo. Pode-se selecionar uma faixa de variantes à qual os reforça
mentos serão aplicados, tão estreita que um fortalecimento seletivo dessa faixa particular
não é obtido. Pelo contrário, as variantes mais próximas da faixa de reforçamento
manter-se-ão com forças iguais 'aquelas da faixa reforçada. Nessa situação, o experimen
tador atingiu as restrições mínimas para a definição de uma classe de resposta. Acima
desses limites, os resultados confirmam, todavia, a lei: tudo o que é reforçado é também
fortalecido.
Herrick (1963) projetou a barra vista na Fig. 8-4 para estudar o deslocamento da
pressão à barra. As pressões realizadas por um rato moviam uma barra em T descrevendo
um arco, enquanto um circuito eletrônico registrava o deslocamento máximo de cada
pressão. A distância máxima que a barra percorria em cad.: pressão foi classificada em
uma de oito zonas. A barra foi planejada de um modo que, quanto maior o número da
zona, maior a quantidade de trabalho exigida do rato.
18
r-n
1 2 3 4 5 6 7 8
(A)
co 54
36
18
E
0>
0
1 2 3 4 5 6 7 8
(B)
(C)
Zona da barra
I'igura 8-5. Distribuição dos deslocamentos da barra em função do tamanho da região reforçada. Às
sombreadas do histograma indicam as zonas da barra nas regiões reforçadas (segundo Herrick, 1964)
- 168-
limites superiores da zona de reforçamento (zonas 5 e 6 ). Este fenômeno pode ser
interpretado como uma tendência do rato de dlspender “menos esforço” : dadas duas
zonas de reforçamento, aquela que exigir a menor condição de trabalho será a mais
fortalecida.
Dimensão da R
Figura 8-6. Representação esquemática de diferenciações progressivas (aproximações
sucessivas) ao longo de uma dimensão quantitativa da resposta. As áreas sombreadas
representam as variantes reforçadas.
- 169-
A diferenciação sucessiva deve ter um limite superior, determinado pela capacidade
do organismo. Mas, dentro dos limites dessas restrições de capacidade, a aproximação
sucessiva de uma forma final de comportamento é um método extremamente poderoso
para produzir comportamento. Através deste processo de aproximação -sucessiva na
dimensão força da barra, Skinner (1938) foi capaz de treinar um rato de 200 g a realizar
o feito hercúleo de pressionar uma barra que requeria o mínimo de 100 g de força.
Nem a diferenciação nem a aproximação sucessiva estão limitadas a mudanças ao
longo de uma dimensão quantitativa da resposta. Mesmo que a topografia, ou forma do
comportamento seja de difícil mensuração, sua modelagem se dá de forma análoga à
aproximação sucessiva ao longo de uma dimensão quantitativa. Anteriormente, fez-se
referência ao operante de bicar o disco do pombo. Essa resposta, quase sempre, tem uma
freqüência igual a zero, no nível operante e, assim, precisa ser modelada. Neste caso, o
experimentador aproxima-se sucessivamente da forma desejada do comportamento,
iniciando com uma forma que pode se parecer em nada com o bicar uma chave. O
experimentador pode reforçar primeiro todos os movimentos do animal que ocorrem na
vizinhança da parede que contém o disco. O efeito deste procedimento de diferenciação é
fortalecer os movimentos do animal nas proximidades do disco. Então, o reforçamento é
tornado contingente aos movimentos da cabeça próximos ao disco. Quando essa contin
gência tiver tido efeito de aumentar tais movimentos, o reforçamento será condicional ao
tocar o disco com o bico. Neste exemplo, a mudança dos requisitos para o reforçamento
combina-se com as mudanças progressivas do comportamento para modelar um novo ato.
O aparecimento do bicar o disco é devido a uma história de diferenciação progressiva de
antecedentes comportamentais remotos, com relação ao,s quais o bicar o disco contém
uma pequena semelhança superficial. É este o processo através do qual muitas de nossas
próprias habilidades são modeladas. É interessante notar que, embora a natureza forneça
muitas situações de reforçamento seletivo (a corrida do coelho é reforçada somente se fôr
bastante rápida para iludir a raposa; a corrida da raposa é reforçada apenas se fôr mais
rápida que a do coelho), parece que a aproximação sucessiva é um arranjo de contingências
estritamente humano. Professores, pais e amigos seguem tal procedimento, embora raras
vezes tão sistematicamente como deveria ser. Talvez seja no laboratório que o maior
poder do procedimento possa ser explorado, porque é lá que podemos controlar e mank
pular melhor os muitos parâmetros, sugeridos pelas Figs. 8-3 c 8 -6 , cujos efeitos no
processo são ainda bastante desconhecidos.
- 170 -
çados, de início na forma de classes arbitrárias, esses operantes tornam-se unidades fun
cionais através da ação do reforçamento seletivo de seus membros e extinção concorrente
dos membros de todas as outra classes de comportamento.
Uma classe importante desses operantes criados é o conjunto cujos membros são cons
tituídos de elementos que foram previamente modelados como operantes. No caso mais
simples, o reforçamento é contingente à emissão de n repetições sucessivas de um
operante anteriormente reforçado. Esse procedimento especifica um novo operante de
ordem superior, constituído de n ocorrências sucessivas da classe de comportamento
anteriormente reforçacfa. Quando descrevemos tal operante de ordem superior, refe-
rimo-nos aos membros da classe anteriormente reforçada que o constituem como seus
seus elementos ( r i , r 2 , r3 , ..., rn). Embora os elementos por si sòs constituíssem,
inicialmente, classes unitárias de resposta, eles são tratados agora como componentes de
uma classe de resposta de ordem superior (Findley, 1962). A especificação de um
operante em termos de um número fixo de tais elementos repetidos é conhecida como
operante de Razão Fixa (RF). O termo “ razão” refere-se ao número fixo de elementos
repetidos por reforçamento. Por exemplo, depois de ter fortalecido o operante de pres
sionar a chave telegráfica num macaco, o reforçamento pode ser tornado contingente a
30 pressões consecutivas à chave telegráfica. Depois de modelar o bicar o disco num
pombo, pode se tornar o reforçamento contingente a cada 50 bicadas no disco. Esses
casos são denotados RF 30 e RF 50, respectivamente. Tais operantes de ordem superior,
sendo constituídos de componentes facilmente observáveis e experimentalmente criados,
são úteis por permitirem uma micro-análise compreensiva da estrutura do comporta
mento operante. Os elementos dos operantes RF são estudados tipicamente do mesmo
modo que as respostas são estudadas em esquemas de reforçamento intermitente. Assim, os
registros cumulativos dos elementos de operantes RF constituem um método de obser
vação das características temporais de classes de resposta altamente ampliadas.
A transição do reforçamento de uma classe que tem somente um elemento para uma
Classe contendo n elementos, representa um tipo de aproximação sucessiva, ao longo da
dimensão do número (n) de elementos. Antes de mudar a condição para o reforçamento
de um único elemento para n elementos, não há, todavia, qualquer informação sobre as
variantes acessíveis ao longo das n dimensões. O único valor de n previamente examinado
(reforçado) em crf foi sempre 1. Assim, a diferenciação é, em grande parte, um problema
de tentativa e erro. Usando o bicar o disco (chave) por pombos, Ferster e Skinner (1957)
foram capazes de passar diretamente de um elemento por reforçamento para razões de
reforçamento de 40 e 50 elementos sem que a extinção ocorresse. Quando a diferen
ciação do novo operante havia estabilizado (umaspoucasdúziasdehoras).o padrão da taxa
dos elementos era tal que taxas altas e uniformeseram freqüentese uma pequena pausa
ocorria depois de cada reforçamento. A diferenciação de razões ainda mais altas requer
uma aproximação sucessiva pelo aumento gradual de n. A razão e aumentada de 5 ou 10 c
mantida no novo valor por várias sessões. Uma curva cumulativa típica, mostrando-um
desempenho estável cm RF 120 por um pombo modelado desse modo, é vista na Fig.
8-7. A curva mostra a uniformidade marcante do comportamento, no tempo, sob especi
ficações RF. O reforçamento e seguido caracteristicamentc por pausas que duram 5 ou 6
min, depois do que o animal começa a bicar com uma taxa uniforme e alta que é mantida
ate o reíorçamento. A pausa pós-reforçamento está relacionada de perto com o tamanho
da razão. Razões grandes são marcadas por pausas longas. Em razões pequenas, a paus;(
pode desaparecer totalmente. O limite superior da diferenciação da razão taivez seja
- 171
desconhecido. Skinner (1957) relata dados de Morse e Herrnstein nos quais um operante
RF contendo 900 elementos foi estabilizado através de diferenciação progressiva.
Figura 8-7. Curva cumulativa do bicar a cliave, por um pombo reforçado após cada
120 bicadas (Ferster e Skinner, 1957).
- 172 -
O fim de uma RF não reforçada era sinalizado no experimento de Skinner e Fe rs ter, por
uma breve mudança na iluminação (colchete 3 no diagrama). Probabilidade de reforça
mento (p) para o comportamento de bicar a chave em RF 30, de 0,85 ate 0,50, manti
veram o comportamento. Em 0,50, houve quase sempre uma tendênciaparaaocorrência
de longas pausas entre os operantes RF (não entre os elementos) característica de um
resultado encontrado por Brandauer (1958), que usou valores de p muito pequenos com
um operante mais siipplcs, uma bicada na chave. Uma vez que Brandauer teve que chegar
a probabilidades de 1/600 para obter o efeito que aqui foi obtido com 0,50 parece que a
quantidade de comportamento envolvida num operante modifica sua suscetibilidade a
um esquerna.
A função que relaciona a resistência à extinção ao tamanho da RF recebeu alguma
atenção experimental. RFs grandes podem exigir um trabalho substancial do indivíduo e,
por essa razão, pode se esperar que ela acarrete uma menor persistência, face à extinção,
do que RFs pequenas. Boren (1961) e Weissman e Crossman (1966) apresentaram dados
que mostram que na faixa entre RF 1 e RF 64, a pressão à barra em ratos e o bicar a
chave em pombos parecem apresentar tal efeito. Apesar desta diminuição na persistência
do operante em função do seu tamanho, muito mais elementos são, na realidade,
emitidos na extinção de grandes RFs. De fato, dentro de certos limites, quanto maior a
RF no treinamento, tanto maior será o número de elementos individuais emitidos
durante a extinção.
Uma conclusão importante segue-se. Sc estamos interessados cm aumentar a persis
tência do comportamento face à extinção, a especificação de RF fornece um método
altenativo para um esquema produzir perseverança. Podemos incorporar o comporta
mento como um elemento de um operante RF dc ordem superior.
Em contraste com os operantes de ordem superior criados pela combinação de
elementos que se demonstrou anteriormente serem operantes, Hefferline e Keenan
(1963) pesquisaram um operante “miniatura” , tão pequeno que uma amplificação eletrô
nica precisa ser empregada para detetá-lo. Essespesquisadores generalizaram, com êxito, u
conceito de classe de resposta operante para comportamentos tão pequenos em aplitude
que o sujeito, geralmente, não é capaz de dizer ter observado suas próprias respostas.
Num experimento, potenciais de contração muscular do polegar de sujeitos humanos
foram registrados. Eletrodos simulados foram colocados em outros pontos do corpo do
sujeito para desviar sua atenção da resposta do polegar. Os sujeitos eram conforta
velmente sentados em um cubículo triangular, com ar condicionado e à prova de som e
eram instruídos, apenas para se relaxarem. Eles foram avisados de que ocorreria reforça
mento na forma de pontos, registrados num contador localizado perto deles, e que cada
ponto valeria 5 “cents” . Mas não foi dito aos sujeitos como eles poderiam produzir os
pontos. Num sujeito, as contrações do polegar que geravam potenciais na amplitude de
25-30 microvolts eram reforçadas e, depois, extintas. Os histogramas para os 10 min de
nível operante, seguidos por 6 blocos sucessivos de 10 min dc fortalecimentQ, seguidos
por 10 min finais de extinção, são vistos na Fig. 8-8 . Os histogramas de condicionamento
mostram que o procedimento de diferenciação foi bem sucedido no fortalecimento sele
tivo da classe reforçada de comportamento e que os 10 min de extinção causaram um
enfraquecimento marcante na classe. Os registros cumulativos da contração muscular
reforçada mostram uma taxa típica dc aumento da classe reforçada, mas - como deve ser
esperado de um operante com dimensões tão limitadas o processo é gradual, esten-
-173-
150 - 2 0 -3 0 150 - Extinção
100 100 -
50 - __ , 50 -
0 . 1---- 1 Q
10 15 20 25 30 35 40 45 10 15 20 25 30 35 40 45
Microvolts
-174-
extinção. Um terceiro fenômeno empírico — típico do comportamento operante em
geral — é demonstrado. No operante de contrair o músculo a classe de resposta foi
definida como c o n tra c ts entre 25 e 30 microvolts. Mas uma inspeção mais detalhada
dos histogramas da Fig. 8-8 mostra que as classes vizinhas de comportamento, embora
não realmente reforçadas, foram também algo fortalecidas. O fortalecimento incidental
induzido em comportamentos que realmente não participam das contingências de refor
çamento é chamado indução de resposta. A indução de resposta ocorre durante o fortale
cimento de qualquer operante, mas nem sempre é fácil verificá-la. Embora o experimen
tador possa desejar limitar o reforçamento a uma classe específica de comportamento, o
fortalecimento pode se estender, através de indução, muito além dos limites estabe
lecidos. Ratos que aprendem os movimentos necessários para atravessar uma pista
complexa, são capazes de nadar na pista, eficientemente, quando esta está alagada,
embora o nadar requeira um grupo de movimentos bastante diferentes. Aprender a
escrever com a mão direita treina a mão esquerda não usada, embora em grau menor.
Aprender a falar o italiano torna mais fácil aprender a falar espanhol. A indução de
resposta é estudada no laboratório com ajuda do aparelho para desenhar, que inclui um
espelho, visto na Fig. 8-9. O sujeito recebe a tarefa de desenhar uma figura vendo, no
espelho, a imagem desta. Uma vez que as relações usuais entre mão e olho são invertidas
as primeiras tentativas são reproduções ruins. Gradualmente, o sujeito passa a desem
penhar melhor a tarefa. A indução de resposta pode ser medida em qualquer momento,
no processo de aquisição, testando-se a quantidade de melhora mostrada pela mãe
esquerda, com a qual o sujeito não praticou.
-1 7 5 -
8.6 DIFERENCIAÇÃO DE TAXA
Ao se considerar os efeitos de certos esquemas de reforçamento, recorre-se sempre ao
fato de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com
o reforçamento. Assim, esquemas de intervalo randômico tendem a fornecer reforça
mento diferencial apôs taxas baixas e esquemas de probabilidade uniforme tendem a for
necer reforçamento diferencial depois de taxas altas. Uma vez que o efeito do reforça
mento é fortalecer qualquer que seja o comportamento que vem antes dele, esses
esquemas agem indiretamente no fortalecimento de certas taxas de comportamento. Se
desejarmos, poderemos fazer surgir uma diferenciação maisdireta e invariante pela especi
ficação dos limites, condições ou restrições da taxa do operante que deve ser reforçado.
No reforçamento diferencial de taxas baixas (drl), um operante R é primeiro especi
ficado e fortalecido. Quando R tiver sido suficientemente fortalecido, ele é tomado um
elemento numa nova especificação de resposta de ordem superior: somente os elementos
de resposta que estão espaçados entre si pelo mínimo de uma certa quantidade de tempo
são agora reforçados. Assim, o procedimento drl reforça um certo comportamento
somente quando precedido de uma pausa. Wilson e Keller (1953) efetuaram este procedi
mento de drl, exigindo que os ratos espaçassem suas respostas de pressão à barra de
determinados retardos mínimos, para que o alimento fosse liberado. A especificação do
tempo mínimo para o operante foi aumentada gradualmente, em passos de 5 seg, de 10
para 30 seg, num período de 30 sessões. A Fig. 8-10 mostra que as diferentes pausas
exigidas, estabelecidas pelas especificações, produziram taxas diferentes de pressão a
barra.
- 176-
Quando a especificação da pausa do d rl foi aumentada, ocorreu um declínio sistemático
na taxa dos elementos da pressão à barra. Outra maneira de dizer isso é que, quando se
exige um aumento no retardo, ocorre um aumento sistemático na duração média das
pausas entre as pressões à barra.
A especificação do d rl é um operador poderoso para fortalecer e manter taxas baixas
de algum comportamento especificado. Curvas cumulativas do bicar a chave mantido em
taxa baixa, em pombos, quando somente bicadas precedidas por pausas de 3 minutos ou
mais eram reforçadas, são vistas na Fig. 8-11. Através de um ajustamento adequado da
especificação do d r l, manteve-se os pombos trabalhando lenta, mas estavelmente, 24
horas por dia, durante dois meses.
O operante de ordem superior fortalecido pelo procedimento drl consiste de
uma topografia bem especificada (por exemplo, uma bicada ou uma pressão) precedida
por uma topografia problemente especificada (por exemplo, qualquer coisa exceto uma
bicada ou pressão). A classe “ qualquer coisa exceto” é, em geral, o suficientimente ampla
para que os sujeitos individuais venham a formar comportamentos idiossincráticos, su
persticiosamente reforçados durante a pausa forçada Wilson e Keller relatam que cada
O operante drl foi mantido com sucesso em esquemas de intervalo por Angei (1956)
e Ferster e Skinner (1957).
-177 -
Em contraste com o d ri, taxas muito altas de comportamento podem ser geradas,
tornando-se o reforçamento contingente à completaçao dos elementos de uma razão
operante dentro de um intervalo de tempo especificado. Se este intervalo fôr progressiva
mente diminuído, ou a razão progressivamente aumentada, ocorrerá uma modelagem de
taxas extremamente altas dos comportamentos componentes. Este procedimento é
conhecido como reforçamento diferencial de taxas altas (d r h ) .
-1 7 8 -
objetivo de estabelecer uma classe de comportamento, uma volta de 360 graus fornece
uma unidade conveniente, embora perfeitamente arbitrária, do comportamento a nüi
reforçado. Se o correr (definido como uma volta completa) é reforçado num intervalo
fixo de 5 min ( IF 5 min), somente a primeira volta depois de decorridos os 5 min será
reforçada. Os efeitos do reforçamento consistem em fortalecer um padrão de corrur,
característico do responder em esquemas IF (ver Figs 7-2 e 74 ). O rato para por
vários minutos logo após um reforçamento e, então, corre numa taxa altá até o
próximo reforçamento, e assim por diante (Skinner e Morse, 1958). Aqui o
desenvolvimento do padrão da IF serve para verificar a natureza operante do correr.
8.8 SUMÁRIO
Os procedimentos de diferenciação e aproximação sucessiva aumentam
fcrandemente o nosso controle experimental sobre o comportamento. Eles são
procedimentos que permitem selecionar os aspectos do comportamento que desejamos
reforçar e, realmente, tornar os comportamentos desejados disponíveis para o
fortalecimento. A combinação de esquemas de reforçamento com várias especificações
de resposta (incluindo as especificações de ordem superior compostas de operantes
condicionados anteriormente) permite que grandes amostras do comportamento de um
organismo, no laboratório, sejam mantidas e estudadas por longos períodos de tempo.
Os procedimentos de razão permitem o estudo de como a quantidade dc trabalho
necessária para o reforçamento pode afetar o comportamento. Os procedimentos dc
d rl e d rh tornam possível o estudo de uma ampla faixa de taxas de comportamento.
No pombo, por exemplo, esses procedimentos produzem uma faixa estabilizável do
taxas de bicar a chave de menos de 100 respostas por hora até 20.000 respostas poi
hora. Frequentemente, especificações de respostas engenhosas podem ser usadas pani
estabelecer linhas-base comportamentais, análogas às linhas-base de esquemas, a parlii
das quais podem ser estudados os efeitos típicos de drogas e outras operações.
Um número de atividades humanas características são correlacionadas com vária»
especificações operantes pesquisadas no laboratório. O trabalho por peça, no qual um
trabalhador é pago para produzir um número fixo de artigos, c uma especificação RF clara.
Assim também são atividades como datilografar um grande número de páginas, preparar
longos exercícios ou bater um prego na madeira. Em muitas dessas, se a quantidade de
comportamento envolvida é substancial,uma pausa antes dc “ voltar ao trabalho” é vista
com freqüência. Podemos observar comportamentos em d rh nas atividades onde um
prêmio e dado pela execução rápida do trabalho em pouco tempo - isto pode ser visto
em garçons, na hora de movimento ou, no basebol, os movimentos de um jogador
correndo para a primeira base. Tipos de comportamento mais “intelectuais” também sc
ajustam aos paradigmas de diferenciação. Numa discussão verbal, por exemplo, há comu*
mente um premio em d rh para “ pensar rápido” e replicar. Por outro lado,numa briga,há
frequentemente um premio em d rl para o não responder muito precipitadamente e “ dizer
coisas de que nos arrependeremos mais tarde” .
Segue-se uma nota sobre as similaridades entre os efeitos de certas especificações de
resposta e os efeitos de certos esquemas. A Razão Fixa, por exemplo, não difere do IF
em seus efeitos sobre o comportamento (compare a Fig. 8-7 e a Fig 7-3 ). Essas seme
lhanças têm levado os teóricos a tentarem reduzir esquemas e diferenciação a uma estru
tura comum, enfatizando os parâmetros de probabilidade de reforçamento^e nâo enfati-
-17 9-
/.ando variáveis de especificação de resposta, ou vice-versa. O sucesso de tal empreendi
mento ainda não está assegurado e, para os objetivos presentes preferimos considerar um
esquema como um procedimento de especificação de contingências probabilistic as de
reforçamento no tempo, dada a classe de R. Por outro lado, consideraremos a diferen
ciação como um procedimento para especificar em que classe de comportamento se deve
agir com um esquema dc reforçamento. A observação de que uma certa definição de R
sob um esquema pode produzir efeitos semelhantes,ou mesmo idênticos à outra definição
sob um esquema diferente, pode realmente ser interessante. Todavia, tais correspon
dências comportamentais não significam necessariamente que, em geral, cada especifi
cação ou esquema seja redutível ao outro.
Para cada um desses conjuntos, podemos dar uma resposta sim ou não no que se refere
a se uma dada pessoa, ou filme, o número,ou país, ou comportamento, respectivamente,
poderia ser incluido na coleção. Na terminologia dos conjuntos, os itens individuais que
compõem a coleção são chamados os membros, ou elementos do conjunto.
Os conjuntos são quase sempre simbolizados por letras maiúsculas. Assim, os inteiros
ímpares menores que 10 , tomados como um conjunto, podem ser simbolizados pela letra
I, c o conjunto das vogais comuns na língua inglesa, pela letra V. Suponha que desejamos
indicar os membros de um conjunto. Um método para escrever as coleções que chama
mos conjuntos é enumerar cada um dos membros do conjunto, separando cada um por
vírgulas e colocando-os em chaves. Assim, o conjunto dos inteiros ímpares menores que
10 é escrito.
/ = { 1 ,3 ,5 ,7 ,9 }
e o conjunto das vogais comuns da língua inglesa é escrito
V = {a, e, i, o, u)
Algumas vezes o conjunto ou coleção é muito amplo para que possamos conveniente
mente escrever todos os seus membros ou elementos. Então, podemos usar três pontos
- 180 -
após escrever um número de membros suficiente para sugerir a regra que d e t e n m n a ;■
filiação. Por exemplo, poderíamos escrever o conjunto dos governos com a s s e m b lé i a s
legislativas eleitas, P, como
L — {a, g, r, d, v, e, 1}
i Ri
deiro. Assim, se o conjunto de todas as pessoas que vivem nos Estados Unidos é um
conjunto universal, então o conjunto das pessoas da cidade ae Kansas é um subconjunto.
Além disso, o conjunto das pessoas de cabelo vermelho da cidade de Kansas é um outro
subconjunto. Suponha que todas as pessoas sejam um conjunto universal, y . Então, o
conjunto dos homens é um subconjunto deste conjunto universal. Mas o conjunto de
meninos é ainda um outro subconjunto. Todos os meninos são do sexo masculino, nias
nem todas as pessoas do sexo masculino são meninos.
Para representar o fato de que todos os membros ae um dado conjunto B são
também do conjunto A, escrevemos
B C A
o que significa que cada elemento de B é também um elemento de A.
Para representar estas noções e para ajudar nossa intuição sobre as várias manipu
lações e combinações simples dos conjuntos que desejarmos fazer, os diagramas conhe
cidos como diagramas Venn são úteis. Num diagrama Venn, o Conjunto P- é represen
tado por urn retângulo e os vários conjuntos e subconjuntos de y são representados poi
círculos, figuras oblongas, ou outras figuras irregulares. Assim, na ilustração anterior a
relativa ao conjunto das pessoas da cidade de Kansas, desenhamos
[8 .1]
[8.2]
[8.3]
- 182-
Em [8.3], nenhum elemento é membro de ambos, R e G. Isto é, não há animal algum
que seja, ao mesmo tempo, um rato e um gato. Evidentemente, então, R a G =
Corjuntos que nao têm regiões de superposição como em [8.3] são ditos conjuntos
m u tu a m e n te e x c lu s iv o s . Se ou não dois conjuntos se sobrepõem, freqüentemente temos
ocasião de aludir aos membros de ambos os conjuntos, tomados simultaneamente, como
um grupo. Se estivéssemos interessados em animais peludos, então ratos e gatos pode
riam ser classificados juntos. Em diagramas Venn, para nos referirmos a essa coleção,
poderíamos escrever:
[8.5]
Exercício 6 .
D e m o n stre que S U S — 11 e qu e S A S = cí>.
- 183
Boren, J. J. Resistance to extinction as a function of the fixed ratio. / . exp.
P s y c h o l 1961, 61, 304-308.
Brandauer, C. M. The effects of uniform probabilities of reinforcement on
the response rate of the pigeon. Unpublished doctoral dissertation,
Columbia Univer., 1958.
Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New Y ork:
Appleton-Century-Crofts, 1957.
Findley, J. D. An experimental outline for building and exploring multi
operant behavior repertoires. J. exp. Anal. Behav., 1962, 5, 113
166.
Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a
small-scale (covert) operant. J. exp. Anal. Behav., 1963, 6 , 307
315.
Herrick, R. M. Lever displacement during continuous reinforcement and
during a discrimination. J. comp. Physiol. Psychol., 1963, 56,
700-707.
Herrick, R. M. The successive differentiation of a lever displacement
response. J. exp. Anal. Behav., 1964, 7, 211-215.
Hull, C. L. Principles of behavior. New York: Appleton-Century-Crofts,
1943.
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York:
Appleton-Century-Crofts, 1950.
Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.
Skinner, B. F. The behavior of organisms. New York: Appleton-Century,
1938.
Skinner, B. F. The experimental analysis of behavior. Am er. Sci.f 1957,
45, 343-371.
Skinner, B. F., and Morse, W. H. Fixed-interval reinforcement of running
in a wheel. J. exp. Anal. Behav., 1958, 1, 371-379.
Weissman, N. W., and Crossman, E. K. A comparison of two types of
extinction following fixed-ratio training. J. exp. Anal. Behav., 1966,
9 ,4 1 -4 6 .
Wilson, M. P., and Keller, F. S. On the selective reinforcement of spaced
responses. J. comp, physiol. Psychol., 1953, 46, 190-193.
-1 8 4 -
Capítulo 9: CONTROLE AMBIENTAL
- 185 -
nervosos. 0 olho é especializado para a recepção de uma faixa limitada de radiação eletro
magnética, o ouvido para uma faixa limitada da pressão do ar causada por vibrações, a
língua e o nariz para certas energias químicas. Existem receptores na pele que detetam a
pressão mecânica, mudanças térmicas, etc. Há receptores nos músculos e articulações do
corpo que detetam o movimento dos músculos e articulaçõesf, aos quais estão incorpo
rados. Uma especificação completa dos padrões de energia eletromagnéticas, mecânicas,
químicas e térmicas que atingem os receptores dos organismos em qualquer momento
dificilmente será feita. Felizmente, isto nemé sempre necessário. Uma vez que o compor
tamento pode estar sob o controle seletivo de partes ou aspectos limitados de configu
rações de energia que constituem o que chamamos ambiente, somente uma pequena
parte selecionada ou aspecto único de energia do ambiente é variada no trabalho experi
mental. O restante do ambiente é mantido tão constante quanto possível. Esses aspectos
ou partes do meio, experimentalmente manipuláveis, são o que chamamos mais comu-
mente estímulos. De todas as leis do comportamento em que os estímulos participam,
até agora vimos somente as leis do reforçamento e da eliciação; outras comporão o
conteúdo deste capítulo e do seguinte.
O estímulo é uma unidade ambiental arbitrária. Quando manipulamos ou mudamos
aspectos limitados do meio e os correlacionamos com o comportamento, estamos mani
pulando essas unidades. Na manipulação do meio visual, por exemplo, frequentemente
restringimos nossas mudanças experimentais a uma das dimensões fundamentais pelas
quais os físicos descrevem a luz. Para os nossos objetivos, a luz pode ser considerada
como uma faixa limitada de perturbação eletromagnética, irradiada a 300.000 km/seg,
em forma de ondas. As ondas de luz podem ser representadas como na Fig. 9-1. O
comprimento de onda (X , Fig. 9-1, lê-se “ lambda” ) é uma dimensão importante do
estímulo, à qual foram correlacionadas respostas diferentes chamadas nomes das cores.
Os comprimentos de onda que constituem a luz formam apenas uma pequena porção de
todo o espectro eletromagnético.
Comprimento
- as r -
através de um diafragma ajustável. No olho, este diafragma é chamado íris. Ambos, olho
e câmara, têm lentes através das quais a luz passa e que servem para focalizar a luz numa
superfície sensível. Na câmera, essa superfície constitui a emulsão do filme. No olho a
superfície consiste de células nervosas que constituem a retina. Essas células retínicas
transformam a luz em impulsos nervosos.
Quando as ondas de luz da Fig. 9-2 incidem sobre o olho, elas são algumas vezes
referidas como luzes espectrais puras. Essas são as luzes que aparecem no arco-íris e
podem ser reproduzidas no laboratório por um aparelho chamado monocromador. São
ditas puras porque contêm apenas um comprimento de onda. A maioria das luzes, inclu
indo aquelas que atingem o olho refletidas de superfícies como mesas, cadeiras, quadros
negros, gramados estão longe de serem puras neste sentido. Geralmente, mesmo a luz de
uma superfície homogeneamente colorida ou de uma lâmpada é constituida de uma
grande mistura de comprimento de ondas diferentes. Aqueles comprimentos de onda que
são predominantes determinam, usualmente, a nossa resposta de denominação da cor.
Todavia, algumas misturas de luz não são denominadas por seus comprimentos de onda
predominantes. A palavra “púrpura” nunca é usada para n o m e a r uma luz espectral pura de
um comprimento de onda. “Purpura” é o nome de cor para uma mistura de azul e
vermelho. As luzes que chamamos brancas e as superfícies que chamamos cinzas irradiam
misturas heterogêneas de quase todos os comprimentos de onda visíveis. Nenhum com
primento de onda, isoladamente, predomina em tais luzes, mas o rótulo “sem cor” que
frequentemente lhes é dado parece se. uma designação incorreta.
As dimensões visuais do estímulo não se limitam a distribuições de comprimentos de
onda e intensidades diferentes de feixes de luz isolados. As dimensões relevantes que
podem controlar o comportamento podem ser definidas de modo a incluir combinações
espaciais das dimensões fundamentais de comprimento de onda e intensidade. Por
exemplo, as intensidades relativas de duas regiões de luz adjacentes podem ser uma
dimensão poderosa do estímulo controlador que determina a resposta relativa ao brilho
que um observador dará a uma parte do padrão. Olhando a Fig. 9-4, vê-se que, quando a
quantidade de luz refletida pelo fundo (background) varia, as respostas ao brilho do
triângulo central mudam embora este último permaneça constante. Isto é, o observador
relatará brilhos diferentes do triângulo. (Este fenômeno é chamado contraste de brilho).
De fato, para produzir uma resposta de relatar que o brilho do triângulo não foi alterado,
teríamos de Variá-lO de tal modo que, quando a intensidade do fundo fosse aumentada
(mais luz no fundo) o triângulo seia também proporcionalmente aumentado em inten
sidade (triângulo também mais intenso). Na situação ilustrada pela Fig. 9-4, uma resposta
de relatar um brilho idêntico para os triângulos diferentes é obtida somente quando a
ra z ã o entre as intensidades do triângulo e do fundo é a mesma (Wallach, 1948)l O controle
funcional da resposta de relatar o brilho para os triângulos da Fig. 9-4 está claramente
localizado numa variável ambiental composta. Como esta regularidade entre meio e com
portamento é a base sobre a qual atribuimos o “ status” de estímulo aos eventos do meio,
não haveria motivo para não denominar de estímulo esta variável composta. Essa desig
nação, naturalmente, não exclui o fato de que, com outras contingências predominantes,
o triângulo apenas, ou o fundo apenas, possam também funcionar como estímulos
individuais.
Outro exemplo de controle de estímulo complexo é visto nas linhas da Fig. 9-5,
comumente referido como “ ilusão” de Müller-Lyer. Os dois segmentos de linha hori
zontais são julgados de comprimento desigual porque a variável de estímulo que controla
o julgamento não é apenas a simples variável do comprimento da linha hori-
- 187 —
Retina
Figura 9-3. O olho comparado Funcional e esquemáticamente com urna câmara fotográ
fica (segundo Wald, 1950). "
Figura 9-4. Um exemplo de como as relações entre duas partes do campo visual influen
ciam as respostas (Segundo Boring, Langfeld e Weld, 1948).
>----------<
<------->
Figura 9-5. A ilusáb de Müller-Lyer.
188-
zontal. Em vez disso, a dimensão relevante do estímulo é composta, formada do compri
mento da linha horizontal e ângulo dos dois segmentos das extremidades.
Os estímulos sonoros, como os estímulos luminosos, podem também ser analisados
num conjunto de dimensões que os compõem. O som tem uma semelhança superficial
com a luz, apresentando certas propriedades de onda. Mas as ondas do som são pertur
bações na pressão do ar, propagadas lentamente (213,36 m/seg), mais semelhantes às
ondas do Mar, que são produtos de perturbações na pressão superficial da água. As
mudanças na amplitude das ondas sonoras constituem mudanças na intensidade da
energia e estão associadas a alturas (de som) diferentes. A Fig. 9-6 indica várias inten-
sidades de sons em termos de uma escala logarítmica chamada de decibel; a figura
fornece alguns exemplos comuns das fontes dessas intensidades.
A dimensão comprimento de onda mostra-se adequada para descrever os estímulos
sonoros. O som, todavia, é convencionalmente descrito pelo número de cristas ou ciclos
por segundo (cps) em vez de X . O número de ciclos por segundo, ou a freqüência do
som, é a dimensão em que estão baseadas as respostas de identificar a tonalidade. O
homem é capaz de dar respostas diferenciais de tonalidade numa faixa de 20 -20.000 cps.
Outros animais, tais como cães e morcegos, são capazes de detetar freqüências duas ou
três vezes maiores que nosso limite superior de freqüência. O modo pelo qual as respostas
de identificação da tonalidade variam com a freqüência é ilustrado na Fig. 9-7, que dá a
principal freqüência das várias notas do piano.
Tal como uma luz pura contendo apenas um X é rara, também o é um tom puro
contendo somente uma freqüência. Diapasões e osciladores de laboratório são fontes de
tons puros. Os tons de instrumentos musicais contêm uma mistura de freqüências e a
tonalidade é geralmente determinada pelas freqüências predominantes. Sons comuns tais
como latidos, ruídos de tráfego, conversa e música representam misturas muito com
plexas de muitas freqüências audíveis em intensidades aproximadamente iguais (tais
como aplausos e estática de rádio) é chamado ruído branco, por analogia com a luz
branca.
As dimensões foram conceituadas para descrever as energias que compõem partes do
nosso meio químico, mecânico e térmico. Respostas relativas a cheiro e gosto estão
baseadas em mudanças diferenciais na concentração e estrutura molecular de gases no
nariz e soluções na língua, respectivamente. Mudanças na temperatura superficial são
detetadas por certos receptores que estão situados na pele.
Para descrever os estímulos que se originam dos movimentos dos músculos e tendões,
cham ados prop ri ocep tores, surgem problemas experimentais. A mensuração de
mudanças no meio interno é difícil sem se invadir cirurgicamente o organismo. A locali
zação dos proprioceptores e seus receptores associados torna tais mudanças no meio
interno relativamente inacessíveis, tanto para medir como para manipular. Na prática, os
estímulos internos são, portanto, quase sempre mais inferidos que realmente observados.
Note que nesta discussão empregamos um grupo de termos para descrever as dimen
sões de estímulo e outro grupo para descrever as respostas comportamentais correspon
dentes. Embora haja correlações regulares entre esses estímulos e as dimensões da res
posta (descritas extensamente na área da psicologia chamada psicofísica) as denomina
ções dos estímulos e das respostas não devem ser contundidas. Frequência e intensidade
de energia luminosa são dimensões do estímulo; cor e brilho são dimensões da resposta.
Freqüência e intensidade de energia sonora são dimensões do estímulo; volume e altura
são dimensões da resposta. Cheiro, gosto, temperatura e peso são termos de resposta
- 189-
140 Sistem a dc am pliação de alta p o tên cia
I 80
^ R ugido do leão
2STrafego m u ito in ten so , 4,5m
^ Rádio m uito alto
4(j> - C onversação no rm al, lm
T3 — E scritório ru id o so ou uma loja
T3
» 0 E scritó rio m edio
Rua residencial tran q ü ila
•3 Rua p o u co m ov im entad a
•s
f 10 R esidência m édia
c Música b<’m suave
4>
? 20 Sussurro suave, l,5 m
z R uído m ínim o ao ar livre
o
2° 3 0 i 100 1
1,000 I 1 10 ,0 0 0 1
50 50Q 2 Ü Q C 1.5 0 Q Q -. 20.0QQ
F re q ü ên cia (ciclos p o r segundo).
- 190 -
C médio
M iC iW ^ A ^ C D E
T e c la d o d o p ian o
t
A ltu ra p a d rã o : 4 4 0 cps
L J ------------------- 1--------------------- 1_____________ I__________________ I______________I_____________ I_____________ L_J
25 50 100 200 500 1000 2000 4000
F re q ü ê n c ia em ciclos p o r seg u n d o
particular do meio, ela ocorrerá também, mas numa extensão menor, quando o meio
estiver ligeiramente alterado de algum modo. A resposta pode desaparecer totalmente
quando a mudança no meio fôr grande demais. A importância dessas proposições é
enfatizar os comentários feitos na introdução deste capítulo: o estado particular do
ambiente na ocasião em que o operante é fortalecido, é um fator importante que
controla a emissão da resposta.
Um pombo faminto pode ser colocado numa caixa do tipo descrito anteriormente
(Fig. 5-11). A aparelhagem é modificada como é visto na ilustração da Parte 2, à p. 121
(segundo Guttman, 1956), de modo que o painel de bicar é transluminado por uma luz
pura vinda de um monocromador. O monocromador permite a seleção precisa e a apre
sentação de qualquer um de um grande número de comprimentos de onda visíveis. A
aparelhagem também permite mudanças rápidas de um comprimento de onda para outro.
Num experimento executado por Guttman e Kalish (1956), os animais foram modelados
a bicar o disco que era transluminado por uma luz amarelo-esverdeada (ver Fig. 9-2) de
550my (my = milimicron = 10“6 cm: uma medida de X . comprimento de onda).
Após alguns treinamentos em crf, os animais foram colocados num esquema de intervalo
variável (IV 1 min). Quando o comportamento havia estabilizado em IV, realizou-se
testes para se determinar até que ponto a luz específica de 550 my- no disco estava
controlando o comportamento. Este teste consistiu de um procedimento de extinção no
qual os animais foram expostos a séries aleatórias de apresentações sucessivas de 30 seg
de 11 comprimentos de onda diferentes, dos quais somente um era o 550 my realmente
- 191 -
no treinamento. Nenhuma outra mudança foi feita no ambiente dos animais. (O
U ia d o
procedimento é visto em notação nos diagramas abaixo).
tre in a m e n to r » s+
1 ( 3 se g )- ]
Í
estab iliza ção em I V T(i min) —* IR —* |^"+
_ L_ [T (3 s e g )—j
- 192-
Comprimento dc onda (milimicrons)
Figura 9-8. Respostas em extinção, emitidas na presença de 11 comprimentos de onda
diferentes projetados um de cada vez na chave. O treino ocorreu apenas em 500m jj
(Guttman, 1956)
Os resultados da Fig. 9-8 confirmam a vantagem de se representar quantitativamente
os estímulos. Suponhamos que o experimento de Guttman e Kalish tivesse sido execu
tado antes de se saber que a luz poderia ser representada por ondas e medida através do
comprimento de onda. Se o pombo tivesse sido treinado a bicar um disco coberto com
papel verde e, então, testado em extinção com papéis verdes e de outras cores no disco,
digamos azul, violeta, vermelho, laranja e amarelo, certamente teriam ocorrido diferenças
no responder a essas cores. Mas, considere como um gráfico igual ao da Fig. 9-8 poderia
ter sido desenhado. O fato de que nenhuma dimensão quantitativa (numérica) existia
para relacionar as diferentes cores umas às outras, teria excluído tal representação
funcional. No nosso exemplo hipotético, não temos base para interpolar os valores da
força da resposta entre duas quaisquer cores empregadas. Na função da Fig. 9-8, fizemos
isso facilmente, conectando as forças da resposta para dois estímulos quantitativamente
adjacentes com uma linha reta. Esta interpolação por linhas retas nos permite prever a
quantidade de generalização a luzes não usadas no experimento. O máximo que
poderíamos fazer com um experimento realizado antes da descoberta de especificações
numéricas da luz por seus cumprimentos de onda, teria sido desenhar um gráfico com
barras do tipo visto na Fig. 9-9. Na falta de um método melhor, as cores da Fig. 9-9 estão
distribuídas alfabeticamente ao longo da abeissa. O fato de nenhuma variável
independente ser designado para o eixo do X da Fig. 9-9 mostra quão deficiente esta
representação teria sido. Aqui, temos alguma noção da importância de dimensões
quantitativas para especificar e relacionar as variáveis independentes em qualquer
ciência. Além disso, o exemplo é útil para mostrar como uma ciência (no caso,
psicologia), frequentemente toma emprestado os métodos e descobertas de outra (no
caso, física), e os explora para seu próprio uso em contextos inteiramente diferentes
daqueles nos quais os métodos foram originalmente desenvolvidos.
- 193
A forma real do gradiente de generalização variará de acordo com as dimensões
particulares do estímulo empregado , o esquema e tipo de reforçamento no treino do
organismo em estudo, e mesmo o valor do estímulo particular de treinamento numa dada
dimensão. .Assim, qualquer busca do gradiente de generalização deve ser abandonada.
Algumas vezes, um “gradiente” pode mesmo não aparecer e uma curva achatada de
generalização é obtida. Quando a freqüência de som é usada num experimento seme
lhante ao de Guttman e Kalish, o grandiente de generalização do pombo para freqüências
de sons apresenta a forma da Fig. 9-10. As curvas da Fig. 9-10 são essencialmente
achatadas.
-1 9 4 -
Mesmo ao longo da própria dimensão comprimento de onda da luz, o uso de
estímulos de treinamento diferentes de 550m y produz gradientes de formas diferentes.
Blough(1961) obteve os dados apresentados na Fig. 9-11 quando treinou três grupos de
animais em 530 my, 550my e 570my, respectivamente. Como a figura indica, a forma
real do gradiente obtido varia dependendo de onde o estímulo de treinamento se
encontra na dimensão X .
<u
•o
3 30
- 195-
Comprimento de onda (milimicrons).
desejarmos, o que, como veremos mais tarde, e bastante signiticante para o ensino de
conceitos gerais à criança.
Fora do laboratório, naturalmente, a generalização nunca é limitada a uma única dimensão
ambiental. Quando ocidentais ingênuos observam que todos os orientais se parecem, está
ocorrendo generalização de um estímulo complexo (o primeiro oriental ou o primeiro
ocidental visto) para outros estímulos “teste” (outros orientais, ou outros ocidentais).
Um estímulo pode ser dito complexo quando mesmo sua descrição parcial envolve mais
dimensões do que seria prático enumerar. As generalizações complexas, como as vistas
fora do laboratório, podem ser inferidas como sendo baseadas em espalhamentos do tipo
da Fig. 9-8, ao longo de cada dimensão que o estímulo de treinamento e aos estímulos-
teste compartilham. Podemos tentar verificar esta hipótese, pelo menos parcialmente,
ampliando nossos estímulos-teste experimentais de modo a incluir mudanças feitas simul
taneamente em duas dimensões de um estímulo-teste. Ao se iluminar um disco de um
pombo com luzes puras de vários comprimentos de onda, estabelece-se uma dimensão de
estímulo bem controlada, X, como já vimos. Na Fig. 9-13, a luz no disco forma uma
espécie de barra. Se este padrão de barra é girado em torno do centro do disco para
qualquer de várias posições, adicionamos ao estímulo uma segunda dimensão indepen
dente - orientação angular do padrão de luz.
- 196-
Verde Amarelo Vermelho Violeta
19/
Homg v l5 o l) executou e:.e experimento e obteve os resultados apresentados na
Fig. 9-14. A porção denominada iinha-base foi obtida na fase II. Nesta fase, pombos
- 198-
não foi completada na Fase III; a parte inferior da função em U da Fig. 9-14 mostra que,
em 570 my, a taxa de resposta no teste está bem acima do nível operante zero, normal
mente associado com o operante de bicar a chave.
A generalização de estímulo na extinção e a generalização de estímulo no
re fo rç a m e n to são procedimentos inversos. Um envolve um espalhamento do
enfraquecimento e o outro envolve um espalhamento do fortalecimento. A Tabela 9-1
contrasta seus procedimentos de definição.
Tabela 9-1
GENERALIZAÇÃO
REFORÇAMENTO EXTINÇÃO
- 199 -
Os resultados vistos nus seções 9.2 e 9.3 fundamentam a conclusão inevitável de que
ambos o reforçamento e a extinção são um tanto específicos ao estado do ambiente
preciominante quando eles ocorrem. O termo 'um tanto’ tem uma significação precisa na
forma dos gradientes de generalização que podem ser observados quando mudanças
controladas numa ou duas dimensões de estímulo, fisicamente especificadas, são feitas.
Generalização, assim, é um conceito estático. Ao contrário de muitos dos fenômenos
comportamentais já familiares (condicionamento, extinção, diferenciação), a generali
zação, em si mesmaj não é um processo. Isto é, ela não é uma mudança no compor
tamento, no tempo, com um procedimento fixo mantido constante. Em vez disso, ela é um
fenômeno que pode ser observado depois do fortalecimento ou enfraquecimento, através
do emprego de uma certa seqüência de operações (por exemplo, as fases da seção 9.3).
Num processo comportamental verdadeiro, o tempo aparece como a variável indepen
dente. Mas, nos gradientes de generalização, a diferença entre os estímulos de treino e de
teste é a variável independente. Embora seja estática neste sentido, veremos no próximo
capítulo como a generalização do enfraquecimento e a do fortalecimento se combinam
no paradigma de discriminação, gerando um dos mais fundamentais processos compor
tamentais conhecidos.
As descobenas de. laboratório sobre a generalização trazem certas implicações para
um velho problema filosófico, o do significado de similaridade. Os comentários lúcidos
de C. E. Osgood ilustram a forma pela qual o método experimental na psicologia pode/
ocasionalmente, fornecer uma re-interpretação moderna de problemas filosóficos tradi
cionais.
“Suponha que perguntemos (como temos muitas vezes perguntado em aulas introdu
tórias de filosofia): O que é mais semelhante a um quadrado vermelho um
quadrado verde ou um círculo vennelho? O psicólogo com uma orientação empírica
cansa-se rapidamente de discutir assuntos como ‘a relação de qualidades únicas’ e
corre ao laboratório para “ averiguar”! Após estabelecer uma reação, qualquer reação,
ao quadrado vennelho, ele testa seu sujeito humano para a generalização ao quadra
do verde e círculo vermelho. Irá o círculo vennelho mostrar mais generalização? Se
assim o for, o círculo vennelho está mais perto do quadrado vennelho que o círculo
verde! Isto significa que temos agora uma escala objetiva para m edir‘similaridade'?
Somente quando estamos interessados na similaridade quando definida pelo comporta
mento de um organismo. E este deve ser um tipo específico de organismo, desde que
a similaridade para o rato, assim definida (ou para o colono australiano, por exem
plo), não seria necessariamente paralela à do Homo Sapiens ocidental.
Isto levanta um problema m enor re la tiv o ao jargão psicológico nós
tomamos conhecimento periódico mas nunca observamos na totalidade. Seguimos o
ímpeto, da nossa linguagem e dizemos que ‘há mais generalização entre esses dois
estímulos porque eles são mais aproximadamente ‘similares’, e então (como o psicó
logo jovem e impetuoso citado acima), afinnamos que 'esses dois estímulos são mais
aproximadamente similares porque há mais generalização entre eles’. Ambas as pro
posições são válidas,, dependendo da definição particular de similaridade. Utilizando
um analisador de freqüência de onda, podemos medir a similaridade física ( proximi
dade no continuum de freqüência) de dois tons e então medir a generalização em
função desta similaridade. Por outro lado, podemos usar um grupo de organismos
como instrumentos de medida da similaridade de tons, como na psicofi' ‘^a, o que,
na verdade, c medir contínuos físicos em termos de generalização e disc run in ação.
- 200 -
Observe cuidadosamente, todavia, que não há garantia de que as duas medidas de
similaridade serão paralelas; de fato, raramente o são. A ilustração mais clara disto se
encontra no fenômeno de generalização de oitava. Tanto para o rato como para o
homem, pelo menos, a generalização de resposta a tons separados por uma oitava é
maior que a tons mais próximos no continuum físico de freqüência, e eles soam mais
aproximadamente ‘similares’. Mas, naturalmente, existem aqueles que diriam que o
conceito de similaridade é significante apenas em tennos do comportamento dos
organismos. Neste caso, devemos nos contentar com tantos tipos de similaridades
quantas são as especies e culturas dentro das espécies” (Osgood, 1953, p. 361).
- 201 -
de um que não tenha esta história. Frequentemente, em vez de manter um registro de
histórias particulares os psicólogos escolhem animais que não têm qualquer história experi
mental e que foram criados em condições controladas. Esses animais, quando usados pela
primeira vez, são ditos “ ingênuos” experimentalmente. Não é sempre necessário usar tais
animais ingênuos; mas devemos nos certificar de que a história particular de nossos
animais não vai, indevidamente, prejudicar nossos resultados. A uniformidade de nossos
resultados será a nossa justificação final.
Nota C. Finalmente, devemos motivar nosso animal. Aqui, o problema de controle e
mensuração é muito mais fácil que com humanos. Podemos privar nosso pombo de
alimento por, digamos 22 horas, depois do que podemos usar pequenas quantidades de
alimento como um reforçador conveniente; ou podemos esfriar o compartimento de
nosso rato até um nível próximo ao do congelamento, depois do que podemos usar um
breve sopro de ar quente como um reforçador.
As notas A, B e C são sugestões para se conseguir um animal representativo que sirva
como uma preparação experimental para o estudo do compolam ento.
10 - DISCRIMINAÇÃO
11 - REFORÇADORES ADQUIRIDOS
12 - ENCADEAMENTOS
Capítulo 10 DISCRIMINAÇÃO
Uma característica marcante dos organismos é a sua habilidade para formar discrimi
nações. Definida como o responder diferencial na presença de situações diferentes, a
discriminação contrasta com a generalização, definida como o responder similar em
situações diferentes.
As discriminações são demonstradas ao nível humano pela habilidade de “distinguir
uma coisa da outra” . Alguns de nós, por exemplo, discriminamos os quadros de Monet
dos de Manet, manteiga de margarina, dois grupos de impressões digitais semelhantes,
dois sinais morse semelhantes. Ao “distinguir uma coisa da outra” estamos fazendo nada
mais nada menos do que demonstrando um responder diferencial em suas respectivas
presenças.
Para distinguir objetos desta forma, uma certa história passada específica parece ser
um pré-requisito. Fazemos estas e outras discriminações tão casual e naturalmente,
todavia, que frequentemente negligenciamos a necessidade desta história passada.
Lembre-se, do capítulo anterior, que, tendo fortalecido uma resposta na presença de um
estímulo, a resposta ocorrerá, embora com menor força, na presença de outros estímulos
relacionados. Se um determinado estímulo é muito semelhante ao estímulo de treino, ele
pode controlar a resposta quase tão bem quanto o estímulo real de treinamento. O
procedimento de discriminação é um método para quebrar o controle generalizado do
responder mantido por uma ampla classe de situações, de modo que as situações muito
semelhantes passem a ser associadas com comportamentos muito diferentes.
Em termos de generalização quantitativa ao longo de uma única dimensão de
estímulo, esta divisão ou quebra determina o estreitamento de um gradiente particular da
força da resposta em torno de um valor de estímulo: um animal é treinado a bicar apenas
um disco verde e não outros, uma criança é treinada a restringir o nome “gato” para um
único subconjunto de animais peludos. O procedimento pelo qual tais efeitos são obtidos
é direto: o reforçamento de um determinado comportamento é restrito a uma dada
situação. Embora este procedimento de tornar o reforçamento de um operante particular
condicional à existência de uma situação o estímuloparticular seja suficientemente gerai
para incluir todas as discriminações, há bastante variações que merecem uma classificação
de discriminações em termos de complexidade, como é indicado pelo número de
situações e estímulos e correlações de resposta associadas requeridas. Em cada um dos
- 205-
quatro exemplos que se seguem, um comportamento diferencial está associado com
diferentes ambientes.
1 . O cinemeiro que discrimina não vai a todos os filmes que são levados ao cinema da
vizinhança. Ele vai (R) a alguns (Sa), e não vai (ausência de R) a outros (S r).
2. DizemosquealgunsgruposdcpcssoassíK) discriminadas quando elas são tratadas de
am modo diferente que outras pessoas são tratadas. Isto é, o grupo discriminado (Sy\^ é
tratado de um modo (R a ), e outras pessoas (S r ) são tratadas de outro modo (R r )
3. O provador de vinhos profissional pode discriminar uma variedade de vinhos que
têm o mesmo sabor para o iniciante. A discriminação do profissional é evidenciada por
sua habilidade em dar um nome particular (Rj R2 , R 3 ........RlOO) Para cada um dc mil
vinhos diferentes ( S j, S2 , S3 , . . S\ .000)-
4. Nas discriminações sutis que um relojoeiro deve fazer quando coloca (Ry) cada
uma de uma dúzia de pequenas peças no lugar apropriado (Sx), a diferença entre a
posição correta e incorreta é medida em frações de milímetros.
Cada um dos quatro exemplos ilustra um nível progressivamente mais complexo de
discriminação. Nas discussões técnicas que se seguem, volte atrás, quando necessário, ao
exemplo correspondente para uma base intuitiva.
- 206 -
3. O macaco poderia fechar os olhos, nunca olhar para as luzes, e ainda fazer uma
boa discriminação respondendo apenas esporadicamente. A primeira ocorrência de
reforçamento para uma resposta esporádica sinalizaria que todas as outras respostas
seriam reforçadas por um momento. Similarmente, a primeira resposta não reforçada
sinalizaria que todas as outras seriam por um momento extintas. Assim, o animal poderia
basear a discriminação na presença ou ausência de reforçamento ao invés de na presença
ou ausência da luz verde.
Herrick, Myers e Korotkin (1959) utilizaram um procedimento instrutivo,
empregando ratos como sujeitos, no estudo da discriminação entre períodos de luz (S^)
escuros (S ^ ), alternados aleatoriamente. Para evitar a falha 1 , eles usaram períodos de
sA de duração variável (30, 60 ou 90 seg). Para evitar a falha 2 e obter uma medida
significance da taxa de resposta durante a formação da discriminação, eles usaram um
esquema de reforçamento VI 30 seg em S^. O esquema VI em S ^ evitou também uma
discriminação baseada no reforçamento ou não-reforçamento (falha 3) jà que (i) não
reforçado não indicava necessariamente S^ , e (ii) a obtenção de um reforçamento não
significa que as respostas subsequentes seriam necessariamente reforçadas.
Para ajudar a simplificar a inspeção do processo comportamental que resulta de um
procedimento de discriminação desta natureza, as respostas em c as respostas em
podem ser registradas em registradores cumulativos separados. O registrador de S ^ corre
somente enquanto o SD está em efeito, e o registrado de S^ corre somente em S^ . A
Fig. 10-1 mostra os registros de pressão a barra de um rato nas sessões 1 , 6 , 1 1 , 21 e 40
no procedimento de Herrick, Myers e Korotkin. A resposta reforçada foi a pressão a
Tempo
Figura 10-1. Amostra de registros diários de um rato durante alguns dos quarenta dias
de treino discriminativo (Herrick, Myers e Korotkin,1959).
- 207 -
que e um caso comparável). A medida que o treino discriminativo continuou, todavia, as
taxas em e S se diferenciaram. A inclinação em parece aumentar e a inclinação
diminuir através dos 40 dias do procedimento de discriminação.
Vários comentários podem ser feitos sobre os dois processos comportamentais
associados a S ^ e S ^ , respectivamente. O aumento na taxa em SD é, provavelmente um
exemplo do fato de que a exposição a um esquema de intervalo depois de crf sempre
inicia, entre outras coisas, um aumento gradual na taxa (por exemplo, veja as curvas de
RI na Fig. 7-4), que eventualmente atinge uma assintota. Russell (1960) mostrou que se
19 sessões de treino em IV são efetuadas em SD antes do início do treino discriminativo,
nenhum aumento na taxa em SD é visto durante a discriminação propriamente dita. A
mudança na taxa em vista na Fig. 10-1, evidentemente, não é peculiar ac procedimento
de discriminação.
A segunda mudança comportamental, o declínio da taxa em SA é simplesmente o
processo familiar de extinção. Em , a pressão à barra nunca é reforçada e, assim, está
sendo continuamente extinta. O processo de extinção em SA é, sem dúvida, prolongado
por causa dos efeitos da generalização resultantes da manutenção concorrente da força da
pressão à barra em S^. A força da resposta que ocorre em difunde-se para SÀ de
acordo com os princípios da generalização. Assim, o processo de discriminação, um
procedimento onde a resposta é reforçada sob um estímulo (SD) e não sob outro (SA ), é
representado pela diferenciação gradual das forças da resposta nas duas situações de
estímulo.
Para medir o estado do processo de discriminação em qualquer momento
determinado, uma variável composta conveniente pode ser formada, constituída de
ambas as taxas em e S A . Podemos definir o índice de discriminação (ID) como
Taxa em
lD
Taxa em SD + Taxa em
i -Jl -L
D 2A- 2
i k 1
■D = j = 1
Assim, a faixa útil do índice de discriminação vai de 0,5 (generalização perfeita sem
discriminação) a 1,0 (perfeita discriminação, sem generalização). Valores intermediários
indicam graus intermediários de discriminação. Valores menores do 0,5, se confiáveis,
indicariam uma preferência de taxa para a condição SA .
- 208-
Variáveis compostas como o índice dc discriminação têm um papel importante na
construção científica de teoria. O físico define a densidade de uma substância como
sendo igual a sua massa por unidade de volume (D m/v). A velocidade média de um
corpo em movimento é uma razão entre a distância que o corpo percorre e o período de
tempo (V = d/t). A própria taxa de resposta, número de respostas/tempo, é uma variável
composta, já que envolve a razão de duas variáveis mais simples. A justificativa para se'
formar uma variável composta a certas outras variáveis na ciência são mais simples e
informativas do que aquelas para as variáveis componentes tomadas sozinhas, então, a
variável composta é dita “útil” . No caso do índice de discriminação, parece claro que
nem a taxa em SD, nem a taxa em , sozinhas, poderiam dar uma boa aproximação do
nosso conceito de discriminação. Por outro lado, alguma razão dessas duas taxas parece
estar mais estritamente relacionada com os conceitos de discriminação e podemos esperar
que a razão seja útil no sentido formal descrito. Por exemplo, a Fig. 10-2 mostra que, no
estudo de Herrick, Myers e Korotkin, o índice está de fato regularmente relacionado ao
número de sessões de treino de discriminação. Somos levados a inferir, pela Fig. 10-2,
que o processo de discriminação está virtualmente completo na sessão 1 5, ocasião em que
o índice parece ter atingido sua assíntota (11) 0,93).
CO
6
<D
Q
CO CX
d
e +->cd
+
o
CO
6
<D
cd
X
cd
- 209 -
próximos de 0,5 indicariam que pouca ou nenhuma discriminação estava sendo feita.
Com o índice igual a 0,5, poder-se-ia dizer que o rato não detetava nenhum odor, uma
vez que ele estaria respondendo na situação como se o gás estivesse ausente. Isto é,
sua taxa em S A seria a mesma que em SD. O lim ia r para a deteção de odor pode ser
definido como a concentração de odor que produz um valor do índice de discriminação
significativamente maior que 0,5. Diminuindo-se gradualmente a concentração de gás ate'
que o Iq caia a um ponto onde não seja mais significativamente diferente de 0 ,5 , o limiar
(mínimo valor detetável) de qualquer odor experimentalmente introduzido pode ser
determinado (Goff, 1961).
Exercício 7.
Delineie um experimento para determinar o som mais fraco que um chimpanzé pode
ouvir. Use apenas uma classe de respostas e esteja certo de não incorrer em qualquer das
três falhas indicadas.
S”
R P- s+
i
[ 10. 1]
SA SA
or
R />
2a 2b
- 210 -
10.3 DUAS CONDIÇÕES DE ESTIMULO, DUAS CLASSES DE RESPOSTA
Com o passar dos anos, os psicólogos projetaram uma variedade de aparelhos para
testar a capacidade discriminativa dos animais. Muitos desses envolvem pelos menos duas
respostas e pelo menos duas condições de estímulo. Um aparelho popular em sua época
foi a plataforma de saltar de Lashley (Fig. 10-3). Neste aparelho, um rato faminto fica
Figura 10-3. Uma forma da plataforma de saltar paia testar reações discriminativas em
ratos (segundo Lashley, 1938 ; de Munn, 1950).
sobre uma plataforma elevada de frente para janelas à sua direita e à sua esquerda, que
estão cobertas por cartões de papelão com desenhos. No treino preliminar, a plataforma
elevada fica perto das janelas que estão abertas, tendo os desenhos sido removidos. O rato
tem apenas que pular da plataforma, através de qualquer janela, para alcançar o alimento
localizado atrás do aparelho. Quando o rato acaba de comer, ele pode ser pego
novamente e colocado na plataforma para outra tentativa. Gradualmente, a plataforma é
movida para mais longe das janelas, até que uma verdadeira resposta de pular tenha sido
sucessivamente aproximada (modelada). Então, os cartões, que serão usados como
estímulos discriminativos, são gradualmente inseridos para cobrir as janelas, primeiro
parcialmente- e, depois, completamente. Um cartão (algumas vezes chamado cartão + )
será preso levemente por uma mola que o solta se o rato pula em sua direção. Depois do
salto, o rato encontra-se de frente a um delicioso prato de farelo amassado. O outro
cartão (chamado as vezes cartão —), todavia, esta" preso de modo que, se o rato pula em
- 211 -
sua direção, ele cai na rede localizada abaixo. Essa conseqüência serve como punição para
este pulo, além de fornecer uma tentativa de extinção.
Considere um experimento em que dois cartões sejam usados:
□ e El
Esses cartões serão alternados aleatoriamente nos dois lados, em tentativas sucessivas e a
janela que contiver o + estará destrancada, enquanto que a janela que contiver o —estará
fechada. O rato se ajustará a um procedimento desta natureza numas poucas tentativas, o
que pode ser observado no aumento gradual de 0,5 para 1,0 na probabilidade de
respostas ao cartão correto.
Não é difícil descrever as contingências existentes em tais discriminações; a chave é
avaliar inicialmente todas as situações de estímulos possíveis. Os cartões individuais não
são estímulos por si próprios. Apenas, o seu padrão particular e suas posições relativas
ajudam a definir a situação de estímulo em qualquer momento. No presente exemplo há,
antes de saltar, duas possíveis situações de estímulo:
S □ E El
sA %
Uma vez que o experimentador tentará manter todos os outros aspectos do ambiente do
rato constantes, de tentativa para tentativa, não nos preocupamos em incluir esses aspectos
constantes na descrição das duas situações de estímulo. Chamemos as duas situações de
Sa e S 3 . Se ignoramos a rede, as contingências são:
Sa Sb
re --> s + R j. f* [10.2]
RDf* R D^ S +
-212-
Figura 1 04. Aparelho de puxar para macacos. Um dos blocos amarrados com barbante
terá alimento escondido atrás (Harlow, 1948).
Embora o delineamento específico de um aparelho de discriminação com duas
respostas, dois estímulos varie para cada espécie diferente de animal, dependendo de suas
capacidades de resposta, as contingências, de discriminação, invariavelmente, obedecem à
form a geral de [10.2| . Macacos, chimpanzés, monos e crianças prestam-se
convenientemente ao uso de aparelhos que requerem respostas de manipulação (ver Fig.
10 -4 ). O fato de que a resposta do organismo possa ser dirigida ao aspecto físico do meio
ao longo do qual o estímulo discriminativo pode ser definido, não deve permitir que se
deixe de levar em conta as contingências comuns em todas as discriminações. Na seção
10 . 1 , examinamos um experimento no qual ratos pressionavam uma barra quando uma
luz estava presente, mas, por conveniência experimental, eles poderiam ter apenas que
correr em direção à luz. Na Fig. 10-4, o comportamento do animal é ‘’dirigido” a um dos
blocos e, além disso, certas propriedades do estímulo, associadas aos próprios blocos,
controlam essa resposta. Mas, em ambos os casos, a correlação de comportamentos
diferentes com ambientes diferentes caracterizam-nos como discriminações.
10.4 m CONDIÇÕES DE ESTÍMULO,
n CLASSES DE RESPOSTA
Aumentando-se o número de estímulos discriminativos usados aumenta-se a
complexidade da discriminação. Considere um caso em que um único cartão positivo, + e
dois cartões negativos,F~le | | | possam aparecer. As situações possíveis antes da resposta
(supondo que em cada situação uma, e somente uma, resposta possa ser reforçada) são:
a b e m B B B B
SA S„ S</ S|>
- 213 -
Em S \ e Sb, o pular a esquerda será reforçado, enquanto em Sc e Sd, o pular à direita
será reforçado. O uso de cartões adicionais negativos e/ou positivos cria ainda mais
situações e pode-se dizer que o grau de complexidade da discriminação aumenta
correspondentemente.
As discriminações podem ser ainda mais complicadas pela especificação de
contingências para mais de uma ou duas classes de resposta. No Wisconsin General Test
Apparatus (visto na Fig. 10-5) os movimentos de apanhar objetos a direita, esquerda e
centro são frequentemente especificados. Pode-se colocar alimento em recipientes rasos,
localizados debaixo de qualquer de três objetos. O arranjo desses objetos serve para
® â> o & O O íS )
S. Sc Se
- 214 -
10.5 MUDANÇAS CONTINUAS NO COMPORTAMENTO EM FUNÇÃO DE
MUDANÇAS CONTINUAS NUMA DIMENSÃO DO ESTIMULO
Coluna j
7/7
Figura 10-6
S,J
[10.3]
Rij
715 -
l igura 10-7. Quadros de uma aproximação simulada de um míssil a um alvo estratégico O bicar
de um pombo fornece o sinal de controle (de Swartz, 1963, segundo Skinner, 1960)
~ 216 -
reforçada são uma função contínua das coordenadas espaciais do objeto estímulo. No
presente exemplo, o ângulo e extensão da resposta de apanhar dependem da posição
espacial do objeto. A função é complexa, mas não há razão para se 'suspeitar que o
procedimento básico de discriminação empregado em cada uma das outras seções deste
capítulo não seja o método para formação dessa discriminação, ou melhor, conjunto de
discriminações. As respostas com determinados valores de ângulo e extensão, que caem
em certos limites pequenos, são reforçadas somente quando o objeto está numa certa
posição relativa ao organismo. As respostas cujos valores de ângulo e extensão se desviam
desses limites não são reforçados. ( 0 objeto não é apanhado)* Tal história passada e
subseqüente controle do comportamento que ela confere à posição espacial, c
imediatamente aparente quando “ tateamos” em busca de uma lanterna no escuro, ou
quando procuramos por um lápis que cai debaixo c!e uma mesa, fora da visão.
- 217 -
Sugere-se a seguinte explicação para se levar em conta este efeito. Um processo de
discriminação, tal como o descrito na seção 1 0 . 1 , é prolongado principalmente devido ao
processo de extinção que deve ocorrer em S^ . Mas, uma das principais variáveis que
afetam a extensão de qualquer processo de extinção é o número de reforçamentos
obtidos na aquisição (ver seção 5.9). Se poucos reforçamentos são dados antes da
extinção, esta será rápida. No treino discriminativo, a resposta em S^ é devida a
generalização do fortalecimento em S^ * O gradiente de generalização implica em que o
potencial de respostas em S ^ , gerado pela aquisição, será menor que ou igual aquele
estabelecido em S^. Nesta análise, pressupõe-se uma família hipotética de gradientes de
generalização, tais como os da Fig. 10-8. O parâmetro da Fig. 10-8 é o número de
reforçamentos fortalecedores durante a aquisição. Note que, quanto menor o número de
reforçamentos administrados, mais próximo S^ pode estar de SD, sem que ocorram
respostas a S A através da generalização.
No procedimento de Skinner, o treino discriminativo começou com uma luz presente
(SD). A primeira pressão a barra emitida, no nível operante, foi reforçada e S^ foi
imediatamente substituído por um período de 5 min de escuro (S ^ ). Depois do
período de 5 min em , o S ^ foi reintroduzido e novamente a primeira resposta
emitida foi reforçada, seguida pelo aparecimento do S ^ e suas conseqüências de
extinção. Este ciclo foi repetido através do treino discriminativo. Sob essas condições, a
generalização a é negligível, havendo pouco ou nada para extinguir em sua presença.
Devido ao fato de que o responder em S^ não ocorre na aquisição de tais
discriminações, elas são apropriadamente denominadas “sem erro” .
H. S. Terrace (1963 a, b) estendeu essa ténica para demonstrar discriminações sem
erro entre pares de estímulos discriminativos muito próximos no gradiente de
generalização. No trabalho de Terrace, o princípio do mínimo fortalecimento inicial é
combinado com a técnica de usar, inicialmente, estímulos bem diferentes como S ^ e
SA e, então, progressivamente, reduzir as diferenças físicas entre eles.
Dimensão do Lístímulo
- 218-
O treino discriminativo é iniciado com um sA bastante diferente de para evitar
generalização (ver Fig. .10-8). À medida que se prossegue o treino discriminativo, as
diferenças entre e são gradualmente reduzidas, tornando-se o mais e mais
semelhante a SD. Isto resulta em tornar o S ^ cada vez mais próximo do SD nas suas
dimensões comuns de estímulo.
Num dos procedimentos de Terrace, o bicar um disco vermelho foi modelado e
receber poucos reforçamentos. Uma discriminação entre vermelho (S^) e verde (SÀ) foi
estabelecida, virtualmente, com nenhuma bicada em com o seguinte método:
“O bicar a chave é condicionado a uma luz vermelha (Sl^). Seguindo cada um dos
cinco primeiros reforçamentos, a luz da chave era sempre vermelha. Depois do
quinto reforçamento, a chave foi obscurecida por 2 seg, depois do que a luz vermelha
aparecia novamente. Seguindo os 20 próximos reforçamentos, o intervalo (escuro)
foi progressivamente aumentado até o intervalo máximo de 30 seg, com uma média
de 15 seg, ser alcançado. Neste ponto, o S ^ foi introduzido. Inicialmente, SÃ era
uma luz verde fraca com 1 seg de duração. Durante tentativas sucessivas em SA , sua
duração e intensidade foram aumentadas progressivamente, até que a duração de
S A fosse de 5 seg e os brilhos de SD e S ^ fossem iguais” (Terrace, 1963, b, p.
224).
- 219 -
segurança de estradas. Como se sabe, este RT pode variar de uma pequena fração de
segundo até vários segundos, dependendo de fatores tais como a concentração de álcool
no sangue, número de horas na direção e presença ou ausência de cafeína no sangue. No
laboratório, os tempos de reação são frequentemente medidos dando-se instruções a um
sujeito humano para pressionar uma chave telegráfica tão rápido quanto possa, depois de
receber um sinal. Tempos de reação da ordem de pequenas frações de segundo (200 —
500 milisegundos) são obtidos com tal procedimento, particularmente se o sinal de
‘Prepare-se” precede o sinal verdadeiro para “ responder” .
- 220 -
R» s+ [10.4]
sr
- 221 -
r
25 21 13 24 29 24 27 16 24 27
30 25 25 23 22 29 23 26 26 25
27 26 25 0 15 28 19 27 23 19
11 27 11 30 28 19 6 26 6 16
37 22 25 25 20 32 23 23 26 24
26 25 8 27 20 31 21 29 22 25
.5
'5c
ocr
tt>
-H
u,
10 15 20 f25
Número de respostas emitidas em
intervalos de teste de 1 min.
1'igura 10-9. Histogramas do número de respostas emitidas em 30 períodos de um
minuto de sA (acima) c 30 períodos <te um minuto dcSD (cmbaivo) Dados fictícios
- 222 -
a discriminação entre ar fresco e odor, se existe, é mínima. Contudo, existem,insinuações
de uma diferença entre o responder em e .A distribuição em SA está mais à
esquerda da discriminação S ^; a distribuição em contém a taxa mais baixa (0
respostas) enquanto a distribuição em contém a taxa mais alta (36 respostas); as
modas das duas distribuições não são idênticas; a média da distribuição em S A é 20,7
respostas/min e a da distribuição em é 24,7 respostas/min.
São as diferenças nestas duas distribuições o resultado de erros casuais de medida ou
elas são, de fato, indicações significantes de uma pequena discriminação? Neste ponto, é
útil lembrar alguns aspectos pertinentes da assim chamada curva normal, discutida na
seção 2.6 e reproduzida na Fig. 10-10. Em particular, desejamos lembrar que entre mais
ou menos um certo número de unidades de desvio padrão, 0 do centro, encontra-se
uma certa percentagem de medidas contidas na área sob tal curva. Para rever, 68 por
cento das medidas se encontram sob a curva entre + 1 O da média central. Uma maneira
- 223 -
distribuição estão entre + 2 CJ e somente 0,05 (5%) estão íora. Esta proposição não diz
que a medida dissidente não veio desta distribuição; poderia ter vindo. Somente diz que é
algo improvável que ela tenha vindo. i
Nosso problema presente tem alguns elementos em comum com a avaliação de uma
única medida nova em referência a uma distribuição conhecida. Avaliando nossos dados
de discriminação não temos apenas uma comparação de uma medida com uma distri
buição de medidas, mas uma comparação de duas distribuições separadas (S^ e SA) de
medidas. O que gostaríamos de saber é se a distribuição em S^ difere sistematicamente,
embora pouco da distribuição em S^.
Uma maneira proveitosa de abordar este problema é investigar se as médias das duas
distribuições diferem significativamente uma da outra. Em outras palavras, será que a
diferença de 4,0 entre 20,7 e 24,7 representa apenas flutuações ao acaso na taxa de
resposta momento-a-momento que, por acaso, foi detetada na nossa divisão arbitrária da
sessão em períodos de “S ^ ” e “S A ” e, no que diz respeito ao rato, S ^ e S A
constituem tratamentos iguais? Ou, será essa diferença de 4,0 o resultado das condições
SD realmente terem um efeito diferente de SA sobre a tendência do responder?
Uma maneira laboriosa de determinar a interpretação mais plausível seria fazer mais
sessões adicionais e idênticas do nosso experimento, mas usando um valor para SA que
sabemos estar muito próximo de S ^ para ser discriminavelmente diferente dele (por
exemplo, S ^ sA), de modo que quaisquer diferenças nas taxas em S^ e S ^ teriam
que ser devidas apenas ao acaso. Essas sessões adicionais dariani um grande número dc
novas médias de taxas de resposta em S^ e sA . Poderíamos subtrair a média de da
média de S A para a sessão e obter uma diferença; poderíamos subtrair a média dc SD da
média de SA para a sessão 2 e obter outra diferença e assim, sucessivairente, para todas as
sessões que tivéssemos a paciência de realizar.
Terminaríamos com um conjunto de números, as diferenças entre as médias emSD e
S ^ . Poderíamos fazer um gráfico da distribuição dessas diferenças entre as médias (os
estatísticos nos asseguram que resultará numa curva normal) e calcular o desvio padrão, o
sigma das diferenças entre as médias da amostra, O Md. Note que esta distribuição das
diferenças entre as médias da amostra deve ter o centro em torno de zero se, ao manter
nossas condições experimentais constantes de sessão a sessão, nenhuma discriminação foi
possível entre S^ e sA . As diferenças observadas entre as médias obtidas de sessão para
sessão seriam, neste caso, apenas aquelas resultantes de flutuações no responder, devido a
influências não controladas, mas presumivelmente não sistemáticas, que poderiam ser
tanto positivas quanto negativas em qualquer momento. Com a adição de sessões, elas se
cancelariam mutuamente, deixando-nos uma diferença média entre as médias igual a
zero.
Uma vez com essa distribuição das diferenças entre as taxas médias de resposta
durante períodos de S ^ e S A não discrimináveis, poderíamos, então, comparar o nosso
valor observado de 0,4 com a distribuição das diferenças casuais entre as médias, para ver
se 4,0 está além de 2 (T Md unidades do centro em zero. O método seria o mesmo através
do qual comparamos uma única medida com uma distribuição conhecida.
L)e fato, não é prático e nem econômico repetir estes experimentos de controle
ta.nlas vezes para obter uma estimativa razoável de como a distribuição das diferenças
entre as médias da amostra se apresentaria no caso onde houvéssemos arranjado
anteriormente para que as amostras não diferissem consideravelmente, exceto por acaso.
Na prática, podemos nos valer de uma derivação da estatística matemática que mostra
- 224 -
que uma estimativa do desvio padrão crítico, O Md, pode ser obtido com um pouco dc
matemática aplicada às nossas 30 medidas originais em SD e S A.
O que devemos fazer primeiro é calcular o desvio padrão do conjunto das 30 taxas
observadas em e o desvio padrão do conjunto das 30 taxas observadas em SA dos
dados da Tabela 10-1. Combinamos, então, esses dois desvios padrões obtendo um desvio
padrão combinado (chamado cr D para distinguir de outros desvios padrões) que para os
dados da Tabela 10-1 é =9,15. Neste ponto aplicamos uma fórmula estatística, com cuja
origem não precisamos nos preocupar, para obter uma estimativa de o o desvio
padrão das diferenças entre as médias da resposta em SD que esperaríamos obter se
repetíssemos o experimento por muitas sessões. A fórmula diz que CTj^ é estimado por
cr D /V N - onde N é o número de pares de medidas que temos, neste caso, 30. O
resúltado, 9,15/ V 30 = 1,67, pode ser usado para determinar a probabilidade de que a
nossa diferença média particular observada, 4,0, aparece apenas devido a erros envolvidos
ao se medir as taxas de resposta em S^.
Evidentemente, 4,0 é maior que duas unidades do tamanho de 1,67. Isto é, a
diferença obtida, + 4,00, encontra-se na região (+ 4,00 / 1,67) a unidades acima da
média da distribuição teórica das diferenças esperadas apenas por acaso. (Lembre-se de
que a média desta distribuição teórica, para o caso onde há somente erros casuais em
para perturbar as medidas da taxa da resposta em é zero). Realmente, uma
diferença t£o giande como 4,0 entre duas médias seria esperada surgir devido ao acaso
menos que 5% das vezes. Uma diferença observada tão improvável de surgir devido a
erros casuais de medida é convencionalmente dita estatisticamente significante. É neste
sentido técnico que, quando nos referimos a resultados numéricos neste texto, a palavra
significância é empregada.
Iniciamos com uma certa diferença pequena entre duas distribuições de taxa de
resposta. Utilizando certas propriedades da curva normal e certas derivações da estatística
matemática, fomos capazes de encontrar a probabilidade do que uma diferença entre as
médias de duas distribuições observadas de dados fosse tão grande quanto o seria se
atribuída apenas a erros casuais. Ao fazer assim, avaliamos a significância estatística da
nossa diferença. A técnica usada foi encontrar, primeiro, um desvio padrão combinado
representando a variabilidade em e SA e, segundo, desta estatística derivar o O O
método supõe que números iguais de medidas sejam feitos nas duas condições. Esta
restrição pode ser superada pelo uso de outras fórmulas, algo menos intuitivas,
encontradas em qualquer livro elementar de estatística. Em geral, os métodos para
ístimar a probabilidade de que as diferenças observadas entre duas médias são devidas a
erros casuais de medida são usados onde ( 1 ) as diferenças observadas são pequenas, ( 2 ) a
variabilidade de medidas é alta como um resultado de perturbações não controladas ou
não controláveis, (3) o tempo não permite a replicação do experimento bastante vezes de
modo a fornecer uma base empírica para estimar a confiabilidade das diferenças
encontradas entre as condições experimentais.
- 225-
Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56,
51-65. “ ’
Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in S° and
SA rates during the development of 'an operant discrimination. / .
comp, physiol. Psychol, 1959, 52, 3 5 9 - 3 6 3 .
Keller, F. S., and Schoenfeld, W. N. Principles of psychology. N e w York:
Appleton-Century-Crofts, 1950.
Lashley, K. S. The mechanism of vision X V . Preliminary studies of the
rat’s capacity for detail vision. J. gen. Psychol. 1938, 18, 1 2 3 - 1 9 3 .
Miüenson, J. R. Random interval schedules of reinforcement. J. exp.
Anal. Behav., 1963 6, 4 3 7 - 4 4 3 .
Munn, N. L. Handbook of psychological research on the rat. Boston:
Houghton Mifflin, 1950.
Pfaffman, C., Goff, W. R., and Bare, J. K. An olfactometer for the rat.
Science, 1958, 12 8, 1 0 0 7 - 1 0 0 8 .
Russell, I. S. Analysis of the responding during operant discrimination.
Unpublished doctoral dissertation, Indiana Univer., 1960.
Skinner, B. F. The behavior of organisms. Chapter 5. N e w York: A p-
pleton-Century, 1938.
Skinner, B. F. Pigeons in a pelican. Amer. Psychol., 1960, 15, 2 8 - 3 7 .
Swartz, P. Psychology the study of behavior. Princeton: Van Nostrand,
1963.
Terrace, H. S. Discrimination learning with and without “errors.” J. exp.
Anal. Behav., 1963a, 6, 1 - 2 7.
Terrace, H. S. Errorless transfer of a discrimination across two continua.
J. exp. Anal. Behav., 1963b, 6, 2 2 4 - 2 3 2 .
- 226 -
Capítulo 11 REFORÇADORES ADQUIRIDOS
É fácil notar, mesmo com um exame rápido do mundo que nos cerca, que algumas
das conseqüências especiais que denominamos reforçadoras têm uma primazia mais
natural ou biológica do que outras. Poucos discutiriam que alimento, água e sexo estar
numa categoria diferente mais “ básica” do que livros, dinheiro e automóveis. Mesmo
assim, os organismos, uma vez ou outra, trabalham por todos esses. Podemos distinguir
essas duas categorias pelo modo em que o organismo chega a possuir uma suscetibilidade
ao reforçamento. Para cada indivíduo, existe uma classe de reforçadores cujos poderes
são meramente uma conseqüência biológica da filiação do indivíduo a uma certa espécie.
Esses reforçadores são uma propriedade das espécies tanto quanto as manchas do
leopardo, a pele do gato a cauda do cachorro. As suscetibilidades ao reforçamento que são
c o n stru íd as no organismo deste modo definem os reforçadores primários ou
incondicionados. Eles serão discutidos em capítulos subsequentes sobre Motivação. Para
o presente, voltamo-nos para um segundo grupo de reforçadores, “ secundários” , que
parecem mais variáveis e menos previsíveis de indivíduo para indivíduo, comparados com
os do primeiro grupo.
Dinheiro, carros, lápis, jornais, prestígio, honra e um sem n&mero de outras coisas
arbitrárias que os seres humanos trabalham para obter, constituem uma grande fonte de
reforçadores fidedignos e potentes. Mas essas coisas não têm valor algum para nós quando
nascemos. Claramente, elas devem ter adquirido sua capacidade para reforçar em alguma
ocasião durante a história passada de cada indivíduo. Uma história passada individual é
um pré-requisito; prova disto é aquele adulto ocasional para quem alguns dos refor
çadores convencionais parecem não ter valor algum. Neste sentido, o outro tem pouca
importância para um monge Trapista, um homem primitivo dificilmente lutaria por uma
cópia do New York Times e nem todos gostam de Brahms.
Dinheiro, material impresso e os trabalhos de um compositor particular não têm o
valor universal do alimento, água e sexo, embora para um dado indivíduo sua atração
possa parecer igualmente forte. Como mostraremos em seguida, os reforçadores
adquiridos obtêm seu poder para fortalecer e manter o comportamento em virtude de
uma história passada de associação com reforçadores primários.É sua dependência sobre
essa história condicional para que tenham poder de reforçar que lhes dá o nome de
reforçadores condicionados.
- 227 -
Os reforçadores condicionados parecem ser especialmente difundidos na manutençao
do comportamento humano. Realmente, eles estão ligados com a própria noção de
cultura humana. Contudo, eles são facilmente cultivados em sujeitos animais no
laboratório, onde as condições exatas para o seu estabelecimento e a medida precisa de
suas forças relativas podem ser quantitativamente estudadas.
SA
e
Ri ■/> R, -+ S +
2
onde SD = clique-luz
SA = ausência de clique-luz
S+ = alimento
R, = aproximação ao comedouro
(2) Então, em S ^ , permitir que uma resposta não fortalecida anteriormente, por
exemplo, pressão a barra, produza o estímulo discriminativo positivo, S ^, retirando-se,
ao mesmo tempo, o reforçador primário final.
SA [Sn
Ri ■/"* Rj -f> [111]
R 2 ----->
2 1
-2 2 3 -
Para testar a eficácia do clique-luz como agente reforçador independente, o
reforçador primário deve estar ausente. Na medida em que o alimento ocorrer no final da
seqüência, o fortalecimento de um novo operante (em | 1 1 . 1 | , pressão à barra) pode ser
inteiramente devido à ação do reforçador primário; o clique-luz, por si só, pode ser
irrelevante.
É claro que, durante o teste de 111 - 1 1 , a extinção da resposta de aproximação ao
comedouro procederá concorrentemente comquaisquer efeitos de fortalecimento que c
procedimento possa estar exercendo sobre a pressão à barra. Assim mesmo, o resultado
experimental de 111.1| é inequívoco. A resposta de pressão à barra existindo
anteriormente numa taxa baixa no nível operante, é rapidamente forlalccida apenas pelo
SD clique-luz. A resposta à barra é condicionada a despeito do fato de nenhum alimento
estar sendo apresentado, e*a despeito do fato de a resposta ao comedouro estar,
simultaneamente, em processo de extinção. Na Fig. 11-1, são vistas curvas cumulativas de
quatro ratos neste procedimento. Pela primeira vez na história de condicionamento dos
ratos, cada pressão à barra produziu uma conseqüência especial - o para aproximação
ao alimento., Durante o tempo em que a Fig. 11-1 foi registrada, o alimento nunca
apareceu Comprrada* r.nm curvas de fortalecimento com reforçamento primário (por
exemplo, alimento), as curvas são mais variáveis e mais negativamente aceleradas (ver Fig.
4-2). Da observação do aumento geral na taxa de pressão à barra visto na Fig. 11-1,
todavia, não há dúvida de que tornar o contingente a pressão à barra, serve,
temporariamente, para condicionar o operante. As curvas do fortalecimento apenas pelo
clique-luz tomam a forma geral das curvas de extinção. Isto nada tem de surpreendente
porque, simultaneamente com o condicionamento de R2 (pressão l\ barra) por SD? Rj
(aproximação ao comedouro) está sendo extinta. Logo, o está perdendo,
concorrentemente, seu poder para agir como para Rj e, por inferência, também o
valor reforçador adquirido. Esta perda é uma conseqüência inevitável do teste de
reforçamento secundário.
- 229 -
Tempo (minutos)
Figura 11-1. Fortalecimento de um operante cie pressão à barra em quatro ratos
famintos, quando o único reforçamento é o que anteriormente determinava a
ocasião para a aproximação ao comedouro (Skinner, 1938).
S” [SA
e |R, -h
2 1
- 230 -
R a ser condicionada e o SD contingente conserva o poder do reforçador secundário. O
método consiste, simplesmente, em deixar a nova R produzir o probabilisticamente,
R2 -£ -> SD, ou alternativamente, incorporar R em um operante de ordem superior, nR
SD Uma intermitência bem escolhida, aqui, não somente irá conservar o poder de S^,
mas manterá também uma alta taxa de R2 . A conservação do poder de S^, neste
procedimento, deriva de sua infreqüência de ocorrência. não perderá seu controle
sobre R] até que R[ tenha ocorrido um certo número de vezes(jem reforçamento) na
presença de SD. Se SD aparece infrequentemente, Ri temapenas oportunidades
infrequentes para enfraquecer.
Numa variante deste método, empregada por D. W. Zimmerman (1957,1959), ratos
famintos foram treinados a correr numa pista, obtendo alimento na caixa-objetivo, no
final. Uma tentativa na pista iniciava-se quando o rato era colocado na caixa de partida.
Uma campainha soava brevemente, a porta da pista se levantava e o rato podia correr até
a caixa-objetivo. O tempo de reação (RT) entre o som da campainha e a resposta de
entrar na caixa-objetivo foi medido. Até aqui este procedimento consiste de
S"D
R , -------> S +
S”
R, >S '
Nas 60 tentativas seguintes, essa probabilidade foi gradualmente diminuída de 0,5 para
cerca de 0,2. Isto é, no final de 90 tentativas do treino de correr, somente cerca de 1
corrida em 5 terminava com alimento. Nas outras quatro corridas, o rato encontrava a
caixa-objetivo vazia. Mesmo assim, o RT de correr à campainha permaneceu curto; a
campainha e a abertura da porta continuaram a agir como um S& para uma resposta
vigorosa e veloz na pista. A situação neste ponto é reminiscente do nosso próprio
comportamento ao atender ao telefone. Embora somente poucas das chamadas possam
ser realmente dirigidas a nós, o comportamento de atender permanece (como o
comportamento de correr dos ratos de Zimmerman) com alta força.
Seguindo essas 90 tentativas do treino de correr, o alimento foi permanentemente
removido e instalou-se uma barra na caixa de partida. Uma tentativa iniciava-se com o
rato sendo colocado na caixa de partida como de costume, mas agora a campainha e a
abertura da porta tornaram-se contingentes unicamente à pressão à barra. Usando o S^
campainha-abertura da porta como o único reforçamento, Zimmerman modelou
progressivamente um operante FR de 15 pressões à barra em três sessões de 90 min.
Durante as 11 sessões seguintes, a resposta FR 15 foi mantida completamente pelo S^
- 231
contingente, enquanto, em cada tentativa, o comportamento de correr subsequente foi
lentamente enfraquecido em virtude de sua extinção. Este estágio é representado como
R S”
[ 11.2]
R.
2
Sc SB
R2 -----> Ri ----- - S '
- 233 -
onde Sg= ficha branca na mão.
Sç = ficha branca no chão
- uva
Rl = inserir ficha na máquina
R2 = apanhar a ficha.
Os animais foram, posteriormente, ensinados a puxar uma barra pesada para obter fichas,
uma tarefa que aprenderam facilmente.
Sq [S-c SB
Kl -----> 1^2 -----► Rj -----> S +
onde So = nenhuma ficha presente
R 3 = puxar uma barra.
Posteriormente, foi estabelecida uma discriminação adicional entre fichas de metal
que nada valiam — isto é, não operavam a máquina de vender, se nela inseridas —e fichas
brancas. Uma breve história com este conjunto de contingências foi suficiente para tomar
os animais indiferentes às fichas de metal.
Em outros experimentos (Cowles, 1937) com um aparelho análogo à plataforma de
saltar de Lashley, na Fig. 10-3, os animais aprenderam discriminações de padrões espe
ciais onde o único reforçamento consistia de ^tokens'.’ Nos experimentos de Cowles, a
resposta era simplesmente a de empurrar para o lado o cartão contendo o padrão correto.
As máquinas de vender ficavam em outra sala, onde, depois que a discriminação havia
sido aprendida (Io — > 1 ,0 ), as fichas acumuladas podiam ser trocadas.
Nesses vários experimentos, os chimpanzés adquiriram novos comportamentos quan
do o único reforçamento imediato eram as fichas. As fichas são distintas de qualquer
outro reforçador secundário apenas por suas propriedades físicas, que as tornam manipu
láveis, estocáveis, etc. Naturalmente, um “token” não é apenas o S^ para uma resposta de
inserção; ele também fornece os verdadeiros meios físicos através dos quais tal resposta
manipulativa pode ser emitida. Uma ficha implica tanto em reforçamento para inserir
como torna possível a inserção. Contudo, os “tokens”, tal como campainhas e cliques,
tornam-se S^s simplesmente porque uma certa resposta é reforçada em sua presença.
11.4 REFORÇADORES GENERALIZADOS
Muitos estímulos discriminativos positivos estabelecem a ocasião para mais de um
único tipo de resposta ser emitido e reforçado. Alguns S^s, de fato, controlam numero
sas respostas, cada uma das quais pode levar a um reforçador primário diferente. Fora do
laboratório, tais situações são encontradas frequentemente. O dinheiro é um exemplo
excelente. Tendo dinheiro, muitas respostas podem ser emitidas, cada uma levando a seu
reforçador próprio e distinto.
S(dinheiro)
^(comprar bilhetes de teatro)
St +
R(comprar um casaco novo)
S2+ [11.3]
R(pedir uma refeição) S3+
- 234
“ Atenção” é, algumas vezes, usado como um nome para um tipo semelhante de S^.
De modo a obter reforçamento para várias respostas verbais, é <juase sempre necessário
que uma pessoa obtenha a “ atenção” de uma outra. Quando o Su atenção é conseguido,
muitas respostas (pedidos, ordens, etc.) podem, então, ser emitidas com a chance de
serem reforçadas. Na ausência de “ atenção” , poderíamos dizer que tais pedidos não são
ouvidos ou notados, o que é equivalente a dizer que eles estão sendo submetidos à
extinção.
Estímulos disc rim in ativos que podem estabelecer a ocasião para mais de uma seqüên
cia resposta-reforçamento estão baseados numa história de associação com mais de um
reforçador primário. No diagrama [ 11.3| por exemplo, o dinheiro foi previamente asso
ciado, através de treinamento - SA+, a entretenimento,calor, alimento, etc. Estímu
los discriminativos associados desta maneira a mais de um reforçador primário e cuja
disponibilidade se torna, então, contingente a um novo comportamento, são chamados
reforçadores generalizados. Embora eles pareçam ter um importante papel na mediação
do comportamento humano complexo, tais reforçadores generalizados não têm sido
estudados extensivamente no laboratório.
EXERCÍCIO 8
- 235-
te S A (escuro). Imagine que, em vez de se fornecer automaticamente, uma luz brilhante
como SD e o escuro como SA 9 outro grupo de animais fosse treinado numa condição
intermediária de iluminação fraca, que não mudasse quando cada período de V I se
iniciava e terminava, nem quando cada período de extinção se iniciava e terminava. Em
linguagem vernacular, diríamos que esses animais não teriam meios de dizer se estariam
em VI ou em extinção. Se o período de extinção não fôr muito prolongado, ratos
treinados nessas condições ajustar-se-ão, produzindo uma taxa constante de respostas
tanto em VI como em extinção.
Suponha que, depois de tal estabilização, uma nova contingência seja introduzida
pela primeira vez. Se agora o rato puxasse um cordão localizado em seu compartimento,
a luz fraca seria imediatamente substituída pelo escuro (SA ) ou pela luz clara (S^),
dependendo da contingência que estivesse em efeito naquele momento. O que fizemos
foi dar ao organismo a opção de produzir estímulos discriminativos. O resultado compor-
tamental de tal opção é claro. A contingência age rapidamente para condicionar a respos
ta de puxar a corda (Wyckoff, 1952).
Quando uma resposta permite a um organismo observar uma situação correlacionada
com o estado de suas contingências de reforçamento, referimo-nos a ela com uma res
posta de observação. Ao observar meramente um aspecto do seu ambiente correlacionado
com certas contingências de reforçamento, o animal não modifica qualquer delas, mas
tem agora a oportunidade de evitar respostas não reforçadas.
As respostas de observação estão entre as mais comuns das nossas atividades diárias.
Para discriminar uma nota genuína de uma falsa, certas respostas de observação muito
detalhadas são necessárias. Uma grande parte do treinamento de peritos em notas falsas e
impressões digitais envolve o fortalecimento de respostas de observação que usualmente
permanecem incondicionadas no leigo. O perito deve aprender quais aspectosde uma
situação deve estudar de modo a poder distinguir entre estímulos diferentes que possam
estar presentes do seu ambiente puxando um cordão que produz S ^ o u S A s o perito em
notas falsas pode checar a impressão significante numa nota bancária que a identificará
como genuína ou falsa. Em ambos os casos, a resposta de observação, puxar o cordão ou
examinar a impressão, permite ao organismo fazer uma discriminação que aumenta a
probabilidade de ele ser reforçado.
A habilidade do perito em fazer discriminações, seja entrevinhos, impressões digitais
ou pinturas, é frequentemente vista com algum espanto pelo novato. Para este último,
dois casos seguramente discriminados pelo perito parecem, soam ou têm sabor de “seme
lhante”. O comportamento de observação no iniciante não foi fortalecido, não lhe permi
tindo “ saber onde procurar as diferenças’ . Ao fortalecer o comportamento de observa
ção em humanos, p o d e m o s muitas vezes “ apontar” , com êxito, as diferenças nas situa
ções. Ao apontar os aspectos da situação de que dependem as diferenças entre e SA .
aproveitamo-nos de uma história passada em que o reforçamento foi previamente contin
gente ao olhar na direção em que o dedo aponta.
Contingências análogas modelam respostas de escutar, bem como o comportamento
de observação em outras modalidades sensoriais. Em geral, uma característica importante
de uma resposta de observação ó que ela aumenta a probabilidade de reforçamento para o
comportamento. Isto certamente c verdadeiro para o rato que tem a opção de produzir
seus S^s e s. Se a discriminação do animal é boa, apresentações de S^ e SA irão,
pelo menos, permitir que a resposta seja limitada a SD. Isto tem o efeito de aumentar a
probabilidade geral de reforçamento para a resposta, bem acima do que aconteceria se S^
e S^- distintos não estivessem disponíveis. No basebol, o batedor que observa um movi
mento rnínimo mas característico do lançador prestes a lançar uma bola que descreverá
uma trajetória ci^va tem uma chance meihor de rebatê-la do que teria sem tal S^.
Frequentemente, os S^s e s produzidos pelo comportamento de observação são
cruciais para a ocorrência de qualquer reforçamento. Tente enfiar uma linha na agulha
com os olhos vendados, ou responder a uma questão de prova sem tê-la lido antes. Em
ambos os exemplos, a probabüidade de reforçamento é tão pequena que pode ser efetiva
mente zero na ausência de um comportamento de observação apropriado.
O comportamento de observação é frequentemente encoberto, tal como quando um
homem se senta silenciosamente na presença de um rádio. Ele está ouvindo ou não? Isto
é, ele está observando ou não? Em geral, a resposta a esta questão pode ser obtida apenas
pelo estabelecimento de contingências de reforçamento onde a probabilidade de que o
indivíduo emita certas palavras seria insignificantemente pequena na ausência de um
comportamento de observação anterior. Se perguntarmos o que foi dito no rádio, a
resposta de repetir o que foi dito de fato é tida como evidência prima facie de que o
comportamento de observação deve ter ocorrido.
EXERCÍCIO 9
Faça a anotação das contingências que predominam quando um organismo tem a
opção de produzir e S ^ , como está descrito no início desta seção. Para tômar o
exercício mais simples, suponha que um esquema de probabilidade uniforme seja alter
nado com extinção.
O conteúdo das seções 11.1 — 11.5 implica em que uma condição suficiente para
tornar um estímulo um reforçador condicionado é fazê-lo um S^ através do procedimen
to de discriminação. Existe pouca evidência de que tornar um estímulo um SD seja uma
condição necessária e suficiente para torná-lo um reforçador condicionado. (Myers,
1959; Kelleher e Gollub, 1962). Em várias ocasiões, observamos, que, à medida que um
estímulo perde sua função de SD? ele perde também sua potência como reforçador con
dicionado. Dinsmoor (1950) mostrou que a resistência à extinção de um operante dis
criminative) era a mesma se o operante fosse extinto na presença de seu SD, ou extinto
com o SDcontingente a ele. Outro experimento (Notterman, 1951) mostrou que, quan
to menor o treino discriminativo que o sujeito receba, menor o valor reforçador que o
SD adquiria.' Essas observações sugerem que as funções discriminativas e reforçadoras de
um SD são estreitamente ligadas, se não diretamente paralelas.
Schoenfeld, Antonitis e Bersh (1950) mostraram que a simples associação de um
evento ambiental como um reforçador primário, por si só, é insuficiente para tomar o
evento um reforçador condicionado. Ratos foram treinados a se aproximarem de seus
comedouros recebendo uma pelota de alimento. Após o rato ter pegado a pelota e já
estar comendo-a, urna luz breve (1 seg) era apresentada. Cem associações luz-comida não
conferiu qualquer valor reforçador potencial à luz porque, em testes subsequentes, o
animal não pressionava a barra para produzir apenas a luz.
Indícios sobre as associações necessárias e suficientes para produzir reforçadores
237
Convencional S I inefetivo
S, Q __ D____ 0- ü
st n n n nn n
R-*-S+ 1 1 1 .... i i i
I n te rm ite n te Sd re d u n d a n te
s, __D____ Q. n n n .
s, n n n
R-*-S* I 1 1 1 ... 1. .
- 238-
No caso inferior, à direita, os dois eventos neutros são apresentados quase ao mesmo
tempo (separados de poucos segundos), depois do que uma resposta pode produzir
reforçamento primário;este caso conferirá valor reforçador condicionado a S j,m as não a
S2 (Eggere Miller, 1962, 1963). Parece que S2 é redundante, não fornecendo qualquer
informação nova sobre a ocorrência da contingência de reforçamento. Este resultado
explicaria o insucesso de Schoenfeld, Antonitis e Bersh em tomar a luz um reforçador
condicionado. Em seu experimento, a luz era S2 ,já tendo sido precedida de S], a visão da
pelota ou a pelota na boca, etc.
Uma análise geral dos quatro casos da Fig. 11-3 indica dois fatos relevantes. (1)
Existem vários paradigmas para estabelecimento de S^s e todos os S^s assim estabele
cidos também adquirem o poder de reforçador condicionado. (2) Somente quando um
estímulí é informativo (isto é, correlacionado não redundantemente com uma contin
gência de reforçamento) é que ele se torna um S ^ ou um reforçador condicionado. Os
argumentos discutidos nesta seção devem ser tomados provisoriamente, porque sua gene
ralidade depende da confirmação de paradigmas temporais, respostas e reforçadores pri
mários adicionais.
- 139 -
reforçamento final, os S^s e os[reforçadores condicionados]que são a trama e urdidura
de sua vida na sociedade (Keller e Schoenfeld, 1950, pp. 257-258).
Um rato ensinado a imitar outro rato está demonstrando uma habilidade, social
rudimentar e mostrando a ação de um reforçador social. Miller e Dollard (1941) treina
ram ratos famintos a atravessar uma pista elevada em T, vista na Fig. 11-4. Alguns ratos
Figura 11-4. Uma pista elevada, em T, para estudai a imitação no rato (segundo Miller e
Dollard, 1941).
foram treinados a correr para um cartão branco ou preto. A posição dos cartões era
distribuída aleatoriamente em tentativas sucessivas. Outros ratos foram treinados simples
mente a correr consistentemente para a direita ou para a esquerda. Quando o rato
executava uma corrida correta, ele encontrava alimento num recipiente colocado na base
do cartão. Esses ratos eram chamados de “líderes” eram treinados até que corressem 20
vezes consecutivas corretamente.
Um segundo grupo de ratos foi treinado para seguir os líderes. Em qualquer tentativa
em que seguiam os ratos líderes, os “seguidores” encontravam alimento descoberto num
pequeno recipiente no meio do caminho da pista. Em qualquer tentativa em que não
- 240 -
seguiam os líderes, eles eram retirados da pista por um pequeno período e mais tarde
fazia-se nova tentativa.
As contingências foram efetivas na produção de seguidores. Notou-se que os ratos
imitavam os líderes quando estes viravam na presença ou ausência de cartões brancos ou
pretos, que imitavam os líderes que haviam sido treinados a ir para a direita ou para a
esquerda e que imitavam indiscriminadamente ratos brancos e cinzentos.
A relação social entre um aluno e um professor é, provavelmente, várias ordens de
magnitude mais complexa do que qualquer habilidade social isolada como a imitação,
mas os rudimentos de tal relação prestam-se à análise experimental. Do ponto de vista do
reforçamento social, podemos considerar que o comportamento do professor é reforçado
pelas mudanças no comportamento do aluno. O aluno deve ser quase sempre reforçado
diretamente, ou pela promessa de alcançar certas habilidades úteis ou por ameaça de
punição.
As contingências envolvidas na situação educacional comum são complexas e
raramente formalizadas de um modo consistente. Mas a idéia fundamental - um organis
mo fortalecendo ou participando do comportamento de outro organismo pode ser
demonstrada com pombos, de uma maneira que expõe o processo crítico envolvido.
Na Fig. 11-5, dois pombos estão separados um do outro por um plástico transpa
rente. Antes da demonstração, ambos foram treinados a comer nos seus respectivos
alimentadores. Além disso, o “professor” foi treinado a bicar o disco plástico em reforça
mento internitente com alimento. A demonstração começa com os animais colocados
juntos pehi primeira vez. Cada vez que o professor bica o disco, é liberado alimento para
o “ aluno” . O professor é reforçado por bicar somente quando o aluno está de pé, em
frente ao canto esquerdo. Consoante com sua história, o professor começa a bicar rápida
e indiscriminadamente com relação á posição do aluno. Portanto, no início, poucas
bicadas do professor são reforçadas. Gradualmente, todavia, á medida que a demons
tração prossegue, mais e mais vezes que o professor bica o disco, ambos os animais são
alimentados. O comportamento de ambos vai sofrendo modificação pela interação social.
Logo, um desempenho quase cômico evolui. O professor fica olhando para o aluno como
se esperando que ele se mova até o canto esquerdo. Enquanto isso, o aluno imita suas
atividades a uma ida repetitiva do alimentador para o canto esquerdo. Tão logo o
aluno esteja parado de forma adequada. O professor bica, ambos coiYiem, e o padrão é
repetido.
Pode-se dizer que o professor manifesta um tipo de discriminação social primitiva.
Seu comportamento é reforçado somente quando o aluno está desempenhando um certo
ato — ficar de pé no canto esquerdo. É este ato por parte do aluno que fornece o S ^ para
o professor bicar o disco.
Como tal esta situação precisa também funcionar como um leforçador condicionado
para o professor. Se o professor procura obter alimento, ele deve encontrar um modo de
tomar essa situação possível, pois, inicialmente, o aluno raramente irá ficar no lugar
favorável. Uma interação social sutil está presente: qualquer bicada que o professor dê
quando o aluno está em outro lugar resulta em alimento apenas para o aluno. 0 b ;car
indiscriminado, então, provavelmente fortalecerá comportamentos do aluno outros que
não o ir para o canto esquerdo. “ Esperar” que o aluno vá para o canto esquerdo fica
sendo o único comportamento que o professor tem disponível para dirigir as respostas do
seu aluno. O pombo professor é rápido em descobrir o valor da paciência.
241 -
(Herrnstein, 1964).
- 242 -
Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in Sl) and
rates during the development of an operant discrimination. J. com;),
physiol. Psychol., 1959, 52, 359-363.
Ilerrnstein, R. J. “Will.” Proc. Amer. Phil. Soc., 1964, 108, 455-458.
Kclleher, R. Schedules of conditioned reinforcement during experimental
extinction. /. exp. Anal. Behav., 1961,4, 1-5.
Kelleher, R., and Gollub, L. A review of positive conditioned reinforce
ment. J. exp. Anal. Behav., 1962, 5, 543-597.
Keller, I7. S., and Schoenfeld, W. N. Principles of psychology, New York:
Applcton-Century-Crofts, 1950.
Melching, W. H. The acquired reward value of an intermittently pre
sented neutral stimulus. J. comp, physiol. Psychol., 1954, 47, 3 7 0
374.
Miller, N. E., and Dollard, J. Social learning and imitation. New Haven:
Yale Univer. Press, 1941.
Myers, J. L. Secondary reinforcement: a review of recent experim enta
tion. Psychol. Dull., 1958, 55, 284-301.
Notterm an, J. M. A study of some relations among aperiodic reinforce
ment, discrimination training, and secondary reinforcement. J . exp.
Psychol., 1951,41, 161-169.
Schoenfeld, W. N., Antonitis, J. J., and Bersh, P. J. A preliminary study
of training conditions necessary for secondary reinforcement. J. exp.
Ps y ch ol 1 9 5 0 ,4 0 ,4 0 -4 5 . ”
Skinner, B. F. The behavior of organisms. New York: Appletón-Century,
1938.
Skinner, B. F. A case history in scientific method. Amer. Psychologist,
1 9 5 6 ,1 1 ,2 2 1 -2 3 3 .
Weissman, N. W., and Crossman, E. K. A comparison of two types of
extinction following fixed-ratio training. J. exp. Anal. Behav., 1966,
9 ,4 1 -4 6 .
Wolfe, J. B. Effectiveness of token-rewards for chimpanzees. Comp.
psychol. Monogr., 1936, 1 2 , 1-72.
WyckofT, L. B., Jr. The role of observing responses in discrimination
learning: Part I. Psychol. Rev., 1952, 59, 431-442.
Zimmerman, D. W. Durable secondary reinforcement: method and
theory. Psychol. Rev., 1957, 64, 373-383.
Zimmerman, D. W. Sustained performance in rats based on secondary
reinforcement. J. comp. physiol. Psychol., 1959, 5 2 , 353-358.
- 243 -
Capítulo 12 ENCADEAMENTO
Na seção 11.1 vimos como, através do uso de recompensas tokens atuando como
reforçadores adquiridos, seqüências ou cadeias simples de comportamento podiam ser
criadas. A mais simples dessas cadeias foi construída a partir de (1) uma resposta nova,
não fortalecida previamente; (2) um previamente estabelecido; e (3) o operante
controlado por este SP. Em geral, cadeias de qualquer tamanho desejado podem ser
formadas pela inclusão indefinida de um número sempre maior de elementos.
12.1 OS ELEMENTOS DE CADEIAS COMPORTAMENTAIS
- 245-
O elo de [ 1 2 . 1 | é um caso especial de uma cadeia comportamental, aquele em que a
cadeia é repetida indefinidamente. Um e b pode ser considerado uma cadeia que está
“ fechada” por permitir que a “última” resposta produza o SD para a “primeira” . Por
exemplo, no elo de [ 1 2 . 1 ] comer é a última resposta e produz o S ^ 5 ausência de
alimento, para a primeira resposta, pressionar a barra.
O elo de [ 1 2 . 1 ) é representado como sendo composto de três membros da resposta.
Por isto, é convencionalmente descrito como uma cadeia de três membros. Mas o número
real de membros usados para representar uma cadeia comportamental é arbitrário, sendo
ditado principalmente pela conveniência descritiva. Ao discutir o comportamento obser
vado e reforçado, três membros servem adequadamente para ilustrar a natureza enca
deada do ato. Ao mesmo tempo, três membros não são muitos para nos assustarem com
uma quantidade de detalhes. Ainda, para outros objetivos, podemos desejar representar o
ato como se formado por mais membros. Por exemplo, para esclarecer tambe'm a topo
grafia, do ato, poderíamos duplicar o número de membros considerados e expandir
r 1 2 . 1 ] para
[ 12.2]
- 246 -
nau será possível colocar o animal sob quaisquer condições para diferenciá-los. Neste
ponto, teremos alcançado um limite lógico para a resolução da resposta. Na maior, parte,
o comportamento é subdivido a um nível em que serve melhor para objetivos ilustrativos
de procedimentos. A pressão à barra e a aproximação ao come douro são facilmente
observadas, medidas e reforçadas sem qualquer instrumentação especial. Em última
análise, estas são as considerações que justificam seu status como unidades
conceitualmente discretas.
Uma cadeia tanto pode ser reduzida quanto ampliada. Em princípio, poderíamos
também escrever[ 1 2 . l|como
Os critérios para definir uma classe de resposta são que a classe seja especificável como
em 112.3] e que possa ser fortalecida ou mantida, como uma classe, pelo reforçamento.
A questão de se a R especificada em[ 12.3)é reforçável é uma questão experimental. Sua
solução dependerá de muitos fatores, tais como o peso e altura da barra, sua distância
espacial até o comedouro, a nitidez de quaisquer deixas intermediárias usadas para
sinalizar a liberação de alimento, as diferenças individuais entre os ratos, e assim por
dainte. Naturalmente, se esta R já foi sucessivamente aproximada e fortalecida, 112.3] é
uma maneira perfeitamente plausível de abreviar as contingências que irão subsequente
mente, manter este comportamento. Infelizmente, todavia, o diagrama [ 12.3] representa
as contingências de reforçamento frequentemente usadas quando o experimentador tem
pouco tempo para se dedicar a uma modelagem real da resposta. O procedimeto de
1 1 2 .3 ] resulta do “colocar o rato na caixa e esperar que o condicionamento ocorra a seu
próprio modo” . A criança que vai à escola de quem se espera que aprenda meramente
vendo e ouvindo, ou o universitário que recebe um livro e a ordem para aprender o
capítulo 12, são todos vítimas freqüentes de contingências como em [ 12.31 . O resultado
é o mesmo tanto para ratos como para humanos — alguns indivíduos adquirem
o comportamento desejado, outros não. Podemos praticamente dizer, com referência a
[12.3) quando comparado com um arranjo mais deliberado de contingências, que o
organismo aprende apesar da conexão não consistente entre os comportamentos reque
ridos e o reforçamento fornecido.
- 247 -
Considere como um rato faminto pode ser treinado a pegar uma bola de gude na mão
do experimentador, depositá-la num buraco localizado a alguma distância, depois puxar
um trapézio em miniatura dependurado em sua caixa e, finalmente, pressionar uma barra
(ver Fig. 12-1). É útil delinear cinco classes de respostas,
- 248-
Figura 12-1. Um rato executando uma cadeia de comportamento (segundo Michael,
1963).
longe do buraco e exigindo respostas de carregá-la com duração cada vez maior. Eventual
mente, a cadeia estará completa. A bola de gude está na mão do experimentador; o rato,
quando colocado na gaiola, vai até o experimentador, pega a bola de gude, carrega-a até o
buraco e deixa-a cair. A campainha soa e, então, o rato puxa o trapézio. Acende-se a luz,
o raio pressiona a barra, e o alimento é liberado. As contingências.são:
- 249 -
S5 S4 S3 s2 S|
R., r4 r, r2 Ri -> S H
5 4 3 2
Onde S5 - bola de gude na mão de experimentador, campainha e luz desligadas
S4 = bola de gude nas patas do rato, campainha e luz desligadas
S3 = bola de gude sobre o buraco, campainha e luz desligadas
S2 = nenhuma bola de gude, campainha ligada, luz desligada
Si = nenhuma bola de gude, campainha ligada, luz ligada
S+ = alim en to .
- 250 -
do cordão é um para uma classe particular de resposta e um S A para o resto. (Note
que a criança deve aprender a observar o estado atual do cordão para escolher os S ^s
'devantes). Tanto para o comportamento de amarrar os sapatos como para os movi
mentos do rato, o status de encadearqento permanece uma seqüência de respostas
operantes entremeadas com seus S^s.
Pierrel e Sherman (1963) descreveram o treino de uma seqüência exótica de compor
tamento do rato. O rato subia uma escada em espiral, atravessava uma ponte estreita e
subia uma escada de mão. Então, puxava uma corrente ligada a um carro de brinquedo
aberto, subia no carro e pedalava-o até uma segunda escada de mao. Depois de subir esta
escada, ele passava através de um tubo e entrava num elevador. O peso dc rato fazia
baixar lentamente o elevador até a plataforma inicial, onde, como um anticlímax, o
animal pressionava uma barra e recebia uma pelota de alimento pelos seus esforços. Depois
de comer, o rato estava em condições de iniciar novamente a seqüência. O observador
casual, provavelmente, ficaria maravilhado pelo desempenho rápido e seguro desta cadeia,
por um organismo tão insignificante como o rato. Um exame da história por trás de tal
desempenho, todavia, revela que apenas os princípios bem estabelecidos dos capítulos
4-11 foram empregados. O comportamento do rato foi adquirido pelos princípios de
discriminação e modelagem e encadeado pelo uso criterioso de reforçadores condicio
nados.
partida partida
í igura 12-2. Labirintos representativos. Cada labirinto tem uma caixa de partida e uma
ou mais caixas-objetivos ou saídas, onde o alimento pode ser encontrado. Um ponto no
labirinto a partir do qual dois caminhos sào possíveis e chamado ponto de escolha.
A força da resposta era inferida de mudanças (1) no número de erros ou entradas em
becos sem saída, e (2) no tempo de reação (RT), da caixa de partida até a caixa-objetivo.
Depois de um número variado de tentativas de treino, os indivíduos colocados no ponto
- 251 -
de partida percorriam esses labirintos rapidamente e sem erros. As curvas obtidas quando
erros ou RTs eram representados em função do número de tentativas eram de várias
formas, dependendo da estrutura particular do labirinto usado.Geralmente, à medida que
se realizava mais e mais tentativas, os erros diminuíam progressivamente até zero e os
RTs diminuíam progressivamente, aproximando-se de uma assíntota.
Havia muitas esperanças, originalmente, de que o estudo de animais em labirintos
revelaria os segredos da ação instrumental e forneceria informação fundamental a
respeito do processo de aquisição. Infelizmente, a história confirmou poucas dessas espe
ranças. Em comparação com a topografia de uma pressão à barra ou uma bicada na
seqüência do labirinto constitui uma longa e complex a cadeia, cuja aquisição envolve uma
mistura não analisada de discriminação, diferenciação e reforçamento condicionado.
Como todos esses aspectos do comportamento estarão inestricavelmente misturados
durante o treino, não é surpreendente que a aquisição no labirinto seja gradual em vez de
abrupta. Os labirintos são usados até hoje na pesquisa psicológica de problemas especiali
zados onde o grau de análise requerido é mínimo; mas, a confusão de um grande número
de fatores de aquisição acarreta dificuldades na interpretação de resultados cortiporta-
mentais. O estudante é aconselhado a encarar o comportamento no labirinto como uma
cadeia de elementos resposta h e te ro gê n e o s (isto é, diferentes), que só gradualmente se
tornam ligados em seqüências unitárias de resposta.
__ __ __
Fase a: ^(pressão à barra) S (aproximação s+
^(alim ento Rao comedouro) —► R —
2 Lf (comer
3 ausente)
Ouando esta seqüência estava bem condicionada, introduziu-se a extinção, não se permi
tindo que a pressão à barra produzisse o som do alimentador (fase b). Esta operação de
extinção quebra a cadeia entre cadeia entre os elos 3 e 2.
Sob essas condições, os S^s para os dois membros finais (aproximação ao comedouro e
comer) não podiam ser reproduzidos e, naturalmente, a pressão à bara no elo 3
- 252 -
enfraqueceu. Quando a resposta à barra alcançou um nível baixo, a cadeia foi restabe
lecida para incluir o elo 2 , permitindo-se que a pressão à barra produzisse o som do
alimentador. Mas nenhuma outra contingência da cadeia foi restaurada (fase c ).
Fase c:
^(pressão à barra) S(som do alimentador)
S(alimento ausente) R(aproximação ao comedouro)—-f-
- 253 -
labirinto), permanecendo ali por um momento. Numa fase final de teste, os ratos são
colocados na caixa de partida com o alimento ainda não presente na caixa-objetivo. O
tempo requerido para percorrer a distância entre a caixa de partida e a objetivo é medido.
O ato de percorrer o labirinto daqueles ratos que tiveram uma história passada de serem
colocados na caixa-objetivo vazia mostra uma extinção rápida, foradonormal. No teste,
estes ratos percorriam o labirinto mais devagar e cometiam mais erros do que cometeriam
se não tivessem tido a oportunidade de “descobrir” que sua caixa-objetivo estava agora
vazia,
Esta redução na força da resposta define um fenômeno conhecido como “extinção
latente” . A escolha desta expressão para descrever o comportamento é baseada numa
interpretação discutível da fase intermediária do experimento, em que os animais são
colocados diretamente no compartimento vazio. “Extinção latente” implica em que esta
fase intermediária é um período durante o qual a extinção do comportamento de percor
rer o labirinto está ocorrendo de forma implícita, ou latente. É tentador dizer que os
ratos param rapidamente de correr no labirinto, em extinção, porque, já tendo t*do
bastante tempo para “ investigar” a caixa-objetivo vazia, eles “ sabem” , antes de correr,
que a encontrarão vazia. Infelizmente, esta explicação baseia-se no futuro como o fator
controlador do comportamento e contém todas as falhas de tais “explicações” , mencio
nadas anteriormente (seção 4.1) Uma interpretação mais simples, embora mais austera,
está baseada na extinção “manifesta” e perdas no reforçamento condicionado. No treina
mento, os ratos aprenderam a percorrer o labirinto.
Treino: __ ___
S(caixa de partida) S(ponto de escolha) S(caixa-objetivo)
R(correr) ----- » R(virar à direita)— ; R(dirigir-se ao recipiente com
T 2 1 alim ento)-----* S +
Na fase intermediária, os ratos estavam na caixa-objetivo, agora vazia, resultando em
alguma extinção verdadeira de R \.
S(caixa de partida)
R( dirigir-se ao recipiente com alimento) — **
1
No teste, toda a cadeia foi submetida a um procedimento padrão de extinção.
Teste:
S(caixa de partida) S(ponto de escolha) S(caixa-objetivo)
R(correr)------^ R(virarà direita)---- R(dirigir-se ao recipiente com
3 ‘ ~2 ' 2 1 alimento) —
Os membros resposta associados com as contingências 3 e 2 foram significativamente
enfraquecidos pela fase intermediária. A explicação dessa diminuição na força é encon
trada na redução drástica do poder reforçador da caixa-objetivo que ocorreu nesta fase.
Na “extinção latente” , esta redução parece regredir por toda a cadeia, diminuindo o
poder reforçador de todos os SDs anteriores.
Os resultados da “extinção latente” e do experimento de extinção seletiva de
Skinner sugerem a seguinte generalização composta de duas partes. Todos os membros de
urna cadeia até o ponto em que, nesta cadeia, um membro tenha'sido submetido a
extinção, sofrem um enfraquecimento, se ou não estes membros foram realmente emiti
- 254-
dos. Por outro lado, nenhum dos membros além do ponto de extinção é enfraquecido. A
generalização é de algum interesse como um método prático para reduzir o comporta
mento não desejado pela simples extinção dos reforçadores condicionados dos quais ele
depende. Se o comportamento não desejado consiste de uma seqüência grande e de longa
duração, tal princípio, se é que ele se mantém para cadeias de qualquer tamanho, deve ser
bem recebido pelos educadores que acham desejável extinguir velhos pontos de vista
antes de ensinar os novos.
Nem sempre é fácil avaliar as forças das várias respostas e reforçadores condicionados
numa cadeia estabelecida do tipo que descrevemos.
(1) O problema da medida. As respostas nessas cadeias são heterogêneas, isto é, as
respostas sucessivas na cadeia diferem uma da outra quanto à forma Quando um rato
rola uma bola de gude até um buraco, puxa um cordão e pressiona uma barra, é pouco
provável que esses comportamentos ocorram com taxas idênticas. As respostas variam na
topografia, duração e esforço requerido. Assim, seria surpreendente se suas taxas de
ocorência fossem comparáveis. Mas uma cadeia, cujos membros correm com taxas
variadas devido às variações topográficas, presta-se pouco como um meio para o estudo
dos efeitos quantitativos que várias operações experimentais, tais como drogas, lesão
fisiológica e esquemas de reforçamento poderiam exercer no comportamento encadeado.
(2) O problema da sensibilidade. Quando essas cadeias estão bem estabelecidas,elas
funcionam como unidades. Isto é o que queremos dizer quando nos referimos aos seus
membros como estando “ ligados” no que eqüivale a um operante de ordem superior. A
estrutura unitária dessas cadeias é uma conseqüência da manutenção dos membros sob o
controle funcional do reforçamento, como fazemos para um operante mais simples.
Embora tenhamos visto que a extinção seletiva é uma forma de revelar a estrutura
essencialmente encadeada de tais atos, muitas operações experimentais parecem afetar a
seqüência como uma unidade. A cadeia como um todo pode variar em força, em função
dessas diferentes variáveis experimentais, mas as forças relativas dos membros individuais
da cadeia permanecem insensíveis a essas variáveis.
Em contraste com a cadeia simples, o esquema encadeado (Ferster e Skinner, 1957)
fornece uma linha-base quantitativa e sensível para avaliar as propriedades de cadeias.
Como as cadeias já descritas, os esquemas encadeados consistem de uma sucessão de
contingências ligadas. Mas, ao contrário dessas cadeias, os esquemas encadeados especi
ficam que cada membro da resposta produz a contingência seguinte probabilisticamente.
Assim, em qualquer ligação única, um número de respostas pode ter que ser emitido para
avançar a cadeia para a próxima ligação. A vantagem disso é que, em qualquer ligação
probabilística, a taxa, frequência ou padrão do responder fornece uma variável depen
dente sensível que pode ser estudada independentemente da taxa, freqüencia ou padrão
dos membros resposta numa ligação em qualquer ponto da cadeia. Além disso, já que os
membros individuais no esquema encadeado podem ser convenientemente especificados
como classes de respostas idênticas (homogêneas), o problema de medida associado com
as topografias heterogêneas em cadeias mais simples é contornado.
Considere um esquema encadeado homogêneo com duas ligações. Lembre-se de
que o termo ligação se refere aosS ^s sucessivos do esquema. Na notação, os colchetes
sucessivos de um diagrama denotam as ligações. Numa cadeia simples, cada ligação c
- 255 -
associada com uma e somente uma resposta, mas no esquema encadeado esta
correspondência um-a-um entre resposta a ligação não está presente.
Um esquema encadeado representativo está abreviado em [ 12A\ .0 bicar a chave de
um pombo na presença de uma luz vermelha produz, num esquema RI, uma luz verde; o
bicar a chave na presença da luz verde produz, num esquema FI, o reforçamento com
alimento.
S(vermelho) S (verde)
R (bicar) RI > R(bicar) FI ^ g+ [12.4]
2 1
0 diagrama [12.4 (descreve uma cadeia de duas ligações mas uma que gera tipicamente
muitas respostas de bicar a chave por reforçamento. Além disso, padrões diferentes de
resposta se desenvolvem nas diferentes ligações, sendo cada padrão apropriado para a
contingência específica da ligação em que ocorre. Assim, as curvas na Fig. 12.4A
mostram que efeitos típicos de RI ocorrem na segunda ligação, a situação luz vermelha;
as curvas naFig 12-4B mostram que efeitos típicos de FI são gerados na primeira ligação, a
situação luz verde. Dois registradores foram usados para obter a Fig. [ 12-4[.Bicadas na
presença da luz vermelha (ligação 2 ) foram registradas num registrador; bicadas na
presença da luz verde (ligação 1) foram registradas em outro. Quando o animal estava na
situação associada a uma determinada ligação, somente o registrador apropriado para esta
ligação era operado.
O procedimento do esquema encadeado tem aplicação na avaliação, em detalhes
quantitativos, do poder reforçador de um reforçador condicionado. Na seção 11.2, está-
vamos preocupados com a durabilidade de um reforçador condicionado: isto é, quanto
tempo um reforçador adquirido retém seu poder de manter comportamentos. Mas a força
de um reforçador condicionado em qualquer momento determinado é,
r
f
' ' f ,
6 min
(A)
(B)
- 256-
frequentemente, de igual interesse. Em linguagem coloquial, a força de um reforçador é
porporcional à quantidade de trabalho que o animal despenderá para obter o reforçador.
Uma discussão completa sobre a força de reforçadores encontra-se no capítulo 15. No
momento, é suficiente notar que a taxa em que um organismo trabalha numa situação
(onde seu trabalho tenha, no passado, produzido o reforçador) é urna medida de tal
força. Em geral, um homem que deseja algo “ ardentemente” trabalhará muito para
conse^uí-lo. Assim também o pombo. Quando o EI da primeira ligação em 112.41 é
aumentado, ou diminuído, a taxa total de bicadas do animal nesta ligação FI dificilmente
é afetada. Mas sua taxa de bicadas na ligação RI precedente se altera sistematicamente. A
função é suave e é apresentada na Fig. 12-5. A função foi obtida com um procedimento
igual ao de [ 12.4 1 . Em vários meses de experimentação diária, quatro valores de FI na
ligação 1 foram estudados. De acordo com a Fig. 12-5, quanto maior o Fl menos o
animal tende a trabalhar para produzir a ligação associada ao FJ e, assim, por inferência,
menor o valor reforçador a ela associado
Os esquemas encadeados podem ser combinados com especificações de resposta de
ordem superior, formando cadeias tais como V I-R F , V I-drl e F R -F I. O número de
ligações permissíveis pode ir além de dois. Demonstrou-se que cadeias VI-VI-VI-VI-VI
mantêm o comportamento (Kelleher e Gollub, 1962). Muitos fenômenos cómporta-
mentais interessantes ocorrem, encadeando-se uma variedade de procedimentos. O estu
dante interessado pode consultar Ferster e Skinner (1957) e Kelleher e Gollub (1962)
para detalhes adicionais.
Figura 12-5. Respostas por m inuto na segunda ligação de um esquema encadeado duas
ligações em função do esquema FI na primeira ligação (dados não publicados de J. R.
MilIcYjson).
- 257 -
penho humano e servem para ligar a seqüência como um todo? A análise sugere uma
resposta afirmativa para ambas as questões.
No comportamento conhecido como caminhar, uma perna é erguida, estendida e
toca o chão. A outra perna, então, repete um padrão semelhante. A cadeia é claramente
algo como
[12.5]
Nesta cadeia, as descrições dos estímulos podem ser questionadas em termos práticos.
Quando caminhamos, em geral não observamos continuamente a posição de nossas
pernas em uma relação à outra. De quajqucr foram, caminhamos adequadamente no
escuro. Evidentemente, existem eventos dentro do organismo que são parte dos Ss em
cada colchete de [ 12 . 5 ]. Estes elementos internos de cada situação de 112.5 | surgem
dos próprios movimentos do corpo. Mencionamos brevemente, na seção 9.1, os
receptores conhecidos como proprioceptores, que se acham localizados nos músculos c
tendões. Esses receptores têm a propriedade de responder diferencialmente a vários
movimentos de músculòs e tendões. Assim, cada S em 11 2.5 | pode ser descrito mais
completamente, notando-se não apenas o estado do membro em referência ao
ambiente externo como fizemos, mas também o estado exato dc tensão dos conjuntos
particulares de músculos usados. No andar comum, esses estados são usados como as
deixas principais para manter uma seqüência dc movimentos bem coordenada.
Contudo, a sensibilidade muscular não é sempre suficiente, especialmente na
aquisição de seqüências mais complexas, para a coordenação ideal do comportamento.
Ao aprendermos um novo passo de dança, um instrutor pode ter que nos aconselhar a
não olharmos para nossos pés. Nosso comportamento de observar é uma maneira óbvia
de assegurar que colocamos nossos pés “onde deveriam ser colocados” durante a dança.
Mas, o comportamento visual de observar não é incentivado pelos mestres de dança
porque ele viola certos padrões estéticos, retarda a aquisição do controle apropriado pela
propriocepção e torna quase impossível que duas pessoas dancem juntas. Em certas
doenças ou lesões da medula vertebral, os receptores proprioceptivos não operam. Nesles
- 258-
casos, as pessoas continuam a caminhar, mas somente pela observação visual da posição de
suas pernas.
A duplicação de indícios e a superposição informativa comumente encontrada nas
situações é explorada na técnica conhecida como “substituição gradual de controle". As
cadeias são frequentemente formadas utilizando-se elementos bem grosseiros das situa
ções como S^s preliminares. Então, à medida que a aquisição prossegue, os controles são
gradualmente transferidos para porções cada vez mais sutis das situações. Isto pode ser
feito não se liberando o reforçamento quando um comportamento grosseiro de observa
ção é detetado, como no exemplo da dança, ou removendo-se gradualmente certos
aspectos da situação. Por exemplo, ao aprender a dirigir um carro, o novato pode depen
der, inicialmente, de comandos verbais do seu instrutor de direção para manter uma
cadeia suave de comportamento. Esses comandos são vistos entre aspas em 12.6 na
designação dos S^s.
SB
SA [ 12.6]
R a - — > Rn - ---- > Rc -*■ SD
4 *
a cadeia R (tocar FA), R (tocar MI), R (tocar SI), R (tocar LA), é determinada. Inicialmen
te, os membros individuais da cadeia são controlados pela partitura. Eventualmente, toda
via, a partitura é gradualmente removida, as respostas de observar diretamente a partitura não
- 259 -
são incentivadas pelo instrutor e finalmente os próprios sons das notas fornecem todos os
S^s necessários. Em geral, o paia tocar uma nota iião será necessariamente o som da
nota imediatamente procedente, mas, em vez disso, uma combinação dos sons de várias
notas anteriores uma passagem. Assim, por exemplo, a deixa para a execução das nota
E acima, geralmente não será apenas a nota B anterior, mas tal execução estará sob o
controle de uma longa série de notas precedentes, sendo a B apenas a última dessas.
Como seria esperado, portanto, as passagens de execução mais difícil são aquelas que são
semelhantes, isto é, aquelas que contêm seqüências de notas idênticas terminando numa
nota final diferente. Para tocar a nota correta, o único disponível está localizado a
alguma 'istância (nas passagens muito semelhantes, talvez uma meia dúzia ou mais notas
anteriores) é as notas imediatamente precedentes devem, no momento, ser ignoradas.
Uma quebra no encadeamento explica a hesitação que um artista algumas vezes exibe
ao iniciar uma passagem. Não há um único no início da partitura. Um problema
semelhante pode ocorrer na memorização de poesia. Uma vez começada, cada palavra
falada marca a ocasião para a próxima palavra, mas é necessário alguma deixa verbal para
se iniciar. Quando crianças recitam poesia, frequentemente se observa que elas fazem
uma “ pausa” entre as linhas. Este é o resultado de se memorizar linha por linha, de modo
que a última palayra da linha anterior não adquire poder suficiente de para a primeira
palavra da linha seguinte.
- "GO
serão enunciados por um dado indivíduo, elas fornecem pouca informação sobre a estru
tura do comportamento verbal. Esta estrutura é convenientemente descrita como cadeias
de palavras. Além disso, as próprias palavras faladas são convenientemente representadas
como cadeias de sílabas ou fonemas. Naturalmente, da mesma forma que os membros
resposta no comportamento encadeado do rato relativo à pressão à barra, as unidades de
cadeias verbais também desaparecem nas seqüências que fluem suavemente. Sob certas
condições, a natureza encadeada das palavras é facilmente demonstrável. Na aquisição de
uma palavra nova e difícil, de modo a podermos repetir a palavra corretamente. A palavra
“ Monongahela” , dos índios Delaware, é de difícil pronúncia para estrangeiros. Quando a
palavra é representada como uma cadeia, os S^s dos sons e as Rs de falar são convenien
temente descritos como sílabas [12.7.| Inicialmente, os sons podem ser
[12.7]
lü < h e > Iü < la > S "la '
2 1
produzidos pelo aparelho vocal de um instrutor ou, em princípio, por uma máquina. As
respostas de 112.7Jsão aquelas de um organismo aprendendo a pronunciar a palavra. Na
notação, os elementos falados (R) das palavras são colocados entre colchetes oblíquos
< > ; enquanto os sons (S) das palavras são colocados entre aspas “ ” .
No início da aquisição, os S^s de qualquer ligação determinada em [12.7 |não têm
controle suficiente sobre as Rs desta ligação para produzir seguramente um comporta
mento. O instrutor pode ter que fornecer uma deixa verbal para a sílaba desejada. Por
exemplo, após o erro comum mongonga , o instrutor pode aconselhar um reinicio e,
depois que o aprendiz responde , mo , ele mesmo pode dizer “non” . Sob instruções
apropriadas para imitar, o S “non” provavelmente controlará a R non . Naturalmente,
o instrutor eventualmente removerá essas deixas verbais de modo que a pronúncia correta
se torne independente da sua presença.
Uma nota sobre imitação é aqui inserida entre parênteses. A imitação é, inquestio
navelmente, um método valioso para controlar o comportamento. Mas, como uma
maneira rápida para o processo completo de aquisição, ele pode ser muitas vezes superesti
mado. Os professores frequentemente se surpreendem ao observar que, dando ao aluno
um pouco de informação, frequentemente nada ensinam ao estudante. O desempenho
complicado de um dançarino, de um acrobata hábil ou de um músico não pode ser
colocado no repertório de um novato através da mera imitação. Observar alguém a dirigir
um carro ou pilotar um avião não desenvolve, por si só, estas habilidades no observador.
A imitação é quase sempre útil para aumentar a força de respostas previamente adquiri
das, mas não é tão útil para encadear os membros numa seqüência de qualquer tamanho
ou complexidade.
A natureza encadeada das palavras é claramente exposta em experimentos que alte
ram a sucessão normal de S^s. Se respostas silábicas do tipo visto em [ 12.7 ]não produ
zem seus S^s característicos imediatamente, o padrão da fala rompe-se e se torna caóti
co, sujeito pode começar a garguejar e, em casos extremos, é totalmente incapaz de falar.
No Feedback auditivo com atraso, as relações normais R -* S^ na fala de cada uma das
suas próprias Rs de falar, por cerca de 1/5 de seg. (Lee, 1950). O termo feedback foi
emprestado da linguagem da eletrônica, onde parte de um sinal de saída “out-put” —
(por exemplo, na sua vitrola, parte da energia amplificada que ordinariamente iria para
261 -
seu altofalante) é retornada (feedback) para a entrada — “ input” — (o lugar onde você
coloca a tomada de sua vitrola) do mesmo circuito. Por analogia, uma resposta pode ser
considerada uma saída do sistema comportamental; o ambiente pode ser considerado a
entrada deste sistema. Quando um organismo opera em seu ambiente, emitindo operan-
tes, as mudanças no ambiente produzidas pelas próprias respostas do organismo podem
ser consideradas um feedback para o organismo. A palavra “feedback” , despida de sua
característica eletrônica, é análoga àquelas conseqüências especiais que chamamos refor
çadores primários e secundários.
Imagine um sujeito numa sala á prova de som. Fones de ouvido confortavelmente
ajustados e paredes e tetos que absorvem sons impedem-no de escutar sua própria voz
pela propagação normal através do ar. (Uma recepção muito reduzida é possível através
da propagação nos ossos). Os sons produzidos pelas respostas de falar vão para um
gravador através de um microfone. Eles são retardados pelo simples procedimento de
primeiro gravá-los e, então, uma fração de segundo mais tarde, tocá-los amplificados para o
sujeito. A amplificação serve para anular quase toda a condução óssea de S^s. O eteito
obtido é um exagero daquele observado quando um orador fala para o público, num
sistema de alto-falante, estando o alto-falante localizado a alguma distância de seu micro
fone.
Num caso típico de distorção da fala produzida por este tipo de atraso de som, a
pronúncia de Monongahela torna-se monongahelala. Considere este efeito em relação à
cadeia do diagrama [12.7 |. Na ligação da contingência 1, o sujeito acabou de pronunciar
R < la > e, em circunstâncias normais, ouviria imediatamente S “ Ia” , o final na cadeia.
Mas, devido ao atraso, ele escuta S “he” , que ainda controla outra R < la>. O efeito é
mais pronunciado no final da cadeia porque, na fala normal, o comportamento no meio
da cadeia da palavra mantém-se ligado pelos movimentos imediatamente antecedentes do
aparelho vocal, em adição aos efeitos sonoros produzidos por esses movimentos. A R
final,uma pausa deliberada, é mais dependente do som da sílaba terminal. (A maneira mais
segura de você saber que terminou de falar uma palavra é escutar sua última sílaba).
O método de feedback auditivo com atraso, quando com um atraso fixo, pode não
ser o melhor para quebrar a cadeia da fala. Com a prática, parece razoável que o sujeito
passe a usar os S^s atrasados, uma vez que eles ainda têm uma relação fixa com o
comportamento anterior (sempre 1/5 seg mais tarde). Se o atraso fosse uma média de
intervalos aleatórios igual a 1/5 seg, intervalos esses que variassem de momento a momen
to, esperar-se-ia um rompimento mais completo da cadeia de linguagem falada.
As sentenças podem ser analisadas de forma análoga às palavras. Durante a infância,
a aquisição de sentenças é baseada na ligação de combinações cada vez mais longas de
palavras. Não levando em conta o problema do significado, as cadeias de sentenças
diferem das cadeias de comportamento do rato até aqui consideradas, no sentido em que
seus membros resposta (palavras) são combinados em muitas seqüências diferentes
permissíveis. (Isto também é verdadeiro nas cadeias de sílabas que formam as palavras). A
cadeia “ o cachorro morde o homem” é controlada por uma situação muito diferente da
cadeia “ o homem morde o cachorro”. Logo, as unidades básicas das sentenças (palavras)
não podem ser aprendidas em qualquer seqüência fixa da maneira em que o rato da seção
12.2 aprendeu os membros de sua cadeia. A sentença é construída peça por peça, empre
gando as palavras como unidades. À medida que a criança cresce, a média do tamanho de
suas sentenças faladas aumenta, como é visto na tabela 12 - 1 .
- 262-
Tabela 12-1
- 263-
As contingências de puxar a barra para os chimpanzés parecem de alguma forma com
aquelas de um motorista que se aproxima de um cruzamento. O comportamento que o
motorista emite no cruzamento dependerá de ele encontrar uma luz verde, uma luz
vermelha, um sinal para prosseguir ou um policial de trânsito. As conseqüências de
estimulo do comportamento de aproximação do motorista e do comportamento de
puxar a barra do chimpanzé estão sujeitas a um grau de incerteza. Em ambos os casos,
uma determinada resposta — puxar a barra ou aproximar-se do cruzamento —pode levar
a várias situações possíveis. E a resposta apropriada que se segue na cadeia(inserir
a ficha ou puxar a barra novamente; parar ou seguir) dependerá da situação particular em
que de fato ela ocorreu.
Quando uma resposta numa cadeia de comportamento pode, deste modo, levar a
uma de várias situações possíveis, diz-se que as contingências naquele ponto se ramificam.
Notamos as contingências simples, ramificadas, nas seções anteriores, desenhando várias
setas partindo de uma R e indicando as probabilidades de cada conseqüência de estímulo.
Muitos dos problemas cotidianos são mais complexos que aqueles encontrados pelo
chimpanzé e o motorista. Nestes casos, as soluções são encontradas apenas cruzando-se
uma cadeia complexa de tais contingências ramificadas. No problema típico, as contin
gências são compostas de modo a formar uma rede complexa de ramos, sub-elos, interco-
nexões, becos sem saída e rotas alternadas.
E conveniente analisar o arranjo de contingências de reforçamento no caso de reso
lução de um problema mais complexo. Ao achar a diferença entre dois números, uma
criança está resolvendo um “problema” . Para o adulto sofisticado, naturalmente, o
exercício de subtração parece uma execução trivial de uma seqüência comportamental
automática. O sabor de um “problema” há muito se perdeu; todavia, é por essa razão que
uma análise deverá ser esclarecedor a.De fato, o fracionamento do exercício simples revela
uma cadeia bastante complexa de contingências, em que pelo menos três habilidades
comportamentais participam.
Considere o seguinte problema
60048
- 152
- 264-
descrito). Esta lista de respostas constitui um conjunto de operantes discriminativos
usualmente adquiridos através da aprendizagem de decorar e ditos serem “memorizados” .
As respostas poderiam, naturalmente, ser rapidamente retiradas de uma tabela, mas elas
são usadas tão frequentemente em problemas de aritmética que o procurar numa tabela
atrasaria drasticamente a execução da cadeia de solução.
2. O comportamento de pedir emprestado deve ter sido previamente adquirido. Dado
um “ inferior” maior que seu “ superior”
60048
152
entrada entrada
operaçao
saída 2 saída
- 265-
A Fig. 12-8 é um diagrama de fluxo de testes e operações que descrevem as etapas
que levam à solução do nosso problema de encontrar a diferença entre dois números. Um
sub-elo (visto em pontilhado) descreve o comportamento de observação que precede o
processo real de solução do problema. O comportamento pode circundar várias
Início
- 266-
vezes esse elo antes de alcançar as condições de que permitem o avanço da cadeia. O
pedir emprestado é visto como um caminho que pode ter que ser percorrido, dependendo
dos resultados do teste do inferior mais à esquerda do diagrama.
O arranjo das habilidades componentes na estrutura vista na Fig. 12-8 garante uma
“ solução” para o problema definido. Comportamentalmente, uma “solução” constitui-se
da produção de uma situação (SD) com certas propriedades. No caso presente, este é
um número que, quando somado a 152 resulta em 60048. Quando um conjunto de
contingências, testes e operações pode ser arranjado de modo a dirigir o comportamento
para a produção inevitável de um da solução, referimo-nos à cadeia resultante como
um algoritmo. Muitos problemas práticos do cotidiano, desde costurar e cozinhar até
calcular e desenhar, são analisados em termos dessas cadeias algorítmicas de comporta
mento.
- 267 -
gerar experimentos, identificando-se ou não algum ou nenhum “pensamento” com estas
cadeias. Neste sentido, a hipótese de Watson permanece como um desenvolvimento cria
tivo importante na h istória da ciência comportamental.
Infelizmente, pouca experimentação conclusiva resultou da hipótese de Watson. Em
sua própria época, aparelhos de registros sensíveis ainda não haviam sido aperfeiçoados ao
ponto necessário para se fazer as medidas exigidas. Dois experimentos, entretanto, feitos
em 1930, fornecem alguma evidência preliminar de que a resposta encoberta ocorre nos
músculos apropriados quando são dadas, aos sujeitos, instruções para “ pensar” .
Num experimento, colocou-se eletrodos em várias partes do corpo do sujeito (bíceps
direito e esquerdo) e o sujeito foi instruído a imaginar o movimento de um membro
(Jacobson, 1932). As respostas elétricas dos músculos foram registradas num quimógrafo
de movimento rápido (do tipo não cumulativo). Na Fig. 12-9, os registros obtidos do
Figura 12-9. Potenciais musculares registrados do bíceps direito depois de vários tipos
de instruções (segundo Jacobson, 1932).
bíceps direito estão justapostos com as várias instruções que os precedem. As instruções
claramente tiveram um efeito seletivo na atividade do músculo e, como mostra o registro
(B), o efeito foi localizado no braço direito somente quando a instrução se referia ao
braço direito. Durante o registro de (A), (B) e (C ), o experimentador não foi capaz de
detetar qualquer movimento real do braço, a olho nu.
Noutro experimento, os eletrodos foram colocados nos músculos da língua e sob os
lábios. Sob instruções de se “ imaginar” contando, ou lembrando poemas ou canções ou
multiplicando números, os potenciais musculares ocorriam na musculatura da fala do
sujeito. A forma da atividade elétrica, embora reduzida em amplitude, era muito parecida
com a atividade elétrica que ocorreu quando a instrução “imagine” foi substituída pela
instrução de “ fale em voz baixa” . .
Noutros experimentos independentes, os eletrodos foram colocados nos braços de
sujeitos surdomudos, cuja linguagem consiste de gestos com as mãos e dedos. Quando os
mudos eram instruídos a “pensarem” em palavras ou resolver problemas de multiplicação
de forma encoberta, geralmente apareciam potenciais musculares na região do antebraço.
Os potenciais musculares de sujeitos que podiam ouvir e falar foram usados como base
para a comparação. Sob instruções semelhantes, ou sujeitos normais não apresentaram
potenciais nas suas regiões do antebraço (Max, 1937).
Em conclusão, a teoria de Watosn fornece um certo conforto intelectual para o
cientista do comportamento: o pensamento tem um lugar no esquema de eventos com-
portamentais e pode, então, ser descartado como outros fantasmas “mentais” do
passado. Mas os experimentos não fluem imediatamente da posição de Watson, talvez um
pouco devido às dificuldades de se fazer registros musculares. Mesmo as melhores teorias,
frequentemente podem levar a uma complacência que, em vez de favorecer a
- 268 -
pesquisa, pode atravancá-ía. Existem numerosos problemas interessantes a respeito de
cadeias encobertas de resposta, como elas são adquiridas, siia superioridade em eficiência
em relação às cadeias manifestas correspondentes, questões sobre a sua manutenção,
e assim por diante. Mas, enquanto as respostas encobertas forem consideradas apenas
uma “explicação” para o “pensamento” , esses problemas pennanecerão enterrados.
Neste sentido, o trabalho de Hefferline e Keenan (1963), mencionado na seção 8.5 é
animador porque fornece o tipo de neutralidade teórica que promete esclarecer esses
problemas e reabrir a discussão sobre as respostas encobertas, tão audaciosamente intro
duzida por Watson há mais de meio século.
- 269-
QUARTA PARTE
CONTINGÊNCIAS COMPLEXAS
- 273-
laboratório animal, que compartilha de certas propriedades importantes com o comporta
mento humano conceituai. Novamente, este comportamento de laboratório surge de uma
configuração de operações familiares de aquisição, extinção, discriminação e generali
zação. Devido a suas relações com comportamentos simples e complexos, ele parece
representar uma ligação importante entre as duas classes. A simplicidade relativa dos
fenômenos de laboratório ajudar-nos-á identificar o termo conceito com certas caracte
rísticas precisas de comportamento. Uma vez tenhamos compreendido esta palavra-chave,
alguns experimentos simples com sujeitos humanos, onde os aspectos especiais da lingua
gem não são utilizados, irão elaborar ainda mais a lógica geral do comportamento con
ceituai Finalmente, guiados pelos nossos paradigmas experimentais, poderemos explorar
brevemente os comportamentos humanos complexos associados com termos tais como
compreensão, significado, instrução, percepção e (no próximo capítulo) solução de pro
blemas.
13.1 DISPOSIÇÃO PARA APRENDER (SIMPLES)
[13.1]
R E -* S + e Rd ^ s+
2
- 274-
Até agora, descrevemos apenas um conjunto de contingências de discriminações de
2S— 2R. Denominemos um único conjunto de tais contingências (como em [13.1]),
um problema de discriminação. Suponha que, uma vez o processo de discriminação tenha
atingido sua assíntota, apresentemos uma nova série de congingências. Escolhemos o
novo problema de modo que ele difira das contingências anteriores apenas em relação aos
objetos usados como seus 2 Ss; por exemplo, uma esfera de madeira maciça e um cone de
madeira invertido. O problema, com exceção disso, é idêntico. Qual será a natureza deste
novo processo de discriminação? De fato, é muito semelhante ao primeirc processo. C
animal começa desempenhando pouco melhor do que se e s p e r a r^ pelo acaso. Mas, even
tualmente, ele passa a escolher o objeto correto (agora a esfera) todas as tentativas.
Uma inspeção mais detalhada destes dois processos pode revelar, todavia, um desloca
mento ligeiramente mais rápido em direção à assíntota, no segundo caso.
Esta comparação de dois processos sucessivos de discriminação sugere um interes
sante delineamento experimental geral. Evidentemente não estamos limitados a um.
dois, ou mesmo alguns de tais problemas de discriminação. Podemos continua» a apre
sentar novos problemas, um depois do outro, enquanto pudermos encontrar objetos
diferentes e nossa paciência aguentar. Felizmente para o último fator, descobrimos que, à
medida que apresentamos mais e mais problemas, os processos de discriminação
tornam-se apreciavelmente mais rápidos. Embora dezenas a centenas de tentativas possam
ter sido necessárias para se chegar ao desempenho assintóticonos problemas iniciais, talvez
menos de meia-dúzia de tentativas sejarn necessárias para um desempenho sem erro
quando 100 discriminações tiverem sido aprendidas. Eventualmente, depois de várias
centenas de problemas, descobrimos um resultado notável. O macaco, agora, é capaz de
solucionar qualquer problema deste tipo, imediatamente. Se, por acaso, ele escolhe c
objeto correto na primeira tentativa, ele continua, daí em diante, a escolher o objeto
correto. Sc, por acaso, escolhe o objeto errado na tentativa 1, ele inverte o padrão de
resposta imediatamente e escolhe o objeto correto da tentativa 2 em diante. Em ambos
os casos, o desempenho do macaco é quase sempre perfeito a partir da tentativa 2. De
fato, a apresentação de uma longa série problemas semelhantes erradicou o processo
gradual de discriminação. Ficamos com um animal que soluciona novas discrimi íações
imediatamente. .
O exemplo precedente ilustra o desenvolvimento de uma disposição para aprender
(leaming-set ou L-setj, um paradigma geral estudado extensivamente e assim denominado
por H. F. Harlow. A Fig. 13-1 mostra mais precisamente os resultados obtidos do proce
dimento de disposição para aprender em macacos rhesus. Cada curva da Fig. 13-1 é a
média de um número de processos de discriminação. Os processos são apresentados
apenas nas tentativas de 1-6. A chave logo abaixo do gráfico diz exatamente que dis
criminações são representadas por cada curva. A Fig. 13-1, então mostra com detalhes as
mudanças médias na forma dos processos de sicriminação sucessivas. O processo de
discriminação de 1-8 é gradual e em forma de / e é claro que a sua assíntota se encontra
além da sexta tentativa de aqirsição. O processo médio para os problemasde 9-16 é menos
gradual; a curva é mais inclinada e atingirá sua assíntota mais rapidamente. Os processos
subsequentes são ainda mais inclinados, até o problema 232, depois do que não há um
“processo” propriamente dito. Há somente o resultado: na tentativa 2 o macaco quase
sempre acerta. 1
- 275 -
4 5 6
Tentativas
Discriminações
H i m ii |-8 ------------- 33-132
9-16 ------------- 133 -232
17- 24 *♦+++++•►+ 23 3 -2 8 8
25-32 ------------- 2 8 9 -3 4 4
- 276 -
N úmero médio de discriminações anteriores.
1'igura 13-2. Um processo de disposição para aprender (L-set), derivado dos dados
da Fig 13-1., baseado no desempenho da tentativa 2.
Não devemos supor que a disposição para aprender seja restrita ao tipo particular de
discriminação descrito em nossos exemplos. Nas discriminações das Figs. 13-1 e 13-2, o
comportamento é gradualmente colocado sob o controle de um entre dois objetos — o
objeto que cobre o amendoim reforçador na tentativa 1. Mas a noção geral de um L-set
consiste de uma habilidade adquirida para solucionar discriminações de uma determinada
classe ao primeiro contato. Assim, o colocar o comportamento sob o controle do maior
entre dois objetos, o objeto verde ou o de forma triangular entre dois objetos, constitui
outros Insets de 2S —2R simples que podem ser convenientemente estabelecidos por um
procedimento semelhante a este descrito. Em geral, podemos supor que o procedimento
de l^set é aplicável sempre que fôr possível se estabelecer um conjunto de problemas de
discriminação relacionados. Apôs o animal ter sido exposto a um subconjunto desses
problemas, ele pode adquirir a habilidade para solucionar todos eles.
- 277 -
O termo Uset é normalmente empregado com referência ao resultado deste paradig
ma.
Harlow (1959) fez um resumo das pesquisas sobre a formação do L-set nas quais
usou várias espécies de organismos, incluindo crianças. As crianças testadas nesses proce
dimentos tipicamente superam chimpanzés e macacos no desempenho geral mas elas
também apresentam um processo contínuo de aquisição do L-set. Os primatas inferiores
na escala filogenética ao macaco rhesus — micos e saguis, por exemplo — mostram um
processo de aquisição de Uset mais gradual que o descrito na Fig. 13-2. Mesmo depois de
1000 ou mais problemas, a assíntota de seus processos de L-set é significativamente mais
baixa que o desempenho perfeito. Outros animais, como ratos e gatos, mostram um
aumento da inclinação nos processos sucessivos de discriminação, mas nunca alcançam
resultados sofisticados no Lset dentro dos limites dos experimentos que têm sido
executados. Todavia, recomendamos cautela ao se concluir que L-sets verdadeiros são
uma habilidade privilegiada dos primatas, em vista das dificuldades metodológicas em se
estabelecer ordena omparáveis de “ problemas” de discriminação para animais i n f e r i o r e s
O num ero de tentativas destinado para cada problema afeta nitidamente
a aquisição do L—set Uma vez que os processos iniciais de discriminação são os
mais graduais, um grande número de tentativas é necessário nos primeiros problemas para
que o comportamento atinja um determinado critério, digamos um desempenho 70 por
cento correto. À medida que são dados mais problemas, o processo de discriminação
acelera-se e menos tentativas são necessárias para se chegar àquele mesmo critério. Esta
diferença foi considerada ao se obter as curvas da Fig. 13-1. Para os primeiros problemas
realizaram-se 50 tentativas e para os últimos apenas 6 ou 9 tentativas.E interessante notar,
todavia, que mesmo quando poucas tentativas, por exemplo, 6 , são realizadas para todos
os problemas, o L-set ainda emerge. Desta maneira, mais problemas, naturalmente, são
necessários para compensar o número menor de tentativas por problema. A combinação
ideal tentativa-problema tem que ser ainda elaborada.
A taxa de L-set é uma função da dificuldade dos problemas sucessivos de
discriminação. Harlow manteve todos os problemas na mesma série uniformemente di
fíceis. Uma progressão gradual de discriminação fácil para difícil pode produzir o L-set
mais eficientemente.
Evitamos usar o termo “ conceito” nas discussões precedentes sobre L-set mas parece
natural perguntar se podemos dizer, em relação a um organismo, que possui um L-set
para o maior de dois objetos, ou para o verde entre dois objetos, que ele possui o
conceito “ o maior de dois” ou “ o verde de dois” . Tais especulações estariam em boa
companhia, porque o próprio Professor Harlow levantou a hipótese de que “ todos m
conceitos tais como triangularidade, vermelhidão, número, e lisura surgem somente da
formação de L-set (Harlow, 1959, p. 5 10).
- 278
Adiando, por enquanto, uma definição rigorosa do termo conceito, apenas sugerimos que
o “ conceito” adquirido nas Figs. 13-1 e 13-2 é “o objeto entre dois debaixo do qual
havia um amendoim na tentativa anterior” . Sua descrição verbal é maior que a dos
conceitos mencionados por Harlow. Falta uma palavra única que o identifique, talvez
porque as contingências que compreendem este conceito são raras 110 mundo fora dos
laboratórios de comportamento dos macacos. Um exemplo de um L-set mais complexo
será útil para esclarecer a relação estreita entre L-set e conceitos.
Uma classe importante de L-sets consiste de discriminações de “singularidade” . Nes
sas discriminações, um grupo de objetos é apresentado. O reforçamento é contingente à
escolha de um único objeto que difira, de algum modo, dos outros objetos do grupo. Tal
discriminação pode consistir das contingências vistas na Tabela 13-1. Estas contingências
contêm dois tipos de objetos, seis situações e três respostas.
Tabela 13-1
UM GRUPO DE CONTINGÊNCIAS DE SINGULARIDADE
S, O A A
s2 Re
A O O
S3 A O A
s< Rc
O A O
Ss A A O
Rd
Sr O O A
Uma vez o sujeito primata tenha adquirido a discriminação a um certo nível do critério,
um novo problema é apresentado. Dois novos tipos de objetos são usados no novo
problema, mas as contingências permanecem de tal modo que a posição do objeto singu
lar entre os três é novamente correlacionada com o reforçamento. Depois de uma série de
vários destes problemas, o macaco adquire uma disposição para aprender que poderia ser
chamada de “escolha o objeto singular entre três”. O sujeito bem treinado na ilustração
da Parte Quatro, p. 271 está demonstrando o comportamento típico desta L-set. O
desempenho sofisticado do macaco rhesus é alcançado somente depois da apresentação
de muitos problemas semelhantes. Estes resultados indicam o grau de sucesso dos proce
dimentos de L-set ao colocar o comportamento operante de animais sob o controle de
relações bem sutis existentes nas situações.
Tal controle comportamental em sujeitos humanos é frequentemente abase sobre a
qual empregamos a palavra “conceito” . Por exemplo, concordamos que uma criança tem
o conceito de propriedade quando ela pode discriminar suas próprias possessões daquelas
de qualquer outra pessoa. Dizemos que uma criança tem o conceito de uma frase substan
tiva quando ela pode escolher frases substantivas entre sentenças não familiares. Similar
mente, creditamos-lhe o conceito de igualdade de número quando ela pode identificar
quantidades iguais em conjuntos não familiares, por exemplo, quando ela pode equiparar
o número de contas numa jarra com o número de maçãs em cima de uma mesa. Todavia
estas ilustrações são apenas sugestivas. Logicamente, precisamos de uma definição mais
- 279 -
rigorosa de “ conceito” se desejamos examinar em detalhes a relação entre L-sets e concei
tos. Será conveniente, portanto, voltarmos a alguns dos primeiros experimentos sobre
formação de conceitos com sujeitos humanos. É aqui que encontramos uma tentativa
explícita para traduzir a formação de conceitos, em sujeitos humanos, em termos com-
portamentais, com a questão sistemática. “ O que uma pessoa faz quando se diz que ela
revela um conceito” ? Quando esta questão puder ter uma resposta satisfatória, estare
mos em condições de determinar os procedimenos pelos quais estes comportamentos
conceituais são adquiridos.
C.L. Hull (1920) tomou como seu ponto de partida o estudo da formação de concei
to a história através da qual uma criança adquire o conceito de “ cachorro” .
Uma criancinha encontra-se numa certa situação, reage a ela aproximando-se e ouve
dizer que isto se chama “cachorro”. Depois de um período indeterminado de intér-
venção, ela encontra-se numa situação algo diferente e ouve dizer que aquilo se
chama “cachorro” . Mais tarde, encontra-se numa situação ainda algo diferente e ouve
dizer aquilo também se chama “cachorro” . Assim o processo continua. As experiên
cias de “cachorro” aparecem em intervalos irregulares (Hull, 1920, p. 5).
- 280 -
Elemento comum
na
M & &J£ % M M « ;m a
X \$ * & % £& Z t t â f i i í H
m u m m w k *
Figura 13-3. Os 144 caracteres chineses usados por Hull para estudar a aquisição de
conceito. São mostrados para cada série a resposta de identificação verbal e o elemento
comum (Hull, 1920).
caracteres do grupo 2 eram apresentados até que todos fossem identificados, então os do
grupo 3 e assim sucessivamente, até o grupo 6 .
Uma vez que o sujeito tivesse aprendido a identificar estes 72 caracteres chineses (6
grupos x 12 caracteres por grupo), o experimentador fazia um teste de generalização. Ele
apresentava os restantes 72 caracteres, mas não mais pronunciava o identificador. Seria o
sujeito capaz de identificá-los, mesmo çiunca os tendo visto antes? Hull descobriu que os
sujeitos identificaram corretamente mais de 70 por cento destes novos caracteres. De
fato, os sujeitos frequentemente faziam identificações corretas, embora fossem incapazes
de verbalizar a regra para a inclusão numa classe particular.
No experimento de Hull, cada membro de uma dada classe de S tinha um certo traço
em comum. Smoke (1932) salientou que os conceitos no mundo real raramente, se
alguma vez, consistem de uma classe de situações com elementos comuns explícitos. A
formação de conceito, geralmente, envolveria uma resposta sob o controle de relações
comuns a um grupo de padrões de estímulo. Considere, por exemplo, as figuras da Fig.
13-4 geradas por uma relação bastante artificial sugerida por Smoke. Todas as figuras à
esquerda da Fig. 13-4 são membros da classe de S^ denominada “ dax” , enquanto que
nenhuma das figuras à direita da Fig. 134 é “dax”. A regra para “dax” é um círculo e
dois pontos: um ponto dentro do círculo e outro fora. Smoke descobriu que sujeitos
humanos adquiriam rapidamente o comportamento generalizado de categorizar outros
padrões como “dax” , mesmo quando seu único “treino discriminativo” anterior consis
tisse da apresentação de algumas figuras “dax” e não “dax” apropriadamente indicadas e
com instruções para se observar as diferenças. Embora fossem frequentemente incapazes
-28 1 -
Figura 13-4. Amostras de S ^ s e S s “ dax” (de Kimble e Garmezy,
segundo Smoke, 1932).
de verbalizar a regra para a inclusão na classe, os sujeitos, mesmo assim, podiam identi
ficar corretamente novas figuras “ dax” que não tinham visto antes.
Nos experimentos de Hull e de Smoke, diz-se que os sujeitos adquirem certos con
ceitos. Podemos agora perguntar de que modo estes experimentos demonstram a aprendi
zagem de conceito:
1. Tanto no experimento de Hull como no de Smoke, os sujeitos adquiriram a
habilidade de dar um rótulo verbal comum para qualquer membro de uma classe de
situações.
2 . O comportamento adquirido generaliza-se para novas situações às quais o sujeito
não havia sido exposto antes.
3. A classe de situações é determinada por alguma relação comum — um traço ou
uma regra geométrica complicada.
Partindo desses dados, somos levados a duas conclusões sobre o comportamento de
conceito. Primeiro, diz-se que um organismo revela um conceito quando ele pode identi
ficar qualquer membro de um conjunto de situações relacionadas. Segundo, o organismo
adquire esta habilidade através de uma história explicita de reforçamento (ou instruções
fundamentadas numa história de reforçamento prévio) na presença de um subconjunto
das situações.
E stam o s agora em condições de ver a relação do paradigma do L—set
c o m a f o r m a ç ã o de c o n c e i t o . O p r o c e d i m e n t o de L —s e t é
simplesmente uma maneira sistemática de ordenar a história de reforçamento que conduz
ao comportamento de conceito. Embora os macacos não falem, o comportamento que
eles ad qu irem com os p ro c e d im e n to s de L—set parece precisamente
análogo ao que os sujeitos humanos fazem, em experimentos sobre formação de con
ceito, usando respostas verbais. O macaco escolhe o objeto singular de um grupo de
objetos que ele pode nunca tervistG anteriormente. O homem escolhe o “dax” entre um
grupo de padrões que ele pode nunca ter visto anteriormente. Na vida real, parece que
raramente adquirimos nossos conceitos atravéz da progressão ordenada de um problema
relacionado para outro, a seqüência característica das disposições para aprender. A
criança na escola, em casa e no parque adquire seus conceitos concorrentemente e muito
mais casualmente do que em quaisquer arranjos de procedimento no laboratório.
Todavia, quando ela pode identificar um novo cachorro como um cachorro, ou uma nova
situação social como aquela que requer “boas manpiras” , ela está se empenhando em
comportamentos do tipo produzido pelos vários procedimentos que descrevemos.
- 282-
Note que o termo conceito, como descrito, não se refere a uma coisa. Como discrimi
nação, condicionamento e extinção, o termo refere-se a certos fatos comportamentais e
certas relações entre comportamento e ambiente. A palavra “conceito” denota o fato
comportamental de que uma determinada resposta* está sob o controle de uma classe
relacionada de SDs. Um corolário interessante dessa definição é que ela não separa um
conceito de uma discriminúyão. Podemos lembrar qiie uma discriminação (Resultado) é
um nome para o fato comportamental de que um passa a controlar uma resposta
operante. Mas sabemos que a generalização toma impossível descobrir um caso perfeito
de discriminação onde apenas um controla a resposta. 0 treino discriminativo prolon
gado pode limitar a classe de eventos ambientais qüe estabelecem a ocasião gara a resposta,
mas a classe permanece uma classe. Se tivéssemos sido treinados para dizer “amarelo”
na presença de um certo comprimento de onda da luz a probabilidade da resposta
“ amarelo”permaneceria alta quando pequenas mudanças fossem feitas no comprimento de
onda. Tais resultadçs, que indicam a persistência da generalização mesmo após um longo
treino discriminativo, expressam as limitações na capacidade do organismo de fazer dis
criminações infinitamente refinadas.
Embora a noção de extensão per se seja muito imprecisa para permitir uma distinção
rigorosa entre conceitos e discriminações com base nos comportamentos observados, ela
sugere que a distinção entre os dois pode ser feita em termos de procedimento. Suponha
que estivéssemos interessados em treinar um organismo a fazer discriminações cada vez
mais refinadas entre um determinado triângulo (S^) e todos os outros triângulos. Nosso
procedimento consistiria em apresentar triângulos gradualmente mais semelhantes ao
triângulo S^, sem liberar o reforçamento na sua presença. Com efeito, melhoramos a
discriminação ampliando a classe de s experimentados. Na formação do conceito de
triangularidade, por outio lado, apresentaríamos e reforçaríamos respostas a triângulos
semelhantes ao triângulo original, aumentando, assim, a classe de SD. Isto é justamente o
que Hull fez oara “ oo” , Smoke fez para “dax” e Harlov» fez para a singularidade. Todas
essas variantes de procedimento servem gradualmente para estabelecer a agregação de S^s
que controlam uma determinada resposta, seja o comportamento dc dizer “ oo” , de dizei
“ dax” ou de selecionar o objeto singular. Os procedimentos para formação de conceitos c
discriminações iniciam-se similarmente, com reforçamento na presença de um único S^,
mas eles divergem daí em diante para alcançar seus efeito diferentes. O treino discrimi
nativo limita a classe de S^s controladores, enquanto a formação de conceito amplia a
classe de S^s controladores. A frase de Keller e Schoenfeld (1950) “discriminação inter
classes e generalização intra-classes” é adequada para resumir a característica comporta
mental de um conceito e nos lembra os processos que participaram na sua evolução.
13.3 ESTUDOS SOBRE FORMAÇÃO DE CONCEITO EM AN1MAÍS
De acordo com a análise apresentada até aqui, um conceito representa o controle
adquirido de um conjunto de situações relacionadas (Ss) sobre uma determinada res
posta. Na seção precedente, sugerimos que o método geral para estabelecer este controle
era o uso anterior de um subconjunto de Ss como SDs num paradigma de discriminação.
Esta descrição está de acordo com os procedimentos de treinamento específico de
Harlow e Hull que apresentaram uma série de contingências de discriminação relacio
nadas. A descrição também está de acordo com o procedimento de Smoke, na medida em
que supusermos que suas instruções permitiram que seus sujeitos se administrassem um
treino discriminativo com os padrões de S^ e S A das figuras geométricas que lhes foram
apresentadas. Esses três experimentos representam apenas uma pequena amostra dos
procedimentos de treinamento que satisfazem a definição de um procedimento de
aquisição de conceito. Existem várias maneiras de se arranjar uma história de discriminação
com um subconjunto dos membros de uma classe ampla de Su s relacionados. Na pre
sente seção, consideraremos alguns desses procedimentos adicionais, chamando a aten
ção, ao mesmo tempo, para a variedade de conceitos que têm sido estabelecidos ao nível
infra-humano.
Kelleher (1958) reforçou pressões à chave telegráfica em chimpanzés famintos (num
esquema probabilístico p= 0,01 de reforçamento alimentar) apenas quando certos
padrões visuais estavam presentes num arranjo de 3 x 3 de pequenas janelas de plexiglass
acima da chave. Outros padrões foram associados com contingências de extinção para a
pressão à chave. No treinamento do conceito, 13 padrões de SD e 13 padrões de
foram apresentados numa seqüência aleatória. A Fig. 13-5a apresenta uma amostra de
três dos padrões de SD e três dos padrões de S & . Os registros cumulativos de resposta
abaixo desses padrões mostram um desempenho típico alcançado após um treinamento
extensivo neste procedimento. As três amostras dos padrões de mostram que a classe
de Su foi limitada pela regra “três janelas inferiores iluminadas” . O comportamento da
- 284 -
Fig. 13-5a representa uma discriminação estável já avançada, com as respostas limitadas
principalmente às ocasiões, em que os padrões de estavam presentes. Em (b), foi feito
um teste para o comportamento de conceito, utilizando-se 6 padrões de não fami
liares e 6 novos padrões de S ^ na seqüência de estímulo, sem alterar as contingências de
reforçamento. Três de cada um dos novos padrões são vistos na Fig. 13-5b. Como os
registros cumulativos na Fig. 13-5b mostram, o comportamento não foi perturbado,
indicando que a formação de conceito foi obtida. O comportamento estabelecido poi
uma história de discriminação anterior com um subconjunto de estímulos foi generali
zado para novos membros da classe de
Como no exemplo de Hull com os caracteres chineses, esses padrões de da Fig.
13-5a e b têm elementos comuns — iluminação das trcs janelas inferiores. Um resultado
um pouco diferente foi obtido quando o experimentador tentou desenvolver um con
ceito baseado no número de janelas iluminadas. Os padrões de estímulo na seção superior
da Fig. 13-5c, ilustram as contingências de treinamento do segundo conceito. Aqui, a
classe de é limitada pela regra “ iluminação de três janelas” . Por outro lado, os padrões
de S^' contem duas ou quatro janelas iluminadas. Os registros cumulativos da Fig. 13.5c
indicam a excelente discriminação alcançada no treino, usando-se a seqüência de 13
padrões de SD e 13 padrões de . Todavia, quando 6 novos padrões de e S A foram
introduzidos (Fig. 13-5d), o desempenho deteriorou-se nitidamente. Um número substan
cial de respostas ocorreu na presença dos novos padrões de SA , enquanto se observou
uma diminuição no número de respostas na presença dos novos padrões de S^. O teste
crítico para o comportamento de conceito falhou porque não se demonstrou que o
responder do animal estava sob o controle geral da classe de “ três janelas acesas” .
Este resultado negativo serve para enfatizar o critério para a existência do comporta
mento de conceito. Depois de se estabelecer o controle discriminativo de uma R com um
subconjunto dos membros de uma classe de S, procuramos ver se o controle discrimi
nativo se generalizou de modo a incorporar os membros restantes da classe de S. Os
exemplos descritos nas seções anteriores preencheram o teste requerido; daí, sua
designação como comportamento de conceito. Isto não aconteceu com o segundo proble
ma de conceito de Kelleher (Fig. 13-5d). Daí, concluímos que o segundo problema
resultou apenas numa discriminação, não num conceito. Todavia, há 9!/3!/6! ~ 84
padrões de possíveis de acordo com a regra três-janelas-acesas, e é possível que o
treino com um subconjunto com mais de 13 padrões de fosse bem sucedido no
estabelecimento do conceito (Ferster, 1964).
É conveniente comparar o procedimento do experimento de Kelleher com o para
digm a de L—set p o rq u e am bos p re te n d em ser paradigmas de conceito.
No procedimento de disposição para aprender, o subconjunto de cada c SA s é
arranjado em termos de “ problemas" cada um dos quais contendo algumas contingências
repetidas. Um novo problema geralmente não é apresentado ate que o anterior tenha sido
adquirido de acordo com o critério. No procedimento de Kelleher, todo o subconjunto
de cada e é apresentado num único “problema” . Mas seria fácil re-delinear o
ex p e rim e n to de Kelleher, moldando-o na forma de L-sets, através do
uso de uma série de problemas de discriminação de 2S ---- > IR. Para o conceito 1 ,
podemos apresentar p r im e ir o
■□ ■ ■□ ■
Problema 1: □□□ versus □□□
■■■ ■□ ■
- 285-
até que o índice de discriminação tenha atingido algum valor arbitrariamente alto. Então
apresentaríamos
□n □ ■■■
Problema 2: $ d
□□□ versus S2A ■■■
■■■ □□□
e assim sucessivamente. Nosso teste da aquisição do conceito é feito, automaticamente,
com o início de cada problema porque neste momento o organismo se defronta com S^s
e SA s nunca visto antes.
Poucos experimentos sistemáticos têm sido realizados para testar qual a combinação
de todos os possíveis procedimentos treina mais eficientemente o comportamento de
conceito. O paradigma da disposição para aprender tem a virtude de proporcionar um;i
curva da aquisição de conceito (ver Fig. 13-2) que é uma estimativa do grau dt*
obtenção do conceito em qualquer momento durante o experimento. Mas deve ficar
claro que, na vida real, aprendemos nossos conceitos de maneira similar à dos chimpanzés
de Kelleher para quem várias combinações de S^s e S ^ s apareceram em ordem aleatória.
O fato de os chimpanzés não terem adquirido o conceito de tres-janelas-acesas sugere
que o tamanho do subconjunto dos membros de usados no treino é uma variável
imporatnte na aprendizagem de conceito. Isto parece estar bem documentado. Andrew e
Harlow (1948)treinaram macacos a discriminar um único triângulo de um círculo. Os
macacos foram subsequentemente testados em várias situações diferentes que incluíam
mudanças na orientação do triângulo original, assim como novos triângulos de tamanhos
e ângulos diferentes. Os macacos apresentaram pouca indicação de terem formado o
conceito “ triângulo” com a sua história com um único membro da classe de triângulos.
No estudo de Hull com os caracteres chineses, um grupo de sujeitos aprendeu a identifi
car apenas três grupos de caracteres, ao invés dos seis usuais. Para contrabalançar sua
exposição a um número menor de grupos, os sujeitos tiveram duas vezes mais tentativas
nestes três grupos. Apesar disso, os sujeitos dos três grupos mostraram um desempenho
muito pior ao identificar os caracteres que nunca tinham visto. Dentro de limites, parece
que a formação de conceito depende diretamente do número ou variedade de S^s
empregados no treino.
A técnica experimental conhecida por escolha de acordo com o modelo proporciona
um conjunto de contingências de discriminação bem apropriado para o estudo do com
portamento de conceito em animais, o comportamento de escolha de acordo com o
modelo é estudado convenientemente em pombos, usando um aparelho contendo três
discos para bicar, cada um dos quais pode ser transiluminado por cores ou padrões.Para
o estudo de escolha de matiz, a seqüência de eventos está descrita esquematicamente pela
Fig. 13-6. Durante o treino preliminar, as duas chaves laterais são ocasionalmente ilumi
nadas com luzes de cores diferentes. O bicar uma ou outra chave é, então, reforçado.
Quando o bicar está seguramente sob o controle das chaves laterais iluminadas, a cadeia
de comportamento pode ser ampliada. As chaves laterais são apagadas e apenas a chave
central fica iluminada com uma luz colorida (Fig. 13-6, parte superior). Quando a chave
central iluminada é bicada, ambas as chaves laterais são iluminadas e a chave do centro é
apagada. Uma das chaves laterais — algumas vezes a esquerda, outras vezes à direita —
apresentará o mesmo matiz que a chave do centro apresentou no momento anterior (Fig.
-2 8 6 -
O i O
r- t
P adrão na chave
c e n tra l a té q u e o
anim al o ligue
0
o o o
13-6, centro). O bicar a chave lateral que tem o mesmo matiz é reforçado. Uma escolha
incorreta, todavia, é seguida pelo apagar de todas as luzes e “time out” de todas as
contingências por alguns segundos. Após o reforçamento ou o “ time-out” , a luz central
acende-se novamente e uma nova tentativa inicia-se. Experimentos com dois ou três
matb.es indicam que o pombo pode ser treinado a escolher matizes de acordo com o
padrão com uma precisão acima de 90 por cento (Comming e Berryman, 1961). Nenhum
experimento tentou ainda estabelecer um conceito geral de “escolha” usando muitos
matizes e muitos padrões. Para estabelecer o conceito geral de escolha, o comportamento
de bicar a chave lateral teria que ser colocado sob o controle de qualquer padrão apresen
tado imediatamente antes na chave central. Quando tais escolhas são feitas com padrões
nunca vistos no treino, podemos dizer que o comportamento revela um conceito geral de
escolha.
A escolha é apenas um de um número de conceitos relacionados sutis que podem ser
estudados experimentalmente através desta técnica de três chaves. Nas contingências
indicadas pela Fig. 13-7, requer-se um conceito algo mais complicado. O animal deve
bicar a figura que está girada de 90(- no sentido anti-horário, em relação à figura padrão.
O estabelecimento destes conceitos em animais, no laboratório, está ainda no estágio
preliminar. Há razão para se esperar que sua produção aguarde combinações adequadas
dos procedimentos familiares dc aquisição, discriminação e aproximação sucessiva e não
quaisquer novos princípios de comportamento.
- 287-
p -.l ^
OIO ' ' ^ " " ^ p --1
+© d © © n © h
Que tais conceitos não estão, provavelmente, além do alcance do pombo é sugerido por
uma demonstração interessante feita por Herrnstein e Lovland (1964). Estes pesquisa
dores treinaram pombos a bicar uma chave plástica por alimento apenas quando uma
placa translúcida próxima à chave estava iluminada. Os pombos adquiriram rapidamente
a discriminação de bicar quando a placa estava acesa e não bicar quando estava apagada. No
procedimento final, a placa foi iluminada com projeções de slides coloridos de 35 mm
contendo fotografias de ambientes naturais, incluindo campo, cidades, rios, árvores e
campinas. Cada slide era apresentado por cerca de um minuto. Em metade dos slides,
havia pessoas em várias posturas e posições e essas projeções eram as ocasiões para o
reforçamento intermitente do bicar a chave. Os outros slides não continham pessoas e
eram SA s para o bicar a chave. Centenas de slides diferentes foram apresentados durante
vários meses de treino com essas contingências. Eventualmente, os animais passaram a
iimitar suas bicadas às ocasiões em que os slides com pessoas eram projetados. Quando
um novo grupo de slides foi apresentado, os animais continuaram a bicar predominan
temente quando havia pessoas presentes, embora nunca tivessem visto estes slides antes.
Uma vez que os slides que continham pessoas variavam bastante no número de pessoas
mostradas, suas roupas, se estavam perto ou longe, se adultos ou crianças, pode-se dizer
que os pombos estavam demonstrando um conceito sofisticado de “pessoa” . Mesmo ás
ocasiões em que os pombos erravam eram interessantes. Eles ocasionalmente bicavam
quando os slides mostravam objetos frequentemente associados a pessoas tais como casas,
barcos e automóveis.
- 288-
“gato” , cada membro desta classe compartilha de certas relações físicas em comum com
todos os outros membros. 0 mesmo é verdadeiro para os caracteres chineses agrupados
no conceito “oo” , as figuras “dax” etc. Em geral, estas relações comuns caracterizam os
nossos conceitos de objetos tais como “casa” , “livro”, “ mesa” e a letra impressa “E”. Em
outros conceitos como “ maior que” , “proveniente de” , “ à direita de” /é um membro de”*
e “ conduz a” , as relações comuns que ligam todos os S^s não são a estrutura espacial
mas outros tipos de relações que são identificadas pelas próprias respostas verbais que
elas ocasionam . Assim, “ maior que” é uma resposta verbal que identifica a relação
compartilhada pelos membros da classe de controlador.
Deveria ficar claro que os conceitos relacionais são muito difundidos. Apesar disso,
frequentemente pode-se observar que o comportamento está sob o controle de amplas
classes de estímulos cujos membros parecem não ter relações comuns de estímulo. Não
existe, por exemplo, uma relação óbvia de estímulo físico nos S^s para “alimento” . Uma
cenoura, uma ervilha, uma folha de espinafre e um copo de leite aparecem como objetos
extremamente diversos. Levando-se em conta apenas suas características visuais, uma
ervilha parece-se mais como uma bola de gude do que com uma folha; uma cenoura
parece-se mais com um bastão do que com um copo de leite. Uma heterogeneidade
semelhante encontra-se nos cristais brancos de iodo, no bromo líquido vermelho e no gás
incolor conhecido como cloro que constituem, parcialmente, a classe “halogêneo”. O
conjunto de situações apresentadas na Fig. 13-8 controla o comportamento de parar,
embora elas tenham pouca semelhança entre si.
- 289 -
mente o controle apresentado por uma classe de ampla, mas heterogênea, comum
p ro ced im en to de L —set. Se trein arm o s um m acaco a escolher ou o
triângulo ou a esfera entre dois objetos e nunca apresentarmos um triângulo e uma esfere
juntos, o comportamento do macaco ficará sob o controle de “triângulos ou esferas”
Além disso, o controle se generalizará para novos triângulos e novas esferas. Aqui, a classe
de SD controlador consiste de duas subclasses muito diferentes. Os membros triangulares
são agrupados devido à sua relação geométrica comum e os membros esféricos também.
Mesmo assim, falta uma relação comum entre triângulos e esferas.
Estendendo o procedimento para diversos SDs adicionais, podemos ampliar a classe
de SD do macaco para uma lista indefinida de objetos heterogêneos. Se mantivermos os
novos elementos de SD não relacionados aos antigos, não haverá razão para se esperar
que o macaco generalize para qualquer S novo que decidirmos incluir na classe.
Os exemplos das classes heierogêneas dc S^ do cotidiano e o comportamento do
macaco citado no último parágrafo ilustram o que é conhecido como conceito disjuntivo.
Os membros da classe de S^ ou triângulos ou esferas, ou cenouras ou ervilhas, ou
espinafre ou leite...; ou um guarda de trânsito no cruzamento ou u m a luz vermelha e assim
por diante. Em cada caso, uma resposta está sob o controle de uma ampla classe de S^s
e, portanto, preenche um dos critérios importantes do comportamento de conceitos.
Contudo, a falta de uma única relação comum, algo que una todos os membros da
classe, impede a generalização a novos membros, o que é típico de outros conceitos.
A dificuldade em se incluir novos membros de uma classe de S ^ disjuntivo na base
da generalização pode ser uma das razões pelas quais se diz, algumas vezes, que a humani
dade abomina conceitos disjuntivos (Bruner, Goodnow e Austin 1956). Felizmente,
muitas vezes é possível encontrar uma relação subjacente entre os membros de uma classe
disjuntiva de S^ que pode fornecer a base para a generalização. Por exemplo, os
alimentos, embora diferentes em aparência, têm a propriedade comum de serem substân
cias que são ingeridas pelos organismos vivos e transformadas em constituintes vitais do
corpo. Similarmente, o bromo, cloro e iodo têm a propriedade comum de se combinarem
com metais, formando sais cristalinos brancos que, de fato, são intimamente relacionados
um ao outro.
Nestes e em muitos outros conceitos disjuntivos, uma relação subjacente é revelada
através de uma operação comportamental que transforma os membros de uma classe de
SD, originalmente heterogêneas e diversos, em um novo conjunto de membros homogê
neos e semelhantes. Essas situações novas têm uma relação comum e esta relação fornece
a base para a generalização normal. Algumas vezes, a operação requerida é simples. Para
descobrir se certa substância é um alimento , precisamos apenas ingerí-la e esperar pela
situação transformada resultante. Para descobrir se alguma substância nova é um halo-
géneo, deixamo-la reagir com o sódio e verificamos se um sal cristalino branco “haloge-
nado” é produzido.
Frequentemente, pode ser difícil reduzir classes disjuntivas em conceitos relacionais
subjacentes. Uma parte significante da atividade científica consiste em se tentar fazer
operações em eventos superficialmente diferentes na esperança de transformá-los em
situações que são de fato semelhantes. Grande parte deste livro se dedica à elucidação de
relações subjacentes descobertas nos eventos comportamentais que, superficialmente,
parecem muito diferentes. Por exemplo, um animal bicando um disco e um estudante
opinando apresentam uma relação subjacente.
A procura de relações subjacentes é, de modo algum, limitada à ciência. Considere a
-2 9 0 -
longa tentativa de se descobrir o padrão absoluto para a arte ou a música. Tal padrão, se
pudesse ser encontrado, seria uma regra para relacionar as ocorrências extremamente
diversas do que identificamos como boa arte ou boa música. O fracasso em se encontrai
tais regras pode nos forçar, na exasperação, a concluir que boa música é aquela que os
críticos, dizem ser boa; ou, para citar uma ilustração da psicologia, diz-se, algumas vezes,
que a inteligência é “o que os testes de inteligência medem” . Ninguém descobriu ainda
uma operação para ser realizada em pinturas ou composições musicais que proporcio
nasse um conjunto de situações em que o genial e o medíocre fôssem inequivocamente
distintos. O conceito de genialidade permanece disjuntivo., “ Quando parar” também
retem uma certa arbitrariedade. Não existe uma operação para transformar os diversos
elementos da Fig. 13.8 em elementos que apresentem uma relação de estímulo comum.
A classe é feita pelo homem e a escolha dos elementos de estímulo é arbitraria. Por esta
razão, não há uma base para a generalização quando um novo S é introduzido. Tudo o
que se pode fazer é testar cada novo exemplo à medida que aparece determinando-se a
inclusão da classe apenas pelas contingências de reforçamento. Tal classe é estabelecida
de um modo similar aquele através do qual formamos, no macaco, o conceito de
“triângulo-ou-esfera”.
Em última análise, a única relação comum a todos os tipos de conceitos disjuntjvos é
que seus membros diferentes controlam a mesma resposta. Alguns conceitos disjuntivos,
por exemplo, alimento e halogêneos, têm uma propriedade além, de modo que seus
membros diferentes podem ser transformados e apresentarem uma relação subjacente
comum. Outros conceitos disjuntivos tais como a boa música a inteligência podem ter
uma relação subjacente; outros ainda, tal como o conceito experimental “triângulo-ou-
esfera” , permanecem ihteiramente arbitrários e dissimilares.
13.7 S IG N I F I C A D O E C O M P R E E N S Ã O C O N S ID E R A D O S COMO
INTERRELAÇÕES ENTRE CONCEITOS
[13.2]
Poucos dos nossos conceitos cotidianos são tão simples como indica esse diagrama, mas a
maoria dos conceitos adquiridos pelos organismos humanos podem ser analisados em
termos de outros conceitos. Assim, um operante é o < conjunto de respostas>que está
sob o < controle de > suas <conseqüências>. Uma enseada é uma < porção de água><
protegida>, com<£ ancoradouros>. Pai é o < progenitor> do <sexo masculino>. Podemos
mesmo inventar tais conceitos, como no exemplo tigleão =o <filho> de um <tigr^><
macho> e um <leãq> ^ fêm ea^ Muitos desses conceitos são formas generalizadas de
- 292-
Pequeno Grande
Acromática
• C ■ ▲
• C ■ A
5G
Ü © c ü A
O c □ A
c
C ores o-
§
6 c ei A
• n A
C ro m ática ^
*«
*c?
d © c Q A
© c m A
3
circulo crescente quadrado triâgiüo circulo crescente quadmdo tm ngub
curvas rctilín ea s curvas retilín eas
F o rm a
F igura 1 3-9c As 32 figuras usadas p o r K endler e V in eb erg (1954)
p a ra e s tu d a r a aq u isição d e c o n c e ito s co n ju n tiv o s.
aprendido dois conceitos, como se vê na primeira e segunda coluna de conceito na Tabela
13-2. No procedimento terminal, todos os sujeitos foram reforçados para arranjar os
cartões em quatro grupos: curvos pequenos, curvos grandes, retilíneo pequeno,
retílineo grande. Tal arranjo é feito na base de conceitos conjuntivos que consistem de
conceitos de tamanho e forma. O grupo 1 aprendeu este arranjo final mais rapidamente
que o grupo 2, que por sua vez, foi mais rápido que o grupo 3. Os autores concluiram que
a taxa de aquisição do conceito conjuntivo está diretamente relacionada ao número de
conceitos componentes aprendidos previamente.
Tabela 13-2
AS CONDIÇÕES DE TREINO USADAS POR KENDLER E VINEBERG (1954) PARA
ESTUDAR A AQUISIÇÃO DE CONCEITO CONJUNTIVO
- 293-
pudéssemos dizer que eles estavam demonstrando compreensão. O tipo de comporta
mento adicional que parece ser requerido está representado esquematicamente na Fig.
13-10 para o conceito de leite.
A Fig. 13-10 é explicada como se segue. Cada um dos círculos do diagrama refere-se
a uma classe de S^s do tipo descrito previamente. Assim, a criança, para quem pode-se
dizer que a Fig. 13-10 tem uma estrutura significante, pode identificar garrafas deleite
copos de leite, leite derramado, e assim por diante. Mas ela pode também identificar
(com respostas verbais diferentes) vacas de vários tipos, cereais de um tipo ou de outro,
queijos, sorvetes e leiteiros. Se ela for uma aluna de ginásio que estuda nutrição, então,
ela poderá ser capaz de identificar o soro, a nata e o cálcio. Mas, igualmente importante,
o organismo humano sofisticado pode dar uma identificação relacionai para uma situação
composta que consiste de um S ^ para o leite e um de qualquer outra classe de S^
indicada. Esta habilidade conceituai está indicada pelas linhas entre os círculos com as
proposições que descrevem a relação. Cada proposição relacionai, todavia, é também um
conceito; na verdade, é o tipo de conceito que encontramos frequentemente nas seções
anteriores. O treino requerido para os conceitos relacionais como “proveniente de” e “é
um componente de” é precisamente análogo ao treino dado ao macaco quando conceitos
como “o singular” , “ o mais alto”, “90 graus de rotação” foram adquiridos. Dizemos que
uma criança sabe o significado, ou tem uma compreensão mais completa de leite quando
ela pode identificar as relações entre os membros da classe de SD que formam o leite e os
membros de várias outras classes de S ^
F ig u ra 13-10. U m a rep re sen tação esq u e m á tic a do c o n c e ito de leite e suas relações
com vário s o u tro s co n ceito s.
Deve ficar claro que a representação estrutural de significado da Fig. 13-10 está
isolada artificialmente. De fato, mostramos apenas as relações entre um único
- 294 -
conceito e um grupo de outros negligenciando as interrelações dos conceitos perifé
ricos com os outros e com todos os conceitos que o organismo' revela. Uma representa
ção completa do repertório conceituai de qualquer indivíduo seria uma tarefa insupe
rável, embora uma amostra limitada de conceitos e suas interrelações possa ser,
possivelmente, descrita,(Reitman, 1965, R. Quillian, manuscrito não publicado).
A Fig. 13-10 é uma maneira grosseira de representar os vários graus de com
preensão. Quanto mais densas as interconexões e maior o número de classes de que
possam ser unidas, mais facilmente diremos que um individuo compreende um con
ceito. A compreensão que uma criança tem de leite difere daquela do administrador da
leiteria ou do especialista em nutrição, principalmente no número menor de conceitos
aos quais a criança pode relacionar o leite. Minha compreensão do meu carro é
incompleta comparada com a do meu mecânico, que pode relacionar a palavra carro a
milhares de outras classes de incluindo, em particular, o que chamamos as partes
do veículo. Contudo, sua compreensão pode terminar com a mecânica da máquina.
Um caso interessante é proporcionado pelo físico que pode ser capaz de analisar
conceitos tais como fricção, aceleração, trabalho e energia a um nível muito mais
básico que o mecânico poderia. Mas quando seu carro não dá a partida, o físico não
estará preparado para repará-lo, a menos que possua conceitos tais como feixe de
mola, vela de ignição, cilindro, distribuidor e suas várias interrelações. As interrelações
entre os conceitos, para qualquer indivíduo, depende da história passada deste indi
víduo: as contingências para o chofer de automóvel estão ligadas a certos conjuntos de
situações, as para o mecânico a um outro e para o físico ainda a outro. As diferenças
entre seus repertórios conceituais sugerem uma distinção de nível embora, frequen
temente seja muito difícil estabelecer, na prática, os níveis relativos de conceitos.
Numerosos autores estudaram uma ou outra relação entre conceitos na tentativa
de esclarecer, em geral, a estrutura relacionai entre os conceitos. Muitos de nossos
próprios conceitos mostram uma estrutura hierárquica interessante (Welch, 1947;
Brown, 1958 a, b). Isto é, o conceito cachorro, por exemplo, pode conter como seus
membros poodles, dalmatas, cães de caça.
S eres
A n im ad o s In a n im a d o s
Peixes Aves Q u ad rú p ed es
[13.3]
O cach o rro
do o u tro la
do da ru a
-2 9 5 -
terriers e assim por diante. Mas Príncipe, meu dâlmata é tambem um conceito com
pleto. Considere todas as situações em que podemos usar a palavra “Principe” para
identifica-las: o Principe em casa, o Principe fora de casa caçando gatos Principe acor
dado etc. A estrutura hierárquica se estende a ambas direções o Principe não é apenas
um cachorro - é um quadrúpede , um animal e um ser animado (Brown, 1958a). Eviden
temente, as classes de S ^que formam os nossos conceitos podem ser ou conjuntos con
tendo outros conceitos ou subconjuntos de outros conceitos. Por exemplo, ver o dia -
grama 13.3 . Adquirir um repertório verbal que colocará um conceito no seu lugar
apropriado numa hierarquia é uma parte importante do que queremos dizer por com
preender um conceito. n
E por responder às interrelações entre conceitos, ou classes de Su que as respostas
de linguagem têm uma vantagem especial sobre outras formas de comportamento. Para
ensinar uma criança que o leite é proveniente das vacas, não é necessário trazer uma
amostra de leite e uma vaca para a criança e reforçara escolha do leite sob uma série de
contingências análogas às contingências da “escolha do acordo com o modelo” que
usamos com o pombo. Se a criança já adquiriu os conceitos < vaca >< leiteiros > e< é
proveniente de > , isto é, ela emprega as palavras “vaca”, “leiteiros” e “é proveniente
de” , nas situações apropriadas, podemos tratar diretamente com o comportamento
verbal. Podemos, primeiro, fornecer uma deixa verbal e, então, reforçar a sentença
composta: “o leite é proveniente das vacas” . A única vantagem da linguagem é que, ao
contrário de barras, chave e botões, ela proporciona um repertório de resposta portátil
que o organismo pode carregar além das situações originais em que o comportamento foi
modelado. Além disso, quando as respostas de linguagem de um organismo podem ser
colocadas sob o controle discrim in ativo das situações arbitrárias que constituem a palavra
impressa, ou as palavras faladas de um segundo organismo, esta vantagemi adquire ainda
mais força. Mas essa grande flexibilidade no controle e emissão do sistema de
comportamentos que chamamos de linguagem pode ser também uma desvantagem por
apresentar a possibilidade de aquisição de cadeias verbais sem o amplo controle de SD
ambiental colateral característico de conceitos. Uma criança pode adquirir o que
chamamos verbalism os vazios. John Dewey, um conhecido teorista da educação, da
geração de Thorndike, uma vez perguntou a um grupo de crianças escolares o que elas
encontrariam se cavassem profundamente a terra. Foi recebido com olhares vazios. A
professora rapidamente, explicou a Dewey que ele havia feito a pergunta de modo
errado. “ Qual é o estado do centro da terra? ” ela perguntou. A resposta veio em coro:
“Fusão ígnea” . Aqui, uma seqüência verbal estava sob o controle discriminativo das
palavras faladas por um segundo organismo (a professora), mas parece que nenhuma
criança seria capaz de identificar qualquer dos membros das classes de SD <Jusãq> ou <
ígnea>, ou relacionar o conceito <centro da terra>com <cavar na superficie>. Estas são
as diferenças principais entre o que muitos educadores chamam de memorizaçãt de cor e
aprendizado significativo. Muitas crianças aprendem o Juramento à Bandeira sem
compreender sequer uma palavra dele; isto é, sem serem capazes de identificar exemplos
dos conceitos representados pelas várias palavras do Juramento.
A presente análise ajuda a esclarecer o papel da definição na linguagem. Considere
a definição familiar de um operante = uma resposta que está sob o controle de suas
conseqüências. Tal definição é uma proposição de um conceito composto constituído
de < resposta > < sob controle de > e < conseqüências - Os estudantes, algumas
vezes, tentam adquirir a cadeia verbal do lado direito do sinal de igualdade, pre
- 296-
parando-se para serem apresentados com apenas o termo do lado esquerdo, num teste.
Mas muitos instrutores têm expectativas maiores. Uma definição é dita ser com
preendida quando pode ser analisada gramaticalmente, isto é, decomposta em seus
conceitos componentes. Se esta análise é efetuada sucessivamente, conceito por con
ceito, eventualmente, atinge-se um ponto onde os componentes do conceito original
são reduzidos a conceitos simples, em vez de compostos. Cada um desses conceitos
simples so podem ser especificados, fazendo-se uma lista de algumas das situações reais
do ambiente que constituem sua classe S^. Neste nível,diz-se, algumas vezes, que o
conceito ê primitivo. Ilustramos esse tipo de análise conceituai na Fig. 13-11. Esta
figura, como a Fig. 13-10, é apenas uma outra maneira de se representar a estrutura
parcial do significado. Parece que o grande poder de uma definição está na sua
habilidade de codificar um grande número de conceitos e suas interrelações numa
única unidade de comportamento verbal. A definição típica seria um exemplo muito
complexo do tipo de conceito estudado por Kendler e Vineberg.
As notas nesta seção fornecem um indício do que está faltando nas análises expe
rimentais do comportamento de conceito nas seções anteriores. Nestas, os pesqui
sadores, ao treinarem seus animais através da L—set ou de outros procedimentos de
conceito, têm tentado estabelecer apenas um único conceito. De modo a simular a forma
mais simples de compreensão, pelo menos três conceitos
A classe dc jco m p o i | ^ cst^ s°b ° c°n- Urr [:estímulo| que segue uma resposta
r trole de P quando
Qéuma função
de P J
Figura 12-11. Uma analise parcial da definição da palavra Operante em alguns dos
seus conceitos componentes. Os conceitos comportamentais importantes estão dentro
dos quadvados c além disso são analisados.
- 297 -
parecem necessários: duas classes independentes de e uma classe a mais de que
conteria, entre seus elementos, situações compostas consistindo de um elemento de
cada uma das duas primeiras classes de S^. Isso seria equivalente a dois conceitos e
um conceito relacionai unindo seus membros. A tecnologia comportamental precisa
ainda ser desenvolvida ao ponto de se poder colocar um número de comportamentos
sob o tipo de controle ilustrado pelas Figuras 13-10 e 13-11, mas um progresso nessa
direção está ilustrado no comportamento do macaco nos dois quadros da Fig. 13-12.
No quadro inferior, o macaco está escolhendo um objeto de forma entre três e seu
comportamento está parcialmente sob o controle da cor da bandeja. Quando esta cor é
mudada, como no quadro superior da Fig. 13-12, o macaco escolhe o objeto de cor
diferente entre os mesmos três objetos. Aqui, dois conceitos relacionais foram desen
volvidos pelos procedimentos de disposição para aprender: “Singularidade de forma” e
‘singularidade de cor” e ambos estão sob o controle discriminativo da cor da bandeja.
Mas mesmo estas demonstrações são pequenas para simular as interrelações complexas
características da “compreensão” . Nestes e em outros experimentos com animais
descritos neste capítulo, apenas um repertório limitado de resposta é desenvolvido.
Parece que a análise experimental das relações de conceitos requer o desenvolvimento
de repertórios de resposta mais amplos que tenham um papel análogo ao do compor
tamento verbal do organismo humano.
Uma parte da seção anterior foi especulativa por necessidade, uma vez que a
tecnologia comportamental ainda não alcançou um estágio onde uma avaliação detalha
da da aquisição de conceito complexo e da interação de conceito possa ser feita em
organismos inferiores. Esperamos suplementar nossa informação experimental sobre a
aquisição de conceito através da análise da aprendizagem humana mas, quando nos
voltamos para o lugar onde a aprendizagem humana de conceito mais sistemática
supostamente ocorre, a escola, encontramos muitas generalizações amplas mas poucos
princípios. Todos são a favor da aprendizagem significante e contra a memorização de
cor. Conceitos, concorda-se universalmente, são o que queremos ensinar e não “fatos
vazios” . Mesmo assim, poucos negariam que, enquanto muitas crianças adquirem os
conceitos básicos que são os objetivos dos seus cursos na escola muitas outras não o
fazem. Isto dificilmente seria devido à falta de material conceituai, pois t) currículo
escolar está impregnado de uma variedade de conceitos isolados. Considere alguns
exemplos adaptados de Brownell e Hendrickson (1950): nação, governo, constituição
cidadão (estudos sociais); lei, elemento, imã, feagente, célula, osmose, massa, ácido,
ion/ciência); erosão, latitude, região, mapa (geografia); voz, tempo, flexão, sentenças,
parágrafo (linguagem); divisão, fração, expoente, equação, número base (aritmética);
escala, tom, clave, intervalo, harmonia (música). Entre esta diversidade de material
conceituai seria surpreendente se não conseguíssemos aproveitar algo de um exame
crítico de como estes conceitos são ensinados. Infelizmente, existe, uma dificuldade
dupla: (1) Nenhum método tradicional de ensino garante a aquisição de conceito, e
mesmo assim ( 2 ) algumas crianças parecem adquirir conceitos, independente de qual
seja o método. Isto mostra a impossibilidade de se extrair dos métodos tradicionais de
ensino as condições necessárias e suficientes para produzir a aquisição de conceito. Os
métodos apropriados para as classes heterogêneas não permitem um controle adequado
- 298 -
SpSdo13<,cT,Jw'O
lK,,ín"írlM9,C0mPl“S" P" “ '"l"‘'nW* ”U“‘~
- 299-
das contingências individuais de reforçamento para assegurar o desempenho desejado
em cada organismo
As implicações deste fato levaram B. F. Skinner (1954, 1958, 1961) a considerar
as possibilidades de um método que permitiria um controle melhor das condições de
aprendizagem de cada estudante individual. Skinner propôs que se programasse as
contingências envolvidas no ensino das matérias cm pequenos passos sistemáticos e se
fornecesse reforçamento imediato para os comportamentos corretos. Skinner notou
que os métodos tradicionais não garantiam a resposta do estudante. Ao ministrar uma
aula para o estudante, ao lhe dar como tarefa a leitura de um livro ou mesmo com a
ajuda de material audiovisual sofisticado como aulas televisionadas, o professor não
tem meios de estar seguro de que o estudante está ouvindo ou lendo cuidadosamente.
Em termos comportamentais, diríamos que o professor não tem meios de estar seguro
de que o aluno está respondendo ativamente.
- 300 -
As contingências programadas dc Skinner supunham implicitamente os tipos de
habilidades intelectuais adquiridas nas escolas, e tradicionalmente vistas como idéias,
compreensão, interesses, associações, conhecimento e assim por diante, eram compor
tamentos operantes complexos. Assim sendo sua aquisição e manutenção deveriam
seguir todas as leis de comportamento que já descrevemos. Mas o ensino programado,
baseado nos princípios de aproximação sucessiva, discriminação, etc., exige uma
atenção mais sistemática para as contingências individuais do que as salas de aula
tradicionais permitem. Skinner propôs uma solução para este problema sob a forma de
uma máquina para apresentar seriadamente o material de ensino e para estabelecer as
contingências de reforçamento para o comportamento. A máquina tem três aspectos
essenciais. ( 1 ) O material é apresentado para o estudante em pequenas porções
discretas, chamadas quadros, (2) Este material estabelece a ocasião para algum
operante discriminativo por parte do estudante, tal como escrever uma palavra ou
sentença, preencher uma lacuna ou escolher uma resposta. (3) O comportamento
emitido é reforçado imediatamente, apresentando-se a “ resposta” correta tão logo o
estudante tenha respondido e permitindo-lhe avançar para o próximo quadro. Uma
dessas máquinas usadas por Skinner é vista na Fig. 13-13. Nesta versão, os quadros
estão escritos num disco rotativo, e um quadro dc cada vez aparece no centro da
janela. Depois de ler o quadro, o estudante escreve sua resposta numa tira de papel
exposta através de uma abertura à direita. Ele, então, levanta uma barra que há na
frente da máquina, movendo o que ele escreveu sob uma cobertura transparente e
revelando a resposta correta na janela central. Os quadros individuais são organizados
em pequenos passos seqüenciais. O estudante pode progredir no seu próprio ritmo
através da sucessão de quadros, chamada um programa, cometendo muito pouco erro.
Mas a apresentação de progu.mas desse tipo não se limita apenas a máquinas. Os
aspectos críticos — pequenos passos seqüenciais, resposta ativa e reforçamento ime
diato - podem ser organizados na forma de um livro. Uma amostra de um texto
programado encontra-se, neste livro, no Capítulo 4.
Muito tem sido escrito a respeito dos méritos e possibilidades da instrução
programada. A elaboração de um programa e uma arte delicada e quando um programa
está perfeito o professor programador poderá entrar em contato com um número
indefinido de estudantes individuais através de contingências íntimas de reforçamento.
Apesar da sua natureza individual que prossegue lenta e metodicamente, procurando
estar seguro de que cada ponto é compreendido antes de passar para o próximo. O
teste e revisão repetidos de um programa em estudantes individuais até que ele seja
bem sucedido em ensinar o que pretende, é uma característica da programação que.
com freqüência, falta completamente nos métodos tradicionais de ensino. Essas vanta
gens da instrução programada podem bem ser a base para elevar a qualidade dos
métodos mais convencionais de ensino. Quando há um programa apropriado para
ensinar os conceitos básicos, o professor fica l ivre para discutir pontos sutis, levar os
estudantes à solução de problemas criativos e para treinar as habilidades adquiridas
através da máquina num contexto algo mais relacionado com a vida. A programação
está ainda num estágio inicial para que possamos estimar com exatidâb o quão
radicalmente ela irá mudar nossas práticas educacionais. De qualquer modo, nosso
interesse atual não é este. Estamos interessados no programa como um veículo
experimental para a aquisição de conceitos.
É conveniente classificar o conteúdo verbal .que constitui um quadro em dois tipos
- 301 -
de proposições: regras e exemplos (Evans, Holme e Glaser, 1962). Uma regra pode ser
considerada como uma especificação geral ou definição de uma classe de SU, enquanto
um exemplo pode ser considerado como a ocorrência de um dos membros da classe de
SD. Uma instrução programada pode ser encarada como um arranjo de várias regras e
exemplos, onde algumas porções de cada regra ou exemplo são omitidas, sendo
necessário, então o comportamento por parte do aprendiz para completá-las. Deve
estar claro que uma apresentação de um subconjunto de exemplos associados com um?,
determinada regra é análoga à apresentação de um subconjunto de Ss individuais de
uma ampla classe de e o reforçamento de uma determinada resposta de identifi
cação, digamos, a palavra leite ou a resposta de apanhar o objeto singular.
Considere os quatro quadros de um programa para ensinar alguns conceitos de
imagem em poesia, vistos na Fig. 13-14. Antes destes quadros, os conceitos de
imagem, objeto e similitude foram ensinados através de exemplos. Os quadros 48, 49 e
50 são três exemplos de uma classe de SD que deve ser identificado como símile.
Note que cada quadro é arranjado de modo a permitir que as deixas contextuais
aumentem a probabilidade da resposta requerida. Os três quadros usados como S^s e
para o símile têm certas similaridades, mas também certas diferenças. Uma vez que o
Figura 13-14. Quatro quadros dc um programa delineado para ensinar conceitos
relativos à imagem na poesia ( cortesia de Susan Stitt).
48. Uma imagem que expressa uma similitude entre objetos de classes diferentes, mas
que não significa exatamente o que diz, é chamado um símile. A imagem “a
menina é como uma flor” é u m .......................................................................................
Resposta. Símile
49. Pelo fato de expressar uma similitude entre objetos de classes diferentes mas não
significar exatamente o que diz, a imagem “ a face do homem iluminou-se como o
sol” é um ...................................................................................................................... ..
Resposta. Símile.
50. Um símile não é introduzido apenas pela palavra como, mas pelas palavras ta!
qual, como se ou como quando. Assim, a imagem “o homem está vermelho tal
qual um pimentão” é um ...............................................................................................
Resposta. Símile.
51. Por outro lado, uma frase que expressa a identidade entre dois objeto mas não
significa exatamente o que diz, não é um símile. Assim, a imagem “seus olhos são
estrelas” (é/não é) um símile.
Resposta. Não é_____________ _________________________________________
programador deseja que o conceito de símile seja tão amplo quanto possível, as
contingências de reforçamento são estabelecidas na presença de uma grande variedade
de exemplos da classe de S^. O quadro 51, todavia, é um caso de SA . Na aquisição
de conceito em humanos e em animais, é importante apresentar situações onde não
haja membros da classe de e retirar o reforçamento da resposta ou, como neste
caso, reforçar uma resposta incompatível. O quadro 51 ajuda a estabelecer o que o
símile não é.
- 302 -
Outro exemplo de rormação de conceito é mostrado no quadro da Fig. 13-15.
Posteriormente, neste programa, o estudante encontrará figuras de outros organismos
com e sem seis pernas e com muitos outros aspectos que variam. Mas a palavra inseto
só terá deixas e será reforçada na presença de figuras de organismos com seis pemas.
Eventualmente, o conceito de inseto se generalizará para uma vasta classe de orga
nismos com seis pemas através desta história com um subconjunto dos membros.
Ainda outro exemplo no campo da análise comportamental é fornecido nos
quadros da Fig. 13-16. O conceito a ser adquirido é o de evento resposta. Note que os
quatros fornecem SDs e S ^ s para o conceito. Eventualmente, aparecerá num quadro
onde se pedirá ao aprendiz que induza a definição geral com base na sua história
passada com numerosos exemplos.
-3 0 3 -
Figura 13-16. Uma série de quadres delineados para estabelecer o conceito de evento-
resposta. As Rs corretas estão indicadas pelas letras pequenas à direita do quadro
(Mecliner, 1963).
1 . Seu nascimento não foi “um evento-resposta” para você. Você jogar seu chocalho
fora do seu berço foi “um evento-resposta” para você.
Marque as respostas abaixo que descrevem um evento-resposta para. a pessoa ou
animai nelas indicado (nota: você pode marcar qualquer número de sentenças).
2 . Quando você bate em alguém, o evento-resposta é seu. Quando outra pessoa lhe
bate, o evento-resposta não é seu.
Para cada sentença abaixo marque o quadrado se a sentença descrever um evento-
resposta para o organismo nela indicado.
a. □ Filipe corre depressa
b. □ Gregório foi atropelado.
c. □ Alice colou no exame.
d. n Maria foi pega colando.
e. n 0 canário perdeu todas as suas penas.
f- □ 0 cachorro pegou o doce no primeiro salto
3. Marque as proposiçoes que descrevem eventos-resposta para você.
a. □ Você resolveu um problema difícil dematemática a
b. □ Seu professor lhe deu uma boa nota.
c. □ Você é um dentista.
d. □ Você está estudand.o para ser um dentista. d
- 304-
diversidade e suas seqüências. Ào desenvolver alguns conceitos diierentes, ele pode
escolher um exemplo multidimensional concreto, apresentando-o sob vários pontos de
vista , ou pode usar vários exemplos mais simples, apresentando cada um sob o único
ponto de vista. Há pouca informação sistemática disponível a respeito de qualquer
destas variáveis, mas é como um meio experimental que a programação tem potenciais
importantes par elucidar relações fundamentais na aquisição de conceito.
13.9 AS CONSTÂNCIAS PERCEPTIVAS
A noção de uma “coisa” como uma entidade imutável está tão fortemente
arraigada que talvez seja uma surpresa que coisas tão primitivas como objetos possam
ser descritas como conceitos. Imagine que a face de um amigo não seja um único
estímulo visual. Algumas vezes, ele aparece na sombra, outras na claridade. Às vezes,
ele está sorrindo, às vezes franzindo as sobrancelhas. Algumas vezes, você o vê de
perfil, outras, de frente. Além disso, perfis e visões frontais são, por sua vez, uma
coleção de perfis e visões frontais, nenhum dos quais é, alguma vez, exatamente
repetido. Apesar do fato de que você nunca veja a mesma face duas vezes, você não
tem dificuldade para identificar seu amigo. Em linguagem técnica, seu amigo é uma
ampla classe de S^s e você responde similarmente a todos os membros.
Considere o objeto mostrado na Fig. 13-17. Todos os quatro desenhos represen
tam “ a mesma porta” , contudo, os vários padrões que atingem o olho e que constituem
as quatro situações que chamamos “porta” , são bastante diferentes. É claro que para
portas, ou qualquer outro objeto que possamos imaginar, o nosso conceito do deter
minado objeto não consiste de uma única situação, mas de uma ampla classe de
situações. Os exemplos que acabamos de dar são casos do que pode ser denominado
constância do objeto. Apesar das mudanças marcantes na situação, nós retemos uma
resposta constante na presença de todas as suas variantes.
Que tipo de conceito é representado pela constância do objeto? Tomados in
dividualmente, os quatro desenhos da Fig. 13-17 sugerem que o conceito de objeto é
disjuntivo, já que essas quatro situações parecem tão diferentes. Mas a Fig. 13-17 é
apenas uma amostra do conjunto infinito de situações que variam de aberta a fechada,
todas as quais controlam a resposta “porta”. E todas essas situações estão mutuamente
- = r
□
0 0 • • 1
- 305-
relacionadas pelo fato de que uma situação Aporta” pode ser continuamente trans
formada em outra. Tal série de transformações relaciona as situações de qualquer
objeto particular.
A constância do objeto é apenas uma classe do que é geralmente chamado de
constâncias perceptivas. Outro exemplo é mostrado através dos dois pedaços de carvão
colocados sobre o papel branco, na Fig. 13-18. Dizemos que o carvão é “preto” e o
papel é “branco” sem levar em consideração a intensidade absoluta de luz que apenas
ou o carvão ou o papel reflete. À sombra, o pedaço de carvão no painel à esquerda da
Fig. 13-18. reflete somente 1 millilambert de luz, enquanto que o mesmo pedaço de
carvão à luz do sol (painel à direita da Fig. 13-18) reflete 100 vezes mais luz. Ainda
assim, dizemos que o carvão é preto, embora ele agora reflita 10 vezes mais luz que
refletia o papel branco à sombra. A resposta à cor neutra (cinza) depende da
iluminação relativa do objeto com respeito ao seu fundo ou região imediatamente
adjacente. Assim, “preto” é um conceito já que é a resposta na presença de uma classe
ampla de S^s relacionados: objeto que reflete 1 unidade de luz, fundo que reflete 9
unidades de luz objeto que reflete 10 unidades de luz, fundo que reflete 90 unidades;
objeto que reflete 100, fundo que reflete 900; e assim por diante.
Um exemplo final é proporcionado pelo fenômeno conhecido como constância de
tamanho. À medida que uma pessoa caminha em sua direção, você não é capaz de
relatar que sua imagem visual está aumentando de tamanho. Contudo, à medida que
ela se aproxima, a imagem aumenta de tamanho na sua retina, de uma maneira
inversamente proporcional â sua distância de você. Dentro de limites você diz que ela
está do mesmo tamanho, independentemente do tamanho da imagem na sua retina.
Desse modo, o conceito de tamanho é dependente de uma classe de SD onde a regra
para inclusão na classe é uma função complexa do tamanho retínico do objeto mais os
valores de muitas outras variáveis visuais que variam com a distância de um objeto. A
Fig. 13-19 mostra que o conceito de tamanho constante não é controlado pelo
tamanho retínico constante. Os três cilindros da Fig. 13-19 são todos os mesmo
tamanho (meça-os) mas tendemos a classificá-los como progressivamente maiores da
esquerda para a direita devido às mudanças na perspectiva linear, uma das variáveis que
em geral, muda progressivamente com a distância.
Naturalmente, não é por acidente que as constancias de objeto, cor neutra e
tamanho se desenvolvem. Contingências de reforçamento estão frequentemente correla
cionadas com os “objetos” (um pássaro deve se manter fora de todas as situações que
- 306 -
Figura 13-19. Resposta ao tamanho quando determinada por variáveis de distância
(Gibson, 1950).
chamamos “gato”, se quiser viver muito), bem como as variáveis de estímulo com
posto que controlam a constância de cor acromática e a constância de tamanho.
Raramente, consideramos que> um objeto está mudando de cor ou tamanho quando
sua iluminação ou distância muda. Por outro lado, é conveniente classificar aquele
animal que está se movendo rapidamente em sua direção como “grande”, embora o
tamanho de sua imagem seja ainda muito pequeno. Nossos conceitos espelham-se nas
contingências de reforçamento da natureza, embora seja uma especulação interessante
- 307 -
saber se esses conceitos perceptivos são geralmente adquiridos na história passada de
cada indivíduo ou se, tendo sido bem adquiridos pelos seus ancestrais, são agora
uma parte permanente do seu eauioamento de resposta visual.
REFERENCIAS PARA O CAPITULO 13.
- 308 -
Kendler, H. H. Basic psychology. N ew York: Appbton-Century-Crofts,
1963.
Kendler, H. H ., and Vineberg, R. The acquisition of compound con
cepts as a function of previous training. / . exp. Psychol. , 1954, 48,
2 5 2 -2 5 8 .
Kimble, G. A ., and Garmezy, N. Principles of general psychology. (2nd
ed .) N ew York: Ronald Press, 1963.
Lysaught, J. P., and Williams, C. M . A guide to programmed instruction.
N ew York: Wiley, 1963.
Mechner, F. Science education and behavioral technology. New York:
Basic Systems, 1963.
Reitman, W. R. Cognition and thought: an information processing ap
proach. New York: Wiley, 1965.
Skinner, B. F. The science of learning and the art of teaching. Harvard
educ. Rev., 1954, 24, 8 6 -9 7 .
Skinner, B. F. Teaching machines. Science , 1 9 5 8 , 128, 9 6 9 -9 7 7 .
Skinner, B. F. Why we need teaching machines. Harvard educ. R e v .t
1 9 6 1 ,3 1 , 3 7 7 -3 9 8 .
Smoke, K. L. A n objective study o f concept formation. Psychol. Monogr.,
1932, 42, Whole N o. 191.
W elch, L. A behaviorist explanation of concept formation. / . genet.
P sych o l , 1 9 4 7 ,7 1 ,2 0 1 - 2 2 2 .
- 309 -
Capítulo 14 SOLUÇÃO DE PROBLEMA E INTELIGÊNCIA
- 311 -
lecidos para animais nos laboratórios de psicologia. Para um aluno de segundo ano
primário
25
-18
constitui um problema, mas um ano ou mais depois isto não será mais o caso.
Similarmente, você pode não achar que / e “^x dx seja problema, dependendo de se
você possui certos comportamentos usualmente ensinados nos textos do primeiro ano
de cálculo. No extremo de um continuum, podemos dizer que sabemos “ como acabar
com as guerras” — um problema desde que uma solução universal ainda não existe. Em
resumo, nenhuma classe de contingências, nem qualquer contingência em particular,
podem ser descritas como um problema até que saibamos que comportamento o organis
mo vai apresentar na presença daquela contingência. Tentemos, agora, descrever este
ponto de vista mais rigorosamente. Para isso, veremos que os conceitos sobre encadea-
mento introduzidos no Capítulo 12 são indispensáveis.
Numa cadeia de comportamento, um organismo emite operantes numa ordem se
qüencial. A ordem particular é controlada pelas conseqüências estabelecidas para cada
operante isolado. Para solucionar um problema de divisão, uma criança bem treinada
realiza a multiplicação, subtração, empréstimo, transporte, etc., numa certa seqüência
que depende do resultado de várias discriminações. Uma criança sem as habilidades
componentes não pode executar a cadeia requerida. Esta criança ilustra a possibilidade
de que, em qualquer situação determinada, pode não existir qualquer cadeia que
produzirá a situação associada com o reforçamento. Isto pode surgir de uma entre
duas maneiras relacionadas. (1) o organismo não adquiriu, no passado, uma parte ou
toda a cadeia necessária para conduzi- lo da situação presente, S^, para a situação
reforçadora, Sb , embora tal cadeia possa ser conhecida por outros organismos. (2) Não
existe qualquer cadeia conhecida cuja execução garanta a transformação de Sa em Sb .
Examinemos, agora, vários problemas representativos.
0 problema na caixa-quebra-cabeça revela certos aspectos interessantes da solução
de problema. Os gatos foram colocados na situação inicial, a caixa fechada, S \ . Alguns
comportamentos foram gerados inicialmente. Os gatos correram, miaram, colocaram
suas patas nas barras, arranharam as bordas dos orifícios maiores, olharam em várias
direções e assim sucessivamente. Muitos destes comportamentos representam operantes
generalizados de uma história passada de reforçamento em situaçõe similares. No
passado, quando colocados num espaço pequeno, os gatos, normalmente, escapavam
olhando ao redor do ambiente, aproximando-se de qualquer orifício, arranhando as
partes soltas do ambiente, e assim por diante. Alguns outros comportamentos, como
miar, estão indubitavelmente estabelecidos na estrutura do gato. Independentemente
de como foram fortalecidos, certos comportamentos, R i, R2, R 3 , R4 ..., surgem na
situação problema inicial. Além disso, embora esses comportamentos não sejam
aleatórios, eles não estão ainda arranjados na seqüência bem ordenada que é emitida
quando o gato, eventualmente, soluciona o problema. O repertório inicial do gato
consiste de um conjunto seletivo de comportamentos que ele traz para a situação e
com os quais ele opera nela. Eventualmente, uma dessas Rs pode ser bem sucedida em
abrir a tramela. Quando isto acontecer, o gato transformou a situação de porta
fechada em porta aberta.
- 312-
SA
R,
R2 S (porta aberta)
R 3 —» R (Sair pela —> Sg (fora da caixa)
R4 Porta)
Na nova situação, S(p0rta abertaV 0 Sat0 tem uma secluência de resposta bem estabele
cida predominante, sair pela poria aberta. Este problema simples ilustra vários aspectos
importantes de solução de problema em geral. (1) Um organismo leva um conjunto de
respostas R j, R2 , R 3 ... para a situação, ou devido à sua história passada com situações
similares ou devido à sua estrutura geneticamente determinada. (2) Essas Rs não são
igualmente prováveis de ocorrerem; algumas (arranhar as bordas de orifícios, miar), têm
maior força do que outras (explorar o teto da caixa; ficar de pé, parada). (3). Uma vez
que uma determinada resposta seja bem sucedida em transformar a situação numa fami
liar, uma seqüência bem estabelecida pode levar o animal à situação reforçadora, Sg.
Thorndike, assim como outros antes dele, referiu-se aos dois primeiros aspectos
descritos como responder por tentativa e erro. O animal emite (“tenta”) muitas
respostas na situação problema, a maioria delas consistindo de “erros”. Eventualmente,
a R “correta” ocorre, ao acaso, e o animal atinge o “sucesso”. Kohler (1925) criticou
- 313 -
esta caracterização da solução de problema. Ele argumentou que a situação de
Thorndike não era represencativa de problemas em geral. Os gatos, dizia Kohler, não
podiam, logo no início, observar a relação entre a tramela e a caixa aberta. Mas muitos
problemas reais, argumentou, permitem ao organismo observar mais aspectos e relações
na situação do que no caso dessses gatos. Assim, Kohler estabeleceu o seguinte
problema para os animais (Fig. 14-1). Uma banana foi colocada do lado de fora da
gaiola do macaco. Havia duas varas de bambu dentro da gaiola, mas nenhuma delas era
bastante comprida para alcançar a banana. Uma vara, todavia, tinha um diâmetro
menor e podia ser facilmente inserida em qualquer das pontas da outra vara com
pondo, assim, uma única vara, bastante comprida para alcançar a banana. Os
macacos de Kohler, quando colocados nesta situação, apresentavam, inicialmente,
comportamentos que haviam sido reforçados no passado. Eles estendiam uma ou outra
vara, movendo-as para frente e para trás em direção à banana. Depois de certa
quantidade de extinção, esta resposta enfraquecia. Neste ponto, alguns animais
sentavam-se calmamente durante um certo tempo, após o que, de repente, encaixavam
as duas varas e puxavam a banana.
Sultão, antes de tudo, agacha-se indiferentemente na caixa colocada um pouco
atrás da grade. Então, ele se levanta, pega as duas varas, senta-se novamente na
caixa e brinca descuidadamente com elas. Ao fazer isso, acontece de se encon
trar segurando uma vara em cada mão de modo que elas ficam em linha reta. Ele
empurra a mais fina em direção à abertura da mais grossa, pula corre em direção
às grades... e começa a puxar a banana em sua direção com as duas varas
encaixadas (Kohler, 1925, p. 27).
Kohler chamou esta solução súbita de insight e sugeriu que isto era uma propriedade
típica da solução de problema. Ele afirmava que Sultão e outros sujeitos resolviam o
problema porque a estrutura do problema tornava-se clara imediatamente e não porque
o comportamento de encaixar as duas varas fosse um operante que predominasse na
situação. Birch (1945) todavia, demonstrou que uma certa história passada é crítica
para solucionar este tipo de problema. Kohler não especificou com detalhes a história
passada de seus macacos.
Birch resolveu pesquisar se a manipulação anterior da vara era essencial. Pegou um
grupo de macacos que nunca haviam tido experiências com varas e estabeleceu-lhes
contingências de um problema idêntico. Ao contrário dos resultados de Kohler,
nenhum desses sujeitos foi capaz de solucionar o problema numa sessão de 30 min.
Birch, então, realizou várias sessões em que permitia que os macacos brincassem com
pequenas varas. Ele observou que os animais passavam, gradualmente, a usar as varas
como extensões de seus braços para cutucar, espreitar, revolver, cavoucar e outras
operações similares. Num segundo teste, todos os animais resolveram o problema das
duas varas em menos de meio minuto. A conclusão é inevitável. A manipulação prévia
das varas é essencial para a solução de um problema que requer isto como uma
habilidade componente; a estrutura lógica da situação não ajudará um organismo
que não possua quaisquer habilidades para utilizar esta estrutura.
A natureza encadeada dos comportamentos componentes que constituem a
solução de um problema nos ajuda a explicar a característica súbita das soluções
observadas por Kohler, e outros. Uma vez que o organismo tenha produzido uma
-3 1 4 -
situação que é uma deixa para uma seqüência bem estabelecida de corpporamento, o
problema termina. Uma vez que Sultão havia transformado aquelas duas varas
pequenas numa mais longa, o problema chegou a um fim, o que nos permite supor,
razoavelmente, que Sultão possuía uma história anterior de cutucar objetos com varas
de vários tamanhos.
14.2 QUEBRA-CABEÇAS
- 315-
Tabela 14-1
1 29 3 _ 20
2 21 127 3 100
3 14 163 25 99
4 18 43 10 5
5 9 42 6 21
6 20 59 4 31
7 23 49 3 20
8 15 39 3 18
9 28 76 3 25
10 18 48 4 22
11 14 36 8 6
-3 1 6 -
O sujeito amarrou o relé ao cordão e colocou-o em movimento, como um pêndulo.
Assim, ele poderia pegar o cordão em movimento, enquanto segurava o outro, e as
duas pontas podiam ser facilmente amarradas. Os sujeitos que tiveram uma sessão
anterior em que foram instruídos a usarem o relé
Figura 14-3. O problema dos dois cordões. Os dois cordões devem ser amarrados um
ao outro, embora estejam muito afastados para se segurar um enquanto se pega o
outro.
Figura 14-4. Uma solução para o problema dos cinco cordões. O Sujeito amarrou o
relé a um cordão e colocou em movimento.
- 317 -
(A) (B) (C) (D) (E)
L L _
LLLI
LL! LU ___U LLUU II II
LI LU LULU U LU
Figura 14-5. Os problemas dos palitos de fósforo de Katona (1940). Em A - C mova
três palitos e produza uma nova figura que tenha um quadrado a menos que a
figura original. Em D, produza uma nova figura com apenas cinco quadrados, movendo
tres palitos. Em E, mova dois palitos e produza uma figura com quatro quadrados.
(Ver as soluções no apêndice deste capítulo)’
-3 1 8 -
cada combinação até você ser bem sucedido. Esta, provavelmente, é a noção de
comportamento de tentativa e erro que Kohler e outros psicólogos atribuíram a
Thorndike ao criticarem sua análise da solução de problema pela falta dos elementus
para uma solução estruturada. Contudo, Thorndike nunca relatou que os gatos se
empenhavam em todos os comportamentos possíveis em todas as seqüências possíveis.
De fato, os gatos restringiam sua atenção aos orifícios e partes moveis da caixa
quebra-cabeça, apresentando um conjunto altamente seletivo de comportamentos. Mas
um problema de um cadeado de segredo ilustra um responder mais puro por tentativa
e erro. Assim, um cadeado de 50 números, que se abre quando a seqüência correta de
3 números é girada, exigirá 50^/2 (= 62,500) seqüências a serem tentadas, em média,
antes de se abrir. Se cada seqüência dura 6 seg, o tempo médio para abrir este cadeado
será de 4 dias detrabalho contínuo. É óbvio porque tal cadeado serve como uma
proteção, mesmo embora quase todas as pessoas tenham uma cadeia algorítmica
apropriada forte que, eventualmente, poderia abrí-lo.
Uma estrutura em árvore é uma maneira conveniente de representar as seqüências
de comportamento nesse tipo de problema (Fig. 14-7),. Os círculos ou nódulos numa
Situação original, SA
- 319 -
Muitos outros problemas podem ser representados na torma de uma árvore de
seqüências operantes e suas situações resultantes. Se um simples cadeado de 5 números
pode levar a tantas ramificações possíveis (125), como será que um indivíduo sempre
resolve problemas realmente difíceis tal como descobrir uma boa jogada no xadrez,
integrar uma função, provar um teorema da lógica? As situações possíveis que
resultam de apenas doze tipos distintos de respostas conduzidos a um nível de
seqüência igual a 12 é 1212 Evidentemente, a tentativa e erro simplesmente não
seriam suficientes para solucionar um problema de qualquer dificuldade.
Suponha que houvesse alguma maneira da pessoa que soluciona o problema limitar
suas operações alternativas. Isto é, suponha que se dissesse ao indivíduo .que o primeiro
número no tipo de cadeado da Fig. 14.6 comumente é 3. Em geral, os problemas que
são solúveis têm associadas a eles várias regras ou heurísticas que permitem que o
organismo restrinja sua topografia de resposta a certos grupos de operações. Essas
heurísticas são geralmente caracterizadas como regras práticas que ajudam a limitar a
seqüência de comportamento. Ao contrário de um algoritmo, seu emprego não garante
uma solução, mas frequentemente ajudam a encontrá-la. Podemos supor que os gatos
de Thorndike exibissem tais heurísticas quando limitavam sua atenção aos orifícios e
partes móveis da caixa quebra-cabeça. No passado, estas respostas compensavam com
maior freqüência do que outros comportamentos. Uma heurística possível para o
problema do cadeado de segredo pode ser a observação de que, algumas vezes, as
pessoas fecham um cadeado e deixam o último número da combinação na posição.
Isto não é sempre verdadeiro, mas pode servir como uma heurística útil. Nos pro
blemas complexos, é conveniente diagnosticar se está ocorrendo um retrocesso ou um
progresso em direção à solução. Isto é, se se está “ ficando quente” . À medida que
retrocedemos de é frequentemente possível interpretarmos as situações interme
diárias (nódulos) como mais próximas ou mais distantes da situação terminal, Sg-
Suponha que coloquemos um homem com os olhos vendados numa sala grande e
digamos-lhe que sua tarefa é atirar um dardo na mosca çlo alvo. A localização da caixa
de dardos e o alvo não lhe é conhecida. Permitimos ao nosso sujeito duas respostas,
caminhar e atirar os dardos. Concordamos em avisá-lo, todavia, depois de cada passo
que ele dá, se ou não está chegando mais perto da caixa de dardos. Além disso, uma
vez que ele chegue até a caixa e comece a atirar os dardos, avisá-lo-emos se os seus
lançamentos estão próximos ou distantes do alvo. Isto é uma versão do brinquedo de
chicote-queimado (“ você está ficando mais quente”) e se o nosso alvo não fôr muito
pequeno, o nosso sujeito solucionará este problema rapidamente. Mas, é óbvio que um
homem que não receba os S^s progressivos (“ avisos”) ao longo do caminho poderá
nunca solucionar o problema.
Em geral, uma análise da solução de problema tem a forma de (1) notar as
heurísticas apropriadas que restringem a topografia da resposta a serem usadas e as
situações que valem a pena ser exploradas; (2 ) notar as discriminações intra-problema
importantes que devem ser feitas para que se possa detectar se uma resposta colocou o
organismo mais perto ou mais longe da situação terminal.
Se estes são realmente os componentes críticos do comportamento de solução de
problema, deve ser possível incorporá-los na estrutura de uma máquina que poderia,
então, resolver problemas semelhantes. O comportamento desta máquina pode ser de
interesse por várias razões. Primeiro, ela poderia verificar a suficiência do conjunto de
heurísticas e discriminações que podemos supor como necessárias para qualquer con-
- 320 -
junto determinado de problemas. Segundo, variando as jcaractensticas da maquina
poderemos descobrir um meio de desenvolver um solucionador de problemas mais
eficiente c, então, aplicar essas descobertas à prática educacional. Devido à sua rapidez
de operação (25.000 ou mais operações por seg), o computador digital é ideal para
explorar esses modelos de solução de problemas. As representações das situações
podem ser programadas, várias operações correspondentes às respostas do organismo
podem ser simuladas e uma estratégia para transformar sucessivamente uma situação
em outra pode ser construída na máquina. Newell e Simon (1963) descreveram um
programa dc computador chamado General Problem Solver (GPS) para tratar com
certos quebra-cabeças e problemas. O programa emprega uma variedade de estratégias
de procura heurística e testes de discriminação para avaliar se as situações recém-
criadas representam um progresso em direção à situação terminal, S b -
Um dos seus problemas é o domínio da lógica simbólica. Pode-se pedir à máquina
que prove que (Rl>\P). ( ^ .R ^ Q ) é equivalente aO; ,(^ Q.P). Dá-se à máquina a
mesma informação que um universitário possui, a saber, uma dúzia de regras para
transformar os símbolos através da adição de termos, supressão de termos, mudanças
das conexões, dos sinais, dos grupos, e assim por diante. O programa que torna o
computador um solucionador de problemas proporciona-lhe a habilidade de aplicar
essas regras (responder) e discriminar as diferenças entre as situações que ela produz. E
o mais importante, talvez, o programa proporciona-lhe um número de heurísticas para
dirigir sua procura através da árvore do problema. Uma heurística conveniente restringe
o GPS de tentar transformar uma situação (nódulo) se esta fòr mais difícil de
transformar do que uma situação anterior (nódulo). O GPS constrói os seus próprios
critérios de dificuldade de transformação. O GPS espera que as diferenças entre as suas
situações sucessivamente geradas, S j, S 2 , S3 e a situação terminal, S[$, diminua á
medida que prossegue trabalhando através de suas séries de transformações. Se isto não
acontecer, o GPS volta a um nível superior (em direção à S \ ) e percorre uma nova
ramificação. Outra heurística força o GPS a abandonar uma ramificação quando esta
vai abaixo dc uma determinada profundidade (a diminuição vertical na Fig. 14-7) e a
situação Sb ainda não apareceu. O GPS parece resolver seus problemas tão bem quanto
estudantes universitários e, talvez mais importante, frequentemente incorre nos
mesmos tipos de erro. Outros programas para solucionar demonstrações geométricas,
jogar xadrez c damas, integrar c estabilizar linha de montagem tem sido projetados,
todos empregando as idéias de estratégias de procura dc heurística.
14.4 IDENTIFICAÇÃO DO CONCEITO
- 321 -
conceito dc fc‘objeto voador” através de uma história de discriminação com lais
objetos.Agora, sua tarefa é simplesmente apresentar o comportamento verbal ad
quirido, dando o nome k4objeto voador” . Em geral, a tarefa do sujeito na identificação
dc conceito consiste cm examinar um número de situações e induzir o conceito delas
(isto ó, propor uma regra geral para a classe de S^). Ele é informado, para cada
situação, se esta é ou não um caso da classe de desconhecida. Nesta tarefa,
tipicamente o sujeito emprega estratégias, ou seqüências sistemãticas de respostas,
que levam à identificação correta.
\j ê J
OO OO □ □ 5 ± l
o o o ooo □□□
□
□ [
o o
FIH
o
I ° I Dl FI ■Ti 2 J E I a JI
□□ i
llllll
01
o o o o
fp<x>l l 0 0 ° l !□□□ l - l Ml
Figura 14-8. Um conjunto de cartões usados para estudar a identif icação de conceito.
As formas variam em (1) número, (2) forma, (3) cor, e (4) número de linhas
periféricas (Bruner, Goodnow e Austin, 1956).
- 322-
30V2p (+) o exemplo inicial positivo dado
20V2p (+) primeira escolha: elimine “três” figuras como um
elemento relevante.
3 QVerde2 p (—) segunda escolha: retenha o “vermelho” como um
elemento relevante.
3±V2p (—) terceira escolha: retenha o “circulo” como um
elemento relevante.
30Vlp (+) quarta escolha: elimine “duas linhas periféricas”
como um elemento relevante.
Logo: o conceito é “ círculos vermelhos” .
Bruner, Goodnow e Austin demonstraram que um número de variáveis, tal como o
tipo do conceito a ser identificado, a maneira em que os 81 cartões eram expostos e o
número de exemplos que se permitia aos sujeitos escolherem, afetava o tipo de
estratégia sistemática empregada.
14.5 A MENSURAÇÃO DE HABILIDADES PARA SOLUCIONAR PROBLEMA:
TESTES DE INTELIGÊNCIA
Talvez, nenhuma palavra seja tão mística em toda a psicologia quanto “inteli
gência” . É uma palavra que todos empregam mas dificilmente definem. Desde 1905, os
psicólogos mantêm a curiosa “ posição de preparar e defender os testes de inteligência
e, então, negar sua responsabilidade por eles, dizendo que “ ninguém sabe o que a
palavra realmente significa ” (Wechsler, 1958). Veremos que a solução de problema
proporciona um veículo conveniente para tratar o tópico inteligência. Em todos os
testes que se propõem a medir a inteligência, veremos apenas uma série de problemas
proposta a um sujeito e várias medidas do seu desempenho registradas.
A idéia de um teste de inteligência, ou como preferirmos chamá-lo, um teste de
solução de problçma, suigiu originalmente de considerações puramente práticas. Em
1904, o psicólogo francês Alfred Binet foi encarregado de preparar um teste que
apontasse aquelas crianças cujas deficiências em solucionar problemas tornava im
provável que elas pudessem tirar proveito da instrução regular da escola. O testes
resultante de Binet era uma série de problemas com gravuras, blocos de madeira,
tabuleiros, etc., próprios para serem administrados a uma criança de cada vez. Este foi
o primeiro teste de inteligência que obteve sucesso. Durante a Primeira Guerra Mundial,
surgiu uma necessidade premente nos Estados Unidos de avaliar as habilidades para
solucionar problemas de vários milhões de convocados o mais rápido possível. Testes
de lápis e papel que poderiam ser administrados, simultaneamente, a um grupo de
recrutas foram desenvolvidos para suprir essa necessidade e foram aplicados na seleção
de homens para várias tarefas. Com o tempo, estes testes de grupo passaram a ser
universalmente empregados. Muitas escolas, atualmente, usam seus resultados para
selecionar estudantes. Universidades e escolas de pós-graduação confiam enormemente
nos seus escores para decisões sobre admissão. Nossa preocupação, todavia, não é com
a aplicação prática de tais testes. Desejamos, em vez disso, averiguar certas con
tribuições que os testes de inteligência têm fornecido à nossa análise dos compor
tamentos humanos de solucionar problema.
Qual é a natureza dos problemas usados nos testes de “inteligência”? Não há
melhor maneira de descrevê-los do que através de exemplo. No teste típico, aparece
um número de subtestes destinados a avaliar várias habilidades para solucionar
- 323-
Se X vem antes
1 i L
□ □ ffl H B ffl
XL
esta para Assim como esta para.
Figura 14-9. Amostras de itens do tipo usado nos testes grupais de lápis e papel para
habilidades dc solucionar problemas (Kimble e (.arme/y, 1963 ).
- 324-
escores do grupo, podemos comparar os escore^ de qualquer indivíduo com aqueles
dos outros no grupo. Um aspecto interessante ^destes escores de teste é que eles se
apresentam aproximadamente com uma distribuição normal.
Idade (anos)
Quocientes de inteligência
- 326-
Percentual Ver- Numé- Abs- Fspa- Mecá- 1 scri- Sole- Scntcn-
bal rica trata ciai | nica ta tração ças
1 1 1 h 1111111
90
75
60
50
40
25 ■
10
17 60 «0 76 91 55 15 16
Percentil
- 327 -
respondentes; que o reforçamento está correlacionado com a ocorrência de um operan
te especificado. 0 sentido dado ao te mio foi o de relação ou dependência. A
contração pupilar está estritamente relacionada à (depende de) (lashes de luz; a
liberação de alimento está estritamente relacionada ao (depende de) bicar a chave. Em
geral, quando uma variável é dependente de outra, pode-se dizer que ela está correla
cionada com esta; o contrário, como veremos, não é necessariamente verdadeiro. Na
descrição mais completa de relações ou correlações particulares entre duas variáveis,
somos, tipicamente, levados à representação gráfica. As correlações que constituem as
leis do reflexo são descritas pelas funções que relacionam as propriedades do eliciador
às propriedades do respondente. As correlações que constituem as leis do fortaleci
mento operante tomam a forma de uma curva da taxa de resposta em função do
tempo.
Quando falamos de duas variáveis que são correlacionadas, é importante separar as
noções de como e quanto elas estão correlacionadas. Perguntar sobre como duas
variáveis estão correlacionadas é indagar sobre a forma da relação entre elas. A medida
em que uma variável aumenta, a outra aumenta, diminui, ou permanece inalterada? A
relação é melhor representada por uma linha reta, uma curva simples ou uma curva
complexa com depressões e picos? As páginas anteriores podem ser consultadas, pois
contêm amostras de uma larga variedade de formas.
Perguntar sobre o quanto duas variáveis estão correlacionadas é indagar sobre a
precisão com que somos capazes de predizer o valor de uma delas sabendo o valor da
outra. A resposta ao “quanto” é independente da resposta ao “como” . A forma de
relação poderia ser linear, curvilínea ou qualquer outra e, mesmo assim, a variabilidade
na medida poderia ser tão grande que pouco mais que uma predição grosseira poderia
ser efetuada. O contraste entre uma forma altamente definida e um grau baixo de
correlação eslá ilustrado nos dados hipotéticos da Fig. 14-13. Nove medidas de U
aparecem para cada valor de X na Fig. 14-13. Os valores médios dos Ys estão
conectados por uma linha reta. F^ evidente que X está diretamente relacionado a Y e a
forma da relação é indiscutivelmente linear. 0 grau de correlação é, todavia, baixo.
Onde o valor de X é 2, por exemplo, os valores de Y variam de menos de 1 a mais do
que 3. Fm geral, a previsão de Y a partir de X, na Fig. 14-13 é deficiente. Para
melhorar o grau de correlação na Fig. 14-13, os valores de Y par,, qualquer valor de X
deveriam estar mais próximos. Isto ê, os valores de Y teriam que ser muito menos
variáveis.
Nas várias relações gráficas, ou correlações, descritas nas páginas anteriores, a
variável no eixo horizontal é tipicamente uma variável independente (medida e mani
pulada), enquanto a variável no eixo vertical é tipicamente uma variável dependente
(medida, mas não diretamente manipulada). Ao tratar estas relações funcionais, dirigi
mos nossa atenção principalmente para a forma das correlações isto é, “ como” as
variáveis estão relacionadas. 0 grau de correlação, isto é, a habilidade preditiva ou o
“ quanto” as variaveis estão relacionadas., foi considerado ser alto devido ao controle
experimental cuidadoso, dispositivos precisos de mensuração, e assim por diante.
Algumas vezes, acontece que não há quaisquer manipulações experimentais dispo
níveis para se determinar como uma variável é influenciada por mudanças sistemáticas em
outra. Nesse caso, podemos ser forçados a basear-nos nas relações entre duas variáveis
dependentes. O grau de correlação entre as variáveis nestas relações entre duas variáveis
dependentes não pode ser tomado como certo. Nenhuma das variáveis está
328
X
Figura 14-1 3. Relação linear hipotética entre duas variáveis.
329
Coeficientes intermediámos representam graus intermediários de previsibilidade. A Fig.
14-14 indica graficamente os tipos de íelações que estão associadas aos vários valores
do coeficiente de correlação. Nosso X e Y poderiam ser quaisquer duas variáveis
dependentes relacionadas: por exemplo, escore no teste de lápis e papel (X) versus
realização no trabalho (Y ), ou altura (X) versus peso (Y).
Figura 14-14.
- 330 -
de um determinado indivíduo. O requisito confiabilidade é, com eteito, uma neces
sidade para um alto grau de correiação entre os resultados do teste em ocasiões
diferentes. Dada uma única medida, devemos ser capazes de predizer a próxima: ela
deverá ser aproximadamente a mesma. A confiabilidade depende, parcialmente, das
condições constantes de medida e, parcialmente, do próprio ato de medir que afeta
desprezívelmente o que está sendo medido. A confiabilidade de um teste de solucionar
problema é geralmente mais baixa do que a de uma régua porque muitas operações
podem facilmente ocorrer entre as medidas, m udando o desempenho de solução de
problema do indivíduo. Por exemplo, práticas demasiadas em vários problemas afetará
a concordância das medidas repetidas de 01. Além disso, o instrumento de medida
afeta dc algum modo, o que está sendo medido: a aplicação repetida de testes de QI
pode afetar os e s c o r e s - o sujeito torna-se “versado em teste” .
Um segundo requerimento imposto às medidas é que elas sejam úteis a qualquer
objetivo para o qual são feitas. A utilidade, no contexto de medida, é chamada
v a lid a d e . Se temos um piano na rua e queremos estar certos, antes de carregá-lo por
très lances dc escada, que ele passará através de uma certa porta, será melhor medir o
seu lado mais largo. Comparando esta medida com as dimensões da porta, seremos
capazes dc predizer se podemos entrar com o piano. Poderíamos fazer muitas outras
medidas do piano - poderíamos determinar o seu valor na praça ou pesá-lo - mas
nenhuma dessas medidas seria válida para os nossos objetivos presentes. Bias não
seriam convenientes para aquilo que pretendíamos fazer, no m omento, com o piano.
Segue-se, portanto, que elas não, seriam medidas válidas para o “ passar atlavés da
porta’1.
- 331 -
entre seus escores e o desempenho, no trabalho ou na sala de aula, pa solucionar
problema. Quanto mais alto o grau de correlação, maior a validade (utilidachdo escore
do lápis e papel.
- 332 -
Bruner, J. S., Goodnow, Jacqueline J., and Austin, G. A. A study of
thinking. New Y ork: Wiley, 1956.
Cronbach, L. J. Educational psychology. New York: Harcourt, Brace
and World, 1963.
Hebb, D. O. A textbook of psychology. Philadelphia: Saunders, 1958.
Katona, G. Organizing and memorizing: studies in the psychology of
learning and teaching. New York: Columbia Univer. Press, 1940.
Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts,
1963.
Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd
ed.) New York: Ronald, 1963.
Kohler, W. The mentality of apes. New York: H arcourt, Brace, 1925.
Luchins, A. S. Mechanization in problem solving: The effect of Einstel-
lung. Psychol. Monogr., 1942, 54, No. 248.
Newell, A., and Simon, H. GPS, a program that simulates human thought.
In E. A. Feigenbaum and J. Feldman (E d s.), Computers and
thought, New York: McGraw-Hill, 1963, pp. 279-293.
Thurstone, L. L. Testing intelligence and aptitudes. Hygeia, 1945, 53,
32-36.
Wechsler, D. The measurement and appraisal of adult intelligence, Balti
m ore: Williams and Wilkins, 1958.
- 333-
QUINTA PARTE
DINÂMICA DO REFORÇAMENTO
15. MOTIVAÇÃO I
16. MOTIVAÇÃO II
- 337-
extensivamente por um gráfico em que as unidades de força (a variável independente)
são representadas em função das unidades de distensão (a variável dependente).
Podemos, se desejarmos, considerar a causa de qualquer distensão particular como
sendo a força particular que atua no corpo. Mas, ao chamar a força de causa da
distensão, não acrescentamos qualquer informação adicional à própria relação fun
cional. De fato, enquanto a lei descreve a forma exata da relação para inúmeras forças
e distensões, a designação de causa é limitada à proposição lógica - se uma força, então
a distensão.
Na relação
Aquecer a água até 100°C—» água ferve,
a aplicação de calor pode ser considerada como causa da ebulição. Mas se persistirmos
em perguntar “ por que” a água ferve quando suficientemente aquecida, estaremos nos
referindo a uma outra relação funcional entre a pressão do vapor da água e a
temperatura. Exatamente a 100°, segundo nos dizem, a pressão de vapor da a'gua é
igual à da atmosfera. Isto pode ou não satisfazer nossa curiosidade sobre a ebulição da
água mas, em qualquer caso, a forma das respostas que obteremos para qualquer
“ porque” a mais será a mesma - mais relações funcionais.
As relações são igualmente importantes para o processo explanatório na ciência
biológica. O acasalamento de moscas de fruta, em que macho e fêmea têm olhos
brancos, gera invariavelmente filhos de olhos brancos.
Casal de pais de olhos brancos —> prole de olhos brancos.
Existe uma relação funcional entre a cor dos olhos dos pais e a cor dos olhos dos
filhos.
Todas essas relações funcionais revelam uma lógica comum. Se considerarmos a
variável antecedente nessas relações como x e a conseqüente que é produzida como y
sua lógica parece ser:
Se x, então y
e seu corolário
Se não y, então não x.
Assim, se uma força (x) é aplicada, então observaremos distensão (y). Mas, se
nenhuma distensão foi observada (não y), então a força não deve ter sido aplicada
(não x). Similarmente, se a temperatura da água sobe a 100 ° (x) então a água ferve
(y). Além disso, se a água não está fervendo (não y), então a temperatura deve estar
abaixo de 100° (não x). Finalmente, se ambos os pais têm olhos brancos (x) então
todos os filhos terão olhos brancos (y). Mas, se os filhos não tem olhos brancos (não
y) então os pais não poderiam ter, ambos, olhos brancos (não x).
Não devemos ficar desapontados ao aprender que as leis cientificas dão uma
representação exata da natureza somente quando certas condições são alcançadas. As
leis científicas se mantêm num'contexto, algumas vezes amplo, algumas vezes estreito,
dependendo da generalidade da relação particular; mas nenhuma lei científica é
verdadeira sob todas as condições. Além do limite de elasticidade, a lei de Hooke falha
e a distensão não é mais proporcional à força aplicada. A menos que certas variáveis
tais como a pressão atmosférica e a pureza da água sejam mantidas constantes, a água
- 338-
nao ferve a 100° A irradiação da mosca de fruta complica as relações de heredita
riedade.
Nas leis descritas, os termos x ey das relações funcionais são conceitos baseados
em quantidades observáveis. A intimidade pela qual tais conceitos estão ligados a
observáveis é a razão porque tais leis são chamadas empíricas. Podemos observar t
medir eventos que são conceituados como forças e distensões de corpos, temperatura e
estados da água, reprodução sexual e cor dos olhos das moscas de frutas. Os tipos de
explicação proporcionados por leis empíricas devem ser contrastados com explicações
pré-científicas. Antes da descoberta das leis que relacionam a atividade de micro
organismos à doença, esta era frequentemente atribuída à demônios alojados no corpo.
Por muito tempo, acreditou-se que o comportamento animal e humano era devido às
almas e espíritos animais. Nessas explicações pré-científicas a doença e o compor
tamento eram relacionados a eventos hipotéticos (demônios e almas), que eram livres
para assumir quase toda propriedade que o teorista lhes desejava impor. A falta de
restrições sobre a natureza hipotética desses conceitos tornou possível que eles, em
princípio, explicassem tudo. Mesmo assim, sua imunidade à não-confirmação por
qualquer procedimento colocou-os na posição paradoxal de, na verdade, nada ex
plicarem.
Em contraste com o vazio de tais explicações fictícias, a relação funcional da
ciência possui habilidades poderosas para a predição, interpretação e controle da
natureza. Quando existe uma lei funcional entre x e y , se soubermos o valor de x
podemos predizer o valor de y. Tendo a lei à mão, sempre que suspeitarmos que x e y
estão agindo no mundo cotidiano, estamos em condições de interpretar eventos reais
fora do laboratório. Finalmente, se pudermos manipular x como desejarmos, então
temos os meios de controlar y como desejarmos. No modelo da relação funcional,
temos o poder e a versatilidade do empreendimento científico revelados de um modo
surpreendente.
15.2 CAUSAS FICTÍCIAS DO COMPORTAMENTO
Quando examinamos as causas tradicionais do comportamento notamos que três
classes principais de causas fictícias dominaram o campo.
Numa delas, o comportamento é explicado por referência a eventos observáveis
que são fortuitamente correlacionados com ele, tal como a posição dos planetas no
nascimento, a direção das linhas na palma da mão, a proeminência relativa de várias
protuberâncias no crânio. Embora tanto o comportamento quanto o “ agente causai”
sejam observáveis, qualquer relação entre eles não é sistemática e, assim, qualifica-se
como “ acidental” em vez de “regular” .
Na segunda, o comportamento é frequentemente atribuído a eventos supostamente
localizados no sistema nervoso central (cérebro e medula). Quando dizemos que um
homem é esperto porque tem “ cérebro” , que não pode trabalhar porque seus nervos
estão esgotados, ou que precisa fazer um exame da cabeça quando age estranhamente,
estamos invocando eventos causais aparentemente localizados dentro da estrutura
nervosa. Na prática, todavia, raramente se faz a observação real desses eventos. Nestes
exemplos, o sistema nervoso existe apenas como um repositório para explicações
fictícias do comportamento. As propriedades das causas hipotéticas são especificadas
apenas a grosso modo e nenhuma relação específica é observada ou teorizada entre
elas e o comportamento observado.
- 339 -
Na terceira, o comportamento é comumentc “explicado” por processos mentais
ii*ternos hipotéticos. Diz-se que fechamos uma porta porque a “ queremos” fechada,
que assobiamos uma melodia porque temos um “ ímpeto” para assobiar, lemos um
livro porque “ sentimos vontade” de lê-lo. Pelo fato de tais proposições parecerem tão
naturais e inofensivas, é difícil notarmos que elas implicam numa forma de causa e
efeito que difere marcaritemente das leis da seção 15-1. Contudo, em cada “vontade” ,
ímpeto” ou “ sentimento” interno não observável está sutilmente designado o status
de uma causa de algum comportamento. Aqui, novamente, estas “ causas” não possuem
quaisquer propriedades independentes que possam ser relacionadas ou pela teoria ou
pela observação, ao comportamento real a ser explicado. O “ ímpeto” e a “vontade”
são fictícios porque são inferidos inteiramente do comportamento que se propõem a
explicar.
O surgimento de uma psicologia científica é, em grande parte, uma mudança de
causas fictícias do comportamento para causas funcionais. Basta que examinemos os
vários procedimentos e processos dos capítulos anteriores para encontrar várias dessas
relações funcionais. Como um prelúdio para a análise dos fenômenos de motivação,
será útil faz.cr uma revisão desses paradigmas comportamentais familiares dc modo a
enfatizar como seus procedimentos constituem uma classe importante dc causas com
portamentais.
- 340 -
comp ort amen tais são condicionais a uma certa história de condicionamento e extinção.
Alguns casos gerais estão resumidos na Tabela 15-1, dc modo a incluir os paradigmas
operantes dos capítulos anteriores. Note que cada caso pode ser reduzido a uma
combinação de apenas dois ingredientes: condicionamento e extinção. A variedade de
comportamentos que podem ser adquiridos e mantidos através dessas operações, e a
complexidade dos controles ambientais sobre o comportamento que a sua correlaçãc
com estímulos pode induzir, atestam a potência notável dessas duas operações opostas.
Tabela 15-1
SD
3. Uma história passada R -± , SD controla a ocorrência de
com o procedimento de
R, e toma-se um reforçador
discriminação S*
R -h
R ^ S + Ry -/-> R x-b
4. O comportamento (R^) r 2-> r 2-» 5 + R2-b
deve sua existência a uma Uma nova unidade de com
história prévia de refor- portamento é adicionada ao
ç mento de seus ancestrais s+ R.,
repertório
ÜLn*
relacionados
(Estágios sucessivos no tem
po -* )
- 341 -
15.4 MOTIVOS E REFORÇADORES
Apesar de todo o seu poder, os procedimentos da Tabela 15-1 são inúteis a menos
que as conseqüências ambientais que eles proporcionam ao comportamento sejam do
tipo especial que denominamos reforçadores. Nas discussões anteriores, tomamos como
seguro o poder reforçador de eventos tais como alimento e água, adiando até agora
uma análise das variáveis que modulam suas propriedades reforçadoras. É a elaboração
dessas variáveis que constitui o campo da motivação.
Podemos questionar, de início, o que essa definição de motivação tem em comum
com as concepções mais clássicas de motivação como o estudo de necessidades,
vontades, aspirações, interesses, desejos, impulsos e outras energias ou motivos do
comportamento. Para o presente, notaremos apenas que estas necessidades e desejos e
outros motivos parecem estar intimamente relacionados ao conceito de reforçadores.
Quarido se diz que um organismo “necessita” de alimento ou água, a inferência de
necessidade é usualmente feita a partir da observação de que é provável que um
organismo, que tenha estado sem alimento ou água por um período, coma e beba.
Diz-se que uma pessoa “ deseja” beber se ela pede água ou que, de outra forma, se
empenha num comportamento que tenha anteriormente produzido água. As necessi
dades e desejos referem-se ao fato de que, devido a um periodo de sua ausência,
alimento e água tornaram-se reforçadores.
Fazemos uma restrição à nossa análise experimental de motivação identificando
como seu domínio a análise dos reforçadores primários apenas. A restrição serve para
excluir aqueles reforçadores cujo poder reforçador depende de uma história passada de
condicionamento, em particular, do paradigma de discriminação No linguajar comum,
naturalmente, os motivos não são sutilmente distinguidos na base de se eles se referem
a reforçadores primários ou secundários. De fato, um motivo pode referir-se a quase
todos os “ porquês” do comportamento. Uma necessidade de superar os outros, um
desejo dc atenção e um desejo de possuir um automóvel caro ou status social podem
todos qualificar-se como motivos legítimos. Não obstante o linguajar comum, as leis
que governam tais motivos são aquelas que governam os reforçadores adquiridos.
Consequentemente, tais motivos adquiridos são mais apropriadamente tratados como
fenômenos de condicionamento. O dinheiro, um bom exemplo de um tal motivo, é
satisfatoriamente descrito como um reforçador positivo generalizado adquirido. Sua
significância reforçadora depende de sua história ou paradigma de discriminação onde
sua presença estabeleceu a ocasião para Rs que, eventualmente, produziam refor
çadores primários. Atenção; necessidade de poder, afiliação, realização; competição e
muitos outros motivos sociais parecem se adequar ao paradigma de reforçamento
secundário descrito no Capítulo 11. Logo, teremos poucas novidades para adicionar a
sua análise neste capítulo.
O problema dc como estudar os motivos adquiridos foi solucionado no Capítulo
1 1 , através da formulação de um conjunto de princípios para converter qualquer
situação de estímulo arbitrária num reforçador condicionado. Ao estudar os re
forçadores primários, preocupar-nos-emos com a elaboração de um número de variáveis
que se mostram intimamente relacionadas ao aumento e diminuição no valor de tais
reforçadores. Como uma ajuda para ampliar o conceito de reforçamento primário do
estudante, apresentaremos, nas discussões que se seguem, uma variedade de re
forçadores primários diferentes.
- 342 -
15.5 OPERAÇÕES DE IMPULSO
Uma operação fundamental que afeta o poder ou valor reforçador de todos os»
reforçadores primários positivos conhecidos é o procedimento de privar o organismo
do reforçador por um período de tempo. Numa primeira aproximação, digamos que o
valor reforçador de um reforçador aumenta diretamente à medida que aumenta a
duração da privação.
Nas discussões anteriores sobre os efeitos do condicionamento (Pavloviano e
operante) partimos do princípio que as variáveis de privação foram reguladas para dar
um valor reforçador moderado aos estímulos usados como reforçadores. Embora
trabalhando por trás do cenário até agora, as variáveis de privação têm, de fato, um
papel central em tomar possíveis os processos comportamentais que estudamos. A
existência deste novo grupo de variáveis, do qual o comportamento depende tão
criticamente, tem duas implicações para análise comportamental que nãopodemos ignorar.
(1) O comportamento é multi-determinado. Um cavalo pode não beber a água que lhe
é apresentada porque não foi privado de água, ou porque nunca adquiriu o compor
tamento de beber água no cocho. Mas, se ele bebe, então deve ser porque possui o
comportamento necessário e está privado de água. Nem privação, nem o con
dicionamento passado apenas, serão suficientes para causar padrões de comportamento.
(2) Uma operação de privação aumenta o valor reforçador de uma classe de
estímulos dos quais muitas cadeias de comportamento podem depender. Quando
privamos um homem de alimento, aumentamos a probabilidade de que ele coma. Mas
aumentamos também a probabilidade de que ele peça alimento, caminhe para uma
certa rua onde. há um restaurante, entre num mercado e assim por diante. Nas
explicações tradicionais de motivação este aumento concomitante na força de muitos
comportamentos é a base para se considerar a privação como uma forma de dirigir,
“ impulsionar” o organismo para o reforçador. Contudo, usado deste modo, o conceito
de “ impulso” tem pouco mais que um valor metafórico. Se o organismo não adquiriu
o comportamento que o levará ao reforçador, a privação por si própria não resultará
em reforçamentos.
E conveniente despir o termo impulso de suas conotações comuns e dar-lhe uma
redefinição técnica que enfatize a habilidade de certas operações em estabelecer
reforçadores. A palavra impulso é usada para indicar que, como um resultado de
alguma operação efetuada no organismo (por exemplo, privação), algum S torna-se um
reforçador, S+. Assim definido, impulso é uma palavra como reflexo, significando uma
certa relação entre variáveis. Se concordarmos em empregar a palavra apenas neste
sentido técnico, devemos ter cuidado e evitar dizer que um organismo respondeu por
causa de um impulso. Sendo uma relação entre alguma operação e o comportamento,
um impulso não pode causar qualquer comportamento.
Pode-se efetuar operações apropriadas de privação para cada reforçador primário.
A observação casual sugere, e experimentos confirmam, que muitas outras operações
têm efeitos semelhantes à privação de reforçadores. Exercício forçado, diminuição da
temperatura da sala, injeção de insulina, lesões cirúrgicas numa região localizada do
cérebro, estimulação de alguma região do cérebro; administração de certas drogas,
oferecimento de aperitivos, introdução de um animal que está comendo junto ao
primeiro todos podem tornar o alimento um reforçador e, assim, são operações de
impulso.
- 343-
Assim como existem várias operações para estabelecer e aumentar o valor dos
reforçadores, também há operações de impulso para reduzir ou eliminar o valor do
reforçador. Podemos chamá-las de operações de redução do reforçador. A mais univer
sal delas é a saciação - apresentação repetida do reforçador até que ele perca o seu
poder de reforçar. Certas drogas, a injeção de sangue de animais saciados, eventos que
produzem emoção, lesões numa parte localizada do cérebro e estimulação numa
determinada região do cérebro, reduzem o valor reforçador do alimento.
Cada reforçador primário tem suas próprias operações particulares de estabele
cimento e redução do reforçador. O paradigma [15.1| esquematiza algumas operações
que tornam a água um reforçador.
Há uma forte tendência para se dizer que essas operações de impulso tornam o
organismo “sedento” e, portanto, ele bebe. Mas a “sede” é um agente causai dúbio.
Tudo o que vemos é que um número de operações tem um efeito similar tornam a
água um reforçador. Como conceitos explicativos, o termo “ sede” e seu correlativo
“ fome” dificilmente são sustentáveis, simplesmente porque eles não apontam qualquer
relação empírica ou teórica entre o comportamento e outros eventos observados ou
especificados. Mesmo como termos descritivos, eles podem prender em armadilhas o
descuidado. Quando dizemos que um homem está “sedentô” quando o vemos beber,
ou “ faminto” quando o vemos comer, estamos inferindo que água e alimento tor
naram-se reforçadores por alguma operação de privação. Mas, de fato, as pessoas
comem e bebem por muitas razões. Elas podem encontrar varias pressões sociais para
assim o fazer, podem fazê-lo para reduzir a ansiçdade, ou podem fazè-lo tal como uma
criança que bebe seu leite ou come seu espinafre para chegar a reforçadores como a
sobremesa.
-3 4 4 -
periodicidade são ciclos pequenos de respiração dos animais, medidos em segundos ou
menos. Todavia, o fato geral é claro — algumas vezes, alimento, água, ar, sexo e assim
por diante são reforçadores, outras não o são. A análise experimental da motivação é
uma tentativa sistemática de relacionar essa variabilidade a variáveis observáveis no
ambiente presente ou passado do organismo. Em resumo, pesquisamos as leis
comportamentais da motivação.
A determinação da natureza cíclica dos reforçadores primários é o primeiro passo
em tal análise. Nem os homens, nem os animais comem continuamente. Quando
provido com um estoque inesgotável de alimento, q rato normal come periodicamente.
A natureza cíclica do comer é vista na Fig 15.1 . Cada resposta de pressão à barra
emitida pelo rato produz uma pequena pelota de alimento e uma contingência de
reforçamento contínuo é mantida permanentemente em efeito. Pode-se observar na
Fig. 15.1 que uma “refeição” inicia-se com uma taxa de pressão constante, mantida
entre 3-5 horas (portanto, comendo). Daí em diante, a taxa de pressão-comer declina,
terminando usualmente numa completa cessação de pressão-comer por umas 6 horas.
Deixando-o beber água quando preferir, o rato produz ciclos característicos de
beber e não beber, como indicam as curvas cumulativas do beber da Fig. 15-2. Há
relativamente poucas respostas de beber entre as 6 e as 18 horas, isto é, durante o dia
O beber, então, aumenta gradualmente e, em geral, atinge o seu máximo por volta de
meia-noite.
- 345-
ligura 15.2. Curvas cumulativas do beber para quatro ratos. O gráfico mostra
períodos de beber e não beber água destilada que estava constantemente disponível
(Young e Richey, 1952).
O sono humano é caracterizado por periodicidades que mudam nas várias idades.
A Fig. 15-3 mostra graficamente como os ciclos mudam à medida queosujeito
humano envelhece. O ciclo muda tanto seu período (número de “sonecas” por dia)
como sua fase (quando a primeira “soneca” começa) com a idade.
- 346-
Um ano
Quatro auos
Dez anos
Adulto
I I I I
18 meia-noite meio-dia 18
-3 4 7 -
Figura 15.4. Curvas individuais de saciação de alimento. As curvas estão assinaladas
com o número de horas de privação anterior de alimento. Um traço oblíquo acima
de cada curva indica que o animal não comia após a resposta de bicar (Reese e
Hogenson. 1962).
- 348-
um valor muito baixo a um valor muito alto, parece referir-se, principalmente ã
observação de que os reforçadores primários podem variar suas forças de valores muito
baixos a muito altos. Assim dizemos que uma pessoa está fortemente motivada para
alimento quando o alimento é um reforçador forte para o comportamento
instrumental daquela pessoa. Similarmente, uma pessoa que está altamente motivada
para o sexo empenha-se frequentemente em comportamento que produz reforçadores
sexuais. Note que, nestes exemplos, apesar de falarmos em termos dc uma alta força
de motivação, tudo o que realmente observamos é a capacidade de um conjunto
particular de reforçadores primários fortalecer e manter o comportamento. Na medida
em que se puder demonstrar que essa capacidade varia de baixa a alta, dependendo das
circunstâncias, podemos indicar o seu valor por uma variável que chamamo, dc valor
reforçador primário dos estímulos.
Como podemos medir o valor reforçador dos estímulos? Parece que não há uma
maneira de medí-lo, salvo pela medida dos efeitos comportamentais dos estímulos
quando eles são contingentes a respostas operantes. Assim, muitas das medidas
comportamentais familiares citadas nos capítulos anteriores, tais como a taxa de
resposta e resistência à extinção, serão úteis para avaliar a força da motivação. Segue-se
uma curiosa implicação dessa versatilidade. O comportamento que o experimentador
escolhe para medir não pode, sozinho e em si mesmo, determinar que fenômeno está
sob estudo. A pressão à barra, ó bicar uma chave e a vocalização “estou com fome”
têm significado somente quando estão associados a outros eventos. Em termos mais
gerais, esta é a razão porque a própria disciplina da psicologia não pode ser definida sõ
como o estudo do comportamento. Ela é considerada mais adequadamente como o
estudo do comportamento na medida em que este se relaciona com o ambiente. Em
capítulos anteriores, as taxas de respostas de operantes representativos foram usadas
fre q u e n te m e n te para estudar o condicionamento, extinção, discriminação,
encadeamento e outros fenômenos, dependendo do procedimento particular imposto
ao organismo quando o comportamento estava sendo medido. Agora, descobrimos um
outro emprego para as medidas operantes. Quando os parâmetros de condicionamento
são mantidos constantes e o comportamento está relacionado a operações de impulso,
as propriedades do comportamento que está sendo emitido podem servir como uma
medida do valor reforçador relativo (ou fprça) de reforçadores primários. Note bem
como essa estratégia experimental é contrária àquela utilizada em capítulos anteriores,
onde as operações de “impulso” eram sempre mantidas constantes e as contingências
de reforçamento eram manipuladas. Empregando aquela metodologia a taxa de
comportamento era tomada geralmente para representar a força do comportamento.
Na metodologia da motivação, a taxa de comportamento será frequentemente tomadc
para representar a força do reforçador. Evidentemente, o “significado” dc
comportamento é derivado apenas pela consideração da variável ou variáveis às quais c
comportamento está sendo relacionado. Discutiremos abaixo algumas técnicas
comportamentais que têm sido usadas para medir o valor reforçador primário dos
estímulos e, assim, por inferência, a motivação. Ao mesmo tempo, ilustraremos uma
variedade de respostas e reforçadores primários diferentes.
1. Resistência à saciação
Nossa intuição nos diz que quanto “mais sedentos” estivermos, mais água
- 349-
poderemos consumir c que quanto mais “ famintos” estivermos, mais alimento
poderemos comer. Como podemos quantificar essas impressões? Uma forma é
examinar as propriedades do processo de saciação em relação à duração de tempo em
que se tenha impedido a um indivíduo o acesso a todos os reforçadores de uma certa
classe. Com efeito, examinamos curvas de saciação obtidas a vários graus de privação.
Suponha que, depois de um período de privação, estabeleçamos uma contingência de
modo que alguma cadeia arbitrária de comportamento possa produzir o reforçamento.
Então, ou o tempo que o organismo leva para alcançar algum critério arbitrário de
taxa baixa ou o número de respostas reforçadas emitidas antes de ser atingido o
critério de taxa baixa, proporcionariam uma medida da resistência à saciação. É
evidente que, se contingências de crf estão em efeito e se a quantidade de
reforçamento é mantida constante, a última medida seria equivalente à quantidade de
substância consumida. A resistência à saciação é calculada de modo análogo à
resistência, à extinção (seção 5.5). Usando o me'todo de resistência à saciação, Siege
(1947) mediu a quantidade de água bebida pelos ratos num período de 5 minutos em
função de quanto tempo os animais haviam sido privados de água. A reiação obtida é
vista na Fig. 15-5. De 0 até 48 horas de privação, a resistência à saciação, medida pela
quantidade de água consumida, aumentou. A taxa de aumento, todavia, parece
diminuir depois de 12 horas. Resultados similares podem ser obtidos para privação de
alimento. Com períodos muito grandes de privação, todavia, a quantidade de alimento
ingerido declinará, presumivelmente como um resultado da contração do estômago e
inanição. Dentro de certos limites, entretanto, a resistência à saciação aumenta à
medida que o tempo de privação aumenta.
A resistência à saciação, embora uma técnica útil, não é sempre inteiramente
‘satisfatória para medir o valor reforçador. Uma dificuldade encontra-se nas
complicações fisiológicas que ocorrem com longos períodos de privação, causando,
Figura 15-5. Quantidade de água ingerida por ratos num pen'odo teste de 5 minutos
m função do número de horas em que não tiveram acesso a qualquer líquido
(segundo Siegel, 1947).
-3 5 0 -
algumas vezes, um consumo reduzido. Outra dificuldade surge se desejarmos saber
quão forte é o reforçador em vários pontos do processo de saciação. Em qualquer
nível de privação, um organismo pode comer ou beber numa taxa constante e alta até
que o processo chegue a uma cessação abrupta (Fig. 15-4). Logo,é difícil avaliar a
força momentânea do reforçador através da inspeção do processo dc saciação. As
curvas de saciação tendem a diferir principalmente nos seus pontos terminais, c não
nas suas inclinações (Fig. 15-4). Então, somos forçados a esperar até que a saciação
seja alcançada para sabermos quão faminto ou sedento o animal estava no início.
Uma técnica em geral mais conveniente para medir o valor reforçador é observar a
taxa de resposta apresentada por um organismo quando o comportamento está sendo
intermitentemente reforçado. Um esquema de intervalo, por exemplo, pode ser
programado para fornecer uma taxa de reforçamento bastante baixa, de modo que o
comportamento possa ser mantido sem a ocorrência de saciação por um longo período
de tempo. Skinner (1938) usou essa técnica para avaliar os efeitos comportamentais de
quantidades especificadas de alimento dadas aos ratos, antes do teste. Primeiro, os
ratos foram privados de alimento por 23 horas e, então, durante vários dias, foram
alimentados com quantidades diferentes de alimento logo antes do teste com as
contingências de intervalo. Os resultados para um desses ratos aparecem na Fig. 15-6.
Os números associados a cada curva referem-se à quantidade de alimento, em gramas,
dado ao rato previamente. É evidente que, quanto mais o rato se alimentava
imediatamente antes do trabalho, menor era a taxa de resposta no esquema.
F. C. Clark (1958) estudou os efeitos de vários graus de privação de alimento
sobre as taxas de respostas “estabilizadas” , em intervalo variável (IV), em ratos.
- 351 -
Vários IVs diferentes foram usados. Clark obteve as curvas da Fig. 15-7 quando
representou a taxa de respostn dos ratos em função das horas de privação. O efeito do
aumento de privação foi o dc aumentar a taxa de resposta sob todos os esquemas de
IV. A maneira pela qual a privação e os esquemas de reforçamento interagem para
determinar as taxas de resposta da Fig. 15-7 é de algum interesse. A similaridade na
forma das curvas da Fig. 15-7 significa que a privação interagiu com o esquema IV de
modo que, cm todos os níveis de privação, a razão entre a taxa num IV c a taxa no
outro IV era uma constante. Por exemplo, com 5 horas de privação, a taxa em ÍV-3
era cerca de 4 R/min. e em IV-1 era 2,5 vezes isto, cerca de 10 R/min. Quando a
privação foi aumentada para 20 horas, as duas taxas eram aproximadamente 6 e 15
respectivamente, de modo que a taxa em IV 1 era ainda 2,5 vezes maior do que a
taxa em IV-3.
No experimento de Clark, o intervalo máximo de privação foi de 23 horas. Heron
e Skinner (1937) pesquisaram sobre a privação alimentar prolongada, em ratos, que se
estendia até a morte do animal. Eles descobriram que a taxa de resposta reforçada
com alimento em IF aumentava progressivamente durante o período de inanição até
atingir um máximo, depois do que declinava rapidamente e logo se seguia a morte
como resultado da inanição. A taxa máxima não ocorreu no mesmo ponto para todos
os ratos. No experimento de Heron e Skinner, ela ocorreu entre 4 e 12 dias. O
resultado apoia as teorias que equiparam a motivação a um deficit corporal
T em po de privação (h o ras)
Figura 15-7. Taxa média de resposta em IV em função do tempo de privação. O
parâmetro é o IV médio (Clark, 1958).
- 352-
(“necessidade” ). Embora o deticil alimentar do rato continue a aumentar através da
privação, parece que o valor reforçador do alimento não aumenta. Veremos mais tarde
quais outras medidas comportamentais substanciam essa conclusão.
3.Resistência à extinção.
H oras d e Privação
4. Aquisição
- 353-
era-lhes apresentada uma discriminação luz-escuro, com contingências do tipo discutido
em relação ao aparelho de saltar de Lashley (seção 10.3). Se, no ponto de escolha, o
rato nadasse para o lado claro, encontrava uma porta aberta que permitiria o acesso
para um lugar seco. Se, todavia, nadasse para o lado incorreto, encontrava uma porta
trancada e tinha de nadar de volta para o ponto de escolha e, então, dirigir-se para o
outro braço do Y para sair. Todo o procedimento foi efetuado debaixo d’água. O
procedimento é, esquematicamente,
- 354 -
Os resultados da aquisição são apresentados na Fig. 15-9. E visto o número de
escolhas corretas em 100 tentativas de aquisição das duas discriminações. Para a
diferença grande de iluminação (discriminação “fácil”), podemos resumir os resultados
dizendo que, quanto maior o tempo de privação de ar, mais eficiente era o
desempenho de aquisição. Mas quando uma pequena diferença de iluminação era usada
(discriminação “difícil”), a aquisição era mais eficiente num valor médio (2 seg.) de
privação de ar e menos eficiente com privações maiores e menores. Se esse resultado
puder ser generalizado, parece que com tarefas difíceis é possível ter-se muito mais
motivação para um desempenho ótimo. Certamente, as diferenças na forma entre as
duas curvas da Fig. 15-9 indicam que o método de aquisição deve ser usado
cauteiosamente como uma medida da força do reforçador. Por exemplo, um resultado
bem diferente foi obtido numa situação que requeria o nadar debaixo d’agua, em linha
reta, sem contingências discriminativas. Então, numa faixa de privação anterior de ar
de 0 a 10 seg, os ratos nadavam tanto mais rápido quanto maior a privação anterior de
ar.
5. Superar obstáculos.
Figura 15-10. A caixa de Obstáculo de Columbia. Há uma grade eletrificada (B) entre
o compartimento do rato (A) e um reforçador colocado na caixa objetivo (C)
( segundo Warden, 1931, de Harlow, 1948 ).
- 355-
Através dessas funções, vemos que se as operações são efetuadas por bastante tempo, o
comportamento que produz o reforçador chega a uma força máxima e, então, declina.
Warden supôs que as alturas relativas dos máximos poderiam ser interpretadas como
significando que impulsos para água e alimento são mais fortes do que o impulso
para sexo. Mas, esta conclusão é justificável? Devemos nos lembrar de que as funções
comportamentais dependem de muitas variáveis além daquela particular que o experi-
Dias d e privação
Figura 15-11. Número de travessias de uma grade eletrificada em função dos dias de
privação do reforçador primário apropriado (segundo Warden, 1931).
- 356-
A técnica do trabalho máximo é semelhante, em linhas gerais, à caixa de obstácu
lo, mas evita um dos efeitos colaterais indesejáveis desta última — a contaminação dos
resultados pelos efeitos emocionais do choque elétrico. A técnica do trabalho máximo
está baseada na noção de que, quanto mais forte o reforçador, mais trabalho o indivíduo
efetuará para obtê-lo. Hodos (1961) delineou um procedimento engenhoso no qual um
organismo trabalha num esquema de reforçamento em razão, onde o valor real da ra
zão aumenta progressivamente com cada reforçamento sucessivo. Num experimento, a
sessão iniciava com uma razão 2 e cada reforçamento sucessivo aumentava à razão de
mais 2, de modo que os animais deveriam emitir 2 respostas para o primeiro reforçamen
to, 4 para o segundo, 6 para o terceiro, e assim por diante. Eventualmente, atinge-se
uma razão tão alta que o animal se recusa a continuar trabalhando. O ponto em que is
to ocorre é chamado de “ponto de quebra”, definido no trabalho de Hodos como 15 mi
nutos sem nenhuma resposta. Usando ratos como sujeitos e leite condensado para o re
forçamento, Hodos manipulou o esquema de privação de seus sujeitos, alimentando-os
todo dia apenas com alimento suficiente para manter o peso de seu corpo numa percen
tagem fixa de seu peso com alimento livre. Assim, um rato mantido a 80 por cento de
seu peso normal está fortemente privado; um rato mantido a 95 por cento de seu peso
normal está apenas um pouco privado. Este procedimento é comumente empregado pa
ra controlar a privação de sujeitos experimentais, e alguns acham que ele permite um
controle um pouco melhor da motivação do que men tendo os sujeitos com uma dura
ção fixa de privação, digamos 23 horas. A medida do comportamento usada por Hodos
foi o número de respostas na última razão completada antes do ponto de quebra. Esta
razão final é a razão máxima que o rato poderia completar sob as condições do experi
mento. A Fig. 15-12 mostra que, à medida que os ratos estavam mais privados, eles com
pletavam uma razão máxima maior. Interpretamos isso como significando que com uma
privação maior o rato apresentará maior quantidade total de trabalho.
7, Adulteração do reforçador.
Quando estamos ligeiramente famintos, somos muito seletivos com relação aquilo
que comemos. Eventualmente, à medida que ficamos mais famintos, nossos padrões so
bre aquilo que aceitaremos serão menos exigentes. Se estivermos com uma privação mui
to grande, comeremos qualquer coisa. Essas impressões sugerem que o impulso poderia
ser medido pela quantidade de uma substância desagradável que pode ser misturada com
o alimento de modo a fazer o organismo parar de consumir o alimento adulterado ou
de trabalhai por ele.
- 357 -
120
Rato SO
R ato 77
I 80-
X»
100 95 90 85 80
P ercentagem do peso com a lim e n to livre
Figura 15-12. Razão máxima que produz o leite e que os ratos emitirão, em função
do grau dc privação de alimentos (Hodos, 1961).
Essa é uma das várias descobertas a mostrar que a quantidade de alimento consumido
(resistência à saciação) e o trabalho realizado pela obtenção de alimento não estão
perfeitamente correlacionados. Miller, Bailey e Stevenson tomaram os dados da razão
como significando que os ratos obesos não estavam tão “ famintos” quanto os ratos
normais, embora, se o alimento estivesse livremente disponível, eles consumissem
relativamente muito mais alimento.
Teitelbaum utilizou o método de adulterar o alimento do rato com uma pequena
quantidade fixa de quinino (uma substância que sujeitos humanos acham amarga) para
averiguar interpretação de Miller, Bailey e Stevenson. Ele descobriu que, durante os
dois meses depois da operação, quando os ratos estavam se tomando obesos, o quinino
não detinha seu consumo anormal de alimento. Em outras palavras, durante este
período no qual os ratos turnavam-se muito gordos, o alimento era um reforçador
forte. Mas, uma vez que os ratos tornavam-se obesos, uma quantidade de quinino
muito pequena para afetar o consumo de alimento pelos ratos normais, detinha
completamente o comer dos animais obesos. Parece que o alimento é menos
reforçador para o rato completamente obeso do qus para o rato normal. Mesmo assim,
se se dá acesso continuo a alimentação não adulterada, o animal obeso comerá muito
mais— sua resistencia à saciação é maior que a do normal.
8. Preferência.
Suponha que seja possível emitir uma, mas não ambas, de duas cadeias de
comportamento. Na medida em que um organismo emite o comportamento que
produz um reforçador em vez de e m itir o comportamento que produz um outro,
dizemos que já tem uma preferência pelo primeiro reforçador. Se a quantidade de esforço
para completar ambas as cadeias é aproximadamente a mesma, tal preferência poderia ser
considerada como uma expressão do valor reforçador superior do primeiro reforçador.
Assim, o comportamento de preferência torna-se um método para avaliar o valor re-
forcador relativo de dois ou mais reforçadores.
- 358-
Quando as glândulas supra-renais de ratos são removidas cirurgicamente, ocorre uma
mudança drástica na balança iònica de sódio e potássio. A menos que uma grande
quantidade de sódio seja ingerida diariamente, o animal logo morrerá. Quando a operação
é realizada, os ratos mudam sua preferência normal por água para soluções salinas (clo
reto de sódio) e ingerem grandes quantidades de solução salina, conseguindo, assim
manterem-se vivos e sadios. Esta mudança de comportamento é a evidência de que a
operação age de modo a aumentar o valor reforçador do sal.
Sumário.
I 15.2|
Operação de estabele
cimento do reforçador
Mais trabalho é realizado
Um reforçador de qualidade inferior
é tolerado
Maior preferência pelo reforçador.
- 359-
compreendermos completamente o seu status como um conceito abstrato dc compilação,
será pouco provável que o empreguemos metaforicamentcTio sentido de “ incitação” ou
força que “ dirige, impulsiona o organismo” , ou como uma causa do comportamento.
Similarmente, evitamos referências à sua “ localização” (já que uma abstração não tem
’‘localização”) ou sua “ satisfação” (pois, como pode uma abstração scr satisfeita? ).
Nenhuma das metáforas de uso comum é apropriadamente aplicada ao conceito de
ilmpulso que explicamos. O termo mostra uma relação complexa e significa, nada mais
nada menos, que Diagramas como [ 15.1 ] e 115.2].
-3 6 0 -
Capítulo 16 MOTIVAÇÃO 11
Diz-se frequentemente que os drives (1) ativam ou dáo energia ao organismo, e (2)
dirigem-no para um objetivo. Em vista de nossa definição no capítulo anterior de drive
como sendo uma relação sumária entre dois grupos de observáveis (veja diagramas (15.1)
e(15.2) , somos forçados a rejeitar a noção metafórica de que um drive por si sò possa
ativar ou dirigir um organismo. Contudo, não devemos ser tão drásticos ao ponto de
rejeitar tôdas as idéias que envolvem a ativação e direção. A partir da análise, algumas
podem se referir a propriedades fundamentais do comportamento, que negligenciamos
até agora em nossa discussão de motivação. *
- 361 -
Figura 16-1. Uma roda de atividade.
- 362-
4
correr na roda. e portanto não devemos tomar como um paradoxo que alguns
investigadores tenham relatado que as privações de alimento e água afetam apenas
ligeiramente, ou nada, as atividades registradas em estabilímetros. Em geral, os tipos de
atividades medidos pela roda parecem ser alterados pela privação, enquanto os medidos
em estabilímetro são muito menos afe+ados. Bolles (1963) suspeitou que essa diferença
significasse que atividades específicas diferentes eram diferencialmente afetadas pela
privação. Com a ajuda de vários assistentes, ele observou periodicamente as atividades de
dois grupos de ratos, por um número de dias, em suas gaiolas. Uma vez por hora, os
experimentadores olhavam brevemente cada rato, e clci^sificavam o que ele estava
fazendo em uma de seis atividades: dormindo, descansando quietamente, de pé em um
local, fazendo toilete, comendo, bebendo. Um grupo (faminto) foi alimentado com 10 g
de alimento uma vez ao dia. Como resultado, esse grupo experimentou uma perda de 15
a 20 por cento em relação ao peso com livre acosso ao alimento. O outro grupo tinha
acesso irrestrito ao alimento e assim foi chamado de grupo ad lib. O regime de privação
de alimento resultou em desvios do padrão de atividade do ad lib. Os ratos famintos
faziam mais movimentos (levantar e locomover) e descansavam mais quietamente que os
ratos ad lib. A privação de alimento parece, assim, mudar o padrão de atividade,
aumentando algumas atividades e diminuindo outras.
O nível operante da resposta, isto é , a atividade operante antes de fortalecida, é
sensível a operações de privação. Crocetti (1962) obteve a curva vista na Fig. 16-4,
quando registrou o nível operante de ratos que pressionavam uma alavanca sob cinco
- 363-
valores diferentes de privação de alimento. A comparação da curva da fig. 16-4 com a da
fig. 15-8 (ambas contendo dados dos mesmos ratos) mostra que a privação de alimento
afetou o nível operante de pressão à barra na mesma maneira que afetou a resistência à
extinção da resposta após o seu fortalecimento experimental.
-3 6 4 -
Figura 16-4. Nível operante da taxa de pressão à barra em relação a horas
de privação de alimento ( segundo Crocetti, 1962)
16.2 INCENTIVO
- 365 -
ratos famintos, com uma gota de solução de sacarose em um esquema IV. A medida que
a concentração de sacarose na solução aumentava, a taxa de pressão à barra aumentava,
alcançando um máximo quando a concentração de sacarose era de 32%. Concentrações
acima dês te valor produ/iam um declínio na taxa de resposta.
Os efeitos comportamentais da quantidade de reforçador podem ser estudados de
várias maneiras. Se o reforçador é alimento, e a qualidade é mantida uniforme, o volume
pode ser variado. Km geral, ratos adquirem cadeias de labirinto mais rápido e estabilizam
em urna assíntota mais baixa de erros por corrida, quando recebem mais alimento por sua
performance. A quantidade pode também ser estudada pela variação do tempo de acesso
ao reforçador. Sujeitos ratos correm mais rápido paia um companheiro se se permite que
permaneçam mais tempo com ele: pombos bicam mais rápido se se permite mais tempo
de acesso ao grão reforçador contingente.
Os efeitos comportamentais da variação da quantidade e qualidade de reforço
primário podem ser categorizados sob o rótulo de funções de incentivo Como um
substantivo, incentivo ó um sinônimo de reforço, mas, como um adjetivo, podemos usá-lo
para denotar a classe de variáveis que mudam o valor reforçador através de mudanças nas
propriedades do estímulo reforçador. Para um sumário e interpretação dos vários efeitos
comportamentais que as variáveis de incentivo podem ter, o estudante interessado pode
consul tar Cofer e Applcy (1964).
- 366-
ajuda a compreender o conceito comportamental de drive. Us estudos fisiológicos
prometem dar-nos o conceito de valor reforçador, com um referente físico, em várias
estruturas anatômicas, e a juntar um número de operações de drive ambientalmente
diversas, descobrindo seus efeitos comuns no organismo.
Mecanismo de comer e beber. Na elaboração gradual dos mecanismos corporais
associados com a alimentação, encontramos um exemplo representativo da procura de
eventos fisiológicos subjacentes a fenômenos comportamentais. Mais precisamente, essa
procura diz respeito a certos eventos e processos internos que acompanham mudanças no
poder reforçador de alimento. Desde a antiguidade até tempos recentes, pensava-se que o
estado do estômago tinha um papel importante no controle do valor reforçador do
alimento. O fato de as “ caimbras de fome” frequentemente acompanharem
informações de grande fome em humanos levou a investigações sôbre as relações entre
câimbras de fome, contrações do estômago e fome. Cannon e Washburn (1912)
estudaram contrações do estômago usando uma técnica simples em que um sujeito
humano engolia um pequeno balão de borracha. Uma vez no estômago, o balão era
inflado, e qualquer contração estomacal que ocorresse apertava o balão. As variações
resultantes de pressão do ar no balão eram por sua vez transmitidas a uma pena
registradora. O sujeito pressionava uma chave telegráfica sempre que sentia câimbras de
fomel. Cannon e Washburn mostraram que as contrações estavam bastante
correi aciona das com o relato de câimbra de fome, e concluíram que essas contrações
eram a causa da fome. A hipótese ganhou atenção imediata porque parecia oferecer um
mecanismo simples e direto para comer e beber. Mas logo foi visto que pacientes que não
tinham estômago comiam de maneira normal, e relatavam “ fome” embora nunca
tivessem contrações de estômago. As implicações dessas observações foram ampliadas em
experimentos que mostraram que ratos comiam normalmente, embora os nervos do
estômago fôssem isolados cirurgicamente do cérebro. Outras observações mostraram que
as contrações de fome eram abolidas pelas primeiras mastigadas de alimento, embora o
alimento continuasse a ter um alto valor reforçador muito depois que as contrações
cessavam. No fim, a teoria de fome de contração do estômago teve que ser abandonada,
porque não explicava muitos dos fatos do comportamento de comer.
1. Os tèrmos "fo m e " e "sêde" são usados no seu sentido descritivo com o palavras
breves para significar que alimenxo e água, respectivamente, têm alto valor
reforçador.
- 367-
Trabalho experimental independente confirmou que certas estruturas no hipotálamo
estão intimamente relacionadas ao poder reforçador do alimento. Km uma subseção
anterior, descrevemos efeitos comportamentais causados pelo dano experimental na
região ventromedial do hipotálamo. Ratos com destruição nessa região comem demais e
tornam-se obesos. A estimulação elétrica dessa região do cérebro também tem efeito no
comportamento motivado por alimento.
Finos eletrodos podem ser implantados no cérebro em localizações bem precisas, sem
lesar estruturas vizinhas. Os eletrodos são guiados no tecido nervoso através de um
buraco perfurado no crânio, e então colocado um pedaço de plástico cimentado no
crânio, cobrindo o buraco. Finalmente, o couro cabeludo é costurado. Depois de alguns
dias de recuperação da operação, o animal operado recupera a saúde normal. O animal
não parece de modo algum importunado pela adição dos eletrodos, e vive normalmente.
Através dos eletrodos implantados, podem ser aplicadas correntes elétricas diminutas à
estrutura do cérebro onde estão localizadas as pontas dos eletrodos. Os efeitos
comportamentais de tal corrente elétrica são então medidos. Quando a região
ventromedial do hipotálamo é assim estimulada, o consumo de alimento diminui. Foram
encontradas outras áreas do cérebro onde a estimulação leva um animal “saciado” a
começar a comer. O quadro dos mecanismos fisiológicos subjacentes á privação e
alimentação ô complexo e ainda fragmentário. Nenhuma estrutura corporal única medeia
o valor reforçador do alimento. O estômago, o sangue, o cérebro e provavelmente outros
sistemas corporais interagem para determinar quando o alimento será reforçador.
Pode-se contar uma história experimental análoga para o mecanismo de beber, mas
podemos indicá-la somente brevemente. As primeiras explicações foram centralizadas no
papel da secura relativa da garganta e boca e na importância das secreções salivates. Boca
e faringe secas eram igualadas a sede. Trabalhos posteriores mostraram que a salivação
poderm não ser crucial desde que animais tanto bebiam como paravam de beber
normalmente mesmo quando seus dutos salivares eram fechados. Ao contrário, em
- 368-
I igura 16-6. Diagrama esquemático do cérebro humano (Rosenzwcig,
1962).
experimentos em que a água que os cachorros bebiam nunca alcançava seus estômagos,
mas saía por uma fistula no pescoço (Fig. 16-7), cachorros privados de água continuaram
a beber indefinidamente; embora suas gargantas e bocas fossem mantidas constantemente
molhadas. A atenção experimental mudou gradualmente para o papel da água contida
nas células do corpo. Um pequeno deficit de concentração normal de água nas células do
corpo c sangue parece ser um fator crítico no beber (Gilman, 1937). O trabalho recente
tem se dedicado à localização de centros cerebrais no hipotálamo que regulam o
comportamento de beber e parar de beber.
Voltamo-nos agora à uma breve descrição de alguns métodos pelos quais os
psicofisiologistas tentam descobrir a lógica da mecânica corporal interna. Suas principais
técnicas são (1) estimulação do tecido nervoso por corrente elétrica ou por substâncias
químicas ou drogas, (2) destruição cirúrgica ou farmacológica ou isolamento de áreas
ligura 16-K Rdlo t.*stimulamlo-sc em uma faixa ik' Skinner (seguiuU* Okls. 1956).
-370-
hábito de vdtar ao canto A para ser estimulado, começamos a tentar levá-lo para o
canto B, dando um choque elélrico sempre que ele tomava um passo nessa direção.
Em questão de cinco minutos o animal estava no canto B. Depois disso, o animal
podia ser dirigido para quase todos os pontos na caixa ao desejo do experimentador.
Cada passo na direção certa era pago com um pequeno choque; com a chegada no
lugar apontado, o animal recebia uma série mais longa de choques (Olds, 1956).
-371 -
uma operaçao de drive para atividade. Por exemplo, um rato confinado em uma pequena
câmara onde seus movimentos são restritos, irá, dando-se-lhe acesso a uma roda de correr,
correr uma quantidade quase proporcional ao tempo em que esteve, anteriormente,
confinado. A atividade é, assim, uma função que aumenta com as horas de confinamento
(Hall, 1961). O valor reforçador de atividade aumentado depois de confinamento pode
ser demonstrado também por um aparelho, o estabilímetro (gaiola de balanço). Quando
colocados em uma gaiola de balanço depois de longos períodos de inatividade forçada,
ratos movem-se muito mais que o usual. Kagan e Barkun (1954) mostraram que ratos
pressionavam uma alavanca para ter acesso a uma roda em que pudessem correr.
Aparentemente, a atividade pode servir como um reforçador primário para respostas
operantes.
2. Exploração. Em condições normais, os organismos preferirão quase sempre
colocar-se em uma situação nova. Isto é particularmente verdadeiro quando a situação
nova apresenta uma oportunidade para “exploração”. É bem conhecido que um rato
faminto, quando introduzido em uma situação nova que contém alimento, irá
invariavelmente “explorar” a situação antes de comer. Isto sugere que o valor reforçador
da exploração suplanta o do alimento, pelo menos inicialmente. Como uma
demonstração experimental desse reforçador, imagine um labirinto T em que um dos
braços contém um elaborado labirinto tipo “ tabuleiro” (Fig. 12-2), e outro braço contém
uma caixa pequena e comum no fim. Ratos que não estão privados nem de alimento nem
de água irão correr consistentemente para o lado que tem o labirinto em tabuleiro se se
permite por um breve período de tempo que “explorem” o labirinto em tabuleiro
quando chegam a ele.
Estímulos novos não precisam ser tão complicados como o labirinto em tabuleiro.
Ratos e camondongos pressionarão uma alavanca se cada pressão produz um breve flash
- 372 -
importante em se um rato pretere pressionar uma aJavanca qut liga uma luz, ou
pressionar a outra alavanca que desliga uma luz (Lockard, 1963).
Reforçadores capazes de fortalecer o comportamento algo vagamente denominado
“curiosidade” foram demonstrados por Butler (1953). Macacos novos foram colocados
em uma caixa opaca em penumbra com duas janelas cobertas, uma azul e outra amarela.
Empurrar a janela amarela não tinha nenhum efeito, mas o empurrar a janela azul abria-a
por 30 seg, mostrando várias cenas (Fig. 16-9). Algumas cenas tais como um grande
cachorro rosnador, não eram reforçadoras e levavam um pequeno empurrão. Outras
cenas, como visão do laboratório e experimentador, outros macacos e objetos de
brinquedo móveis tinham valor reforçador apreciável. Os macacos confinados
rapidamente discriminavam a côr do painel e produziam as cenas reforçadoras
frequentemente. Esse comportamento parece conter alguma relação com privação, desde
que quanto mais o animal era confinado na caixa sem oportunidade de produzir uma
cena, maior sua taxa de resposta quando dada a oportunidade. Butler (1957) encontrou a
função vista na fig. 16-10, quando a pressão ao painel era reforçada em um esquema IV
com a visão, por 12 seg; de uma colônia de macacos.
Crianças novas gastam muito tempo com “brincar” e manipular objetos. Essa
manipulação parece ter propriedades reforçadoras intrínsecas e não precisa ser
dependente da associação com outros reforçadores primários. Harlow (1950) demonstrou
que macacos irão desmanchar quebra-cabeças mecânicos do tipo visto na Fig. 16-11, sem
nenhum reforço adicional . Parece que êsses macacos resolverão os problemas meramente
pelo gosto de resolvê-los. É por isto que tais reforçadores são chamados intrínsecos. Por
um período de 10 hr. de observação, Harlow notou que o número de quebra-cabeças
abertos diminuía progressivamente, sugerindo um processo de saciação.
3. Contato físico para organismos jovens: reforçadores de "afeição" : Pode-se
suspeitar que o contato físico com a mãe deve ser um reforçador para um organismo
jovem. Tal reforçador teria, obviamente, utilidade biológica para manter o organismo
jovem perto de sua mãe onde alimento, abrigo e proteção poderiam ser encontrados
- 373 -
Pesquisa realizada por Harlow demonstrou que o contato do corpo é um reforçador
muito poderoso, e além disso não depende de reforços primários adicionais de alimento,
abrigo e proteção com os quais é normalmente associado. O contato, por si sô, é um
reforçador primário poderoso e específico. Harlow (1960) criou macacos jovens em
completo isolamento de suas mães. Das observações do reflexo de segurar, em macacos
bebês (Fig. 16-12), Harlow suspeitou que poderia ser construída uma mãe “sub-rodaga”
(substituta) que poderia fornecer certos aspectos do contato físico que as mães
verdadeiras fornecem.
O reflexo de segurar e tocar é eliciado por um objeto cilíndrico; então, objetos do tipo na
Fig. 16-13 foram colocados nas gaiolas dos bebês macacos desde o nascimento. Esses
objetos cilíndricos (mães substitutas) eram idênticos em construção exceto por suas
cabeças (um aspecto determinado mais tarde como irrelevante) e suas superfícies. Ambos
os objetos foram construídos de arcabouços de arame, mas o arcabouço de arame de um
estava coberto por uma camada grossa de tecido , enquanto o arcabouço do outro estava
exposto. Harlow referiu-se ao objeto coberto de tecido macio como “mãe de pano” ; e o
outro objeto ele chamou de “ mãe de arame”. Os macacos criados em gaiolas contendo
ambas essas mães substitutas permaneciam muito tempo de sua vida infantil em contato
com a “ mãe de pano” , segurando-se a “ ela” muito à maneira do reflexo de segurar da
Fig. 16-12. Por outro lado, eles ignoravam virtualmente a “ mãe de arame”.
-374-
problema de alimentar-se de Uina mãe enquanto t i n h a » t a t o com a outra. Em outros
experimentos, Harlow demonstrou que o valor reforçador da mãe de pano perdurava até
dois anos. Essas descobertas atestam a grande durabilidade desse reforçador. As
propriedades reforçadoras críticas da substituta parecem ser (1) sua forma cilíndrica e (2)
sua maciez. Quando se usou uma tábua chata coberta de tecido, esta não gerou os efeitos
vistos pelo cilindro coberto de pano da Fig. 16-13. O “ abraço” não era possível com uso
da tábua.
Harlow indicou que o privar os bebês macacos de suas mães* ou de mães substitutas
apropriadas, pode interferir marcantemente com respostas emocionais e padrões de
companhia, mais tarde . Evidentemente, a disponibilidade do reforçador de contato no
início da vida é crítica para a ocorrência normal de certos padrões de comportamento na
vida adulta. O trabalho de Harlow fornece um início impressionante neste problema
muito difícil dos efeitos de experiências iniciais em comportamentos maduros
posteriores. Desde Freud, os psicanalistas têm enfatizado que certas experiências iniciais
críticas são de grande importância para o ajustamento de padrões emocionais de sêres
humanos adultos; mas, através de experimentação controlada, a exploração dessas idéias
tem sido difícil. O paradigma de Harlow pode oferecer um esquema útil para testar
algumas dessas idéias.
- 375-
1*igura 16-13. Macaco rhesus jovem mamando dc um objeto de arame
cilíndrico, enquanto agarra-se a um objeto semelhante coberto com tecido
(Harlow, 1960).
Figura 16-14. Horas, por dia, passadas com as mães substitutas de pano e
arame em várias idades, em dias (Harlow, 1960).
16.5 DRIVES ADQUIRIDOS
“Em uma fazenda perto de Viena, Lorenz dividiu um grupo de ovos postos por
uma gansa em d d s grupos. Um grupo foi chocado pela gansa; outro grupo foi
chocado por uma incubadeira. Os gansinhos chocados pela gansa imediatamente
seguiram sua mãe pela fazenda. Os outros, todavia, não viram sua mãe. A primeira
coisa que eles viram foi Lorenz. E então seguiram Lorenz pela fazenda (Hess, 1958,
p. 81)” .
-377 -
Esse fenômeno, no qual uma experiência no início da vida dos gansos influenciou seu
comportamento mais tarde, Lorenz chamou de “imprinting”. Logo foi estabelecido que a
experiência tinha que ocorrer durante um período crítico no início da vida do organismo
para ser efetivo. Trabalhes subsequentes devotados ao imprinting têm demonstrado que
os tipos de objetos que podem fazer surgir tais comportamentos dc seguir são tão
arbitrários como caixas de papelão ou esferas em movimento. Esses trabalhos posteriores
tem tentado qualificar as condições sob as quais ocorrerá o imprinting.
Têm indicado também que “seguir” é simplesmente uma manifestação de que um certo
objeto tornou-se um reforçador poderoso. Qualquer comportamento instrumental que
traga a ave jovem a uma maior proximidade com o objeto é fortalecido.
O aparelho utilizado por Hess (visto na Fig. 16-15) consiste de uma pista circular
fechada de Plexiglass na qual um pato chamariz pode ser movido por um motor a várias
velocidades. Um patinho, nascido poucas horas antes, c colocado na pista e o modelo
começa a mover-se em volta da pista. Em alguns experimentos, um som sai de um alto
falante de dentro do modelo. A operação de imprinting consiste de 1 hora, ou menos, de
exposição ao objeto em movimento. Mais tarde, os patinhos, são testados para
determinar preferência de resposta para o modelo de imprinting em comparação com
outros objetos. Um achado surpreendente é que a operação de imprinting deve ocorrer
durante um período de idade para ser efetiva na determinação da preferência. A fig.
16-16 mostra isto graficamente. Para o caso de patinhos selvagens, uma idade de 13-16 h
depois do nascimento dá o máximo de imprinting. Parece que, além de 30 h depois do
nascimento, o imprinting já não é possível nesta espécie.
A fim de estabelecer que o objeto “ imprinted” age como outros reforçadores,
Hoffman, Searle, Toffcy e Kozma (1966) modelaram uma resposta de bicar na chave que
produzia uma iluminação breve (5 seg) do objeto “ imprinted” em movimento. Em seus
- 378-
estudos, a arbitrariedade do objeto “imprinted” foi enfatizada. 0 ubjeto era uma
mamadeira de leite sendo levada em um vagão de um trem modelo. Os patinhos recebiam
uma exposição, anterior ao imprinting, à mamadeira de leite e mais tarde adquiriram as
Rs de bicar a chave quando cada bicada produzia um aparecimento breve da mamadeira
em movimento como reforçador. Subsequentemente, uma razão 5-1 foi mantida. Os
sujeitos que não tiveram exposição anterior ao imprinting à mamadeira não bicavam a
chave, mostrando que a operação de imprinting foi essencial para a criação desse tipo de
reforçador.
Embora o objeto “imprinted” pareça adquirir propriedades reforçadoras, essas
podem não durar indefinidamente. Hoffman, Toffey, Searle e Kozma mediram a
quantidade de tempo pelo qual os patinhos “imprinted”, vivendo constantemente no
aparelho, mantiveram a visão da mamadeira de leite pelo bicar da chave. Os
experiment adores descobriram que, à medida que os animais cresciam, tendiam a
trabalhar cada vez menos pelo objeto. Alguns resultados típicos são vistos na Fig. 16-17.
Por volta de 60 dias, o valor do objeto em movimento como reforçador havia quase
dissipado completamente. Um fato interessante é o de que o reforçador podia ser
restabelecido temporariamente através de choque nos patinhos, ou pela apresentação de
outros estímulos geradores de emoção.
- 379-
Figura 16-18. Rato viciado toma injeção de droga à vontade, pela pressão à
barra. A solução de droga vem pelo tubo e então, através de uma cânula
cronicamente implantada, penetra na veia jugular. Uma corrente em uma
coleira impede que o tubo gire quando o animal se move na gaiola (segundo
Weeks, 1964).
primários do que com as de reforçadores secundários. Ao contrário de um reforçador
condicionado, não é sujeito a um procedimento de extinção, nem serve como um
para uma resposta que produza um reforçador subsequente mais primário.
2. Vício Sabe-se bem que a administração repetida de certas drogas cria uma
dependência em sua administração contínua. Além disso, essas drogas (tal como o ópio e
seus derivados morfina, heroína e demorol) vem a adquirir propriedades reforçadoras
poderosas. Os humanos que desenvolvem tais dependências, chamadas de vícios, tudo
farão para obter injeções da droga. A despeito de sua prevalência na sociedade moderna,
as condições que controlam o vício (suas causas e curas) rião são bem entendidas.
Estudos recentes com sujeitos animais têm utilizado técnicas de resposta de operante
livre para estudar o poder reforçador dessas drogas depois do vício. 0 principal objetivo
desses estudos é clarificar as condições que estão relacionadas ao vício.
A operação que cria o reforçador de vício consiste da apresentação repetida
(usualmente por injeção) de morfina e outros compostos em doses gradualmente
maiores. Como uma conseqüência dessa série de administrações, a droga adquire
poderosas propriedades reforçadoras. 0 vício experimental tem sido produzido em ratos
e macacos por êsse método de aumentar gradualmente a dose da droga. As propriedades
do reforçador adquirido da droga foram estudadas permitindo-se a um rato viciado os
-3 8 0 -
meios para administrar o narcótico em si próprio (Weeks 1964). O rato viciado trabalhava
numa caixa de Skinner onde cada pressão à barra inicialmente produzia injeção
controlada de um narcótico selecionado. O sistema de injeção consistia de um tubo e
uma cânula pela qual a droga era levada, em solução, diretamente para a veia jugular do
rato (Fig. 16-18). Os resultados mostram que ratos viciados adquirem a R de pressionar a
alavanca quando isso leva a várias quantidades de morfina. Curvas típicas de RF
associadas com razões variando entre 10 e 400 pressões à barra para uma única injeção
demonstram a natureza extremamente poderosa do reforçador morfina. Embora
ocorressem periodieidades de pouca duração no vdor reforçador adquirido (efeitos de
saciação), a duração a longo prazo do reforçador era indefinida. Um macaco trabalhando
sob condições semelhantes a essas descritas para o rato permaneceu viciado por 21 meses
(Weeks 1964). A técnica revela-se promissora em trazer resultados que podem sugerir os
procedimentos a serem usados no controle das propriedades do reforço de drogas, uma
vez que tenha ocorrido o vício.
O controle dos reforçadores de vício tem implicações óbvias para o controle de
de vícios em humanos.
- 381 -
psychiat., 1960, 30, 676-684.
Hess, E. H. Imprinting in animals. Sci. Amer., 1958, 195, 81-90.
Hess, E. H. Imprinting. Science, 1 9 5 9 , 130, 133-141.
Hoffman, H. S., Searle, J. L., TofTey, Sharon, and Kozma, F. Behavioral
control by an imprinted stimulus. J. exp. Anal. Behav., 1966, 9,
177-189.
Kagan, J., and Berkun, M. The reward value of running activity. J. comp,
physiol. Psychol., 1954, 47, 108.
Lockard, R. B. Some effects of light upon the behavior of rodents.
Psychol. Bull., 1963, 60, 509-529.
Mayer, J. Glucostatic mechanism of regulation of food intake. New
England J. Med., 1953, 249, 13-16.
M urray, E. J. Motivation and emotion. Englewood Cliffs: Prentice-Hall,
1964.
Olds, J. Pleasure centers in the brain. Sci. Amer., Oct. 1956, 195, 105
116.
Olds, J. Hypothalamic substrates of reward. Physiol. Rev., 1962, 42,
554-604.
Olds, J., and Milner, P. Positive reinforcement produced by electrical
stimulation of septal area and other regions of rat brain. J. comp,
physiol. Psychol, 1954, 47, 419-427.
Pliskoff, S. S., Wright, J. E., and Hawkins, T. D. Brain stimulation as a
reinforcer: intermittent schedules. J. exp. A n a l Behav., 1965, 8,
7 5 -88.
Richter, C. P. A behavioristic study of the activity of the rat. Comp.
Psychol Monogr., 1922,1, No. 2.
Richter, C. P. Animal behavior and internal drives. Quart. Rev. B iol,
1927,2, 307-343.
Rosenzweig, M. The mechanisms of hunger and thirst. Chap. 3 in L.
Postman (E d .), Psychology in the making. New York: Knopf,
1962.
Sanford, F. Psychology, a scientific study of man. Belmont, Calif.: W ads
worth, 1961.
Templeton, R. D., and Quigley, J. P. The action of insulin on the mobility
of the gastro-intestinal tract. Amer. J. Physiol , 1930, 91, 467-474.
Weeks, J. R. Experimental narcotics addiction. Sci. Amer., Mar. 1964,
210, 46 -5 2 .
- 382-
Capítulo 17 CONTINGÊNCIAS AVERSIVAS
Nossas discussões sobre o comportamento operante têm, até aqui, lidado exclusiva
mente com casos em que, pela manipulação da correlação entre uma classe especifica
da de resposta c eventos tais como alimento c água, ocorrem certas mudanças no
comportamento. Aquisição, discriminação, esquemas dc reforçamento, diferenciação,
aproximações sucessivas e encadeamento são as denominações dos procedimentos
específicos que ditam a forma precisa da correlação resposta-reforçamento. O termo
impulso agrupa as variações 110 comportamento operante que estão sob o controle dc
operações que alteram o valor reforçador daqueles reforçadores. Em todos os diversos
procedimentos tratados, o comportamento é mantido por reforçadores que são
definidos como estímulos que têm a habilidade de aumentar a probabilidade das
respostas que seguem. Volt amo-nos, neste capítulo, para uma nova classe de estímulos
reforçadores que não preenchem essa definição de reforçadores positivos, embora
modifiquem c mantenham o comportamento de maneira característica.
Pouco mais do que a observação casual é necessária para se detetar que, sob
circunstâncias apropriadas, a re m o ç ã o de certos eventos ambientais exerce efeitos
comportamentais poderosos. Observamos que as aves encontram abrigo durante as
tempestades, os cães dirigem-se para a sombra quando o sol do verão incide sobre eles
e as pessoas fecham as janelas quando o barulho do tráfego está alto. Nesses exemplos,
o comportamento emitido remove ou termina algum evento ambiental tal como chuva,
calor e luz, c barulho, listas observações sugerem a existência de uma classe distinta de
eventos reforçadores. Como a operação que define esses eventos como reforçadores
(sua remoção) e oposta, cm caráter, àquela dos reforçadores positivos (definida por sua
apresent ação), eles são conhecidos como re fo rç a d o re s n e g a tiv o s (S~ ). Em geral, os
reforçadores negativos constituem-se daqueles eventos c u jo té rm in o (ou redução 11a
intensidade) fortalecerá c manterá operantes.
Os reforçadores negativos incluem os eventos que, no linguajar comum, chamamos
de “ irritantes” , “ desconfortáveis” , “ dolorosos” , “ desagradáveis” , “nocivos” c assim por
diante. A maioria desses termos envolve um domínio de referência não compor tame n-
tal que, provavelmente, não será adequado para uma análise funcional. Com um
-383-
sinônimo para reforçador negativo, o termo “ aversivo” é mais neutro que qualquer um
desses adjetivos e tem a vantagem dc sugerir a noção apropriada de “evitar” , “mover-se
para longe de ” ou “ fugir de” uma situação. No laboratório, os estímulos aversivos
têm, tipicamente, a forma de choques elétricos, imersão prolongada na água e certas
intensidades de luz, som e temperatura,
elétrico
Figura 17-1. Labirinto em T para estudar o comportamento de fuga (segundo
Meunzinger e Fletcher, 1936).
- 384-
( “erros” ). Nas primeiras tentativas, o virar para a esquerda ou direita são igualmente
prováveis, mas à medida que a aquisição da resposta dc virar para o lado seguro
prossegue, as respostas para o lado “ incorreto” diminuem. Vemos a tendcncia media
de 25 ratos na Fig. 17-2. Podemos inferir a partir da diminuição do número de erros
na curva da Fig. 17-2 que a resposta de virar para o lado seguro ocorreu depois de 100
tentativas de treinamento.
() processo comportamental representado na Fig. 17-2 exige que ampliemos o
nosso conceito de fortalecimento operante. As respostas podem ser fortalecidas ou
pela produção de reforçadores positivos ou pela terminação de reforçadores negativos
(S"~ ). A última variante é
s"-
R ----->S0
Uma resposta (R) conduz o organismo de uma situação aversiva, S para uma
diferente, menos aversiva, s0.
17.3 PARÂMETROS DE S“
A Fig. 17-3 esquematiza os eventos, variáveis e relações inerentes às contingências de
fuga no reforçamento negativo. As variáveis independentes de maior interesse na Fig.
17-3 são (1) a intensidade de estímulo aversivo prevalente, (2) a duração do período com
estímulo ausente, (3) a quantidade em que a intensidade é reduzida
depois da resposta, (4) a natureza da intermitcncir, se alguma, existente entre R e a
terminação ou redução de S'", e (5) o atraso, se algum, que intervém entre uma R c- o
término ou redução subsequente do estímulo.
- 385-
duração do redução parcial
período sem na intensidade
intensidade
estímulo / do estímulo
I— I contingência ! atraso na
intermitente ! terminação
R
j~*- tempo de reação
As respostas eram efetivas para a fuga do choque apenas depois que o choque estivesse
ligado por uma duração média de 30 seg. O procedimento gerou uma laxa moderada c
constante de pressão à barra na presença do choque. O padrão do comportamento
assemelha-se à resposta reforçada com alimento em IV
Dinsmoor c Winograd exploraram os efeitos da variação da intensidade dc S
sobre esta linha-base de resposta dc fuga em IV. Sua técnica foi a dc iniciar a sessão
com uma determinada intensidade de S—presente, digamos lOOjLiamps, obseivar a fre
qüência de resposta por um período de tempo suficiente para obter uma medida
-386-
confiável da taxa, depois dc mudar para um valor diferente dc S , digamos 400
y amps, e repetir o processo. Numa sessão de 2 horas, eles puderam obter medidas da
taxa de fuga para seis valores diferentes de intensidade de S .
O comportamento de um rato durante uma parte da sessão aparece na Fig.
17-4. O registro cumulativo mostra que cada valor dc intensidade de choque controla
uma única taxa de resposta de fuga. O efeito comportamental da mudança de um valor
dc intensidade para outro (marcada pelos traços) c quase instantâneo: independente de
sua taxa anterior, o animal muda abruptamente para uma taxa, apropriada à nova
intensidade dc choque.
Quando a taxa total dc resposta é colocada cm função da intensidade dc choque,
restrita a Fig. 17-5A. Essa função foi obtida do inesmo rato cuja curva cumulativa
aparece na Fig. 17-4. A Fig. 17-5A indica que, na faixa estudada, à medida que a
intensidade do choque aumenta a taxa de resposta dc fuga tambem aumenta
continuamente.
- 387 -
choquc elétrico Nível do ruído luz incandescente (milliamberts)
(microamperes) (millivolts) a
(A) (B) (C)
Figura 17-5. Taxa de resposta de fuga em função da intensidade do estímulo
aversivo. A abscissa está em unidades logarítmicas (A) Dinsmoor e Winograd,
1958; (B) Barry e Harrison, 1957; (C) Kaplan 1952.
-38 8-
o rato respondia prontamente ao aparecimento do clioque. Mas, quando períodos
pequenos sem choques eram a conseqüência do pressionar, os RTs ao aparecimento do
choque eram longos, indicando que estes valores pequenos de duração do período sem
choque proporcionavam pouco ou nenhum reforçamento. Não c necessário que um
operante termine completamente um estímulo aversivo para que seja fortalecido. A
1 igura 17-6. Tempo dc reação (RT) de fuga em função dc vários valores de duração
do período sem choque (segundo Dinsmoor e Hughes, 1956).
S“
i i_________ i i i i
0 seg. f -
Tempo i______ i______ i--------- 1--------- ‘--------- 1--------- 1--------- 1---------L-
F ig u r a i 7-7.
-3 8 9 -
liste procedimento age dc modo a originar um estado dc equilíbrio. O organismo
conserva uma taxa de resposta que mantém a intensidade de S * dentro de uma
pequena faixa de intensidades (usualmente baixa). Quando o S~ é choque elctrico, esse
equilíbrio é denominado nível de tolerância ao choque. O nível real mantido varia
com um número de parâmetros do procedimento e é sensível à administração de
certos agentes farmacológicos, tais como analgésicos c anestésicos. A Fig. 17-8 ilustra a
estabilidade comportamental típica que esse procedimento gera. Além disso, a figura
mostra o resultado comportamental da administração intravenosa de uma pequena
quantidade dc morfina num macaco rhesus trabalhando neste procedimento. (A Fig.
17-8 significa um registro bem detalhado e ampliado do contorno de S'” da Fig.
17-7). A injeção dc morfina é seguida rapidamente por um aumento da tolerância ao
choque a um novo nível de intensidade, que pcrmanccc pelos 40 minutos restantes
apresentados. O efeito confirma as propriedades clínicas bem conhecidas da morfina, e
sugere que o procedimento fornecc um instrumento experimental adequado para medir
as propriedades analgésicas dc várias drogas.
25
20 *
"3
d>
2 3
- , 0i f
-5
- 390 -
um desses eventos S 2 , S\ passa a (1) evocar uma CR semelhante a R2 pelas leis do
condicionamento respondente; c (2) adquirir poder aversivo.
Figura 17-9. Uma caixa do vai-e-vem para o estudo do controle de estímulo aversivo
(segundo Miller, 1951).
- 391 -
Brown c Jacobs (1949) colocaram ratos num compartimento de uma caixa do
vai-e-vcm e emparelharam um tom pulsantc h luz (S j) com 6 seg. dc choque
inevitável (SJ). Vinle e dois emparelhamentos de Sj c S2 foram administrados cm um
período dc dois dias. O choquc foi então permanentemente desligado e testaram-sc as
propriedades aversivas de Sj. A porta entre os compartimentos foi levantada, S\
apresentado e estabelecida uma contingência tal que qualquer tentativa dc pular para o
outro compartimento terminava o Sj toin-luz. 0 efeito das tentativas dc teste foi
condicionar o saltar a barreira. Desde que o choquc nunca foi apresentado no teste, esse
condicionamento deve ter sido a conseqüência da fuga do Sj tom-luz. E desde que os
ratos normalmente não tentam escapar dos tipos de tons c luzes usados neste
experimento, a operação de emparelhar os tons c luzes com o choquc deve ter sido
crítica.
Ao testar o reforçamento positivo condicionado (seção 11.1), podemos lembrar,
permitiu-se que um novo operante produzisse um S^, mas o reforçamento primário foi
removido. O novo operante foi inicialmente fortalecido em virtude do contingente,
mas, à medida que o tempo passava, o perdia o seu poder de reforçador
condicionado, uma vez que não mais estabelecia a ocasião para o reforçamento
primário. Esla perda apareceu como um declínio eventual na força do novo operante.
Um aumento similar e uma queda na probabilidade de um novo operante ocorrcin ao
se testar o podor de um estímulo aversivo condicionado. No teste da caixa do
vai-e-vcm, cada vez que tom + luz é apresentado sem choque, ocorre uma tentativa dc
extinção Pavloviana. Isto é, o tom + luz perde algumas das propriedades cliciadoras
que lhes foraih conferidas pelos emparelhamentos prévios com o choque. Com a
extinção do poder eliciador dc Sj ocorre uma redução gradual no poder de S\
reforçar negativamente uma resposta. O resultado, naturalmente, é que, cm ccrto
ponto, os ratos param de pular a barreira quando Sj é apresentado. No experimento
de Brown e Jacobs, o RT de pular a barreira ante o aparecimento de S\ diminui nas
20 primeiras tentativas do teste; então, nas 20 tentativas subsequentes, o RT começa a
aumentar, indicando que o poder controlador do tom-luz está diminuindo. Precisamos
ter essas relações dchcadas cm mente quando lidarmos com os fenômenos das seções
seguintes.
- 392-
proposição puramente descritiva: as pedras caem na terra. E, além disso» por parecer
ser uma explicação suficiente, a proposição teleológica tende a desencorajar um exame
adicional do fenômeno, pospondo assim uma análise funcional.
A explicação, na ciência, é um assunto complexo e de muitas facetas, mas alguns
estudiosos acham que ela pode ser reduzida a (1) descrições extensas dos eventos em
questão, incluindo suas relaçBes com outros eventos; e (2) familiaridade com estas
descrições e relações. A explicação científica, de acordo com este ponto de vista, é cm
grande parte um problema de fornecer relações entrelaçadas entre os fenômenos da
experiência sensorial. Eventualmente, essas relações tornam-se tão familiares que
parecem lógicas, ou auto-evidentes. Assim, as “ reformulações radicais” de uma geração
são o “bom senso” da geração seguinte. Compare este tipo de explicação com a do
tipo proposital. Embora achemos estranho, 300 anos depois de Galileu, pensar que as
pedras possuem um desejo de retornar à terra, frequentemente, content am o-nos em
considerar o comportamento como sendo dirigido pela vontade ou intenção. Todavia,
assim como o propósito é irrelevante para “explicar” a queda das pedras, também o é
para a análise do comportamento. Dizer que os organismos respondem para (a fim de)
produzir reforçadores não traz mais informação do que dizer que eles respondem
quando suas respostas são frequentemente seguidas por reforçadores.
Frequentemente, propõem-se explicações teleológicas para o comportamento de
esquiva. Ao dizermos que nos abrigamos, quando vemos uma nuvem de tempestade
para não ficarmos molhados, estamos implicitamente invocando uma explicação
proposital para o nosso comportamento. Todavia, nossa proposição (ou crença) não
constitui uma explicação no sentido técnico descrito (a saber, uma proposição de
alguma relação funcional entre o comportamento que está sendo descrito e alguma
outra variável), mas é meramente uma reproposição dos fatos — quando o céu está
escuro e trovejando, movemo-nos de um certo modo. A esquiva de um evento
ambiental que ainda não aconteceu (a chuva) dificilmente pode controlar o com
portamento presente. Supor que isto poderia acontecer é criar o problema lógico de
como explicar um evento em termos de outro evento que ainda não ocorreu. Em vez
disso, procuramos uma explicação (descrição) do comportamento em termos de
variáveis que (1) atuam por ocasião do comportamento, e (2) agiram, no passado, em
condições similares. Ao fazer isto, baseamos nossa explicação nos conceitos intro
duzidos nas três seções anteriores.
Iniciamos nossa análise do comportamento de esquiva com uma demonstração
experimental do fenômeno. Talvez encontremos, no exame cuidadoso dos eventos
comportamentais que ocorrem na situação de esquiva, algumas relações invariantes nas
quais possamos basear uma explicação mais aceitável do fenômeno.
Brogden, Lipman e Culler (1938) colocaram cobaias em rodas de atividade
individuais. Um tom de 1000 cps era apresentado ao animal e, 2 seg mais tarde, um
choque era administrado através do piso da gaiola. Se o animal corresse na roda,
fazendo-a girar 2,5 cm ou mais quando o som se iniciava, ele poderia evitar o choque.
O girar a roda através da corrida também terminava o som. Note a estrutura básica
para os paradigmas de esquiva. Primeiro, ocorre algum evento ambiental de “ aviso” (o
tom); então, após um lapso de tempo, segue-se um segundo evento ambiental, aversivo.
Enquanto isso, há uma contingência estabelecida — por um experimentador ou pela
natureza - de modo que, se uma resposta especificada ocorre entre o aparecimento do
primeiro estímulo e o aparecimento do estímulo aversivo, o estímulo aversivo é
omitido e o primeiro estímulo é terminado.
- 393-
- No experimento de Brogden, Lipman e Culler, as cobaias aprenderam a girar a
roda, e, assim, evitar o choque em quase todas as tentativas. A Fig. 17-10 relaciona o
aumento observado na percentagem das respostas de girar a roda com o número médio
de dias em que cada percentagem particular foi atingida.
100 "7*-----------
s
s
ss
80 *
/
//
/ //
/
S' 60 /
s
**s
*
I s/
$ 40 s*
//
y
20
/S
\\
V\
\\
\\\\
\
2 4 6 8
Média do número de dias de treinamento
Figura 17-10. Aquisição do comportamento de esquiva. Dados de quatro cobaias
(segundo Brogden, Lipman e Culler, 1938).
Os fatos sobre a esquiva são claros, mas sua representação é um outro problema. É
evidente que o fortalecimento comportamental observado não é condicionamento
operante por reforçamento positivo, desde que nenhum reforçador positivo era
contingente à resposta. Parece pouco provável que o girar a roda tenha sido
condicionado classicamente, uma vez que a resposta tem um caráter de emissão. Mas
será conveniente considerar a possibilidade. O paradigma
Si ——> Rj
[17.1]
S2 -----> R-2
- 394 -
aparentemente, e adequado. Note, todavia, que o Diagrama [17.11 não descreve o
efeito que o correr na roda (CR) tem sobre o choque (Sj). No verdadeiro
condicionamento Pavloviano, a CR não impede a ocorrência de S2- Quando um
cachorro passa a salivar ante um som, a salivação não evita a ocorrência de alimento.
O fato de a resposta condicionada na esquiva evitar a ocorrência de S2 pode ou
não ser significante. Brogden, Lipman e Culler supuseram que se o correr que eles
observaram era realmente uma CR, então a omissão do choque não deveria fazer
qualquer diferença no comportamento de correr. O procedimento Pavloviano é
meramente uma prescrição para emparelhar dois eliciadores. Realizou-se, então, um
segundo experimento em que o tom de 1000 cps era apresentado e, 2 seg mais tarde,
o choque era administrado como no primeiro experimento. No segundo experimento,
todavia, as respostas de correr que ocorriam antes do choque não tinham efeito na
liberação subsequente do choque. O experimento, então, proporciona um empare-
lhamento estrito de um S\ e S j. Se a resposta de correr é condicionada pelos
princípios Pavlovianos, deveríamos esperar que o novo reflexo S\ CR (Tom-Correr)
aumentasse em força.
Os resultados do experimento, vistos na Fig. 17-11, são nitidamente diferentes
daqueles do primeiro experimento, vistos na Fig. 17-10. Durante o segundo experi
mento, a força da resposta de correr flutuou, aumentando vagarosamente até um
máximo (cerca de 50 por cento das tentativas diárias no 13o. dia) e, então, declinando
até um nível baixo, próximo de zero, lá pelo vigésimo d ia (5000^ tentativa), quando o
experimento terminou. Contraste este resultado com o desempenho de 100 por cento
dos animais no primeiro experimento (Fig. 17-10) depois de apenas 8 dias (120
tentativas). O fracasso em se condicionar o correr através de um procedimento
Pavloviano elimina a possibilidade de que o condicionamento de esquiva seja um tipo
de condicionamento respondente.
dias de treinamento
1- iguni 17-11. Percentagem dc respostas dc correr, quando o correr não evita S?
(segundo liroirden. I ipinan c Cuiier, 193S). ~
- 395-
O condicionamento de esquiva nem é um fortalecimento operante por refor
çamento positivo nem um caso de condicionamento Pavloviano. Seria um tipo de
treino de fuga? Se examinarmos com atenção os dois experimentos de Brogden,
Lipman e Culler descobriremos que ambos fornecem condições necessárias para se
estabelecer um reforçador negativo secundário. No primeiro experimento, o expe
rimento de esquiva, o correr antes da apresentação do choque terminava o tom. Na
seção 17.4, mostramos que esta contingência servia para fortalecer o operante, R.
sr
R — > s0
s;
T ----->S2-
R -----> S0
-3 9 6 -
previsão teórica de que o comportamento de esquiva é, de fato, cíclico (Wertheim,
1965). A restauração ocasionai das propriedades aversivas de S\ significa que o
emparelhamento de Sj^ SJ* é, na realidade, intermitente. A intermitência, pro
vavelmente, mantém a força aversiva de S\ bem melhor do que se Si fosse
correlacionado toda vez com SJ, pelas mesmas razões porque um estímulo inter
mitentemente emparelhado com alimento é um reforçador positivo secundário mais^
durável. À medida que prossegue o treino de esquiva, os emparelhamentos de S\ e S2
tornam-se cada vez menos freqüentes, enquanto a durabilidade aversiva de Si continua
a aumentar. Em certo momento, pode se alcançar um ponto onde toda a vida restante
do indivíduo não seja bastante longa para que a correlação S j, S f ocorra novamente.
Esta discussão sobre a esquiva tem se restringido aos casos em que o S\ terminado
é um estímulo de aviso externo. Casos mais sutis de condicionamento de esquiva
ocorrem quando o próprio comportamento do organismo adquire caráter aversivo,
como no grupo de contingências conhecido por procedimento de Sidman (Sidman,
1953). Podemos fornecer, aqui, apenas um esquema do que talvez seja a variante mais
simples desse procedimento. Se um estímulo aversivo breve é liberado para um
organismo depois de T unidades de tempo sem o aparecimento de uma dada resposta,
temos a seguinte contingência em efeito:
[17.2]
- 397-
Figura 17-12. Registros cumulativos da resposta de esquiva —pressão à barra durante
a primeira sessão de treino. Os traços verticais indicam choques. O valor de T era de
30 seg. (Verhave, 1959). X
fazendo ao receber um choque, podemos dizer, com toda certeza, o que ele não estava
fazendo. Ele não estava pressionando a barra. Se estivesse, não receberia o choque.
Logicamente, todo comportamento, exceto pressão à barra, pode ser emparelhado com
choques da mesma maneira que dada ocorrência de S\ de aviso nas situações de
esquiva convencional é primeiro emparelhada com o choque. O efeito desse empare-
lhamento de comportamentos com choques na situação de esquiva de Sidman é fazer
com que uma grande parte do próprio comportamento do animal adquira propriedades
aversivas condicionadas. Depois de um certo tempo, muito do próprio comportamento
do rato, exceto sua pressão à barra, adquire o status de Si de aviso auto-administrado.
Se o rato “ foge” do seu próprio comportamento aversivo, nada há que possa fazer,
exceto pressionar a barra. Pressionando a barra, ele obtém o subproduto usual de
eventos aversivos condicionados - isto é, a esquiva de um reforçador negativo
condicionado.
17.6 PUNIÇÃO
-398-
agora, ser punidas apresentando-se cnoques na pele após sua ocorrência. A sociedade
usou, e ainda usa, o procedimento de punição, numa variedade de maneiras, para
desencorajar certos comportamentos dos seus membros. A palmatória não desapareceu
completamente de nossas escolas; espancamos nossos filhos quando eles se comportam
“mal” ; e a punição é ainda o principal instrumento da justiça. O procedimento de
punição parece ser usado frequentemente não porque funcione tão bem, mas porque
(1) tem um efeito imediato; e (2) sua liberação e/ou efeitos colaterais são quase
sempre positivamente reforçadores para a pessoa que administra a punição. Os
psicólogos clínicos e os psiquiatras referem-se aos indivíduos que são positivamente
reforçados ao punir os outros, como sádicos. Adiaremos a discussão das condições que
podem fazer surgir o comportamento sádico para o próximo capítulo.
Os efeitos imediatos da punição são facilmente observados. Uma criança que ri na
igreja pode ser imediatamente silenciada por um beliscão; um cachorro i.ue pula nas
visitas pode normalmente ser controlado por uma pancada com o jornal. Ambós,
criança e cachorro, provavelmente não serão permanentemente- curados de seus
comportamentos indesejáveis através da punição. No momento, todavia, o compor
tamento indesejável é temporariamente suprimido e essa supressão serve para propor
cionar reforçamento positivo imediato para o comportamento do punidor, tornando»
então, mais provável que ele puna no futuro.
A supressão temporária do comportamento produzida pela punição pode ser
facilmente demonstrada no laboratório, onde suas características quantitativas podem
ser apuradas. Num dos primeiros experimentos de Skinner (1938), ratos famintos
foram treinados a pressionar uma barra que produzia alimento num esquema de
reforçamento em I F . A pressão à barra foi então extinta, retirando-se o alimento.
Alguns dos ratos foram punidos durante os 10 primeiros minutos de extinção. A
punição foi na forma de um tapa forte nas patas dianteiras, liberados pela própria
barra, depois de cada pressão. O tapa consistia de um movimento inverso rápido e
forte da barra, provocado por um martelo que nela batia após cada pressão. O efeito
desses 10 min de tapa pode ser visto, comparando-se os processos de extinção de dois
ligura 17-13. Os eleitos dc uma punição leve (tapa) no processo de extinção operante
(Skin tier, 1938).
-399 -
grupos de ratos na Fig. 17-13. Está bem claro, na Fig. 17-13, que os tapas reduzem
imediatamente o responder para bem abaixo de sua taxa normal de extinção. Após os
10 min de tapas a taxa de respostas permaneceu, no primeiro dia, bem abaixo daquela
dos ratos não punidos. Esta supressão de resposta é um resultado típico da punição e
é uma especificação parcial dos efeitos emocionais da punição. Até agora, os resultados
confirmam nossa expectativa sobre a punição — ela suprime o comportamento e tem
efeito* imediato. No segundo dia de extinção, todavia, o grupo punido respondeu mais
rapidamente que o grupo não punido, de modo que,no fim de dois dias, o número
total de respostas de pressão à barra em extinção, para os dois grupos, era o mesmo.
Somos forçados a concluir que a punição leve, tal como um tapa nas patas
durante alguns minutos, não suprime permanentemente o processo de extinção
operante; simplesmente adia-o. Fosse nosso desejo eliminar a pressão à barra comple
tamente, não poderíamos usar esse procedimento, já que seu efeito é transitório.
Devemos ser cuidadosos para não supergeneralizar com base nesta única demons
tração. A punição não tem um efeito simples sobre o comportamento. Seus efeitos
dependem de muitos parâmetros do estímulo aversivo - sua força e duração, por
exemplo. Se um poderoso choque elétrico tivesse sido usado, em vez de um tapa leve.
e/ou tivesse a contingência de punição permanecido por várias horas em vez de poucos
minutos, o comportamento seria suprimido por muito mais tempo do que o foi. Além
disso, o número total de respostas no processo de extinção teria sido significantemente
atenuado, embora o tempo para alcançar o nível operante pudesse não ter sido
afetado. A menos que a punição tenha sido extremamente intensa, todavia, uma vez
que cesse, o comportamento eventualmente ressurge. Somente com estimulação
aversiva extremamente forte, a punição pode reduzir permanentemente o compor
tamento para o nível zero (Holz e Azrin, 1963). Os diferentes efeitos que a punição
pode ter sobre a resposta, dependendo da forçado estímulo aversivo, aconselham
cautela ao se fazer qualquer generalização superficial sobre os efeitos da punição.
irs
-4 0 0 -
No procedimento empregado por Skinner, apenas uma única resposta, a pressão à
barra, podia produzir o reforçamento positivo. Quando várias respostas podem
produzir o reforçamento positivo na mesma situação, a punição de uma resposta pode
facilitar o deslocamento do comportamento e, se efetuada criteriosamente, ajudar a
aquisição de novos padrões de comportamento. Num experimento de Whiting e
Mowrer (1943). ratos famintos aprenderam a percorrer o labirinto visto na Fig. 17-14.
Os ratos colocados na caixa de partida, rapidamente, adquiriram a cadeia de correr
para a caixa objetivo através do caminho curto. O comportamento está de acordo com
a Lei do Menor Esforço: dadas duas ou mais cadeias alternativas para o mesmo
reforçador, o organismo escolhe aquela que requer menos trabalho. Após a aquisição,
três procedimentos foram comparados em termos de sua habilidade para forçar os
ratos e usarem o caminho longo. Para um grupo de ratos, A, uma barreira de vidro foi
colocada no meio do caminho curto, de forma que os animais só podiam atingir a
caixa-objetivo através do caminho longo. Para um segundo grupo, B, retirou-se o
reforçamento para o percorrer o caminho curto e este só era dado se os ratos usassem
o caminho longo. Para um terceiro grupo, C, uma placa eletricamente carregada foi
colocada no meio do caminho curto, liberando um choque para os ratos que tentassem
usá-lo. Contudo, se os ratos passassem pelo choque, eles encontravam alimento.
Whiting e Mowrer obtiveram diferenças marcantes nas taxas de ajustamento a esses
procedimentos. Os ratos punidos do grupo C passaram a usar o caminho longo depois
de uma média de apenas 6 choques. O grupo da barreira foi 82 vezes à barreira antes
de mudar consistentemente para o caminho longo. 0 grupo B, sob extinção simples,
correu 230 vezes à caixa objetivo vazia através do caminho curto, antes de preferir o
longo. Evidentemente, punir uma resposta pude ajudar bastante na aquisição de outra
resposta disponível.
Esse resultado tem sido corroborado por outros experimentos. Se escolhas
incorretas são punidas e escolhas corretas são positivamente reforçadas, num labirinto
T, a aquisição é mais rápida do que se apenas se reforçar positivamente as respostas
corretas (Warden e Aylesworth, 1927). Deve-se tomar uma precaução na interpretação
de tais resultados. Embora a aquisição de comportamento possa ser acelerada pela
punição de formas indesejáveis da resposta, existe pouca evidência para indicar o que
acontece ao novo comportamento adquirido quando cessa a punição do compor
tamento indesejável. No estudo de Warden e Aylesworth, por exemplo, poderíamos
perguntar se haveria um aumento temporário nos “erros” caso os choques para as
respostas incorretas cessassem depois da aquisição.
Esses estudos sugerem uma conclusão prática. Se a punição é empregada na
tentativa de eliminar certos comportamentos, então qualquer que seja o reforçamento
que o comportamento indesejável tenha produzido, ele deve tornar-se disponível
através de um comportamento mais desejável. Apenas punir as crianças por um “mau
comportamento” na sala de aula pode ter pouco efeito permanente, salvo gerar uma
aversão duradoura pelo estudo. Os reforçadores para o “mau comportamento” devem
ser analisados e a sua obtenção deve, talvez, ser permitida através de respostas
diferentes, ou em outras situações. Se não se permite oportunidade suficiente para
atividade física às crianças, por exemplo, elas, provavelmente, serão superativas na sala
de aula, com efeitos prejudiciais para o ensino. Recessos freqüentes, contingentes ao
trabalho produtivo, em conjunção com a punição consistente da atividade indesejável,
pareceria ser uma aplicação prática dos resultados de Whiting e Mowrer. Even-
-401 -
tuaimente, a necessidade de se administrar estimuiação aversiva desapareceria, à médida
que o comportamento punido desaparecesse e fosse substituído por formas de
comportamento mais desejáveis. Mas, para que isso aconteça, parece importante
proporcionar uma alternativa recompensadora para as respostas punidas.
Uma classe de comportamento para a qual a punição pode ter efeitos muito
complicados é o comportamento que é adquirido e mantido por contingências
aversivas. Qual, por exemplo, é o efeito da punição no comportamento estabelecido de
esquiva do tipo descrito na Fig. 17-12? A evidência que temos no presente indica que,
se o comportamento é punido com o mesmo estímulo que o animal foi previamente
treinado a evitar, essa punição não reduz a força do comportamento. Em vez disso,
pode aumentar sua força! Se a punição é um estímulo aversivo diferente, entretanto,
ela terá seu efeito supressivo usual (Church, 1963; Solomon, 1964).
Um ponto crítico a ser retirado da presente discussão sobre punição é a
complexidade de seus resultados. Os efeitos da punição dependem de muitos fatores
para podermos escrever um simples paradigma de Procedimento, Processo e Resul
tados. Os Processos e Resultados dos Procedimentos de punição são variáveis e
condicionais ao tipo de comportamento que esta sendo punido, assim como aos
estados de muitas variáveis que operam no ambiente presente e passado do indivíduo
punido. Até que se desenvolvam leis gerais de punição, os subprodutos emocionais que
acompanham a estimulação aversiva sugerem que o seu emprego no controle prático
do comportamento humano deve ser efetuado com bastante cautela.
Muito do que chamamos punição nas atividades humanas toma uma forma algo
diferente da apresentação de um estímulo aversivo primário (incondicionado). Quando
punimos uma criança por mentir privando-a de seu jantar, ou quando mandamos um
homem para a cadeia por ter roubado, as conseqüências punitivas são na forma da
remoção de reforçadores positivos (condicionados e incondicionados). Ferster (1958)
estudou alguns efeitos comportamentais da remoção de um estímulo discriminativo
positivo contingente a certas respostas. No treino preliminar, a pressão à barra de
chimpanzés famintos era reforçada com alimento, num esquema de intervalo variável,
numa situação (S^), mas nunca era reforçada numa segunda situação (S^ ), As
situações eram alternadas periodicamente. Este é um procedimento padrão de dis
criminação, com reforçamento intermitente em S ^ Quando uma discriminação estável
havia sido estabelecida, o procedimento foi modificado de modo que o S ^ só aparecia
(o SD só terminava) seguindo taxas altas de resposta. A remoção do SD era
contingente a um certo padrão de respostas de pressões à barra, isto é, taxas altas. Pela
inibição das taxas altas, os chimpanzés foram capazes de evitar períodos de SA . O
efeito da contingência de Ferster foi produzir taxas de resposta anormalmente baixas
(inibição de taxas altas) que somente voltavam ao normal quando a contingência de
“punição” era retirada. É possível que a “punição” deste tipo evite alguns dos efeitos
emocionais colaterais indesejáveis dos estímulos aversivos incondicionados, merecendo
mais estudo como uma técnica adequada para controlar o comportamento.
17.7 MASOQU1SMO
-402-
punição de propriedades positivamente reforçadoras? Muenzinger (1934) mostrou que
tal inversão do valor de reforçamento pode ocorrer mesmo em nível infra-humano. Ele
treinou ratos famintos a correrem num labirinto em T, dando-lhes choque e depois
alimento, ao escolherem o braço designado. Esses ratos adquiriram a cadeia de
percorrer o labirinto mais rapidamente que os ratos controle que eram alimentados
mas não recebiam choque por escolherem o braço designado. Neste experimento e em
outros semelhantes, o choque é usado como um para respostas que são, depois,
positivamente reforçadas. Uma escolha correta no labirinto é seguida por um choque
que estabelece a ocasião para continuar até o alimento. Este procedimento deve, assim,
ser contrastado com aquele do choque para respostas em ou “ incorretas” . Às
contingências são:
R(escolha correta) - s~
R (aproximar-se) -
Sob essas condições, mesmo choques moderadamente fortes podem adquirir o status
de S^s para a aproximação ao alimento e, assim, o status de reforçadores positivos
condicionados. Num paradigma convencional de discriminação S^ - S ^ , Holz e Azrin
(1961) liberavam choques para a resposta de bicar a chave, em pombos, reforçada com
alimento em S^ mas não em S^ . Eles descobriram que o elemento de punição em S^
passou a controlar taxas apreciáveis de resposta. No teste, quando a punição era
administrada durante o S ^ , os animais começavam a trabalhar rapidamente, como se
estivessem em S^, embora nenhum alimento fosse liberado para tal resposta em S^ .
Esses animais de Muenzinger e de Holz e Azrin realmente pareciam ser masoquistas.
Eles pareciam trabalhar para serem punidos. Quando apreciamos a história que
transforma choques elétricos, em SDs para respostas que podem ser positivamente
reforçadas, talvez estejamos em vias de compreender as causas do masoquismo
humano.
- 403 -
Holz, W. C., and Azrin, N. H. Discriminative properties of punishment.
J. exp. Anal. Behav., 1961, 4, 225-232.
Holz, W. C., and Azrin, N. H. A comparison of several procedures for
eliminating behavior. J. exp. Anal. Behav., 1963, 6, 399-406.
Kaplan, M. The effects of noxious stimulus intensity and duration during
intermittent reinforcement of escape behavior. J. comp, physiol.
Psychol., 1952, 45, 538-549.
Miller, N. E. Learnable drives and rewards. Chap. 13 in S. S. Stevens
(E d .), Handbook of experimental psychology. New York: Wiley,
1951.
Muenzinger, K. F. Motivation in learning: I. Electric shock for correct
responses in the visual discrimination habit. J. comp. Psychol.,
1934,17, 439-448.
Muenzinger, K. F., and Fletcher, F. M. Motivation in learning, VI.
Escape from electric shock compared with hunger-food tension in
the visual discrimination habit. J . comp. Psychol., 1936, 22, 7 9 -9 1 .
Sidman, M. Two temporal parameters of the maintenance of avoidance
behavior by the white rat. J. comp, physiol. Psychol., 1953, 46,
253-261.
Skinner, B. F. The behavior of organisms. New York: Appleton-Cen-
tury, 1938.
Solomon, R. L. Punishment. Amer. Psychologist, 1964, 19, 239-253.
Verhave, T. Avoidance responding as a function of simultaneous and
equal changes in two temporal parameters. J. exp. Anal. Behav.,
1959,2, 185-190.
Warden, C. J., and Aylesworth, M. The relative value of reward and
punishment in the formation of a visual discrimination habit in
the white rat. J. comp. Psychol., 1927, 7, 117-127.
Weiss, B., and Laties, V. G. Titration behavior on various fractional
escape programs. /. exp. Anal. Behav., 1959, 2, 227-248.
Weiss, B., and Laties, V. G. Characteristics of aversive thresholds m ea
sured by a titration schedule. J. exp. Anal. Behav., 1963, 6, 563
572.
Weitzman, E. D., Ross, G. S., Hodos, W., and Galambos, R. Behavioral
method for study of pain in the monkey. Science, 1961, 133, 37-38.
Wertheim, G. A. Some sequential aspects of IRTs emitted during Sidman-
avoidance behavior in the white rat. J. exp. Anal. Behav., 1965, 8,
9-15.
Whiting, J. W. M., and Mowrer, O. H. Habit progression and regression
— a laboratory investigation of some factors relevant to human
socialization. J. comp. Psychol., 1943, 36, 229-253.
-404-
Capítulo 18 COMPORTAMENTO EMOCIONAL
Antes do fim do século dezenove, pensava-se que a emoção era um estado interno
do organismo que, quando induzido, causava um comportamento apropriado por parte
deste organismo. Assim, do ponto de vista tradicional ou clássico, a emoção era uma
causa do comportamento. Ouando, por exemplo, um veado vê um urso (S), surge o
mêdo (um estado corporal) que é seguido por uma R apropriada, correr. Similarmente,
um homem quando contrariado (S), torna-se zangado (estado corporal) e sua raiva
torna-o agressivo, R.
Os comportamentos manifestos supostamente induzidos por estados emocionais
- 405 -
foram classificados bem cedo, e Charles Darwin escreveu um tratado clássico des
crevendo sua utilidade biológica. O medo, por exemplo, induzindo à precaução, pode ter
salvo a vida de muitos animais na história da evolução. Assim também a raiva
pode ter sido útil para destruir certas barreiras físicas que evitavam a conclusão de uma
cadeia de comportamento que levaria a um reforçador biologicamente significante.
Outras emoções, tal como a alegria, Darwin supôs serem úteis para o objetivo de
comunicar a outros organismos próximos que nenhuma ação agressiva viria, e que os
comportamentos cooperativo, sexual e outros seriam agora seguros e reforçadores.
Darwin descreveu as posturas elaboradas c os respondentes pelos quais as emoções de
raiva, medo e alegria são “expressas” nos animais (Fig. 18-1). Poderiam ser iden
tificados padrões de resposta bem definidos que eram, de alguma forma, peculiares à
espécie e, mesmo assim, apresentavam elementos comuns entre as espécies. O
enrijecimento dos lábios de um homem com raiva, revelando seus dentes caninos, era
interpretado como um vestígio da retração da boca dos animais que preparam seus
dentes afiados para atacar um agressor. Hoje, raramente mordemos quando com raiva
mas esse padrão de vestígio ainda está conosco.
As explicações de Darwin enfatizam o que podemos chamar de aspectos
Figura 18-1. Hostilidade e nl'ah ií ida do cm animais. (1) Hostilidade no cão. (2)
Afabilidade no cão. (3) Hostilidade no gato. (4) afabilidade no gato (de Darwin,
1872, segundo Yoimc, 1%1). " "
- 406-
topográficos do comportamento emocional. William James, escrevendo no fim do século
dezenove, estava mais interessado na seqüência de causa e efeito na emoção. Em
particular, ele estava interessado em refutar a idéia de que os estados internos
causassem o comportamento emocional. James propôs que as mudanças somáticas na
emoção (respondentes fisiológicos) não eram a causa do comportamento manifesto,
mas sim o resultado de padrões comportamentais que eram eliciados diretamente pela
situação. “ 0 bom senso diz: perdemos nossa fortuna, ficamos tristes e choramos*
encontramos um urso, assustamo-nos e corremos; somos insultados por um rival,
ficamos com raiva e lutamos” (James, 1890). James argumentou, todavia, que a
“ proposição mais racional é que nos sentimos tristes porque choramos, raivosos
porque lutamos, medrosos porque trememos e não que choramos, lutamos ou
trememos porque estamos tristes, zangados ou com medo, como seria o caso” (James,
1890). James inverteu, assim, a seqüencia clássica dos eventos na emoção.
Na explicação de James, assim como em todas as tradicionais, o “sentimento” de
emoção, fosse uma causa ou um efeito, tinha um papel crítico.
“fi quase impossível, para mim, pensar que tipo de emoção de medo restaria se
não estivessem presentes o sentimento da aceleração dos batimentos cardíacos e da
respiração ofegante, do.tremor dos lábios e dos membros enfraquecidos, dos arrepios e
das contrações viscerais. Pode-se fingir um estado de raiva e não se apresentar uma
excitação no peito, não ficar com a face vermelha, não se dilatar as narinas, não
ranger os dentes, não se ter um impulso para a ação vigorosa...? E, tal como na
tristeza, o que seria dela sem suas lágrimas, seus soluços, sua sufocação do coração e
suas dores no peito? ” (James, 1890).
A descrição de James implicava em que os estados corporais que acompanham os
comportamentos emocionais ofereciam uma base para definir as emoções.
Nas décadas de 1920 a 1930, Walter Cannon, um fisiólogo, contestou as sugestões
de James de que as emoções eram distinguidas por estados corporais especiais. Cannon
argumentava que ( 1 ) os estados fisiológicos para muitas emoções diferentes eram
muito semelhantes e não podiam ser distinguidos; raiva e ansiedade, por exemplo,
proporcionavam mudanças idênticas em muitos respondentes. (2) Os respondentes da
emoção ocorriam em estados não emocionais, tais como exposição a um vento gelado,
exercício pesado e febre. (3) A droga adrenalina, quando injetada em sujeitos
humanos, produz os respondentes típicos de medo (dilatação dos bronquíolos,
constrição dos vasos sanguíneos, liberação de açúcar do fígado, aumento nos batimen
tos cardíacos, cessação da função gastro-intestinal, etc.) embora os indivíduos assim
injetados não relatassem emoção (Cannon, 1927).
Cannon aduziu outra evidência para provar que o “ sentimento” de emoção não
poderia ser apenas o resultado de mudanças respondentes que ocorrem em situações
emocionais e, então, apresentou uma teoria própria. Os eventos internos que
relatamos como “sentimentos” são mediados por uma região especial do cérebro, o
tálamo. Sua hipótese foi baseada nos efeitos de lesões e estimulação elétrica dessa
região do cérebro no comportamento emocional.
18.2 TRÊS CONCEITOS DE EMOÇÃO
-4 0 7 -
Diagramas da Fig. 18-2 resumem esses pontos de vista históricos. (Lê-se ->com o “ conduz
Clássico"---- S -----►
emocional
James (1890)—S
Comportamento
emociona]
Eventos
Cannon (1927)- S
emociona]
Figura 18-2. Representação esquemática de três teorias históricas da causação
emocional.
- 408-
O problema dos eventos privados é particularmente enfatizado na emoção apenas
porque o comportamento emocional manifesto é frequentemente acompanhado por
mudanças viscerais (estômago, coração, pulmões, etc.) e glandulares intensas e amplas.
Sejam ou não esses eventos mais fortes quando se diz que o comportamento e
“emocional” , a metodologia para o estudo da emoção é exatamente a mesma que a de
outros processos comportamentais. Os sentimentos que podem acompanhar os eventos
viscerais sempre apresentam o problema de serem privados e, portanto, de exclusão
científica, por mais vívidos_que possam ser para a pessoa que os está experimentando.
Uma suposição razoável é a de que os eventos privados inacessíveis que chamamos de
sentimentos estão correlacionados com estados fisiológicos particulares que são aces
síveis à observação, dada a instrumentação necessária. É realmente recomendável
dirigir-se para dentro do organismo e investigar as propriedades dos processos
fisiológicos concomitantes com o comportamento manifesto e isto desempenha um
papel importante no desenvolvimento de um quadro compreensivo de qualquer
fenômeno comportamental. Mas tal investigação fisiológica não substitui a necessidade
de uma informação sólida sobre o comportamento e seus determinantes ambientais.
Padrões reflexos. Se desviarmos nossa atenção dos eventos privados, descobrimos
que o problema da seqüência de situação, sentimento e comportamento não mais nos
preocupa da mesma maneira que preocupou James e Cannon. Desde que os sentimen
tos reais não são mensuráveis ou manipuláveis diretamente, não é de interesse crítico,
para nós saber se eles ocorrem antes, depois ou ao mesmo tempo que o com
portamento. J. B. Watson, o homem que tanto preparou a psicologia para a análise
moderna do comportamento, parece ter sido um dos primeiros a ver isso e, em seus
escritos, encarava a emoção como padrões especiais de respostas, eliciados inicialmente
por estímulos incondicionados. Esses padrões, ele notou, poderiam ser ligados a
estímulos previamente neutros, através de procedimentos de condicionamento
Pavloviano. Partindo de estudos em recém-nascidos, Watson concluiu que havia somente
tres de tais padrões que legitimamente eram qualificados como emoções padrões X, Y
e Z. A Tabela 18-1 resume o esquema de Watson. Evidentemente, os três padrões
emocionais primários da Tabela 18-1, X, Y e Z, são os protótipos do que mais
comumente chamamos de raiva, medo e alegria. De acordo com Watson, todas as
outras emoções são baseadas nessas três, como misturas ou combinações que surgem
através de procedimentos complexos de condicionamento Pavloviano.
Watson preparou uma demonstração simples para mostrar como o condiciona
mento amplia os controles da emoção. Para uma criança Albert de 11 meses de
idade, Watson mostrou um rato (S j) nunca antes temido e emparelhou a presença do
rato com umas poucas apresentações de um som alto súbito (S 2 ), produzido pela
batida de um martelo numa barra metálica. O som amedrontava a criança (síndrome Y
de Watson), e servia como o eliciador incondicionado num paradigma Pavloviano. Em
certo ponto, o rato (S \) passou a eliciar, em Albert, uma CR que era muito
semelhante ao comportamento Y: chorar, gritar, retrair-se, etc. A forma condicionada
de medo pode ou não ser exatamente idêntica ao medo incondicionado. Para enfatizar
esse ponto, a CR baseada nos reflexos de medo incondicionado é geralmente referida
como ansiedade. Em experimentos posteriores, Watson mostrou que essa ansiedade
condicionada podia ser lentamente extinta pelo método usual — apresentação de
S\ (o rato) sem o S2 (o som alto).
Uma das vantagens importantes do tratamento das emoções feito por Watson com
-409-
relação ao de seus predecessores é que ele formulou a pergunta: quais são as causas
externas do comportamento emocional? Como o próprio Watson frisou, “nunca
ocorreu a James ou a algum dos seus seguidores neste aspecto, especular, e muito
menos experimentar, sobre a gênese das formas emocionais de resposta” (Watson,
1930, p. 142). A demonstração de Watson de que as emoções estavam ligadas aos
princípios do condicionamento Pavloviano foi um primeiro passo para a sua análise
experimental. Realmente, o capítulo presente pode ser chamado de Alguns efeitos
complexos do condicionamento Pavloviano, mas nós seguimos a tradição discutindo
esses efeitos como “emoções” .
TABELA 18-1
ELICIADORES RESPONDENTES
RAIVA (X)
Impedir os movimentos da criança segu- Chorar, gritar, endurecer o corpo. Movi-
rando sua face ou cabeça; ou segurar mentos coordenados de golpear e bater
seus braços fortemente junto ao corpo. das mãos e braços. Levantar e abaixar
pés e pernas. Prender a respiração.
MEDO (Y)
Remover subitamente todos os meios de Retenção súbita da respiração. Segurar -
sustentação (deixar cair das mãos para se (reflexos de segurar). Piscar os olhos,
ser segura por um assistente). Som alto. Franzir os lábios. Chorar.
Empurrar de repente ou balançar leve
mente (logo que começar a dormir ou
logo que acordar). Puxar de repente o
cobertor (quando está adormecendo).
ALEGRIA (Z)
Acariciar ou manipular uma zona eró- Se a criança está chorando, ela para de
gena. Fazer cócegas, balançar, embalar chorar. Aparece um sorriso. Ela emite
suavemente. Dar tapinhas leves. Colocar sons.
em decúbito ventral no joelho do assis
tente.
Operantes interrompidos. Outro passo conceituai deve ser dado para simplificar a
análise experimental de fenômenos emocionais. Watson endossou o ponto de vista
(como fez Darwin) de que as emoções primárias eram padrões complexos de resposta
in condicionada e tomou três de tais padrões como “ fundamentais”. Mas qual a
justificativa que ele possuia para limitar-se justamente a esses três em particular? Um
som alto — por exemplo, um tiro de pistola à queima-roupa — produzirá o padrão de
-410-
susto (Fig. 18-3) c uma imensidão de outros respondentes. O padrão é completado em
cerca de 1/2 scg, e contém muitos dos aspectos de um breve ataque de emoção. Mas,
por que não c chamado de uma emoção? Assim, também a tosse, o soluço, o espirro,
o lacrimejar dos olhos por causa de uma partícula de poeira, os sintomas da alergia
chamada febre do feno, a palpitação e o enrubescimento depois de exercícios pesados,
e a indigestão depois de comer muito, todos envolvem padrões complexos de
respondentes. Contudo, poucos os chamariam de emoções. O que há de especial com as
reações X, Y, Z que elas, e não esses outros padrões, devem receber um status
especial e ser denominadas “emoções”? Nenhuma resposta satisfatória foi dada, ainda,
a esta questão. Não foram encontrados critérios adequados que possam distinguir os
reflexos emocionais dos reflexos não-emocionais. Na sua ausência, podemos supor que
a definição de emoção encontra-se em outro lugar que não nas características especiais
de certos padrões reflexos.
Um aspecto primordial de todas as emoções é a ruptura, distúrbio, intensificação
ou mudança geral que ocorre em qualquer de uma variedade de comportamentos
arbitrários nos quais um indivíduo possa estar empenhado no momento em que ocorre o
que nòs chamamos de uma situação emocional. Realmente, um homem amedrontado é
mais facilmente identificado pela depressão marcante de todas as suas atividades usuais
l iguni 1R-3. Resposta dc susto a uni tiro dc pistola (Lands c Hunt, 1939).
- rr* -
dessas mudanças amplas, e rião dos padrões reflexos ou dos estados corporais, que se
mostrará o esquema mais conveniente para estudar as emoções.
As operações que fazem aparecer essas mudanças amplas consistem de dois tipos
principais: ( 1 ) a apresentação ou término de reforçadores primários poderosos, e ( 2 ) a
apresentação de estímulos que foram previamente associados com tais reforçadores
poderosos através do condicionamento Pavloviano. As mudanças amplas em muitos
comportamentos operantes associadas com essas operações poderiam ser interpretadas
como mudanças simultâneas no valor reforçador de praticamente todos os reforçadores
primários do organismo. A destruição e o estrago adquirem tal valor reforçador para o
indivíduo zangado que, momentaneamente, nada mais é importante. O homem que
está amedrontado ou desgostoso perde o apetite e o desejo sexual. As pessoas
enamoradas estão frequentemente tão envolvidas com os seus reforçadores recém-en-
contrados que elas “vivem dc amor” exclusivamente, por um período de tempo,
negligenciando o alimento e não se empenhando em outras atividades de rotina.
Pareceria que a emoção, como a motivação, classifica um grupo de operações que
modulam o valor reforçador de reforçadores primários e mudam a atividade geral do
organismo. Assim, não devemos nos surpreender em saber que muitas autoridades,
atualmente, tratam os dois tópicos como uma área unificada. De qualquer forma, há
diferenças nas espécies de operações historicamente atribuídas aos dois campos. As
operações universais antecedentes associadas à motivação são privação e saciação. Na
enioção, as operações antecedentes são mudanças abruptas de estímulo. Além disso, o
medo, a raiva e a alegria implicam em mudanças difusas, não específicas, no valor de
todos os reforçadores; fome e sede implicam em mudanças algo mais específicas num
grupo mais restrito de reforçadores.
Uma parte significante da análise da emoção como uma quebra das atividades
operantes rotineiras de um indivíduo surge dos estudos de um fenômeno de
laboratório conhecido como ansiedade experimental. A ansiedade é produzida por uma
variante da variação de Watson do condicionamento Pavloviano: um estímulo original
mente não aversivo (S l) é emparelhado com um estímulo aversivo (S J). A ansiedade é
medida observando-se os efeitos que o emparelhamento tem sobre quaisquer atividades
operantes em que o organismo possa estar empenhado. Desde que somos limitados na
faixa de estímulos aversivos que poderíamos desejar apresentar para um organismo
humano, geralmente podemos escolher entre macacos, ratos c pombos para serem
sujeitos. Para manter esses animais em atividades operantes por períodos substanciais,
podemos privá-los de alimento ou água e, então, treiná-los a pressionar uma barra ou
bicar uma chave com reforçadores positivo intermitente. Uma vez completado esse
treino, temos um organismo que manterá uma taxa moderada de comportamento
operante por um longo período de tempo, uma preparação a partir da qual podemos
administrar procedimentos de condicionamento Pavloviano
Um experimento clássico de ansiedade condicionada, é o de W. K. Estes e B. F.
Skinner (1941) usando um procedimento Pavloviano superposto a um operante
reforçado intermitentemente, como salientamos. Certos refinamentos dc procedimento
foram introduzidos por Hunt c Brady (1951, 1955) e e sua técnica experimental que
descreveremos. Eles treinaram ratos privados dc líquidos a pressionar uma barra poi
-41 2-
água ò, então, coíocaram o comportamento sob um esquema IV de reforçamento com
água. Quando o comportamento em IV se tornou estável, foram feitos jmparelhamen-
tos Pavlovianos, periodicamente, com um clique (S j) soando por 5 min, seguido por
um choque elétrico breve (S2 ) nos pés do rato.
Legenda
Clique introduzido em C,
terminado pelo choque
em S após 5 min.
Tempo
I'igura lfl-4. A resposta cie ansiedade condicionada ((’AR) no rato, como aparece
tipicamente no comportamento operante de pressionar a barra positiva e intermiten
temente reforçado (Hunt e Bradv, 1951).
-413-
Algumas das mudanças comportamentais típicas que se seguiram podem ser vistas
nas curvas cumulativas de pressão à barra da Fig. 18-4. Estas curvas descrevem
distúrbios no operante reforçado por água que estava ocorrendo, distúrbios estes que
surgiram devido ao emparelhamento Pavloviano de S\ comS 2 . Na Fig. 18-4A, o rato
estava trabalhando estavelmente na barra. Os reforçamentos com água não são vistos,
mas vários foram fornecidos durante o período visto em (A). A primeira tentativa de
condicionamento Pavloviano (S i, S2 )é vista em (B). Note que, neste estágio, o clique,
S i, não tinha efeito perceptível na pressão à barra. O choque, todavia, quando
apareceu, resultou numa breve diminuição da taxa, mas logo o rato estava novamente
trabalhando com estabilidade. O procedimento de emparelhamento foi repetido em
intervalos. Depois de alguns emparelhamentos, ocorreu uma mudança que pode ser
vista na parte central, à esquerda, na Fig. 18-4. O rato começou a responder
irregularmente e com taxa reduzida durante o clique. Enquanto isto, a resposta original
ao choque começou a se adaptar (seção 18.9), de modo que o choque, em si, afetava
cada vez menos a pressão à barra. Depois de um número de emparelhamentos (em
baixo, à direita, na Fig. 18-4), ocorre uma cessação quase completa de pressão à barra
no período de clique. O comportamento operante em processo foi quase completa
mente interrompido pelos emparelhamentos; havia se desenvolvido a ansiedade condi
cionada, na forma de uma supressão condicionada da pressão à barra positivamente
reforçada. A observação do rato durante o período de clique, revelou os reflexos
característicos do medo: retração, tremor, palpitação, imobilidade, defecação e micção.
A ansiedade condicionada tem sido verificada em um número de espécies e com
um número de esquemas de linha-base de reforçamento positivo. O resultado geral é
uma supressão do responder desenvolvido durante o estímulo de aviso. A supressão é
duradoura; pombos mantiveram-na após um período de 2 anos de descanso (Hoffman.
Fleshier, e Jensen, 1963). Logicamente, então, os efeitos do procedimento de
ansiedade são consistentes e duráveis. Mas há alguma razão para se acreditar que o que
estamos estudando em animais no laboratório tem alguma coisa a ver com a ansiedade
como a conhecemos no homem?
- 414 —
300 450 670 1000 1500 2250 3400
F re q ü ên cia (ciclo s p o r seg u n d o )
nada em pombos cuja resposta de bicar era mantida por um esquema de refor
çamento com alimento em IV 2 min. Um tom de 1000 ciclos foi usado como
Si e um choque elétrico no corpo do animal como S2 - Após repetidos empare-
lhamentos de Si e S2 , o bicar a chave foi suprimido em Si. Então, o choque foi
permanentemente interrompido, tons de várias freqüências foram apresentados no
decorrer de 25 sessões-teste e qualquer supressão a eles foi medida. A Fig. 18-5, de
um animal típico, mostra que no decorrer das sessões 1-5 (a curva superior acima),
ocorreu, quase completa supressão a uma faixa ampla de tons; o gradiente é achatado.
Nas sessões subsequentes o gradiente tornou-se gradualmente mais inclinado, à medida
que o animal restringia o bicar a chave, bicando na presença daqueles tons mais
remotos do S\ dc treino. Mas, mesmo depois de 25 sessões sem choques, ainda ocorria
uma supressão quase perfeita para o Sj original do treinamento. Esses gradientes de
generalização indicam, primeiro, que a ansiedade pode se espalhar para condições
muito diferentes daquelas que originalmente a produziram e, segundo, que a ansiedade
condicionada, uma vez produzida, pode ser extremamente resistente à extinção.
Podemos resumir a informação apresentada sobre ansiedade experimental em seu
paradigma.
DADOS: Um operante, previamente fortalecido com reforçamento positi
vo, um eliciador aversivo incondicionado, um estímulo‘‘neutro”
PROCEDIMENTO: (1) um operante é mantido num esquema intermitente de
reforçamento positivo, por exemplo R - ü > S'h
( 2 ) Enquanto as contingências de reforçamento positivo
permanecem em vigor, S\ é ocasionalmente emparelhado com
S2 •
-41 5-
PROCESSO: Ocorre uma supressão gradual da taxa de R sempre que
S\ é apresentado.
RESULTADO: R é suprimida em alguma extensão mensurável durante S] e
outros Ss relacionados.
Nossa avaliação do paradigma de ansiedade experimental revela que o emparelha-
mento de um estímulo previamente neutro com um estímulo aversivo, enquanto o
organismo está empenhado em outras atividades, produz certos efeitos drásticos, e
duráveis naquelas atividades. Geralmente, as “outras atividades” têm se restringido ao
comportamento mantido por esquemas dc reforçamento intermitente. Um perfil mais
completo dos efeitos emocionais incluiria informações sobre discriminação, diferencia
ção, encadeamento, solução dc problema, esquiva e outras linhas-base comportamen
tais. Existem razões para se esperar efeitos característicos em cada um desses casos.
Frequentmente, diz-se que a ansiedade moderada facilita a solução de problema,
enquanto que a ansiedade forte a dificulta. Os procedimentos de ansiedade condicio
nada permitem testes objetivos dessas e de outras afirmações. Os efeitos dos
procedimentos de ansiedade condicionada são seguramente mais complexos do que
qualquer proposição simples de “supressão” . Já se sabe que o procedimento de
emparelhar S j , S J >quando superposto a uma linha-base dc esquiva, pode gerar
facilitação da resposta, em vez de supressão. (Sidman, 1960).
A ansiedade experimental, na forma dc supressão da resposta intermitentemente
reforçada, tem se mostrado um instrumento de utilidade prática para o estudo de
diversas variáveis experimentais. Brady e Hunt (1955) descobriram que podiam
eliminar temporariamente a ansiedade experimental liberando corrente suficiente, no
cérebro do rato, para produzir convulsões (um procedimento chamado de ECC o
“choque cletroconvulsivo” , comum na prátioa psiquiátrica). A supressão condicionada
é previsivelmente afetada por tranqüilizantes que controlam os sintomas da ansiedade
humana. Outros pesquisadores têm estudado os efeitos de várias lesões cerebrais na
supressão condicionada, na busca de estruturas do sistema nervoso central que são
críticas para o comportamento emocional (Brady, 1961, 1962).
18.4 RAIVA
-416-
verbalmente, causar danos físicos a alguém, quebrar objetos, retirar-se vigorosamente
da situação, gritar e xingar. Cada uma das causas citadas implica numa extinção súbita
de um comportamento previamente reforçado, a interrupção abrupta de uma cadeia de
comportamento.
Azrin, Hutchinson e Hake (1966) planejaram uma técnica para medir experimen
talmente a duração e frequência de comportamentos agressivos que resultam da
interrupção de uma cadeia dc comportamento. Nesta técnica, um pombo faminto foi
treinado a bicar uma chave por alimento. Quando o pombo experimental havia
adquirido o comportamento de bicar a chave, um segundo pombo “ alvo” , imobilizado
numa caixa especialmente construída, foi introduzido no compartimento experimental
(Fig. 18-6). À caixa que continha o pombo-alvo foi montada de maneira que um
interruptor, colocado sob a caixa, desligava, sempre que esta era sacudida vigorosamen
te. A montagem foi cuidadosamente equilibrada, de modo que os movimentos normais
espontâneos do pombo-alvo eram insuficientes para acionar o micro-interruptor, ao
passo que, quaisquer ataques vigorosos que o pombo experimental dirigisse ao corpo
exposto do pombo-alvo seriam registrados. Os ataques ocorreram dentro da previsão.
Sempre que as contingências de reforçamento eram mudadas abruptamente de crf para
extinção, o pombo experimental, invariavelmente, atacava, o alvo. Os ataques eram
viciosos e agressivos, durando ate 10 minutos.
Os resultados paralelos da interrupção de uma cadeia de comportamento reforça
do, tanto em animais como em homens, confirmam a generalidade do paradigma de
frustração. Seu procedimento é, simplesmente, uma extinção abrupta de um operante
após reforçamento contínuo. Seus resultados são mudanças amplas na topografia do
comportamento, acompanhadas por mudanças no valor reforçador da destruição,
estrago e outros atos agressivos.
São esses comportamentos de raiva condicionados da mesma maneira que o medo
foi condicionado na seção anterior? Num estudo relevante Leitenberg, (1966) treinou
Proteção
- 417 -
ratos, a pressionarem uma barra com relorçamento positivo num esquema IV . Durante
a sessão, foi apresentado um ‘‘estímulo de aviso” (S i), seguido poucos minutos mais
tarde por um segundo estímulo (S^ 2 ),que indicava que um período de extinção para a
pressão à barra havia entrado em efeito. O procedimento é análogo ao procedimento
de ansiedade condicionada, mas um estímulo correlacionado com extinção ( S 4 )
substitui, aqui, o choquc (SA). Depois de poucos emparelhamentos, os ratos de
Leitenberg, aumentaram suas respostas no estímulo de “ aviso” , embora tal aumento na
taxa não produzisse mais reforçamento. _
Podemos especular que essa facilitação da taxa de resposta representa uma
“resposta condicionada dc raiva” , mas o procedimento de Leitenberg, é apenas
sugestivo. Muitos aspectos do comportamento não foram medidos para que possamos
estar certos de que, durante o estímulo de aviso, a probabilidade de comportamentos
agressivos tais como o ataque ou o responder anormalmente intenso pode também ter
sido aumentada.
18.5 ELAÇÃO
- 418 -
menos 5 min (drl 5 min, ver seção 8 . 6 ). Quando a taxa de resposta parecia estável,
um paradigma Pavloviano foi superposto às contingênicas operantes. S\ era uma
mudança na cor da chave seguida depois de algum tempo por S2 , uma apresentação
“livre” de alimento, idêntica ao reforçamento usado para manter a linha-base, exceto ,
que a apresentação “livre” de alimento não era contingente a uma bicada na chave. O
procedimento de Herrstein e Morse produziu uma mudança dramática na taxa de bicar a
chave durante S]. Antes do procedimento Pavloviano, uma taxa muito baixa e
razoavelmente constante de bicar havia sido mantida Depois do procedimento
Pavloviano estar em efeito por algumas sessões, todavia, taxas altas de bicar desenvol
veram-se durante S \. A Fig. 18-7 mostra os registros cumulativos da sessão 11 para
seis sujeitos. Em a, o S\ era apresentado, (f indica a apresentação de , alimento).
Neste experimento, S\ era prolongado por 1 min além dc s j e terminava em b
embora, aqui, nos preocupemos somente com os efeitos da taxa de a a f. A Fig. 18-7
indica que a maioria dos animais mostra um aumento da taxa a (S \) que dura,pelo
menos, até f (S 9 ). 0 aparecimento rápido do efeito parece anular a possibilidade de
que o aumento da taxa seja devido a qualquer relação supersticiosa do bicar com 0
reforçamento livre.
-419-
Experimentos semelhantes usando uma linha-base reforçada em IV com alimento e
estimulação cerebral positivamente reforçadora (ver seção 16.3) como também
demonstram uma facilitação condicionada (Fig. 18-8) durante um estímulo que
consisten temente precede a estimulação cerebral (Brady, 1961).
Um efeito ainda mais sutil desse tipo geral foi observado por Pliskoff (1963). 0
comportamento pode ser mantido sob vários esquemas IV. alternados diferentes, sendo
que cada IV fica em efeito por um tempo limitado e cada IV é correlacionado com
um estímulo especial. Sc um estímulo de aviso (S j) é apresentado antes da mudança
(S 2 ) de um IV com um intervalo médio maior entre as oportunidades de reforçamento
para um comum intervalo médio menor (digamos IV 2 min para IV 1/2 min), podem
ocorrer certas mudanças no responder durante o estímulo de aviso. Quando a mudança
é de um intervalo médio longo para um pequeno, como acabamos de descrever, o
organismo está, na verdade, mudando de um esquema menos favorável para um mais
favorável. O procedimento de Pliskoff produziu uma supressão moderada na taxa dc
resposta durante o estímulo de aviso, sugerindo que uma operação dc “elação” pode
nem sempre aumentar as atividades operantes.
I igura 18-8. 1 acilitação condicionada numa linha-basc cm IVm reforçada com alimento
resultante do emparelhamento de S| com um choque cerebral positivamente reforçador.
(Brady, 1961)
O estabelecimento das condições gerais que produzem supressão e daquelas que
produzem facilitação esperam por mais trabalho experimental sobre os efeitos emocio
nais gerais dc $3 c do emparelhamento de Sjs com S+s em outras linhas-base
comportamentais. Os poucos estudos descritos indicam como as emoções positivas
podem ser encaradas como mudanças condicionávcis no comportamento operante em
processo.
Esta seção c as duas precedentes completam nossa análise dos efeitos comporta
mentais dc três categorias de operações produtoras de emoção. As operações são
reflexas, os comportamentos operantes. Mesmo assim, ao contrário dos fenômenos
operantes comuns, esses que denominamos “emocionais” referem-se a mudanças em
operantes que não são produzidas diretamente pela alteração de suas conseqüências de
reforçamento. Nenhum dos efeitos da ansiedade, raiva ou elação torna o reforçamento
- 420 -
positivo mais provável ou o reforçamento negativo menos provável. O rato “ ansioso”
na Fig. 18-4 recebe choquc caso haja ou não supressão. O pombo “ com raiva” que
bica seu companheiro vigorosamente não restabelece, através disso, o reforçamento. O
rato “ alegre” dc Brady (Fig. 18-8) não acelera a ocorrência da estimulação cerebral
por responder rapidamente. Assim, embora as mudanças medidas no comportamento
sejam mudanças nas taxas de operantes, elas não são controladas diretamente pelas
contingências de reforçamento dc nenhum dos operantes afetados.
Dizer que um efeito emocional não é útil, aqui e agora no ambiente de laboratório
do animal, ou no ambiente do homem civilizado, para influenciar a probabilidade dc
reforçamento, não significa que ele não possa ter sido alguma vez útil para influenciar
a probabilidade de reforçamento e que não possa ser útil cm outros ambientes. Fm
particular, o comportamento emocional pode ter sido extremamente útil para os
ancestrais do indivíduo cujo comportamento emocional estamos agora testemunhando.
As sugestões de Darwin a respeito da utilidade biológica dc comportamentos emocio
nais no ambiente natural já foram salientadas (p. 406). Tais especulações estão de
acordo com os fatos conhecidos dc que os rcspondent.es emocionais são mediados por
partes do sistema nervoso que, na maioria, são filogcncticamcntc mais velhas que as
partes desse sistema que controlam as capacidades para adquirir comportamentos
operantes complexos. Os comportamentos emocionais parecem estar entre aqueles
comportamentos primitivos cujas potencialidades estão estabelecidas c, como outros
reflexos, eles estão sob o controle de princíoios Pavlovianos cm vez de operantes.
-421 -
istas cujo tamanho varia dc três a várias dúzias dc emoções básicas. Nenhum critério
satisfatório para selecionar as emoções primárias ou fundamentais foi ainda encontra
do, nem foram analisados detalhadamente os métodos de composição.
Nossa consideração começa com a afirmação dc que os três padrões citados por
Watson (Tabela 18-1) e descritos como mudanças operantes nas três seções precedentes
constituem os três padrões emocionais fundamentais. Seu status fundamental deriva-se
do fato de que ( 1 ) em sua forma incondicionada, seus procedimentos exaurem as
possibilidades de apresentação c remoção dc reforçadores primários positivos e
negativos, e ( 2 ) em sua forma condicionada, seus procedimentos exaurem as possibili
dades de paradigmas Pavlovianos simples. A Tabela 18-2 resume as operações
Pavlovianas c alguns dos seus efeitos comportamentais conhecidos. Na Tabela 18-2, um
traço diagonal em S c uma abreviação da notação que indica o término do evento
estímulo reforçador. Pode-se observar que a coluna à esquerda da tabela exaure as
combinações possíveis dc um S\ com a apresentação ou termino de S+ ou S .
Existem quatro possibilidades lógicas, mas agrupamos duas delas na premissa dc que os
efeitos comportamentais de se terminar um reforçador negativo ou apresentar um
reforçador positivo sejam bastante semelhantes para permitir um tratamento conceituai
semelhante. Uma segunda suposição que simplifica é feita ao se negligenciar as diferenças
entre reforçadores particulares positivos ou negativos. Assim, a “elação” produzida
pelo emparelhamento de um S\ com um reforçador sexual não é distinguida. no
esquema da Tabela 18-2 da elação produzida pelo emparelhamento de um S\ com um
reforçador alimentar. Essas suposições constituem trabalhos hipotéticos cuja utilidade
somente a experimentação futura poderá determinar.
Tendo estabelecido três emoções “ primárias” , podemos nos voltar para o problema
de representar outras emoções. Na Fig. 18-9, as três emoções primárias aparecem como
vetores de um modelo geométrico.
Tabela 18-2
- 422-
S-
Este quadro de referência nos permite representar a noção de que algumas emoçõe:>,
aparentemente, diferentes, podem ser consideradas como correspondentes a diferenças nv
intensidade do reforçador positivo ou negativo em que estão baseadas. As emoções
retratadas nos extremos de cada vetor são baseadas nos valores mais fortes dos
reforçadores incondicionados relevantes e os termos usados para descrever os
comportamentos são escolhidos apropriadamente. À medida que nos movemos em
direção à origem, a intensidade diminui. Seguimos Plutchik (1962), ao supor que, à
medida que a intensidade diminui, os efeitos comportamentais tendem a desaparecer e
ser menos claramente distinguíveis. Isto é indicado pela escolha de um sistema que
converge em direção a um ponto (a origem) onde as três emoções se encontram. Deve
ficar claro que um grande número de termos da linguagem comum de emoção poderia ser
colocado em algum ponto nessa estrutura, da qual são vistos apenas três níveis (alto,
médio e baixo).
Muitos fenômenos comportamentais aos quais aplicamos o termo emoção não
encontram um lugar na Fig. 18-9, qualquer que seja o nível de intensidade que
escolhermos. Esses, sugerimos, podem ser considerados como casos de emoções primárias
misturadas. Como as emoções primárias se misturam? De duas formas principais: (1) um
d eterm in a d o S \ é emparelhado sucessivamente com duas ou três primárias,
esquematicamente (por exemplo)
- 423 -
Como uin exemplo 0a primeira mistura, consideremos o efeito que ocorre quando
uma criança rouba um doce. O doce na mão é um S| para o S+ doce na boca; mas c
lambém um S] para punição (S ), que lem uma alta probabilidade de ocorrer. Kssa
combinação particular (um S\ emparelhado primeiro com um S"1 e depois com um S")
ocorre muito frequentemente na natureza para que seus efeitos tenham um único nome,
culpa. A análise de Plutchik sugere que, de uma maneira análoga, o orgulho deve ser uma
mistura de raiva e alegria. Logicamente, casos mais complicados podem ocorrer com
outras misturas das três emoções primárias. Hm alguns casos, os efeitos não se fundem e
falamos de emoções mistas Variando independentemente as probabilidades dc ocor
rência de cada um dos S2 S, podem ser adquiridas outras sutilezas nos padrões de compor
tamento emocional. Assim como o quúnico atualmente prepara compostos que não
existem na natureza, emoções experimentais que não surgem comumente no mundo
natural podem ser geradas por várias operações compostas de condicionamento.
O caso cm que S2 6 composto de elementos tantos positivos, como negativos (S^)
ilustra um tipo de situação psicológica de conflito. Se uma dada situação incluc
elementos tanto positivos quanto negativos, os comportamentos dc aproximação c
esquiva podem existir, ambos, com uma alta força e diz-se que há um confltio entre
Juas cadeias incompatíveis de comportamento: aproximar-se versus afastar-se. Uma
criança que ordinariamente evita ou foge de espinafre pode ser colocada numa situação
de conflito se se lhe diz que a sobremesa depende de ela comer o espinafre. O tonar o
espinafre-no-estômago um S ^ para respostas que produzem sobremesas dá ao espinafre
um certo valor de reforçador positivo que pode ou não superar a aversão original. Um
exemplo de um confltio ainda mais forte aparece num experimento dc um psiquatra,
Julcs Masscrman (1946). Gatos famintos foram colocados numa caixa contendo
alimento no seu extremo. Os gatos logo passaram a se aproximar c comer o alimento
sempre que colocados na caixa, lím tentativas posteriores, colocou-se um tubo para
conduzir ar comprimido perto do alimento, de tal modo que-, assim que o gato
estivesse quase pegando o alimento para comer, uma violenta corrente dc ar era
dirigida para a sua cabeça. Masserman descreve o efeito comportamental deste
emparelhamento do comportamento de aproximação reforçado positivamente com um
estímulo aversivo, como “ pânico” . No dia seguinte, c subsequente, esses gatos
recusaram-se a se aproximar do alimento. A corrente dc ar foi, então, removida
permanentemente (extinção Pavloviana), mas muitos gatos nunca mais se aproximaram
do alimento, preferindo a fome. Masserman caracterizou estes gatos como “neuró
ticos” e sugeriu que um procedimento dc conflito deste tipo deve ser o fator
subjacente dc muitas neuroses humanas. Uma interessante observação colateral foi
feita. Antes do início do experimento, as preferências alcoólicas dos gatos foram
testadas, ofcrcccndo-sc-lhcs leite puro numa tigela c leite misturado com álcool cm
outra. Antes dc experimentar o procedimento de conflito, os gatos invariavelmente
preferiam leite puro, mas depois de experimentar o procedimento de conflito os gatos
de Messerman apresentaram uma preferencia marcante pelo leite “ alcoolizado” .
Misturas ou compostos emocionais podem ser produzidos por procedimentos
Pavlovianos ainda mais complicados. Certos padrões emocionais, aparentemente, depen
dem de operações dc condicionamento bem complexas, muitas das quais não são
possíveis sem outras histórias anteriores de condicionamento, ainda mais complicadas.
Considere o caso da remoção não apenas dc um único S+, mas de um reforçador
generalizado (seção 11.4). Removendo tal reforçador, removemos efetivamente uma
- 424 -
variedade de reforçadores positivos. Mas sem a his Uri a que primeiro torna um S um
reforçador generalizado, os efeitos emocionais particulares dc sua remoção não são
possíveis. O caso cm pauta, acreditamos, tem uma relação estreita com o fenômeno
que chamamos de “ tristeza” . A morte dc um amigo, a perda de um bom emprego c
eventos semelhantes provocam a tristeza porque, dc uma só vez, uma variedade de
reforçadores c perdida, parccc razoável que esse padrão raramente seja visto cm
animais, porque os reforçadores generalizados são mais comumentc criados nas
sociedades humanas. Mas todos conhcccm o cão que, com a morte do seu dono,
apresenta comportamentos bastante parecidos com nosso próprio comportamento dc
tristeza. Na medida em que as operações sejam plausíveis, pode ser possível gerar esses
ou comportamentos similares em outras espccics. As emoções que usualmente supomos
serem características do homem podem ser peculiares para nós, não porque os animais
sejam incapazes de possuí-las, mas porque suas condições geradoras raramente, ou nunca,
surgem fora das sociedades humanas.
Definimos emoção como a associação entre certas mudanças amplas nos comporta
mentos operantes cm processo e a apresentação ou remoção dc reforçadores. Como
uma relação abstrata entre eventos, a “emoção” , tal como o impulso, não pode causar
nada — sentimentos, comportamentos ou mudanças fisiológicas. No entanto, as
operações que dão origem a certos comportamentos emocionais, podem, se efetuadas
frequentemente, provocar mudanças corporais patológicas agudas. Assim, uma emoção
forte e prolongada pode ser correlacionada com hipertensão, bronquite asmática,
úlcera gastrointestinal, dores de cabeça c outras doenças. Tem sido reconhecido, há
algum tempo, que certas doenças tem suas origens cm situações dc tensão; isto c,
situações cm que figuram estímulos aversivos fortes e/ou prolongados que fazem surgir
comportamento emocional forte e prolongado. Os executivos são propensos a úlceras e
certas doenças cardio-vasculare?. 0 surgimento da asma, c', algumas vezes, associado a um
evento amedrontador na infância c pode ser subsequentemente instigado por cicunstân-
cias moderadamente amedrontadoras. Em geral, a ansiedade crônica c quase sempre
correlacionada com um número dc sintomas somáticos patológicos, desde a acne até o
distúrbio gastrointestinal grave.
A medicina psicossomática se especializa no diagnóstico c tratamento de doenças
que parecem resultar dos mesmos procedimentos que produzem certos comportamen
tos emocionais condicionados. A realidade das doenças psicossomáticas pode ser
demonstrada de forma dramática em animais no laboratório, onde podem ser
produzidas situações emocionais aversivas cujos efeitos são letais para o sujeito. Nos
experimentos dc Brady, Porter, Conrad e Mason (1958), macacos foram treinados a
evitar choques elétricos, através da pressão dc uma barra, emprcgando-sc um
procedimento semelhante ao da esquiva dc Sidman visto no Diagrama 17.2. Os
choques eram programados a cada 20 seg. e os macacos eram expostos ao procedimen
to por 6 horas consecutivas, após o que havia 6 h. dc descanso c, então, 6 h. de
esquiva c assim por dainte, indefinidamente, dia após dia. Uma luz vermelha era
correlacionada com as 6 h. do período dc esquiva.
O comportamento de esquiva típico gerado por esse procedimento é visto na Fig.
18-10. Note que poucos choques foram realmente administrados no período dc 6 h
-425-
Uma hora
de esquiva. Depois de poucas semanas, a morte inesperada de muitos dos sujeitos deu
ao experimento uma parada abrupta. A autópsia revelou que os .animais haviam
sucumbido por úlceras duodenais perfuradas. Quando esses resultados foram obtidos,
eles sugeriam que o procedimento de esquiva poderia ter sido o agente causai na
produção da úlcera e morte dos macacos. Mas outra possibilidade era de que a úlcera
fosse um resultado dos efeitos dos choques elétricos recebidos, dia após dia, e que a
contingência de esquiva fosse supérflua.
— 426 —
Uma figura do aparelho err. que os dois animais ficavam por várias semanas durante o
teste de esquiva é mostrada na ilustração da Parte Cinco ( p.335), o animal executivo
emitia uma taxa alta dc resposta de esquiva durante os períodos de 6 h. dc esquiva c
respondia pouco durante o período de 6h. de descanso. O macaco de controle, por outro
lado, raramente pressionava a barra durante o período de esquiva ou de “ descanso” , já
que sua b arra estava associada com a contingência nula. No experimen
to de controle conjugado, todavia, somente o animal executivo sucumbiu de úlceras.
Os macacos dc controle, sacrificados no dia da morte dc seus pares “executivos”, não
apresentaram qualquer produção dc úlcera, sugerindo assim que o fator letal eram
realmente as contingências dc esquiva prolongada, e não o choquc em si. Estudos
subsequentes indicaram que um fator crítico para a produção dc úlceras por esse
método é a escolha de um ciclo dc 6 h de esquiva — descanso. Outros ciclos não
produziram ulceração (Brady, 1958).
Do ponto de vista da presente análise do comportamento emocional, notamos que
o animal executivo é o único dos dois que recebe um emparelhamento Pavloviano
consistente. Apenas para ele, a não ocorrência de uma pressão à barra cm 20 seg
(R20”) é suficiente para proporcionar uma situação (S j) que c consistentcmcnte
emparelhada com choques. Seu parceiro de controle, todavia, recebe choques ocasio
nais, mas esses nunca são consistcntcmentc emparelhados corn qualquer situação
determinada (S j) no seu ambiento. Portanto, o paradigma de ansiedade condicionada é
preenchido apenas pelo macaco executivo.
Sir Charles Sherrington comentou que, das áreas onde a psicologia c a fisiologia se
encontram, uma c a emoção. Ccrlamenle, nenhuma análise da emoção seria completa
sem alguma descrição das grandes mudanças fisiológicas que ocorrem sob paradigmas
Pavlovianos de emoção. Alguns psicólogos endossam o ponto de vista de que o
território psicológico dos fenômenos emocionais e exaurido pela análise dos padrões
reflexos c perturbações dc operantes que são produzidos pelos procedimentos que
descrevemos nas seções anteriores. Tal ponto de visla pode ser tecnicamente correto,
dependendo da definição pessoal de psicologia, mas impõe limites disciplinares
arbitrários que não correspondem aos fenômenos naturais em si mesmos. Notamos em
algum ponto, neste texto, que os limites entre as disciplinas científicas são quase
sempre traçados de forma muito arbitrária e é óbvio que um cientista interessado nos
fenômenos emocionais pode utilizar-se da análise comportamental, da fisiologia do
reflexo, da endocrinologia, da neurofisiologia, assim como de outras disciplinas
relacionadas. Numa abordagem introdutória à psicologia, nossa obrigação c descrever
os principais efeitos comportamentais das várias mudanças ambientais. Mas não nos
aprofundamos muito no assunto, notando apenas brevemente alguns dados ncuiotisio-
lógicos que ajudam a pintar um quadro mais completo do fenômeno em discussão.
A noção de que cada emoção está associada a um padrão único dc respondentes
autônomos aparece na passagem de William James citada anteriormente (p.407).
Todavia, esses vários padrões podem frequentemente ser muito semelhantes e uma
medida bem detalhada de muitos respondentes pode ser necessária para discernir suas
diferenças (Ax, 1953). Em nossa discussão introdutória sobre os reflexos e o
condicionamento Pavloviano simples, salientamos que os procedimentos Pavlovianos
- 427 -
Olho
Glândula lacrimal
Membrana mucosa do nariz e palato
Glândula sub-maxilar
Glândula sublingual
Membrana mucosa da boca
Glândula parótida
tsôtago
Lstômago
Vasos sanguíneos
abdominais
Fígado
Pancreas
Intestino Delgado
/ Reto
Glândula suprarenal
Rim
Bexiga
Órgãos sexuais
Medula
Genitália externa
I igura 18-11. O lado direito do sistema nervoso autonomo humano ( Kimblc e (iarmezy, 1963)
-42 8-
parecem mais apucavcis aqueles respondentes internos que são mediados por uma parte
do sistema nervoso chamada sistema nervoso autônomo (“auto-regulador”) (SNA),
representado diagramaticamcntc na Fig. 18-11. O SNA conduz impulsos elétricos do
cérebro e medula para os órgãos viscerais, nunca ao contrário. O SNA se divide
funcionalmente em duas partes. Uma é chamda o sistema simpático e é vista em linhas
pontilhadas na Fig. 18-11. A outra, o parassimpático (para significa paralelo a),
encontra-se anatomicamente acima c abaixo do simpático c é visto cm linhas cheias na
Fig. 18-11.
Os fatos que se seguem são dc importância. Primeiro, os órgãos servidos pelo SNA
são precisamente aqueles que, como já indicamos, produzem respondentes,condiciona
dos c incondicionados. O respondeu te respirat ório, o respondents salivar e a taxa
cardíaca são velhos amigos do condicionamento Pavloviano. Nos últimos cinqüenta
anos, os pesquisadores russos mostraram meticulosamente que o funcionamento de
quase todos os órgãos neste diagrama é suscetível aos procedimentos de condiciona
mento clássico. O SNA é tão iiHimamcnte ligado ao condicionamento Pavloviano que
se poderia encará-lo como o aparelho anatômico para o condicionamento deste tipo.
Finalmente, podemos observar que cada órgão individual na Fig. 18-1 1 tem fibras
tanto pontilhadas quanto cheias que chegam até ele e é assim sujeito a influências dc
ambas as partes: simpática e parassimpática. Mas os efeitos dessas duas partes em cada
órgão não são os mesmos. De fato, eles são tipicamente opostos. Isto se dá cm parte
porque as duas partes liberam produtos químicos diferentes nos seus pontos terminais
no órgão. O sistema simpático libera uma substância muito parecida com a adrenalina,
enquanto os nervos parassimpáticos liberam uma substância diferente,chamada acctilco-
lina. A Tabela 18-3 resume alguns efeitos principais das duas divisões do sistema
autônomo.
-429-
Tabela 18-3
AÇÃO RESPONDENTE AUTÔNOMA (Segundo P. T. Young, 1961)
-430-
18 9 CONTROLE EMOCIONAL, MATURIDADE EMOCIONAL E COMPORTAMEN
TO EMOCIONAI PATOLÓGICO ____
Sc as cmoçocs envolvem comportamentos cliciados, então que lipo do autocon
trole pode ser exercido sobre eles? Como nossos operantes estão sob o controle dr
suas conseqüências c porque somos capa/es dc observar esse fato, somos inclinados a
tradu/ir isto como um controle que “ nós'’ temos sobre eles Mas os respondentes não
estão sob o controle dc suas conseqüências. Já notamos como os efeitos dc supressão c
facilitação dos procedimentos emocionais frequentemente não se relacionam às conse
qüências reforçadoras de tal forma que parecem não-adaptativos e inúteis. Mas os
reflexos emocionais dc uma pessoa são frequentemente aversivos para outros indi
víduos e para ela mesma e a sociedade civilizada exige algum controle sobre o
comportamento emocional. A mudança usual nos padrões emocionais, da infância ate
a fase adulta, c caracterizada por um aumento maior no controle do comportamento
emocional, frequentemente, chamado dc maturidade emocional. Como ela c consegui
da? Aparentemente, existem pelo menos três maneiras principais de se chegar a tal
controlo.
Quando uma situação que produz comportamento emocional c repetidamente
apresentada, a magnitude da resposta diminui com tempo. Este c o fenômeno
conhecido‘como adaptação ou habituação, citado cm nossas discussões iniciais sobre o
condicionamento operante. A introdução de um organismo numa situação nova
frequentemente produz comportamento de medo: retrair-sc, imobilizar-sc, dcfecar,
urinar, etc. Mas a introdução repetida do organismo nessa mesma situação resulta
numa diminuição gradual dos efeitos. Diz-se que o indivíduo sc adaptou, ou se
habituou à situação.
Na sociedade, um método importante de modificar o comportamento emocional é
o de adaptá-lo. Um organismo sujeito ao procedimento dc extinção depois de um
esquema de reforçamento intermitente não mostra a taxa dc resposta aumentada ou
outras mudanças que chamamos de raiva. Depois que tal organismo tiver tido uma
história de extinção após reforçamento intermitente, seu comportamento de raiva está
ausente porque ele sc adaptou há muito tempo e, agora, dizemos que ele tem uma
“alta tolerância à frustração” . Vemos efeitos análogos na conduta humana. As crianças
choram c gritam quando seus brinquedos são removidos. Os adultos (usualmente)
mostram reações mais moderadas. O adulto típico já teve uma longa história de perder
coisas: teve alguns anos dc adaptação f*.s asperezas da extinção c reage correspondente
mente menos. Frequentemente, falamos na superação de nossos medos, indicando que
a sua habituação ocorrc no tempo ccrto. A adaptação não ó limitada a eventos
aversivos, entretanto. Mesmo coisas boas da vida podem perder sua atração se nos
tornamos “acostumados” a elas.
Uma segunda forma de controle ocorre quando disfarçamos nossos respondentes
encobrindo-os com operantes opostos. Assim, diz-se a uma criança não deve chorar e
lamuriar, embora ela possa “sentir” . Na sociedade ocidental, o homem deve reter as
lágrimas, mas a mulher pode chorar. Comportamentos manifestos de medo são
frequentemente repreendidos c somos induzidos a apresentar operantes que ocultem
nossos medos. Sempre que somos advertidos para aguentar firmes, somos encorajados a
contra-atacar, com um operante oposto, o respondente reflexo de csmorecimcnto que
ocorre na “ fossa” . A facc “ inexpressiva” c uma habilidade necessária para o bom
jogador de pôquer, mas não é provável que ocorra uma habituação suficiente para
abolir completamente o substrato respondente inobservado gerado por uma seqüência
- 431 -
real de cinco cartas. Bssa sobrevivência de respondentes autônomos na ausência dc
outros comportamentos (tal como a expressão facial) características da emoção é a
base do detetor de mentiras que, na relidadc, c um detetor dc respondentes
autônomos. Esse dispositivo consiste de um aparelho para medir a taxa cardíaca, a
respiração, resistência da pele, tensão muscular c outros respondentes. Quando são
feitas perguntas para um suspeito, suas respostas podem consistir dc operantes que
mascaram qualquer reação emocional externa. Mas a mensuração de seus respondentes
autônomos pode desmascará-lo se ele estiver “ mentindo” , já que um homem que
cometeu recentemente um crime, provavelmente, apresentará efeitos seletivos dc
ansiedade para as palavras que descrevam as ccnas c os eventos do crime.
Uma terceira forma de controle sobre a emoção consiste da esquiva, de um lado,
ou produção, dc outro, de situações que evocam o comportamento emocional. Quando
evitamos um inimigo que provavelmente nos fará raiva, ou paramos de jogar golfe
porque jogamos mal continuamente, ou quando vamos a um restaurante onde
frequentemente temos uma boa refeição, evitamos ou produzimos certos reforçadores.
Mas, como um subproduto, podemos tambem escapar dc, ou produzir alguns dos
nossos próprios comportamentos emocionais. Nesse sentido, pode-se dizer que exerce
mos controle sobre nossas emoções.
H evidente, com esta consideração breve desses três métodos de controle emocio
nal, que o nosso controle sobre os nossos respondentes emocionais carccc do grau de
controle que temos sobre nossos braços, pernas ou cordas vocais. Talvez seja útil
apreciar essa diferença na nossa educação das crianças c no nosso tratamento com
outras pessoas.
A sociedade está repleta de situações geradoras de raiva e ansiedade. Desde a infân
cia , encontramos proibições e conflitos, ameaças e frustrações. Algumas são caprichosas;
outras parecem necessárias para a ocorrência ordenada das atividades humanas. A
maioria dos indivíduos consegue sair dessa história com um repertório de habilidades
para evitar eventos aversivos c produzir reforçadores positivos, o que c suficiente para
manter a raiva e a ansiedade em níveis toleráveis. Mas alguns indivíduos, talvez
porque suas histórias contenham uma quantidade incomum dc controle aversivo, ou
talvez porque, geneticamente, são mais sensíveis a operações geradoras dc raiva ou
ansiedade, não adquirem as habilidades suficientes para um ajustamento satisfatório às
contingências da sociedade. Já discutimos os casos que caem no terreno da medicina
psicossomática. Muitos outros indivíduos humanos demonstram efeitos drásticos dc
operações de raiva c ansiedade prolongadas que não podem ser chamadas de doença no
mesmo sentido que úlceras, hipertensão c asma. Uma ausência prolongada de situações
geradoras dc elação pode tambem tet efeitos adversos, especialmente se o empobreci
mento ocorre cedo na vida. As crianças que são criadas, desde o nascimento, cm
instituições quase sempre recebem comida c cuidado suficientes para sua saúde geral,
mas podem não receber a estimulação afetiva e o carinho que as outras crianças obtêm
dos pais. Se falta esta estimulação afetiva durante os seis primeiros meses dc vida. esses
bebês frequentemente se tornam crianças c adultos extremamente apáticos (Spitz,
1957). As crianças tornam-se abatidas, desinteressadas, mostram estupor, falta de
apetite c desenvolvimento físico rctardado.Tais crianças parecem não ter a intensidade
usual de comportamento de alegria, bem como dc medo e raiva. L:m resumo, todos os
seus comportamentos emocionais parecem estar altamente atenuados. Algumas delas
-432-
nunca desenvolvem níveis normais dc reforçadores positivos e, assim, tem que ser
mantidas cm instituições por toda a vida.
Existem vários outros estados comportamentais patológicos aos quais os homens
são propensos c cujas causas são mais sutis e pobremente compreendidas. As pessoas
que apresentam efeitos comportamentais dc ansiedade por longos períodos dc tempo
nas situações complexas que surgem na sua vida cotidiana, são quase sempre chamadas
“neuróticas” . O comportamento emocional prolongado do tipo denominado ansiedade
constitui uma interferência marcante nos outros operantes e pode-se dizer que um
neurótico é “ desajustado” simplesmente porque, cm vez de se empenhar cm operantes
que podem produzir reforçadores positivos, ele apresenta as supressões características
da ansiedade. Se as supressões persistem por longos períodos, a eficiência do indivíduo
nas atividades normais pode ser bastante reduzida. Outros indivíduos desenvolvem
padrões de comportamento que são tão patológicos ou perigosos para a sociedade cm
geral que essas pessoas tem que ser institucionalizadas, para sua própria segurança ou a
da sociedade. Numa ampla classe de patologia do comportamento conhecido como
psicose, os reforçadores positivos normais podem perder o seu valor ou inexistir de todo.
Alguns psicóticos têm que ser mimados, outros não têm qualquer “interesse” em alguma
coisa, outro relatam o aparecimento de situações que não estão de fato presentes
(alucinações), outros mostram uma generalização de ansiedade para quase todas as
situações, outros ainda apresentam em alta força comportamentos como assassinatos e
violação, que estão ausentes no repertório civilizado típico. A reabilitação e cura de
indivíduos que apresentam patologias de comportamento dessa magnitude são problemas
sociais graves, embora as causas precisas da maioria de tais comportamentos permaneçam
obscuras.
Durante a idade média, os comportamentos bizarros eram atribuidos a influencias do
diabo e as pessoas que apresentavam tais comportamnetos eram queimadas como
bruxas, encarceradas c sujeitas a outras brutalidades destinadas a exorcizar o diabo. A
crueldade do homem para com seu semelhante é agora mais lúcida do que na história
inicial do tratamento de indivíduos perturbados. Durante o século dezenove, surgiu
uma atitude mais esclarecida. Os indivíduos que apresentavam patologias de comporta
mento passaram a ser encarados como “ doentes” em vez de possessos. Em vez de
presos, eles eram enviados a hospitais.
Os hospitais são um avanço significante em relação as prisões. Mas uma implicação
significante pode ser retirada da psicologia moderna: as causas e curas dos comporta
mentos patologicos diferem muito das doenças organicas. Só muito recentemente, as
patologias do comportamento passaram a ser encaradas como produtos de histórias
incomuns de condicionamento. Como tal, suas curas exigem um tratamento comporta
mental e não médico. Foi o psiquiatra de Viena Sigmund Freud que reconheceu que as
causas de certos comportamentos patológicos encontram-se na história passada remota
do indivíduo. Alem disso Freud salientou que frequentemente, o indivíduo é incapaz
de descrever os eventos críticos do passado que levam à patologia. Um aspecto
importante do método psicoanalítico de Freud, assim, envolvia o fornecimento de
SDs verbais para aumentar a probabilidade de o paciente relatar incidentes de seu
passado que poderiam ter uma relação com o distúrbio atual. Para Freud, parecia óbvio
que o tratamento consistisse parcialmente em fazer o próprio paciente saber qual era a
sua história relevante. Tal ponto de vista tem relação com o que conhecemos sobre
a extinção e adaptação de efeitos emocionais.
- 433 -
Não podemos pretender que tenhamos chegado a uma compreensão clara (le
exatamente quais tipos de histórias levam a patologias diferentes e quais tipos de ação
devem ser efetuadas para reeducar os indivíduos em padrões de vida mais reforçadores.
Contudo, os princípios comportamentais básicos do tipo descrito neste livro serão
seguramente úteis para ajudar a formar uma base experimental sólida para a psicologia
clínica e a psiquatria. Isto porque, tal como a prática da medicina orgânica deriva-se das
descobertas de processos químicos, bioquímicos e fisiológicos, fundamentais, assim
também a prática da psicoterapia deriva-se das descobertas de processos comportamentais
fundamentais.
onde Ie é definido como o índice de mudança emocional. Deve ficar claro que c-b é o
número de repostas durante S\ e b-a o número de respostas num período de controle
imediatamente antes de S\ e de duração igual a S j. Quando o responder durante S\
e o período de controle é igual (nenhum efeito de S i), então Ie - 0,5. Quando
c-b < b-a, ocorreu supressão e o Ie encontra-se entre 0 e 0,5, dependendo de quão
completa foi a supressão. No caso onde ocorre facilitação em S j, c-b > b-a, então
1,0 < Ie >0,5. Evidentemente, Ie varia de 0 (supressão completa) a 1,0 (facilitação
completa: inexistência de resposta no período de controle, todas as respostas em S]).
Tempo (minutos)
Figura 18-12. O cálculo dc um índice de supressão.
-434-
EXERCÍCIO 10.
Porque é dificil uma emoção como um padrão de comporta
mento particular?
EXERCÍCIO 11
Discuta as similaridades e ediferenças entre motivação e emoção.
EXERCÍCIO 12
Faça a notação do procedimento atribuído a Pliskoff na seção 18.5
REFERÊNCIAS PARA O CAPÍTULO 18
Ax, A. F. The physiological differentiation between fear and anger in
humans. Psychosom. Med., 1953, 15, 433-442.
Azrin, N. H., Hutchinson, R. R., and Hake, D. F. Extinction-induced
aggression. J. exp. Anal. Behav., 1966, 9, 191-204.
Brady, J. V. Ulcers in executive monkeys. Sci. Am er., 1958, 199, 95
100.
Brady, J. V. Motivation-emotional factors and intracranial self-stimula
tion. Chap. 30 in D. E. Sheer (E d .), Electrical stimulation of the
brain. Austin: Univer. of Texas Press, 1961.
Brady, J. V. Psychophysiology of emotional behavior. Chap. 10 in A. J.
Bachrach (E d .), Experimental foundations of clinical psychology.
New York: Basic Books, 1962.
Brady, J. V., and Hunt, H. F. An experimental approach to the analysis
of emotional behavior. J. Psychol., 1955, 40, 313-324.
Brady, J. V., Porter, R. W., Conrad, D. G., and Mason, J. W. Avoidance
behavior and the development of gastroduodenal ulcers. J. exp.
Anal. Behav., 1958, 1 ,6 9 -7 2 .
Cannon, W. B. The James-Lange theory of emotions: a critical examina
tion and an alternative theory. Am er. J. Psychol., 1927, 39, 106
124.
Darwin, C. The expression of the emotions in man and animals. London:
Murray, 1872.
Estes, W. K., and Skinner, B. F. Some quantitative properties of anxiety.
J. exp. Psychol., 1941, 29, 390-400.
Gates, G. S. An observational study of anger. J. exp. Psychol., 1926, 9,
325-336.
Herrnstein, R. J., and Morse, W. H. Some effects of response-inde
pendent positive reinforcement on maintained operant behavior. J.
comp, physiol. Psychol., 1957, 50, 461-467.
Hoffman, H. S., and Fleshier, M. Stimulus factors in aversive controls:
the generalization of conditioned suppression. J. exp. Anal. Behav.,
1 9 6 1 ,4 ,3 7 1 -3 7 8 .
-435-
Hoffman, H. S., Fleshier, M., and Jensen, P. K. Stimulus aspects of
aversive controls: the retention of conditioned suppression. J. exp.
Anal. Behav., 1963, 6, 575-583.
Hunt, H. F., and Brady, J. V. Some effects of electro-convulsive shock
on a conditioned emotional response ( “anxiety” ). J. comp,
physiol. Psychol., 1951, 44, 88-98.
James, W. Principles of psychology. Vol. II. New Y ork: Holt, 1890.
Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd
ed.) New York: Ronald, 1963.
Landis, C., and Hunt, W. A. The startle pattern. New Y ork: F arrar and
Rinehart, 1939.
Leitenberg, H. Conditioned acceleration and conditioned suppression in
pigeons. J. exp. Anal. Behav., 1966, 9, 205-212.
Masserman, J. Principles of dynamic psychiatry. Philadelphia: Saunders,
1946.
Pliskoff, S. S. Rate change effects with equal potential reinforcements
during the “warning” stimulus. J. exp. Anal. Behav., 1963, 6,
557-562.
Plutchik, R. The emotions: facts, theories, and a new model. New Y ork:
Random House, 1962.
Schacter, S., and Singer, J. E. Cognitive, social, and physiological
determinants of emotional state. Psychol. Rev., 1962, 69, 379-399.
Schoenfeld, W. N. An experimental approach to anxiety, escape, and
avoidance behavior. Chap. 5 in P. Hoch and J. Zubin (E d s.),
A nxiety. New York: Grune and Stratton, 1950.
Sidman, M. Normal sources of pathological behavior. Science, 1960,
1 3 2 ,6 1 -6 8 .
Spitz, R. A. No and yes. New York: International Univer. Press, 1957.
Tolm an, E. C. A behavioristic account of the emotions. Psychol. Rev.,
1 9 2 3 ,3 0 ,2 1 7 -2 2 7 .
Watson, J. B. Behaviorism, (rev. ed.) Chicago: Univer. of Chicago
Press, 1930.
Young, P. T. M otivation and emotion. New York: Wiley, 1961.
-436 -
TABELA DE PARADIGMAS COMPORTA MENTA IS
TABELA DE PARADIGMAS COMPORTAMENTAIS
o do Um eliciador, S2 Apresentar S2 repetidamente R2, a resposta eliciada, dimi A força do reflexo é diminuida
nui em magnitude, aumenta temporariamente
em latência, etc.
amen Dois eliciadores, Sj Emparelhar repetidamente S\ S\ passa a controlar uma nova Sj evoca seguramente a CR
ano e S2 com S2 resposta (CR) semelhante a R j
ção Uma classe de com 0 reforçamento é aplicado pa 1. Fortalecimento das varian As variantes reforçadas apre
portamento com for ra um conjunto de variantes tes reforçadas sentam-se com uma força alta
ça v 0 dentro da classe, 0 resto é sub 2. Enfraquecimento daquelas
metido à extinção variantes que passaram por
extinção
nação 1. Uma classe de Reforçar a R numa das condi A força da resposta em eS 0 organismo passa a responder
resposta ções de estímulo (S^) e extin- gradualmente se diferencia, em e não em S
2. Duas condições guir a R na outra condição de ocorrendo um processo de ex
de estímulo estímulo (S) tinção prolongada em S
ão para Contingências de dis Apresentar uma série de pro Os processos de discriminação Discriminações novas, mas re
criminação adequa blemas relacionados de discri do indivíduo mudam gradual lacionadas, são resolvidas com
das minação mente de lentos e graduais pa eficiência máxima
ra súbitos e abruptos
TABELA DE PARADIGMAS COMPORTAMENTAIS - CONTINUAÇÃO
ona Um estímulo aversi Permitir que uma R termine A força de R aumenta S” controla a ocorrência de R
e tuga vo, S” s-
Condicionamento de traço, 63
Condicionamento verbal, 92—94
Conflito
de aproximação-esquiva, 424—425
de motivos, 365
Constâncias perceptivas, 305—308
Constructo hipotético
força do reflexo, 4 2 —43
Contingências comportamentais, 127 ver também Esquemas de
Reforçamento
agrupadas, 141 —142
na aquisição de significado, 2 9 5 -2 9 6
aversivas na sociedade, 432
em cadeias, 245
como causas do comportamento, 342
discriminação, 139, 210
na disposição para aprender, 274
duração de, 1 3 3 -1 3 4
escolha de acordo com o modelo, 286
filogenéticas, 3 0 7 -3 0 8 , 364, 406, 420—421
fuga, 385
funcionais, 140—141
imitativas, 240—241
múltiplas, 1 3 0 -1 3 2
negativas, 137—138
nulas, 132
probabilísticas, 1 3 8 -1 3 9
punição, 398—402
ramificadas, 263—267
repetitivas, 135—136
Contingência de reforçamento contínuo (crf), 79
supersticiosa, 94
Continuidade de comportamento, 159,178
Contrações no estômago, papel no comer, 367
Contraste de brilho, 187—188
Controlado, experimento, 66 -68
Controle do ambiente
por estímulos não relacionados, 291
sobre operantes, 185
Controle do comportamento; ver Causas do Comportamento;
Controle do Ambiente
Controle, das emoções, 431—434
experimental, 66
SD ; ver Discriminação
Correlação
coeficiente de, 330
grau vs. forma de, 327—328