Você está na página 1de 459

J. R.

MILLENSON

p r in c p io s d e

ANLISE DO COMPORTAMENTO
A mais moderna e sistemtica coleo de princpios elementares universais que existem para a modificao do comportamento
Obturador Retculo de difrao

K
l V

* tf) 1 __
4

k l :

\
\

Monocromador

Fonte de Luz

H e s b iir U

PRINCPIOS DE ANLISE DO COMPORTAMENTO

J.R. MILLENSON

PRINCPIOS DE ANLISE DO COMPORTAMENTO

T ra d u o de A lin a de A lm e id a Souza D io u e tie K ezende

COORDENADA

THESAURUS

Copyright, J. R. Milleonson, 1967 Ttulo original: Principles-of Behavior Analysis THI MACMILLAN COMPANY, NLW YORK

Library of Congress catalog card number: 67 15540

Montagem: Afonso Rocha Fotomontagem de : Joo Pinto Composio de: Antonio Carlos da Silva e Clemente Silva l 'ilho Capa: Paulo Magalhes

MCMLXXV Todos os direitos, em lngua portuguesa no Brasil, reservados de acordo com a lei. Nenhuma parte deste livro pode ser reproduzida ou transmitida de qualquer forma ou por qualquer meio, incluindo fotocpia, gravao ou informao computadorizada, sem permisso por escrito da editora COORDENADA / THESAURUS EDITORA DE BRASLIA LTDA. SIG Q. 08 LOTE 2356 FONE: (061) 344 3738 - FAX: (061) 344 2353 - Braslia - DF.

Para VIVIENNE

PREFCI O EDI O BRAS I LEI RA

A maior parte do livro PRINCPIO S DE A N L IS E DO C O M PO R TAM EN TO fo i escrita durante o ano acadmico de 1964, enquanto eu era um jovem professor assistente de Psicologia no In stitu to de Tecnologia Carnegie (agora Universidade Carnegie-Mellon), em Pittsburgh, Pensylvania. Eu o concebi como um te x to sistemtico de introduo dos estudantes, em nvel elementar e avanado, queles princpios conhecidos de m odificao do com portam ento que devem servir de base grande poro da conduta adaptativa do homem e de organismos relacionados com ele. Em sua maior parte, escrever este livro fo i um trabalho de amor. Eu ensinava Psicologia a iniciantes, para quem eu a interpretava como a cincia que se preocupa com as interaes do com portam ento com o meio ambiente e para quem havia tantas coisas que desejava dizer (e que o fiz muitas e muitas vezes!) que no se encontravam em qualquer dos livros textos existentes, que decidi desenvolv-los por escrito. Aquela poca existia apenas um livro te x to sistemtico e elementar sobre esse campo de estudo que, embora suportando majestosamente a sua idade, m uita coisa tinha acontecido desde a sua publicao em 1950. Parece-me claro agora, como o fo i ento, que a Psicologia um campo c ie n tfic o a mover-se rapidamente de seu estgio pr-paradigmtico para a explorao sistemtica de um conjunto unificado de com portam entos. Gosto de pensar que em sua d im in u ta trilh a , o livro PRINCPIOS DE A N L IS E DO CO M PO RTAM ENTO continua a dar uma contribuio permanente pc.ra o estabelecimento desse novo paradigma da Psicologia. Agor.i, olhando para trs, uma dcada desde que esse livro apareceu, posso ver mais claramente as suas virtudes e falhas. certo que nessa cincia de desenvolvimento to rpido qualquer livro te x to logo se desatualiza. Novos processos im portantes, como a ^uto-modelagcm, o com portam ento adjuntivo e o biofeedback entraram em cena; outros processos familiares, como o da punio e do condicionam ento clssico, foram consideravelmente relorm ulados. Por o utro lado, enquanto em 1964 no tinham os quase nenhuma teoria que merecesse esse nome, os anos de 70 testemunharam a chegada de modelos quantitativos tanto na teoria do reforo como na do condicionam ento clssico. Esses modelos, embora deliberadamente restritos rea que cobrem, tm uma certa aura de a u te n tic id a d e que alta totalm ente nas grandiosas teorias prim itivas sobre aprendizagem da era anterior. As descobertas complementares de que as atividades autnomas reflexas so reorcveis e nue os com portam entos em itidos nodem ser

excitados por contingncias associadas/ colocam em questo nossa distino fechada entre operantes e respondentes. m u ito cedo para dizer quo drasticamente essas descobertas vo abalar nossos fundam entos tericos, mas certo que maiores

modificaes esto no ar. H dez anos atrs, como reao s prematuras teorizaes das dcadas de 1940 e 1950, a disposio dos que trabalhavam nesse campo era fortemente descritiva. A anlise
que B.F. Skinner fez do com portam ento proposital, sua preocupao com o organismo individual e sua nfase no controle pelo reforam ento de contingncias eram as bases do cultivo em prico vigoroso dos princpios de reforam ento positivo. A lei do efeito de T horndike estava no seu znite e este livro um p ro d u to daquele clm ax. Porm algumas mudanas sutis esto acontecendo no Zeitgeist. O controle de contingncias pervasivo e im portante como comeou a ceder lugar a um conjunto de efeitos perplexantes que, mesmo parecendo intim am ente ligados ao reforo, vo alem da lei do efeito. Por outro lado, o condicionam ento clssico, a outra face da moeda do determ inism o na Psicologia, acha-se menos e menos seguro de seu papel como o segundo maior p rin c p io de m odificao do com portam ento. Suspeito mesmo que devemos logo nos preparar para aceitar a idia de que as modificaes das respostas no condicionam ento clssico pode ser grandemente reduzido a uma forma de aprendizagem instrum ental. Naturalm ente que, quando e se, essa integrao vier, ela certamente no eliminar Pavlov. Pelo contrrio, os diques sero finalm ente eliminados para a explorao das descobertas do grande fisilogo Russo, em sua rea mais apropriada: a modulao do com portam ento corrente pelos efeitos Pavlovianos sobre a motivao, a emoo e a criao de reforadores. O livro PRINCPIOS DE A N L IS E DO COM PORTAM ENTO guarda um silncio virtual sobre as contribuies dos bilogos com portam entais s fontes evolucionistas da variao do com portam ento; fator este no facilm ente manipulvel mas no facilm ente ignorado. Enquanto eu sempre senti a negligncia s contribuies dos etologisias s caractersticas com portam entais das espcies, como a m aior omisso de meu livro, e o enfoque no meio-ambientalism o (que poderia ter sido d ifc il conseguir com uma apresentao balanceada de biologia e psicologia) fo i e a sua m aior fora. Porquanto a sua preocupao com as variveis do meio ambiente do passado e do presente perm itiram -me aplicar a teoria do reforo de maneira criativa a um amplo espectro de c o m p o rta m e n to s humanos complexos, incluindo a aprendizagem de conceitos, significado e compreenso, soluo de problemas, motivao e emoo, de tal modo que ainda hoje parece-me que retm um sabor moderno. Assim, por todas as mudanas e ferm entos que ocorreram desde o seu aparecimento e por todas as suas omisses, pode m uito bem ser qe o livro PRINCPIOS DE A N L IS E DO CO M PO RTAM ENTO ainda contenha a mais noderna e sistemtica coleo de princpios elementares universais que existem para a jodificao do com portam ento. Certamente eu creio que minha ateno meticulosa para a elaborao e a aplicao de conceitos fundamentais, minha presso neste livro na descrio form al de contingncias de reforam ento, a preocupao no te xto com os detalhes ntim os, em profundidade, de um nmero lim itado de processos fundamentais do com portam ento, seu com prom etim ento em compreender, opondo-se a uma ( obertura superficial dos temas, sua natureza programada e, finalm ente, sua f em que a teoria psicolgica pode e deve ser desenvolvida a um nvel com portam ental so, todos eles, caractersticas que permanecem distintas e perenes. Tornando este livro disponvel numa edio em Portugus a, talvez, uma audincia bem maior, esta poder ser introduzida aos recentes insights e s promessas conceituais dessa cincia do sculo XX

PREFACIO

O objetivo deste livro fornecer uma introduo rigorosa Psicologia Experimental orientada para os dados. Ele se dirige principalmente ao estudante do primeiro curso em Psicologia e contm material adequado para dois semestres consecutivos ou um perodo de um ano. Embora o texto atinja um grau incomum de sistematizao para o nvel introdutrio, o material que ele contm no necessariamente mais difcil do que o encontrado na maioria dos textos de abordagem geral no campo. Com um grupo limitado de conceitos gerais, tentei construir uma estrutura razovel de modo que o estudante tenha, se este fr o seu primeiro, nico ou ltimo curso em cincia, os meios para interpretar e ordenar uma ampla variedade de fenmenos psicolgicos. No fiz tentativa alguma para rever todas as atividades variadas dos psiclogos em geral na metade do sculo vinte. Na maior parte mantive o caminho direto e estrito da Psicologia Experimental. Dentro desses limites, concentrei-me no que, em termos tradi cionais, seria chamado aprendizagem e condicionamento, motivao e emoo e, em menor extenso, Psicofsica, percepo e resoluo de problemas. Os correlatos fisio lgicos do comportamento so apresentados nas discusses sobre motivao e emoo. As desordens do comportamento so estruturadas como fenmenos emocionais patol> s. No h um captulo com ttulos como os de Percepo e Psicofsica, mas seus 1'miiTilns bsicos e alguns dados representativos so considerados no texto, nos captulos h*> lic* controle de estmulo, discriminao e aquisio de conceitos, e em outras partes. A aluminum na rea feita em termos da anlise funcional do comportamento, um ponto do visla h muito tempo associado com B. F. Skinnei. Embora a maioria dos prin cpios* dosciilos tenham suas origens no laboratrio de pesquisa animal,sua relevncia para as atividades humanas repetidamente enfatizada. Algumas nooes de Estatstica elementar so apresentadas, principalmente para fornecei algum sabor variabilidade dos dados e para apontar a utilidade de instrumentos estatsticos no losumo e interpretao dos resultados. Utilizei o mtodo de anexar alguns captulos com seoes sobre anlise de dados, muitos dos quais descrevem conceitos estatsticos simples. Embora estas sees estejam organizadas de modo a incorporar os dados empricos citados nos captulos em que aparecem, eles fornecem seqncia independente colocada narte do c o rn o d o textn

Um sistema de notao de R e S para descrever os procedimentos comportamentais uma parte integral do texto. Os procedimentos no campo esto se tornando cada vez mais complexos e algum esquema formal para reduz-los aos seus elementos parece dese jvel se se quer que o estudante aprecie diferenas e similaridades de procedimento. 0 problema de se a notao particular, aqui elaborada, h de encontrar um lugar permanente na cincia no ser resolvido aqui. Mas, com sua incluso, desejo enfatizar que uma representao simblica da lgica de nossos procedimentos est se tornando obrigatria para uma exposio e comun icao e ficientes. Espero que o instrutor encontre dificuldade para modificar a seqncia dos captulos ou omitir qualquer um completamente. (As sees que podem ser omitidas sem destruir a continuidade esto em tipo pequeno.) Os conceitos se constroem uns sobre os outros e o livro uma unidade. O nvel de dificuldade parece-me ser uma funo direta do nmero do captulo. Ao usar o material com estudantes de vrios nveis, o principal grau de liberdade parece ser a velocidade em que o instrutor pode progredir. Mantendo o prin cpio de Bruner1, que qualquer assunto pode ser ensinado, de modo efetivo e de uma forma intelectualmente honesta, a qualquer indivduo em qualquer estgio de desenvol vimento , espera que o livro seja til para diversos nveis: talvez, como um texto auxiliar para o curso de aprendizagem em graduao, ou mesmo como um livro de consulta para cursos de ps-graduao em anlise experimental do comportamento. Um laboratrio seria um complemento valioso para um curso tal como este e a seqncia do texto tal que facilita uma ordem lgica de tpicos experimentais para o laboratrio. Meus agradecimentos so para muitos dos meus ex-alunos da Columbia University, Birkbeck College (University of London) e Carnegie Institute of Technology que, durante anos, estabeleceram as condies para escrever o livro e que modelaram amplamente a sua estrutura. A Susan Alcott, Nancy Innes, Mary Carol Perrott, e par ticularmente Isabelle Alter, tenho uma dvida pela leitura crtica, releitura, e edio dos rascunhos preliminares. As sugestes dos meus colegas Daryl Bem, John Boren, Derek Hendry, Dennis Kelly, Bernard Migler e do editor dessa serie, Melvin Marx, que entre eles ieu cada c a p tu lo do livro, esclareceram , apreciavelmente, a verso final. Evalyn Segai, genero sam ente, realizou o rduo trabalho de reler todo o manuscritc durante as frias de vero, e seus comentrios detalhados ajudaram a melhorar o livro de muitas maneiras. W. N. Schoenfeld e Francis Mechner merecem o crdito por aquilo que de valor original aqui for encontrado. No seria necessrio dizer que eles no so de modo algum responsveis pelos defeitos e deficincias e espero que eles perdoem quais quer distores de suas idias que eu possa ter, inadvertidamente, criado. J. R. M.

J. S. Bruner, The process of education. Cambridge: Harvard llnivrr Press 196^ n ^

SU M RIO

NOTA AOS ESTUDANTES......................................................................................... PRIMEIRA PARTE: A REGULARIDADE DO COMPORTAMENTO..................... CAPTULO 1 UM BACKGROUND PARA A ABORDAGEM CIENTFICA AO COMPORTAMENTO.......................................................................

19 21

23 23 25 25 26 27 29 30 32 34 37 37 39 41 42 44 45 53 53 56 62 64

1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9

Primeiras tentativas para explicar e classificar o comportamento hum ano..... A ao reflexa........................................................................................................ Reflexos condicionados ou adquiridos............................................................... A teoria da evoluo e o comportamento adaptativo....................................... Os primeiros experimentos sobre o comportamento voluntrio .................. O Zeitgeist.............................................................................................................. A psicologia perde a sua m ente............................................................................ O firme estabelecimento de uma anlise experimental do comportamento .... Reviso.................................................................................................................... COMPORTAMENTO REFLEXO (ELICIADO)...........................

CAPTULO 2 2.1 2.2 2.3 2.4 2.5 2.6

A frmula S - R .................................................................................................... Leis do reflexo prim rio........................................................................................ Leis secundrias do reflexo................................................................................... Fora do reflexo: um constructo hipottico....................................................... Exemplos comuns de reflexos.............................................................................. Variabilidade nas medidas; resumo de dados em distribuio de freqncia; estatstica bsica; a curva norm al........................................................................ CONDICIONAMENTO PAVLOVIANO .......................................

CAPTULO 3 -

3.1 Reflexos condicionados e a natureza de um experim ento................................. 3.2 O paradigma Pavloviano: um mtodo esquemtico de representar ocondi cionamento 3.3 Relaes temporais nos paradigmas de condicionamento................................. 3.4 A extenso do condicionamento clssico................................ ...........................

3.5 O mtodo experimental ........................................................................................ 3.6 Introduo aos conceitos elementares de probabilidade................................... CAPTULO 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 FORTALECIMENTO OPERANTE...............................................

66 70 75 75 77 79 84 85 86 87 89 90 92 94 95 99 100 101 102 106 107 108 112 112 116 121

Introduo ao comportamento proposital.......................................................... Um experimento p rottipo.................................................................................. Mudanas na taxa absoluta................................................................................... Mudanas na taxa relativa.................................................................................... Mudanas seqenciais no responder.................................................................... Mudanas na variabilidade.................................................................................... Operantes e estmulos reforadores..................................................................... O paradigma do fortalecimento operante........................................................... Operantes vocais..................................................................................................... A extenso do fortalecimento operante............................................................. Superstio............................................................................................................. Condicionamento operante .................................................................................. EXTINO E RECONDICIONAMENTO DO OPERANTE.......

CAPTULO 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9

Mudanas na taxa de resposta durante a extino.............................................. Mudanas topogrficas e estruturais na extino............................................... Resistncia extino........................................................................................... Recuperao espontnea ....................................................................................... Condicionamento e extino sucessivos............................................................. Esquecimento e extino...................................................................................... Uma definio compreensiva de extino operante........................................... A extenso dos conceitos de extino................................................................. Representaes grficas dos resultados de experimentos nos quais muitas variveis independentes so estudadas em conjunto........................................

SEGUNDA PARTE: AS UNIDADES FUNDAMENTAIS DE ANLISE............... CAPTULO 6 -

NOTAO DE CONTINGNCIA DE RESPOSTA E EST MULO................................................................................................ 123 124 126 127 129 130 132 133 134

6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8

Respostas e eventos ambientais............................................................................ Situaes e eventos ambientais............................................................................. A noo de uma contingncia comportamental................................................ A situao inicial (Sa ) .......................................................................................... Contingncias mltiplas na mesma situao....................................................... A contingncia n u la .............................................................................................. A durao das situaes e das contingncias....................................................... Mais de uma resposta exigida para a conseqncia S .......................................

6.9 6.10 6.11 6.12 6.13 6.14 6.15

Contingncias repetitivas......................................................................... ........... Facilitao............................................................................................................. ontingncias negativas....................................................................................... Contingncias probabilsticas............................................................................. Discriminaes...................................................................................................... R e S funcionalmente dependentes................................................................... Contingncias agrupadas...................................................................................... REFORAMENTO INTERMITENTE.........................................

135 136 137 138 139 140 141 143 144 149 152 153 155 155 159 159 163 164 169 170 176 178 179 180 185 185 190 197 199 201

CAPTULO 7 7.1 7.2 7.3 7.4 7.5 7.6

Contingncia de intervalo.................................................................................... Probabilidade de reforam ento.......................................................................... Notas tericas sobre esquemas de reforam ento.............................................. Os efeitos do reforamento intermitente naresistncia extino................. Outros efeitos comportamentais do reforamento interm itente.................... Estados estveis do com portam ento.................................................................. A ESPECIFICAO DA RESPOSTA..........................................

CAPITULO 8 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9

A definio de classes de resposta............................................... ..................... Uma definio de resposta operante emtermos da teoria dos conjuntos....... O paradigma da diferenciao............................................................................ Aproximao sucessiva........................................................................................ Extenso do conceito de operante.................................................................... Diferenciao de ta x a .......................................................................................... Reforamento do responder contnuo.............................................................. Sumrio................................................................................................................. A linguagem e lgica dos conjuntos................................................................... CONTROLE AMBIENTAL............................................................

CAPTULO 9 9.1 9.2 9.3 9.4 9.5

Dimenses do estm ulo....................................................................................... Generalizao de estm ulo................................................................................... Generalizao da extino................................................................................... Algumas implicaes da generalizao............................................................... Notas sobre o delineamento de experimentosem psicologia usando sujeitos anim ais...................................................................................................................

TERCEIRA PARTE: UNIDADES COMPONENTES DO COMPORTAMENTO .... 203 CAPTULO 10 - DISCRIMINAO........................................................................... 205 10.1 Duas condies do estmulo, uma classe deresposta......................................... 10.2 O paradigma da discriminao............................................................................ 206 210

10.3 Duas condies do estmulo, duas classes de resposta..................................... 10.4 m Condies do estmulo, n classes de resposta............................................... 10.5 Mudanas contnuas no comportamento em funo de mudanas contnuas numa dimenso do estm ulo............................................................................... 10.6 Discriminao sem respostas em S^ .................................................................. 10.7 Tempos de reao discriminativos..................................................................... 10.8 As implicaes do controle de estmulo operante........................................... 10.9 A significncia das diferenas entre duas m atrias........................................... CAPITULO 11 11.1 11.2 11.3 11.4 11.5 11.6 REFORADORES ADQUIRIDOS................................

21 i 213 215 217 219 220 221 227 228 229 233 234 235 237 239 245 245 247 251 252 255 257 260 263 267 271

As propriedades reforadoras dos estmulos discriminativos positivos.......... Como aumentar a durabilidade de reforadores condicionados..................... Recompensas token ......................................................................................... Reforadores generalizados ................................................................................. Respostas de observao ..................................................................................... As condies necessrias e suficientes para se criar reforadores condi cionados ................................................................................................................. 11.7 O reforamento secundrio no comportamento social................................... CAPTULO 12 12.1 12.2 12.3 12.4 12.5 12.6 12.7 12.8 12.9 ENCADEAMENTO...........................................................

Os elementos de cadeias comportamentais............................................. ......... O desenvolvimento de uma cadeia com plexa................................................... A aprendizagem de labirinto como um encadeamento................................... Os efeitos da extino seletiva em pontos diferentes na cadeia..................... Esquemas encadeados.......................................................................................... O comportamento humano cotidiano como encadeamento........................... Cadeias vocais....................................................................................................... Cadeias ramificadas e representao do diagrama de fluxo............................ Cadeias de comportamento encoberto..............................................................

QUARTA PARTE: CONTINGNCIAS COMPLEXAS.............................................. CAPTULO 13 -

AQUISIO DE CONCEITO ......................................... 273 274 278 278 280 284 288 291

13.1 Dispc' o para aprender (simples)................................................................... 13.2 Algumas variveis que interferem na aquisio da disposio para aprender (L -S E T )................................................................................................................. 13.3 L-SETS mais com plexos.................................................................................... 13.4 Experimentos simples sobre formao de conceito em sujeitos hum anos..... 13.5 Estudos sobre formao de conceito em animais............................................ 13.6 Classes arbitrrias de S^; conceitos disjuntivos............................................... 13.7 Significado e compreenso considerados como interrelaes entre conceitos

13.8 A aquisio de conceito atravs da instruo programada............................. 13.9 As constncias perceptivas.................................................................................. CAPTULO 14 - SOLUO DE PROBLEMA E INTELIGNCIA........................ 14.1 14.2 14.3 14.4 14.5 A estrutura de um problema e a natureza de uma soluo............................ Quebra-cabeas..................................................................................................... Estratgias de procura de heursticas................................................................ Identificao do conceito.................................................................................... A mensurao de habilidades para solucionar problema: testes de inteli gncia ..................................................................................................................... 14.6 Correlao, teste de confiabilidade e validade.................................................. QUINTA PARTE: DINMICA DO REFORO......................................................... CAPTULO 15 - MOTIVAO I ................................................................................ 15.1 Causa e efeito e a noo de lei cientfica......................................................... 15.2 Causas fictcias do comportamento .................................................................. 15.3 Histria passada com contingncias de condicionamento e extino como causas do com portam ento................................................................................... 15.4 Motivos e reforadores................................................................... ..................... 15.5 Operaes de impulso ......................................................................................... 15.6 Periodicidades no valor do reforam ento......................................................... 15.7 Paradigmas de privao e saciao.................................................................... 15.8 A mensurao dos impulsos................................................................................ CAPTULO 16 - MOTIVAO I I ............................................................................... 16.1 16.2 16.3 16.4 16.5 Ativao e aspectos direcionais da motivao.................................................. Incentivo ............................................................................................................... Fatores fisiolgicos na motivao ...................................................................... Reforadores primrios adicionais...................................................................... Drives adquiridos..................................................................................................

298 305 311 311 315 318 321 323 327 335 337 337 339 340 342 343 344 346 348 361 361 365 366 371 377

CAPTULO 17 - CONTINGNCIAS AVERSIVAS................................................... 383 17.1 17.2 17.3 17.4 17.5 17.6 17.7 Reforadores negativos........................................................................................ Condicionamento de fuga ................................................................................... Parmetros de S'".................................................................................................. Estmulos aversivos condicionados..................................................................... Condicionamento de esquiva.............................................................................. Punio................................................................................................................... Masoquismo........................................................................................................... 383 384 385 390 392 398 402

CAPfrULO 18 - COMPORTAMENTO EMOCIONAL.............................. P ................

405

a emoo uma causa do comportamento ou um efeito comportamental? .. Trs conceitos de em oo.................................................................................. O paradigma da ansiedade.................................................................................. R aiva...................................................................................................................... Elao..................................................................................................................... Um modelo para representar einterrelacionar fenmenos emocionais.......... Medicina psicossomtica...................................................................................... O sistema nervoso autnom o.................................................................... i........ Controle emocional, maturidade emocional e comportamento emocional patolgico............................................................................................................... 18.10Um ndice de mudana emocional.....................................................................
NDICE ANALTICO..........................................................................................................

18.1 18.2 18.3 18.4 18.5 18.6 18.7 18.8 18.9

405 407 412 416 418 421 425 427 431 434
437

NOTAS AOS ESTUDANTES

UMA PSICOLOGIA INTRODUTRIA PODE SER INTERPRETADA COMO UMA introduo aos mtodos e princpios da anlise cientfica do comportamento. Embora as definies antigas de Psicologia enfatizassem os processos mentais, por razes que sero esclarecidas atravs deste texto, uma abordagem moderna Psicologia toma o comportamento dos seres humanos assim como dos animais inferiores como seu objeto de estudo. Apoiando-se firmemente no canone de que apenas o que pode ser observado pode ser cientificamente estudado, este ponto de vista moderno ataca problemas da Psicologia tradicional atravs da anlise do comportamento. No decorrer deste texto encontrar-nos-emos estudando e representando na linguagem do comportamento, tpicos tais como aprendizagem e memria, soluo de problema e inteligncia, sensao e per cepo, emoo e motivao. A organizao deste livro permitir que voc chegue a uma compreenso preliminar dos princpios bsicos do comportamento humano. Embora muitos dos paradigmas e conceitos fundamentais, que so tratados com detalhes, tenham sido derivados origi nalmente de experimentos de laboratrio com sujeitos animais, eles no so de modo algum limitados aos animais. Empregamos sujeitos animais na pesquisa psicolgica por razes pragmticas: o ser humano do sculo vinte provavelmente no se submeteria livremente a uma faixa ampla de controle ambiental necessria para um estudo cientfico; e mesmo que se submetesse, a sociedade no o permitiria. Para chegar a uma compreenso das causas do comportamento humano e animal, ser necessrio que voc adquira primeiro um vocabulrio tcnico e uma familiaridade completa com os conceitos bsicos da Psicologia. No se conhece um caminho mais curto para se chegar a tal vocabulrio. Voc dever aprend-lo do mesmo modo que, ao se preparar para uma partida de xadrez, necessrio aprender os nomes e movimentos permissveis das peas, as sadas mais comuns e os princpios bsicos de ataque e defesa. Ao estudar Psicologia, voc pode ter uma desvantagem peculiar que no existe na aprendizagem inicial de xadrez. Certas opinies e pontos de vista pr-concebidos sobre as causas do comportamento, os quais so uma parte padro da interpretao do mundo dada pelo bom senso, devem primeiro ser esquecidas. Infelizmente, esta viso do bom senso da natureza humana no sempre a mais til para a formulao de uma cincia

-1 9 -

sistemtica das relaes entre o comportamento e suas variveis controladoras. Por essa razo, ser melhor que voc tente colocar de lado seus preconceitos sobre as aes das pessoas e, em particular, seu sistema de representao dos assim chamados processos mentais internos. Tente, assim, abordar a matria com um ponto de vista novo, conten tando-se, inicialmente, em fazer perguntas ingnuas tais como O que o organismo observado estava fazendo? e O que se relaciona consistentemente com o que ele fazia? No incio, seu progresso pode parecer lento mas ele ser sempre seguro.

J. R. M.

- 20-

PRIMEIRA PARTE
A REGULARIDADE DO COMPORTAMENTO 1. 2. 3. 4. 5. UM BACKGROUND PARA A ABORDAGEM CIENTIFICA AO COMPORTAMENTO COMPORTAMENTO REFLEXO (EL1CIADO) CONDICIONAMENTO PAVLOV1ANO FORTALECIMENTO OPERANTE EXTINO E RECONDICIONAMENTO DO OPERANTE

Captulo 1

UM BACKGROUND PARA A ABORDAGEM CIENTIFICA AO COM PORTAMENTO

Quando Scrates ouviu falar das novas descobertas no campo da anatomia, que se propunham a provar que as causas dos movimentos corporais eram derivadas de um engenhoso arranjo mecnico dos msculos, ossos e articulaes, disse: Isto dificilmente explica porque estou sentado aqui, numa posio recurvada... falando com vocs (Kantor, 1963). Passaram-se 2.300 anos desde este comentrio de Scrates e nos sculos subsequentes, as causas do comportamento humano foram atribudas a mars, espirito divino, posio das estrelas e, com freqncia, simplesmente ao capricho. Nos ltimos cem anos, surgiu uma cincia do comportamento trazendo um conceito estrutural novo, com novas atitudes em relao s causas do comportamento. Uma breve histria dos eventos que levaram ao desenvolvimento desta cincia uma introduo apropriada para seu estudo. Assim como no existe um modo melhor de entender as atividades presentes de uma pessoa do que estando a par de sua histria passada, tambm no h melhor meio de entender as atividades presentes de uma cincia do que atravs do conhecimento do seu passado. 1.1 PRIMEIRAS TENTATIVAS PARA EXPLICAR E CLASSIFICAR O COMPORTA MENTO HUMANO

As origens precisas da cincia do comportamento, como aquelas todos os campos do conhecimento, esto perdidas na obscuridade dos tempos. Mesmo assim, sabemos que pelo ano 325 a.C., na Grcia antiga, Aristteles combinou a observao e a interpretao num sistema naturalstico de comportamento, ainda que primitivo. Aristteles procurou as causas (1) do movimento dos corpos, e (2) das discriminaes feitas pelos organismos. Descreveu muitas categorias de comportamento tais como a percepo dos sentidos, viso, olfato, audio, bom senso, pensamento simples e complexo, apetite, memria, sono e sonho..Seus tpicos soam-nos familiares, atualmente, e eles ro ainda encontrados de uma forma ou de outra, em quase todos os textos de Psicologia. Aristteles estava menos interessado na previso e controle da natureza do que estamos atualmente e, desta torma, suas explicaes do comportamento tm um sabor mais antiquado. Aristteles estava preocupado em explicar as vrias atividades de um indivduo, mostrando serem eias padres especficos de qualidades gerais, tais como apetite, paixo, razo, vontade e habilidade sensorial (Toulmin e Goodfield, 1962).
- 23 -

As observaes e classificaes de Aristteles e dos estudiosos gregos que o seguiram foram um incio substancial na tentativa naturalstica de entender as causas do compor-' tamento humano. Mas a nova cincia declinou com o desaparecimento da civilizao helnica. O incio da Era Crist e da Idade Mdia produziu um clima intelectual pobre para o desenvolvimento da observao e pesquisa: o homem voltou sua ateno para os problemas metafsicos. Os Padres da Igreja iniciaram e os telogos medievais comple taram uma transformao conceituai de uma das qualidades puramente abstratas de Aristteles numa alma sobrenatural a quem as causas do comportamento humano eram atribudas. Encarando esta alma como imaterial, insubstancial, e sobrenatural, um dualismo definitivo foi estabelecido entre alma e corpo. Colocando as causas do compor tamento numa regio no observvel do esprito, este dualismo inibiu o estudo naturalstico do comportamento. Ento, por um longo perodo de tempo, as cincias do comportamento permaneceram adormecidas. Temos que pular adiante para o sculo dezessete, no tempo de Galileu e o surgimento da fsica moderna para retomar os fios que eventualmente, deram-lhes uma estrutura cientfica. As teorias do filsofo e matemtico Ren Descartes (1596-1650), contemporneo francs de Galileu, representam uma quebra parcial da explicao metafsica do compor tamento. Tomando como modelo as figuras mecnicas dos jardins reais de Versailles que se moviam e produziam sons, Descartes sugeriu que o movimento corporal era o resultado de causas mecnicas semelhantes. As mquinas nos nrdins reais operavam baseadas em princpios hidrulicos. A gua era bombeada em tubos fechados para impulsionar os membros das figuras, produzindo movimentos, ou era conduzida atravs de aparelhos que emitiam palavras ou msicas quando a gua passava. Descartes imaginou que animais e homens eram, na realidade, um tipo de mquina complicada, analogamente construda. Ele substituiu a gua das figuras reais pelos espritos animais, um tipo de substncia intangvel, elstica e invisvel; e sups que os espritos flussem nos nervos de tal modo que entravam nos msculos causando, assim, sua expanso e contrao e, por sua vez, fazendo os membros se movimentarem. Algumas das Figuras Reais estavam arrumadas de maneira que, se os visitantes passassem por cima de ladrilhos escondidos, o mecanismo hidrulico atuante fazia as figuras se aproximarem ou se afastarem. Descartes tomou essa resposta mecnica como modelo para explicar como um estmulo ambiental externo poderia causar um movimento corporal. Uma ilustrao (ver la. Parte, p.21) num dos seus trabalhos, mostra o retraimentc de um membro de um homem prximo de uma chama. De acordo com Descartes, a m quina do nosso corpo assim formada de tal modo que o calor de uma chama excita um nervo que conduz essa excitao ao crebro. Do crebro, os espritos animais so transmitidos ou refletidos de volta ao membro, atravs do nervo, aumentando o msculo e causando assim a contrao e retraimento (Fearing 1930). O desejo de Descartes de encarar o comportamento humano como determinado por oras naturais foi somente parcial. Hle limitou sua hiptese mecnica para certos com portamentos involuntrios e sups que o resto era governado pela alma, localizada no crebro. A alma guiava inclusive os mecanismos dos comportamentos involuntrios , mais ou menos do mesmo modo que uma mquina poderia dirigir as Figuras Reais. A despeito deste dualismo e a despeito de sua escolha de um princpio hidrulico, as formulaes de Descartes representaram um avano no pensamento inicial sobre o com portamento. A teoria do corpo como um tipo especfico de mquina poderia ser testada por observao e experimentao. Hsta foi a propriedade seriamente omitida nas
- 24

explicaes medievais. Ao'restabelecer a idia de que, pelo menos, algumas das causas do comportamento humano e animal poderiaim ser encontradas no ambiente observvel, Descartes estabeleceu as bases filosficas que eventualmente iriam justificar uma abordagem experimental do comportamento. 1 .2 - A AO REFLEXA O ponto de vista de Descartes simboliza o novo interesse num mecanismo que conduziu experimentao sobre a ao reflexa do animal. Em 1750, um psiclogo escocs, Robert Whytt, redescobriu e expandiu experimentalmente o princpio do estmulo, de Descartes. Pela observao da contrao sistemtica da pupila luz, salivao a irritantes e vrios outros reflexos, Whytt foi capaz de estabelecer uma relao necessria entre dois eventos separados: um estmulo externo (por exemplo, a luz), e uma resposta corporal (por exemplo, a contrao da pupila). Alm disso, a demonstrao de Whytt que um nmero de comportamentos reflexos poderia ser eliciado numa r decapi tada, enfraqueceu a atratividade de uma explicao em termos de alma. Contudo, no foi possvel, ainda no sculo dezoito, olhar o estmulo isoladamente como uma causa sufi ciente do comportamento. A alma, pensou Whytt, provavelmente se difunde atravs da medula e do crebro, retendo, consequentemente, o controle mestre dos reflexos. Nos 150 anos seguintes, mais e mais relaes reflexas foram descobertas e elaboradas e o conceito de estmulo adquiriu mais fora. Ao mesmo tempo, a ao do nervo passou a ser compreendida como um sistema eltrico ao invs de hidrulico. No inicio do sculo XIX, a tendncia espiritual tomou-se suprflua para explicar a ao involuntria e Sir Charles Sherrington, clebre fisiologista ingls, pde resumir as causas do comportamento reflexo em leis quantitativas de estmulo-resposta. Essas leis relacionavam a velocidade, magnitude e probabilidade da resposta reflexa intensidade, freqncia e outras propriedades mensurveis do estmulo. A cincia havia anexado inteiramente o reflexo. Mesmo assim, uma grande proporo do comportamento humano e dos animais superiores permaneceu ligada a foras sobrenaturais. 1.3 - REFLEXOS CONDICIONADOS OU ADQUIRIDOS Pouco antes do incio do sculo XX, Ivan Pavlov, fisiologista russo, estava pesquisando as secrees digestivas de ces. No curso desses experimentos, notou que enquanto a introduo de alimento ou cido, na bca, resultava num fluxo de saliva, a mera apario do experimentador trazendo alimento poderia tambm eliciar um fluxo similar. Pavlov no foi, de modo algum, o primeiro homem a fazer observaes deste tipo. Mas parece ter sido o primeiro a suspeitar de que seu estudo detalhado poderia fornecer um indcio para a compreenso do comportamento ajustado e adaptado dos organismos. Foi esta viso que o ievou ao estudo sistemtico desses reflexos, os quais chamou de reflexos condicionais, porque eles dependiam ou eram condicionais a um evento prvio na vida do organismo. A apario do experimentador no eliciava origi nalmente a saliva. Somente depois que sua apario era frequentemente associada com alimento ou cido, ela apresentava esse efeito. A contribuio particular de Pavlov foi mostrar experimentalmente como os reflexos condicionais eram adquiridos, como poderiam ser removidos (extintos) e que faixa de energias do ambiente era efetiva em sua produo. Pavlov, em tempo, apontou uma lei geral de condicionamento: depois de uma

-2 5 -

associao temporal repetida de dois estmulos, aquele que ocorre primeiro, eventual mente, passa a eliciar a resposta que, normalmente, eliciada pelo segundo estmulo.' Esta lei continua conosco at hoje, ligeiramente modificada. Trs aspectos gerais do trabalho de Pavlov merecem nossa ateno. Primeiro, ele no estava satisfeito em observar simplesmente os aspectos gerais do condicionamento, como muitos outros fizeram antes dele (c. f. Hall e Hodge, 1890). E^m vez disso, ele prosseguiu para verificar a generalidade do fenmeno usando muitos estmulos e muitos ces. Foi somente depois de numerosas demonstraes que ele codificou numa lei o que havia descoberto -- lei esta aplicvel, pensou ele, a todos os estmulos e a todos os organismos superiores. Segundo, Pavlov, preocupou-se com os aspectos mensurveis ou quantitativos do fenmeno. Essas quantidades mensurveis, tais como a quantidade de saliva e o nmero de emparelhamentos do retlexo, foram teis por permitirem uma anlise deta lhada do condicionamento. Um terceiro aspecto do trabalho de Pavlov foi sua natureza sistemtica. Limitando seus estudos aos efeitos de numerosas condies sobre uma nica grandeza (quantidade de saliva), Pavlov assegurou que suas descobertas experimentais pudessem ser interrelacionadas e, consequentemente, mais significativas. Pavlov viu claramente como se deve proceder na explicao do comportamento. o naturalista deve considerar somente uma coisa: qual a relao desta ou daquela reao extema do animal com os fenmenos do mundo externo? Esta resposta pode ser extremamente complicada em comparao com a reao de qualquer objeto inanimado, mas o princpio envolvido permanece o mesmo. Estritamente falando, a cincia natural tem por obrigao determinar somente a conexo precisa que existe entre um dado fenmeno natural e a resposta do organis mo vivo a este fenmeno (Pavlov, 1928, p. 82) . Contudo, apesar de seu prprio interesse declarado na relao meio e resposta, Pavlov gradativamente passou a encarar o condicionamento como um estudo da funo do crebro. Suas explicaes tendiam a ser em termos de processos cerebrais hipotticos. Mas, na verdade, Pavlov raramente mediu qualquer relao real entre crebro e compor tamento. Assim, estas explicaes eram to fictcias como as primeiras explicaes em termos da alma. Tentando explicar o comportamento atravs de funes desconhecidas do crebro, ele evitava uma descrio direta do prprio comportamento violando, deste modo, uma das suas prprias afirmaes de que uma cincia do comportamento necessita determinar somente a "conexo precisa que existe entre um dado fenmeno natural e a resposta do organismo vivo a este fenmeno . L4 - A TEORIA DA EVOLUO E O COMPORTAMENTO ADAPT ATIVO De certo modo, o trabalho de Pavlov representa o auge da doutrina mecanicista de Descartes sobre o comportamento reflexo. Com respeito ao comportamento que tradicionalmente era colocado sob o controle do desejo ou volio, Descartes seguiu os preconceitos de seu tempo, atribuindo-o ao controle de uma alma no observvel. Tal soluo , todavia, apenas adiou a investigao cientfica, uma vez que o problema original de explicar o comportamento foi simplesmente transferido para um outro mais difcil, o de explicar o comportamento da alma postulada. Em 1859, ocorreu um grande evento cientfico que alterou o clima intelectual tornando-o favorvel para um estudo
-26 -

naturalistic*) do comportamento voluntrio. Naquele ano, Charles Darwin props a teoria da evoluo, dizendo que o homem era membro do reino animal e que diferenas entre o homem e outros animais eram quantitativas e somente uma questo de graus. Assim um conhecido historiador da Psicologia colocou a questo; A teoria da evoluo levantou o problema da Psicologia animal porque ela exige uma continuidade entre diferentes formas animais e entre o homem e os animais. De uma maneira vaga, a noo Cartesiana [de Descartes] ainda prevalecia. O homem possuia uma alma e os animais eram considerados sem alma, e havia, alm disso, pouca distino entre uma alma e uma mente. A oposio teoria da evoluo era baseada principalmente na suposio que fazia de haver continuidade entre homens e feras e a rplica bvia para a crtica foi demonstrar a continuidade. A existncia de mente nos animais e a continuidade entre a mente humana e animal, deste modo, tornou-se crucial para a sobrevivncia da nova teoria (Boring, 1929, p. 462-463) . A teoria de Darwin era baseada em muitas observaes cuidadosas que ele havia feito de fsseis e da estrutura da flora e fauna vivas, em reas isoladas da Terra. Alm disso, ele pesquisou o comportamento atravs do qual os animais se adaptavam aos seus meios. As observaes comportamentais de Darwin foram to amplas e detalhadas que marcam a primeira tentativa sistemtica de uma Psicologia Animal Comparativa (ver Darwin, 1873). O interesse de Darwin no comportamento foi, como observou o professor Boring, baseado naquilo que tal comportamento revelaria sobre a mente. Assim, a demonstrao da complexidade e variedade nos comportamentos adaptativos de animais em relao a seus ambientes mutveis, pareceria provar que eles, como o homem, deviam tambm pensar, ter idias, e sentir desejos. Consequentemente, Darwin foi criticado por seu antropomorfismo, isto , por tentar explicar o comportamento animal em termos de conceitos mentalistas. Mas pouco se pensou neste tempo em levantar a questo meto dolgica mais radicai; se os conceitos mentalistas tradicionais (pensamento, idia, desejos) tm valor explicativo mesmo para o comportamento humano. George John Romanes, amigo de Darwin, escritor ingls e popularizador da cincia escreveu um livro sobre a inteligncia animal (Romanes, 1886) no qual comparou o comportamento de vrias espcies de animais. Romanes colheu material da observao cuidadosa de animais, mas, tambm levou em considerao evidncias de cunho popular sobre animais de estimao e de circo. Por esta razo, seu mtodo veio a ser chamado aned tico. Os mtodos, antropomrfico e anedtico de Darwin e Romanes, respectivamente, marcaram uma renovao no interesse pelo comportamento adaptativo do animal e pela relao deste com o comportamento humano. Consequentemente, eles representam importantes precursores histricos de uma verdadeira anlise experimental do comportamento. 1 .5 - O S PRIM EIR O S EXPERIM EN TO S SOBRE O COMPORTAMENTO VOLUNTRIO Em 1898, Edward L. Thorndike, da Universidade de Columbia, publicou os resultados de alguns estudos de laboratrio com gatos, ces e pintos. Seus mtodos eram radicalmente opostos queles da observao casual que o haviam precedido. A aparelhagem utilizada por Thorndike mostrada na Fig. 1-1.0 comportamento estudado foi a fuga de um ambiente fechado e atos, tais como, puxar um cordo, mover um trinco,
- 27 -

pressionar uma barra ou abrir uma porta erguendo uma tramela, foram escolhidos por sua co n v en in cia e ex atid o de observao. Uma vez que qualquer um destes comportamentos podia ser organizado de modo a servir como instrumento que produziria a fuga da caixa, Thorndike os chamou de comportamentos instrumentais.

I igura 1-1. A caixa quebra-cabeas utilizada por Thorndike para estudar a aprendizagem instrumental de animais (Garret, 1951).

Quatro elementos do trabalho de Thorndike sobre o comportamento instrumental demonstram uma qualidade moderna no vista nas pesquisas comportamentais antes de sua poca. (1) Ele reconheceu a importncia de se fazer observaes de animais cujas histrias passadas fossem conhecidas e mais ou menos uniformes. Logo, criou seus animais no laboratrio onde poderiam obter condies ambientais semelhantes antes do experimento. (2) Thorndike compreendeu a necessidade de se fazer observaes repetidas de um mesmo animal e de se fazer observaes em mais de um animal e em mais de uma espcie. Somente deste modo poderia estar certo de que os resultados que ele obtinha eram aplicveis aos animais em geral. (3) Thorndike viu que, a menos que considerasse mais do que um ato particular do comportamento, suas concluses, seriam vlidas apenas para o nico aspecto do comportamento que ele escolhesse. Logo, empregou diversos comportamentos em vrios aparelhos diferentes. (4) Ainda outra qualidade do trabalho de Thorndike, caracteristicamente cientfica, foi sua tentativa de fazer uma apresentao quantitativa dos resultados. De seus trabalhos com animais nas caixas quebra-cabea, Thorndike apresentou um conjunto de princpios ou leis gerais do comportamento que acreditava serem vlidas para muitas espcies e muitos tipos de comportamento. Um desses, princpios, embora

-2 8 -

modificado chegou at nossos dias. Thorndike notou que, quando os animais eram inicialmente colocados na caixa quebra-cabea, eles apresentavam muitas respostas difusas de debater-se. Eventualmente, um desses comportamentos difusos poderia, por acaso, fazer funcionar o mecanismo de fuga. A porta, ento, abrir-se-ia, permitindo ao animal sair da caixa e o b te r um a pequena quantidade de alimento. Thorndike observou que o comportamento, que inicialmente permitia ao animal sair, era apenas um dos muitos que ele executava na situao. Assim, medida que o animal era repetidamente submetido situ a o , ele passava a a p re s e n ta r menos comportamentos suprfluos, at que eventualmente no apresentasse, praticamente, nenhum daqueles mal sucedidos. Thorndike concluiu disto que os resultados bem sucedidos do passado, ou efeitos do comportamento, deveriam ter uma influncia importante na determinao das tendncias comportamentais presentes do animal. Thorndike chamou isto a capacidade dos efeitos passados do comportamento modificarem os padres do comportamento animal a lei do efeito. Esta lei sobrevive ainda hoje como um princpio fundamental na anlise fundamental e controle do comportamento adaptativo. 1 .6- O ZEITGEIST Thorndike forneceu um novo mtodo experimental e com sua ajuda formulou o que logo seria aceito como uma lei bsica do comportamento adaptativo. Do mesmo modo que Whytt, 1 50 anos antes, deixou o conceito de reflexos parcialmente no estado de fato observado e parcialmente no estado de interpretao suprflua, assim tambmThrndike deixou a lei do efeito. Na sua proposio do princpio, Thorndike no estava satisfeito em considerar o efeito como uma mera fuga do confinamento ou mero acesso ao alimento. Mas em vez disso, sentiu necessidade de inferir que o sucesso levava ao prazer e a satisfao, e que estas eram as causas verdadeiras das mudanas observadas no compor tamento. Deste modo, ele deixou a explicao a cargo de estados mentais hipotticos, prazer e satisfao, os quais no eram mais reais do que a alma de Descartes. Para Thorndike, como para seus contemporneos, o comportamento de um gato escapar de uma caixa quebra-cabea no era importante como comportamento, mas somente como um meio de esclarecer os processos mentais e associaes de idias do animal. T h o rn d ik e foi, ento, fiel sua poca e suas tradies considerando o comportamento principalmente interessante pelo que podia revelar sobre algum outro sistema. O que as pocas e as tradies impem aos mais originais pensadores so frequentemente denominadas de Zeigeist. Os grandes homens de uma era erguer-se-o acima de Zeitgeist de algumas maneiras mas, mesmo assim, sero por ele acorrentados de outras maneiras. Descartes superou-o quando props uma teoria mecanicista original sobre o movimento do corpo. Que ele foi acorrentado pelo Zeitgeist, evidente, pela sua permanncia no dualismo mente-corpo . Vimos o Zeitgeist em Whytt, que redescobriu o princpio do estmulo, mas no foi capaz de eliminar a alma como a causa final dos reflexos que observou. Pavlov estudou os reflexos condicionados, um fenmeno cuja importncia foi negligenciada durante sculos. Mesmo assim, vimos que Pavlov estava preso pelo Zeitgeist; ele manteve o ponto de vista de que os reflexos condicionados, embora, claramente, um fenmeno comportamental, eram de interesse para a compreenso do crebro ao invs do comportamento. Agora, vemos o Zeitgeist em Thorndike, que realizou alguns dos primeiros experimentos sobre o comportamento voluntrio , mas explicou suas descobertas atravs da associao de idias. De fato, o

-2 9 -

princpio do Zeitgeist penetra de tal forma todas as cincias que podemos tomar como regra geral que todo trabalho humano ser colorido pelas teorias e ponlos de vistas aceitos em sua poca. Assim, embora a grandeza de um homem consista em libertar-se de certas maneiras de pensar estabelecidas e ver o que ningum antes dele viu claramente, ou, do mesmo modo, ele no escapar completamente do clima social, filosfico e 1 cultural no qual trabalha. 1.7 - A PSICOLOGIA PERDE A SUA MENTE Thorndike introduziu o comportamento adaptativo no laboratrio e, assim fazendo, descobriu a importncia da le i do efeito. Os estudos de Thorndike sobre o compor tamento surgiram do seu interesse, como Psiclogo, nos processos mentais. Ser instru tivo, neste ponto, examinar a disciplina da Psicologia que, na primeira metade do sculo vin te, fundir-se-ia com outras contribuies histricas da cincia do comportamento. A pesquisa psicolgica experimental iniciou-se em meados do sculo dezenove como uma disciplina derivada da fisiologia dos rgos dos sentidos. De fato, os pioneiros Herman Helmholtz, Johannes Mller e Wilhelm Wundt eram todos fsicos e fisiologistas. Estes primeiros psiclogos experimentais adotaram as categorias de comportamento descritas por Aristteles mas, de um modo diferente deste, eles estavam interessados no comportamento, apenas, na medida em que esclarecia os processos mentais. Logo, o trabalho dos primeiros psicologistas representava uma tentativa para tornar os mtodos experimentais naturalsticos, introduzidos por Galileu, compatveis com as doutrinas metafsicas da Idade Mdia. Foi Wundt que, em 1879, fundou o primeiro laboratrio de Psicologia em Leipzig. Podemos considerar o seu sistema como representativo das atividades desta nova disciplina, a qual tinha menos de vinte anos quando Thorndike estava fazendo seus experimentos com gatos e pintos na Colmbia. Wundt advogou que a psicologia era a cincia da experincia; e, como tal% seu objeto de estudo abrangia sentimentos, pensamentos e sensao. Ele formulou a doutrina de que o mtodo da Psicologia era introspectivo, um exame dos processos conscientes do organismo em experiencia. Logo, Wundt esquematizou o problema da Psicologia como (1) a anlise dos elementos dos processos conscientes, (2) a determinao de como esses elementos so conectados e (3) a determinao das leis de conexo (Boring, 1929, p. 328, ital. omitidos). Os expe rimentos que Wundt e seus seguidores realizaram do uma imagem melhor do contedo da psicologia do que as definies fornecidas por Wundt. A maioria dos trabalhos foi classificada sob o ttulo de sensao humana e dizia respeito ao sentido visual em particular. Numerosos experimentos mediam as intensidades mnimas de luz que um ob servador poderia detectar sob vrias condies. Outros estavam voltados para as menores mudanas ambientais necessrias para um observador relatar diferenas apenas percebidas m luminosidade, cor e distncia dos objetos. Tais pesquisas vieram a ser chamadas de experimentos de limiares em Psicofsica. Psico porque as sensaes eram consideradas estar sob estudo; fsica - porque mudanas fsicas no ambiente eram manipuladas e medidas experimentalmente. Audio, tato, gosto, olfato e o sentido do tempo tambm foram pesquisados, assim como o tempo de reao, ateno e sentimento. A memorizao de vrios tipos de slabas sem sentido era um mtodo para tratar a associao de idias e deduzir as propriedades da memria. Embora se afirmasse ser a psicologia uma cincia dos contedos, processos e atos mentais, o que de fato ela investigava era o comportamento. Associaes de idias eram

30-

inferidas a partir da aprendizagem de slabas sem sentido; sensaes idnticas eram inferi das de observaes do comportamento quando um sujeito humano agrupava dois objetos ambientais diferentes em contextos diferentes (por exemplo, duas amostras de papel cinza sob diferentes condies de iluminao); a velocidade do processo mental era inferida do tempo de reao do indivduo. Assim, no foi paradoxo algum o fato de que quando Thorndike veio a fazer uma observao mais detalhada da associao de idias, estivesse livre para escolher animais como sujeitos. Se o comportamento dos organismos humanos poderia levar inferncia sobre o processo mental, por que no o comportamento animal? Logo, aconteceu que o trabalho de Thorndike ajudou a intro duzir os mtodos de pesquisa animal na Psicologia. A eles pejmanecem ao lado dos descendentes metodolgicos da psicologia sensorial clssica e da Psicologia introspect iva do sculo dezenove. Mas, talvez o homem que mais contribuiu para esclarecer a relao entre o comportamento e Psicologia foi John B. Watson. O primeiro trabalho deste psicologista americano dizia respeito s modalidades sensoriais que o rato usa na aprendizagem de um labirinto. medida que Watson continuava seus estudos com animais, tornava-se mais e mais preocupado com o ponto de vista predominante de que o comportamento era significativo somente quando esclarecia processos mentais ou conscientes. Ocorreu a Watson que os dados do comportamento tinham valor em si mesmos e que os problemas tradicionais da Psicologia imaginao, sensao, sentimento, associao de idias poderiam ser todos estudados estritamento por mtodos comportamentais. Em 1913, Watson publicou um trabalho, atualmente clssico, definindo a psicologia como cincia do comportamento e chamando esta nova Psicologia de behaviorismo . Watson argumentava, neste trabalho, que o estudo do comportamento poderia chegar a u m status independente dentro da cincia. O objetivo de tal cincia seria a previso e controle do comportamento de todos os animais, sem nenhuma preferncia especial para os seres humanos. O behaviorista, dizia Watson, deve relacionar seus estudos de ratos e gatos com o comportamento humano no mais (no menos) do que o zoologista deve relacionar suas dissecaes de sapos e vermes anatomia humana. Atravs de sua doutrina, Watson estava destruindo a teoria homocntrica da importncia do homem no mundo do comportamento to eficazmente como Coprnico, quatrocentos anos antes, havia destrudo a teoria do universo geocntrico (terra no centro). O ponto crtico de Watson era o de que a psicologia deveria ser objetiva isto , ela deveria ter um objeto de estudo que, como nas outras cincias, fosse independente do observador. A Psicologia clssica, tentando estabelecer como seu objeto a autoobservao, carecia de um observador independente, localizado fora do sistema em considerao. A adoo do comportamento como objeto a ser observado deu nova psicologia o observador independente necessrio. O programa de Watson tinha um grande alcance e era para sua poca, notavelmente sofisticado. Ao enfatizar o comportamento como um objeto independente de uma cincia dirigida para a previso e controle do comportamento e a anlise microscpica do ambiente e comportamento em termos de estmulo e resposta como a maneira para a compreenso eventual de padres complexos do comportamento, o programa de Watson preparou a base para nossos pontos de vista modernos.
- 31 -

1 . 8 - 0 FIRME ESTABELECIMENTO DE UMA ANLISE EXPERIMENTAL DO COMPORTAMENTO Os primeiros experimentos de Thorndike sobre o comportamento animal e a definio de Psicologia dada por Watson, como uma cincia do comportamento, introduziram a pesquisa animal na Psicologia,Mesmo assim, o status cientfico da nova Psicologia era precrio. No princpio dos reflexos condicionados formulado por Pavlov, Watson pensou ter encontrado um mecanismo explicativo para muitos dos ajustamentos complexos e sutis de organismos adultos, inclusive o homem, aos seus ambientes. Mas a tentativa de forar todos os comportamentos no modelo do reflexo foi um fracasso. Watson no soube apreciar a importncia daJei do efeito de Thorndike, principalmente, pode-se supor, devido ao excesso de bagagem conceituai com que Thorndike envolvera a questo. O ponto de vista de Watson de que a tarefa de uma cincia preditiva do comportamento fosse a compilao de todas as correlaes estmulo-resposta hereditrias e adquiridas que um dado organismo exibisse, desviou a ateno da procura de leis gerais do comportamento. Neste vcuo terico, conceitos mentalistas tradicionais continuaram a sobreviver. O rigor experimental do behaviorismo estava fora de questo, mas sua meto dologia corria o risco de ser estril. Vinte anos de mtodo de cincia natural sustentados pelo behaviorismo fracas saram em fornecer uma formulao sistemtica consistente e til. Os dados experi mentais refletiam muitas propriedades arbitrrias dos aparelhos. Concluses acei tveis com qualquer grau de generalidade referiam-se a aspectos, caractersticas ou capacidades limitantes. Enquanto muitas dessas eram bastantes vlidas, poucas eram logicamente convincentes e preferncias pessoais levavam a muitas cincias individuais do comportamento (Skinner, 1944; p. 276). Numa srie de publicaes iniciadas em 1930, B. F. Skinner props uma formulao do comportamento que surgiu de observaes feitas num nico organismo respondendo numa situao experimental artificial, cuidadosamente controlada e altamente padro nizada. O organismo que Skinner usou foi o rato branco, e a aparelhagem consistia numa caixa contendo uma pequena barra que, se pressionada pelo rato, fornecia uma pequena pelota de alimento em um recipiente localizado diretamente abaixo da barra

Figura 1-2. A caixa de Skinner para o estudo do comportamen to operante de pequenos animais (Skinner, 1938).

-3 2 -

Sob essas condies experimentais, um rato faminto deixado s na caixa, logo viria a pressionar a barra com uma taxa constante e moderada at que um dado nmero de pelotas de alimento liberadas comeasse a saciar o animal. A situao experimental utilizada por Skinner e sua abordagem aos problemas do comportamento foram nicas em muitos aspectos. Skinner viu a necessidade de encontrar uma varivel dependente sensvel e exata. Isto , algum aspecto quantitativo do comportamento que pudesse variar numa ampla faixa e ter uma relao ordenada e regular com as variveis ambientais passadas e presentes, relao esta que pudesse ser formulada em termos de uma lei. Sua descoberta de que a freqncia de ocorrncia da resposta de pressionar a barra durante um intervalo de tempo (sua taxa) satisfazia essas condies, foi o principal avano em direo a uma anlise sofisticada do comportamento individual. A abordagem de Skinner aos problemas do comportamento diferia, de certo modo, daquelas dos seus precursores assim como de seus contemporneos que trabalhavam com a psicologia animal. Como proposio fundamental, ele sustentou que uma cincia do comportamento poderia ser o que chamou de descritiva ou funcional; isto , poderia limitar-se a descobertas de relaes ou correlaes entre variveis mensurveis. Skinner tambm argumentou que as pesquisas deveriam ser sistemticas, no sentido de que as relaes obtidas estivessem ligadas por um ponto comum. Limitando suas observaes s formas pelas quais uma nica varivel dependente (a freqncia por unidade de tempo de um ato arbitrrio mas, mesmo assim, representativo) mudavam com as condies ambientais variadas, Skinner manteve seu prprio trabalho altamente sistemtico. Um objeto de estudo, frequentemente, espera instrumentos para colocar o observador em melhor contato com ele. Skinner inventou um registrador que realiza um registro visual das respostas sucessivas atravs de um ligeiro deslocamento vertical de uma pena, movendo-se horizontalmente no tempo. medida que o experimento progride, um grfico de respostas acumuladas desenhado em funo do tempo. Esse registrador cumulativo de respostas torna possvel um registro de alta qualidade do processo comportamental para inspeo imediata que funciona para os behavioristas de uma maneira no diferente da que o microscpio funciona para o biologista. As contribuies metodolgicas reais de Skinner para a cincia moderna do comportamento so numerosas e podemos apresentar, aqui, somente um esboo de algumas das mais importantes. Ele reconheceu a antiga dicotomia entre aes reflexas e voluntrias ou, como chamou mais tarde, operantes. Mas mostrando que o princpio de Pavlov se aplicava ao fortalecimento dos reflexos, enquanto a lei do efeito de Thorndike descrevia o fortalecimento de operantes, ele colocou ambos os tipos em perspectiva harmoniosa. Formulou, tambrq um vocabulrio preciso cujos termos foram definidos com referncia aos fatores observveis que ele media e manipulava. Nessa terminologia est a base do nosso quadro conceituai moderno. Desde o inicio, Skinner enfatizou a importncia da predio e controle detalhados do comportamento individual, ao invs de diferenas gerais entre grupos de animais. Suas prprias pesquisas foram invariavelmente caracterizadas por um grande nmero de medidas em poucos organismos, sendo a reprodutibilidade do processo sob estudo o teste de sua validade. O enfoque de Skinner na taxa de uma resposta operante representativa evitou muitos dos problemas associados com as medidas mais indiretas do compor tamento. Thorndike observou o nmero de erros cometidos e o tempo gasto para alcanar o sucesso no seu quebra-cabea, mas nenhuma dessas era, na realidade, uma propriedade real do comportamento instrumental que estava sendo adquirido. Se dese jamos treinar um co a pular atravs de um aro, por exemplo, no estamos interessados
- 33-

nos erros que ele comete, mas no seu comportamento de pular atravs do aro. Os erros so medidas de comportamentos outros que no aqueles que estamos investigando. Questes interessantes sobre se um dado ato ocorrer ou no, ou com que freqncia ocorrer, nunca poderiam ser respondidas em termos de erros ou escores de tempo. O dado bsico de Skinner, a taxa de respostas, est relacionado de perto com a probabilidade de ocorrncia do comportamento e tem sido especialmente til em fornecer respostas a questes sobre a probabilidade da resposta. Com o passar dos tempos, Skinner ampliou sua base emprica. Combinaes de respostas e organismos outras que no o pressionar a barra por ratos tm sido estudadas. A expectativa original de que este ato seria caracterstico do comportamento operante, de um modo geral, tem sido aparentemente confirmada. Alm disso, as relaes que Skinner obteve garantem, em muitos casos, o ttulo de princpios comportamentais, j que elas parecem manter-se para um grande nmero de organismos, incluindo o homem, e para todas as respostas que podem ser classificadas como operantes. O trabalho de B.F. Skinner nos leva a um ponto prximo da nossa conceituao moderna de cincia do comportamento. Estamos ainda muito perto desse perodo his trico, muito envolvidos em nosso prprio Zeitgeist, para termos a perspectiva necessria para determinar os pontos fracos no sistema de Skinner. Nos captulos que se seguem, todavia, veremos que a cincia do comportamento, atualmente restabelecida de um modo firme como uma cincia natural, est se expandindo em muitas reas de pesquisas. Talvez, a prova mais convincente de que essa cincia se desenvolveu encontra-se no surgimento recente de uma tecnologia do comportamento esboada diretamente a partir dela. Como veremos, as aplicaes de tcnicas do comportamento esto sendo ampliadas a pesquisas de drogas, treino de animais, guerras, tratamento do comportamento humano anormal e educao. 1.9 - REVISO A histria da cincia do comportamento comea com a classificao naturalstica do comportamento feita por Aristteles. Logo foi sucedida por uma Filosofia Teolgica e a anlise do comportamento permaneceu adormecida por quase dois mil anos. Mas no sculo XVII, surge novamente com a concepo de Descartes de que o corpo animal uma mquina, e alguns dos seus movimentos so ordenados e regulares. Robert Whytt e vrias geraes de fisiologistas posteriores mostraram que estes movimentos de caracterstica automtica se relacionavam, de forma precisa, a eventos particulares nc ambiente do animal. Essa relao entre um evento ambiental e um movimento particular torna- e a primeira unidade organizada de anlise para a cincia do comportamento. o reflexo. Eventualmente, Pavlov amplia o conceito de reflexo para incluir relaes ambiente-comportamento que so condicionais a operaes anteriores na histria do animal. Esses reflexos condicionais tornam possvel uma anlise de alguns dos comportamentos que um organismo adquire durante sua vida. Thorndike o primeiro a mostrar que o comportamento que possui uma espontaneidade no observada nos reflexos obedece a certas leis qualitativas que diferem das leis do reflexo. Nessa poca, John Watson inicia a sua campanha para convencer a Psicologia, o estudo da mente, de que a mente , em grande parte, comportamento. Com a descoberta de B. F. Skinner de um objeto de estudo fidedigno, a taxa de respostas operante, o comportamento espontaneamente emitido comea a desenvolver leis prprias, sendo cada ocorrncia to

-34-

geral e previsvel como aquelas do reflexo. Aiiistria da anlise do comportamento revela que os homens esto bastante enclinados a adotar interpretaes suprfluas sobre o com portam ento, ao invs de aceitar a realidade das descries do prprio comportamento. Quase todo contribuinte da cincia compartilhou de algumas supersties da sua poca sobre o comportamento que estava pesquisando.
REFERNCIAS PARA O CAPITULO 1.

Boring, E. G. A history of experimental psychology. New York: The Century Company, 1929. Darwin, C. R. The expression of the emotions in man and animals. London: Murray, 1873. Dennis, W. Readings in the history of psychology. New York: AppletonCentury, 1948. (Chapters 3, 45, 48, and 50.) Fearing, F. Reflex action: a study in the history of physiological psy chology. Baltimore: Williams and Wilkins, 1930. Garrett, H. Great experiments in psychology , New York: AppletonCentury-Crofts, 1951. Hall, G. S., and Hodge, C. F. A sketch of the history of reflex action. Am er. J. Psychol ., 1890, 3, 71-86; 149-173; 343-363. Kantor, J. R. The scientific evolution of psychology. Vol. 1. Chicago: Principia Press, 1963. Pavlov, I. P. Lectures on conditioned reflexes. New York: International Publishers, 1928. Romanes, G. J. Anim al intelligence. (4th ed.) London: Kegan Paul, 1886. Skinner, B. F. A review of C. L. Hulls Principles of behavior. Am er. J. Psychol., 1944, 57, 276-281. Skinner, B. F. The concept of the reflex in the description of behavior. /. gen. P s y c h o l 1931, 5, 4 27-458. Thorndike, E. L. Animal intelligence. Psychol. R e v . Monogr. Suppl. 1898, No. 8. Toulmin, S., and Goodfield, June. The architecture of matter. New York: Harper and Row, 1962. Watson, J. B. Psychology as the behaviorist views it. Psychol. R ev.f 1913, 20, 158-177.

-3 5 -

Captulo 2 - COMPORTAMENTO REFLEXO (ELICIADO)

Seria consistente com a nossa argumentao histrica sobre a cincia do compor* tamento afirmar que a Psicologia a cincia que se preocupa com o modo pelo qual o comportamento de um organismo est relacionado com o seu ambiente. Talvez a mais simples dessas relaes comportamento-ambiente seja o reflexo. Para o fisiologista, o reflexo um fenmeno a ser explicado. Isto , o fisiologista est interessado nas estruturas anatmicas subjacentes ao reflexo e os eventos corporais que ocorrem entre o estmulo eliciador e a resposta. Seu interesse baseia-se na compo sio ou anlise do reflexo. Para o Psiclogo, por outro lado, o reflexo um fenmeno a ser empregado para explicar outros comportamentos. Isto , o Psiclogo est interessado em mostrar que padres complexos de comportamento so compostos de, ou podem ser sintetizados a partir dos reflexos. A distino anlise-sntese mostra de uma vez o ponto comum e o ponto de partida das duas cincias. A partir do reflexo, as duas disciplinas movem-se em direes diferentes. Como Psiclogos, desejamos usar o reflexo como um princpio explanatrio ou como uma unidade de anlise do comportamento mais com plexo. Portanto, devemos entender algumas das propriedades quantitativas e conceituais dos reflexos. 2.1 - A FRMULA S - R Como vimos ao considerar o comportamento reflexo no captulo 1, Descartes e Whytt representaram o ambiente com o conceito de estmulo. E representaram o com portamento em termos dos movimentos do organismo ou resposta a este estmulo. Esses conceitos continuam a ser teis para a descrio de relaes ordenadas entre ambiente e comportamento. Neste captulo, designaremos o estmulo na relao reflexa pelo smbolo S e a resposta pelo smbolo R. A regularidade existente na relao entre eventos ambientais e aes reflexas podem ser resumidas pela frmula. R 2 = / ( S2) ^ssa frmula diz que uma certa resposta reflexa, R 2 (chamada um respondente). uma funo de (isto , depende de) um evento estmulo S2 (chamado um eliciador)1. Essa
1. Os n d ices n u m rico s sero esclarecidos no C a p tu lo 3.
-37 -

frmula expressa uma relao ou correlao importante, entre dois eventos. No de correr deste captulo, examinaremos esta correlao em detalhe. Um dos experim entos de Sherrington serve de ilustrao. Ele conectou um msculo da perna de um gato a um aparelho para medir a contrao deste msculo. Anteriormente, sob anestesia, o crebro do gato havia sido desconectado da medula. (No estudo dos reflexos, as influncias que no esto sob o controle direto do experimentador so frequentemente removidas cirurgicamente. Neste caso, separar o crebro da medula espinhal remove qualquer efeito possvel que o crebro possa ter sobre o msculo em estudo.) Choques eltricos breves de vrias intensidades foram, ento, apli cados a um nervo sensorial que se sabia estar envolvido em um arco reflexo neste msculo. A Fig. 2. 1 ilustra os resultados hipotticos do tipo que Sherrington poderia ter obtido, medida que aumentasse gradualmente a intensidade do choque em sete tenta tivas sucessivas. Algumas das propriedades de um reflexo tpico esto representadas: por exemplo, se observarmos, na Fig. 2.1, que a linha relativa ao tempo se desloca da esquerda para a direita, observaremos primeiramente que o choque mais fraco (o choque mais fraco e localizado na extrema esquerda) no elicia um respondente. Valores de choque no suficientes para eliciar uma resposta . Mas para estarmos certos, apresentamos o mesmo valor do choque novamente na tentativa 3. Desta vez, obtemos uma resposta. Este valor do choque se encontra no que chamaremos a regio de penumbra ou limiar: o bastante forte para, algumas vezes, eliciar um respondente e outras vezes no. Continuando nossas apresentaes de choque de maior intensidade observamos um nmero de efeitos inte ressantes: (1) cada apresentao de choque seguida por (elicia) um respondente, (2) choques eliciadores mais fortes so seguidos por respondentes mais fortes, (3) os respondentes ocorrem mais rapidamente aps eliciadores mais fortes; isto , o tempo entre o eliciador e o respondente, chamado latncia, menor quando o eliciador mais forte.

latncia longa

latncia curta

r* i
Respondente

A regio de penumbra

Choques eltricos no msculo

JL

JL

.k A A h

T em p o

- ----- 1 -----1 -----1 -----1 ---- J-----1 -----1 -----1 -----1 -----1 ----- 1 J----- L i ---------- 1 ------------- l

Figura 2 1 Seqncia temporal esquemtica de apresentaes repetidas de um eliciador e a ocorrncia de respondentes associados. A altura dos respondentes indica sua magnitude. A altura dos eliciadores indica sua intensidade. A distncia entre o aprecimento do eliciador e o aparecimento do respondente representa a latncia. A linha do tempo feita por um marcador peridico que marca intervalos de tempo iguais e arbitrrios.
-3 8 -

A descoberta de relaes e propriedades como essas ilustradas na Fig. 2. 1 um dos objetivos permanentes da cincia. Quando relaes qu se mantm entre os valores de um evento (tais como intensidades de choque) e valores de outro evento (tais como a mag nitude ou rapidez de movimento do msculo) podem ser isoladas ou reproduzidas dia aps dia, experimento aps experimento, frequentemente falamos da regularidade da natureza. De um modo figurado, estamos dizendo que a natureza parece ser limitada por certas leis cuja descoberta o principal objetivo da pesquisa cientfica. Devemos qualificar cuidadosamente essa ltima proposio * todavia, porque parece certo que as relaes ou leis da natureza no so como conchas numa praia, esperando por ns para ajunt-las numa cesta cientfica. Antes de podermos estabelecer leis relacionando nossos conceitos, preciso termos formulado, pelo menos numa primeira aproximao, os nossos conceitos. A descoberta das leis do reflexo foram precedidas por quase trezentos anos de uma evoluo gradual do conceito de estmulo, iniciando-se com Descartes. Ento, a cincia uma operao similar ao funcionamento de uma armadilha. Em estgios pr-cientficos, nossa intuio e experincia ingnua levam-nos a suspeitar que uma certa ordem existe na natureza a especulamos qual a natureza desta ordem. (Por exemplo, consideremos a suposio de Descartes de que o comportamento involuntrio era como uma mquina.) Ento, comeamos a perturbar um pouco a natureza, isto , a fazer experimentos e, assim, mudar o curso natural dos eventos de modo que possamos obter uma idia melhor do que pode acontecer com um fenmeno particular. Mas mesmo para fazer um primeiro experimento exploratrio, necessitamos, geralmente, definir nosso fenmeno de um modo mais preciso, bem como decidir sobre o que alterar e onde procurar pelos efeitos de nossa alterao experimental. Os resultados do nosso primeiro experimento permitir-nos-o definir nossos termos ainda mais preci samente. Deste modo, modificamos continuamente os nossos conceitos. Ao mesmo tempo, enriquecemo-los, relacionando-os a outras coisas que so conhecidas. Alm disso, tendo refinado nossos conceitos na base de experimentos, somos levados a novos experi mentos. Diz-se, s vezes, que um bom experimento responde uma velha questo e levanta duas novas. No h um ponto final para esse processo (o qual a cincia) uma vez que estamos continuamente refinando e redefinindo os nossos conceitos e continuamente relacionando uns aos outros. 2.2 - LEIS DO REFLEXO PRIMRIO A ordem ou regularidade ilustrada pela Fig. 2-1 est ao nvel de uma das unidades mais simples do comportamento, o reflexo. Devido ao fato de que esta regularidade envolve o comportamento dos organismos como a propriedade que sujeita a, ou sensvel a mudanas no estmulo eliciador, chamamos essas leis de leis do comportamento. Os cientistas tentam formular suas leis de um modo to geral quanto possvel. No estariam satisfeitos em ter uma lei para o efeito de choques eltricos' sobre o msculo da perna, outra para os efeitos de cidos na boca sobre a salivao e ainda outra para o reflexo pupilar. Eles preferem expressar suas leis em termos de certas propriedades comuns a todas essas relaes, de modo que possam abranger uma faixa de fenmenos to ampla quanto possvel. Assim, quando Sherrington estudou os reflexos, ele fez um estudo de muitos reflexos envolvendo eliciadores e respondentes diferentes. A partir de experimentos deste tipo, ele formulou trs leis que podemos chamar as trs leis
-3 9 -

primrias do reflexo. Essas leis no so deformuladas em termos de qualquer eliciador particular como o choque eltrico, ou de qualquer respondente particular como um determinado movimento muscular. Elas so, ao invs disso, formuladas genericamente em termos de estmulos eliciadores (qualquer eliciador) e respostas (qualquer res pondente). Formulando-as assim, obtemos uma generalidade adequada, mas com sacri fcios de detalhes particulares. Por exemplo, a relao exata entre a intensidade do estmulo e a magnitude do respondente varia de reflexo para reflexo. Algumas vezes, a relao quase diretamente proporcional, de modo que numa ampla faixa de intensidade de estmulos, dobrando-se a intensidade do estmulo, a magnitude do respondente ser dobrada, e assim por diante. Em outros reflexos, um aumento de dez vezes na inten sidade do estmulo seria necessrio para produzir o dobro da magnitude do res pondente. Nossas leis do reflexo primrio so expressas de tal forma que essas diferenas ficam encobertas. Os eliciadores sempre podem ser especificados por uma dimenso de intensidade. E n t o , eliciadores do tipo do choque podem ser fracos, moderados, ou de maior intensidade. Eliciadores do tipo da luz para respostas pupilares podem variar de intensidades to fracas, que mal podemos ver, a intensidades to altas que a luz torna-se dolorosa. Como notamos, energias abaixo de um certo nvel na dimenso da intensidade so insuficientes para eliciar qualquer resposta. medida que a intensidade gradativamente aumentada, encontramos uma regio em torno da qual valores da intensidade podem ou no eliciar um movimento. Essa regio de indeterminao onde a intensidade pode ou no ser o bastante forte para eliciar um respondente a regio de penumbra do limiar. Podemos formular essa informao mais especificamente numa lei: 1. Lei do limiar. Existe uma faixa de intensidade abaixo da qual nenhuma resposta ocorrer e acima da qual uma resposta sempre ocorrer. Dentro dessa faixa as respos tas ocorrero com alguma incerteza. Um ponto arbitrrio, nessa regio de incerteza (digamos, aquela intensidade que elicia a resposta 50 por cento das vezes) chamado de limiar, intensidade acima desse ponto so chamados estmulos eliciadores. medida que a intensidade do estmulo aumentada a resposta ocorre sempre e graduada em relao ao estmulo. Ento, eliciadores fortes eliciam rapidamente respondentes fortes e de longa durao. Eliciadores fracos so seguidos mais lentamente por respostas fracas e de curta durao. A maior parte dessa informao pode ser represen tada por duas leis do reflexo: 2. Lei da Intensidade-Magnitude. A medida que a intensidade de um estmulo eli ciador aumentada, a magnitude do respondente eliciado tambm aumenta. 3. Lei da latncia. medida que a intensidade do estmulo eliciador aumentada, o tempo (latncia) entre o aparecimento do estmulo eliciador e o aparecimento do respondente diminui. As leis do reflexo so importantes para definir o conceito de reflexo. Pode-se dizer que um reflexo uma correlao entre uma mudana em parte do ambiente e uma propriedade comportamental, tal que as trs leis muito especiais que descrevemos acima sejam vlidas. Esquematicainente, um reflexo pode ser representado assim S2 ^ R-2
- 40 -

onde S2 representa um eliciador, > representa causa pelas leis do reflexo e R2 representa a mudana comportamental produzida. Nessa frmula vazia nada dito sobre como R 2 depende de S2 . Tal frmula pode ser considerada extremamente geral (ela descreve toda ao reflexa) e muito pouco precisa (ela no especifica os detalhes de qualquer ao reflexa particular). A seta > pode ser lida elicia, onde elicia defini do como 'conduz , pelas leis do reflexo . O termo elicia de alguma importncia na cincia do comportamento porque denota um grupo muito especfico de leis causais entre ambiente e comportamento, isto , as leis do reflexo. Ento, S2 pode ser dito um estmulo eliciador, uma mudana no ambiente que est correlacionada com o compor tamento atravs das leis do reflexo. Similarmente, R 2 *o respondente, definido como uma resposta eliciada. E til reservar a palavra eliciar para a definio precisa formulada acima. Nos captulos subseqentes empregaremos o termo estmulo repetidamente em conjuno com um tipo diferente de controle sobre o comportamento. Mas distinguiremos tal controle pela omisso cuidadosa do qualificador "eliciar" naquele contexto. 2.3 - LEIS SECUNDRIAS DO REFLEXO Certas leis, chamadas leis secundrias do reflexo, codificam uma informao adicio nal. Uma delas a lei da fadiga do reflexo. Quando um respondente repetidamente eliciado muitas vezes por segundo, por uma intensidade de estmulo constante, a mag nitude do respondente declina gradualmente, e eventualmente a resposta pode cessar de todo. Esse fenmeno chamado faiiga do reflexo e visto esquematicamente na Fig.
2- 2 .

Pf llririnnnnnri-------------- ------------------

s 2n n n n n n n n n n n n n n n n n n nr i n . n - - - T em po __ 1 ------1 ------ 1 ------ 1 ------ 1 ------1 ------1 ------1 ------1 ------

Figura2-2. Fadiga do Renexo.

Um erro comum cometido ao se dizer que o declnio do respondente a zero


devido fadiga. Isto um exemplo de uma explicao inteiramente vazia e deveria ser

evitado. Um fenmeno, (y), parcialmente explicado quando pode ser relacionado a outro fenmeno, (x), que ocorre anteriormente no tempo. A chuva, (y), parcialmente explicada quando pode ser relacionada condensao de vapor de gua que ocorre quando uma nuvem quente rapidamente esfriada, (x). A febre tifide, (y), par cialmente explicada quando pode ser relacionada s atividades, (x), de um pequeno microorganismo, a Salmonella typhosa. Mas para explicar que o declnio do respondente, (y) da Fig. 2-2, devido fadiga, a que (x) o estamos relacionando? A fadiga, usada neste sentido, uma entidade no observvel - sem qualquer propriedade independente a ser relacionada ao fenmeno observvel. Esse declnio do respondente a fadiga, e no devido fadiga. Outra lei secundria do reflexo a lei da Somao Temporal de Subliminares. Lembremo-nos de que na Lei do Limiar, apresentaes muito fracas de energias apropria
-41 -

das no eliciam respondentes. Diz-se que esses valores baixos de energia esto abaixo do limiar, e so chamados subliminares. Todavia, se apresentarmos dois ou mais desses subliminares em sucesso rpida podemos, sob certas condies, produzir um respondente. Esse fenmeno visto esquematicamente na Fig. 2-3. como se as duas intensidades subliminares se somassem para formar um nico eliciador. A somao tem poral, vista na Fig. 2-3, define exatamente o que queremos dizer por esses conceitos que chamamos de reflexos, estmulos eliciadores e respostas eliciadas.

Figura 2-3. Somao Temporal.

-----* ------------ m --------------------- -------------------

Tempo ------ 1 ------ 1 ____i ____i ------ 1 ------1 ____i ----- j------ 1 ------

Podemos notar em relao a isto que a palavra eliciar frequentemente tomada sem crtica, como sendo idntica a causar. (Por exemplo um estmulo luminoso pode ser dito causa, de um comportamento pupilar.) O termo causa uma palavra antiga usada, s vezes, na histria da filosifia e da cincia para denotar uma relao necessria e suficiente entre eventos. A palavra parece ter sido empregada para descrever um evento X, sempre que X se relaciona a um evento Y, de tal forma que se h o evento X ento o evento Y ocorrer; e se no Yf ento no X. Tente essa frmula. Faa de Y um respondente, digamos uma contrao muscular, causada por um estmulo-choque que chamamos X. Logicamente, certo que: se o choque, ento a contrao. tambm certo que, se no observarmos a contrao (no Y ), ento no ter havido um dado estmulo, o choque (no X). , ento, evidente que, logicamente, um estmulo eliciador pode ser dito causar uma resposta na ao reflexa, mas tambm claro que essa proposio oferece pouca informao sobre a natureza exata da relao causai. Em geral necessitaremos de uma descrio mais detalhada da relao entre o comportamento e suas causas do que possvel por uma mera proposio da sua sucesso lgica na frmula X e Y. Logo, o termo eliciar prefervel ao termo causar no presente contexto no porque seja algo mais objetivo ou lgico que a palavra causar mas porque eliciar contm uma grande proporo de todas as leis primrias e secundrias do reflexo. Evidentemente, quando chutamos uma bola causamos sua resposta de viajar no ar. Mas as leis que governam essa resposta so as leis do movimento, de Galileu eno as leis do reflexo, de Sherrington. 2.4 FORA DO REFLEXO: UM CONSTRUCTO HIPOTTICO

Consideremos uir. dado reflexo, digamos, flexionar o joelho a uma pancada no mesmo. Em qualquer momento, esse reflexo ter um certo limiar, indicado pela menor intensidade da pancada necessria para eliciar algum movimento da perna. Alm disso, em qualquer momento, uma pancada com uma intensidade fixa eliciar um movimento de uma determinada magnitude, com uma dada latncia entre S2 e R 2 . E ainda, no mesmo momento podemos conceber que um dado nmero de pancadas ser necessrio
-4 2 -

para fatigar o reflexo. Uma caracterstica importante dos reflexos encontrada na o dservao de que, nos momentos em que o limiar baixp (uma pancada muito fraca efetiva) a magnitude de R.2 para um dado valor de S2 (padro) ser alta, a latncia ser curta e o nmero de S2 sucessivos necessrios para fatigar o reflexo ser grande. Ao contrrio, naqueles momentos em que o limiar alto (uma pancada forte necessria para qualquer movimento), a magnitude de R2 para um valor padro de S2 ser baixa, a latncia ser longa e apenas poucos S2 sucessivos sero necessrios para fatigar o reflexo. Essa associao sistemtica ou co-varincia das propriedades do reflexo (limiar, mag nitude, latncia, etc.) levaaurna interessante construo lgica. Somos levados a identificar essa co-varincia e inferir que existe uma entidade hipottica que intervm entre o estrtiulo e o respondente. Deduz-se que esta entidade, a ser designada como fora do reflexo, determina a variao sistemtica, ou co-varincia de cada propriedade do respondente. No caso do reflexo, o cons true to fora do reflexo definido por essa co-varincia de tal modo que grandes magnitudes, latncias curtas, limiares baixos, R 2 fatigadas lentamente, etc; representam reflexos fortes. Ao contrrio, pequenas mag nitudes, latncias longas, limiares altos, R2 rapidamente fatigadas, etc. constituem refle xos fracos. Note que o constructo no definido exclusivamente em termos dos valores respondente. Ele incorpora (no limiar) tambm o valor do eliciador. Ento, uma R2 de graitde magnitude no precisa necessariamente representar um reflexo forte. Ela pode bem ser o resultado de um reflexo fraco sendo testado com um S2 intenso. O construto fora do reflexo representado na Fig. 2.4.
Magnitude

Figura 2-4. O construto fora do

Limiar

Diz-se que o construto da Fig. 2-4 hipottico, simplesmente porque no dire tamente observado. Ningum viu a fora de um reflexo; o que vemos so meramente as mudanas no comportamento. Mas o fato de mudanas comportamentais estarem corre lacionadas umas s outras induz-nos a agrup-las como reflexes de uma entidade nica subjacente. O formar construtos como a ora do reflexo apresenta certos riscos, particularmente ao se determinar propriedades para o construto hipottico que vo muito alm das observaes que lhe do origem. Ainda assim a construo hipottica um tipo importante e persistente de formao de conceito em todas as cincias e sua justificao encontra-se na sua utilidade. No caso particular da fora do reflexo, ela entra como um conceito til na formao de outras leis num sistema de comportamento. (Lembre-se, primeiro devemos ter nossos conceitos, ento, chegar s nossas leis.) Por exemplo, drogas, doenas do sistema nervoso central e eliciao simultnea de outros reflexos todos causam mudanas concorrentes nas grandezas que definem a fora do reflexo. Ento, conveniente representar essas leis correlacionadas por um nico termo, fora do reflexo. Veremos outros exemplos desse tipo de representao e composio de relaes em captulos seguintes.
-4 3 -

2.5 - EXEMPLOS COMUNS DE REFLEXOS s observaes que so resumidas como leis do reflexo so mais facilmente feitas em msculos cirurgicamente isolados de influncias outras que no aquelas do eliciador em estudo. Embora estudemos reflexos em msculos cirurgicamente preparados para obter mos preciso de controle, os reflexos so facilmente vistos em formas qualitativa no comportamento intacto de todos os animais, desde o homem s espcies mais inferiores. A ilustrao de Descartes relativa ao retraimento do membro de um homem de uma chama (ver p. 1) um reflexo humano intacto. Outros so as eliciaes de lgrimas pelo sumo de cebola, espirro devido pimenta no nariz, flexo do joelho devido a uma pancada no tendo patelar, descarga de saliva quando alimento colocado na boca, mudana no batimento cardaco devido a um som alto,e assim por diante. Todos esses reflexos estlo de acordo com o nosso modelo fundamental, ou paradigma, S2 > R2 onde algum S2 elicia algum respondente R 2 ; e se o reflexo pudesse ser apropriadamente isolado, uma relao como aquela na Fig. 2-1 seria obtida. Alguns exemplos de seqn cias eliciador-respondente so vistos na Tabela 2.1. Todas as correlaes na Tabela 2.1 so reflexos. Alguns envolvem msculos do esqueleto (espirro, flexionar o joelho, tremo res), alguns envolvem msculos cardacos (mudanas na taxa cardaca), outros envolvem glndulas (salivao, lgrimas) e outros envolvem msculos lisos (palidez da pele, mudan as pupil ares). Tabela 2.1 SEQNCIA COMUM DE REFLEXOS

NOME DO REFLEXO Lacrimal Espirrar Patelar Salivar Sobressalto

ELICIADOR S2 sumo de cebola nos olhos Pena no nariz, Pancada no joelho Alimento na bca Barulho alto

PELAS LEIS DO REFLEXO CONDUZ Lacrimejar

RESPONDRNTE R-,

Espirro Flexo do joelho Salivao Taxa cardaca aumenta, mscu los do esqueleto contraem-se, pupila dilata-se, :tc. Tremor, palidez t Contrao pupila pele

Tiritar Pupilar

F rio

Luz no olho

- 44 -

Uma vez ou outra, esses reflexos tm sido chamados de involuntrios, involuntrio um termo histrico empregado para expressar grosseiramente a natureza automtica e eliciada de certos comportamentos. Desde a anlise quantitativa de Sherrington sobre o reflexo, o conceito original de eliciao tem sido bastante refinado. Parece criterioso, assim, substituir.o mais velho e o mais vulgar dos termos involuntrio pelo mais exato eliciado , que compreende todas as leis do reflexo em sua definio. Essa substituio eventual de um termo pobremente especificado, que, com freqncia, foi associado a um quadro pr-cientfico de referncia, uma ocorrncia comum e tpica na cincia. Por outro lado, algumas vezes, uma anlise cientfica retem a velha palavra mas imprime-lhe um significado novo e preciso. A cincia reteve do vernculo as palavras fora em fsica, elemento em qumica e motivo em psicologia, mas tem mudado e expandido bastante os seus significados. Mas no sempre fcil separar as conotaes de conceitos prcientficos e, algumas vezes, uma nova palavra ajuda na mudana conceituai. A velha palavra, ento, ser deixada de lado para morrer lentamente pelo desuso. Tal o caso da palavra involuntrio em psicologia. 2.6 - VARIABILIDADE NAS MEDIDAS: RESUMO DOS DADOS COM DISTRIBUI ES DE FREQUNCIA; ESTATSTICA BSICA; A CURVA NORMAL Um importante passo em direo anlise de qualquer fenmeno natural ocorre quando certos aspectos deste fenmeno podem ser medidos. Medidas implicam em nmeros e os nmeros que so registrados pelos pesquisadores sob vrias condies de observao so o que chamamos de dados quantiativos brutos. Um nmero prodigioso de medidas ou dados so geralmente coletados no curso de um nicn experimento. Mesmo uma demonstrao muito casual de uma das leis do reflexo poderia facilmente requerer at 250 medidas da magnitude do respondente. As numerosas medidas que constituem os dados brutos de um experimento so inconvenientes. Seu grande volume torna-se de difcil compreenso, mesmo para o pesquisador que as coletou. Certamente, elas dificil mente poderiam ser comunicadas em sua forma bruta a uma comunidade cientfica como um todo. Sob tais presses, desenvolveram-se mtodos de resumir os dados e caracterizlos por alguns de seus aspectos proeminentes. Estas caracterizaes sumrias e descritivas constituem o que chamamos estatstica descritiva. No restante desta seo, considerare mos brevemente certos conceitos estatsticos simples considerados teis pelos experimentalistas na descrio e resumo de seus dados. Suponha que estejamos com a tarefa de determinar a magnitude do respondente patelar eliciado por uma pancada com uma fora de 70,00 g aplicada no joelho. Iniciamos sentando nosso sujeito confortavelmente, colocando suas pernas numa posio padro e aplicando, ento, nossa pancada de 70,00 g num ponto determinado to precisamente quanto possvel. Prosseguimos, medindo a extenso resultante da flexo do joelho, anotando a altura mxima (excurso) que a perna alcana, digamos o ponto que o tornozelo atinge antes de voltar posio original. Suponha que nossa medida da extenso da perna seja feita com uma rgua comum e que observamos, neste caso, que a perna percorreu uma distncia de 4,25 cm. Neste ponto, podemos ser inclinados a dizer que a magnitude do flexionar o joelho para um eliciador de 70,00 g de fora e 4,25 cm. A cincia, geralmente, nunca se contenta com observaes no replicveis e, desta forma, somos levados a repetir nossas operaes simples. Podemos, ento, voltar a eliciar o reflexo e medir novamente a magnitude do respondente por vrias vezes, anotando
45-

cada vez o resultado numnco das nossas operaes de medida. Embora tenhamos siao cuidadosos em bater no mesmo ponto cada vez, em chegar a posio original da perna e em dar ao sujeito um descanso breve entre as pancadas, observamos contudo, que a magnitude do respondente 4,25 cm numa tentativa, 4,12 cm em outra, e 431 numa terceira. Ficamos um tanto perdidos em relao a qual medida particular devemos relatar como sendo o valor verdadeiro da magnitude do respondente a uma pancada de 70,00 g. O que foi iniciado como uma simples tarefa tomou-se mais complicado do que supnhamos originalmente. Suponha agora que decidamos fazer algum tipo de mdia de nossas medidas e chamar essa mdia a magnitude do respondente a uma pancada de 70,00 g. Somamos nossos valores 4,25 4,12 4,31 12,68 e, ento, para dar a cada medida uma representao igual na mdia, dividimos pelo nmero de medidas que temos, neste caso, 3. Obtemos o seguinte nmero 4.2266... uma vez que no era possvel originalmente ler nossa rgua mais do que 0,10 arredondamos nossa resposta para duas casas decimais, relatando a magnitude da flexo do joelho como 4,23 centmetros. Mas considere agora o que realmente foi feito atravs de uma coisa simples como tirar a m dia das m edidas. Com que base -nos permitido somar os nossos valores e dividir pelo nmero de medidas e chamar isso o valor verdadeiro? Descobriremos que a questo no facilmente respondida. Porque no escolhemos, por exemplo, o resultado intermedirio entre todas as medidas como o "verdadeiro", neste caso 4,25 ? Uma dificuldade ainda mais importante apresenta-se quando tentamos medir novamente a flexo do joelho no dia seguinte e descobrimos que, embora nossas medidas sejam novamente prximas umas das outras (digamos, 4,00, 4,25, 4,19), elas no so exatamente os mesmos valores que os do dia anterior. Que nmeros tomaremos agora como o valor verdadeiro do respondente para 70,00 g? . No somente os erros de medida presentes, mas condies no controladas tais como temperatura, umidade e o quanto nosso sujeito dormiu na noite anterior podem estar afetando nossas medidas. No provvel que possamos sempre controlar completamente todas as influncias que tm um efeito perturbador em nossas medidas. Somos forados, por fim,a concluir que o valor verdadeiro do respondente apenas fictcio e que no existe nenhuma operao para descobr-lo. Na prtica, naturalmente, a situao no to ruim quanto a tornamos aqui. De fato, nossas medidas so todas razoavelmente prximas uma das outras e frequentemente podemos computar apenas tal mdia, ou mdia aritmtica. Uma vez tendo essa mdia aritmtica computada, podemos tom-la como nossa melhor estimativa da magnitude do respondente e considerar como irreal nossa procura de um e somente um valor verdadeiro. A mdia ou mdia aritmtica um dos conceitos mais primitivos da estatstica embora comum em todas as cincias. Este conceito torna possvel a abstrao de um valor, a partir de um nmero de medidas repetidas, o qual tomado para representar todo o grupo de medidas. Ento, podemos medir vrias vezes o ponto de ebulio do
46-

lcool etlico e concluir que o ponto mdio de ebulio igual a 78C. Ou, podemos observar, durante uma hora, a freqncia de carros que atravessam uma ponte em intervalos de 5 minutos sucessivos e concluir que a taxa mdia igual a 31 carros por 5 min. Justificamos esta mdia apelando para certas propriedades gerais das medidas que examinaremos agora. A justificativa para o uso de uma mdia melhor observada olhando-se de perto algumas propriedades das medidas repetidas de R2- Suponha que obtivemos 20 valores para a magnitude de R 2 , em centmetros, que so registrados na Tabela 2-2. Tabela 2-2 MAGNITUDE DE RESPONDENTES DE FLEXIONAR O JOELHO, EM CENTME TROS, EM 20 APLICAES SUCESSIVAS DE UMA PANCADA NO JOELHO TENTATIVA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 EXCURSO R2 EM CENTlkETROS 4,25 4,12 4,31 4,00 4,25 4,19 3,96 4,05 4,12 4; 19 3,88 4,25 4,19 4,19 4,12 4,05 4,31 4,44 4,20 3,92

Desejamos agora apresentar ou representar esses dados brutos numa forma que revelar algumas de suas propriedades, primeira vista. Para esse objetivo, a primeira manipulao que frequentemente se mostra til agrupar as medidas em classes mais amplas do que aquelas nas quais so originalmente dadas. Suponha que agrupemos os resultados da Tabela 2-2 em categorias de dcimos de centmetro. Ento, poderamos estabelecer o grupo de categorias mostrado no lado esquerdo da Tabela 2-3. Essas categorias tm uma faixa de um dcimo de centmetro. Na Tabela 2-3 os nmeros das tentativas em que o respondente ocorreu numa dada categoria so colocados na coluna do lado direito.
-4 7 -

A Tabela 2-3 reduz nossos dados a 7 categorias de 3,80 a 4,49. As 20 medidas individuais iniciais foram reduzidas a 7 categorias de medidas. Perdemos alguma preciso (4,00 no pode mais ser distinguido de 4,05 na Tabela 2-3), mas ganhamos alguma economia na representao. O ganho no grande com apenas 20 medidas originais, mas seria muito grande se tivssemos comeado com 20.000. Tabela 2-3 REAGRUPAMENTO DAS MEDIDAS DA TABELA 2-2 EM CATEGORIAS MAIS AMPLAS (1/10 cm) CATEGORIA 3,50 3,60 3,70 3,80 3,90 4,00 4,10 4,20 430 4,40 4,50 4,60 -3 ,5 9 -3 ,6 9 -3 ,7 9 - 3 ,8 9 - 3 ,9 9 -4 ,0 9 -4 ,1 9 - 4 ,2 9 -4 3 9 - 4 ,4 9 -4 ,5 9 -4 ,6 9 TENTATIVAS NAS QUAIS O RESPONDENTE CAI NUMA CATEGORIA PARTICULAR

11 7 ,2 0 4 ,8 ,1 6 2,6,9,10,13,14,15 1,5,12,19 3,17 18

Um outro sumrio til poderia ser feito se nossos dados fossem mostrados graficamente. Um nmero de esquemas visuais tem sido sugerido como auxilio na representao de dados do tipo que temos aqui. Consideremos uma classe deles. possvel, em primeiro lugar, espaar regularmente os vrios valores de nossos grupos de medidas numa linha horizontal, chamada o eixo do x ou abscissa. Segundo, podemos colocar uma linha vertical que intercepta a abscissa (chamada o eixo do V, ou ordenada) para representar o nmero ou freqncia de medidas. Dessa maneira, se colocamos um x para cada uma de nossas medidas em tal referncia (chamada um sistema de coordenada Cartesiana ou retangular) obteremos a representao pictorial da distribuio dos valores vista na Fig. 2-5. Alguns aspectos da Fig. 2-5 so de interesse particular. Primeiro, notamos que exis tem exatamente 20 X. Ento, cada medida aparece como um nico X na Fig. 2-5 e o nmero total de X o nmero de medidas tomadas. Um segundo aspecto da Fig. 2-5 a sua forma. Parece avolumar-se em volta de um valor central e ser grosseiramente simtrica. Essa caracterstica de muitas medidas repetidas justifica o uso de um nico valor mdio para resumir todo o grupo de medidas. Atrs desse valor mdio , tacitamente se esconde uma figura mais ou menos como a Fig. 2-5. Diz-se que o nmero que indica o valor prevalente de uma distribuio de freqncia, tal como a Fig. 2-5, representa um ndice da chamada tendncia central da distribuio. Mas podemos notar que existem vrias possibilidades de escolha para ndices
-

48-

de tendncia central. Dessas, uma simples seria escolher a categoria contendo maior freqncia (maior nmero de X). Quando se escolhe o valor da tendncia central dessa
Ordenada

T J It
t
Figura 2-5. Medidas hipotticas da flexo do joelho (categorizadas em dcimos de centm etro) representa das como uma distribuio de fre qncia num sistema de coordenadas retangulares.

10

.o o n
V

r
X X X XX

Moda

XX XXX X X X X X X X.
1.0 2.0

XXX

- Abscissa

Magnitude da flexo do joelho (centmetros)

maneira diz-se que se encontra a moda da distribuio. No presente caso, a moda a categoria 4,10 4,19, porque contm 7 medidas, nmero este maior do que qualquer outra categoria (ver Fig. 2-5). Um segundo tipo de ndice de tendncia central obtido, isolando-se a categoria de medida particular que tem o mesmo nmero de medidas abaixo e acima dela. Tal estatstica de tendncia central chamada o valor mediano da distribuio. A categoria mediana dos dados presentes est na categoria 4,10 4,19, porque pode ser encontrado um valor nesta categoria que seria maior do que os 10 valores inferiores e menor do que os 10 superiores. O terceiro tipo, conhecido como mdia, o que calculamos previamente somando as medidas e dividindo pelo nmero total de medidas. No caso presente, esse ndice, ou mdia aritmtica, cerca de 4,15. Qual desses trs ndices representa o mais prximo da magnitude real do respondente? Nenhuma resposta geral possvel para esta questo porque a magnitude real do respondente uma quantidade fictcia. A nica maneira disponvel para se avaliar a magnitude do respondente obter-se medidas repetidas dele sob condies to constantes quanto possveis. Essas medidas seriam como aquelas representadas pela Fig. 2-5. Se precisssemos de um nico nmero para resumi-las, o melhor que poderamos fazer seria calcular um ou mais ndices de tendncia central. No caso presente, a forma simtrica nos assegura que qualquer desses trs ndices concordar aproximadamente, mas, em algumas distribuies contendo umas poucas medidas muito distantes da moda (tal como na distribuio de rendas nos Estados Unidos onde poucas pessoas so muito ricas mas a maioria do povo est agrupada em torno de um ponto central), a mdia aritmtica deslocada em direo s poucas enquanto a mediana menos afetada e a moda no perturbada. A distribuio da Fig. 2-5 convenientemente representada por (A) ou(B )daFig. 2-6. Em (A) os X foram substitudos por barras cujas alturas so proporcionais frequncia real, f. A parte (A) chamada um histograma e ser empregada com freqncia na descrio de dados comportamentais nos captulos subseqentes. Em(B), os X foram substitudos por linhas retas conectando a altura de cada categoria. A parte (B) chamada um polgono de freqncia. Ambas as respresentaes vistas na Fig. 2-6 so apenas maneiras alternativas de representar distribuies de frequncia. Em todas as distribuies de freqncia, os ndices de tendncia central assumem grande importncia.
-49 -

3,50 4 ,5 0 Magnitude da flexo do joelho (centmetros) Figura 2-6. Mais duas representaes de distribuies de freqncia (A) como histogram a e (B) como polgono de freqncia. Os dados so derivados da Figura 2-5.

Magnitude da flexo do joelho (centmetros) (B) Polgono de Freqncia

Mas outra propriedade importante das distribuies de frequncia o espalhamento das medidas, tecnicamente chamado sua disperso. Consideremos as duas distribuies de magnitude do respondente da Fig. 2-7. tomadas, digamos, de dois sujeitos diferentes. Ambas as distribuies tm medidas de tendncia central idnticas (mdias, medianas e modas). Mesmo assim, elas diferem de maneira to bvia que seria interessante ter-se um ndice sumrio para caracterizar esse tipo de diferena. Notemos, antes de tudo, que a diferena entre as duas curvas da Fig. 2-7 grosseiramente a de "espalhamento. Mas, logicamente, o espalhamento de uma distribuio est relacionada com a variabilidade das medidas que contm. Quanto mais variveis nossas medidas e mais elas diferirem umas das outras, maior ser o espalhamento. Uma estatstica simpes, embora grosseira, para resumir o espalhamento ou disperso de medidas

Figura 2-7. Distribuies de duas freqncias com tendncias centrais idnticas e disperses diferentes.

Magnitude de R 2

pode ser calculada, descobrindo-se a maior (em nossos dados originais do reflexo 4,44) e subtraindo desta o menor escore obtido, 3,88. Com tais dados mo, a operao resulta num valor 4,44 3,88 = 0, 56. Tal estatstica chamada amplitude da distribuio. A amplitude fcil de ser calculada, mas no to til como desejaramos. Sua dificuldade que uma nica medida muito extrema muda-a drasticamente. Por essa razo, preferimos dizer que a amplitude uma estatstica que no tem estabilidade. Outra medida mais sofisticada da disperso de uma distribuio possvel, aproximando-se, em primeiro lugar, os dados resumidos pelas Figs. 2-5 e 2-6 com o tipo de curvas matematicamente suaves, em forma de sino, vistas na Fig. 2-7. Essas curvas suaves so simtricas e so chamadas curvas normais. O estudante curioso pode muito bem estar interessado em saber como essas curvas suaves da Fig. 2-7 foram descobertas, mas infelizmente sua derivao matemtica no pode ser tratada aqui. Devemos nos contentar em dizer que elas parecem aproximar, razoavelmente bem, muitos tipos de medidas repetidas, das quais nossa magnitude do respondente uma. Um ndice adequado para a disperso ou variabilidade pode ser encontrado atravs do exame acurado da forma das duas curvas da Fig. 2-7. Se iniciamos no extremo mais esquerda de cada curva, devemos observar que, inicialmente, a curva cncava crescente. Ento, para ambas as distribuies, a curva passa atravs de uma regio em que quase uma linha reta. Finalmente, continuando em direo direita, as curvas adquirem uma forma cncava decrescente, alcanando eventualmente, um mximo no ponto rotulado de mdia. J que essas curvas normais so simtricas, uma anlise correspondente pode ser feita iniciando-se na extremidade direita e movendo-se para a esquerda. Os dois pontos simtricos em que as curvas mudam de concavidade crescente para concavidade decrescente so chamados os pontos de inflexo e esto localizados nas setas horizontais na Fig. 2-7. Esses pontos localizados tomam-se bons marcos para caracterizar a disperso das distribuies (compare a distncia entre os dois grupos de setas da Fig. 2-7 colocados nesses pontos). E, embora sejam difcies para um julgamento a lho n, no difcil calcul-los a partir de medidas reais. Deveria ser notado que os pontos de inflexo esto relacionados mdia da distribuio, tal que quanto maior disperso de uma curva normal, tanto mais dis tante da mdia esto esses pontos. Em outras palavras, quanto maior a disperso, mais os pontos de inflexo sero desviados da mdia. Essa idia de desvio est includa no nome usualmente dado aos pontos de inflexo da curva normal, os pontos de desvio padro. O desvio padro (abreviado 0 , ou sigma) a distncia da mdia a qual quer um dos pontos de inflexo. A grande vantagem desses pontos como ndices de disperso da distribuio sobre outras medidas (por exemplo a amplitude) que eles dividem a distribuio normal de uma maneira extremamente til, como visto na Fig. 2-8. Em particular, o resultado que para dados que podem ser aproximados por uma curva normal, cerca de 34 por cento das medidas cairo na regio entre 1 O e a mdia; e cerca de 34 por cento cairo na regio + 1 O e a mdia. Assim, cerca, de 68 por cento das medidas estaro contidas dentro da mdia de 1 10. Similarmente, cerca de 95 por cento estaro contidas dentro de _ 2 Qe acima de 99 por cento dentro de 3Q. Ento, existe uma relao bastante exata entre o desvio padro e a percentagem de medidas a serem encontradas nas diferentes regies da curva, um fato no verdadeiro para a amplitude ou outras medidas comuns de variabilidade. Mtodos de computao para estimar qualquer grupo de medidas so encontrados em numerosos textos ele mentares de estatsticas e no sero descritos aqui.
- 51 -

Figura 2-8. Curva normal dividida por seu desvio padro, mostrando a porcentagem de medidas contidas em cada regio.

Transformaes para distribuies de freqncia relativa. Uma transformao muito til e simples frequentemente feita nas medidas originais quando se lida com distribuies. Em vez de se fazer diretamente grficos do nmero real de eventos numa dada categoria, frequentemente divide-se o nmero observado numa dada categoria pelo nmero total de medidas que se tem. O resultado dessa operao sempre um nmero menor do que ou igual a 1, que chamado a freqncia relativa desta categoria. Por exemplo, com referncia Tabela 2-3, podemos dividir o nmero total de medidas na categoria 4,20 - 4,29 (4) pelo nmero total de medidas (20) e obteremos 4/20 - 0,2, a freqncia relativa nessa categoria particular. Uma maneira til de pensar sobre a freqncia relativa consider-la como a proporo das medidas totais que ocorrem numa dada categoia. Se multiplicarmos este nmero por 100, obtemos a percentagem de todas as medidas que caem na categoria particular. Um grupo de tais percentagens, ou freqncias relativas, fornece-nos uma maneira conveniente para comparar duas distribuies quando o nmero total de medidas em cada uma no necessariamente o mesmo. Note que a curva da distribuio de freqincia relativa ou de distribuio de percentagem tem o mesmo modelo, ou forma, que a curva de distribuio das freqncias reais observadas da qual ela foi derivada.

EXERCCIO 1:

Transforme a distribuio da Fig. 2-5 numa distribuio de freqncia relativa.

-52 -

Captulo 3 -

CONDICIONAMENTO PAVLOVIANO

Por volta de 1903, PAVLOV, fisiologista russo, interessou-se pelo fenmeno que primeiro chamou de secrees psquicas.. Pavlov descreve o ponto de partida de suas pesquisas na seguinte citao: Se alimento ou alguma substncia rejeitvel colocada na boca, uma secreo de saliva produzida. O objetivo dessa secreo , no caso de alimento, alter-lo quimicamente, e no caso de uma substncia rejeitvel, dilu-la e remov-la da boca. Este um exemplo de um reflexo que ocorre devido s propriedades fsicas e qumicas de uma substncia quando ela entra em contato com a membrana mucosa da boca e lngua. Mas, alm disto, uma secreo reflexa semelhante evocada quan do essas substncias so colocadas a uma distncia do co e os rgos receptores afetados so apenas aqueles do olfato e da viso. Mesmo o recipiente no qual o alimento dado suficiente para evocar um reflexo alimentar completo em todos os seus detalhes; e, alm disto, a secreo pode ser provocada mesmo pela viso da pessoa que trouxe o recipiente, ou pelo rudo de seus passos . (Pavlov, 1927, p. 13). Desde o incio, estava claro para Pavlov que algum tipo de associao entre o reflexo salivar S2 > R 2 e eventos arbitrrios como vasilhas de alimento e rudo de passos era responsvel pela capacidade destes evocarem secrees psquicas . A primeira e mais importante contribuio de Pavlov para a cincia do comportamento foi sua descrio e elaborao das condies necessrias e suficientes para essa associao. Atravs de um estudo sistemtico do respondente salivar de ces, Pavlov descobriu que, se qualquer mudana ambiental arbitrria (digamos. S j) precedia direta e exatamente o reflexo eliciador de salivao, S] poderia por si s vir a produzir a salivao. 3 1 - REFLEXOS CONDICIONADOS E A NATUREZA DE UM EXPERIMENTO Examinaremos com detalhes um experimento realizado por um dos discpulos de Pavlov (Anrep, 1920) como exemplo do mtodo Pavloviano e os resultados que levaram a essa concluso importante. A Fig. 3-1 mostra a situao experimental empregada por Pavlov e seus colegas no Instituto de Medicina Experimental em Petrogrado (hoje Leningrado). Ele bem descrito por Keller e Shoenfeld:

-5 3 -

Figura 3-1. Representao de uma situao Pavloviana para condicionar a resposta salivar num co (Paviov, 1928).

Em primeiro lugar, familiariza-se um co normal com a situao experimental at que no apresente nenhum distrbio quando colocado em arreios e deixado sozinho numa sala especialmente construda para eliminar estmulos indesejveis externos. Uma pequena abertura ou fistula feita na pele da mandbula, perto do conduto de uma das glndulas salivares. Quando a fistula cicatriza, um tubo de vidro cuidado samente cimentado externamente na fistula de modo a drenar a saliva sempre que a glndula for ativada. Do funil, a saliva ento flui para um vidro ou cai, gota a gota, numa plataforma de registro levemente equilibrada. A magnitude das respostas aos vrios estmulos pode ser medida pelo volume total ou nmero de gotas secretadas num dada unidade de tempo. O experimentador, que fica sentado numa sala ad jacente, pode fazer suas medidas, aplicar os estmulos desejados (incluindo alimento) e observar o comportamento do co atravs de uma janela (Keller e Schoenfeld, 1950, pp. 16-17). O experimentador tem, ento, condies para medir precisamente o reflexo salivar. tambm capaz de controlar cuidadosamente a apresentao de vrios eventos estmulo para o organismo. Num experimento realizado por Anrep (1920), um tom soava na sala do animal por 5 seg. Dois ou trs seg mais tarde um pouco de alimento era dado ao co. Esse empareIhamento de tom com alimento foi repetido depois de intervalos que variavam de 5 a 35 min. A fim de observar o efeito de um tom sozinho, o experimentador ocasionalmente, apresentava-o por 30 seg. desemparelhado do alimento. No curso de 16 dias, foram feitas 50 associaes alimento-tom e 6 testes do tom. Os principais dados do experimento de Anrep foram obtidos durante os 6 testes apenas com o tom. Durante esses testes, ele mediu cuidadosamente o total de gotas de saliva e o tempo entre o aparecimento do tom de 30 seg. e a primeira gota de saliva. A Tabela 3-1 apresenta os dados.
- 54 -

Tahela 3-1 AQUISIO DE UM RESPONDENTE SALIVAR A UM TOM (DADOS DE ANREP, 1920) TEMPO DECORRIDO ENTRE O APARECIMENTO DO TOM E A GOTAS DE SALIVAO SUBSEQUENTE (SEGUNDOS) SALIVA Y 0 6 20 60 62 59 Z

NMERO DE EMPARELHAMENTOS PRVIOS DE ALIMENTO-TOM X 1 10 20 30 40 50

18 9 2 1 2

V-se na Tabela que, depois de um emparelhamento alimento-tom, a apresentao do tom sozinho no produziu salivao. Depois de 10 emparelhamentos, todavia, 6 gotas apareceram no teste com o tom sozinho, e a primeira dessas 6 gotas apareceu 18 se gundos depois do aparecimento do tom do teste. Depois de 20 de tais emparelhamentos, 20 gotas foram produzidas e a primeira gota demorou s 9 seg. para aparecer. De 30 emparelhamentos em diante, aproximadamente 60 gotas de saliva foram obtidas para cada teste e, ento, elas comearam a aparecer um ou dois segundos depois do apareci mento do tom do teste. Os resultados do experimento so claros. A salivao ocorre exatamente a um tom selecionado, arbitrariamente, depois que este emparelhado 30 vezes com alimento. O processo pelo qual um tom adquire a capacidade de produzir uma resposta salivar por si mesmo, medida que os emparelhamentos com alimento aumentam, chamado condicionamento. Pavlov viu uma semelhana prxima entre essa nova correlao de tom com salivao e a ao reflexa comum e foi levado, assim, a chamar essa nova correlao de reflexo condicional (pobremente traduzido como um reflexo con dicionado). Vemos nas palavras seguintes porque ele fez isto: Denominei esses novos reflexos, reflexos c o n d i c i o n a d o s , para distingu-los dos inatos ou reflexos incondicionados. O emprego do termo condicionadocada vez mais torna-se generalizado e penso que seu uso totalmente justificado. Isto porque, comparado com os reflexos inatos, esses novos reflexos realmente dependem- de muitas condies, (ital. adicionados) tanto sua formao como na manuteno de sua atividade fisiolgica. Naturalmente, os termos condicionado e incondicionado poderiam ser substitudos por outros de igual mrito. Ento, por exemplo, podemos conservar o termo reflexos inatos e chamar o novo tipo de reflexos adquiridos; ou
-5 5 -

chamar os primeiros de reflexos da espcie", uma vez que so caractersticos das espcies e os ltimos de reflexos do indivduo, j que eles variam de animal para animal numa mesma espcie, e no mesmo animal variam em ocasies diferentes e sob diferentes condies (Pavlov, 1927, p. 25). 3.2 - O PARADIGMA PAVLOVIANO: UM MTODO ESQUEMTICO DE REPRE SENTAR O CONDICIONAMENTO. O princpio do reflexo condicionado convenientemente resumido por um modelo simples de estmulo-resposta, ou paradigma. Os elementos do paradigma so os dois reflexos iniciais e um novo reflexo condicionado desenvolvido. Representemos os reflexos nos quais o condicionamento est baseado como Si -> Ri e S2 > R2- No procedimento de Pavlov, Si precede S2 . Se ignorarmos 0 respondente a S i , esse emparelhamento pode ser representado como Si S2 -> R 2 De acordo com o princpio de Pavlov, depois de um nmero de emparelhamentos (S1 )S2; S 1,S 2; S 1,S 2 ;...) Sj passa a evocar uma nova resposta, a resposta con dicionada (CR) no diagrama f 3.11*

CR

[3-11

O diagrama [3.1] conhecido como o paradigma pavloviano, e representa esquematicamente o procedimento e os resultados do condicionamento pavloviano ou dssco O Diagrama [3:11d uma descrio esquemtica ou simblica de certos aspectos do paradigma, mas podemos desejar uma especificao mais completa. Como um guia til para resumir o paradigma pavloviano, assim como muitos outros paradigmas comportamentais que sero descritos em captulos subsequentes, introduziremos uma repre sentao estrutural, de quatro partes, de tais paradigmas. Em geral, todo paradigma coinportamental consistir de um Dado, um Procedimento, um Processo e um Resultado. Neste quadro de referncia, o paradigma pavloviano funciona como se segue: DADOS: dois eliciadores S\ e S2 PROCEDIMENTO: emparelhamento repetido de S\ com S2 , sempre na ordem S 1 , $2>^1 ^25 PROCESSO: S \ passa gradualmente a controlar a nova resposta (CR), que pode se assemelhar R 2 de S2 . RESULTADO: Si elicia seguramente uma CR.

- 56-

Note certas caractersticas de tal paradigma. O Dado frequentemente contm umo descrio do estado comportamental anterior ao Procedimento. Aqui, necessrio ter-se dois eliciadores, ou dois reflexos intactos, antes que se possa comear. O Procedimento uma descrio suscinta do que os experimentadores fazem. (Notaremos, com freqncia, que til representar o aspecto do procedimento de nossos paradigmas comportamentais atravs de smbolos). O Processo diz brevemente o que acontece no tempo com os aspectos significativos do comportamento, medida que aplicamos o nosso proce dimento. Uma descrio de um processo compor tamental adquire, tipicamente, a forma de um grfico, com o tempo no eixo horizontal (X) e alguma propriedade do compor tamento do organismo no eixo vertical (Y). Discutiremos isso mais completamente numa seo posterior. Finalmente, o Resultado o estado final do processo. Quando o compor tamento cessou de mudar significantemente sob o determinado procedimento, o resul tado foi alcanado. Nas subsees seguintes, elaboraremos alguns dos mais importantes aspectos do paradigma pavloviano. A reiao de CR com R2. Podemos considerar um acidente histrico o fato de Pavlov iniciar sua pesquisa sobre o condicionamento com um reflexo que gerava uma CR muito semelhante R2,incondicionada. Tanto CR como R 2 envolvem a produo de secreo das glndulas salivares. Realmente, no provvel que o observador casual detecte qual quer diferena entre a salivao condicionada e a incondicionada. A similaridade entre CR e R 2 no reflexo salivar , provavelmente, responsvel pela crena geral, perpetuada at aos tempos modernos, de que CR R2- Mas Pavlov sabia que isto no era verdade. No somente a magnitude de CR era diferente de R 2 , mas a composio qumica real da saliva diferia entre CR e R 2 . Pavlov preferiu ignorar as diferenas entre CR e R2 e se concentrar nas similaridades. Isto frequentemente uma estrategia segura na pesquisa cientfica preliminar Foi o gnio de Galileu que o permitiu ignorar as pequenas dife renas na velocidade de queda de objetos leves e pesados em favor de uma teoria que os idealizava caindo na mesma velocidade. Ele fez isso em face de uma teoria bem esta belecida da natureza que exigia exatamente a concluso oposta. Ao formular um princpio terico que afirmava ser CR = R 2 , Pavlov estava empregando a estratgia de Galileu de ignorar pequenas diferenas. S i,ele sups, passa a eliciar o respondente de S2 como um resultado de seu emparelhamento com S2P^sse princpio, conhecido como o princpio de substituio de estmulo (Sj substitui S2 ), tinhauma grande atrao em termos de suas aparentes (1) generalidade, (2) sim plicidade, e (3) capacidade para explicar outros fenmenos. Uma vez que estes aspectos so caractersticos dos nossos melhores conceitos na cincia, no surpreendente que o princpiode substituio de estmulo fosse adotado por John Watson e outros primeiros behavioristascomo base paraexplicar todo comportamento. Na substituio de estmulo eles pensavam ver o mecanismo subjacente aos padres complexos de comportamentos aprendidos e hbitos compostos. Consideremos o programa arrojado de Watson para'uma anlise experimental do comportamento: dado o estmulo, podemos predizer a resposta; iada a resposta, podemos predizer o estmulo .Neste quadro de referncia era natural considerar a ligao dos novos estmulos com as velhas respostas (substituio de estmulo) como um princpio poderoso para criar novas seqncias de comportamento. Watson acreditava que o comportamento complexo humano e animal representava o embasamento e a composio de reflexos condicionados. Devido importncia terica da substituio de estmulo nas teorias de Pavlov e Watson, os pesquisadores posteriores ignoraram as diferenas entre CRs e &2S Por algum tempo. Contudo, por duas razes, o princpio da substituio, de Pavlov, no resistiu ao teste do tempo.
-5 7 -

(1) Embora Watson propusesse que todo comportamento poderia ser visto como uma interao e composio de reflexos condicionados, a proposio no conduziu a novas formas poderosas de prever e controlar o comportamento. O teste de todos os conceitos cientficos o seu emprego na previso, controle e organizao da matria prima da natureza. No incio, a substituio de estmulo parecia ser til para ordenar o comportamento, mas medida que os anos se passavam ela permanecia estril na previso e controle. Mesmo os homens que o haviam empregado muito entusiasticamente comearam a duvidar de sua natureza fundamental. Eventualmente, com uma nova ex plorao da lei do efeito de Thorndike, tornou-se claro que grande parte do com portamento no cabia dentro do modelo Pavloviano. Mas esta uma histria que fica para o prximo captulo. (2): medida que dispunha de mais e mais informaes sobre o condicionamento descobriram-se casos em que a CR era apenas ligeiramente diferente de R2 mas, em alguns casos era exatamente o oposto. Um experimento realizado por Notterman, Schoenfeld e Bersh (1952) empregando sujeitos humanos ilustrativo. No seu estudo, S] era um tom audvel e S2 um choque eltrico suave, liberado na mo esquerda do sujeito. Esses pesquisadores mediram a taxa cardaca respondente com um aparelho um pouco diferente do conhecido como um eletrocardigrafo familiar em muitos consultrios mdicos. Em vez de manter seus sujeitos numa situao pavloviana (Fig. 3-1), eles sentaram-nos em cadeiras comuns, instruindo-os para permanecerem to quietos quanto possvel por cerca de 90 min. Durante este perodo, os experimentadores registravam a taxa cardaca de seus sujeitos enquanto apresentavam tons e choques. Notterman, Schoenfeld e Bersh encontraram evidncia clara de uma taxa cardaca (CR) depois de 11 emparelhamentos de choque e tom. Todavia, enquanto a resposta incondicionada ao choque (R 2 ) era uma acelerao da taxa cardaca, a resposta condicionada (CR) envolvia uma diminuio dessa taxa. Embora um trabalho posterior (Zeaman e Smith, 1965) mostre que as diferenas entre CR e R2 na taxa cardaca esto estritamente relacionadas a diferenas respiratrias correspondentes, a disparidade entre as formas dos comportamentos condicionado e incondicionado permanece. Exemplos extremos como este levaram-nos a ver de uma forma diferente o condicionamento pavloviano ou clssico. Em quase todos os casos de uma suposta substituio de estmulo, existem diferenas marcantes entre CR e R2- Em muitos casos, elas estavam ocultas devido as medidas grosseiras tomadas quando os pesquisadores estavam somente interessados no condicionamento como um fenmeno de substituio. Abreve histria da substituio de estmulo exemplo interessante do crescimento contnuo da cincia. Um conceito pode influenciar por alguns anos ou dcadas porque parece fornecer comorto intelectual e prometer a ordem da natureza. Mas, a menos que cumpra a sua promessa, eventualmente, ele dar lugar ao peso da evidencia experimental. Durante seus dias de glria, todavia, tal conceito pode dirigir pesquisas de maneiras que efetivamente colocam vendas nos cientistas em relao a fraqueza do conceito. quase como se, para dar ao conceito uma chance, ignoremos por um tempo, certas discrepncias, certa indeterminao em sua definio. Essa permissividade temporria no estgio inicial da explorao justificada a longo prazo porque muitos de nossos con ceitos bem estabelecidos passaram atravs de tal iniciao e emergiram fortes e lgicos por causa dela. O prprio reflexo um bom exemplo disso, e assim so muitos conceitos da cincia fsica que sobreviveram ao teste do tempo.
58

A importncia do Reflexo S \ ---- > R i Pavlov sugeriu que S \ ----- > R \ deveria ser um reflexo biologicamente mais fraco do que S2 ---- > R2 para que o con dicionamento clssico ocorresse. A noo de fraqueza biolgica no est inteiramente clara. Presumivelmente, uma maneira de dizer que, se as energias de S \ e S2 fossem de algum modo igualadas, ento R \ seria sempre menor ou ocorreria menos frequentemente do que R 2 . Um fato relacionado que Pavlov enfatizou foi que o condicionamento mai fcil de ser observado (embora no necessariamente mais fcil de ser obtido) quando S] no elicia inicialmente R2 - Deveria estar claro que, se S \ elicia R2 antes do condiciona mento, ento o efeito do emparelhamento de Sj e S2 pode ficar obscuro. Assim, na maioria dos experimentos de condicionamento, toma-se o cuidado de selecionar um Si que no tenha a capacidade original de eliciar R 2 - Diz-se que tal S] neutro com respeito a R 2 - Um S \ neutro especialmente desejvel se, durante o condicionamento, vamos procurar pela CR no mesmo lugar onde observamos R 2 . Contudo, a neutralidade inicial de S\ em relao a R2 no um aspecto necessrio para a ocorrncia do condi cionamento clssico, como Long (1941) demonstrou algum tempo atrs. Num dos ex perimentos de Long, um tom de 1/7 seg. de durao foi usado como S\ e um breve flash de luz como S2 . Em ambos os casos, o respondente de piscar os olhos em sujei tos humanos foi medido. Tanto a luz como o tom eliciava o piscar desde o inicia Mas depois dos emparelhamentos, o S] tom sozinho, passou a eliciar duas piscadas suces sivas. A Fig. 3-2 d um exemplo de um dos registros de Long quando S] era apresentado.

Figura 3-2. Resposta de piscar a um tom de 1/7 seg. depois de 30 emparelhamentos tom-luz (segundo Long, 1941)

Ainda mais impressionante foi um experimento realizado por Long no qual S\ e S2 eram tons idnticos. Neste experimento um resultado semelhante foi obtido: o primeiro tom passou a produzir dois movimentos das plpebras depois dos emparelhamentos. Assim, o caso especial do paradigma Pavloviano com Si = S2 produz resultados condizentes com o paradigma geral. Os resultados de Long tm um significado adicional. Se antes do condicio namento, um estmulo elicia Ri e depois do condicionamento evoca Ri e CR podemos generalizar isto para casos em que um nico estmulo pode vir a controlar uma variedade
- 59 -

de comportamentos diferentes, dependendo das vrias histrias passadas de emparelhamento com S2 s diferentes. Este resultado pode ser representado diagramaticamente como R CR'
S,

CR CR \ etc.

[3.2]

Assim, um tom emparelhado independentemente com um choque, uma luz e alimento pode simultaneamente evocar CRs de mudanas na taxa cardaca, piscar de olho e salivao, respectivamente. Essa constelao inteira de comportamentos evocados por um unico estimulo pode ter importncia para o nosso estudo da emoo como veremos num captulo posterior. Naturalmente, deveria ser enfatizado que, no Diagrama 13-21 Rj um sumrio de todos os comportamentos inicialmente eliciados por Si - Embora fre quentemente limitemos nossas discusses sobre o condicionamento a uma ou duas res postas, o condicionamento um fenmeno que invade todo o sistema compor tamental de um indivduo. Quando examinamos uma nica resposta em detalhe, assim o fazemos porque julgamo-la representativa do que est ocorrendo em geral no sistema de resposta e no porque seja tudo o que est ocorrendo. Tentar pesquisar o sistema total de uma vez nos sobrecarregaria com detalhes no controlveis. Tomamos uma amostra representativa e tentamos explor-la em profundidade. Essa outra estratgia de pesquisa que tem tido sucesso na pesquisa cientfica embora tal sucesso evidentemente, dependa de quanta sorte temos ao escolher uma amostra que seja realmente representativa de um fenmeno em geral. O fato de que a CR e R 2 salivar sejam tao semelhantes e to dominantes no caso de Pavlov sugere a possibilidade de que a sua amostra no fosse to representativa como ele poderia t-lo desejado. S -|-----> CR um "Novo Reflexo"? No velho princpio de substituio, S] ---- > R 2 era visto como o novo reflexo condicionado . Embora possamos preferir representar os efeitos do condicionamento clssico como a formao de uma CR para S 1 ainda temos de encarar a questo sistemtica de se S \ > CR um reflexo, ou um outro tipo de correlao estmulo resposta. Existe muito pouca evidncia experimental dispo nvel que trata do assunto, mas o pouco que temos indica que ele no de fato um reflexo verdadeiro. Em primeiro lugar, aumentos na intensidade de S\ no resultam em aumentos na magnitude de CR, ou em decrscimos na sua latncia. Ao contrrio, o mximo de magnitude de CR e sua latncia mnima so obtidos com o valor exato de S\ empregado no condicionamerto (Mostofsky, 1965). Valores mais ou menos intensos resultam em CRs mais fracas. Por outio lado, lembremo-nos do Captulo 2 onde foi dito que as leis de magnitude * : latncia do reflexo especificam uma simples proporcionalidade entre a intensidade de S2 e a fora de R 2 - 60 -

Segundo, a latncia da CR adquirida para S \ geralmente mais longa do que a latncia dos respondentes (R is) associados com aquele mesmo S i . Isto pode ser demons trado atrave's do emparelhamento de uma luz (S \) com uma corrente de ar na plpebra (S2 ). Originalmente, tanto Si como S2 eliciam o piscar de olho. Como resultado do emparelhamento, Si passa a evocar duas piscadas de olho distintas, uma R i seguida por uma CR. Usando esse procedimento com sujeitos humanos, Grant e Norris (1947) iden tificaram vrias regies modais de latncia, como mostra o histograma da Fig. 3-3. Esses

Latncia (milisegundos)

Figura 3-3. Distribuio da latncia de todas as respostas de piscar o olho eliciadas por uma luz forte no curso de um experimento de condicionamento com sujeitos humanos (segundo Grant e Norris, 1947).

pesquisadores chamaram a regio entre 50 e 110 mil segundos (1 mseg. S 3 se^ = 1/1000 seg.) a faixa do reflexo verdadeiro; a regio entre 260 e 450 mseg representa a faixa de CR. Terceiro, se S \ CR um reflexo verdadeiro, deveria ser possvel construir mais reflexos condicionados a partir dele. O prprio Pavlov viu as possibilidades dessa acumulao de condicionamentos, assim como as implicaes disso para o comportamen to humano. Por exemplo, num experimento realizado por Frolov (citado por Pavlov 1927, pp. 33-34). um metrnomo foi primeiro utilizado como S\ no paradigma, onde Alimento > Saliva era o reflexo incondicionado. Depois de alguns emparelhamentos o resultado usual foi obtido: o metrnomo sozinho evocava uma CR salivar. Frolov ento, tentou usar a nova correlao S \ ------ CR como a base para um reflexo con dicionado de segunda ordem. Ele colocou um quadrado preto no campo visual do co por 10 seg. Ento, esperou 15 seg mais e, finalmente, soou o metrnomo por 30 seg. Essa uma variao do emparelhamento simultneo1 discutido acima e, de acordo com Pavlov, ele seria necessrio para se chegar a um condicionamento de segunda ordem. Depois de 10 de tais tentativas, o quadrado preto passou a evocar alguma salivao embora nunca tivesse sido emparelhado com alimento. Representamos esse exemplo de condicionamento de ordem superior como uma operao de dois esteios na Fig. 3 4 .
61

Este reflexo foi omtido aps s S i ----- CR ter sido formado.


j
Figura 3-4. Procedimento de Frolov para estabelecer o condicionamento de segunda ordem.
s2

------------ *-

................
R*

Ordem
I)

---------------------- J
S i -------- R|

^C R '
II) S0 ^ -------- - R 0

Tipicamente, a CR de ordem superior era pequena em magnitude, longa em latncia, varivel em ocorrncia e de pouca durao. As tentativas para se chegar alm do condicio namento de segunda ordem sem o emprego do S2 > ^ 2 original no foram bem sucedidas com respondentes salivares. A importncia do condicionamento de superior desse tipo ainda est em discusso entre os psiclogos. Seu carter transitrio (se o S2 omitido por vrias tentativas, ele desaparece de todo)a dificuldade em estabelec-lo e sua incapacidade para se estender a muitas ordens,levaram alguns autores a comentar que dificilmente poder-se-ia esperar que a influncia do condicionamento de ordem superior fosse muito grande no comportamento cotidiano dos organismos (Keller e Shoenfeld 1950, p. 32). Por outro lado, suas possibilidades tericas como um princpio explanatrio, tm impressionado favoravelmente outros autores, tais como C.E. Osgood (1953) que considera que * esse processo certamente se estende de maneira ampla na aprendizagem humana, especialmente na rea da linguagem (Osgood, 1953, p. 316) Em resumo, parece que as relaes S \ CR estabelecidas pelo condicionamento so, provavelmente, bastante diferentes dos reflexos verdadeiros, o que justifica agruplas separadamente. 3.3 RELAES TEMPORAIS NOS PARADIGMAS DE CONDICIONAMENTO

O condicionamento Pavloviano ou clssico pode convenientemente ser considerado como o efeito caracterstico da apresentao de estmulos em certas relaes temporais, isto , numa certa ordem no tempo. At agora, content amo-nos em colocar a operao fundamental do condicionamento Pavloviano como um "emparelhamento" de dois es tmulos eliciadores. J tempo de considerar com mais detalhes a natureza desta operao de emparelhamento. Na Fig. 3-5, so apresentadas quatro maneiras diferentes em que Sj pode ser emparelhado no tempo com S2
S,
S,

XI

S, S,

JZL
(A) Sim ultneo Figura 3-5. Algumas relaes temporais possveis entre S j e S 2 no condicionamento clssico.

rz L
(B) Retardo

Si
S,

s,
St

___EL_
(D) Retroativo

(C) Trao
-6 2 -

O primeiro caso (A) talvez seja o tipo mais comum e referido na literatura de condicionamento como condicionamento simultneo . O S i curto e seu aparecimento ocorre cerca de 1/2 seg. antes de S2 . Na Fig. 3-5A, S\ termina antes de S2 ; todavia Si pode ultrapassar S2 sem alterar os resultados. Outro procedimento temporal empregado no condicionamento clssico visto na Fig. 3-5B. O Si iniciado antes de S2 e per manece por um intervalo de tempo considervel. Quase no final de S j, S 2 apresentado. Este chamado um procedimento de retardo.tambm possvel, sob as condies de Pavlov, obter-se CRs com retardos at de vrios minutos. O caso ilustrado na Fig. 3-5C semelhante ao condicionamento simultneo exceto que S\ apresentado mais cedo e termina antes da apresentao de S2 . Este o procedimento que Frolov usou em seu experimento de segunda ordem. Este caso referido como um procedimento de trao, na suposio de que um trao de S\ permanece no sistema nervoso do organismo depois que S] termina. Se o tempo entre S\ e S2 no for muito grande (uns poucos minutos) possvel se formar CRs para S\ atravs do procedimento de trao. Quo longo pode ser o tempo entre S] e S2 antes que o condicionamento se torne impossvel? Nenhum resposta geral possvel, pois isto depende do reflexo particular S2 R2 , das intensidades de S\ e $2 e de muitos outros fatores. Uma questo relacionada mais fcil de ser respondida: qual o intervalo timo entre o aparecimento de S\ e o aparecimento de S2 ? Isto , que intervalo permite asCRsmais consistentes?Um estudo realizado por Wolfle (1932) usando a retrao do dedo a um choque eltrico como S2 ---- ^ -R 2 gerou a curva vista na Fig 3-6. Note que a percentagem mxima de CRs ocorreu em

8 I
c O

Intervalo S i ---- S 2 (seg) Figura 3-6. Condicionabilidade relativa em funo do intervalo Sj Wolfle, 1932). S 2 (segundo

(Xca de 1/2 segundo e esse valor frequentemente tido como sendo o intervalo timo de S i ------ S2 . Poucas CRs foram registradas em 0 seg. (simultaneidade verdadeira). Os valores negativos do intervalo S i ----- S2 (aqueles a esquerda de 0 na Fig. 3-6) apresen tam algum interesse terico. Eles representam o caso (visto na Fig. 3-5D) em que S\ vem
-6 3 -

depois (!) de S2 - Esse o procedimento chamado de condicionamento retroativo. Con corda-se atualmente que o procedimento de condicic. jnento retroativo no resulta na formao de uma nova CR para S\ e a Fig. 3-6 apoia este ponto de vista. Da nossa anlise na seo anterior, poderamos esperar, todavia, que S2 (agora o primeiro estmulo) adquirisse uma CR. Embora tal resultado no seja consistente com a noo de Pavlov de que o estmulo anterior deva pertencer a um reflexo biologicamente mais fraco ele seria compatvel com uma anlise do condicionamento clssico puramente em termos de relaes temporais entre estmulos. Um procedimento final, no visto na Fig. 3-5, ocorre quando S2 apresentado periodicamente sozinho, sem qualquer Si . Num experimento, Pavlov alimentou um co regularmente em cada 30 min. Nenhuma mudana de estmulo precedia a alimentao. Quando esta rotina de alimentao estava bem estabelecida, o alimento foi totalmente retirado, medindo-se os efeitos. Sob essas condies observou-se que a salivao comeava aproximadamente no fim do perodo de 30 min, o perodo em que o alimento normalmente viria. Pavlov chamou esse procedimento de condicionamento de temporal com base na analogia de que o intervalo de tempo desde a alimentao anterior passava a atuar, de alguma forma, como um S\.

3.4 - A EXTENSO DO CONDICIONAMENTO CLSSICO O leitor deve sair dessa introduo ao condicionamento clssico com uma compreen so clara da natureza invariante de um aspecto do fenmeno. Sempre que dois eliciadores so associados no tempo atravs das regras apresentadas em nossa discusso sobre emparelhamento um resultado inevitvel obtido. O primeiro eliciador passa, eventualmente, a evocar algum novo conjunto de comportamento no organismo. Isto verdadeiro, caso o emparelhamento seja realizado ou por um experimentador num la b o ra t rio cuidadosam ente construdo ou pela ao da natureza na selva. Frequentemente, algum novo comportamento assim evocado o condicionado assemelhar-se- a alguns dos respondentes do segundo eliciador, mas isso no necessariamente verdadeiro. Esse fenmeno parece ser bastante geral, estendendo-se em todo reino animal. J se obteve CRs em vermes, caranguejos, peixes, rpteis, pombos, galinhas, carneiros, ces, macacos e fetos humanos de sete meses de idade ainda no tero materno (Hilgard e Marquis, 1940). Na histria inicial da pesquisa sobre o condicionamento clssico, quando o paradig ma era tido como Sj 5 * R2 >pensava-se que qualquer reflexo poderia ser condiciona do . Isto , qualquer respondente (R 2) poderia ser transferido por substituio de estmulo para novos Sis. Com a queda da substituio de estmulo e a aceitao geral de que a CR pode no ser idntica a R 2 , essa posio foi enfraquecida. Alguns insucessos na obteno de condicionamento so esclarecedores. Numa srie de experimentos cuidadosos com o ernprego de S]s e S 2 S diferentes e vrios intervalos Si S2 , F.A. Young (1958) foi incapaz de obter uma transferncia do respondente pupilar para S j. Young resume a literatura dos ltimos trinta anos sobre um suposto condicionamento desse respondente e conclui que a evidncia indica que nenhum pesquisador demonstrou inequivocamente o condicionamento desse respondente. Schlosberg (1928) indica que condicionamento da flexo do joelho pode ser um artefato devido aos processos que veremos no Captulo 4. Reinwald (citado em Keller e Schoenfeld, 1950) no foi capaz de obter uma CR de flexo do joelho em mais de 1.000 emparelhamentos de uma iuz com
-6 4 -

uma pancada no tendo patelar. possvel que esses pesquisadores estivessem procuran do por uma CR muito parecida com a R2 , original. O condicionamento clssico pode ter sido algo distorcido por muitos anos devido a procura de CRs somente ao longo de dimenses mais bvias de R 2 - O fato que podem existir CRs em dimenses comportamentais diferentes de R2 - Realmente, bem conhecido que o condicionamento clssico um fenmeno que invade muitos aspectos do sistema comportamental de resposta do organismo. Moore e Marcuse (1945) mostraram que quando vrios sistemas comportamentais so examinados, as CRs so vistas mais claramente em alguns desses (como respirao, salivao e taxa cardaca) do que em outros (atividade motora ou geral). A Fig 3-7, um dos registros de Moore e Marcuse, tomados de um porco colocado num arreio Pavloviano e previamente sujeito a tons (S i) emparelhados com biscoitos (S 2 ) ilustrativa.
Cabea ____ ____

Salivao (1/60 cc) Corao

________________________ __________________________________________

A lim entao________________________ ___________________ Tom (480 ) A lim e n to ----------------------------------------* -------------------------------------------- ----- . Tempo (seg.^.................. - ............... -...... -.....-............................ -........ Figura 3-7. Respostas de um porco em um nmero de sistemascomportamentaisa um sinal sonoro que havia sido previamente emparelhado com alimento (segundo Moore e Marcuse, 1945).

As CRs parecem mais convincentemente formadas em respondentes que dependem das funes do sistema nervoso autnomo. Como Keller e Shoenfeld em (1950) salientam: Estes envolvem as aes de glndulas e msculos lisos (e.g. a secreo de suor e a contrao das veias). Desde que a ao de tais 7 efetores' frequentemente associada com estados de emoo (no'm edo" a saliva seca, o suor excretado, a pele esfria, ar pupilas dos olhos se dilatam, etc.) no seria surpresa.... saber-se que esses estados podem ser condicionados maneira Pavloviana (Keller eSchoenfeld, 1950 pp. 27-28). Com a no confirmao da expectativa de Watson de que a substituio de estmulo seria a pedra fundamental para construir uma teoria geral de todo comportamento aprendido, a pesquisa bsica sobre o condicionamento clssico tem sido, at recentemente, pouco enfatizada nos Estados. Unidos. (Prokasy, 1965). Os russos por outro lado, nunca estiveram to interessados no condicionamento como um instrumento para a anlise psicolgica. Por essa razo, talvez, a pesquisa sobre reflexos condicionados nunca entrou em declnio naquele pas. Embora o condicionamento clssico nunca possa atuar como seus entusisticos adeptos esperavam a 30 ou 40 anos atrs, parece provvel que ele ainda possa emergir, se bem que numa forma diferente como um conceito importante
65

para a compreenso do comportamento. O fato de que nossas emoes paream seguir as leis de Pavlov, ao invs ua lei do efeito de Thorndike fornece um indcio da possvel importncia do condicionamento clssico. Em vez de serem as unidades de compor tamento aprendido como Watson concebeu, pode ser que os estados emocionais classicamente condicionados acompanhem e sejam mesmo essenciais para a manuteno de muitos de nossos padres de comportamento. Mas, no momento, isso uma mera especularo e uma apresentao mais detalhada deve esperar um capitulo posterior. 3.5 O MTODO EXPERIMENTAL

A partir daqui, faremos uso recorrente de certos conceitos bsicos da cincia experimental. Na presente seo comearemos a introduzir alguns princpios simples do mtodo experimental como so usados na psicologia, motivando a discusso atravs de referncias a experimentos de Pavlov e seus colaboradores. Em todo experimento, o cientista procura estudar certos aspectos do mundo natural na medida em que se relacionam a outros aspectos. Uma das primeiras tarefas do cientista tentar eliminar as influncias sobre o objeto de seu estudo nas quais ele no est diretamente interessado, na ocasio do seu experimento. Assim, ao estudar como a magnitude do respondente variava com mudanas da intensidade do estmulo, Sherrington separou o crebro da medula para eliminar as influncias desconhecidas que o crebro pudesse ter sobre a magnitude do respondente. De um modo similar, Pavlov rotineiramente colocava os ces numa sala especial onde eram isolados do mundo exterior. Ele diz: Pensvamos, no incio de nossa pesquisa, que seria suficiente simplesmente isolar o experimentador na cmara de pesquisa com o co a sua frente e impedir a entrada de qualquer pessoa durante o curso de um experimento. Mas essa precauo mostrou-se ser completamente inadequada, uma vez que o experimentador, por mais que tentasse ficar quieto, era uma fonte constante de um grande nmero de estmulos. Seus menores movimentos o piscar o olho ou o movimento dos olhos, a postura, respirao e assim por diante todos agiam como estmulos que, chegando at ao co, eram suficientes para viciar os experimentos, tornando a interpretao exata dos resultados extremamente difcil. A fim de excluir essa influncia imprpria do experimentador tanto quanto possvel, ele deveria ficar localizado fora da sala em que o co estivesse colocado, e mesmo essa precauo provou-se insatisfatria em lab o ra t rio s no construdos especialmente para o estudo desses reflexos particulares. O ambiente do animal, mesmo quando fechado numa sala, est sempre mudando. Os passos de uma pessoa que passa, conversas ocasionais nas salas vizinhas, o bater de uma porta ou a vibrao de um furgo passando, vozes da rua, bondes e mesmo sombras que penetram atravs da janela para dentro da sala, qualquer desses estmulos casuais, no controlados, que chega aos receptores do animal... vicia os experimentos (Pavlov, 1927), p. 20). Fica claro a partir do relato de Pavlov que os cientistas se esmeram para
controlar as influncias indesejveis nos seus experimentos. Este o sentido que damos

sxpresso experimento controlado . Algumas vezes todavia, impossvel eliminar uma temperatura e umidade da sala onde fica o animal no podem ser alteradas. Se estas
-6 6 -

mudam drasticamente, elas alteram as propriedades do reflexo. A idade do animal, sua sade e o grau de privao de alimento so influncias semelhantes. O melhor que podemos fazer mant-las to constantes quanto possvel durante o curso do experi mento. Este , ento, um segundo significado de um experimento controlado: mantemos constantes muitas influncias no nosso fenmeno em questo. Tendo controlado as influncias indesejveis, removendo-as ou mantendo-as constantes, prosseguimos na execuo de um experimento. Mas o que isso impe? Em cada experimento, no importa em que cincia, h certos ingredientes bsicos na sua preparao. Em primeiro lugar, uma vez que cada experimento uma tentativa de relacionar duas ou mais coisas entre si, ele trata com pelo menos duas grandezas que possam assumir valores diferentes. (Nos experimentos de Pavlov, duas de tais grandezas eram frequentemente o nmero de emparelhamentos e a magnitude da resposta.) As grandezas que podem adquirir valores diferentes receberam dos matemticos o nome de variveis. Adotaremos esse nome, empregando-o frequentemente atravs do restante deste texto. Ambas as variveis num experimento devem ser mensurveis e uma delas deve ser controlvel ou manipulvel pelo experimentador. Isto , ele deve ser capaz de mudar ao menos uma delas como desejar. No experimento de Anrep (ver seo 3.1) existem trs variveis, trs grandezas que assumem valores diferentes: o nmero de emparelhamentos prvios alimento-tom gotas de saliva e o tempo passado entre o aparecimento do tom e a salivao subsequente (Tabela 3-1). Para simplificar, limitemos nossa ateno a somente duas delas: nmero de emparelhamentos e gotas de saliva. Ambas as variveis foram medidas pelo Dr. Anrep. Todavia, somente uma foi manipulada por ele. Isto , ele determinava diretamente o valor de s uma delas. Essa varivel foi o nmero de emparelhamentos. Uma varivel que medida e manipulada num experimento chamada de varivel independente. Qualquer outra varivel que for concorrentemente medida neste experimento mas no manipulada, chamada varivel dependente. Anrep, assim tinha duas variveis dependentes: gotas de saliva e o tempo para a primeira gota aparecer. Consideremos, por um momento, somente a primeira delas. 80 r Y

ct 5

60-

40 -

B O O

200 ---------- 1 ---------- 1 _______i_______i_______i_______ Y


10 20 30 40 50 Nmero de emparelhamentos sucessivos de X Figura 3-8. Representao da varivel independente de Anrep (1920) e uma de suas variveis dependentes num sistema de coordenada retangular.
-6 7 -

Suponha que tentemos representar nossas variveis e nossos resultados num sistema de coordenada retangular bidimensional como na Fig. 3-8. Designamos a varivel independente para o eixo horizontal (eixo do X) e a varivel dependente para o eixo vertical (eixo do Y). (Essa localizao da varivel dependente exatamente oposta aquela de um histograma. Ver Fig. 2-6.) Vrias propriedades da Fig. 3-8 so interessantes de se notar. (1) Sempre damos aos nossos eixos rtulos informativos descrevendo nossas variveis. (2) Marcamos distncias iguais nos eixos e fazemos com que essas distncias representem aumentos iguais de nossas variveis. (3) As escalas dos eixos (X) e (Y) no precisam ser as mesmas. (4) O zero coincide para ambos os eixos onde as linhas coordenadas se encontram no ponto chamado de origem.
80

> < 60

.fe

a 1 3

40

20

10

20

30

40

50

Nmero de emparelhamentos sucessivos X Figura 3-9. Os dados de Anrep (1920) sobre gotas de saliva e nmero de emparelhamentos indicados como pontos bidimensionais num sistema de coordenada retangular.

Prosseguimos representando os dados de Anrep no sistema de coordenada retangular. Utilizamos as colunas 1 e 2 da Tabela 3-1 para colocar os pontos nos locais apropriados dentro do quadro de referncias. Cada ponto representa um par de nmeros: o nmero de gotas de saliva associado com o nmero de um dado emparelhamento. Ao fazermos isso, obtemos a Fig 8-9. O ltimo passo conectar os pontos com linhas retas. Com esta operao, obtemos a Fig. 3-10, que chamamos a curva ou funo que relaciona o nmero de gotas de saliva ao nmero de emparelhamentos prvios alimento-tom, numa faixa da varivel independente que varia de 0 a 60 emparelhamentos. A forma de tais curvas ou funes de algum in tere sse . No p re sen te caso, vemos que alm do ponto que representa 30 emparelhamentos no ocorre muita mudana na varivel dependente. Quando uma funo alcana um valor limite em torno do qual flutua da em diante, dizemos que alcanou a assntota. Presumivelmente, mesmo que quisssemos continuar com milhares de emparelhamentos adicionais, obteramos, aproximadamente, apenas 60 gotas em cada teste.

-6 8 -

Linha assinttica

> 73 o o a > T 3

O D

Figura 3-10. A funo de Anrep (1920) relacionando gotas de saliva e numero de emparelhamentos, mostrando sua assntota.

Estamos agora, em condies de definir um experimento como a medida e manipulao de uma varivel e a medida concorrente e no manipulao de outra. Estritamente falando, essa d e fin i o vale apenas para os experimentos mais simples, aqueles com uma varivel independente e uma varivel dependente. Experimentos mais complicados podem ter muitas variveis dependentes e independentes, mas aqui suficiente compreender que um acrscimo de variveis no contm novos princpios. O experimento de Anrep serve ainda para ilustrar uma caracterstica especial dos experimentos em Psicologia. Num experimento psicolgico, a varivel dependente inevi tavelmente algum aspecto do comportamento do organismo, a varivel independente inevitavelmente algum aspecto do ambiente imediato ou anterior do organismo. Aqui por exemplo, gotas de saliva uma grandeza comportamental; o nmero de emparelhamentos refere-se freqncia de algum estado anterior do ambiente do animal. Note cuidadosamente que nem saliva nem tom so variveis segundo nossa definio. Gotas de saliva e nmero de tons apresentados que so variveis. Assim, uma varivel a grandeza que pode assumir valores diferentes (variveis); aquilo que medimos e registramos. Agora que temos os instrumentos para compreender e representar os experimentos seus resultados, estamos numa posio muito melhor para compreender os dados obtidos por Anrep e resultados semelhantes. A funo da Fig. 3-10 representa o nosso primeiro exemplo de um processo comportamental. Um processo comportamental pode ser definido como uma mudana no comportamento no tempo (ou tentativas no tempo) em que um procedimento constante mantido em efeito. Podemos verificar que o experi mento de Anrep preenche essas condies. Ele seguiu o mesmo procedimentoemparelhamento de tom com alimento tentativa aps tentativa, testando ocasional mente o efeito do tom sozinho. Em nenhum ponto de suas cinqenta tentativas ele desviou e instituiu um procedimento novo e diferente. Foi sempre o mesmo: tom-alimento, esperar um pouco, tom-alimento, ... e assim por diante. Ento, a curva da Fig. 3-10 que cresce at alcanar assntota, o processo atravs do qual um tom passa, gradualmente, medida que a u r v ;,am os emparelhamentos, a adquirir a habilidade de produzir uma resposta de saliva p* > i mesmo.
- 69 -

3.6 - INTRODUO AOS CONCEITOS ELEMENTARES DE PROBABILIDADE Muitas das coisas que os psiclogos registram e observam ocorrem aqum da certeza perfeita, mesmo quando todas as condies de experimentao e observao so to cuidadosamente controladas quanto possvel. Por exemplo, em qualquer tentativa teste antes de assntota de aquisio ser atingida, a apresentao do S\ no experimento de Anrep (ver figura 3-4) poderia no ter gerado nenhuma CR. Se imaginarmos qualquer tentativa teste realizada antes da assntota, teramos de admitir que haveria uma incerteza muito real ligada predio de se ou no qualquer CR ocorreria para S\. Naturalmente, medida que o nmero de tentativas prossegue, a incerteza diminui Diz-se que um respondente condicionado est complementamente adquirido quando suas chances de ocorrer depois de S\ tom aram-se certas ao mximo. O que verdadeiro para os reflexos condicionados verdadeiro para muitos outros eventos comportamentais e no comportamentais. Algumas vezes, uma pessoa comer o que colocado diante dela, outras vezes no. Algumas vezes, um trem chegar atrasado; algumas vezes, chegar pontualmente. O que gostaramos de ter seria uma rgua ou um instrumento de medida com o qual pudessemos representar e comparar, de uma maneira precisa, a certeza de eventos tais como CRs, comer sobremesas, chegada de trem. Felizmente, encontramos este instrumento no conceito matemtico de probabilidade. Para o presente objetivo, consideraremos a probabilidade de um evento como um nmero que podemos associar a este evento, um nmero que caracterizar a certeza relativa do evento sob condies bem definidas de observao. A fim de determinar esse nmero para um evento, devemos primeiro estabelecer um grupo de condies padro sob o qual iremos procurar pelo evento. Um dos tipos de condies padro envolve uma certa operao (procedimento) que executamos tal como jogar uma moeda, apresentar um S{ ou ordenhar uma vaca. Num segundo tipo as condies padro so estabelecidas pela natureza e meramente fazemos nossas obser vaes em ocasies definidas. Assim, podemos observar se o trem local das 7h34min. chega ou no pontualmente, ou podemos observar o nmero de carros que cruza a ponte George Washington numa determinada hora. Por convenincia, daqui em diante referirnos-emos a qualquer tipo de condies padro de observao simplesmente como a
observao padro.

Denominaremos de resultados os eventos de interesse que surgem quando fazemos as observaes padro. Por exemplo, ao apresentar um estmulo e procurar por um res pondente (uma observao padro), podemos observar a ocorrncia de uma flexo do joelho (um resultado). Ao atirar uma moeda, podemos estar interessados na ocorrncia de cara (um resultado). Em geral, sempre que a ocorrncia de um determinado evento ou resultado no perfeitamente certa, isto pode significar que, ao se fazer a observao padro algum outro evento ocorreu, evento este diferente daquele no qual estvamos principalmente interessados. Assim, se estivssemos interessados no evento cara ao jogar uma moeda, o evento coroa seria aquele que ocorre sempre que o evento cara no ocorre. Para aplicar as noes de probabilidade deveremos classificar todos os resul tados possveis de uma observao padro. No caso de uma moeda de dois lados, os resultados possveis so bvios. Mas quantos resultados possveis poderiam resultar da observao de carros ou da ordenhao de uma vaca? Nesses casos, seria til classificar o grande nmero de possibilidades em um

-7 0 -

nmero fixo e pequeno de categorias. Por exemplo, ao medir a produo de leite podemos achar conveniente preocuparmo-nos apenas com o fato de se Mimosa dar 0 0 21, 2 41 ou mais do que 41 toda manh, ao ser ordenhada. A ordenha a observao padro e quebramos arbitrariamente os eventos possveis em apenas trs resultados. Parece que esse um procedimento arbitrrio e que poderamos ter escolhido dois (algum leite ou nenhum leite), ou mais do que trs resultados, estabelecendo mais categorias. Nos experimentos de condicionamento, quase sempre perguntamos se uma resposta condicionada ou no observada aps cada apresentao de um estmulo. Aqui, a observao padro a apresentao de um estmulo e existem dois resultados uma resposta de nenhuma resposta. Mas poderamos escolher uma caracterstica da resposta para examinar (digamos, sua magnitude) e categoriz-la tal como fizemos com a quantidade de leite produzido pela manh. O ponto importante de todas essas classificaes que elas nos permitem tomar cada resultado real da observao padro e classific-lo em uma ou outra categoria de resultado. Uma vez fixadas quais as categorias de resultado que nossa observao padro deve ter, seguimos adiante. Nosso prximo passo para medir a certeza de qualquer resultado particular pode consistir em se fazer a observao padro algumas vezes a fim de se obter uma idia de quo frequentemente o resultado em questo ocorrer em relao a outros

Figura 3-11. Razo de freqncia de caras numa seqncia de atirar uma moeda. Note a escala comprimida (logartmica) do eixo horizontal. (Cramr, 1955).

resultados possveis. Esse um procedimento fundamental na estimativa de probabilidades. Por exemplo, podemos jogar uma moeda 100 vezes e obtermos 53 caras e 47 coroas. Ou podemos notar que, em 50 apresentaes de um S j , observa-se uma CR 45
- 71

vezes. Se tomarmos agora a razo entre a freqncia dos resultados observados do evento em questo, e a freqncia total de resultados observados, obteremos um nmero entre 0 e 1. Este nmero dos d alguma noo da certeza do evento em questo. Assim, a razo da freqncia de caras no total de eventos de atirar moedas 53/100 = 0,53. Analogamente, a razo da freqncia de CRs nas apresentaes de S\ 45/50 = 0,90. Desses exemplos deveria ficar claro que as razes de freqncia podem ser calculadas sempre que tivermos obtido freqncias de determinados eventos e freqncias de todos os eventos. A idia de uma razo de freqncia nos aproxima muito do nosso ndice desejado de certeza. Mas uma outra caracterstica da razo de freqncia deve ser notada. Uma razo de freqncia est sujeita aos erros usuais de medidas discutidas na seo 2.6. Isto , as razes de freqncia observadas variaro de algum modo em blocos diferentes de observaes padro. Mas, a medida que fazemos mais e mais observaes padro, algo interessante ocorre com a razo de freqncia: ela tende assintoticamente a se aproximar de um valor limite. A Fig. 3-11 mostra como isto acontece quando jogamos uma moeda e observamos os valores da razo de freqncia de caras , medida que se faz mais e mais observaes padro. Evidentemente, estamos chegando cada vez mais perto de uma assntota^ neste caso 0,50. A assntota de uma razo de freqncia
definida como a probabilidade do evento.

A faixa de variao desse nmero que chamamos probabilidade de 0 a 1. Uma probabilidade 0 indica que nunca em qualquer observao padro anterior, o evento em questo foi observado. Geralmente probabilidades prximas de 0 esto associadas com a previso de que improvvel que um resultado do tipo em questo ocorra em qualquer tentativa determinada da observao padro e que em muitas tentativas no futuro, ele ocorrer apenas algumas vezes. Probabilidades prximas de 0,5 significam que o resultado em questo ocorre aproximadamente metade das vezes que a observao padro feita e em conseqncia, essa a nossa previso para o futuro. medida que a probabilidade se aproxima de 1 ficamos cada vez mais certos de que deveremos observar o resultado em questo. Finalmente em 1, dizemos que estamos certos de que o resultado ocorrer. Assim, a nossa convico de que o sol nascer amanh recebe uma expresso quantitativa dada por uma probabilidade igual a 1 ,0 , j que toda observao no passado resultou em o sol aparece . O resultado o sol no aparece , todavia, tem at agora uma freqncia igual a 0 e, ento, uma probabilidade 0. Esse valor expressa nossa falta de confiana em prever esse resultado. Uma maneira til de representar a escala de probabilidade vista na Fig. 3-12.
N unca aconteceu . Perfeitamente certo

Pode ou no acontecer

Baixa

2
Probabilidade

Alta

Figura 3-12. A escala de p ro b ab ilid a d e.

REFERNCIAS PARA O CAPITULO 3. Anrep, G. V. Pitch discrimination in the dog. / . Physiol., 1920, 53, 3 6 7 -3 8 "
- 72 -

Cramr, H. 77:./ elements of probability theory. Wiley: New York, 1955. Dashiell, J. F. Fundamentals of general psychology. (3rd ed.) Boston: Houghton Mifflin, 1949. Grant, D. A., and Norris, E. B. Eyelid conditioning as influenced by the presence of sensitized Beta-responses. / . exp. P sychol , 1947, 37, 423-433. Hilgard, E. R., and Marquis, D. G. Conditioning and learning. New York: Appleton-Century-Crofts, 1940. Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New Y ork: Appleton-Century-Crofts, 1950. Long, Lillian D. An investigation of the original response to the condi tioned stimulus. A rch . Psychol., (New Y ork) 1941, No. 259. Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964. Moore, A. U., and Marcuse, F. L. Salivary, cardiac, and motor indices of conditioning in two sows. J. comp. Psychol ., 1945, 38* 1-16. Mostofsky, D. (E d .) Stimulus generalization. Stanford: Stanford Univer. Press, 1965. Notterman, J., Schoenfeld, W. N., and Bersh, P. J. Conditioned heart rate response in human beings during experimental anxiety. /. comp, physiol. Psychol., 1952, 45, 1-8. Osgood, C. E. M ethod and theory in experimental psychology. New York: Oxford Univer. Press, 1953. Pavlov, I. P. Conditioned reflexes. London: Oxford Univer. Press, 1927. Pavlov, I. P. Lectures on conditioned reflexes. New Y ork: International Publishers, 1928. Prokasy, W. F. (E d .) Classical conditioning: a symposium. New Y ork: Appleton-Century-Crofts, 1965. Schlosberg, H. A study of the conditioned patellar reflex. J. exp. Psychol 1928, 1 1 ,4 6 8 -4 9 4 . Wolfle, H. M. Conditioning as a function of the interval between the conditioned and the original stimulus. J. gen. Psychol., 1932, 7, 80-103. Young, F. A. Studies of pupillary conditioning. J. exp. Psychol., 1958, 55, 97 -1 1 0 . Zeaman, D., and Smith, R. W. Review of some recent findings in human cardiac conditioning. Chap. 19 in W. F. Prokasy (E d .), Classical r * in'nning. New York: Appleton-Century-Crofts, 1965.

-7 3 -

Captulo 4 - FORTALECIMENTO OPERANTE

A regularidade demonstrada nos fenmenos reflexos tanto incondicionado como condicionado - ilustra o tipo de ordem a ser encontrada entre comportamento e ambiente. Todavia, muitas das atividades dos organismos superiores no parecem enquadrar-se num modelo reflexo de comportamento. Essas incluem as aes humanas que foram descritas^ntes de Descartes como voluntrias, espontneas intencionais e propositais, e que resistiram anlise experimental at o incio do sculo vinte. Uma ilu stra o esclarecedora sobre onde terminam os reflexos e comeam esses comportamentos encontrada na seguinte passagem: quando um gato ouve um rato, volta-se para a fonte do som,v o rato, corre em sua direo e lana-se sobre ele. Sua postura em cada estgio, mesmo na seleo do p que dar o primeiro passo, determinada por reflexos que podem ser demonstrados um a um em condies experimentais. Tudo que o gato tem a fazer decidir se persegue ou no, todo o resto est preparado para isso pelos seus reflexos posturais e locomotores (Skinner, 1957, p. 343). Por trs da proposio ilusoriamente simples de tudo que o gato tem a fazer e
decidir encontra-se o ponto de partida para uma cincia daqueles comportamentos cujas

ocorrncias no esto relacionadas reflexamente presena imediata de um eliciador ou a uma histria de emparelhamento de dois eliciadores. 4.1 - INTRODUO AO COMPORTAMENTO PROPOSITAL No estudo dos reflexos e respostas condicionadas vimos que a explicao e compreenso cientficas surgiram atravs da descoberta progressiva e da elaborao de relaes entre certos aspectos do comportamento (as respostas, variveis dependentes) e certos aspectos do ambiente (as variveis independentes, estmulo e histria passada). C ada descoberta de uma nova relao ou lei do comportamento foi um evento importante na histria do reflexo. medida que nossas leis comeam a se empilhar e se misturar, sentimo-nos justificados em falar acerca de uma compreenso parcial do comportamento reflexo. A nlise ex p e rim en tal tem procedimento similar com os comportamentos

- 75

que chamaremos, por enquanto, propositais . Desde o trabalho pioneiro de Thorndike com gatos e pintos sobre aprendizagem, os psiclogos tm, progressivamente, persistido na procura de relaes entre o comportamento proposital e outros eventos. Em geral, a procura dessas relaes no nos conduziu ao longo dos mesmos caminhos do reflexo. Contudo, uma abordagem funcional j foi iniciada. Considere o problema no desenvolvimento de tal abordagem: como procedemos para encontrar as variveis ou eventos aos quais o comportamento proposital possa estar significantemente relacionado? Inicialmente, devemos proceder por intuio e observao grosseira. Se tivermos sorte, podemos cumprir nossa tarefa ajudados por uma especulao filosfica avanada. Vinte e cinco anos antes de Thorndike,o filsofo britnico Herbert Spencer escreveu o seguinte. Suponha, agora, que ao estender sua cabea para apanhar uma presa de difcil alcance, uma criatura falhe rapidamente. Suponha que, ao lado do grupo de aes motoras aproximadamente adaptadas para alcanar a presa a esta distncia... um pequeno movimento do corpo para a frente (ocorre). O sucesso, ao invs do fracasso, ser alcanado... Quando as circunstncias se repetem, esses movimentos musculares que foram seguidos por sucesso so provavelmente repetidos: o que foi inicialmente uma combinao acidental de movimentos ser agora uma combinao que tem probabilidade considervel (Spencer, 1878). Na proposio de que aqueles movimentos musculares que foram seguidos por sucesso so provavelmente repetidos , Spencer estava enfatizando que o que um or ganismos faz agora est, de algum modo, relacionado com as conseqncias do que o organismo fez no passado. Aqui, ento, est a deixa que Thorndike, e mais tarde Skinner, deveriam seguir extensivamente. O comportamento proposital aquele que quase totalmente definido por suas conseqncias. Considere a Tabela 4.1. Em cada ato ali citado, o objetivo do compor tamento est relacionado de perto com as conseqncias. Dizemos que amarramos um Tabela 4.1 ALGUNS COMPORTAMENTOS PROPOSITAIS DOS ANIMAIS E HOMENS, SEUS ASSIM CHAMADOS PROPSITOS, E SUAS CONSEQNCIAS PASSADAS REAIS. COMPORTAMENTO Amarrar um sapato Comprar uma capa de chuva Entrar em um restaurante Abrir uma torneira Escrever uma carta Cavar um buraco PROPSITO
Para manter o sapato Para no molhar Para almoar Para obter gua Para assegurar uma resposta Para escapar do frio

CONSEQNCIAS

0 sapato fica no p
A chuva no molha Voc almoca Aparece a gua A resposta obtida Obtm-se calor

sapato para manter nosso sapato no p, mas uma proposio equivalente que amarramos nosso sapato e, ontem quando o amarramos, ele ficou no p. Aproposiode que os ratos se refugiam em buracos para escapar do frio pode equivalentemente ser expressa com a proposio de que os ratos frequentemente, no passado, refugiaram-se em buracos e encontraram temperaturas mais elevadas.
-7 6 -

EXERCCIO 2.
Transforme cada um dos comportamentos e propsitos da Tabela 4.1 em propo sies equivalentes que expressem simplesmente o comportamento presente e o com portamento passado com suas conseqncias.

Aparentemente, temos duas maneiras de representar o mesmo comportamento, na nossa lngua: 1 ), o proposital no qual empregamos o termo para (ou de modo a) e que implica no tempo futuro; 2 ), o descritivo, no qual especificamos o comportamento presente e o associamos com o que aconteceu no passado. A redundncia na repre sentao desperdcio e usualmente evitada pelos cientistas. Na presente argu mentao, deveremos rejeitar a linguagem proposital e adotar a linguagem mais descritiva por uma razo lgica. O comportamento no pode ser relacionado com eventos futuros, isto , eventos qu ainda no aconteceram. Um lembrete algo desagradvel pode ser retirado da seguinte ilstrao: Durante a guerra, os russos usaram ces para bombardear tanques. Um co era treinado para se esconder atrs de uma rvore, arbustos ou outro esconderijo qualquer. Quando um tanque se aproximava e passava, o co corria ao seu lado e uma pequena mina magntica, presa s suas costas era suficiente para danificar o tanque ou incendi-lo. O co, naturalmente, tinha que ser substitudo (Skinner, 1956, p. 228). Apenas uma das duas possveis descries satisfatria aqui. O co corre na direo ao tanque devido a certas conseqncias passadas de correr na direo de tanques. (Presumivelmente eles eram ali alimentados ou acariciados, etc.) Nesse exemplo extremo fcil rejeitar a proposio alternativa de que os ces corriam na direo dos tanques para serem explodidos. Mesmo assim, a ilustrao til para estabelecer o princpio geral de que o futuro no determina o comportamento. Em resumo, uma classe muito real e importante de comportamentos surgida de situaes que parecem envolver escolha ou deciso, chamada comportamento proposital. Esse comportamento, deve ficar claro de uma vez, inclui-se na categoria de Descartes de 'voluntrio e constitui a ao que os antigos chamavam intencional . Nossa anlise presente, indica que esse comportamento est de algum modo relacionado com suas conseqncias controlado por elas. Por essa razo, daqui por diante, deveremos substituir o antigo termo proposital pelo termo instrumental de Thorndike, ou ope rante de Skinner. Chamar o comportamento de instrumental ou de operante sugere que, operando no ambiente, o comportamento instrumental na obteno de conseqn cias. Nenhum desses termos implica o mesmo quadro conceituai indesejvel que o termo proposital , mesmo assim ambos tentam aprender a noo fundamental de que as conseqncias passadas de tal comportamento so um de seus determinadores impor tantes.

4.2

UM EXPERIMENTO PROTTIPO

Se um rato de laboratrio, faminto, colocado na caixa ilustrada na Fig. 4-1 e certos procedimentos so efetuados, um nmero de efeitos comport ame ntais interessantes podem ser observados.
- 77 -

Para os objetivos da presente anlise, as caractersticas significativas da caixa so ( 1 ) uma bandeja para o fornecimento de uma pequena pelota de alimento para o rato e ( 2 ) uma alavanca ou barra, projetando-se da parede da frente, que, quando pressionada para baixo com uma fora de cerca de 10 g, fecha um micro-interruptor, permitindo um registro automtico desse comportamento. Os aspectos significantes do rato so os seguintes: ( 1 ) sadio e foi acostumado a comer uma refeio por dia, por volta da mesma hora em que se encontra na caixa. (2) Foi previamente adaptado a essa caixa e, durante este perodo de adaptao, o alimento era ocasionalmente fornecido na bandeja. Agora, ele se aproxima prontamente da bandeja de alimento e come-o sempre que este'est disponvel.

Figura 4.1 - Uma cmara experimental baseada na caixa originalmente usada por B. F. Skinner para o estudo do comportamento instrumental no rato e outros pequenos mamferos (Will Rapport).

Considere o seguinte experimento. O rato cuidadosamente observado nessa caixa por um perodo de 15 minutos. Durante este tempo, nenhum alimento fornecido na sua bandeja. No ser difcil observar a ocorrncia de comportamentos que chamamos exploratrios. O rato cheira os cantos, cheira a bandeja, pressiona ocasionalmente a barra, levanta-se apoiando suas patas dianteiras nas paredes e assim por diante. Alm disso, o animal frequentemente se engaja em atividades de limpeza e de farejar, e ocasionalmente permanece quase completamente imveL Todas essas atividades so exemplos daquilo que os psiclogos usualmente rotulam de respostas. suficiente, no presente, observar a seguinte precauo: esses comportamentos no so respondentes (nenhum eliciador especfico pode ser encontrado para eles. Isso no significa que eles

-7 8 -

no dependam, em grande parte, da construo da caixa para que ocorram. No obstante, eles parecem ser emitidos na ausncia de qualquer estmulo especfico. Por essa razo, eles so frequentemente referidos como respostas emitidas. A observao dos comportamentos emitidos por um animal na situao onde nenhuma conseqncia especial est sendo fornecida para qualquer resposta conhecida como a observao do nvel operante. Os registros do nvel operante servem como uma importante linha base em relao qual deveremos, mais tarde, comparar os efeitos da liberao de conseqncias especiais para uma ou mais respostas emitidas. Depois de 15 minutos de observao dessas vrias respostas emitidas, iniciamos o se guinte procedimento. Cada vez que observamos que o rato pressiona a barra, imediatamente fornecemos uma pelota de alirtiento na bandeja. Agora, pela primeira vez na histria do rato, o comportamento de pressionar a barra tem a conseqncia especial de produzir alimento. No ser necessrio esperar muito para ver os efeitos dessa nova contingncia no com portam ento do rato. Logo o animal estar ativamente ocupado com comportamentos de pressionar a barra e comer. Algumas mudanas ou modificaes bem marcantes em seu comportamento ocorrem no espao de poucos minutos. Na linguagem comum, dizemos que o rato aprendeu a pressionar a barra para obter o alimento. Tal descrio contribui pouco para a proposio de que o rato est agora pressionando a barra frequentemente e est obtendo alimento. 0 que desejamos fazer descrever em detalhe, e to quantitativamente quanto possvel, as mudanas no comportamento as quais resultam da simples operao de liberar uma conseqncia especial, para apenas uma das atividades normais do indivduo que ocorre na situao. Para fazer isso, consideremos quatro maneiras complementares de encarar as mudanas no comportamento do rato quando, como o foi aqui, um de seus comportamentos selecionado e recebe uma conseqncia favorvel. 4.3 - MUDANAS NA TAXA ABSOLUTA O experimento que descrevemos um exemplo dos experimentos prottipos sobre o comportamento operante realizados por B. F. Skinner em 1930. Uma das mudanas comportamentais marcantes que ocorre sempre que um comportamento, como o pressionar uma barra, seguido por alimento, que o comportamento aumenta grandemente em freqncia. Ser til considerar o aumento que ocorre na freqncia, quando o comportamento j existente sujeito a uma conseqencia especial, como um fortalecimento deste comportamento. Ento, o processo que estamos examinando agora poderia ser chamado de fortalecimento do comportamento operante, ou mais brevemente, fortalecimento operante. As mudanas na freqncia de um dado comportamento so vistas mais claramente no aparelho similar a um quimgrafo, de Skinner, que registra, tinta, as ocorrncias sucessivas da resposta selecionada e as acumula verticalmente num papel de registro, ao mesmo tempo que a pena se move continuamente no tempo na direo horizontal. Para compreender esse aparelho, que pode justificadamente ser chamado de microscpio dos behavioristas, leia o programa da Tabela 4.2 passo por passo. Escreva suas respostas nos espaos fornecidos para isso. Prossiga, passo por passo, at chegar ao fim.

- 79

Tabela 4-2 (continuao) Neste diagrama, a taxa aumenta constantemente de um valor ba prximo de___________ para um valor alto prximo d e ---------------Um aumento na taxa chamado acelerao positiva. A acelera positiva vista neste diagrama/no diagrama do quadrado acima (marq qual). A acelerao negativa refere-se a um (a )------------------------------------na taxa. A acelerao negativa vista no diagrama deste quadro/no do qua acima (marque qual).

Para registrar outros eventos que ocorrem enquanto c animal e respondendo, a pena move-se rapidamente 4para o sudeste'' e retor novamente. No diagrama esquerda, a pena traou uma linha d e -para____Nesse ponto, a pena retornar imediatamente para-----------A pequena marca diagonal ("trao ou risco") e m ---------------------____foi feita pelo mesmo movimento da pena como mostrado ein d A marca ou risco sudeste frequentemente usada para indicar q uma resposta produziu alguma conseqncia especial.. No diagra deste quadro, essas respostas foram registradas somente pela mar vertical e m ---------------- - e ----------------- No diagrama deste quadro, uma resposta recebeu uma conseqnc especial e m -------------N a p r tic a , o trao vertical feito por uma umca resposta mu pequeno para ser facilmente identificado. Entretanto, podemos u a --------------------- da curva em qualquer ponto como um indicador v do da taxa de resposta. No diagrama, a taxa foi mais alta entre_____ e ________zero entre e ------ -- e de um valor intermedirio entre____e _____ ________

T abela 4-2

(continuaao)

/ / | '00 ,1' g>50 S 5 10 Sl ------- 1 ------- L _


M inutos

Quando os degraus so to pequenos que nao podemos contar a tas, podemos ainda determinar o nmero de respostas entre doi no registro usando uma escala. No diagrama deste quadro, a poro vertical da escala direit que aproximadamente respostas foram emitidas en no registro cumulativo esquerda. Se o papel se move muito devagar, no ser possvel medir acur te o tempo entre duas respostas, mas ainda assim podemos dete tempo passado entre dois pontos escolhidos^ No diagrama deste quadro, a poro horizontal da escala di diz que as respostas a e b do registro cumulativo esquerda oc com um intervalo de aproximadamente minutos.

f ----/a 10 ----5 ------ a M inutos M D & s vezes, uma curva cumulativa e usada para registrar a progresso de um automvel em movimento e, ao indica a velocidade do movimento. Quando uma curva cumulativa usada para registrar o co nima! a inclinao indica---------------------

No diagrama a esquerda, aps completar cerca de 100 resposta e b , o animal parou por um curto p e r o d o J " q - " ~ e ento emitiu cerca de ---- -- ------------- respostas en

de resposta significa o nmero de respostas por unidade de tempo. Num registro acumulativo, o ostas pode ser determinado pela distncia percorrida pela pena na direo-------------

gistro cumulativo o tempo indicado pela distncia percorrida pela pena na direo---------------------------

TABELA 4-2

UMA SEQNCIA DE INSTRUO PROGRAMADA SOBRE CO REGISTRO CUMULATIVO DA RESPOSTA (ADAPTADO DE SKIN

Uma larga tira de papel desenrola-se de um rolo. A ponta d move-se vagarosa e constantemente para a esquerda. Uma p sobre o papel traou uma linha que comea em __________ e e m ------------------------- __________________________

O movimento vagaroso do papel sob a pena traou a linha horiz _a ____________ . Em b a pena moveu-se repenti percorrendo uma distncia pequena para cima at

No diagrama esquerda, o papel percorreu uma distncia peque da posio mostrada no diagrama do quadro acima. A pena fix uma segunda linha horizontal de _____________ a __________

No diagrama deste quadro, a pena j ocupou as quatro posi c, d. Ela ocupou a posio____________primeiro e________ ltimo.

No diagrama deste quadro, o tempo que decorreu entre c e d f o -----do que o tempo que decorreu entre a e b -------------------------------

Tabela 4-2 (continuao) Ao registrar as respostas emitidas por um organismo, a pena move cima e traa uma linha vertical curta cada vez que uma resposta No diagrama esquerda, um experimento comeou quando a pen em a. A primeira resposta ocorreu em No diagrama, tres respostas toram emitidas rapidamente e co taxa constante e m ----------------------- --------------- e ----------------

No diagrama a esquerda, as trs respostas registradas em a emitidas _____________ rapidamente do que as trs em b,--------

Quanto mais rpido o responder, tanto ---------------- as pausas entre as respostas. Quanto mais alta a taxa de respostas, tanto .-------------- a linha horizontal traada pela pena entre respostas sucessivas. No diagrama do ltimo quadro, quanto mais rpido o responder, tanto_______________ a inclinao da linha em degraus. A taxa de resposta mostrada p ela____________ de linha em degraus.

As respostas no diagrama a esquerda comeam com um relativamente alta em a. O tempo entre as respostas sucessivas t progressivamente_____________ _ _ ________________________

No diagrama, a inclinao da primeira parte da curva traada p comeando em a relativamente___________________________

A que se parecem as curvas cumulativas tpicas do processe de fortalecimento instru mental? As curvas vistas na Fig. 4.2 so os registros de quatro ratos individualmente submetidos ao procedimento que descrevemos acima. As curvas indicam que o processo de fortalecimento abrupto.

Tempo (minutos)

Figura 4.2 - Algumas curvas tpicas de respostas acumuladas obtidas de ratos famintos no dia do fortalecimento de uma resposta de presso a barra pela primeira vez. Como cada resposta produz uma pelota de alimento, os traos de alimento esto omitidos (Skinner, 1938).

0 efeito da conseqncia especial de alimento nem sempre ocorre imediatamente, mas uma vez que ocorre, h uma mudana abrupta para uma nova e alta taxa de resposta que mantida no restante do experimento.
4.4 MUDANAS NA TAXA RELATIVA

Uma segunda maneira conveniente de observar o processo de fortalecimento da resposta considerar as mudanas de taxa na resposta selecionada em relao as mudanas de taxa que ocorrem em todo o substrato das atividades que ocorrem na situao. Por exemplo, numa demonstrao do fortalecimento da resposta de pressionar a barra para uma classe de gradua do Cornegie Institute of Technology foram registrados os seguintes comportament' de um rato, em 15 min, de nvel operante, e 15 min subsequentes de fortalecimento d? ^sso a barra.

Rp = = = Ra = Rb =

atividades de presso barra. farejar Puxar uma pequena corrente pendurada no teto cheirar a bandeja de alimento Estender uma pata em direo a um bloco de chumbo colocado em um dos can tos.

Ri = permanecer imvel por aproxjnvdar\vnre 9 seg contnuos.

-84 -

As freqncias dessas atividades durante o nvel operante e durante o fortalecimento esto representadas nos histogramas da Fig. 4.3.

Rp

Rf

Rc

Ra

Rb

Ri

COMPORTAMENTOS
Figura 4.3 - Freqncias relativas de vrios comportamentos que ocorrem numa caixa experimental antes e depois do fortalecimento do comportamento de pressionar a barra

Olhando a Fig. 4.3, vemos claramente que no apenas a taxa de presso a barra aumentou, mas as taxas das outras atividades no associadas com alimento na situao diminuram. 4.5 MUDANAS SEQENCIAIS NO RESPONDER

As modificaes comportamentais que acompanham o fortalecimento de uma dada resposta se estendem alm dessa resposta para muitas outras atividades. Em particular, quando o alimento dado ao animal, todas as atividades envolvidas na obteno de alimento so tambm fortalecidas. Mas o fortalecimento no se limita simplesmente ao aumento na sua freqncia. Uma mudana na ordem em que o animal emite certos comportamentos ocorre no fortalecimento instrumental. Uma ordem particular rapidamente estabelecida e mantida. No experimento de pressionar a barra, a seqncia (1) pressionar a barra, (2) aproximar-se da bandeja de alimento, (3) pegar o alimento (4) inger-lo, (5) aproximar-se da barra. (1) pressionar a barra... Em resumo, um elo contnuo de comportamento foi formado pela operao de tomar o alimento contingente presso barra. Esse elo bastante diferente do padro de seqncia de resposta vistas no n'^1 operante. Dois membros do elo estabelecido 1 e 2, serviro para ilustrar este ponto. Ignoremos, por um momento, todos os outros comportamentos possveis na situao e limitemos nossa ateno ao ( 1 ) pressionar a barra e ( 2 ) aproximar-se da bandeja (U *
- 8b

alimento. Antes do fortalecimento da pressdo barra, essas duas respostas ocorrem de tal modo que, quando o animal emite uma delas, provvel que ele repita essa rnesma resposta novamente em vez de emitir a outra (Frick e Miller, 1951). Assim, uma seqncia bastante tpica de presso barra (Rp) e respostas de aproximar-se da bandeja (Ra), no nvel operante, pode ser: Rp Rp Ra Rp Rp Rp Ra Ra Ra . .

Durante o fortalecimento, essa seqencia muda rapidamente para a alternao: Rp Ra Rp Ra Rp Ra . ..

e dificilmente ser visto outro padro (Millenson e Hurwitz, 1961). No se sabe quo rapidamente esse processo ocorre, mas sob condies favorveis, parece provvel que s ja quase to instantneo quanto a mudana na taxa absoluta de presso barra. 4.6 - MUDANAS NA VARIABILIDADE Um indivduo nunca emite um ato duas vezes exatamente da mesma forma. Assim como cada vez que escrevemos nosso nome, fazemo-lo ligeiramente diferente, assim tambm cada vez que o rato pressiona a barra, ele o faz de um modo ligeiramente diferente. Algumas presses so feitas com a pata esquerda, algumas com a direita, algumas vom o nariz e algumas com o ombro. Mesmo assim, agrupamos todos esses casos e dizemos que a classe de respostas que chamamos presses barra constituda de todas as possveis maneiras de pressionar uma barra. Durante o fortalecimento de tal classe de resposta, estamos realmente fortalecendo esses casos individuais de respostas, cada uma das quais difere ligeiramente de seus semelhantes. Esse fortalecimento dos membros da classe de comportamentos que constituem a presso a barra tem um efeito marcante na forma final em que o comportamento se estnbelece. Enquanto inicialmente, no nvel operante, o rato tende a pressionai a barra de muitas maneiras diferentes, depois do fortalecimento, tende a faz-lo de poucas maneiras. Em outras palavras, os casos individuais tornam-se cada vez mais semelhantes. Expressa mos este resultado dizendo que a topografia do comportamento se restringe durante o fortalecimento instrumental. A topografia de uma resposta refere-se maneira pela qual o animal emite a resposta. Estritamente falando, a topografia parece dizer respeito aos msculos realmente empregados no momento da ocorrncia da resposta. 0 registro de tais eventos, todavia, apresenta dificuldades. Como uma tentativa para fazer isso, pode-se empregar uma cmara para fotografar o animal no momento em que a resposta con cluda. Guthrie e Horton (1946) tiraram fotografias de gatos e ces quando o comporta mento que produzia uma conseqncia especial era o de inclinar uma vara que estava no centro da caixa do animal. A Fig. 4.4 ilustra alguns exemplos extremos da estereotipia do comportamento depois do fortalecimento. Cada animal adota uma topografia idiossincr tica e s se afasta dela em qualquer ocasio determinada apenas em detalhes. Um exemplo surpreendente de estereotipia humana no comportamento instrumental apren dido visto na Fig. 4.5.
86

' t

Figura 4.4 - Desenhos das respostas de dois gatos e um co em emisses sucessi vas de uma resposta de inclinar uma vara (Kimble, 1956, segundo Guthrie e Hor ton, 1946).

4.7 - OPERANTES E ESTMULOS REFOR ADORES Em resumo, ento, os quatro efeitos do fortalecimento de uma resposta so: 1 aumentar a taxa desta resposta em relao ao seu nvel operante; 2 aumentar a taxa dessa resposta em relao txa de outro comporta mento que est ocorrendo na situao; 3 transformar num elo, que sempre repetido, o padro ou seqncia das respostas envolvidas; 4 aumentar a estereotipia da resposta selecionada. A presso barra, o puxar a corrente, explorar com o nariz, inclinar uma vara e assim por diante so atos convenientes escolhidos pelos experimentalistas para estudar esses efeitos. A adequao desses comportamentos para o estudo do fortalecimento operante depende criticamente da sua capacidade de serem modificados como foi descrito. For malmente, esses e outros comportamentos, assim fortalecidos, so definidos como operantes. Os quatro efeitos do fortalecimento constituem o que chamaremos, daqui por diante, de leis do fortalecimento operante. Presses barra e outros comportamentos simples dos animais so escolhidos para estudar essas leis porque eles so facilmente observados e medidos pelo experiinntador e facilmente executados em vrias taxas pelo organismo. No decorrer deste texto, continuaremos a ampliara aplicabilidade dessas leis e do termo operante muito alm de presso barra e ratos.

- 87 -

Na sua lei do efeito, Thorndike enfatizou a importncia de certas consequencias espeicais do comportamento. Eventos que eram satisfatrios , dizia ele, e que seguiam o comportamento, atuavam de modo a fixar aquele comportamento. Embora chamar tais eventos de satisfatrios possa, primeira vista, parecer uma especificao indepen dente e til das conseqncias especiais, o fato que fornecer uma definio satisfatria para satisfatria' 1 difcil. No caso do animal, no temos uma maneira de saber se um evento satisfatrio, salvo pela observao de se ele atua no comportamento de acordo com as leis do fortalecimento operante. No caso do ser humano podemos pensar que a satisfao possa ser facilmente identificada, mas tente definir o termo. Coisas satisfa trias so aquelas das quais gostamos, mas quais so essas coisas? Em ltima instncia, as coisas de que gostamos so aquelas que trabalharemos para obtr. Mas dizer que trabalha remos por elas outra maneira de dizer que faremos por elas o que o nosso rato far por alimento. Somos, ento, levados concluso de que a definio dessas conse qncias especiais melhor concebida em termos de seus efeitos especiais no comporta mento.

Figura 4.5 - Ted Williams completando suas 2.000 rebatidas no primeiro turno e 2.001 rebatidas no quinto turno de um jo go disputado no Yankee Stadium em 11 de agosto de 1955 (The New York Times and Patrick A. Burns).

Em resumo, temos um grupo de conseqncias especiais, especiais porque quando usadas em conexo com operantes, como fizemos na seo 4.2, resultam em mudanas caractersticas de comportamento. Uma lista parcial de tais conseqncias conveniente. Para seres humanos e animais superiores Alimento gua Sexo Calor Novidade funcionam dessa maneira.
-8 8 -

Uma conseqncia sempre uma mudana no ambiente de um indivduo. A apresen tao de alimento para nosso rato foi uma mudana 110 seu ambiente previamente sem alimento. A conseqncia de pedir um copo dgua pode ser um novo ambiente onde o copo dgua aparece na mo de um amigo. A conseqncia de tirar o telefone do gancho um novo ambiente que agora inclui o sinal de discar. Poderamos estender tais exemplos indefinidamente. Note, nosso ambiente foram definidas, no contexto dos reflexos e do condicionamento Pavloviano, como estmulos. , ento, evidente que, ao falar de um certo grupo especial de conseqncias, nada mais estamos fazendo do que delimitando, pelos seus efeitos especiais sobre operantes, um certo subconjunto de estmulos. Podemos convencionalmente definir aqueles estmulos que, ao seguirem o comportamento operante, atetam-no atravs das leis do fortalecimento operante, como estmulos reforadores (S+) ou simplesmente reforadores. A operao de apresentar um reforador denominaremos de reforamento. Diz-se, algumas vezes, que os tenros operante e reforamento so circulares. Parece que cada um definido em termos do outro. Reforadores parecem ser definidos como aqueles eventos que fortalecem operantes; mas operantes parecem ser definidos como aqueles comportamentos que so suscetveis de fortalecimento pelos reforadores. O pequeno experimento imaginrio que se segue mostra como a circularidade pode ser quebrada. Imagine um experimentador ingnuo diante de um Marciano. Ele observa um orga nismo que nunca viu antes. O organismo faz alguma coisa. O experimentador, de sua mala de conseqncias, apresenta uma aleatria. Ser que o organismo executa nova mente esse comportamento com maior freqncia ou ser que a conseqncia no tem efeito algum? Se no, talvez o experimentador tente novamente outra conseqncia ou tente, talvez, a mesma conseqncia, mas selediona outro comportamento. Por um processo de tentativa e erro, o experimentador pode descobrir certas conseqncias e certos comportamentos que funcionem das maneiras descritas nas sees 4.3 a 4.6. Tendo descoberto uma conseqncia especial, ele pode continuar a us-la para descobrir outros operantes. Tendo encontrado um operante, ele pode continuar a us-lo para descobrir outras conseqncias. Pouco a pouco , o experimentador persistente construir seus con ceitos de reforadores para o Marciano e operantes do Marciano apenas atravs de tais operaes. 4.8 - 0 PARADIGMA DO FORTALECIMENTO OPERANTE O que temos discutido no fortalecimento operante diversamente mencionado na literatura de psicologia como suscetiva, de ensaio e rro, aprendizagem de efeito, aprendizagem instrumental, condicionamento instrumental, aquisio, condicionamento Tipo R (para resposta), aprendizagem operante e condicionamento operante. Preferimos restringir o termo fortalecimento operante para as condies em que o comportamento que reforado j existe com uma certa fora, maior do que zero, no momento em que o fortalecimento iniciado. Contudo, ao examinarmos outras fontes, til reconhecermos a equivalncia desses vrios nomes para o processo de fortalecimento. Estamos agora em condies de dar uma definio compreensiva do paradigma do fortalecimento operante. Tal como o condicionamento Pavloviano, ele tem quatro aspectos: um. Dado, um Procedimento, um Processo e um Resultado.
- 89 -

DADO : 1 Uma resposta operante sendo emitida numa freqncia maior do que zera 2 - Um reforador apropriado. PROCEDIMENTO: Seguir cada emisso do operante selecionado com o estmulo refor ador. til representar o procedimento de fortalecimento operante simbolicamente. O procedimento pode ser representado simplesmente como: R -> S+

Onde R representa uma classe de resposta operante (constituda de r j, r 2 . . . rn), S+ representa um estmulo reforador e a seta lida como produz ou conduz a. PROCESSO: Um aumento abrupto na taxa do operante, sua incorporao rpida num elo de comportamento e uma restrio na topografia do ope rante. RESULTADO: O mesrrto que no processo. 4.9 - OPERANTES VOCAIS As atividades humanas que chamamos linguagem constituem possivelmente, o mais complexo de todos os padres de comportamento humano. At o presente momento, a linguagem ainda to nica para o organismo humano que pode muito bem ser tomada como uma das propriedades principais que definem a espcie. Os elementos comuns de todas as linguas so os sons produzidos pela vibrao do ar que expelido dos pulmes e que passa atravs de um grupo de msculos na laringe, chamados de cordas vocais. A tenso desses msculos, medida que o ar passa atravs deles, est sob o mesmo tipo de controle que governa os movimentos de outras partes do corpo. Conseqentemente, a produo do som comportamento operante. A regio maxilar, os lbios e a lngua agem em combinao com a laringe para moldar os sons e produzir mais de quarenta sons humanos diferentes, conhecidos como fonemas, os quais so usados em vrias combinaes nas lnguas. Devido ao fato de que os sons dos fonemas so diretamente dependentes dos movimentos do aparelho vocal, a medida da produo do fonema constitue uma medida indireta do comportamento, do mesmo modo que a medida da presso a barra constitue uma medida indireta dos movimentos realizados pelo rato ao pressionar esta barra. A linguagem humana desenvolve-se a partir de sons no refinados, emitidos pelas crianas. De um modo surpreendente, um beb, durante os primeiros 5 meses de vida, emite todos os sons usados em todas as lnguas fiumanas nasais e fricativas francesas, guturais germnicas, e assim por diante (Osgood, 1953). Esses sons so emitidos indepen dentemente de estmulos eliciadores e devem ser distinguidos do choro real de um beb. Durante os primeiros meses de vida, um beb exibe um nvel operante muito alto de produo de sons. Ele pode ficar horas produzindo sons de gargarejo estalos com a lngua, sibilos, gritos e roncos. O termo tcnico balbucio empregado para denotar a emisso espontnea desses comportamentos. Um progresso importante no balbucio ocorre por volta de seis meses, quando a estrutura seqencial do balbucio alterado de modo que a criana tende a repetir sua prpria produo vocal (gu-gu, d-d, l-l, etc). As mudanas que ocorrem do balbucio fala so complexas e um nico grfico no
-9 0 -

suficiente para descrever completamente o progresso. Todavia, uma mudana impor tante que ocorre a mudana na freqncia relativa dos diferentes sons pronunciados, medida que o beb cresce. Assim, na Frana, os fonemas envolvidos no r francs e as vogais nasais so fortalecidos pela comunidade que refora os pais da criana, seus companheiros de brinquedos e, eventualmente, seus professores. Em pases de lngua inglesa, um grupo diferente de fonemas modelado em palavras por uma comunidade reforadora diferente. O resultado desse fortalecimento pode ser inferido de um grupo de histogramas semelhantes aos da Fig. 4.3, porm mais complicados. Na Fig. 4.6, so vistos os histogramas das freqncias relativas de 12 fonemas voclicos (veja o Apndice A neste captulo, para sua explicao) para crianas de vrias idades e adultos. Podemos inferir que o reforamento desses sons ajusta a sua freqncia quela da comunidade adulta.
recm-nacido _ -23-24 meses

< L > O ,

cu < 60 c tf C o
5-6 meses A d ulto----

i IeAeoDoUu

JZ t
i I e C s A e o o o U u

Figura 4.6 - Perfis da freqncia de fonemas vogais, mostrando a mudana gradual da freqncia relativa em direo a um padro tpico do adulto na comunidade refor adora das crianas (Irwin, 1952).

Uma prova mais direta dos efeitos de se reforar sons produzidos pela criana surge de experimentos de laboratrio. Num experimento, o comportamento de bebs de 3 meses de idade foi observado enquanto eles permaneciam em seus beros. Durante duas sesses de observao, um experimentador adulto recurvava-se sobre o bero a uma distncia um pouco maior do que 30 cm da criana e permanecia relativamente sem movimento e sem expresso. Durante esse perodo, um segundo observador registrava a freqncia de sons produzidos pela criana. Em duas sesses subseqentes, o procedi mento foi o nesmo, exceto que o primeiro experimentador seguia cada som que no fosse choro com um^sorriso, trs sons utsk e um leve toque aplicado no abdomen da criana com os dedos da mo. (Rheingold, Gewirtz e Ross, 1959, p. 28). Isto, natural mente, apenas: R(balbucio) > ^(sorrisos, sons, tocar o^abdomen)

O efeito do procedimento foi um aumento da freqncia do balbucio bem acima da sua taxa ao nvel operante durante essas sesses de fortalecimento. O experimento demonstra a natureza operante dos sons humanos. Muitos' outros animais emitem sons, alguns dos quais so reforveis e outros no. Um chimpanz foi criado, desde o nascimento, com uma famlia que tentou ensin-lo a falar. (Hayes, 1951). A tarefa foi difcil, porque o macaco, primeira vista, no emitia som operante algum. Os nicos sons que produzia eram gritos reflexos quando alimento ou outros eliciadores
- 91 -

apareciam, e sons CR aos estmulos que haviam sido previamente emparelhados com esses eliciadores. Mrs. Hayes tentou seguir o seguinte procedimento
o p PI _ j_

1 (viso do alimento)

(g ri to excitado)

S (alimento)

[4.1]

na esperana de fortalecer a CR (gritar), reforando-a. 0 procedimento foi seguido por muitos meses mais no foi efetivo, mostrando que o comportamento respondente con dicionado no est sob o controle de suas conseqncias. Eventualmente, um som ahhh emitido apareceu, espontaneamente, num dia e mostrou-se ser reforvel. O macaco aprendeu, eventualmente, a dizer Mam^ Papa e Cup atravs de procedimentos que discutiremos num captulo posterior. interessante especular sobre a importncia da histria de f4.ll para a produo eventual do operante ahhha. Foi 4.1) um precursor necessrio para esse operante, ou com a mera passagem do tempo poderia o macaco t-lo desenvolvido, de qualquer modo, na ausncia de [4.1]? Uma das dificuldades principais para o desenvolvimento da fala (como a conhecemos) no macaco a ausncia de balbucio. Enquanto um beb balbucia para si mesmo por horas sem fim, num estgio comparvel de desenvolvimento, o beb chimpanz permanece quieto. Em geral, por vrios dias, o chimpanz no pro nuncia um nico som. Logicamente, um nvel operante maior que zero um requisito para fortalecimento, pois alguma coisa deve existir para se reforar. Em experimentos com outros animais, verificou-se que o ladrar de ces, o miar de gatos e alguns dos sons das aves so reforveis. Nestes casos, a freqncia da produo de sons pode ser aumentada marcadamente, atravs de suas conseqncias especiais. 4.10 - A EXTENSO DO FORTALECIMENTO OPERANTE O fortalecimento operante um fenmeno que, de algum modo, limitado aos comportamentos simples de animais e crianas que discutimos at agora. Estudamos o animal porque podemos controlar rigorosamente seu ambiente passado e presente. Mas o comportamento operante isto , o comportamento que pode ser fortalecido por suas conseqncias constitui uma grande proporo das atividades cotidianas dos homens Quando chutamos uma bola de futebol, cozinhamos uma galinha, discutimos a ltima moda, lamentamos o tempo e lavamos os pratos, estamos constantemente emitindo muitos operantes. Com efeito, estamos emitindo algum operante em cada momento de nossa vida. Na verdade, nossos operantes so freqentemente arranjados em seqncias mais complicadas do que a simples cadeia repetitiva do rato na seo 4.2 *Mas como veremos em captulos posteriores, uma complexidade surpreendente pode ser tambm gerada ao nvel do rato, gato, pombo e macaco. No difcil demonstrar o fortalecimento operante em seres humanos. Dadas as condies do paradigma do fortalecimento operante, podemos realizar demonstraes em nossos amigos sem grandes dificuldades. A principal considerao adicional que acharemos a demonstrao mais drstica e convincente se impedirmos nosso sujeito humano de tornar cnscio de que estamos realizando um experimento de fortaleci mento. O tornar-se cnscio uma maneira dedizer que o sujeito capaz de verbalizar o procedimento que est sendo efetuado. Este estar cnscio verbal um ndice seguro de que o comportamento que estamos tentando fortalecer estar agora sob o controle poderoso de anos de histria passada, com o qual a aplicao de um paradigma de
- 92 -

fortalecimento de, digamos, 30 min. com um reforador fraco ter pouca possibilidade de competir. Num delineamento experimental interessante, baseado nos trabalhos iniciais de W. Verplanck (1955) um assistente de pesquisa de graduao foi usado como um ( ator** para tentar fortalecer certo comportamento de conversa em alunos de graduao (Centers, 1963). O assistente e o sujeito eram colocados numa sala, ambos esperando ostensivamente serem chamados para um experimento de psicologia. Na verdade, este era o experimento. Durante esse tempo, o assistente estabelecia uma conversa com o sujeito que de nada suspeitava e, em vrios perodos, reforava diversos tipos de contedo de conversa, tais como demonstrao de opinio, fornecimento de informao e perguntas, com concordncia -e ateno especial. Enquanto isso, sem conhecimento do sujeito, a conversa estava sendo gravada e observada atravs de um espelho unidirecional. A conversa experimental durava 30 min. sendo dividida em trs perodos de 10 min. Durante o primeiro perodo, ou nvel operante, o assistente procurava no demons trar concordncia ou fornecer respostas informativas s opinies e perguntas do sujeito. Durante os 10 minutos seguintes, o perodo de fortalecimento comportamental o assis tente concordava com, ou parafraseava favoravelmente, todas as demonstraes de opinio emitidas pelo sujeito. Alm disso, ele expressava ateno, simpatia, e compreen so para todas as informaes propostas e reforava todas as perguntas ou dando a informao solicitada ou concordando e aprovando, se era isto o que a pergunta indicava desejar. Durante os 10 min. finais, o assistente ou discordava das opinies do sujeito ou permanecia silencioso depois que elas eram verbalizadas. Ele ignorava as informaes fornecidas e era o mais alheio possvel s questes. Os resultados do reforamento de concordar (fortalecimento) indicaram claramente que a freqncia de demonstrao de opinio e fornecimento de informao, em relao a todas as proposies, aumentou. Alm disso, nenhum sujeito notou este condiciona mento de seu comportamento. Por razes desconhecidas aos experimentadores, o fazer perguntas no mostrou qualquer fortalecimento e assim, de acordo com a nossa defi nio, ele no constitui uma classe operante. Num nvel diferente de desenvolvimento, Brackbill (1958) fortaleceu com sucesso uma resposta de sorrir em bebs de 4 meses de idade, utilizando o contato fsico como reforamento. O prprio cientista est empenhado num empreendimento que exige, frequente mente, a emisso de muitos operantes, poucos dos quais so reforados. Comporta mentos que levam proposio de novas relaes, ou de uma nova ordem entre os conceitos, uma descoberta de um novo fenmeno e assim por diante, so reforados pela comunidade cientfica. Entre os reforadores proeminentes para os behavioristas, est a ordem observada quando se v que algum comportamento de um indivduo est regular mente relacionado s suas conseqncias, como no caso da presso a barra pelo rato da seo 4.2. Essa lembrana de que o prprio pesquisador um organismo que se com porta, sujeito s leis do fortalecimento operante, caracteriza o desenho visto na Fig. 4.7. A verificao das leis do fortalecimento operante no comportamento humano importante, porque isto mostra que apesar das diferenas aparentes muito grandes entre homem e animal existem certas similaridades funcionais. So essas similaridades que, em tima instncia, justificam o nosso estudo da psicologia atravs do comportamento de organismos inferiores. Afinal de contas, o Psiclogo est principalmente interessado no comportamento humano, o a mais exatamente dos comportamentos, que so cornparti93 -

Figura 4.7 - Rapaz, este cara est condicionado. Cada vez que eu pressiono a barra, ele joga uma pelota aqui dentro . (Adaptado com permisso de Jester Columbia College).

lhados por ambos, seres humanos e animais superiores. Frequentemente, utilizamos sujeitos animais em nosso trabalho experimental por razes pragmticas. Podemos con trolar mais facilmente o ambiente imediato e passado do animal. Podemos priv-lo de agentes tais como alimento e gua, de modo a utiliz-los mais tarde como reforadores poderosos. Finalmente, podemos observar continuamente o animal por perodos longos de confinamento. O uso de animais na pesquisa em psicologia segue uma tradio longa e respeitada na cincia, a de controlar e isolar condies relevantes, de modo a revelar a regularidade bsica na natureza. Talvez, a classe mais importante de variveis independentes em psico logia diga respeito histria passada do indivduo. Um sujeito humano chega at ns com uma histria passada longa, complicada e incompletamente conhecida. 0 fato de que mais ou menos uma hora de reforamento fraco de operantes apenas parcialmente especi ficados possa resultar numa modificao comportamental detectvel, como no experi mento de Centers (1963), deve ser tomado como um tributo natureza fundamental dos processos que isolamos a partir do estudo animal. 4.11 - SUPERSTIO Dizer que o reforamento contingente a uma resposta pode significar apenas que ele segue a resposta e no implica necessariamente numa ligao fsica direta entre a resposta e o reforador. O reforamento pode ser mediado pelo comportamento de um experimentador, ou por algum outro aparelho automtico. 0 efeito do reforamento no comportamento indiferente aos meios pelos quais a correlao temporal entre R e S+ efetuada. O poder automtico do reforamento em fortalecer o comportamento nos lembra que, do mesmo modo que o condicionamento Pavloviano, sempre que as condi es temporais para o procedimento de fortalecimento operante so alcanados (na selva, no lar, no laboratrio), provvel a ocorrncia de modificaes no comportamento. Quando nos lembramos de que o processo de fortalecimento quase sempre virtual mente instantneo, no nos surpreenderamos ao descobrir que o fortalecimento do comportamento pode ocorrer mesmo em situaes onde existe apenas uma coincidncia fortuita entre uma dada R e a ocorrncia do S+. No experimento realizado por Skinner (1948), um pombo faminto foi colocado numa caixa no diferente daquela vista na Fig.

- 94 -

4.1. No havia, no entanto, uma barra nesta caixa e o alimento consistia dc pequenas pores de gros misturados que poderiam ser fornecidos atravs do alimentador. Cada 15 segundos, o alimento era automaticamente apresentado ao pombo, no importando o que ele estivesse fazendo no momento. Sob essas condies, 6 entre 8 pombos rapida mente desenvolveram respostas caracteristicamente diferentes mas estereotipadas. Um pombo desenvolveu um movimento circular contrrio aos ponteiros do relgio, comple tando duas ou trs voltas entre os reframentos. Um segundo pombo repetidamente estendia sua cabea em direo a um dos cantos superiores da gaiola. Outro apresentou um movimento de balanar a cabea' no plano vertical. Os outros trs pombos desen volveram uma variedade de outros movimentos bizarros da cabea e do corpo, caractersticos. O processo de fortalecimento casual , em geral, aparente. Por acaso, o animal estava executando alguma resposta no momento em que o alimento era fornecido. Essa coinci dncia fortalece essa resposta e, assim, torna-a mais provvel de reaparecer novamente e ser reforada uma segunda vez. Uma vez iniciado, o processo se perpetua. Como Skinner salientou, pode-se dizer que o experimento demonstra um tipo de superstio. O animal comporta-se como se existisse uma relao causai entre seu compor tamento e a apresentao do alimento, embora tal relao no seja real. Existem muitas analogias no comportamento humano. Os rituais para mudar a sorte de algum com cartas so bons exemplos. Poucas conexes acidentais entre um ritual e as conseqncias favorveis so suficientes para estabelecer e manter o comporta mento, apesar dos muitos casos no reforados. Um outro exemplo o do jogador de boliche que lana a bola fora da pista, mas continua a se comportar como se estivesse controlando-a atravs da curvatura e torso de seu brao e ombro. Esses comporta mentos no tm, naturalmente, efeito real algum sobre a sorte de algum ou sobre a bola a meio caminho fora da pista, tal como, no presente caso, o alimento apareceria com a mesma freqncia se o pombo nada fizesse ou, estritamente falando, se ele fizesse outra coisa qualquer (Skinner, 1948, p. 171). 4.12 - CONDICIONAMENTO OPERANTE O fortalecimento operante um caso especial do que chamaremos mais tarde de um modo mais geral de condicionamento operante. O termo condicionamento algo infeliz neste contexto porque ele lembra a natureza eliciada do comportamento respon dente. Contudo, o fortalecimento operante e o condicionamento Pavloviano tm certas similaridades importantes. Em particular, as modificaes do comportamento observadas em ambos os paradigmas so condicionais a alguma histria passada anterior. Num caso, a histria um emparelhamento de um S ^co m um S2 - No outro, a histria de uma determinada R que ocorre imediatamente antes de um S+. essa natureza condicional das mudanas comportamentais que justifica o uso do termo condicionamento para ambos. Na medida em que as diferenas importantes entre os dois fenmenos sejam sempre lembradas, no h perigo algum em empregar o termo condicionamento , quali ficado que seu adjetivo apiopriado, Pavloviano ou operante. Todavia para evitar o perigo que advem de se negligenciar essas diferenas, limitamos geralmente o termo condiciona mento para o paradigma Pavloviano e utilizaremos outros termos (por exemplo, fortaleci mento) para nos referirmos s vrias modificaes operantes que estudaremos nos captu los que se seguem. A Tabela 4.3 apresenta algumas comparaes diretas entre os dois

tipos de modificaes comportamentais que so frequentemente chamadas de condicio namento. Tabela 4.3 COMPARAO ENTRE O CONDICIONAMENTO PAVLOVIANO E OPERANTE

CONDICIONAMENTO PAVLOVIANO Sr PARADIGMA OU PROCEDIMENTO CR est sob o controle de S\ (CR pode ter elemen tos em comum R 2 ) CR

CONDICIONAMENTO OPERANTE

R - S ^

NATUREZA DA

R emitida

A ____________
CR gradualmente evocada por S\ R aumenta em freqncia sua topografia reduzida e ela incorporada a um elo de comportamento.

PROCESSO

RESULTADO

Fortalecimento de uma R Formao de alguns com j existente no repertrio portamentos novos (CR) a comportamental. Sl Taxa de R, forma de R or dem seqencial relativa a outras Rs que ocorrem Em geral envolve msculos do esqueleto. Pedra fundamental para aquisio de atividades complexas de soluo de problemas.

Probabilidade da CR a S\ COMO MEDIDO magnitude da CR, latncia da CR. CORRELATOS FISIOLGICOS Em geral envolve msculos lisos e glndulas.

Envolvido na emoo. Pos IMPORTNCIA PA sivelmente, parte do subs RA A PSICOLOGIA trato motivacional.

-9 6 -

APNDICE A A tabela seguinte a chave para os fonemas apresentados na abscissa da Fig. 4-6.

SMBOLO

EXEMPLO o i na palavra fria o i na palavra fcil / o a n/ palavra mesa o da palavra f, seguido do a de rua intermedirio entre o de j e o em f primeiro a da palavra cama som aberto do na palavra f o a da palavra caro, um pouco mais demorado o o na palavra n como em vou o o da palavra porque como o u na palavra uva

1
e e
X

0
a c

0
V u

REFERNCIAS PARA O CAPITULO 4. Brackbill, Yvonne. Extinction of the smiling responses in infants as a function of the reinforcement schedule. Child Develpm., 1958, 29, 115-124. Centers, R. A laboratory adaptation of the conversational procedure for the conditioning of verbal operants. /. abnorm. soc. Psychol., 1963, 67, 334-339. Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. N T ew York: Appleton-Century-Crofts, 1957. Frick, F. C., and Miller, G. A. A statistical description of operant condi tioning Am er. /. Psychol.. 195 1, 64, 20-36. Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New York: Rine hart, 1946.
-9 7 -

Hayes, C. The ope in ourM ause ifevv Y ork H arper and Row, 1951. Irwin, O. C. Infant spcech: development of vowel sounds. / . speech hearing Disorders, 1952, 1 7 ,2 6 9 -2 7 9 . Mednick, S. A. Learning. Englewood ClifTs: Prentice-Hall, 1964. Millenson, J. R., and Hurwitz, H. M. B. Some tem poral and sequential properties of behavior during conditioning and extinction. /. ex p . Anal. Behav., 1 9 6 1 ,4 ,9 7 -1 0 5 . Osgood, C. E. M ethod and theory in experimental psychology. New York: Oxford Univcr. Press, 1953. Rhcingold, II. L., Gewirtz, J. L., and Ross, H. W. Social conditioning of vocalizations in the infant. /. comp, physiol. Psychol., 1959, 52, 68 -7 3 . Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938. Skinner, B. F. Superstition in the pigeon. / . exp. Psychol ., 1948, 38, 168-172. Skinner, B. F. Walden two. New York: Appleton-Century-Crofts, 1948. Skinner, B. F. A case history in scientific method. A m e r . Psychologist , 1 9 5 6 ,1 1 ,2 2 1 -2 3 3 . Skinner, B. F. The experimental analysis of behavior. Am er. 5c/., 1957, 45, 343-371. Skinner, B. F. Cumulative Record. New Y ork: Appleton-Century-Crofts, 1959. Spencer, H. The principles of psychology . New Y ork: D. Appleton, 18/78. Verplanck, W. S. The cntrol of the content of conversation. / . abnorm. soc . Psychol ., 1955, 51, 668-676.

-9 8 -

Captulo 5 - EXTINO E RECONDICIONAMENTO DO OPERANTE

Quando a conexo entre uma resposta operante e seu reforador abruptamente desfeita, o resultado um processo comportamental caracterstico. As caractersticas deste processo, que chamado extino, representam uma parte importante na instalao e manuteno de padres comportamentais complexos, sendo por isso examinadas com alguns detalhes neste captulo. Historicamen te, o conceito de extino tem tido uma evoluo vagarosa e difcil. O enfraquecimento caracterstico do comportamento (isto , o declnio em sua freqncia) visto sob o procedimento de extino foi considerado pelos primeiros pesquisadores como um mero artefato do fortalecimento concorrente de outros comportamentos competitivos . A suposio de que a extino no poderia ser explicada em termos de uma operao de fortalecimento concomitante em qualquer outra parte na corrente de comportamento veio somente com a descoberta de que a extino acarreta mais do que o enfraquecimento (diminuio na freqncia) de uma nica classe de resposta. Quando se permite que um operante, previamente reforado, ocorra sem a conse qncia usual de reforamento, numerosas respostas no reforadas ocorrem. Essas respostas so, no incio, emitidas com uma alta freqncia, maior mesmo do que quando elas estavam sendo reforadas. Esse aumento imediato na taxa de resposta est correlacio nado com mudanas na topografia e magnitude do comportamento que o implicam como emocional. Um rato, treinado anteriormente a pressionar uma barra por alimento, atacar vigorosamente e morder a barra quando o reforamento for omitido. O rato, tal como um homem incapaz de achar suas chaves no bolso, onde ele, usualmente,as encontrava, mostra efeitos que podem ser designados como raiva. Alm dessas mudanas compor tamentais na taxa e topografia, o elo de comportamento, anteriormente bem estabeleci do, degenera-se, voltando aos padres de atividades vistos antes do fortalecimento. Ao mesmo tempo, medida que a extino continua, os comportamentos previamente suprimidos pelo fortalecimento da resposta selecionada comeam a retornar sua proeminncia antiga no repertrio de resposta do animal. Muitas dessas mudanas ocorrem gradualmente, estendendo-se por um perodo de muitas horas. De fato, o processo de extino to demorado, mesmo seguindo uns poucos reforamentos, que seguro dizer que provavelmente nenhum estudo delineou o processo em todos os seus aspectos, at seu ponto final.

-9 9 -

5.1

MUDANAS NA TAXA DE RESPOSTA DURANTE A EXTINO

O declnio na taxa de uma resposta anteriormente reforada o efeito mais claio da extino. As mudanas na taxa so claramente vistas numa curva cumulativa, onde elas nparecem como flutuaes ondulatrias superpostas numa acelerao negativa geral. A Fig. 5-1, ilustra a curva de extino a resposta de presso barra de um rato, anteriormente acostumado a receber uma pelota de alimento para cada presso a barra. A taxa de resposta mais alta no incio (imediatamente aps a retirada do reforamento) e diminui gradualmente durante o perodo de uma hora e meia. Ao fim de 90 min. o rato est respondendo numa taxa apenas ligeiramente maior do que a do seu nvel operante. omo a Fig. 5-1 mostra, a curva de extino muito irregular e contm muitos perodos l alta atividade intercalados com perodos de pouca atividade (as pores planas da curva). Esses ltimos tornam-se mais proeminentes prximo ao fim da extino. Alguns

Figura 5-1. Uma curva de extino para uma resposta de presso a barra anteriormente reforada (De Skinner, 1938 dados de 7. S. Keller e A. Kerr).

p v.iisadores supuseram que o processo de extino devido principalmente a um aumento gradual no nmero desses perodos inativos no decorrer do tempo e que> qua ido o organismo responde, ele o faz na sua taxa alta usual. Hurwitz (1 9 5 7 ) apresen tou dados sugestivos que suportam essa noo. Ele analisou um nmero de curvas simila res as da Fig. 5-1, dividindo-as em intervalos sucessivos de tempo de 2 min. Dividiu, ento, os intervalos em duas classes, dependendo de quantas respostas eles continham. Aqueles que continham zero ou somente uma resposta, ele chamou de silenciosos . aqueles que continham duas ou mais, ele chamou de "ativos". Hurwitz descobriu que o nmero de respostas nos perodos kativos no declinava a medida que a extino progredia, mas que mais e mais intervalos tornavam-se "silenciosos". Seus resultados para trupo de animais esto resumidos na Fig. 5-2.

10

20

30

40

50

60

Intervalos sucessivos de 2 min. (A)

Intervalos sucessivos de 2 min. (B)

Figura 5-2. Anlise do responder durnnte a extino. (Segundo Hurwitz, 1957).

/ 5.2 - MUDANAS T0P0GJRAFICAS E ESTRUTURAIS NA EXTINO Os efeitos da extino no se limitam a mudanas na freqncia de uma determinada resposta. Ocorrem, em particular, mudanas marcantes na form a do comportamento durante a extino. Num estudo de Antonitis (1951), onde foi estudado o operante do rato de introduzir o focinho por entre uma fenda de uma das paredes, mediu-se os efeitos de vrias sesses de extino intercaladas com fortalecimento. Uma parede da gaiola utilizada por Antonitis continha uma fenda horizontal de 50 cm de comprimento. Sempre que o rato introduzia o focinho dentro da fenda, um raio de luz era interrompido, sendo tirada uma fotografia do rato no momento exato em que a resposta era dada. Media-se a posio em que o rato estava ao longo da fenda, naquele momento, e o ngulo que seu crpo formava com uma linha perpendicular fenda. A Fig. 5-3 ilustra o aparelho.

Figura 5-3. Representao pictorial da resposta estudada por Antonitis (195 1 ).

- 101 -

Reforando, com aliipento, a colocao do focinho na fenda, a freqncia desse comportamento foi primeiro aumentada acima do nvel operante. Subsequentemente, o colocar o nariz na fenda foi extinguido, refortalecido, reextinguido e refortalecido nova mente. Confirmando os resultados de Guthrie e Horton (1946) com a resposta de inclinai uma vara em gatos e ces, Antonitis notou que o ngulo e a posio da resposta tendiam a se tornar estereotipados durante o fortalecimento: o animal limitava suas respostas a uma regio restrita da fenda. A extino, entretanto, produziu uma variabilidade no comportamento de colocar o focinho na fenda pelo menos to grande quanto a que foi observada durante o nvel operante: o animal variou suas respostas sobre o comprimento inteiro da fenda. Finalmente, o refortalecimento resultou em maior estereotipia (respos tas mais restritas) do que o fortalecimento original havia produzido. Resultados similares foram obtidos por Notterman (1959), que estudou a fora com que um rato pressionava a barra durante o nvel operante, fortalecimento e extino. Uma descoberta adicional emergiu dos dados de Notterman. Os registros individuais revelaram foras ocasionais, emitidas durante a extino, que excediam qualquer obser vao anterior, tanto no nvel operante como no fortalecimento. Retornaremos a essa descoberta mais tarde, nas discusses de diferenciao e habilidades. O elo ou cadeia de comportamento estabelecida pelo reforamento degenera-se quando se retira o reforamento para os operantes. Frick e Miller (1951) forneceram a ratos 300 reforamentos espaados durante 5 sesses pelo pressionar uma barra, no aparelho mostrado na Fig. 5-4. (Note que a bandeja de alimento, neste aparelho, est um pouco mais distante da barra do que na caixa-prottipo usada por Skinner, j descrita). Aps o 300^ reforamento, obteve-se um registro de 24 horas de extino para cada rato. Durante a extino, Miller e Frick observaram a degenerao da cadeia... Rp Ra Rp Ra . . . fortalecida. medida que a extino progredia, comeavam a suceder-se presses barra (Rp Rp, etc.) e idas bandeja (Ra Ra etc.). Houve pouca tendncia para o padro se tornar aleatrio durante a extino. Ao contrrio, o padro fortalecido de Rp Ra Rp Ra . . . gradualmente, deu lugar ao padro do nvel operante, o de ocorrncias repetidas da mesma resposta. Talvez deva ser enfatizado que este resultado no foi, de modo algum, forado logicamente. O elo de comportamento poderia ter simplesmente dimi nudo em freqncia durante a extino, embora permanecendo intacto. Em resumo, o efeito do procedimento de extino induzir um processo gradual de comportamento cujas mudanas incluem diminuio na freqncia da resposta, aumento na variabilidade da forma e intensidade da resposta e quebra estrutural da seqncia do comportamento. Estas so todas propriedades importantes da extino e sero mencionadas frequentemente, daqui por diante, como mecanismos explicativos. 5.3 RESISTNCIA EXTINO

Se se peimitisse que o processo de extino se completasse, os estados de nvel operante poderiam eventualmente ser alcanados. O tempo para que isso*ocorra aparen temente um ndice da persistncia do indivduo em face extino. Em experimentos reais, uma volta ao nvel operante raramente, se alguma vez alcanada. Consequentemente, medidas mais convenientes e prticas da persistncia ecto baseadas na rapidez com que a taxa de resposta diminui durante a extino. Por exemplo, o nmero de respostas emitidas ou a quantidade de tempo at o ponto em que algum critrio de taxa baixa alcanado, so chamados medidas de resistncia extino.
- 102 -

Foto clula

Figura 5-4. Aparelho usado pra estudar as mudanas na seqncia do comportamento durante o fortalecimento e extino (Frick e Miller, 1951).

A maneira pela qual os valores reais dessas medidas so obtidos ilustrada na Fig 5-5, onde a curva de extino da Fig. 5-1 reaparece.

Figura 5-5. Uma curva de extino da presso barra aps o fortalecimento. No ponto a nenhuma resposta havia sido emitida por cinco minutos consecutivos (segundo Skinner, 1938, dados de F.S. Keiler e A. Kerr).

Suponha que adotemos o critrio arbitrrio de qu, se em qualquer momento durante a extino, mais de 5 min decorram sem uma ocorrncia da resposta selecionada, a extin o deve ser considerada completa para todos os objetivos prticos e devemos, ento, terminar nosso experimento. Examinando, ento a Fig. 5-5, nosso experimento terminar em a. Neste ponto, nenhuma resposta ocorreu por 5 min, 130 respostas foram emitidas e 32 min se passaram. Qualquer um desses dois ltimos valores, juntamente com a especifi-

cao do critrio de taxa baixa (nenhuma resposta durante 5min), serve como um ndice da resistncia extino. Um critrio diferente pode afetar o resultado da resistncia a extino. Na Fig. 5-5, por exemplo, um critrio de 5 minutos sem resposta teria sido bastante frouxo, j que muito mais respostas, bem acima da taxa no nvel operante, ainda seriam emitidas. Por outro lado, se tivssemos escolhido 10 minutos sem resposta, os 90 minutos do experi mento de Keller e Kerr no seriam suficientes para alcanar o nosso critrio, uma vez que nenhuma pausa de tal durao ocorreu. A fim de evitar a natureza arbitrria de um critrio de extino, muitos pesquisadores prosseguem com o procedimento de extino at que a inclinao geral da curva indique que a funo est prxima de sua assntota. Ento, o nmero de respostas emitidas em qualquer tempo arbitrariamente conveniente, da em diante, pode facilmente ser lido no registro cumulativo como a resistncia extino. Esse procedimento ilustrado no ponto b da Fig. 5-5 onde, em 1 hora, a resistncia extino definida como 190 respostas. A resistncia extino fornece um ndice comportamental quantitativo cuja relao com um nmero de operaes experimentais de interesse. Oportunamente, referirnos-emos a estudos em que a resistncia extino a principal varivel dependente comportamental. Na vida real, estamos frequentemente interessados em saber o quo persistente ser uma pessoa face a nenhuma recompensa. Diz-se que um homem, cuja resistncia extino baixa, "desiste muito f acilmente ou "no tem perseverana' diante de uma tarefa difcil. Por outro lado, muita resistncia extino algumas vezes indesejvel. O homem que passa muito tempo, improdutivamente, tentando restabelecer uma relao amorosa interrompida, pode perder uma boa chance de uma relao nova e melhor. Uma das variveis que inicialmente se suspeitava afetar a resistncia extino era a quantidade de fortalecimento anterior. Parecia plausvel que, se muitos reforamentos fortalecedores fossem dados, a resistncia extino poderia ser maior do que se apenas poucos fossem fornecidos. Essa hiptese geral foi confirmada por vrios experimentos (Williams, 1938; Perin, 1942 ; Hearst, 1961) que indicaram que a resistncia extino de um operante baixa quando apenas alguns reforamentos so dados no fortaleci mento, aumentando, gradativamente at alcanar um mximo depois de 50 e 80 reforamentos. Outra varivel que provavelmente afetaria a persistncia de uma resposta extino seria o esforo despendido na resposta Mowrer e Jones (4943) levantaram a hiptese de que as respostas que exigem grande esforo so mais rapidamente extinguidas do que as que requerem menos esforo. Esta previso foi confirmada num estudo realizado por Capehart, Viney e Hulicka (1958) que treinaram ratos a pressionar uma barra para obter alimento. Eles variaram a fora necessria para pressionar a barra durante o fortaleci mento, de modo que, em algumas sesses, uma barra pesada era apresentada e, em outras, uma leve ou uma intermediria Os animais foram, ento, divididos em trs grupos, um dos quais foi extinguido na barra pesada, outro na barra leve e o ltimo, na barra intermediria. Usando um critrio de nenhuma resposta em 5 minutos como ndice de resistncia extino, eles obtiveram a funo vista na Fig. 5-6. O delineamento desse experimento bem diferente daqueles que consideramos at aqui. Nas representaes grficas dos efeitos comportamentais neste e em captulos anteriores, apresentamos dados obtidos com um s sujeito. Algumas vezes, a re presentao grfica consistiu de mdias de vrios sujeitos mas, em todos os casos, cada
- 104-

Peso da barra (gramas)

sujeito foi submetido a um procedimento idntico e completo. Por completo,queremos dizer que o comportamento dq sujeito foi medido em cada valor empregado para a varivel independente. Ouso dei vrios sujeitos e a mdia dos resultados apenas uma tentativa de eliminar erros aleatrios de medidas, que perturbam todo experimento.Em certos estudos comportamentais, contudo, impossvel sujeitar o mesmo indivduo a mais do que um valor da varivel independente sem introduzir novas variveis pertur badoras. Este geralmente o caso quando a resistncia extino a varivel dependen te. Para medir os valores da resistncia extino para cada um dos vrios valores de nossa varivel independente, teramos que obter vrias curvas de extino do organismo. Mas, aps o fortalecimento original num valor determinado da varivel independente, existe apenas uma curva de extino. Para obter outra deveramos, ou fortalecer c comportamento ou usar outro sujeito. 0 primeiro caso justificado somente se ascurvas sucessivas de extino depois do fortalecimento e refortalecimentos repetidos fererridnticas. Acontece, contudo (ver seo 5.6) que elas no o so. Na verdade, elas so sistematicamente diferentes. Ento, no temos outro recurso para adotar seno o de usar um sujeito diferente ou grupo de sujeitos para cada condio experimental. Consequentemente, Capehart, Viney e Hulicka extinguiram a resposta de um rate numa barra de 5 gramas, outro numa de 40 gramas e um terceiro numa de 70 gramas. Deste modo, eles evitaram o problema de como obter curvas de extino inicial para o mesmo rato em todos os trs pesos da barra. Mas, ao fazerem isso, eles introduziram uma nova fonte de erro de medida: as diferenas individuais entre os sujeitos devido a outros fatores como diferenas genticas ou diferenas no controladas na histria pas sada. Para fazer uma mdia dessas diferenas individuais entre os sujeitos, mdia esta que poderia obscurecer qualquer efeito que o esforo da resposta pudesse ter, os pesquisado res replicaram essencialmente o experimento 9 vezes mais e fizeram uma mdia de seus resultados, usando, ao todo, um total de 27 sujeitos (9 ratos para cada uma das trs condies diferentes). Embora a suavidade da sua funo que relaciona a resistncia extino ao peso da barra ateste o sucesso de sua estratgia, seus resultados (e todos os resultados simillares) devem ser interpretados com cautela. Em seu experimento, nenhum sujeito experimentou os trs valores da varivel independente na extino. Logo, a gene ralizao do resultado para qualquer organismo individual depende da suposio de que, se fosse possvel obter uma curva de extino inicial para os trs valores diferentes da varivel independente num nico indivduo, os resultados de tal procedimento correspon deriam aos resultados obtidos ao se sujeitar indivduos diferentes s diferentes condies experimentais. Em geral, procuramos evitar essa suposio sempre que possvel e recor
-105-

remos a tais funes de grupo (das quais a Fig. 5-6 um exemplo) somente quando, como neste caso, aparentemente no tivermos outra escdha. Sempre que tivermos uma escolha, prefervel realizar um experimento completo com um s sujeito, expondo-o a todas as condies em que estamos interessados. A confiabilidade de nossos resultados pode, ento, ser avaliada atravs de replicaes completas de nosso experimento com sujeitos adicionais.
Exerccio: Sem consultar a literatura de psicologia, veja se voc pode delinear um experimento para testar o efeito do nmero de reforamentos durante o fortaleci mento na resistncia extino. Voc teve que usar um delineamento de grupo (como Capehart, Viney e Hulicka) ou foi capaz de usar um delineamento individual (como a funo de Anrep na Fig. 3-10).?

5.4 - RECUPERAO ESPONTNEA A extino pode ser prolongada at que a taxa de um operante anteriormente for talecido tenha alcanado um nvel baixo. Se o sujeito (por exemplo, um rato numa caixa de Skinner) , ento, retirado da situao e colocado de volta um pouco mais tarde, outra, curva de extino (menor) ser obtida (ver Fig. 5-7).

Figura 5-7. Recuperao espontnea da extino de uma resposta de presso barra de um rato. As pores da curva direita e esquerda da linha vertical foram separadas por 47 horas durante as quais o organismo esteve fora da situao (Skinner, 1938).

Mesmo que nenhum fortalecimento tenha ocorrido entre as duas sesses de extino, ocorre uma certa quantidade de aumento espontneo na fora da resposta. A quantidade de recuperao espontnea (quando medida pela resistncia extino da segunda curva de extino) depende, at certo ponto, do intervalo de tempo entre o fim da primeira extino e o incio da segunda. Os efeitos da recuperao espontnea podem ser vistos num intervalo to pequeno quanto 15 min entre as duas sesses de extino, na situao de pressionar a barra. O efeito aumenta at cerca de 2 horas de intervalo, depois do que nenhum aumento adicional na recuperao espontnea ocorre. Os fenmenos da recuperao espontnea tm sido assunto para muitas especulaes, mas seus pressupostos mecanismos esto alm da perspectiva de uma proposio intro dutria.

- 106 -

5.5

CONDICIONAMENTO E EXTINO SUCESSIVOS

Na seo 5.4, dissemos que a primeira extino aps o fortalecimento original um fenmeno nico. Extines posteriores (depois de refortalecimentos) diferem da primeira extino porque so mais rpidas e contm um total menor de respostas. O efeito documentado pelos dados de Bullock e Smith (1953). Eles expuseram ratos a 10 sesses dirias de um procedimento onde se reforava as 40 primeiras respostas barra, seguindo-se diretamente 1 hora de extino. Quando as curvas de extino foram exami nadas, notou-se que elas tornavam progressivamente menores da sesso 1 a 10 . O efeito visto na Fig. 5-8. Enquanto que, na sesso 1, a mdia da resistncia extino em 1 hora foi 50 respostas, na sesso 10 isto havia cado para 10 respostas apenas.

Figura 5-8. Curvas medias de respostas acumuladas durante 1 hora de extino Os nmeros direita de cada curva iden tificam a sesso (segundo Bullock e Smith, 1953). 5

10

10

20

30 Minutos

40

50

60

Esses resultados podem ser extrapolados para alm de dez sesses. Parece que apenas poucas sesses a mais seriam necessrias para que o animal alcanasse o que chamado extino numa tentativa. Na extino numa tentativa, apenas uma nica resposta emitida aps a retirada do reforamento. A mudana no comportamento torna-se abrupta e parece razovel concluir que o organismo passa a discriminar o procedimento de extino como tal. Poucas respostas em extino a regra, no nvel humano. Muitas de nossas prprias respostas mostram uma diminuio rpida, quando cessa o refora mento. No continuamos a inserir moedas numa mquina de cigarros ou de doces quebrada, quando no obtemos aquilo que pagamos. Ouando abrimos a caixa do correio e descobrimos que est vazia, no continuamos a abri-la. Como os ratos de Bullock e Smith, aprendemos a esperar pelo nosso reforamento. Resultados tais como os de Bullock e Smith no deixam dvidas de que os processosde extino sucessiva so diferentes. De fato, eles formam um subprocesso progressivo, medida que tendem a uma assntota de uma resposta por perodo de extino O que acontece, contudo, se cada perodo de extino prolongado at alcanar a taxa de nvel operante? Ser cada extino sucessiva ou pouco mais rpida, que a precedente? Pouca informao existe para responder questo com autoridade, mas dados no publicados coletados por J. L. Kerr e J. R. Mlenson (1957) mostraram que, quando a presso barra de um rato era extinta at ao ponto onde duas sesses consecutivas fossem iguais ou menores do que a taxa ao nvel operante, um efeito similar ao de Bullock e Smith era

- 107 -

jLinda obtido. A Fig. 5-9 mostra o resultado desse procedimento para um animal efetuado em quatio desses ciclos de condicionamento e extino.
50

*8 40 Figura 5-9. Resistncia extino num rato em funo de procedimentos sucessivos de condicionamento e extines com volta ao nvel operante (dados no publicados de Kerr e xMillenson 1957)

s
^

H > * 10 o

30 3 c g 8 20

ESQUECIMENTO E EXTINO Nmeros de ciclos de condicionamento-extino Devido ao fato de que o esquecimento e a extino esto ambos associados a um enfraquecimento do comportamento, eles so frequentemente confundidos. Na extino, o enfraquecimento est associado emisso de respostas no reforadas na situao previamente associada com reforamento. No esquecimento, o efeito do reforamento enfraquecido pela simples passagem do tempo, durante o qual o indivduo no est na situao previamente associada com o condicionamento. O esquecimento pode ser estudado, fortalecendo-se, em primeiro lugar, um operante e, ento, permitindo que se passe um tempo considervel e, finalmente,extinguindo esse operante. Quando isso feito nas condies controladas da caixa de Skinner, a curva de extino resultante muito semelhante aquelas obtidas logo aps o fortalecimento. A Fig. 5-10 mostra uma compara o entre duas curvas mdias de respostas acumuladas, uma obtida de um grupo de ratos extinguidos 1 dia depois do fortalecimento original e a outra obtida de ratos extinguidos 45 dias depois do fortalecimento original. Os 44 dias de diferena de tempo parecem ter tido apenas um efeito muito pequeno em comparao com o efeito do procedimento de extino real.

5.6

Figura 5-10. Curvas de extino obtidas 1 dia aps o fortalecimeno oiiginal e 45 dias aps o fortalecimento original (Skinner, 1938)

30

Minutos

60

108-

Existem' ainda resultados mais surpreendentes que apoiam a noo de que a mera passagem do tempo entre o condicionamento e a extino tem, espantosamente, pouco efeito. Um grupo de pombos foi treinado, no aparelho visto na Fig. 5-11, a bicar uma chave ou disco iluminado, obtendo alimento. Depois do fortalecimento da resposta de bicar a chave, os animais foram transferidos para o biotrio. Quatro anos mais tarde. retomaram ao aparelho e foram testados no procedimento de extino. Embora os pombos no tivessem visto o disco por mais de 1.400 dias, eles comearam a bic-lo, imediatamente e deram centenas de respostas em extino (Skinner, 1950). Existe uma vasta literatura sobre o esquecimento do comportamento verbal humano. Antes do incio do sculo vinte, Ebbinghaus memorizou listas das chamadas slabas sem

Figura 5-11. Aparelhagem usada para o estudo do comportamento operante de pombos.

sentido (Ver Fig. 5-12) e registrou a perceniagem de slabas das quais ele se lem brava em vrios perodos de tempo. O uso de slabas sem sentido ao invs de palavras foi uma tentativa de eliminar fatores de significado e familiaridade que poderiam influenciar os resultados, caso fossem usadas palavras comuns. Ebbinghaus observou (ver Fig. 5-13) que uma queda marcante na reteno ocorria durante as primeiras 8 horas depois de aprendidas as listas. Depois disso, o processo de esquecimento aproximava-se muito lentamente de uma assntota. Quase a mesma quantidade podia ser relembrada 31 dias ou 2 dias depois da aprendizagem.
- 109-

Figura 5-12. Uma lista de slabas sem sentido para o estudo da aprendizagem verbal e esquecimento.

BIK ZUR JEK ZOT YIN

NAX KIB VOD MEF BEW

Figura 5-13. Curva de esquecimento, de Ebbinghaus para slabas sem sentido (segundo Ebbinghaus, 1885, de Keller e Schoenfeld, 1950).

Slabas sem sentido so facilmente esquecidas. Outros materiais verbais no so to rapidamente perdidos. A Fig. 5-14 mostra curvas de esquecimento para trs tipos de materiais: poesia, prosa e slabas sem sentido. Porque as curvas de extino de animais mostram efeitos to pequenos depois de passado longo tempo, enquanto um homem pode esquecer mais da metade do que ele aprende em poucas horas? essa uma superioridade no esperada do rato e do pombo em relao ao homem? Talvez seja, mas encontramos uma explicao mais conveniente ao considerarmos a atividade que interve'm duranie a passagem do tempo nos dois tipos de experimentos. Nos experimentos com animais, o animal removido da situao ex perimental e tem pouca chance de emitir respostas que se assemelhem ao operante

Figura 5-14. Curvas de esquecimento mostrando a reteno para diferentes tipos de materiais (segundo Guilford, 1938 e Kendler, 1963).
-110-

fortalecido. No biotrio, os animais no experimentam quaisquer situaes muito seme lhantes s de sua caixa de treinamento. O homem, por outro lado. aps memorizar trechos de palavras - sejam palavras sem sentido, prosa ou poesia - no abruptamente removido de seu ambiente verbal. Ao contrrio, ele continua a usar palavras (aprendidas) e a experimentar situaes com um certo grau de similaridade com o ambiente onde a memorizaov /'riginal foi feita. Sempre que as situaes mudam radicalmente depois da aquisio, o esquecimento no to grande. As habilidades de datilografia so apenas um pouco afetadas depois de um ano ou mais sem se praticar. Longe da mquina de escrever, as chances de uma pessoa executar respostas similares datilografia so pequenas. Nadar e andar de bicicleta so duas ilustraes adicionais de habilidades que so retidas por ]ongos perodos sem prtica. Sempre que uma resposta especial fortalecida num novo ambiente, diferente de qualquer um encontrado na situao cotidiana, o esquecimento reduzido. Isto verda deiro tanto para o homem como para j animal. difcil transportar um homem, abrup tamente, de uma situao de aprendizagem para um outro ambiente completamente diferente. Jenkins e Dallenbach (1924) tentaram fazer isso. Seus sujeitos aprenderam uma lista de slabas sem sentido logo antes de dormir. Os sujeitos foram, ento, acorda dos em vrios intervalos aps a aprendizagem e solicitados a se recordarem da lista que

Horas dcsdc a aprendizagem

Figura 5-15. Curvas mostrando o nmero de slabas relembradas aps dormir ou ficar acordado (adaptado de Jenkins e Dallenbach, 1924)

haviam aprendido anteriormente. Os resultados (Fig. 5-15) foram comparados com aqueles obtidos de um grupo de sujeitos que no foram dormir aps terem aprendido a lista, mas continuaram com suas atividades cotidianas usuais. Aparentemente, o que feito durante a passsagem do tempo crtico na determinao de quanto esquecimento ocorre. Podemos convenientemente considerar que, no caso mais extremo de esqueci mento , ocorre extino normal e completa, isto , a resposta emitida repetidamente, mas sem reforamento, at que pare de ocorrer. Em outros casos reais, algum enfraqueci
- 111 -

mento ocorre devido similaridade de outros comportamentos com o comportamento aprendido e similaridade dos ambientes durante o fortalecimento e o esquecimento. 5.7 - UMA DEFINIO COMPREENSIVA DE EXTINO OPERANTE O procedimento de extino faz surgir o processo de extino. Como vimos o processo de extino consiste, em parte, de um declnio na taxa de resposta. Um nmero de outros processos comportamentais tais como fadiga, habituao e saciao envolve um declnio similar e devemos ser cuidadosos ao distingu- los. Se um declnio na taxa de resposta tudo o que observamos, provavelmente, encontraremos dificuldades para dizer qual processo est envolvido. Ao teorizar posteriormente, podemos atribuir um declnio na taxa de resposta extino de certas outras respostas, as quais no esto sendo medidas, mas apenas supostas. Esse um exemplo de como os conceitos bem conhecidos (por exemplo, extino) so usados como pedras fundamentais para erigir um edifcio explanatrio para um processo mais complexo e menos compreendido. Mas devemos estar atentos ao atribuir todos os declnios de taxa a uma presumvel extino. Quando possvel, recorra definio compreensiva de extino:
DADO: uma resposta ooerame pieviamente lortalecid. PROCEDIMENTO: i'etjra<ia do reloram em o para o operante.

Em notao simblica: R, ou R -fr PROCESSO: 1 - um declnio gradual, algo irregular, na taxa, marcado por aumentos progressivos na freqncia de perodos relativamente longos de noresposta. 2 _ um aumento na variabilidade da forma (topografia) e da magnitude da resposta. 3 um rompimento gradual no elo ordenado do comportamento for talecido. RESULTADO: os processos comportameniais aproximam-se dos estados do nvel operante como valores limitantes. 5.8 - A EXTENSO DOS CONCEITOS DE EXTINO A diminuio da fora da resposta vista na extino experimental no se limita a ratos e pombos de laboratrio. Isto demonstrado pela pesquisa original relatada por C. D. Williams, aqui reproduzida integralmente do Journal of Abnormal and Social Psychology. A ELIM INAO DO COMPORTAMENTO DE BIRRA ATRAVS DF PROCEDIMENTOS DE EXTINO. Carl D. Williams, University of Miami. Este trabalho relata o tratamento bem sucedido do comportamento de birra numa criana do sexo masculino, pela retirada do reforamento. O sujeito (S) tinha aproximadamente 2 1 meses de idade. Havia estado seriamente doente durante os - 112 -

primeiros 18 meses de vida. Sua sade melhorou, ento, consideravelmente e ele adquiriu peso e vigor. O S, agora exigia o cuidado e a ateno especiais que lhes haviam sido dados durante os meses crticos. Ele impunha alguns de seus desejos, especialmente na hora de dormir, atravs de um comportamento de birra para controlar as aes de seus pais. Os pais e uma tia revezavam-se para coloc-lo na cama noite e tarde, na hora da sesta. Se o pai (ou a me) deixava o quarto depois de colocar o S na cama, elo gritava a esperneava at que o pai (ou a me) voltasse ao quarto. Assim, no se podia deixar o quarto at que S dormisse. Se o pai (ou a me) comeava a ler enquanto estava no quarto, S gritava at que o material de leitura fosse posto parte. Os pais sentiam que S gostava deste controle sobre eles e que se esforava durante o tempo mais longo possvel para no dormir. Em qualquer ocasio, os pais estavam gastando de meia hora a duas horas, cada vez que colocavam a criana para dormir, esperando no quarto at que dormisse. ^ Aps um parecer mdico a respeito da condio fsica de S, foi decidido retirar o reforamento desse comportamento de birra. Consistente com o princpio de aprendizagem de que, em geral, o comportamento que no reforado ser extinto, um dos pais ou a tia colocava o S na cama d uma maneira agradvel e relaxada. Depois dos agrados caractersticos da hora de dormir, deixava-se o quarto e se fechava a porta. O S gritava e chorava, mas o pai (ou a me) no voltava ao quarto. A durao dos gritos e do choro era medida a partir do momento em que a porta era fechada. Os resultados so vistos na Fig. 5-16. Pode ser observado que S continuou gritando por 45 min na primeira vez em que foi colocado na cama, na primeira srie de extino.

55 50 45 40 35 30 25

1
O

.S _ 20 O "O

5 1 2 3 4 5 6 7 8 9 !0

Vezes 'm que a criana foi colocada para dormir Figura 5-16. Durao d< . oro em duas se'rires de extino em funo d; ocasies sucessivas de ser colocado na c.-una (Williams. 1
- 113

O S no chorou a segunda vez que oi posto na cama. Isso talvez seja atribuvel sua fadiga de chorar na ocasio 1. Pela dcima sesso, o S no mais choramingava, esperneava ou chorava quando os pais deixavam o quarto. Em vez disso, ele sorria quando eles saiam. Os pais notaram que ele emitia sons alegres at cair no sono. Cerca de uma semana mais tarde, o S gritou e esperneou aps a tia t-lo colocado na jama, provavelmente refletindo uma recuperao espontnea do comportamento de birra. A tia reforou, ento, o comportamento de birra, voltando ao quarto do S e l permanecendo at que ele dormisse. Foi, ento, necessrio extinguir o comportamento uma segunda vez. A Fig. 5-16 mostra que a segunda curva de extino semelhante a primeira. Ambas as curvas so similares s curvas de extino obtidas com sujeitos subhumanos. A segunda srie de extino atingiu o zero na nona ocasio. Nenhuma birra posterior, na hora de dormir, foi relatada durante os dois anos seguintes. Deve ser enfatizado que o tratamento, neste caso, no envolveu punio. Tudo o que se fez foi suspender o reforamento. Ocorreu, ento, extino do comportamento de birra. Nenhum ps-eeito ou efeito colateral indesejvel desse tratamento foi observado. Aos trs anos e 9 meses de idade, S parecia ser uma criana cordial, expressivae esperta. O uso do procedimento de extino geral, ento, para enfraquecer a fora de qualquer operante. Em captulos posteriores, veremos outras numerosas maneiras de manipular a fora do comportamento. Mas apenas com a aplicao simples de duas operaes principais reforamento e extino podemos variar amplamente a fora do comportamento. A fora do comportamento um conceito importante na psicologia devido a sua relao estrita com a probabilidade de ocorrncia do comportamento. Quando uma resposta existe com alta tora, sua freqncia alta e a probabilidade de que seja emitida em qualquer tempo determinado tambm alta. Estas so, simplesmente, maneiras diferentes de dizer a mesma coisa. Essa afirmao verdadeira para homens e animais. A anlise do comportamento operante , de modo geral, o estudo da forma e, mais particularmente, da probabilidade de ocorrncias de tais comportamentos. Se admi timos que os conceitos do reflexo possam explicar os mecanismos simples da execuo de comportamentos tais como postura, caminhar e correr, ento o territrio que resta para a explorao psicolgica parecer ser o inicio dos operantes. Logo, nosso interesse cen traliza-se em situaes que proporcionem uma escolha de comportamentos. Mesmo na simples caixa de Skinner, onde frequentemente uma nica resposta medida, a escolha est presente na liberdade aparente do animal de responder ou no responder. Em geral, nossa preocupao com as causas do comportamento ou, em termos mais tc nicos, com os controles sobre a emisso de respostas. Embora uma seqncia de compor tamento possa estar integrada, de um modo reflexo, do inicio at o fim podemos ainda estar interessados em saber porque ela comeou. Embora todo este livro consista numa srie de respostas propostas a esta questo, j podemos perceber que as operaes de condicionamento e extino fornecem dois princpios explanatrios poderosos. Uma resposta pode no ocorrer, por exemplo, porque foi extinta. Um aspirante a escritor que tenha enviado vrios originais aos editores, tendo-os todos rejeitados, pode dizer que no consegue escrever nem mais uma palavra'. Ele pode estar parcialmente paralisado com o que chamado cimbra de escritor. Ele pode ainda insistir que deseja escrever e podemos concordar parafraseando-o: sua
- 114 -

probabilidade extremamente baixa de resposta devida principalmente extino. Outras variveis continuam efetivas e, se a extino no houvesse ocorrido, elas produziriam uma alta probabilidade (Skinner, 1953, pp. 71-72). A noo de freqncia ou fora de resposta fundamental para a Psicologia, prin cipalmente porque muitos comportamentos parecem ser explicveis em termos da fre qncia com que as unidades de comportamento ocorrem. Dizemos que algum um entusiasta do bridge quando observamos que ele joga e fala frequentemente sobre bridge. Estar bastante interessado' em msica tocar, ouvir e falar muito sobre msica. O jogador inveterado aquele que joga frequentemente. O f da fotografia est sempre tirando fotografias revelando-as e olhando as fotos feitas por

Figura 5-17. O poder da extino. (Desenhado por Opie, 1961, The New Yorker Magazine, Inc.).
-11 5-

ele e por outros. O erotomaiuaco' frequentemente se ocupa com comportamento sexual O dipsomanaco bebe frequentemente" (Skinner, 1953 p. 62) Embora nossa anlise sobre c Mino esteja muito longe de ser completa neste captulo, ela ilustra alguns dos principais efeitos conhecidos da retirada do reforamento na fora do comportamento. 5.9 - REPRESENTAES GRFICAS DOS RESULTADOS DE EXPERIMENTOS NOS QUAIS MUITAS VARIVEIS INDEPENDENTES SO ESTUDADAS EM CONJUNTO. Neste texto, o principal dispositivo para representar os resultados de experimentos o grfico bi-dimensional. Nos casos mais simples, tal grfico construdo de uma tabela que contm pares de valores de x e y (ver Tabelas 2-2 e 3-1). Nas tabelas, cada valor da varivel independente forma um par com um nico valor da varivel dependente (em geral, uma mdia de muitos valores observados). Num grfico simples tal como o da Fig. 5.6, trs valores da varivel independente (peso da barra) formam um par com as respec tivas mdias observadas da varivel dependente - resistncia extino e so indicados como pontos. Ento, traam-se linhas retas conectando (isto , interpolando-as entre) os pontos. A curva resultante permite-nos ver os resultados num quadro nico, relacio nando, assim, os dados de um modo que a tabela no faz. Os registros cumulativos so mais sofisticados. Na Fig. 5-1, a varivel independente (tempo) contnua e a interpolao desnecessria j que o registrador cumulativo marca a ocorrncia ou no ocorrncia de uma resposta (a varivel dependente) em cada momento no tempo e no em poucos pontos selecionados. Algumas vezes um pesquisador deseja num nico experimento estudar os efeitos de mais do que uma varivel independente. O mtodo comum de representar os resultados quantitativos de tais experimentos ainda o grfico, mas a forma algo generalizada. Considere as duas funes da Fig. 5-18. Uma delas (A) simplesmente a Fig. 5-6 reprodu zida aqui por convenincia. A outra a funo de Perin (1942) Williams (1938) cl acionando
150

i-

70 40 Peso da barra (gramas) (A)

10

20 30 40 50 60 70 80 90 N mero dc reforamentos
( 8)

Figura 5-18. (A) Resistncia extino em funo do peso da barra (Capehart. Viney, e Hulicka, 1958). (B) Resistncia extino em funo do nmero de reforamentos prvios (adaptado de Perin, 1942, e Williams, 1938).

-116-

a resistncia extino da presso, barra, no rato, com o nmero de reforamentos prvios, que fortaleceram a resposta. Poderamos supor, para o objetivo da presente discusso que o experimento representado por (A) e (B) na Fig. 5-18 tivessem sido efetuados no mesmo laboratrio, com o mesmo aparelho e com as condies controladas de modo que as nicas diferenas entre (A) e (B) consistissem das manipulaes da varivel independente indicada. Podemos iniciar nossa anlise com a observao de que ambos os grficos corres pondem a nossa frmula simples de um experimento: uma varivel independente ligada a uma varivel dependente. H, contudo, uma relao interessante entre os dois exemplos da Fig. 5-18. Ambos (A) e (B) apresentam a mesma varivel dependente, resistncia extino. Alm disso, um exame mais detalhado revela que (A) e (B) tm um ponto em comum. Para ver isso, considere a noo, implcita em (A), de que muitas variveis foram mantidas constantes; somente o peso da barra foi variado. Analogamente, implcita em (B) est a noo de que muitas variveis foram mantidas constantes; somente o nmero de reforamentos foi variado. Contudo, em (A) uma das variveis mantidas constantes a varivel independente de (B) e uma das variveis mantidas constantes em (B) a varivel independente de (A). Especificamente, todos os sujeitos em (A) receberam 90 refora mentos, enquanto que todos os sujeitos em (B) tinham uma barra que pesava 15 gramas. Portanto, tem um ponto em comum: o ponto que representa 90 reforamentos com uma barra de 15 gramas. O elo entre (A) e (B) da Fig. 5-18 torna-se mais claro com a representao grfica de ambas as funes num mesmo sistema de coordenadas. Ser til empregar um sistema de coordenadas tridimensional, uma vez que h duas variveis independentes e uma varivel dependente. Examine a representao tridimensional de (A) e (B) na Fig. 5-19. Nesta figura, a Fig. 5-18A mostrada como um polgono sombreado no plano xy enquanto que a Fig. 5-18B mostrada como uma seo cnica traada no plano zy. Z

Figura 5-19. Representao das duas funes da Fig. 5-18 como duas superfcies num sistema de coordenadas tridimensional.

-117-

As duas superfcies interceptam-se nos seus pontos comuns x = 15,2 90. (O fato de que os limites das curvas das duas superfcies no coincidam precisamente pode ser explicado pelas vrias diferenas nos dois experimentos alm das duas variveis em considerao). A Fig. 5-19 um mapa que mostra o territrio da resistncia extino limitado por essas duas variveis independentes. O mapa mostra que as duas funes da Fig. 5-18 fornecem informao compor tamental acerca dos efeitos do peso da barra e nmero de reforamentos somente numa pequena regio do espao possvel. A representao espacial da Fig. 5-19 sugere que o territrio pode ser mais eficiente mente estudado num experimento onde ambas as variveis independentes sejam manipu ladas juntamente de modo a cobrir uma poro maior do espao experimental. Uma manipulao desse tipo poderia ser uma extenso do experimento de Capehart, Viney e Hulicka (1958) onde o nmero de reforamentos fosse manipulado juntamente com o peso da barra. A especificao dos grupos para as vrias combinaes das variveis inde pendentes pode ser feita de acordo com o esquema que vem descrito na Tabela 5-1.

Tabela 5-1. Especificao dos grupos de um Experimento para Estudar os Efeitos conjuntos do Nmero de Reforamentos Anteriores e Peso da Barra sobre a Resistncia Extino. NMERO DE REFORAMENTOS DADOS NO FORTALECIMENTO 50 50 50

GRUPOS A B C D E F G H I

PESO DA BARRA 5 15 30 5 15 30 5 15 30

100 100 100


300 300 300

As curvas hipotticas da Fig. 5-20 sugerem que tipo de resultado pode ser obtido se os grupos que recebem 30, 90, e 270 reforamentos fossem estudados, usando-se os trs pesos da barra. Na Fig. 5-20, a representao bi-dimensional, sendo que o valor de uma das variveis independentes (nmero de reforamentos) mostrado simplesmente como um numeral pequeno direita de cada curva. Essa representao uma alternativa para a Fig. 5-19. Representaes bi-dimensionais como a da Fig. 5-20 so frequentemente en contradas na literatura e so conhecidos como famlias de curvas, ou a forma paramtrica da representao funcional. Essa ltima terminologia uma forma aceita de se mencionar as variveis independentes que se sabe ou se acredita serem relacionadas a uma dada varivel dependente. Parmetro virtualmente sinnimo de varivel independente embora seja empregado especificamente para denotar as variveis independentes relacionadas a uma varivel dependente comum.Os parmetros da resistncia extino mostrados na Fig. 5-20, so, portanto, peso da barra e nmero de reforamentos
-118-

200

150-

Peso da barra (gramas). Figur 5-20. Representao bidimensional dos resultados hipotticos da manipulao do peso da barra juntamente com a manipulao do nmero de reforamentos. Os pontos em 90 so de Capehart, Viney e Hulicka ( 1 9 5 8 ) Os outros pontos indicados so hipotticos.

antes da e.Uino. Evidentemente, o nmero de parmetros de qualquer varivel de pendente pode ser bem grande. Em qualquer experimento particular, contudo, raramente estudamos mais do que um ou dois deles ao mesmo tempo. EXERCCIO 4 Desenhe uma representao paramtrica (bidimensional) de possveis resultados de um experimento similar ao de H.M. Wolfle (Fig. 3-6). usando quatro valores diferentes de intensidade de S2 - Utilize os dados de Wolfle como uma das suas quatro curvas. REFERNCIA PARA O CAPITULO 5 Antonitis, J. J. Variability of response in the white rat during condition ing and succecding extinction and reconditioning. Unpublished doctoral dissertation, Columbia Univer., 1950. Antoni,tis, J. J. Response variability in the white rat during conditioning, extinction, and reconditioning. J. exp. P s y c h o l 1951, 42, 273-281. Bullock, D. H., and Smith, W. C. An effect of repeated conditioniiigcxtinction upon operant strength. J. exp. Psychol., 1953, 46, 349 352.
-119-

Capehart, J., Viney, W., and Hulicka, I. M. The efcct of effort upon extinction. J . comp, physiol, Psychol., 1958, 51, 505-507. Ebbinghaus, H. Memory (Translated by H. A. Ruger and C. E. Bussenius). New York: Teachers College, 1913. Frick, F. S., and Miller, G. A. A statistical description of operant condi tioning. Amer. J. Psychol., 1951, 64, 20-36. Guilford, J. P. General psychology. P rinceton: ,D. Van Nostrand, 1939. Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New Y ork: Rine hart, 1946. Hearst, E. Resistance-to-extinction functions in the single organism. J. exp. Anal. Behav., 1961, 4, 133-144 Hurwitz, H. M. B. Periodicity of response in operant extinction. Quart. J. exp. Psychol., 1957, 9, 177-184. Jenkins, J. G., and Dallenbach, K. M. Oblivcsccnce during sleep and waking. Amer. J. Psychol., 1924, 35, 605-612. Keller, F /S ., and Schoenfeld, W. N. Principles oj psychology. New Y ork. Appleton-Century-Crofts, 1950. Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts, 1963. Kimble, G. A. Principles of general psychology. New York: Ronald Press, 1956. Mowrer, O. H., and Jones, H. M. Extinction and behavior variability as functions of effortfulness of task. J. exp. Psychol., 1943, 33, 3 6 9 386. Notterman, J. M. Force emission during bar pressing. J. exp. Psychol., 1959, 58, 341-347. Perin, C. T. Behavior potentiality as a joint function of the amount of training and the degree of hunger at the time of extinction. J. exp. Psychol., 1942, 3 0 ,9 3 -1 1 3 . Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938. Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950, 57, 193-216. Skinner, B. F. Science and human behavior. New York: Macmillan, 1953. Williams, C. D. The elimination of tantrum behavior by extinction procedures. /. abnorm. soc. Psychol., 1959, 59, 269. Williams, S. B. Resistance to extinction as a function of the num ber of reinforcements. J. exp. Psychol., 1938, 23, 506-522.

-120-

SEGUNDA PARTE
AS UNIDADES FUNDAMENTAIS DE ANLISE

6 . NOTAO DE CONTINGNCIA DE RESPOSTA E ESTMULO


7. REFORAMENTO INTERMITENTE 8 . A ESPECIFICAAO DA RESPOSTA 9. CONTROLE AMBIENTAL

Captulo 6 NOTAO DE CONTINGNCIA DE RESPOSTA E ESTIMULO

Sistemas elaborados de notao abreviada que expressam as relaes entre procedi mentos, conceitos e eventos so, comumente desenvolvidos pela cincia. Tais sistemas de notao podem ser convenientes para descrever as operaes. Como um meio analtico, a notao pode ajudar a reconhecer as similaridades e diferenas entre procedimentos e simplificar sua classificao, foijando uma maneira para sua eventual integrao terica. Um sistema desse tipo, altamente desenvolvido e bem conhecido, existe na qumica. Indicando um elemento particular por um smbolo e definindo as relaes entre os elementos (por exemplo, + para combinao; > produz; A para aplicao de calor), uma descrio parcimoniosa de um procedimento e alguns de seus resultados podem ser rapidamente dados e a relao .sse procedimento com outros procedimentos seme lhantes facilmente vista. Deve-se salientar, todavia, que em todas as notaes usadas com o objetivo de resumir, perde-se alguma informao. Quando o sdio, por exemplo, adicionado gua, o hidrognio liberado e forma-se o hidrxido de sdio. Este procedi mento e seus resultados so conveniente e quantitativamente expressados assim 2Na + 2H O H ---- > 2NaOH + H 2 Esta expresso omite grande quantidade de detalhes pelo fato de representar certas relaes fundamentais de uma maneira simples e concisa. Ela no informa por exemplo, que esta reao gera calor, no d qualquer informao a respeito do tempo gasto pela reao e no diz sobre o estado (slido, lquido, gasoso), em que o produto se apresen tar. Apesar dessas limitaes, a notao tem se mostrado bastante til para justificar sua incluso contnua na qumica, porque ela descreve convenientemente inmeros eventos com grande generalidade. Por exemplo, a representao verdadeira para muitas formas diferentes de sdio (p, slido, granular, cristalino), em qualquer hora do dia, numa enorme faixa de temperatura e presses atmosfricas. Como a maioria das generalizaes cientficas, todavia, ela no vlida universalmente. Se a temperatura for muito baixa e a presso atmosfrica muito alta, a reao no ocorrer A representao tambm no informa que o Na no um material unitrio, mas realmente um nmero de materiais relacionados (istopos). Todos eles comportam-se de uma forma muito semelhante para a maioria dos objetivos, o que permite que o rtulo Na seja aplicado a todos como ,na aproximao.
- 123-

Os psiclogos esto principalmente interessados nas relaes entre as atividades dos organismos e outros eventos no mundo. Um sistema de notao que emprega eventos ambientais e eventos comportamentais como termos fundamentais seria conveniente para descrever inmeros procedimentos psicolgicos e, como veremos, tomaria possvel uma comparao analtica das operaes. O esquema de notao esboado em detalhe neste captulo derivado de um sistema descrito inicialmente por F. Mechner (1959) e elabo rado por Vicki Mechner (1963). Ao contrrio do exemplo qumico, a notao comportamental que esboaremos esquematiza somente aspectos de procedimento da experimentao. Nesse sentido ele se assemelha notao da eletrnica. Nesta, um circuito representado por smbolos e o resultado de tal circuito, quando uma voltagem lhe aplicada, deve ser descrito por funes que relacionam as variveis independentes e dependentes que operam no circuito. Ao ser usada, a presente notao poderia igual mente ser suplementada com funes que relacionem as variveis independentes (mudanas em eventos ambientais) com as medidas do comportamento. Ao nvel da presente considerao, no tentaremos dar definies formais ou rigorosas para as unidades que empregaremos para descrever os procedimentos comportamentais: estas podem ser encontradas em outros captulos. O nosso interesse aqui somente fornecer de uma maneira concisa e com o mnimo de comentrios, vrios instrumentos de notao atravs de exemplos e problemas que ilustram os poderes, caractersticas e limitaes principais da notao R e S que amplamente usada no decorrer deste texto, 6.1. RESPOSTAS E EVENTOS AMBIENTAIS A notao incorpora eventos comportamentais sob a fo m a de respostas instru mentais (operantes), abreviadas como R. Estas so, naturalmente, comportamentos que so controlados por suas conseqncias. Para os objetivos presentes, podemos definir o comportamento como qualquer coisa que um organismo individual faz. Ento, podemos ainda identificar uma resposta como uma unidade de comportamento. A palavra chave na especificao do comportamento o verbo fazer. Um organismo, para se comportar, deve fazer alguma coisa, deve agir. Assim, temos abaixo exemplos de comportamento e tambm exemplos daquilo que chamaremos de respostas. ( 1 ) Joo rebateu a bola. (2) O Sr. Mitty engrenou o carro. (3) Eu levei minha bandeja para a mesa. (4) O rato pressionou a barra. (5) O macaco coou suas costas. ( 6 ) Jorge esperou pelo nibus. Em todos esses exemplos, algum organismo fez alguma ;oisa. De modo geral, ..entamos especificar a resposta em termos dos movimentos que o organismo faz, ao invs de em termos das conseqncias desses movimentos. Ento. Joo rebatei a bola implica e que Joo levantou os braos de uma certa maneira e em corespondncia com a direo em que a bola vinha e, como uma conseqncia, a bola rebatida. impor;ante, ao princpio, separar os eventos com portam entais de suas conseqncias.Portanto, ( 1 ) escrito melhor assim: Joao levantou o basto : e (3) ('sciito melhor Eu movi minhas
-124-

pemas em tal e tal direo, segurando uma bandeja em minhas mos e, eventualmente, cheguei mesa. Chegar mesa foi uma conseqncia do comportamento de mover as pemas. Note-se que, em cada exemplo, um organismo foi identificado. Seguiremos a conveno de que cada especificao de uma R identificar o organismo para o qual o evento e uma R. Deste modo, evitaremos confundir a R de um organismo com aquelas de um outro. Uma regra simples para identificar eventos respostas num texto de linguagem comum selecionar os verbos de ao. J que uma resposta um ato, os verbos de ao esto em geral (embora no invariavelmente) associados a eventos resposta. Os seguintes exemplos ilustram alguns eventos que no so eventos resposta. (7) A bola rebateu em Joo ( 8 ) 0 furaco assolou o pas. (9) O governo sofreu um colapso. (10) A Sra. Brown morreu. ( 1 1 ) 0 macaco adormeceu. (12) Jorge ficou cansado de esperar. Em (7), Joo nada fez. Houve uma ao sobre ele. Em ( 8 ), o furaco no um orga nismo, ento no pode emitir respostas, tal como as conceituamos. Em (9), o governo no consiste de um organismo individual que sofreu o colapso. O comportamento de um indivduo no est sendo descrito pelo colapso do governo. Rejeitamos (10) porque morrer um evento comportamental nico para cada organismo e as respostas devem ser eventos repetveis. Em (11), o dormir, embora um fenmeno comportamental interes sante, no deve ser interpretado como um evento resposta. Finalmente, a proposio que diz Jorge ficou cansado uma especificao grosseira de algum estado interior de Jorge, mas no uma descrio de algo que ele esteja fazendo e, assim, no um evento de resposta. Escreveremos os eventos resposta de vrias maneiras. Podemos represent-los com um R maisculo com um ndice numrico ou em forma de letra e especificar, parte, ima chave com sua identidade verdadeira, como no exemplo

onde R^= Joo ergueu o basto Rb = Joo correu para a primeira base

Este exemplo simples mostra algumas caractersticas importantes da notao. Em primeiro lugar, cada R, em qualquer exemplo particular, deve ser uma R do mesmo organismo. Ento, no poderia ser um exemplo de alguma coisa que Joo fez e Rg um exemplo de alguma coisa que Jorge fez. Outra maneira de dizer isso, salientar que somente podemos discutir o comportamento de um organismo de cada vez. Uma alternativa para indicar a identidade verdadeira de R subscrever, abreviando o comportamento com uma palavra como
-125-

^(levantou) e ^(correu)

Ambas as formas sero usadas. 6.2 SITUAES E EVENTOS AMBIENTAIS Qualquer indivduo que se comporta cercado e bombardeado por uma multi plicidade de energias. Alguma dessa energia est muito longe para afetar o organismo. Assim, um sinal luminoso do trfego em Tquio no ter efeito em nosso comportamen to em Nova York. Um homem atirando contra ns a oito quilmetros de distncia no ir, similarmente, ter efeito sobre ns, a menos que o vejamos. Outro tipo de energia pode no ter efeito porque o organismo no possui receptores especializados para captla. Ondas de rdio e radiao csmica rodeiam-nos constantemente mas no detetamos estas energias a menos que estejamos equipados com instrumentos especiais para traduzi-las em sons e deflexes de ponteiros energias que podemos detetar. O organis mo construdo de modo a detetar uma amostra de energias sua volta e todas elas constituem seu ambiente. Um ambiente, num dado momento, pode ser muito complexo, consistindo de sons, padres de luz, odores e todas as configuraes daquilo que chama mos objetos. Frequentemente, notaremos que necessrio especificar apenas as mudanas que ocorrem em nossos ambientes. Quando Joo rebateu a bola, esta viajou na direo geral do campo externo. O restante do seu ambiente permaneceu relativamente constante mas a parte que envolvia a bola mudou. As idias que se seguem se mostraro teis. Uma descrio do ambiente de um organismo em qualquer tempo e lugar determinados e em referncia a ele, ser designada uma situao, abreviada por S. Alm disso, chamaremos uma mudana numa parte ou em todo o ambiente deste organismo de um estmulo. Uma vez que um estmulo apenas um caso especial da situao, no precisamos de um smbolo especial para ele. Podemos usar o S de situao. Eis algumas s i t u a e s para vrios organismos: (13) (14) (15) (16) (17) (18) A bola veio em direo a Joo... Walter Mitty no seu Volkswagen 1962 cinza, sob a chuva, com o p na embreagem, o motorista do carro de trs buzinando... Minha bandeja contendo o almoo... 0 rato na caixa de Skinner, uma barra na parede da frente, nenhuma comida presente.,.. Uma pulga picando o macaco... Jorge no ponto de nibus...

Note que trs pontos seguem cada uma dessas situaes descritas. Isto porque qualquer situao pode sempre ser descrita indefinidamente com maiores detalhes. Feliz mente, precisamos descrever apenas os aspectos da situao nos quais estamos interes sados. Na maioria das vezes, estes sero as mudanas no ambiente e que ocorrem de

-126-

uma situao para outra. Note tambm a ausncia de quaisquer verbos de ao na descrio de situaes ambientais. A penltima (17), parece ser uma exceo. Contudo, a picada uma situao (S) para o macaco (embora seja uma resposta da pulga). Esta ilustrao enfatiza a importncia de se identificar sempre para cada evento R ou cada evento S a que organismo Rs e Ss esto se referindo. As situaes (Ss) so escritas de forma semelhante s Rs. Podemos subscrever um nmero ou uma letra como em S l 6 bla dirigindo-se para Joo Sb = Walter Mitty no seu carro ou subscrever o quanto da situao real julgarmos necessrio: S(rato na caixa, alimento ausente) importante notar que as situaes podem ser simples como a situao S24 = bomba caiu + a rua foi destruda + povo gritando + sirenes de ataque areo soando + fogo ardendo minha volta... Embora muitas mudanas ocorram no ambiente num determinado momento, elas todas constituem uma e somente uma situao: uma situao com muitas mudanas. Deve-se depreender dessas consideraes que, logicamente, s uma situao, em cada momento, pode existir para qualquer organismo. Ser conveniente usar o sinal + para combinar mudanas separadas no mesmo evento S. 6.3 A NOO DE UMA CONTINGNCIA COMPORTAMENTAL O fazer alguma coisa frequentemente produz algumas conseqncias importantes. Na linguagem de eventos resposta e estmulo, essa proposio significa que a R frequente mente conduzir a um S de alguma conseqncia. A presente notao fundamen talmente uma notao das conseqncias de estmulo do comportamento. Sempre que observamos que um evento comportamental produziu repetidamente, no passado, alguma conseqncia especfica no ambiente, estamos diante de uma contingncia comportamen tal. Formalmente, uma contingncia comportamental definida como uma regra que especifica uma relao condicional entre uma resposta e suas conseqncias. Examine alguns exemplos dessas regras. (19) (20) (21) (22) (23) Pressionar o boto de partida faz o motor funcionar. Se voc disser mais uma palavra, ser mandado para a cama sem o jantai. Gire a maaneta para a esquerda, para abrir a porta. Beba seu leite e voc ganhar a sobremesa. Sempre que o macaco pressiona a barra ele recebe um amendoim.

Cada um desses cinco exemplos especifica um evento resposta e uma conseqncia de


- 127 -

estmulo para esse evento R. Considere (19). Se voc pressionar, R, o boto de partida, ento, o motor funcionar, S (funcionar). Em (20): Se voc disser uma palavra, R, ento, voc estar na cama sem o jantar, S(na cama + sem o jantar). Note que mudamos voc ser mandado em (20) para a forma voc estar . A mudana acentua a idia crtica de que os eventos ambientais acontecem para o organismo. Em (20), o mand-lo para a cama poder envolver eventos resposta da parte de outro indivduo (por exemplo, sua me) mas desde que estamos discutindo voc, este um evento S para voc. muito importante manter um quadro de referncia consistente na notao de contingncias. No momento, vamos supor que podemos notar os eventos R e S de um e somente um organismo de cada vez. Assim, no podemos misturar os eventos comportamentais de dois organismos no mesmo diagrama e cham-los Rs. No exemplo (21), se a maaneta girada para a esquerda, R(girar para a esquerda), ento a porta se abre S(porta se abre). Os exemplos (22) e (23) tambm cabem na forma se R, ento S. De um modo geral, uma contingncia especifica a dependncia de uma mudana ambiental de um evento anterior de comportamento. Embora as contingncias sejam muito frequentemente especificadas no tempo futuro (veja os exemplos prvios) deve estar claro que elas so regras baseadas em observaes feitas no passado. Podemos usualmente ler a dependncia dada por uma contingncia com: se Rf ento S. Uma maneira equivalente de descrever essa dependncia de S sobre R observar que, numa contingncia comportamental R conduz a S, ou R produz S. Estas ltimas formas tem uma utilidade to geral que existe um smbolo especial, -> , cujo significado conduz a ou produz. Ento, podemos escrever os exemplos de contingncias de (19) a (23) como se segue. (19a) R (pressionar)-----> S (m otor funciona)
(20a) R a -----> S a

onde R a " dizer uma palavra e Sa ~ na cama (21a) R( 16)---- > S i


onde R(] 6) vixar a m aaneta para a esquerda e S\ (22a) R (beber leite)----- > ^(sobrem esa) (23a) R (pressionar a barra) ->S(amendoim) = p o rta aberta

Cada um desses cinco casos convenientemente lido como R conduz a S. A noo de uma contingncia comportamental no difcil, mas importante notar alguns de seus aspectos caractersticos. Primeiro, a contingncia descreve as conse qncias de S para dar uma R. Ela no descreve a ocorrncia do comportamento. Isto , no diz que R ocorrer. Apenas diz que S condicional (dependente) a R, isto , que R ocorreu no passado e foi, ento, seguida por S. Segundo, a contingncia comporta mental especifica apenas as conseqncias ambientais para o comportamento. H um nmero de outros tipos de contingncias que a notao no se destina a manejar. Vrios destes esto ilustrados nos seguintes exemplos: (24) (25) (26) Os selvagens executaram a dana da chuva e no dia seguinte choveu. Se houver sol, irei ao pique-nique. Se ele abrir o livro, comear a ler.

-123-

(27) (28)

Quando acordei, podia ouvir Joseila j movimentando-se na cozinha. Se continuar a chover, a lavoura ser destruda.

Em (24), estamos diante de uma pseudo-contingncia. R(dana) realmente conduziu a (-----*) S(chuva)* Todavia, a proposio no implica que, no passado, tal dana tambm tenha produzido chuva. O exemplo (24) meramente uma especificao de uma seqncia nica de R e S e a noo crtica de regra est ausente. Em (25), temos a idia de que algum evento comportamental, R(jr ao pique-nique), ^ condicional a algum evento ambientei S(se houver sol)- Mas isto o oposto da nossa idia de contingncia comportamental, que prope a dependncia de S a uma R anterior. Em (26) temos R(ler) dependente de R (abrir o livro)- Mas, novamente, isto no uma conseqncia de estmulo para o emitir uma R. uma conseqncia comportamental do emitir uma R. Q exemplo (27) meramente uma proposio descritiva de algum evento e nem especifica, nem implica em qualquer regra. Finalmente, (28) descreve dois eventos ambientais. O segundo, S(colheita destruda), dependente do primeiro, S(chover mais)- Tal contingn 3*S de uma contingncia comporta cia S---- S no se enquadra no modelo bsico R mental. A noo de que as conseqncias de S so dependentes de R fundamental nas contingncias comportamentais. A notao equipada apenas para representar tais con tingncias. Isto simplesmente porque, como o texto deixa claro, controlar as conseqn cias passadas do comportamento um dos meios mais poderosos que o psiclogo tem para controlar eficientemente o comportamento que se lhe apresenta no momento. Logo, no ser surpreendente que ur^a notao tenha sido desenvolvida para representar o padro dessas conseqncias em relao ao comportamento, tanto no laboratrio como fora dele. 6.4 A SITUAO INICIAL (SA) Logicamente, toda contingncia comportamental faz parte de algum ambiente. Outra maneira de dizer isso que as contingncias so geralmente possveis apenas em alguma situao determinada. Assim, no exemplo (19), pressionar o boto de partida possvel somente quando voc est em seu carro, com o boto ao alcance e assim por diante. Em ( 20 ), a contingncia permanece somente quando uma segunda pessoa est presente para escut-lo e mand-lo para a cama sem o jantar. Consideraes, similares podem ser feitas para o restante dos exemplos de contingncia. Em geral, uma determinada situao prevalece num momento em que uma determinada contingncia est em efeito. Uma vez que a situao mudada com a ocorrncia de R (R produz uma nova situao, a conseqncia S) frequentemente desejvel, por questes de comparao, indicar essa situao inicial, de pr-conseqncia. Na notao, isto feito escrevendo-se a situao inicial (abreviada frequentemente por Sa) verticalmente acima de R. Coloca-se, ento, um colchete abrangendo os dois termos, S \ e R, para indicar que a situao e a contin gncia associadas a R ocorrem simultaneamente. Considere: S,

[ 6. 1]

- 129 -

onde Sa = leite sua frente R = beber Sb - sobremesa O diagrama [ 6 . 1 1 lido: quando o copo de leite estiver sua frente e, se voc o beber, ento ganhar a sobremesa. O diagrama [ 6.1 | o tipo mais simples possvel de diagrama de contingncia a ser escrito na notao. Ele mostra duas situaes, uma inicial e uma segunda as conseqncias de R. Ele especifica um evento resposta. Embora os diagra mas que se sucedem sejam mais complicados, todos eles contm como elementos a idia expressa em [ 6 .1 1 Isto , em alguma Sa, se uma R emitida, entio Sg ocorrer. As contingncias que se adaptam ao diagrama [ 6.1 j so melhores lidas como:
quando ou enquanto ou durante ou logo aps

R SA
se

----->
ento

SB

Se esta fraseologia for adotada, haver pouca possibilidade de interpretao errnea de qualquer problema. 6.5 CONTINGNCIAS MLTIPJ AS NA MESMA SITUAO Raramente encontramo-nos numa situao onde possamos fazer apenas uma coisa que tenha conseqncias. Normalmente, existem diversos comportamentos que podera mos desempenhar em cada situao, muitos dos quais poderiam produzir mudanas significantes no ambiente, ou conseqncias. Por exemplo, ao estar sentado diante da mquina de escrever, l esto quarenta ou mais teclas que podem ser batidas, cada uma produzindo uma conseqncia diferente. Poderamos tambm colocar e tirar o papel, apagar as letras com a borracha, mudar a fita, etc. Alm disso, se o telefone estiver perto, poderemos telefonar. Se uma segunda pessoa estiver prxima, podemos solicitar seus prstimos e sermos atendidos. Pode-se continuai enumerando indefinidamente vrias atividades possveis nessa situao, todas com conseqncias distintas. Resolvemos este problema na notao escrevendo somente quantas dessas contingncias desejarmos notar e isto feito com a simples adio de Rs nos colchetes. Assim, se estivermos interessados em notar as contingncias do bater em qualquer tecla de uma mquina de escrever e produzir uma letra, ou do discar um nmero num telefone, ou do pedir um copo de gua, poderamos escrever: Sa (na mquina de escrever, perto do telefone, amigo prximo) Rl (bater na tecla) S(ietra) ^ 2\ R2 (discar o nmero) - S (aiguem responde) R3 (pedir gua) > S(um copo com gua trazido)

Em geral, podemos escrever tantas contingncias de R quantas desejarmos, simplesmente pela adio de Rs e suas conseqncias dentro de um colchete.

-130-

SA Ri

SB [ 6 . 3]

R2 > R .3 SD R4 sE

Os trs pontos na vertical significam k k e assim por diante . Note, cuidadosamente, que |6 .2 |e | 6.3 | no so representaes dos comportamentos que sero realizados quando estivermos sentados maquina de escrever. So represen taes do que acontecer se qualquer uma das Rs ocorrer. Os diagramas \6.2\ e 16.3 |no asseguram que alguma dessas Rs seja, na realidade, efetivada ou que algum comporta mento ocorra. O mximo que a notao pretende c mostrar quais conseqencias ocor rero se alguns comportamentos ocorrerem. Este um ponto fundamental que deve ser con st an temente lembrado sempre que Se examinar diagramas de R c S. Um caso especial de contingncia mltipla ocorre quando mais de uma R pode produzir as mesmas conseqncias S. Na expresso h mais de uma maneira de tirar o couro de um gato , temos um conjunto de contingncias do tipo visto no diagrama 6 .4 :

SA

R{ ----r > Sb R2 1 R a- 1

[6.4]

onde

S\ S[3 R] F *2 R3

- gato intacto gato sem couro = um modo de tirar o couro do gato - outro modo = ainda outro modo

Para um exemplo mais especfico, considere as maneiras pelas quais podemos chamar um garo nossa mesa. Podemos chamar garo , podemos fazer um sinal ao garo mais prximo com as mos ou podemos meramente olhar na direo do garo, fixando nossos olhos nos dele.

- 131 -

(nao lu garao nossa mesa) (cli am a r o ga r o) _____ R(olhar o garo)

S(o garo vem)

[6.5]

0 diagrama | 6.5 | ilustra um mtodo til de especificar Sa, a situao inicial. Para produ zir o diagrama 16.5 [ escrevemos primeiro todos os com portam ento* envolvidos. Ento, escrevemos a conseqncia principal, o garo vem at ns\ Finalmente, para d eter minar o melhor mtodo de especificar Sa, verificamos apenas qual seria o oposto da conseqncia. Neste caso, simplesmente nenhum garo nossa mesa . Quando casos,complexos, contm muitos Ss, frequentemente til obter o oposto de cada S, pois o oposto pode dar uma pista de como iniciar o diagrama.

6.6 A CONTINGNCIA NULA


Nos diagramas 6.1 a 6.5, Rs produziram Ss. Sempre que uma R conduzia a uma nova situao, esta era includa num colchete vertical ao longo da situao em vigor. Mas, nesses diagramas, a conseqncia S foi escrita sozinha, fora do colchete. Um S fora de um colchete usualmente indica que nenhuma contingncia especial (em que estamos interes sados) se mantm nessa situao. Ento, o significado de Sg sozinho em 16.1 J o mesmo que:

Aqui se infere que a R em questo, R (beber) n^ m a* s tem quaisquer conseqncias especiais uma vez o organismo alcance Sg. Assim, a ausncia de qualquer R detenninada, num colchete, implica que se esta R fr emitida durante aquele S, nenhuma conseqncia especial ocorrer. A ausncia de quaisquer conseqncias especiais para uma R define um caso especial de uma contingncia e chamada de contingncia nula. Assim, a ausncia de qualquer R determinada em qualquer colchete implica que a contingncia nula est em ao para esta R durante o S deste colchete. Alm disso, o aparecimento implica na contingncia nula de um S fora de um colchete nesta situao para todas as Rs em con siderao. Ocasionalmente, em alguma situao, digamos S, desejamos enfatizar que uma R que anteriormente tinha uma conseqencia, no a tem mais. Uma maneira de fazer isto seria simplesmente omitir a R do colchete que inclui Sa ^ mas para enfaiizar, pode ser ade quado escrever: S* R R

os quais so ambos lidos: durante Sa, R no mais produz quaisquer conseqncias espe ciais. Ambos so equivalentes a Sa
*

ou

[S

todas as q u atro form as ilustram m aneiras diferentes de escrever a contingncia nula.

- 132 -

6.7 A DURAO DAS SITUAES E DAS CONTINGNCIAS As situaes no duram indefinidamente, faamos ou no alguma coisa para muda las. Podemos subir num nibus somente enquanto ele permanece no ponto. Podemos acenar para o garo enquanto ele est vista, mas eventualmente ele desaparece e nossos sinais no so eficazes. As crianas frequentemente tm um limite de tempo para beber o leite. Depois disso, no haver sobremesa, independentemente do que elas faam. O fato de que muitas situaes e contingncias tenham uma durao de tempo definida a elas associada, leva introduo do smbolo T que representa a durao dc tempt'). O uso de T direto. A situao (S j), que dura um tempo T, e escrita:

Vrios pontos devem set levantados a respeito da interpretao de [6 .6 .| Primeiro, T c a durao de Sj. Segundo, em T h sempre uma seta que nele se origina. Se uma situao dura um tempo T, ento uma nova situao deve substitu-la. Esta nova situao ser encontrada na ponta da seta que se origina em T. Terceiro, T e sua seta so usados para representar ao fim de T unidades de tempo''. Ento, T sempre uma determinada durao dc tempo. Temos alguns exemplos do uso dc T, a seguir: (29). A pea dura duar horas, mas h um intervalo de 10 minutos entre o primeiro e o segundo ato. O primeiro ato dura 45 minutos.

S (ato 1 ) Z(45 min) (30)

S (intervalo) > ZOOm in)

S (ato II) X(65 min)

S(Hm da pena) *

o rato ficar na caixa por uma hora.

SA T -* S n onde Sy\ rato na caixa T - 1 hora Sg rato fora da caixa Nenhuma contingncia foi escrita nesses colchetes j que nenhuma conseqncia para quaisquer comportamentos foi especificada. Se houvesse sido especificada alguma, ento as Rs teriam sido colocadas nos colchetes. Algumas vezes, apenas um valor aproximado de T conhecido. Ento, se estamos esperando que algum saia da cabine telefnica para que possamos fazer uma chamada, no podemos estar certos de quanto tempo a situao de S(cabine tejefnica ocupada)

- 133-

durar- O mximo de que somos capazes, nessas condies, seria estimar uma media do tempo de espera, digamos 5 minutos, em media. Uma mdia de T, assim especificada, escrita T, onde o - indica em media. T usado exatamente da mesma maneira que T. Por exemplo: 1(5 min) > S(cabine livre > S(cabine ocupada) [6.7 1

O diagrama 6.7 ilustra mais duas caractersticas da notao. Primeiro, as setas sempre se originam nos Ts (ou Rs), nunca nos Ss. Quando um S sucede outro, a seta deve vir de um T (ou de- R). Segundo, a posio vertical de T e S, num colchete, irrelevante. Um pode estar abaixo ou acima do outro. Os eventos dentro de um colchete entram em ao simultaneamente.

6.8 MAIS DE UMA RESPOSTA EXIGIDA PARA A CONSEQNCIA S.


Quando mais de uma ocorrncia de uma dada resposta necessria para produzir alguma conseqncia S, este fato pode ser indicado de uma ou duas maneiras. Antes de tudo, o evento, comportamental associado com a contingncia pode ser definido em termos do nmero de elementos requeridos. Ento, o exemplo escreva uma palavra no quadro negro 100 vezes e, ento, voc pode ir para casa , poderia ser notado assim:
Ra Sa

Si onde Sj = dentro da sala de aula Ra ~ escrever uma palavra 100 vezes Sa = permisso para sair

Aqui, o nmero de elementos requerido est envolvido na definio de Ra. Alternati vamente, este caso poderia ser notado assim: Rn.a ^ Sa S, on de s j = dent ro da sa1a de au 1a Ra = escrever uma palavra Sa = permisso para sair n = 100

Assim como o T, algumas vezes pode-se conhecer apenas o valor mdio de a. Quando somente o nmero mdio de respostas requeridas para uma mudana S conhecido, escrevemos n.

-134-

6.9 CONTINGNCIAS REPETITIVA. Nos diagramas [6.1 | a [6.5 [ as respostas produziram consequencias ambientais. Mesmo assim, todas essas contingncias poderiam ser descritas de uma vez. Isto , uma vez que a R especificada ocorreu, apareceu uma nova situao e a contingncia nula entrou, ento, em efeito para todas as Rs enumeradas no colchete seguinte. Todavia, esta uma condioque nem sempre verdadeira. Em 6.2, por exemplo, uma simplificao grosseira foi feita, desde que est claro que, quase que imediatamente depois de bater numa tecla, podemos bater em outra e produzir uma letra. Evidentemente, necessitamos de alguma maneira para descrever a natureza repetitiva de certas contingncias. Talvez a contingncia repetitiva mais comum seja aquela que a mquina de escrever ilustra. Depois de fazer alguma coisa obtemos uma conseqncia, mas podemos fazer a mesma coisa novamente, se desejarmos, e ainda obtermos uma conseqncia e assim indefinidamente. A maneira mais simples de descrever este caso seria diagram-lo de modo a indicar que a contingncia antiga est novamente em efeito logo depois da conseqncia. Esta seria uma representao exata, porque certo que no podeipos datilografar uma nova letra no momento em que a tecla est batendo no rolo. Se fizermos assim, teremos a sobreposio de tipos e outros efeitos indesejveis. A idia principal que devemos esperar um pouquinho, apenas uma frao de um segundo. Assim, a contingncia nula que est em efeito no momento da conseqncia dura somente uma pequena frao de segundo, depois do que voltamos nosssa contingncia original. Na seo 6.7, discutimos como o tempo pode produzir novas situaes. Precisamos apenas ampliar este conceito para permitir que o tempo conduza de volta s situaes antigas e tambm s antigas contingncias. Essa ampliao de nossas idias permitir uma representao exata de muitas contingncias repetitivas. No caso da mquina de escrever, podemos notar:

SA

Sb
|T 2

Ra

onde

, S a " mquina de escrever, teclado em repouso. Ra - ^ater numa tecla S[} a letra aparece j pequena frao de segundo.

16.8|

No diagrama 16.8 | representamos o fato de que numa situao S^, podemos bater numa tecla e produzir uma marca na pgina e na outra S b , no podemos obter esse efeito batendo na tecla. Para nos referirmos s duas contingncias distintas (uma das quais, naturalmente, o caso nulo) subscrevemos os numerais 1 e 2 embaixo dos colchetes. Outros exemplos de contingncias repetitivas simples so:

- 135 -

(31)A ave recebe uma apresentao de 3 seg de alimento cada vez que bica o disco. (32)Voc pode encher sua caneta tintoiro colocando-a no tinteircr e empurrando o mbolo. (Aqui, o T da contingncia 2 bem longo, dependendo do quanto voc escreve). (33)Cada presso no gatilho faz a arma disparar um tiro. Um segundo tipo de contingncia repetitiva ocorre quando uma segunda resposta, em vez da mera passagem do tempo, faz voltar s condies da primeira situao e suas contingncias. Quando um rato reforado com uma gota de leite cada vez que pressiona a barra, um ? . segunda presso barra no p ro d u z ir uma segunda gota de leite at que a primeira seja consumida. Assim,

onde S a leite ausente S r - gota de leite RA presso barra RB - beber o leite representa aquelas condies. Este tipo de reciclagem comportamental muito comum Algumas armas de fogo pequenas so construdas para atirar somente quando reguladas entre cada tiro. S(arma regulada) _______ ^ R(puxar o gatilho) |S(fogo) [R(regular) ________

Similarmente, voc pode obter muitas garrafas de uma mquina de Coca-Cola, inserindo as moedas, mas voc deve remover cada garrafa para que a prxima moeda seja eficiente. Em resumo, h dois modos principais de reciclar uma contingncia repetitiva: atravs da passagem de tempo (indicado por T ^ ) } no por meio de um evento resposta (indicado
por R -----1 )

6.10 FAC1LITAO Ocasionalmente, acontece que a emisso de uma resposta, embora no altere o ambiente, torna possvel que uma segunda resposta produza um estmulo. Assim, quando chegamos ao final de uma linha com a nossa mquina de escrever, o teclado no mais opera. Se pressionarmos o soltador de margem, as teclas no operam, mas esta resposta no muda nosso ambiente de um modo aprecivel. A mquina de escrever parece exatamente a mesma antes e depois de ter sido pressionada a tecla de soltar a margem. As mudanas ocorrem, naturalmente, dentro da mquina de escrever e so reveladas pela possibilidade, de gora, se produzir letras,batendo nas teclas. Notamos es.se caso, assim:

136-

onde

S24 $23 Ra Rb T

= trmino da linha - a letra aparece = pressionar o soltador de margem = bater na tecla - pequena frao de segundo

Assim, o aparecimento de no colchete, 2, sem um S, implica em que o S do colchete precedente, S2 4 , est ainda em vigor. E realmente isto correto. Casos tais como [6.9] so indicados esquematicamente Rj -----> R 2 e so lidos: Se R j, ento se R 2 -. *

0 comportamento verbal humano frequentemente configura-se numa representao semelhante a [6.9 j. Quase sempre prefaciamos os nossos comentrios com Escute isso , ou Ouviu falar desta? . Estas proposies introdutrias tm o efeito de captar a ateno, embora a ateno nem sempre seja revelada por qualquer mudana aparente na face da nossa audincia, isto , no nosso ambiente. 0 que acontece, todavia, que os nossos comentrios subsequentes certamente sero mais observados (isto , produziro conseqncias) se forem prefaciados por tis proposies. Para assar um bolo somos aconselhados a untar levemente o fundo da forma. Assim, o bolo no ficar agarrado fornia quando formos remov-lo. No podemos ver diretamente os efeitos do untar a forma uma vez que tenhamos colocado o bolo, mas podemos observar que a resposta de untar torna possvel a resposta de remov-lo. Em termos mais tcnicos, a facilitao a produo de uma contingncia comportamental atravs da ocorrncia de uma resposta que por si mesrna no produz qualquer conseqncia ambiental direta.
6.11 CONTINGNCIAS NEGATIVAS As contingncias de comportamento so, muitas vezes, especificadas de maneira negativa. A menos que voc beba seu leite, ser mandado para cama. Se voc no pagar sua conta de telefone, eles cortaro o seu telefone. Todos os que no votarem sero severamente repreendidos. Um erro comum considerar o no beber , no pagar., no votar , como Rs. Desde que o comportamento alguma coisa que o organismo faz, tais assertivas so claramente uma violao de nossas definies. Uma soluo para a especificao da R est na observao de que o tempo, invariavelmente, tem um im p o rta n te p apel, em bora frequentem ente camuflado, nessas contingncias. Logicamente, se uma conseqncia ocorrer para 0 no fazer algo, o administrador da conseqncia tem que decidir quanto tempo de no fazer constitui o no fazer . Assim.

- 137-

o tempo est intimamente ligaao s contingncias negativas, porque sempre alguma durao de inatividade que produz as conseqencias. Ao considerar as contingncias negativas, til levar em conta todos os comportamentos possveis, exceto a R determinada, como uma classe nica de comportamentos. Embora essa classe seja, em geral, muito diversa e no bem especificada, podemos estar certos de que, pelo menos, no incluir R como membro. Para indicar esse conjunto complementar de comportamentos que no inclui R comc membro, empregamos o smbolo R (l-se R barra) para referirmo-nos a todos os comportamentos, exceto R. Desde que, como notamos, sempre uma certa durao de R (no executar R) que produz as conseqncias, devemos sempre subscrever um T para R. Assim, a menos que paguemos nossa conta de telefone dentro de duas semanas, a partir do momento em que a recebemos, o telefone ser cortado diagramado assim

[6.10]
on(^e Sa R T Sb = recebimento da conta = pagar a conta = 1 4 dias = telefone cortado

Note que R no est representada na chave como qualquer comportamento especfico. Todavia, sua R complementar est especificada na chave, embora aparea no diagrama real apenas por implicao (isto , se a quantidade de T de R no ocorre, ento fT deve ocorrer). Assim, R sempre definida em relao a R de modo que uma ou outra deve ocorrer, mas, evidentemente, ambas no podem ocorrer. Em [6.10 [ se a quantidade T de R ocorrer, ento, o telefone ser cortado, mas se.R ocorrer, ento nada de especial acontecer. Uma vez que R no est representada em [6.10,] isto significa que R est numa contingncia nula com relao a S a e Sg e, realmente, isto verdadeiro. No pag-la (duas semanas de qualquer coisa, exceto pag-la) resulta nas conseqncias. Como um guia geral, observar-se-, frequentemente, que Sg nessas contingncias negativas, um evento aversivo ou indesejvel. Logo, 6.10 pode ser tido como uma prescrio para a produo de eventos aversivos. Logicamente, isto significa que tambm uma prescrio para evit-los e isto precisamente o que desejvamos notar quando introduzimos este tipo de exemplo. 6.12 CONTINGNCIAS PROBABILISTIC AS Algumas vezes, as conseqncias S de uma resposta variam. Quando atiramos uma moeda, nem sempre obtemos o mesmo resultado. Metade das vezes obtemos cara, metade das vezes, coroa. Este caso notado pela incluso de mais de uma seta originando em R e colocando os valores da probabilidade sobre cada seta. Quando mais de uma seta com origem em R empregada desta m a n e ira d o s v a lo re s especificados da probabilidade devem som ar l. Na moeda no viciada, temos:
- 138-

Em geral, quando o comportamento pode ter um nmero de conseqncias possveis, devemos escrever

indicando a probabilidade de cada conseqncia S sobre sua seta correspondente. Naturalmente p + q + r + s+...deve somar 1 . As situaes dc estmulo podem tambm se suceder probabilisticamente. Quando chove rui segunda-feira, c provvel que chova tambm na tera-feira mas, algumas vezes, o tempo podo mudar em 24 horas, e, na tera-feira, o sol brilhar:

onde S\

= chuva

T24 = 24 horas 5 2 = dia de sol 5 3 = mais chuva

6.13 DISCRIMINAES Em todos os diagramas apresentados sups-se que o tempo corresse da esquerda para a direita. Isto , a sucesso temporal de Ss e contingncias era da esquerda para a direita. (As contingncias que reciclam no so excees, porque a seta que recicla da direita para a esquerda meramente uma abreviao para escrever uma srie infinita de smbolos direita.) A dimenso vertical foi empregada para indicar que os eventos escritos no mesmo colchete entram em efeito simultaneamente. Em algumas ocasies, til consi derar vrias contingncias que poderiam estar em efeito simultaneamente. Assim-, podemos pretender discutir as contingncias que surgem de discriminaes simples de laboratrio. Se a luz for vermelha, o macaco deve pressionar a barra para conseguir alimento; mas se a luz fr alaranjada, o macaco deve girar uma roda para conseguir o alimento:

-139-

R(vermelha) y(pressionar) S" R(alaranjado) (girar a roda)

-r S 4(alimento)
[6. 11]

Em 16.11] nenhuma regra dada para a ordem do vermelho e alaranjado. Portanto, nenhuma reciclagem apresentada. O aparecimento de dois colchetes, um acima do outro, implica em que., antes do reforamento, ambas as contingncias estaro em efeito. O diagrama [6.11] tambm ilustra o fato bvio de que mais de uma R pode produzir a mesma situao. 6.14 R e S FUNCIONALMENTE DEPENDENTES Os casos complexos de contingncias repetitivas podem envolver mais do que uma simples reciclagem para a situao original. Frequentemente, a situao original modifi cada por cada ocorrncia do evento resposta. Quando inflamos uma cmara de bicicleta, cada bombada infla a cmara um pouco mais. Para notar isso, usamos as ltimas letras do alfabeto (u, v, x, y, z) como ndices de S, querendo implicar a natureza varivel e inconstante de S. Assim, em

onde Sx = pneu inflado com uma quantidade x x = uma funo de nR R = inflar

vemos que a quantidade de ar na cmara uma funo do nmero de Rs que ocorreu. O diagrama 6.12 ilusoriamente simples mas um nmero de casos comuns usam-no como um elemento. Quando cortamos uma rvore, batemos creme e corremos 100 metros, cada resposta que executamos, modifica um pouco a situao. To logo seja dada uma R, modificando a situao, outra R pode ser emitida imediatamente modificando-a uin pouco mais, e assim por diante. Eventualmente, no final, um novo conjunto de contin gncias estar em efeito: podemos colocar a rvore cada num caminho, o creme em cima de um pedao de bolo e podemos receber uma medalha pela nossa velocidade na corrida. Algumas vezes, a resposta que produzir as conseqncias uma funo de algum aspecto da situao existente. No captulo 1 discutiremos um caso no qual o comporta mento de procurar resulta na descoberta de um objeto. Mas a direo em que a procura efetiva uma funo da localizao espacial do objeto. Este um caso simples onde tanto a R como o S no mesmo colchete requerem ndices variveis. A forma correta de R
- 140 -

depende de S, mas, a mjios que o objeto seja encontrado sempre no mesmo lugar, S sera varivel. O diagrama [6.13 (representa este caso Sc Rj, onde S2 = objeto na mo R = procurar y = direo no espao x posio do objeto S = objeto a alguma distncia de nos e y = f(x) 6.15 CONTINGNCIAS AGRUPADAS 0 tempo (T) tem sido usado como referncia durao de situaes e contingncias. Algumas vezes, til representar por um nico T a durao de um conjunto inteiro de contingncias. Para indicar essa possibilidade, uma nova facilidade notacional deve ser desenvolvida. Considere que a poca dos morangos v de maro a setembro, isto , 7 meses. Se voc vai mercearia durante esta poca, encontrar morangos anunciados e em exposio. Se voc perguntar se h morangos para vender, receber uma afirmativa. Naturalmente, a mercearia no permanece aberta 0 dia todo. A loja abre s 9 horas e fecha s 18 horas. Aqui, temos dois ciclos de tempo independentes. Primeiro, temos a poca dos morangos que dura 7 meses e a poca em que no h morangos, que dura 5 meses. S(na poca) T(7 meses) S(fora de poca) T(cinco meses) [6.13J * S2

zi

Mas tambm temos o horrio de 9 horas por dia de trabalho da mercearia. Isto (9 horas) [ (mercearia aberta) T( 15 horas) __ S(mercearia fechada)

Precisamos conseguir uma maneira de combinar as situaes e ciclos de tempo. O diagra ma 6.14 mostra esta representao. Aqui, os colchetes aparecem agrupados dentro de colchetes.

- 141 -

0 T 7 meses e o T 5 meses aplicam-se durao de todas as contingncias neles includas. T 2 includo apenas para permitir a reciclagem do seu pedido de morangos. Provavel mente, leva um certo tempo para que voc profira as palavras e tenha a primeira caixa em suas mos. Ento, voc pode pedir novamente e receber outra caixa. O exemplo mostra um agrupamento trplice. Uma vez que uma e somente uma situao pode estar presente em qualquer tempo, Sg inclui muitos dos elementos de S\ REFERNCIAS PARA O CAPITULO 6 M echner, F. A notation system for the description of behavioral pro ced u res./ . exp. A n a l Behav., 1959, 2 , 133-150. Mechner, Vicki. A notation system jor behavioral contingencies: an instructional program. New York: Basic Systems, 1963.

- 142-

Captulo 7 REFORAMENTO INTERMITENTE

No paradigma do fortalecimento operante, cada membro de uma classe de resposta selecionada emitido tipicamente seguido por um estmulo reforador. Esse paradigma pode ser efetuado por cientistas do comportamento, pais, professores, amigos ou pela prpria natureza. Sempre que o procedimento de fortalecimento operante iniciado, o resultado tpico um aumento na probabilidade da resposta. O reforamento de cada membro de uma classe selecionada de resposta, nesse paradigma, chamado de refora mento contnuo (daqui por diante, abreviado por crf). O termo no significa que o reforamento esteja continuamente disponvel. Ele simplesmente significa que uma con tingncia do tipo R S+ prevalece /Continuamente entre a resposta e o reforamento. No mundo civilizado e na selva, as relaes entre os comportamentos emitidos e as mudanas subsequentes no ambiente so frequentemente mais complexas do que o crf. Em certos dias, muitas vezes por razes obscuras ou desconhecidas, o mesmo comporta mento que teve xito em outras ocasies no o ter. Este carter fortuito da relao entre operantes e conseqncias subsequente s.pode ser evitado no laboratrio. A, controlando explicitamente o reforamento dos comportamentos, podemos decidir para os nossos sujeitos humanos e animais exatamente quais comportamentos de uma srie emitida sero bem sucedidos. De um modo tpico, tal controle descrito na forma de regras. Essas regras especificam em detalhes as relaes que existem entre certas respostas ope rantes e os estmulos reforadores subsequentes. As regras so apenas casos especiais das contingncias comportamentais do Captulo 6 , mas elas incorporam como eventos S crticos as conseqncias especiais que j denominam os reforadores. Os comportamentos humanos nas situaes cotidianas revelam ambas as contin gncias: reforamento contnuo e intermitente. Sob circunstncias normais, muito do nosso comportamento reforado continuamente. Os interruptores acendem e apagam a luz com regularidade. Quando ouvimos uma voz e olhamos na direo em que ela vem, normalmente vemos a face de outra pessoa. Quando perguntamos a um amigo quantas horas so, regularmente obtemos uma resposta. Excees ocorrem, mas so to infre* quentes que causam surpresa e perplexidade quando acontecem. Em outras situaes, todavia, o reforamento intermitente a regra. A pacincia do pescador em lanar e retirar o anzol da gua por horas a fio, sem a ocorrncia de uma mordiscada, desen volve-se atravs de uma histria de reforamento intermitente. No basebol, o refor amento sob a forma de uma rebatida considerado adequado quando em ste entre dez

- 143-

ou mais tentativas o jogador perde a vez. O cinemeiro inveterado, talvez raramente vcj um bom filme, mas seu comportamento de ir ao cinema semanalmente permanece forte. Neste capitulo, analisaremos alguns dos princpios do reforamento intermitente que foram isolados no laboratrio com sujeitos animais e humanos e mostraremos alguns dos muitos procedimentos possveis. ( 1 ) 7.1 CONTINGNCIAS DE INTERVALO Como ponto de partida, lembre-se do procedimento de condicionamento e extino sucessivos (ver seo 5.5). Tipicamente, este procedimento proporcionava n refora mentos contnuos para uma resposta, seguindo-se T horas de extino. Este ciclo caracte rstico, consistindo de uns poucos reforamentos c, depois, uma extino prolongada, estendia-se por uma ou mais sesses experimentais. Quando a extino havia resultado numa reduTo acentuada do responder, o ciclo era repetido. Considere agora uma variao desse procedimento, consistindo do reforamento de uma nica resposta, seguido por apenas um minuto de extino, novamente um segundo reforamento e assim por diante. Nessa variao, muitos ciclos de condicionamento e extino so con densados em uma nica sesso de uma hora. Depois de efetuar este procedimento, surge um efeito comportamental caracterstico, que se v estilizada da Fig. 7-1. Inicialmente, curvas condensadas de extino, negativamente aceleradas, seguem cada reforamento (Fig. 7-1), (parte a). A resposta que produz o reforamento freqen te mente a ltima de uma srie de respostas cm taxa baixa. Esse quadro, no entanto, transitrio e depois de um certo nmero de reforamentos ter ocorrido, desenvolve-se uma taxa moderada e estvel (parte b). Esta tambm uma fase evanescentc, que d lugar a uma terceira fase (c), caracterizada por uma pausa depois de cada reforamento, pausa esta que seguida por uma mudana gradual ou abrupta para uma taxa de resposta aoderadamente alta, mantida at ao final do intervalo de 1 minuto. As fases transitrias b c c so ilustradas com dados reais na Fig. 7-2. Esta figura repre senta as sesses 2, 3 c 4 da resposta de bicar o disco (chave) de um pombo, que recebia alimento de acordo com o procedimento condicionamcnto-cxtino descrito acima. As curvas da Fig. 7-2 foram empilhadas ; isto c, foram tiradas do seu sistema de coorde nadas usual e colocadas horizontalmente mais prximas, para economizar espao e faci litar a comparao. As taxas reais de resposta em qualquer momento e tambm o nmero de respostas acumuladas emitidas cm qualquer momento podem ser estimados por com parao com a pequena chave inserida na parte inferior direita da figura. O procedimento descrito uma das vrias maneiras possveis em que um experimentador pode programar contingncias de reforamento em relao ao tempo. No caso em questo, o experimentador estabeleceu um intervalo fixo de tempo entre o ltimo reforamento c o restabelecimento da contingncia de reforamento. At que esse inter valo fixo tenha passado, nenhuma resposta pode ser reforada. Tal procedimento fixa o tempo entre o reforamento e a prxima contingncia de reforamento e, por isso, apropriadamente denominado um esquema de Intervalo Fixo (abreviado por IF). Note, todavia, queo intervalo de tempo entre o recebimento de quaisquer dos reforamentos reais nao c fixo.
- 144-

Reforamento (tempo) Figuro 7-1.. Curva estilizada da transio do crf para reforamento intermitente em intervalos peridicos fixos. O uso de ti para rotular a abeissa sugere que os segmentos sucessivos de resposta devem estar associados no com reforamentos sucessivos, mas,

(1) Faz-se necessria uma palavra a respeito do delineamento dos experimentos sobre reforam ento interm itente discutidos neste captulo. tp ic o desses experimentos que os sujeitos sejam inicialm ente treinados num esquema c rf de reforam ento. Somente q u a n d o uma taxa estvel de resposta estabelecida sob as condies c rf o e x p e r im e n ta d o r in tr o d u z as in te rm it n c ia s desejadas.

- 145-

Embora o valor mnimo deste intervalo seja o tempo fixo entre um reforamento e o estabelecimento de uma contingncia, seu valor real depende de quo rpido a resposta ocorre depois que a contingncia entra em efeito. O elemento bsico aparece em notao, assim (fixo) >R > S* Os eteitos principais de um esquema em intervalo fixo (IE ), imposto aps um crf podem ser resumidos da seguinte maneira: 1 . O comportamento do indivduo mostra um ajustamento gradual ao procedi mento, que se nota atravs das mudanas no padro da taxa de resposta. J discutimos este efeito. 2 . O padro que emerge no final tem a forma de ondas (ondulado). Num esquema IF, o reforamento c seguido por um perodo subsequente de no reforamento. Uma longa histria passada neste estado de coisas faz com que o animal pause por um tempo aprecivel aps um reforamento. Essa cessao do responder uma conseqncia natural do fato de que, no passado, uma resposta aps o reforamento numea foi refor ada. uma forma de extino discriminada, que ser esclarecida mais tarde, quando discutirmos o processo comportamental da discriminao. 3. O comportamento pode ser mantido indefinidamente em IFs de apenas poucos segundos at IFs de vrias horas de durao. DIA
24

68

144

Figura 7-3. t-stgios no desenvolvimento do comportamento num esquema 1 1 * 30 min. Dados de int 'rretoramento selecionados so apresentados para os dias indicados. O nmero esquerda de cada segmento indica o nmero ordinal do reforamento que termina este segmento (segundo Cummine e Schoenfeld, 1958).

-146-

Num experimento, pombos famintos foram expostos 16 horas por dia a contin gncias de reforamento com alimento em IF -3 0 min, em 144 dias consecutivos, repre sentando uma histria experimental dc mais de 1.300 horas. O comportamento de bicar a chaye foi mantido atravs do experimento e verificou-se a natureza transitria de certos efeitos de IF Na Fig. 7-3, as mudanas no padro de resposta so ilustradas atravs do registro de comportamento de um animal durante intervalos interreforamento selecio nados, obtido nas sesses 24, 68 e 144. A mudana progressiva de uma ondulao gradual para uma ondulao abrupta evidente.
IR 4 min

Figura 7-4. Registros cumulativos de animais em IR 4 min, obtidos nas sesses iniciais (4a. ou 5a.) e Finais (15a., 17a. ou 20a.) (Millenson, 1963).

Contingncias em IF no so raras na vida cotidiana. O contedo de uma panela ferve, aproximadamente, aps um certo tempo fixo que o calor aplicado. Os nibus que andam no horrio reforam a espera dos passageiros no ponto em intervalos fixos. O fato dc o IF no manter um nvel constante de comportamento num perodo de tempo , com freqncia, um obstculo importante para o seu uso no controle prtico do compor tamento. Em cursos universitrios, onde a principal contingncia estabelecida um exame final, muitos estudantes trabalham muito pouco durante o curso. Poucos dias antes do exame final, ocorre um frenesi de atividades. Suponha que os intervalos de tempo entre o reforamento e a prxima contingncia de reforamento tenham duraes aleatrias e sejam imprevisveis. O resultado um novo tipo de procedimento chamado esquema de Intervalo Randmico (IR). Este esquema pode ser especificado apenas pelo intervalo mdio entre o reforamento e o restabele cimento da contingncia. Para dar alguma indicao da variao em intervalos que pode ser encontrada, num esquema de IR 1 min, por exemplo, cerca dc 95% dos intervalos entre o reforamento e as contingncias de reforamento cairo na faixa de 0 a 2 minutos. A exposio inicial a um procedimento IR aps uma histria em crf, produz somente os dois primeiros estgios de transio descritos para a IF na Fig. 7-1. O resul-

- 147 -

tado final em IR uma taxa de resposta estvel e uniforme, cujo registro cumulativo no apresenta desvios sistemticos de uma linha reta (ver Fig. 7-4).

Figura 7-5. Registros cumulativos de respostas para esquemas IV de deflexes de ponteiro, com intervalos mdios, de 15 seg, 30 seg, 1 min e 2 min, respectivamente. Todos os registros so do mesmo sujeito. Km cada caso, o registro apresentado foi feito depois de sesses prvias no esquema (Holland, 1958).

Aproximaes de esquemas IR so frequentemente encontrados fora do laboratrio. Os operadores de radar que observam o osciloscpio para detectar sinais infrequentes encontram-se numa intermitnciasimilar ao esquema IR, Sua resposta o comportamento de observar; o reforamento a descoberta de um sinal. Um caso similar ocorre quando um operador tem de observar o marcador para detectar deflexes infrequentes, mas crticas. Nesses exemplos, pode-se pressupor que o comportamento visvel de observar
- 148 -

segue as leis do comportamento operante, mas ele nem sempre facilmente medido. No procedimento de Holland (1958), sujeitos humanos foram instrudos a examinar um marcador e relatar (pela presso de uma chave telegrfica) cada deflexo observada a partir de um ponto zero. Ambos, marcador e sujeito, todavia, estavam num quarto escuro e o marcador podia ser visto somente aps a presso de uma segunda chave telegrfica que fornecia iluminao por uma frao de segundo. Deste modo, Holland estabeleceu um operante convenientemente mensurvel que se correlacionava com o comportamento de observar do sujeito; para olhar o marcador, o sujeito tinha que pressionar uma chave. Para colocar o comportamento de pressionar a chave sob um esquema similar ao de intervalo randmico, o experimentador programou deflexes no ponteiro (refora mentos) separadas por diferentes intervalos de tempo. Os intervalos no eram propria mente randmicos, mas tinham duraes variadas. O procedimento um exemplo do que chamado um esquema de Intervalo Varivel (TV). Sob as condies de Holland, o esquema manteve taxas de pressionar a chave (resposta de observao) superiores a uma resposta por segundo. Holland pesquisou os efeitos da mudana do intervalo mdio entre asdeflexes programadas do ponteiro. Comeando com um intervalo mdio de 15 seg, ele aumentou progressivamente o intervalo mdio para 30 seg, 1 min e, finalmente, 2 min, em vrias sesses consecutivas. A fig. 7-5 mostra os resultados obtidos com um de seus sujeitos, um homem alistado ha Marinha dos Estados Unidos. Os padres de taxa observados esto de acordo com qs estudos animais sobre os efeitos comportamentais deste esquema (Ferster e Skinner, 1957). Os resultados de Holland na Fig. 7-5 indicam, alm disso, que o IV produz uma taxa de resposta que tende a aumentar medida que o intervalo mdio entre as deflexes (reforamentos) diminui. Uma implicao interessante desta descoberta que, se as deflexes forem transitrias (isto , se durarem apenas pouco tempo), ento menos deflexes sero perdidas (isto , mais sero observadas) quando o intervalo mdio entre elas for pequeno. Ento, um homem que observa uma tela de radar onde os sinais raramente ocorrem tem uma boa chance de perder um sinal transitrio crtico quando este aparece , porque provvel que sua taxa de observao seja baixa. Os resultados da Fig. 7-5 sugerem a possibilidade de se inserir sinais artificiais suplementares para manter a taxa de observao alta, ao nvel que assegurar a deteco de todos os sinais crticos. 7.2 PROBABILIDADE DE REFORAMENTO Um esquema de reforamento pode ser provisoriamente definido como um procedi mento ou plano que determina quando e por quanto tempo uma contingncia de refora mento estar em efeito. Como tal, ele deve ser estabelecido e mantido por um experi mentador. Um esquema de reforamento , assim, um fenmeno de laboratrio. Embora haja esquemas que se assemelhem a algumas intermitncias de reforamento vistas na natureza, o conceito de esquema independente dessas comparaes e tem implicaes que vo muito alm delas. Um esquema de reforamento pode ser considerado um caso idealizado de uma intermitencia de reforamento. Um esquema de reforamento fundamentalmente uma especificao da probabi lidade 'de reforamento para uma resposta selecionada em determinadas ocasies. Na seo anterior, apresentamos contingncias que programavam muoaiias apartir de, epan valores extremos de probabilidade, 0 e 1. Evidentemente, extino outro nome para o valor extremo, probabilidade de reforamento = 1. Nos esquemas de intervalo discu tidos acima, foram estabelecidas contingncias que especificavam uma probabilidade de
- 149 -

reforamento 1 , aps intervalos fixos, randmicos e variveis, durante os quais essa probabilidade era 0. Mas o campo dos esquemas dc refo.amento no , de modo algum, restrito a misturas temporais, embora complexas, dos extremos superiores e inferiores da probabilidade de reforamento. possvel, por exemplo, construir um esquema no qual a probabilidade de refora mento para uma determinada resposta seja a mesma o tempo todo. Certas situaes da vida real aproximam-se desses esquemas de probabilidade constante ou uniforme de reforamento. Os resultados de se atirar uma moeda no viciada ocorrem em tais bases probabilsticas. Numa aposta, por exemplo, uma srie de lanamentos pode ser feita e eventualmente obtm-se o reforador desejado, digamos, cara. Todavia, a cara pode no aparecer em um grande nmero de lanamentos, embora a probabilidade de se obter cara, em qualquer lanamento, seja uniformemente constante e igual a 1/2. A

Tempo (minutos) Figura 7-6. Taxas dc respostas acumuladas quando o bicar c reforado num esquema dc probabilidade* uniforme (dados de J. Farmer).

- 150 -

imprevisibilidade de um lanamento de moeda caracterstica da probabilidade uniforme dc contingncias de reforamento. Apostar e jogar, em geral, so realmente probabilsticos deste modo. Se o bom tempo tido como um reforador e o comportamento de ir ao piquenique efetuado, o reforamento ocorre probabilisticamente. Podemos consultar o departamento de meteorologia para confirmar o nmero de dias bons previs tos para junho. Mas, embora a probabilidade de que faa bom tempo possa ser muito alta, nosso comportamento de ir ao piquenique pode, ainda assim, no ser re fo r a d o com um dia bom. Geralmente, partimos do princpio de que, em qualquer perodo de tempo determi nado, vantajoso para o indivduo ganhar tantos reforamentos quanto possvel. Na extenso em que esta generalizao verdadeira, diante de um esquema de probabilidade uniforme a melhor estratgia responder to frequentemente quanto possvel. Se somos pagos para achar conchas bonitas numa praia, quanto mais conchas examinarmos, mais conchas bonitas encontraremos. Isto verdadeiro seja qual fr a probabilidade de encon trar conchas bonitas. Algumas praias podem permitir-nos uma probabilidade mais alta do que outras, mas, em qualquer praia, ser vantajoso para ns examinar tantos espcimes quanto possvel . Outro modo de dizer isto seria afirmar que vantajoso que o nosso comportamento de examinar/tenha a mxima taxa possvel. Um pombo faminto, exposto a um esquema de probabilidade uniforme de refora mento com alimento desta natureza, rapidamente se ajustar a uma estratgia tima, se a probabilidade fixada no foi muito baixa. O esquema gera taxas de resposta extrema mente altas ("Brandauer, 1958). A figura 7-6 uma amostra de alguns resultados tpicos obtidos neste esquema, onde a probabilidade de receber alimento por bicar era de 1/25. Em alguns momentos na Fig. 7-6, o pombo estava bicando a uma taxa de trs por quatro respostas por segundo p o r oerodos consecutivos. Quando Sidley e Schoenfled (1964) expuseram pombos a vrios valores de probabilidade dc reforamento variando de 1 at 1/160, obtiveram a interes sante funo da Fig. 7-7. Fm seu estudo, a taxa total de respostas foi maior quando a

2.50-

fz.oo1
I

1.50-

o d

8 1.0 0 0.50 0 V 10
l' * ~

0.1000

0.0500

0.0250

00125

0 0068

1 igura 7-7. 1'axas totais dc resposta em funo da probabilidade de reforamento (segundo Sidley e Sclioenfeld, 1964).

probabilidade dc reforamento era 1/10. Probabilidades de reforamentos superiores c inferiores a 1 / 10 , levaram a uma reduo na produo, o que no representa uma estra tgia t ima.

- 151 -

1.3 NOTAS TERICAS SOBRE ESQUEMAS DE REFORAMENTO Podemos resumir a importancia sistemtica das sees 7.1 e 7.2 pela observao de que um esquema um conjunto de regras que especificam: ( 1 ) quando estabelecer uma contingncia de reforamento; (2) quanto tempo mant-la em vigor; (3) qual valor da probabilidade de reforamento atribuir a ela. Quando as variaes nessas trs condies so permutadas com os diversos parmetros de resporta a serem discutidos no prximo captulo, as possveis variaes de procedimento para manter operantes tornam-se enormes. Pressionados no sentido de economizar representaes, os tericos tm desen volvido representaes tais como as da Fig. 7-8 para descrever e relacionar os vrios

Probabilidade uniforme ^ de 1/5___________

j___ ___ t___ j___ I ___ |


Figura 7-8. Probabilidade dc reforamento para uma resposta em funo do tempo desde o reforamento anterior.

esquemas. Na Fig. 7-8, a probabilidade de reforamento para uma resposta dada em funo do intervalo ps-reforamento para cinco dos esquemas que consideramos. (Devemos notar, entre parnteses, que um acordo universal sobre qual a melhor repre sentao de esquemas ainda no foi conseguido entre os pesquisadores neste campo. Ao consultar a literatura, o estudante avanado deve, assim, estar preparado para encontrar outras maneiras de conceituao dos procedimentos deste captulo e do Captulo 8 ). A tareia de descrever ou especificar um vasto nmero de procedimentos de refora mento em termos de poucas variveis manipulveis um de dois problemas relacionados na anlise terica de esquemas. O outro problema est na explicao de como os esquemas geram seus efeitos caractersticos na taxa de resposta. Skinner (1953) salientou que os esquemas so apenas maneiras aproximadas de reforar taxas de resposta. Isto .

- 152-

os esquemas trequentemente so programados de modo a liberar reforamentos numa ocasio cm que o indivduo, provavelmente, estaria respondendo como um certo tipo de taxa, alta ou baixa, dependendo do esquema particular, Dc acordo com a lei familiar do fortalecimento operante, o comportamento que ocorre imediatamente antes do refora mento tem sua probabilidade aumentada ou mantida. Nossa analogia com a concha levou-nos concluso dc que, num esquema de probabilidade uniforme, por exemplo, quanto mais alta a taxa dc resposta, tanto mais provvel torna-se um reforamento num determinado intervalo curto dc tempo. Neste tipo de esquema, ento, uma taxa alta de resposta frequentemente preceder o reforamento. Os esquemas de intervalo, logicamente, apresentam, no conjunto, uma contigurao diferente. Nestes, admitindo-se que o organismo responda pelo menos uma vez por intervalo, taxas mais altas no aumentam a probabilidade do reforamento. Isto porque o restabelecimento da contingncia dc reforamento no intervalo independente do com portamento do animal. Ela estabelecida por um relgio no caso de um esquema IF, e por um contador Geiger ou outra fonte aleatria no caso do esquema IR. Nada que o animal faa pode apressar a liberao do reforamento. De fato, quanto mais tempo o organismo esperar antes dc responder, maior a probabilidade de refora mento quando finalmente ele responder. Num esquema IF por exemplo, a probabilidade de reforamento c igual a 1 /se o organismo esperar todo o perodo de IF^ antes de responder (veja o painel IF, Fig. 7 -8 ). Essas relaes entre esperar c, ento, responder, sugerem que os esquemas dc intervalo agem dc modo a retardar a taxa dc resposta. 7.4 OS EFEITOS DO REFORAMENTO INTERMITENTE NA RESISTNCIA EXTINO

O reforamento intermitente, quando comparado ao crf, leva a um aumento substan cial na resistcncia extino da resposta selecionada. Assim,os esquemas de reforamento fornecem uma tcnica importante para aumentar a persistncia comportamental. Depois do reforamento contnuo da presso barra ou do bicar uma chave, a curva tpica de extino alcana os critrios dc extino comumente empregados por volta de uma hora, durante a qual, na maioria dos casos, apenas poucas centenas de respostas so emitidas. Por outro lado, na Fig. 7-9, os registros dc um animal aps uma histria dc intervalo varivel .(IV) dc reforamento indicam que uma assntota de mais que 3.000 respostas esl sendo gradualmente alcanada depois dc 8 horas.

Figura 7-9. Fxtino aps IV (Skinner 1 5 0 )


- 153-

Os esquemas de probabilidade uniforme de reforamento tambm produzem maior resistncia extino do que crf. Um experimento feito por Weinstock (1954) dizia respeito extino do comportamento aps valores diferentes de probabilidade de reforamento no treinamento. Um aparelho com uma pista, semelhante ao visto na Fig. 7-10
Porta que fecha

foi empregado. Em tal aparelho, um animal colocado na caixa de partida, a porta aberta no momento apropriado e um cronmetro comea a funcionar. Quando o animal entra na caixa objetivo, onde pode encontrar alimento, o cronmetro para e o animal removido quando se deseja. Essa seqncia de eventos chamada uma tentativa. Uma vez que a tntativa realmente continua at que o animal, finalmente, v at a caixa objetivo, a freqncia de resposta no uma medida adequada do comportamento nestas circunstncias. O tempo que gasto para o animal ir do incio at a caixa objetivo, todavia, relevante e facilmente mensurvel. Essa medida um caso do que chamaremos tempo de reao. Ela contm certas similaridades com a latncia, uma vez que o tempo entre uma mudana ambiental (a porta aberta) e uma resposta (entrada na caixa objetivo). Mas, a latncia reservada para uma descrio de respondentes e o tempo de reao reservado para a descriao de operantes Weinstock (1954) treinou 4 grupos de ratos a correrem num aparelho similar ao da Fig. 7-10. A cada grupo foi dada uma de quatro probabilidades fixas diferentes de encontrar alimento na caixa objetivo, p - 1,0: 0,8; 0,5 e 0,3. Assim, o grupo 1,0 encon trava alimento em cada tentativa (crf), o grupo 0.8 encontrava-o em 80? das tentativas, c assim por diante. Depois que todos os animais haviam sido treinados a correr, aparente mente, na sua velocidade mxima, iniciou-se a extino, retirando-se o alimento da caixa objetivo. Apenas uma tentativa era efetuada por dia. Os resultados indicam que o grupo 1,0 foi o mais rpido para extinguir, isto , aps poucas tentativas(4 ou 5), esses animais passaram a gastar muito tempo para atravessar a pista, se que chegavam a faz-lo. A ordem da extino seguiu a ordem inversa da probabilidade. Quanto menor a probabili dade, mais tempo persistiu o comportamento condicionado de correr. O grupo 0,3 foi o
-154-

que levou mais tempo para que seu comportamento de correr fosse enfraquecido pela extino. Na faixa das probabilidades pesquisadas, portanto, a diminuio da probabili dade de reforamento aumentou a resistncia extino, medida pela volta da veloci dade do correr ao nvel operante. Note que esta proporcionalidade inversa no pode ser mantida abaixo de algum valor mnimo de probabilidade porque, se a probabilidade de reforamento se torna muito pequena (aproximando-se de 0 ), o fortalecimento original ser impossvel. Por que as contingncias intermitentes aumentam a resistncia extino? Uma explicao prende-se observao de que, depois de uma histria de reforamento inter mitente, a extino no parece muito diferente do procedimento de fortalecimento real. Durante um reforamento intermitente de qualquer tipo, ocorrero perodos de extino quando nenhum reforamento estiver disponvel para a resposta. Nesse sentido, toda a histria de reforamento intermitente do animal lhe diz que um perodo de extino leva, eventualmente, ao reforamento. Na verdade, o esquema ensinou perseverana ao animal. 7.5 OUTROS EFEITOS COMPORTAMENTAIS DO REFORAMENTO INTERMI TENTE / Os esquemas de reforamento so, obviamente, procedimentos que manipulam taxas de resposta. bastante surpreendente que a maioria de nossas informaes sobre seus efeitos comportamentais seja derivada de anlises de taxas de resposta durante e em seguida exposio a eles. Ainda assim, vlida a questo de como tais procedimentos afetam a constelao total de comportamentos de um indivduo. Uma resposta parcial poderia ser na forma de proposies que descrevem como os esquemas afetam proprie dades do comportamento tais como a topografia da resposta, a magnitude da resposta a ordem seqencial do responder, etc. Lane e Shinkman (1963) estudaram os efeitos de um esquema IVsobre a amplitude e durao do p ia r no pinto. Este operante foi inicialmente fortalecido pelo refora mento de cada piar no pinto, por um pintinho faminto, com uma breve apresentao de alimento. Seguindo-se esse treino, o piar foi reforado intermitentemente num esquema de IV 100 segundos. Na fase final do experimento, o piar foi extinto. Os resultados mostraram que a durao e amplitude da resposta de piar eram altamente estereotipadas durante o crf, tomando-se significativamente mais variveis durante o procedimento IV Mas a extino produziu um nvel ainda mais alto de variabilidade nas medidas das respostas. Quando a durao da presso barra de um rato foi analisada sob esquemas de probabilidade uniforme, notou-se que ela era extremamente estereotipada sob crf, algo mais varivel durante contingncias de probabilidade uniforme e extremamente varivel na extino (Millenson, Hurwitz e Nixon, 1963). Os dados parecem apoiar a generalizao de que a variabilidade de comportamento parece aumentar progressivamente sob condies de crf, esquemas intermitentes e extin o, nesta ordem. 7 6 ESTADOS ESTVEIS DO COMPORTAMENTO Na maior parte de nossa anlise precedente do comportamento, enfatizamos a impor tncia de certos procedimentos comportamentais e dos processos comportamentais carac

-155-

tersticos associados a eles. Desta maneira, examinamos os processos de condicionamento Pavloviano e operante e da extino. Neste captulo vimos que os estados transitrios que so os produtos iniciais da exposio a esquemas de reforamento constituem um conjunto distinto de processos comportamentais. Embora tais processos sejam impor tantes no estudo do comportamento, seus pontos finais so, pelo menos, de igual impor tncia. Assim, um reforador definido tanto em termos de sua capacidade de manter 0 compoitamento nos padres caractersticos do esquema como em termos de sua capa cidade de aumentar as taxas de respostas durante o processo de fortalecimento operante. A manuteno do comportamento por contingncias intermitentes aproxima-nos dos nossos prprios comportamentos cotidianos, muitos dos quais foram fortalecidos ou adquiridos no passado remoto e mantidos, da em diante, por reforamento intermitente. No laboratrio, esta manuteno permanente do comportamento pode ser melhor descrita pelos chamados estados estveis. As medidas comportamentais atingem estados estveis ao final de seu processo' ou aspecto transitrio. Por exemplo, as curvas da sesso 144 da Fig. 7-3, provavelmente, representam um estado estvel do comportamento sob as contingncias de IF Similarmente, as curvas de IV da Fig. 7-5 parecem ser representativas do desempenho final nesses tipos de esquemas. Um esquema IV ou IR pode gerar taxas estveis moderadas de resposta por longas sesses, dia aps dia, indefini damente. O fato de que os esquemas podem levar a estados estveis de comportamento, que podem ser mantidos indefinidamente, sugere que esses estados podem servir como linhas-base adequadas, a partir das quais pode-se avaliar os efeitos de numerosas variveis sobre o comportamento. A noo de uma linha-base bastante familiar. O nvel operante foi usado como linha-base para determinar se o fortalecimento de uma resposta ocorreu. Podemos usar um desempenho que est sendo mantido no momento por um esquema como uma linha-base. Em captulos posteriores, os efeitos das mudanas de estmulo, contingncias interpoladas e de outros procedimentos em tais linhas-base ajudaro a definir muitos conceitos psicolgicos importantes. Como uma ilustrao da tcnica geral, devemos nos contentar, no momento, com uma demonstrao do efeito de uma droga tranquilizante sobre o comportamento estvel. Dews (1955) estudou o efeito do pento barbital no responder estvel de pombos em IF Depois de ter exposto os pombos s contingncias IF 15 minutos o bastante para o surgimento de um padro estvel, Dews injetou pequenas quantidades de droga nos animais durante certas sesses. Observou, ento, os efeitos no padro de IF Neste experimento, a varivel independente foi a quantidade de droga injetada e a varivel dependente foi a mudana no comportamento a partir do estado normal cm IF (ver Figs. 7-2 e 7-3). Para estar certo de que qualquer efeito observado pudesse ser atribudo apenas droga e no ao distrbio causado pela propria injeo, uma soluo salina foi injetada nos animais em outras sesses At um certo nvel de concentrao de droga, Dews no observou efeitos no comportamento o desempenho continuou semelhante aquele sob o IF normal. Com concentraes acima de 1 mg de pentobarbital, ocorreu uma mudana significativa. A taxa total foi reduzida em cerca de 75%, e a ondulao caracterstica do IF foi praticamente perdida, sendo substi tuda por uma taxa de resposta constante e muito baixa atravs do intervalo fixo. Este um exemplo relativamente simples dc uma sub-areada cincia do compor tamento aplicada muito ampla e em expanso, conhecida como psicofarmacologia o estudo da ao de drogas no comportamento. Muitas firmas farmacuticas mantm atual mente laboratrios comportamentais exclusivamente para o estudo dos eteitos de novas
-156-

drogas no comportamento animal. Na explorao de uma nova droga, muitas linhas-base devem ser usadas. Uma droga no afetar todos os padres de comportamento da mesma forma. At aqui, no mencionamos muitos estados de lnha-base, mas os seguintes pro cessos que estudamos terminam em estados estveis estatsticos, que podem ser usados como linhas-base: L 2. 3. 4. 5. 6. Esquemas de intervalo Esquemas probabilsticos Condicionamento e extino sucessivos A prpria extino A seqncia comportamental vista em elos simples de comportamento A topografia e magnitude do comportamento sob crf.

REFERNCIAS PARA O CAPTULO 7 Brandaucr, C. M. The effects of uniform probabilities of reinforcement on the response rate of the pigeon. Unpublished doctoral disserta tion, Columbia Univer.,/1958. Cumming, W. W., and Schpenfeld, W. N. Behavior under extended ex posure to a high-value fixed interval reinforcement schedule. /. exp. Anal. Behav., 1958, 1, 245-263*. Dews, P. B. Studies on behavior. I. Differential sensitivity to pentobarbital of pecking perform ance in pigeons depending on the schedule of reward. J. Pharmacol, exp. Ther., 1955, 113, 393-401. Ferster, C. B., and Skinner, B, F. Schedules of reinforcement. New Y ork: A ppleton-Century-Crofts, 1957. Holland, J. G. H um an vigilance. Science, 1958, 128, 6 1-67. Lane, H. L., and Shinkman, P. G. Methods and findings in an analysis of a vocal operant. J. exp. Anal. Behav., 1963, 6 , 179-188. Millenson, J. R. Random interval schedules of reinforcement. J. exp. Anal. Behav., 1963, 6 , 437-443. Millenson, J. R., Hurwitz, H. M. B., and Nixon, W. L. B. Influence of reinforcement schedules on response duration. J. exp. Anal. Behav., 19ul, 4, 243 250. Sidley. N. A., and Schoenfeld, W. N* Behavior stability and response rate as functions of reinforcement probability on random ratio schedules. J . exp. Anal. Behav., 1964, 7, 281-283. Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950, 57, 193-216. ~ Skinner, B. F. Science and human behavior . New Y ork: M acmillan, 1953. Weinstock, S. Resistance to extinction of a running response following partial reinforcement under widely spaced trials. J . comp, physiol. Psychol., 1 9 5 4 ,4 7 ,5 1 -5 6 .

- 157-

Captulo 8 A ESPECIFICAO DA RESPOSTA

Nas sees precedentes, limitamos nossa anlise sobre a modificao comportamental quelas mudanas dos comportamentos que j existiam com alguma fora maior que zero antes do condicionamento. Agora o momento de abandonar esta restrio simplificadora e arbitrria do paradigma de condicionamento operante, verificando como um novo comportamento, no existente antes no repertrio do indivduo, adquirido. Antes de proceder ao estudo deste processo de aquisio, entretanto, necessrio uma explicao adicional do termo resposta operante e seus componentes. 8.1 A DEFINIO DE CLASSES DE RESPOSTA Uma das razes pelas quais a cincia do comportamento demorou a se desenvolver, baseia-se na prpria natureza de seu objeto. Ao contrrio do tecido renal, cristais jde sais, baterias, o comportamento no pode ser facilmente retido para observao. Em vez disso, os movimentos e aes dos organismos parecem fluir numa corrente contnua, sem incio e fim definidos. Quando um rato se move da frente para o fundo de sua gaiola, quando voc dirige seu carro 400 km sem parar, quando voc prega um boto, difcil identificar pontos na correnie comportamental contnua, onde as unidades naturais do comporta mento possam ser consideradas fracionadas. Uma complicao adicional que noh duas aes de um organismo que sejam exatamente iguais, porque nenhum comporta mento repetido exatamente. O problema da conceituao das unidades fundamentais de uma corrente comporta mental contnua, no repetitiva, baseia-se na prpria estrutura da cincia. Para submeter o comportamento a uma anlise cientfica isto , de modo a ser possvel prediz-lo e control-lo precisamos dividir nosso objeto de estudo de tal modo que alguma coisa fixa e reproduzvel possa ser conceituada. Os mtodos da cincia so reservados para eventos reproduzveis. Tanto o termo evento como seu qualificador reproduzvel so conceitos cientficos bsicos. Temporais, cargas eltricas, fluidos, molculas, planetas, instituies sociais, etc; so a matria prima das cincias. Embora dois temporais e dois governos democrticos no sejam exatamente iguais, necessrio agrupar eventos seme lhantes, embora no idnticos, numa nica classe e cham-los temporais ou governos democrticos . Atravs do uso de tais artifcios, no somente a meteorologia e a cincia poltica, mas todas as cincias, estabelecem conceitos em termos dos quais se enquadram
- 159 -

suas leis, generalizaes e, previses. A conceituao dc comportamento em termos de tais classes, anlogas aos conceitos de classe dc outras cincias, , assim, uin pr-requisito para uma cincia do comportamento capaz de descobrir leis, fazer generalizaes e previses. Em se tratando do comportamento, podemos algumas vezes iniciar, classificando numa nica categoria um conjunto de comportamentos que so correlacionados com o mesmo estmulo. Assim, podemos observar as flexes sucessivas da perna, em resposta a um toque bem definido no joelho e, embora notando suas diferenas, decidir chamar de resposta patelar classe (conjunto) de todos os movimentos que ocorrem com uma durao entre os limites de 1/5 a 1 seg. e que caem numa faixa de ngulos ( a ) de 5 a 30 graus (ver Fig. 8-1). Ao admitirmos essa classe, nossa esperana incluir todos, ou quase todos os comportamentos que esto de fato correlacionados com este eliciador parti cular. Obtivemos os movimentos sucessivos atravs da eliciao repetida, usando o mesmo estmulo eliciador com intensidade, durao e localizao fixas, e assim por diante Embora a classe, que assim formada, parea ser um agrupamento de movi mentos aparentemente semelhantes, sua definio formal apenas a classe de movi mentos que ocorre a um dado estmulo.

Figura 8-1. Diagrama esquemtico da faixa de movimentos que inclui todos os compor tamentos que so chamados Reflexos Patelares .

Tal classe , naturalmente, um respondente e, neste caso, ela define o respondente patelar. Para definir estas classes de comportamento, necessrio conceituar certas dimen ses atravs das quais os comportamentos possam ser descritos e medidos. Da mesma forma que uma mesa exaustivamente descrita atravs da medida de sua largura, compri mento, altura, nmero de ps, cor, peso, densidade da madeira, nmero de gavetas e assim por diante, assim tambm uma amostra de comportamento pode ser exausti vamente descrita pela medida da posio e. orientao do organismo em referncia a partes de seu ambiente, os movimentos que esto ocorrendo, o perodo de tempo que eles preenchem, a intensidade e freqncia com que ocorrem e assim por diante. Mesas particulares e amostras particulares de comportamento podem, ento, ser descritas por sua configurao nica de valores dimensionais. Parece, assim, que as classes de mesas e de amostras comportamentais do tipo X so determinadas pelo estabelecimento de
- 160 -

restries, limites e condies ao longo de certas dimenses, de modo que todas as coisas que desejarmos chamar mesas e comportamentos do tipo X, respectivamente, incluir-se-o, com certeza, nessas classes. Assim, as mesas deveriam ter, digamos, um ou mais ps (uma condio), deveriam ser feitas de material slido, ao invs de lquido ou gasoso (uma restrio), ter uma superfcie plana (uma restrio), ter um comprimento maior que 30 cm e menor que 35 m (um limite), e assim por diante. Da mesma forma, os comportamentos do tipo X poderiam incluir, digamos, qualquer movimento para baixo (uma restrio) do brao esquerdo (uma condio) que esteja entre 15 a 100 gramas de fora (um limite) e que no exceda a 1/2 seg. de durao (uma restrio) e assim por diante. Mencionamos exemplos de dimenses do comportamento tais como posio, durao e fora da resposta, em sees anteriores. Essas dimenses foram usadas para descrever a variabilidade de comportamento no nvel operante, fortalecimento, extino e esquemas de reforamento. Algumas dimenses como posio, ngulo, localizao e orientao do comportamento so chamadas dimenses topogrficas, uma vez que uma relao de seus valores em qualquer momento determinado especificar a forma exata do comportamento. A especificao do valor dessas dimenses, em qualquer momento determinado, d o tipo de informao fornecida por uma fotografia do organismo surpre endido em ao. Tendo apreendido a forma esttica do comportamento atravs das variveis topogrficas, podemos usar as dimenses dinmicas tais como a velocidade, fora, durao e taxa de repetio do comportamento para descrever, ainda mais, uma amostra particular do comportamento. Em princpio, uma amostra de comportamento poderia ser completamente descrita por uma especificao dos valores de todas as dimenses pertinentes ao comportamento. Esta descrio, em relaio a uma e-xplicao mais completa, estaria, sem dvida, precisamente na mesma relao que h entre um instantneo e um filme. Na prtica, uma descrio exaustiva do comportamento rara mente tentada. Quando a topografia ou forma de interesse principal, deve-se recorrer ao uso de dispositivos para fotografar o comportamento, mas uma anlise quantitativa de uma ou duas dimenses comportamentais representativas ser, em geral, preferida. No caso do reflexo patelar, a especificao da classe de comportamento em termos de apenas duas dimenses parece suficiente para uma aproximao adequada. Uma dessas dimenses constitui o ngulo da perna em relao posio de descanso; a outra dimenso a durao do movimento. Em geral, a especificao experimental de um fragmento do comportamento nunca mais que parcial, sendo que os valores de muitas dimenses ficam indeterminados. Para formar as classes ou unidades para expressar as leis, generalizaes e previses do comportamento emitido, uma estratgia diferente daquela usada para definir respon dentes deve ser adotada. No comportamento no eliciado, podemos iniciar pela definio de um conjunto algo arbitrrio de comportamentos que preenchem certas restries e condies e que caem dentro de certos limites ao longo das dimenses especificadas da resposta. Nossos critrios originais para agrupar certas amostras de comportamento podem estar baseados em pouco mais do que a observao superficial de que o conjunto de comportamentos, que cai no que descrevemos como tipo X, poderia ser uma classe de algum interesse. Tendo formado essa classe arbitrria, deve-se solicitar agora - no um eliciador, porque no existe um - mas um reforador, para a confirmao de que a classe que arbitrariamente selecionamos funcionar realmente como uma unidade. Isto , pros seguimos aplicando a operao de reforamento em fragmentos sucessivos do comporta
- 161 -

mento tipo X, como definido. Cada membro da classe ser, sem dvida, um pouco diferente de qualquer outro e, por essa razo, chamado uma variante. Preparamo-nos para tais diferenas ao especificar os limites (e no valores exatos) dentro dos quais reforaramos. Se o reforamento, agora, afeta o comportamento de modo a fortalecer seletivamente uma classe de comportamentos, estamos certos ao referirmo-nos a esta classe como uma classe de resposta operante, ou mais simplesmente como um operante. Considere alguns exemplos. Poderamos definir os limites de uma certa classe de movimentos e tentar reforar todos os movimentos dentro dos limites. O reforamento de uma classe de extenses do brao ocorre nos movimentos de pegar. As palavras so exemplos proeminentes da formao de classes arbitrrias de resposta. Todos os sons que caem dentro de certos limites aceitveis (portanto, so produzidos pela ao muscular dentro de certos limites aceitveis), constituem as palavras faladas "por favor". Quando uma criana enuncia e pronuncia as palavras corretamente (isto , emite uma variante que cai na classe desejada), o reforamento liberado e a classe de movimentos que produz por favor fortalecida. Na natureza, parece pouco provvel que o reforamento seja sempre contingente um conjunto restrito de limites do modo descrito acima. No laboratrio, o reforamento poderia ser tornado contingente a um subconjunto restrito de comportamentos definidos pelas limitaes dimensionais. Mas, mesmo a, as unidades so estimadas de modo mais geral, classificando juntos todos os movimentos que atuam, pelas leis da mecnica simples, para produzir uma mudana especfica no ambiente. Portanto, todos os movi mentos que pressionam uma barra, ou um disco, ou uma chave telegrfica, ou que conduzem um rato do incio ao fim de uma pista, giram uma roda, ou colocam acar numa chcara de caf, servem para limitar efetivamente a topografia do organismo de tal modo que se consegue uma estimativa da classe topogrfica especificada. Isto verdade, simplesmente porque h limites nas maneiras possveis de se fazer todas essas coisas. Se construmos nosso aparelho com cuidado, os comportamentos possiveis que poderiam produzir as mudanas ambientais especificadas sero bastante limitados e, portanto, for ados a terem uma forma razoavelmente semelhante. (Os comportamentos de enfiar linha numa agulha so mais limitados que os de fechar uma porta). Na medida em que restrin gimos nossas dimenses, os comportamentos que constituem a classe tero semelhanas topogrficas da mesma forma que os respondentes tem naturalmente. Todavia, a nica
exigncia formal para um operante que ele seja uma classe de comportamento susce tvel, como classe, de reforamento. Se especificamos uma classe que no pode ser

fortalecida ou mantida pelo reforamento de seus membros, tal classe no constitui uma resposta operante, seus membros no so variantes da resposta e, presumivelmente, no se presta para o uso no estudo do comportamento operante. Isto verdade se uma especificao dos limites do comportamento fr feita em termos de limitaes dimensio nais ou de alguma mudana ambiental necessria que o comportamento deva produzir. Operantes, ou respostas operantes (respostas, para simplificar, se voc se lembra de que respostas no significam responder a ), ento, so as classes de comportamento, suscet veis ao reforamento, que formam as unidades fundamentais de anlise de uma grande parte das aes humanas c animais. Na definio de operantes como uma classe de comportamentos sensveis de refora mento, nenhuma lgica exclui a definio de subclasses ou superclasses de operantes contidos em ou que contem qualquer classe operante particular, previamente definida. Esta flexibilidade no modo pelo qual os conjuntos comportamentais bsicos
- 162-

podem ser subdivididos em conjuntos menorjs, ou combinados para formar conjuntos maiores, ser de grande importncia quando examinarmos os limites extremos aos quais os conceitos de operante podem ser estendidos. Portanto, a definio de um operante, em si mesma, no coloca qualquer restrio 3obre a amplitude de uma classe de resposta, em termos da quantidade de comportamento abrangida por ela. Como veremos na seo 8.5, classes que consistem de contraes musculares muito breves para serem observveis pelo sujeito que as emite, podem vir a funcionar como operantes. No outro extremo, seqncias longas de aes parecem funcionar como classes nicas de operantes. Sob algumas condies, ser possvel falar de tricotar um suter, escrever um livro, ou caminhar para o trabalho, como operantes. Extenses do conceito de operante a tais operantes de grande escala s agora esto sendo exploradas no laboratrio. 8.2 UMA DEFINIO DE RESPOSTA OPERANTE EM TERMOS DA TEORIA DOS CONJUNTOS

Uma definio alternativa do operante, compatvel com a exposio precedente, iOrnecida, aqui, na notao da teoria dos conjuntos (ver seo 8.9). Considere o conjunto de todas as amostras de comportamentos possveis.

U
Neste conjunto U, vamos definir o subconjunto de comportamentos, B, que est dentro dos limites preestabelecidos La Lb, Mc - Md,-- , e tem restries ou condies tais que a forma do comportamento deve ser N, O, ..., onde as letras maisculas L, M, N, O, significam as dimenses do comportamento e os ndices especificam os limites supe riores e inferiores dessas dimenses. Ento, este subconjunto pode ser representado por

Como um meio alternativo de definir B, podemos considerar todos os comporta mentos que completam um determinado resultado ambiental, S, para constituir o sub conjunto B. Considere uma tentativa de reforar amostras sucessivas do subconjunto B. Se o fortalecimento dos membros do subconjunto, R, de comportamentos, agora, ocorre ( como evidenciado por um aumento seletivo na sua freqncia, uma mudana na sua ordem seqencial em relao a outros comportamentos, e assim por diante), ento, este subconjunto R ser conhecido como um operante e os membros observados de R sero identificados como variantes da resposta operante. Se nenhum fortalecimento de um subconjunto R ocorre, ento B c considerado apenas um subconjunto especfico de comportamentos, destitudo de importncia emprica para a anlise do comportamento. Dado um operante R, possvel definir um subconjunto, r, tal que cada membro em r seja tambm um membro de R.
- 163-

Na prtica, pude-se verificar que muitos desses subconjuntos r ^ r j podem ser operan tes em si mesmos, pela definio anterior. Desde que, todavia, a definio de um operante depende de se observar o fortalecimento pelo reforamento e desde que o* fortalecimento definido em relao a outros comportamentos (ver seo 4.4), o limite at o qual o fracionamento e/ ou subdiviso da classe R pode ser ampliado estabelecido pelo ponto no qual no possvel fortalecer um dado subconjunto ri sem igual fortaleci mento de qualquer outro ij. Evidentemente, isto determina o limite inferior da definio de uma classe de operante. Uma operao oposta admissvel. Dado o operante R, possvel descobrir (ou criar) um superconjunto R de ordem superior, que contm todos os membros de R, alm de outros comportamentos.

\ssim, embora os movimentos para pressionar uma barra possam funcionar como um operante, os movimentos de pressionar uma barra vinte e cinco vezes podem funcionar como um operante de orc1 em superior, R. Da mesma forma, os movimentos de pressionar uma barra, seguidos pelos movimentos de puxar uma corrente, podem funcionar como um operante de ordem superior. Novamente, os limites aos quais os operantes podem ser estendidos dessa maneira so estabelecidos apenas pelos limites da suscetibilidade com portamental ao reforamento. 8.3 O PARADIGMA DA DIFERENCIAO O reforamento exclusivo daqueles fragmentos de comportamento que esto dentro dos limites e que tm as restries e condies estabelecidas pelas dimenses comporta mentais conhecido como o procedimento de diferenciao de resposta. Assim, o forta lecimento de comportamentos tais como bicar o disco por pombos, pressionar a barri por ratos, pegar os brinquedos pela criana, envolvem diferenciao de resposta. O que chamamos at aqui de fortalecimento operante um caso especial de diferenciao .de resposta. Para avaliar os vrios aspectos quantitativos da diferenciao de resposta, til examinar um caso em que a especificao da classe comportamental a ser reforada feita cm termos de uma nica dimenso comportamental. Na definio do pressionar a barra por um rato, a fora mnima requerida para que a barra seja pressionada pode quase sempre ser especificada. Essa fora mnima um exemplo do limite inferior de uma dimenso comportamental. Se a fora mnima fr bastante baixa, o nvel operante dc pressionar a barra ser maior que zero e o fortalecl-

- 164-

(A)

1
^3 17 21 25 29 33

1
37

41

45495357

(B)

8
21

8
25

I
29

l 1
33

i 1
37 41 45

1
49

i
53

i
57

13

17

Intensidade das presses, em gramas


Figura 8-2. Distribuio de fora de resposta, quando todas as foras acima de 21g (A) e acima de 36 g (B) eram reforadas ( segundo Hays e Woodbury, cita do em Hull, 1943).

mento da classe operante de pressionar a barra proceder exatamente como descrito no Capitulo 4. Hays e Woodbury (citados em Hull, 1943) realizaram um experimento de fortalecimento semelhante, empregando uma fora mnima de 21 gramas. Depois que o processo de fortalecimento havia estabilizado, eles obtiveram respostas distribudas ao longo da dimenso fora, como visto no histograma superior da Fig. 8-2. A Fig. 8-2A mostra nada mais que a variabilidade familiar que caracteriza o comportamento, mesmo quando este reforado em condies de crf. Em (A), as foras emitidas esto distribudas quase simetricamente em torno de um ponto cerca de 8 g acima do limite inferior da classe de resposta operante. Note que poucas presses (representadas por crculos vazios na Fig. 8-2) no alcanam adequada mente o critrio de uma resposta e, portanto, no so reforadas. Quando os experimentadores estavam convencidos de que a Fig. 8-2 representava o estado final estvel do comportamento sob suas condies, eles aumentaram a fora mnima requerida para 36 g O resultado dessa mudana na classe de resposta foi o ajustamento do comportamento do rato mostrado no histograma da Fig. 8-2B. A distribuio de foras deslocou-se para os valores maiores e centralizou-se em aproximadamente 41-45 g. O condicionamento desta nova classe de comportamento foi bem sucedido; a condio necessria para conferir classe o 'status' de uma resposta operante foi alcanada. Houve uma outra conseqncia importante desse condicionamento. Novas foras emitidas, nunca antes vistas no repertrio do animal (aquelas alm de 45 g), ocorrem agora com freqncia moderada.

- 165-

O procedimento dc diferenciao resultou no aparecimento e estabilizao de um conjunto de novos comportamentos. Como isto ocorreu? Dois processos com piemen ta res parecem ser responsveis. Primeiro,observe que, no momento em que foi colocada em efeito, a nova condio de 36 g incorporava algumas foras existentes (veja a extremidade direita da Fig. 8-2A). Esperar-se-ia que o fortalecimento desses comportamentos com foras maiores que 36 gramas os manteria. Se esta condio no tivesse sido alcanada, quase que certamente teria ocorrido a extino normal. Ento, em segundo lugar, o mnimo de 36 g excluiu muitas foras anteriormente reforadas. Quando presses barra com essas foras anteriormente reforadas foram emitidas sob o procedimento de 36 g no mnimo, elas foram extintas. Lembre-se que um dos resultados do procedimento de extino um aumento na variabilidade do comportamento (seo 5.2). A extino das foras de 21-36 gr anteriormente reforadas, tenderia, assim, a produzir novas foras, tanto superiores quanto inferiores quelas usualmente emitidas.A emisso de foras muito baixas no teria conseqncias no experimento presente, mas a emisso de foras muito altas teria conseqncias reforadoras e, logo, seria fortalecida. Eventualmente, esses dois processos ( 1 ) extino diferencial e ( 2 ) fortalecimento diferencial que interagiam ao longo da dimenso fora, conduziram estabilizao comportamental na forma do histograma (B) da Fig. 8-2. A extino teve um papel duplo, crucial nessa diferenciao de presses barra mais fortes. (1) Agiu de modo a trazer novas e excepcionais variantes da resposta, algumas das quais com possibilidades de serem reforadas. (2) Agiu de modo a enfraquecer o compor tamento ao longo da poro da dimenso onde o reforamento havia sido suspenso. Como outros paradigmas comportamentais, a diferenciao tem uma definio completa apenas na especificao de seu dado, procedimento, processo e resultado. DADA: PROCEDIMENTO: uma classe de comportamento sendo emitida com alguma fora maior que zero. aplicar o reforamento a* um subconjunto de variantes dessa classe e submeter o resto ao procedimento de extino. fortalecimento gradual das variantes reforadas e o e n fraq u e cim e n to gradua! do grupo dc variantes submetidas a extino. uma distribuio estabilizada das variantes reforadas cuja fora excede aquela das variantes no reforadas.

PROCESSO:

RESULTADO:

O procedimento de diferenciao no precisa ser necessariamente aplicado como o foi no experimento de Hays-Woodbury. Tudo o que necessrio, pela nossa definio, que um subconjunto de variantes seja reforado e um segundo subconjunto extinto e que,juntas, essas duas possibilidades esgotem todas as variantes. Na Fig. 8-3, vrias possibilidades so vistas esquematicamente. Somente (A) corresponde ao caso de Hays-Woodbury.

Lxcrccio 5. Prediga os efeitos do procedimento de diferenciao aplicado, da manei ra mostrada, em cada um dos casos da Fig. 8-3, esboando novas distribuies de vari antes da resposta.
- 166 -

Dimenso comportamental Figura 8-3. Algumas aplicaes possveis de reforamento e extino a variantes de R. As regies reforadas esto sombreadas.

Um caso semelhante au da Fig. 8-3D foi descrito por Keller e Schoenfeld (1950). Uma mquina de jogo foi modificada para permitir uma medida precisa de quanto o mbolo era puxdo antes de ser solto. Variaes nos limites inferiores superiores da resposta foram exploradas e o reforamento para as variantes corretas era um 1flash?'de luz aps a liberao do mbolo. Pode-se selecionar uma faixa de variantes qual os refora mentos sero aplicados, to estreita que um fortalecimento seletivo dessa faixa particular no obtido. Pelo contrrio, as variantes mais prximas da faixa de reforamento manter-se-o com foras iguais 'aquelas da faixa reforada. Nessa situao, o experimen tador atingiu as restries mnimas para a definio de uma classe de resposta. Acima desses limites, os resultados confirmam, todavia, a lei: tudo o que reforado tambm
fortalecido.

Herrick (1963) projetou a barra vista na Fig. 8-4 para estudar o deslocamento da presso barra. As presses realizadas por um rato moviam uma barra em T descrevendo um arco, enquanto um circuito eletrnico registrava o deslocamento mximo de cada presso. A distncia mxima que a barra percorria em cad.: presso foi classificada em uma de oito zonas. A barra foi planejada de um modo que, quanto maior o nmero da zona, maior a quantidade de trabalho exigida do rato.

Figura 8-4. Barra usada para estudar o deslocamento da resoost*

Num experimento, Herrick (1964) primeiro reforou as presses includas em qualquer zona de 1 a 8 . Os resultados de um rato so vistos na Fig. 8-5A. Uma ampla faixa de deslocamentos foi obtida. A faixa das posies reforadas foi, ento, progressivamente, limitada. Quando somente as posies 3-6 eram reforadas, obteve-se o histograma da Fig. 8-5B. A distribuio dos deslocamentos foi um pouco mais estreita; no obstante, o rato manteve a maior parte de suas presses dentro dos limites reforados. Mais alm, nas sries experimentais, os nicos deslocamentos reforados foram aqueles na zona 5. Os resultados so vistos na Fig. 8-5C. As presses na faixa reforada foram muito freqentes mas ocorreram numerosas presses nas zonas no reforadas. Um efeito interessante visto no histograma da Fig. 8-5B que as zonas prximas dos limites inferiores de refora mento (zonas 3 e 4) incluem mais comportamentos do que as zonas prximas dos
36

18

r-n 1 2
c 54 o
36

4
(A)

18

E 0 >

1 2

4
(B)

(C) Zona da barra I'igura 8-5. Distribuio dos deslocamentos da barra em funo do tamanho da regio reforada. s sombreadas do histograma indicam as zonas da barra nas regies reforadas (segundo Herrick, 1964)

- 168-

limites superiores da zona de reforamento (zonas 5 e 6 ). Este fenmeno pode ser interpretado como uma tendncia do rato de dlspender menos esforo : dadas duas zonas de reforamento, aquela que exigir a menor condio de trabalho ser a mais fortalecida. 8.4 APROXIMAO SUCESSIVA O maior poder do procedimento de diferenciao consiste na sua habilidade para criar e, ento, manter comportamentos ainda no observados no repertrio do animal. Este poder estende-se mais alm nos casos em que diferenciaes progressivas e graduais podem ser feitas no decorrer do tempo. No exemplo de Hays-Woodbury e nos exemplos da Fig. 8-3, uma diferenciao com um passo foi pretendida. Mas um segundo procedi mento de diferenciao pode ser feito a partir dos resultados da primeira, e assim sucessi vamente, de modo a produzir, eventualmente, comportamentos qu podem ser muito diferentes das formas originais. A menos que a histria de diferenciao sucessiva fosse conhecida, seria difcil explicar o aparecimento desses comportamentos. Um beb inicia a vida com um repertrio de todos os sons bsicos usados nas vrias lnguas, mas seu balbucio e murmrio so muito diferentes da pronncia adulta de uma frase em portu gus. Ainda mais, o aparecimento de sentenas precedido pelo de palavras, palavras pelo de sons silbicos e estes so diferenciados a partir da corrente de sons rudes emitidos pelo recm-nascido. As diferenciaes progressivas e graduais que se fazem sobre os resultados de cada diferenciao prvia e que, gradualmente, conduzem o comportamento a alguma forma final desejada, so conhecidas como aproximaes sucessivas do comportamento, final ou de modo mais simples modelagem do comportamento. O processo represen tado esquematicamente na Fig. 8 -6 . Pela ensima diferenciao, a distribuio de variantes obtida parece, para o observador casual, no ter relao alguma com a distri buio original da resposta. Contudo, as origens da ensima distribuio baseiam-se no fortalecimento c extino sucessivos dos predecessores dessas variantes. Sem esta histria causal a distribuio final na Fig. 8-6 nunca teria surgido

Dimenso da R Figura 8-6. Representao esquemtica de diferenciaes progressivas (aproximaes sucessivas) ao longo de uma dimenso quantitativa da resposta. As reas sombreadas representam as variantes reforadas.
- 169-

A diferenciao sucessiva deve ter um limite superior, determinado pela capacidade do organismo. Mas, dentro dos limites dessas restries de capacidade, a aproximao sucessiva de uma forma final de comportamento um mtodo extremamente poderoso para produzir comportamento. Atravs deste processo de aproximao -sucessiva na dimenso fora da barra, Skinner (1938) foi capaz de treinar um rato de 200 g a realizar o feito hercleo de pressionar uma barra que requeria o mnimo de 100 g de fora. Nem a diferenciao nem a aproximao sucessiva esto limitadas a mudanas ao longo de uma dimenso quantitativa da resposta. Mesmo que a topografia, ou forma do comportamento seja de difcil mensurao, sua modelagem se d de forma anloga aproximao sucessiva ao longo de uma dimenso quantitativa. Anteriormente, fez-se referncia ao operante de bicar o disco do pombo. Essa resposta, quase sempre, tem uma freqncia igual a zero, no nvel operante e, assim, precisa ser modelada. Neste caso, o experimentador aproxima-se sucessivamente da forma desejada do comportamento, iniciando com uma forma que pode se parecer em nada com o bicar uma chave. O experimentador pode reforar primeiro todos os movimentos do animal que ocorrem na vizinhana da parede que contm o disco. O efeito deste procedimento de diferenciao fortalecer os movimentos do animal nas proximidades do disco. Ento, o reforamento tornado contingente aos movimentos da cabea prximos ao disco. Quando essa contin gncia tiver tido efeito de aumentar tais movimentos, o reforamento ser condicional ao tocar o disco com o bico. Neste exemplo, a mudana dos requisitos para o reforamento combina-se com as mudanas progressivas do comportamento para modelar um novo ato. O aparecimento do bicar o disco devido a uma histria de diferenciao progressiva de antecedentes comportamentais remotos, com relao ao,s quais o bicar o disco contm uma pequena semelhana superficial. este o processo atravs do qual muitas de nossas prprias habilidades so modeladas. interessante notar que, embora a natureza fornea muitas situaes de reforamento seletivo (a corrida do coelho reforada somente se fr bastante rpida para iludir a raposa; a corrida da raposa reforada apenas se fr mais rpida que a do coelho), parece que a aproximao sucessiva um arranjo de contingncias estritamente humano. Professores, pais e amigos seguem tal procedimento, embora raras vezes to sistematicamente como deveria ser. Talvez seja no laboratrio que o maior poder do procedimento possa ser explorado, porque l que podemos controlar e mank pular melhor os muitos parmetros, sugeridos pelas Figs. 8-3 c 8 -6 , cujos efeitos no processo so ainda bastante desconhecidos. 8.5 EXTENSO DO CONCEITO DE OPERAOTE Uma histria de diferenciao e aproximao sucessiva pode tornar classes de compor tamento suscetveis ao reforamento, classes estas que, de outra maneira, poderiam permanecer indisponveis. Neste sentido, os procedimentos de diferenciao e aproxi mao sucessiva so, adequadamente, considerados mtodos de criar operantes. Estamos agora em condies de entender porque a maioria dos operantes que observamos fora do laboratrio, tais como o abrir e fechar portas, dizer por'favor , operar mquinas, assar bolos, e n v ia r mensagens pelo cdigo morse, chutar bolas de futebol, parecem ter uma estrutura mais unitria, como se fossem um nico evento, do que sugerimos, anterior mente, ser caracterstico da corrente de comportamento.O statusde evento desses atos lhes c o n f e r id o pelo lato de eles serem produtos da diferenciao.Diferencialmente refor

- 170 -

ados, de incio na forma de classes arbitrrias, esses operantes tornam-se unidades fun cionais atravs da ao do reforamento seletivo de seus membros e extino concorrente dos membros de todas as outra classes de comportamento. Uma classe importante desses operantes criados o conjunto cujos membros so cons titudos de elementos que foram previamente modelados como operantes. No caso mais simples, o reforamento contingente emisso de n repeties sucessivas de um operante anteriormente reforado. Esse procedimento especifica um novo operante de ordem superior, constitudo de n ocorrncias sucessivas da classe de comportamento anteriormente reforacfa. Quando descrevemos tal operante de ordem superior, referimo-nos aos membros da classe anteriormente reforada que o constituem como seus seus elementos ( r i , r 2 , r3 , ..., rn). Embora os elementos por si ss constitussem, inicialmente, classes unitrias de resposta, eles so tratados agora como componentes de uma classe de resposta de ordem superior (Findley, 1962). A especificao de um operante em termos de um nmero fixo de tais elementos repetidos conhecida como operante de Razo Fixa (RF). O termo razo refere-se ao nmero fixo de elementos repetidos por reforamento. Por exemplo, depois de ter fortalecido o operante de pres sionar a chave telegrfica num macaco, o reforamento pode ser tornado contingente a 30 presses consecutivas chave telegrfica. Depois de modelar o bicar o disco num pombo, pode se tornar o reforamento contingente a cada 50 bicadas no disco. Esses casos so denotados RF 30 e RF 50, respectivamente. Tais operantes de ordem superior, sendo constitudos de componentes facilmente observveis e experimentalmente criados, so teis por permitirem uma micro-anlise compreensiva da estrutura do comporta mento operante. Os elementos dos operantes RF so estudados tipicamente do mesmo modo que as respostas so estudadas em esquemas de reforamento intermitente. Assim, os registros cumulativos dos elementos de operantes RF constituem um mtodo de obser vao das caractersticas temporais de classes de resposta altamente ampliadas. A transio do reforamento de uma classe que tem somente um elemento para uma Classe contendo n elementos, representa um tipo de aproximao sucessiva, ao longo da dimenso do nmero (n) de elementos. Antes de mudar a condio para o reforamento de um nico elemento para n elementos, no h, todavia, qualquer informao sobre as variantes acessveis ao longo das n dimenses. O nico valor de n previamente examinado (reforado) em crf foi sempre 1. Assim, a diferenciao , em grande parte, um problema de tentativa e erro. Usando o bicar o disco (chave) por pombos, Ferster e Skinner (1957) foram capazes de passar diretamente de um elemento por reforamento para razes de reforamento de 40 e 50 elementos sem que a extino ocorresse. Quando a diferen ciao do novo operante havia estabilizado (umaspoucasdziasdehoras).o padro da taxa dos elementos era tal que taxas altas e uniformeseram freqentese uma pequena pausa ocorria depois de cada reforamento. A diferenciao de razes ainda mais altas requer uma aproximao sucessiva pelo aumento gradual de n. A razo e aumentada de 5 ou 10 c mantida no novo valor por vrias sesses. Uma curva cumulativa tpica, mostrando-um desempenho estvel cm RF 120 por um pombo modelado desse modo, vista na Fig. 8-7. A curva mostra a uniformidade marcante do comportamento, no tempo, sob especi ficaes RF. O reforamento e seguido caracteristicamentc por pausas que duram 5 ou 6 min, depois do que o animal comea a bicar com uma taxa uniforme e alta que mantida ate o reoramento. A pausa ps-reforamento est relacionada de perto com o tamanho da razo. Razes grandes so marcadas por pausas longas. Em razes pequenas, a paus;( pode desaparecer totalmente. O limite superior da diferenciao da razo taivez seja

- 171

desconhecido. Skinner (1957) relata dados de Morse e Herrnstein nos quais um operante RF contendo 900 elementos foi estabilizado atravs de diferenciao progressiva.

Figura 8-7. Curva cumulativa do bicar a cliave, por um pombo reforado aps cada 120 bicadas (Ferster e Skinner, 1957).

noo de que o procedimento dc razo define um operante dc ordem superior baseada em estudos que verificaram que este operante, como outros, pode ser submetido a um esquema de reforamento e mantido indefinidamente nos moldes caractersticos dc um esquema particular. Ferster e Skinner (1957) reforaram operantes em RF 30 sob um esquema de probabilidade uniforme. Isto ,

onde

R = 3 0 bicadas na chave SA = iluminao normal S3 = diminuio da iluminao

172

O fim de uma RF no reforada era sinalizado no experimento de Skinner e Fe rs ter, por uma breve mudana na iluminao (colchete 3 no diagrama). Probabilidade de refora mento (p) para o comportamento de bicar a chave em RF 30, de 0,85 ate 0,50, manti veram o comportamento. Em 0,50, houve quase sempre uma tendnciaparaaocorrncia de longas pausas entre os operantes RF (no entre os elementos) caracterstica de um resultado encontrado por Brandauer (1958), que usou valores de p muito pequenos com um operante mais siipplcs, uma bicada na chave. Uma vez que Brandauer teve que chegar a probabilidades de 1/600 para obter o efeito que aqui foi obtido com 0,50 parece que a quantidade de comportamento envolvida num operante modifica sua suscetibilidade a um esquerna. A funo que relaciona a resistncia extino ao tamanho da RF recebeu alguma ateno experimental. RFs grandes podem exigir um trabalho substancial do indivduo e, por essa razo, pode se esperar que ela acarrete uma menor persistncia, face extino, do que RFs pequenas. Boren (1961) e Weissman e Crossman (1966) apresentaram dados que mostram que na faixa entre RF 1 e RF 64, a presso barra em ratos e o bicar a chave em pombos parecem apresentar tal efeito. Apesar desta diminuio na persistncia do operante em funo do seu tamanho, muito mais elementos so, na realidade, emitidos na extino de grandes RFs. De fato, dentro de certos limites, quanto maior a RF no treinamento, tanto maior ser o nmero de elementos individuais emitidos durante a extino. Uma concluso importante segue-se. Sc estamos interessados cm aumentar a persis tncia do comportamento face extino, a especificao de RF fornece um mtodo altenativo para um esquema produzir perseverana. Podemos incorporar o comporta mento como um elemento de um operante RF dc ordem superior. Em contraste com os operantes de ordem superior criados pela combinao de elementos que se demonstrou anteriormente serem operantes, Hefferline e Keenan (1963) pesquisaram um operante miniatura , to pequeno que uma amplificao eletr nica precisa ser empregada para detet-lo. Essespesquisadores generalizaram, com xito, u conceito de classe de resposta operante para comportamentos to pequenos em aplitude que o sujeito, geralmente, no capaz de dizer ter observado suas prprias respostas. Num experimento, potenciais de contrao muscular do polegar de sujeitos humanos foram registrados. Eletrodos simulados foram colocados em outros pontos do corpo do sujeito para desviar sua ateno da resposta do polegar. Os sujeitos eram conforta velmente sentados em um cubculo triangular, com ar condicionado e prova de som e eram instrudos, apenas para se relaxarem. Eles foram avisados de que ocorreria refora mento na forma de pontos, registrados num contador localizado perto deles, e que cada ponto valeria 5 cents . Mas no foi dito aos sujeitos como eles poderiam produzir os pontos. Num sujeito, as contraes do polegar que geravam potenciais na amplitude de 25-30 microvolts eram reforadas e, depois, extintas. Os histogramas para os 10 min de nvel operante, seguidos por 6 blocos sucessivos de 10 min dc fortalecimentQ, seguidos por 10 min finais de extino, so vistos na Fig. 8-8 . Os histogramas de condicionamento mostram que o procedimento de diferenciao foi bem sucedido no fortalecimento sele tivo da classe reforada de comportamento e que os 10 min de extino causaram um enfraquecimento marcante na classe. Os registros cumulativos da contrao muscular reforada mostram uma taxa tpica dc aumento da classe reforada, mas - como deve ser esperado de um operante com dimenses to limitadas o processo gradual, esten-173-

150 100 50 0
.

2 0 -3 0

150 100 -

Extino

_ _,
1 ---- 1 Microvolts

50 Q

10 15 20 25 30 35 40 45

10 15 20 25 30 35 40 45

Figura 8-8. Histogramas de frequncia de respostas para vrias categorias de contraes do polegar, medidas em microvolts, durante o nvel operante (NO), condicionamento e ex tino. A categoria reforada est sombreada (Segundo Hefferline e Keenan, 1963).

dendo-sepor 60 minutos de condicionamento. Isto difere, assim, das curvas abruptas de fortalecimento da presso barra no rato (Fig. 4-2). Os resultados de Hefferline e Keenan so importantes na nossa anlise do comporta mento por vrias razes. Primeiro, eles mostram os limites inferiores a que o nosso conceito de operantes pode ser levado e ainda denotam uma unidade funcional de com portamento. wSegundo, demonstram que a inabilidade do sujeito para verbalizar as contin gncias de reforamento de modo algum afeta a regularidade do condicionamento e

-174-

extino. Um terceiro fenmeno emprico tpico do comportamento operante em geral demonstrado. No operante de contrair o msculo a classe de resposta foi definida como c o n tra c ts entre 25 e 30 microvolts. Mas uma inspeo mais detalhada dos histogramas da Fig. 8-8 mostra que as classes vizinhas de comportamento, embora no realmente reforadas, foram tambm algo fortalecidas. O fortalecimento incidental induzido em comportamentos que realmente no participam das contingncias de refor amento chamado induo de resposta. A induo de resposta ocorre durante o fortale cimento de qualquer operante, mas nem sempre fcil verific-la. Embora o experimen tador possa desejar limitar o reforamento a uma classe especfica de comportamento, o fortalecimento pode se estender, atravs de induo, muito alm dos limites estabe lecidos. Ratos que aprendem os movimentos necessrios para atravessar uma pista complexa, so capazes de nadar na pista, eficientemente, quando esta est alagada, embora o nadar requeira um grupo de movimentos bastante diferentes. Aprender a escrever com a mo direita treina a mo esquerda no usada, embora em grau menor. Aprender a falar o italiano torna mais fcil aprender a falar espanhol. A induo de resposta estudada no laboratrio com ajuda do aparelho para desenhar, que inclui um espelho, visto na Fig. 8-9. O sujeito recebe a tarefa de desenhar uma figura vendo, no espelho, a imagem desta. Uma vez que as relaes usuais entre mo e olho so invertidas as primeiras tentativas so reprodues ruins. Gradualmente, o sujeito passa a desem penhar melhor a tarefa. A induo de resposta pode ser medida em qualquer momento, no processo de aquisio, testando-se a quantidade de melhora mostrada pela me esquerda, com a qual o sujeito no praticou.

F ig u ra 8-9. D iagram a e sq u em tico de u m ap a re lh o de d e sen h ar, co m espelho. O su jeito se se n ta fre n te a u m a estrela que lh e vfsivel so m e n te no espelho (M ednick. 1 964)

-1 7 5 -

8.6 DIFERENCIAO DE TAXA


Ao se considerar os efeitos de certos esquemas de reforamento, recorre-se sempre ao fato de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com o reforamento. Assim, esquemas de intervalo randmico tendem a fornecer refora mento diferencial aps taxas baixas e esquemas de probabilidade uniforme tendem a for necer reforamento diferencial depois de taxas altas. Uma vez que o efeito do refora mento fortalecer qualquer que seja o comportamento que vem antes dele, esses esquemas agem indiretamente no fortalecimento de certas taxas de comportamento. Se desejarmos, poderemos fazer surgir uma diferenciao maisdireta e invariante pela especi ficao dos limites, condies ou restries da taxa do operante que deve ser reforado. No reforamento diferencial de taxas baixas (drl), um operante R primeiro especi ficado e fortalecido. Quando R tiver sido suficientemente fortalecido, ele tomado um elemento numa nova especificao de resposta de ordem superior: somente os elementos de resposta que esto espaados entre si pelo mnimo de uma certa quantidade de tempo so agora reforados. Assim, o procedimento drl refora um certo comportamento somente quando precedido de uma pausa. Wilson e Keller (1953) efetuaram este procedi mento de drl, exigindo que os ratos espaassem suas respostas de presso barra de determinados retardos mnimos, para que o alimento fosse liberado. A especificao do tempo mnimo para o operante foi aumentada gradualmente, em passos de 5 seg, de 10 para 30 seg, num perodo de 30 sesses. A Fig. 8-10 mostra que as diferentes pausas exigidas, estabelecidas pelas especificaes, produziram taxas diferentes de presso a barra.

Intervalo de Retardo (seg)


F ig u ra 8-10 . T ax a m d ia de presso b a rra , d u ra n te a ltim a sesso, em cad a um dos cin co v alores d ife re n te s d e um intervalo de r e ta rd o m n im o necessrio e n tr e presses re fo r ad as ( seg u n d o W ilson e K eller, 19 5 3 ).

- 176-

Quando a especificao da pausa do d rl foi aumentada, ocorreu um declnio sistemtico na taxa dos elementos da presso barra. Outra maneira de dizer isso que, quando se exige um aumento no retardo, ocorre um aumento sistemtico na durao mdia das pausas entre as presses barra. A especificao do d rl um operador poderoso para fortalecer e manter taxas baixas de algum comportamento especificado. Curvas cumulativas do bicar a chave mantido em taxa baixa, em pombos, quando somente bicadas precedidas por pausas de 3 minutos ou mais eram reforadas, so vistas na Fig. 8-11. Atravs de um ajustamento adequado da especificao do d r l, manteve-se os pombos trabalhando lenta, mas estavelmente, 24 horas por dia, durante dois meses. O operante de ordem superior fortalecido pelo procedimento drl consiste de uma topografia bem especificada (por exemplo, uma bicada ou uma presso) precedida por uma topografia problemente especificada (por exemplo, qualquer coisa exceto uma bicada ou presso). A classe qualquer coisa exceto , em geral, o suficientimente ampla para que os sujeitos individuais venham a formar comportamentos idiossincrticos, su persticiosamente reforados durante a pausa forada Wilson e Keller relatam que cada

F igura 8-11. T ax as de b icar a chave q u a n d o so m e n te b icad as p reced id as p o r um a pausa de 3 m in o u m ais eram re fo r a d a s (S k in n e r, 1957).

rato desenvolveu uma forma de comportamento colateral, facilmente reconhecvel e previsvel, constituida ritualmente de limpar-se, farejar e andar em vrias partes da cmara experimental durante os intervalos de retardo. A especificao do operante drl convenientemente expressada como uma amostra de comportamento que inclui, por um certo tempo,qualquer comportamento outro que no o selecionado, seguido pelo comportamento sejecionado. Fm notao de conjunto, defininmwnicialmente, em U , o operante R. A poro de )J no incluida em R chamada R e inclui quaisquer comportamentos, exceto aqueles que caem na classe R. Evidentemente, R e R esgotam o espao comportamental, ]J Sob o d rl, o novo operante, 0, definido como consistindo de: pelo menos T min de R, + R.

O operante drl foi mantido com sucesso em esquemas de intervalo por Angei (1956) e Ferster e Skinner (1957).

-177 -

Em contraste com o d ri, taxas muito altas de comportamento podem ser geradas, tornando-se o reforamento contingente completaao dos elementos de uma razo operante dentro de um intervalo de tempo especificado. Se este intervalo fr progressiva mente diminudo, ou a razo progressivamente aumentada, ocorrer uma modelagem de taxas extremamente altas dos comportamentos componentes. Este procedimento conhecido como reforamento diferencial de taxas altas (d r h ) . 8.7 REFORAMENTO DO RESPONDER CONTNUO Como vimos, a criao de operantes atravs do processo de diferenciao age, tipica mente, impondo um incio e um fim arbitrrios ao comportamento. A criao de uni dades discretas desta natureza til para se medir os efeitos comportamentais, pois as unidades prestam-se contagem. A contagem, naturalmente, toma possvel o clculo de uma taxa de resposta e, consequentemente, da probabilidade da resposta, com todas as vantagens adicionais dessas variveis. Todavia, esta separao de operantes em eventos discretos com incio e fim definidos no uma condio necessria para sua definio. Se o fosse, a anlise de comportamentos interessantes tais como ficar parado e o seu inverso, mover-se continuamente, estariam fora do mbito do comportamento operante. Que esses co m p o rtam en to s so to suscetveis ao reforamento, como as unidades comportamentais mais bvias, demonstrado pelo reforamento de uma resposta contnua de correr, num rato. O aparelho para estudar o correr uma gaiola rotatria, semelhante que vista na Fig. 8-12, mas modificada pela adio de um comedouro para liberar automaticamente uma pelota de alimento, quando necessrio. Com o

F ig u ra 8-12. G aio la ro ta t ria e reg istrad o r a u to m tic o . A ro d a gira a p en as n o se n tid o a n ti-h o rrio .

-1 7 8 -

objetivo de estabelecer uma classe de comportamento, uma volta de 360 graus fornece uma unidade conveniente, embora perfeitamente arbitrria, do comportamento a ni reforado. Se o correr (definido como uma volta completa) reforado num intervalo fixo de 5 min ( IF 5 min), somente a primeira volta depois de decorridos os 5 min ser reforada. Os efeitos do reforamento consistem em fortalecer um padro de corrur, caracterstico do responder em esquemas IF (ver Figs 7-2 e 74 ). O rato para por vrios minutos logo aps um reforamento e, ento, corre numa taxa alt at o prximo reforamento, e assim por diante (Skinner e Morse, 1958). Aqui o desenvolvimento do padro da IF serve para verificar a natureza operante do correr.

8.8 SUMRIO
Os procedimentos de diferenciao e aproximao sucessiva aumentam fcrandemente o nosso controle experimental sobre o comportamento. Eles so procedimentos que permitem selecionar os aspectos do comportamento que desejamos reforar e, realmente, tornar os comportamentos desejados disponveis para o fortalecimento. A combinao de esquemas de reforamento com vrias especificaes de resposta (incluindo as especificaes de ordem superior compostas de operantes condicionados anteriormente) permite que grandes amostras do comportamento de um organismo, no laboratrio, sejam mantidas e estudadas por longos perodos de tempo. Os procedimentos de razo permitem o estudo de como a quantidade dc trabalho necessria para o reforamento pode afetar o comportamento. Os procedimentos dc d rl e d rh tornam possvel o estudo de uma ampla faixa de taxas de comportamento. No pombo, por exemplo, esses procedimentos produzem uma faixa estabilizvel do taxas de bicar a chave de menos de 100 respostas por hora at 20.000 respostas poi hora. Frequentemente, especificaes de respostas engenhosas podem ser usadas pani estabelecer linhas-base comportamentais, anlogas s linhas-base de esquemas, a parlii das quais podem ser estudados os efeitos tpicos de drogas e outras operaes. Um nmero de atividades humanas caractersticas so correlacionadas com vria especificaes operantes pesquisadas no laboratrio. O trabalho por pea, no qual um trabalhador pago para produzir um nmero fixo de artigos, c uma especificao RF clara. Assim tambm so atividades como datilografar um grande nmero de pginas, preparar longos exerccios ou bater um prego na madeira. Em muitas dessas, se a quantidade de comportamento envolvida substancial,uma pausa antes dc voltar ao trabalho vista com freqncia. Podemos observar comportamentos em d rh nas atividades onde um prmio e dado pela execuo rpida do trabalho em pouco tempo - isto pode ser visto em garons, na hora de movimento ou, no basebol, os movimentos de um jogador correndo para a primeira base. Tipos de comportamento mais intelectuais tambm sc ajustam aos paradigmas de diferenciao. Numa discusso verbal, por exemplo, h comu* mente um premio em d rh para pensar rpido e replicar. Por outro lado,numa briga,h frequentemente um premio em d rl para o no responder muito precipitadamente e dizer coisas de que nos arrependeremos mais tarde . Segue-se uma nota sobre as similaridades entre os efeitos de certas especificaes de resposta e os efeitos de certos esquemas. A Razo Fixa, por exemplo, no difere do IF em seus efeitos sobre o comportamento (compare a Fig. 8-7 e a Fig 7-3 ). Essas seme lhanas tm levado os tericos a tentarem reduzir esquemas e diferenciao a uma estru tura comum, enfatizando os parmetros de probabilidade de reforamento^e no enfati-17 9-

/.ando variveis de especificao de resposta, ou vice-versa. O sucesso de tal empreendi mento ainda no est assegurado e, para os objetivos presentes preferimos considerar um esquema como um procedimento de especificao de contingncias probabilistic as de reforamento no tempo, dada a classe de R. Por outro lado, consideraremos a diferen ciao como um procedimento para especificar em que classe de comportamento se deve agir com um esquema dc reforamento. A observao de que uma certa definio de R sob um esquema pode produzir efeitos semelhantes,ou mesmo idnticos outra definio sob um esquema diferente, pode realmente ser interessante. Todavia, tais correspon dncias comportamentais no significam necessariamente que, em geral, cada especifi cao ou esquema seja redutvel ao outro. 8.9A LINGUAGEM E LGICA DOS CONJUNTOS
Um conjunto qualquer coleo bem definida de objetos ou entidades conceituais. O termo objetos ou entidades conceituais" tomado num sentido amplo, significando coisas tais como rvores, pessoas, mesas de cozinha, resultados do atirar uma moeda, cor de cabelo, respostas ou nmeros. Dizer que um conjunto uma coleo bem definida significa o fato dc que, para qualquer objeto ou entidade conceituai, podemos dar uma resposta definida -- sim ou no - no que se refere a se esse objeto est numa coleo particular. Alguns exemplos de conjuntos so:

(1) (2) (3) (4) (5)

Todas as pessoas da cidade de Kansas com cabelo vermelho. Os filmes onde Alec Guinness aparece. Os nmeros mpares. Os pases do mundo com parlamentos eleitos. Todos os comportamentos que abrem uma porta.

Para cada um desses conjuntos, podemos dar uma resposta sim ou no no que se refere a se uma dada pessoa, ou filme, o nmero,ou pas, ou comportamento, respectivamente, poderia ser incluido na coleo. Na terminologia dos conjuntos, os itens individuais que compem a coleo so chamados os membros, ou elementos do conjunto. Os conjuntos so quase sempre simbolizados por letras maisculas. Assim, os inteiros mpares menores que 10 , tomados como um conjunto, podem ser simbolizados pela letra I, c o conjunto das vogais comuns na lngua inglesa, pela letra V. Suponha que desejamos indicar os membros de um conjunto. Um mtodo para escrever as colees que chama mos conjuntos enumerar cada um dos membros do conjunto, separando cada um por vrgulas e colocando-os em chaves. Assim, o conjunto dos inteiros mpares menores que 10 escrito. / = { 1 ,3 ,5 ,7 ,9 } e o conjunto das vogais comuns da lngua inglesa escrito
V = {a, e, i, o, u)

Algumas vezes o conjunto ou coleo muito amplo para que possamos conveniente mente escrever todos os seus membros ou elementos. Ento, podemos usar trs pontos

- 180 -

aps escrever um nmero de membros suficiente para sugerir a regra que d e t e n m n a ; filiao. Por exemplo, poderamos escrever o conjunto dos governos com a s s e m b l i a s legislativas eleitas, P, como P {Canad, Inglaterra, Frana, Estados Unidos, Islndia...}

Dois conjuntos especiais, so de interesse. Um o conjunto universal, s i m b o l i z a d o por y . O conjunto universal, y , contm todos os elementos aos quais f a z e m o s qualquer referncia numa dada discusso.Em termos de nossos exemplos anteriores, todos os seguintes seriam conjuntos universais apropriados:
(1)

(2) (3) (4) (5)

todas as pessoas da cidade de Kansas. todos os filmes feitos. - todos os nmeros. todos os pases do inundo. todos os comportamentos do indivduo.

O y serve simplesmente para delimitar qualquer discusso particular, estabelecer seus limites c definir o tpico ou regio a partir da qual as vrias colees podem, ento, sei feitas. Um segundo conjunto especial aquele que no tem membro algum. Tal conjunto chamado conjunto vazio, < p . Todos os nmeros mpares com um nico dgito acima de 10 , todos os pases do mundo que tm dinossauros vivos, todas as pessoas da cidade de Kansas com cabelo verde so presumivelmente exemplos do conjunto vazio, $ . Note que h somente um $ , ao passo que h tantos conjuntos universais diferentes quantos quadros de referncia houverem para qualquer discusso determinada. Embora um conjunto se componha de elementos, alguns ou todos os elementos podem ser, por si ss, considerados conjuntos. Considere o conjunto universal, y , de todos os livros, sentenas, palavras e letras. Um elemento desse conjunto este livro. Mas este livro contem uma coleo de sentenas. Essas sentenas compem um conjunto: o conjunto das sentenas deste livro. A anlise pode ser levada ainda mais longe para palavras c, ento, para letras. As sentenas contm os elementos palavras; as palavras contm, ainda, como elementos, as letras. Nessa conexo, importante notar que, ao se enumerarmos elementos de um conjunto, incluimos apenas os elementos diferentes. Assim, os elementos do conjunto L das letras que constituem a palavra agradvel sao escritos L {a, g, r, d, v, e, 1} No duplicamos o a que ocorre mais de uma vez na palavra porque um e l e m e n t o idntico. Naturalmente, se a palavra Agradvel fosse escrita em letra maiscula, e n t a o deveramos incluir o A, assim como o a, como elementos, dependendo se t iv s s e m o s tomado o nosso conjunto universal como o conjunto de todas as letras, ou s o m e n l e o conjunto das letras minsculas. A noo de que os conjuntos podem ser divididos em conjuntos est contida n o conceito de um subconjunto. Um subconjunto, B, de A, um conjunto tal que iada membro de B tambm um membro de A. O contrrio no necessariamente ver d a

i Ri

deiro. Assim, se o conjunto de todas as pessoas que vivem nos Estados Unidos um conjunto universal, ento o conjunto das pessoas da cidade ae Kansas um subconjunto. Alm disso, o conjunto das pessoas de cabelo vermelho da cidade de Kansas um outro subconjunto. Suponha que todas as pessoas sejam um conjunto universal, y . Ento, o conjunto dos homens um subconjunto deste conjunto universal. Mas o conjunto de meninos ainda um outro subconjunto. Todos os meninos so do sexo masculino, nias nem todas as pessoas do sexo masculino so meninos. Para representar o fato de que todos os membros ae um dado conjunto B so tambm do conjunto A, escrevemos
B C A

o que significa que cada elemento de B tambm um elemento de A. Para representar estas noes e para ajudar nossa intuio sobre as vrias manipu laes e combinaes simples dos conjuntos que desejarmos fazer, os diagramas conhe cidos como diagramas Venn so teis. Num diagrama Venn, o Conjunto P- represen tado por urn retngulo e os vrios conjuntos e subconjuntos de y so representados poi crculos, figuras oblongas, ou outras figuras irregulares. Assim, na ilustrao anterior a relativa ao conjunto das pessoas da cidade de Kansas, desenhamos

[ 8 . 1]

(Hide K so as pessoas da cidade de Kansas. Se desejamos indicar as pessoas de cabelos vermelhos da cidade de Kansas podemos desenhar dois crculos, deixando-os parcialmen te sobrepostos, como em:

[8.2]

onde os crculos K e V representam, respectivamente, as pessoas da cidade de Kansas e as pessoas de cabelo vermelho. Nem todas as pessoas de cabelo vermelho vivem na cidade de Kansas, mas aquelas que vivem esto representadas pela regio superposta sombreada em 18 .2 1 chamada a intersecao dos dois conjuntos V e K 0 smbolo a usado para denotar a intersecao de dois conjuntos. Logo, [8 .2 1 pode ser escrito como V A K. Suponha que desejamos nos referir aos dois conjuntos de animais, ratos, R, e gatos, G. Ento, se o conjunto universal P consiste de todos os animais conhecidos, temos .

[8.3]

- 182-

Em [8.3], nenhum elemento membro de ambos, R e G. Isto , no h animal algum que seja, ao mesmo tempo, um rato e um gato. Evidentemente, ento, R a G = Corjuntos que nao tm regies de superposio como em [8.3] so ditos conjuntos m u tu a m e n te e x c lu s iv o s . Se ou no dois conjuntos se sobrepem, freqentemente temos ocasio de aludir aos membros de ambos os conjuntos, tomados simultaneamente, como um grupo. Se estivssemos interessados em animais peludos, ento ratos e gatos pode riam ser classificados juntos. Em diagramas Venn, para nos referirmos a essa coleo, poderamos escrever:

onde P o grupo de animais peludos. Um conjunto X tal que qualquer elemento x ou um gato ou um rato chamado a u n i o dos dois conjuntos R e G e escrito: X "RUG. O conjunto X o que est representado pelas reas sombreadas em |8.4). Um conceito final ser til. Frequentemente, desejamos discutir o co m p le m e n to de um conjunto S, simbolizado porS, >S. O complemento de um dado conjunto aquele conjunto que contem todos os n o membros do conjunto dado. Assim, os conjunto* complement ares de cada um dos nossos exemplos originais so dados por: (1) U - Todas as pessoas que no tm cabelos vermelhos na cidade de Kansas. (2)U -Todos os filmes que no apresentam Guinness (3)U -Todos os nmeros exceto os mpares (4)U -Todos os pases do mundo que no tm parlamentos eleito e (5)U -Todos os comportamentos que no abrem portas. Note que o complemento e formado pela comparao do conjunto original com o conjunto universal, escrevendo-sc como complemento o que est fora. Assim, o comple mento de nosso conjunto K em 18 .1 1c convenientemente representado pela rea som breada em [8.5j

[8.5]

Exerccio 6 .
D e m o n stre que

S U

1 1 e qu e S A S = c> .

REFERNCIAS PARA OCAPTUI O 8 Anger, D. The dependence of interresponse times upon the relative rein forcement of different interresponse times. J. exp. Psychol., 1956, 52, 145-161.
- 183

Boren, J. J. Resistance to extinction as a function of the fixed ratio. / . exp. P s y c h o l 1961, 61, 304-308. Brandauer, C. M. The effects of uniform probabilities of reinforcement on the response rate of the pigeon. Unpublished doctoral dissertation, Columbia Univer., 1958. Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New Y ork: Appleton-Century-Crofts, 1957. Findley, J. D. An experimental outline for building and exploring multi operant behavior repertoires. J. exp. Anal. Behav., 1962, 5, 113 166. Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a small-scale (covert) operant. J. exp. Anal. Behav., 1963, 6 , 307 315. Herrick, R. M. Lever displacement during continuous reinforcement and during a discrimination. J. comp. Physiol. Psychol. , 1963, 56, 700-707. Herrick, R. M. The successive differentiation of a lever displacement response. J. exp. Anal. Behav. , 1964, 7, 211-215. Hull, C. L. Principles of behavior. New York: Appleton-Century-Crofts, 1943. Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York: Appleton-Century-Crofts, 1950. Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964. Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938. Skinner, B. F. The experimental analysis of behavior. Am er. Sci.f 1957, 45, 343-371. Skinner, B. F., and Morse, W. H. Fixed-interval reinforcement of running in a wheel. J. exp. Anal. Behav., 1958, 1, 371-379. Weissman, N. W., and Crossman, E. K. A comparison of two types of extinction following fixed-ratio training. J. exp. Anal. Behav., 1966, 9 ,4 1 -4 6 . Wilson, M. P., and Keller, F. S. On the selective reinforcement of spaced responses. J. comp, physiol. Psychol., 1953, 46, 190-193.

-1 8 4 -

Captulo 9: CONTROLE AMBIENTAL

Ao discutir os procedimentos de fortalecimento operante, esquemas e diferenciao, dedicamos pouca ateno ao ambiente predominante. Durante o fortalecimento da presso barra de um rato, do choro de um beb, do bicar de um pombo e da expresso de opinio de um estudante, nosso interesse no ambiente se limitou verificao de que o operante era possvel (isto , que barras, discos, e uma histria passada com a lngua inglesa existissem quando necessrios) e que o reforamento poderia ser introduzido quando se desejasse. Contudo, visvel, ao se considerar o comportamento de qualquer organismo, que essa negligncia das condies predominantes do meio deve resultar numa imagem muito inadequada do comportamento. Em geral, os organismos emitem respostas seletivamente, de acordo com o estado de seus ambientes presentes ou passados. Uma criana aprende a chorar somente quando um dos pais est em casa para reforar o choro. Um co no pedir alimento na ausncia de um ser humano. Dificil mente pediremos gua quando ningum estiver na sala para ouvir (e ento nos reforar). Todos esses casos ilustram um tipo de controle do comportamento exercido pelo meio, mas um tipo de controle que difere em vrios modos da maneira pela qual os estmulos eliciadores controlam seus respondentes. Exemplificando,no gritamos nosso pedido no restaurante, mais e mais alto quanto mais alto for o garo. Por outro lado, um aviso sussurrado pode gerar uma atividade intensa, se aquilo que se diz justifica tal tipo de atividade. Numa palavra, as leis do reflexo so inaplicveis ao controle ambiental de operantes. Um grupo de leis bem diferentes, expressas em termos da histria passada de reforamento do organismo, governa a emisso seletiva de operantes. Para formular essas leis,, todavia, precisamos conceituar um nmero de dimenses para especificar, analisar e , em geral, descrever quantitativamente o ambiente dos organismos. 9.1 DIMENSES DO ESTIMULO O ambiente prevalente de um organismo pode ser considerado como o padro ou a configurao de todas as energias, presentes num determinado momento, que so capazes jde entrar em relao funcional com o comportamento. Essas energias so apena^ um pequeno subconjunto das energias estudadas pelos fsicos. Elas se limitam, namaiona, quelas que podem ser detectadas por estruturas anatmicas especializadas, receptores, que os organismos tm para receber certas energias e transform-las em impulsos eltricos
- 185 -

nervosos. 0 olho especializado para a recepo de uma faixa limitada de radiao eletro magntica, o ouvido para uma faixa limitada da presso do ar causada por vibraes, a lngua e o nariz para certas energias qumicas. Existem receptores na pele que detetam a presso mecnica, mudanas trmicas, etc. H receptores nos msculos e articulaes do corpo que detetam o movimento dos msculos e articulaesf, aos quais esto incorpo rados. Uma especificao completa dos padres de energia eletromagnticas, mecnicas, qumicas e trmicas que atingem os receptores dos organismos em qualquer momento dificilmente ser feita. Felizmente, isto nem sempre necessrio. Uma vez que o compor tamento pode estar sob o controle seletivo de partes ou aspectos limitados de configu raes de energia que constituem o que chamamos ambiente, somente uma pequena parte selecionada ou aspecto nico de energia do ambiente variada no trabalho experi mental. O restante do ambiente mantido to constante quanto possvel. Esses aspectos ou partes do meio, experimentalmente manipulveis, so o que chamamos mais comumente estmulos. De todas as leis do comportamento em que os estmulos participam, at agora vimos somente as leis do reforamento e da eliciao; outras comporo o contedo deste captulo e do seguinte. O estmulo uma unidade ambiental arbitrria. Quando manipulamos ou mudamos aspectos limitados do meio e os correlacionamos com o comportamento, estamos mani pulando essas unidades. Na manipulao do meio visual, por exemplo, frequentemente restringimos nossas mudanas experimentais a uma das dimenses fundamentais pelas quais os fsicos descrevem a luz. Para os nossos objetivos, a luz pode ser considerada como uma faixa limitada de perturbao eletromagntica, irradiada a 300.000 km/seg, em forma de ondas. As ondas de luz podem ser representadas como na Fig. 9-1. O comprimento de onda (X , Fig. 9-1, l-se lambda ) uma dimenso importante do estmulo, qual foram correlacionadas respostas diferentes chamadas nomes das cores. Os comprimentos de onda que constituem a luz formam apenas uma pequena poro de todo o espectro eletromagntico.
Comprimento

F igura 9-1. A n a tu re z a o n d u la t ria reg u lar da luz p u ra . O c o m p rim e n to de o n d a ( ), isto , a d iferen a e n tre cristas de o n d as sucessivas, inversam ente p ro p o rc io n a l freq n cia das o n d as n o te m p o e co rre la cio n ad o com o que ch am am o s de co r, ou m atiz, d a luz. A am p litu d e est relacio n ad a com a inten sid ad e de luz.

Na Fig. 9-2, v-se uma dimenso eletromagtica mais completa de X . Quase todos os organismos respondem a diferenas na amplitude ou intensidade das ondas de luz,mas somente um nmero limitado de espcies tem receptores especializados para detetar mudanas em X Pombos, homens,serpentes e macacos so exemplos de orga nismos que detetam tais mudanas. Outros, tais como o rato e o co so ditos cegos a cores porque diferenas em X apenas no controlam o seu responder diferencial. O receptor que chamamos de olho convenientemente comparado a uma cmara fotogr fica porque ambos tm similaridades funcionais (ver Fig. 9-3). Ambos recebem a luz
-

as r -

atravs de um diafragma ajustvel. No olho, este diafragma chamado ris. Ambos, olho e cmara, tm lentes atravs das quais a luz passa e que servem para focalizar a luz numa superfcie sensvel. Na cmera, essa superfcie constitui a emulso do filme. No olho a superfcie consiste de clulas nervosas que constituem a retina. Essas clulas retnicas transformam a luz em impulsos nervosos. Quando as ondas de luz da Fig. 9-2 incidem sobre o olho, elas so algumas vezes referidas como luzes espectrais puras. Essas so as luzes que aparecem no arco-ris e podem ser reproduzidas no laboratrio por um aparelho chamado monocromador. So ditas puras porque contm apenas um comprimento de onda. A maioria das luzes, inclu indo aquelas que atingem o olho refletidas de superfcies como mesas, cadeiras, quadros negros, gramados esto longe de serem puras neste sentido. Geralmente, mesmo a luz de uma superfcie homogeneamente colorida ou de uma lmpada constituida de uma grande mistura de comprimento de ondas diferentes. Aqueles comprimentos de onda que so predominantes determinam, usualmente, a nossa resposta de denominao da cor. Todavia, algumas misturas de luz no so denominadas por seus comprimentos de onda predominantes. A palavra prpura nunca usada para n o m e a r uma luz espectral pura de um comprimento de onda. Purpura o nome de cor para uma mistura de azul e vermelho. As luzes que chamamos brancas e as superfcies que chamamos cinzas irradiam misturas heterogneas de quase todos os comprimentos de onda visveis. Nenhum com primento de onda, isoladamente, predomina em tais luzes, mas o rtulo sem cor que frequentemente lhes dado parece se. uma designao incorreta. As dimenses visuais do estmulo no se limitam a distribuies de comprimentos de onda e intensidades diferentes de feixes de luz isolados. As dimenses relevantes que podem controlar o comportamento podem ser definidas de modo a incluir combinaes espaciais das dimenses fundamentais de comprimento de onda e intensidade. Por exemplo, as intensidades relativas de duas regies de luz adjacentes podem ser uma dimenso poderosa do estmulo controlador que determina a resposta relativa ao brilho que um observador dar a uma parte do padro. Olhando a Fig. 9-4, v-se que, quando a quantidade de luz refletida pelo fundo (background) varia, as respostas ao brilho do tringulo central mudam embora este ltimo permanea constante. Isto , o observador relatar brilhos diferentes do tringulo. (Este fenmeno chamado contraste de brilho). De fato, para produzir uma resposta de relatar que o brilho do tringulo no foi alterado, teramos de Vari-lO de tal modo que, quando a intensidade do fundo fosse aumentada (mais luz no fundo) o tringulo seia tambm proporcionalmente aumentado em inten sidade (tringulo tambm mais intenso). Na situao ilustrada pela Fig. 9-4, uma resposta de relatar um brilho idntico para os tringulos diferentes obtida somente quando a ra z o entre as intensidades do tringulo e do fundo a mesma (Wallach, 1948)l O controle funcional da resposta de relatar o brilho para os tringulos da Fig. 9-4 est claramente localizado numa varivel ambiental composta. Como esta regularidade entre meio e com portamento a base sobre a qual atribuimos o status de estmulo aos eventos do meio, no haveria motivo para no denominar de estmulo esta varivel composta. Essa desig nao, naturalmente, no exclui o fato de que, com outras contingncias predominantes, o tringulo apenas, ou o fundo apenas, possam tambm funcionar como estmulos individuais. Outro exemplo de controle de estmulo complexo visto nas linhas da Fig. 9-5, comumente referido como iluso de Mller-Lyer. Os dois segmentos de linha hori zontais so julgados de comprimento desigual porque a varivel de estmulo que controla o julgamento no apenas a simples varivel do comprimento da linha hori-

- 187

Retina

Figura 9-3. O olho comparado Funcional e esquemticamente com urna cmara fotogr fica (segundo Wald, 1950). "

Figura 9-4. Um exemplo de como as relaes entre duas partes do campo visual influen ciam as respostas (Segundo Boring, Langfeld e Weld, 1948).

>----------< <------->
Figura 9-5. A ilusb de Mller-Lyer.
188-

zontal. Em vez disso, a dimenso relevante do estmulo composta, formada do compri mento da linha horizontal e ngulo dos dois segmentos das extremidades. Os estmulos sonoros, como os estmulos luminosos, podem tambm ser analisados num conjunto de dimenses que os compem. O som tem uma semelhana superficial com a luz, apresentando certas propriedades de onda. Mas as ondas do som so pertur baes na presso do ar, propagadas lentamente (213,36 m/seg), mais semelhantes s ondas do Mar, que so produtos de perturbaes na presso superficial da gua. As mudanas na amplitude das ondas sonoras constituem mudanas na intensidade da energia e esto associadas a alturas (de som) diferentes. A Fig. 9-6 indica vrias intensidades de sons em termos de uma escala logartmica chamada de decibel; a figura fornece alguns exemplos comuns das fontes dessas intensidades. A dimenso comprimento de onda mostra-se adequada para descrever os estmulos sonoros. O som, todavia, convencionalmente descrito pelo nmero de cristas ou ciclos por segundo (cps) em vez de X . O nmero de ciclos por segundo, ou a freqncia do som, a dimenso em que esto baseadas as respostas de identificar a tonalidade. O homem capaz de dar respostas diferenciais de tonalidade numa faixa de 20 -20.000 cps. Outros animais, tais como ces e morcegos, so capazes de detetar freqncias duas ou trs vezes maiores que nosso limite superior de freqncia. O modo pelo qual as respostas de identificao da tonalidade variam com a freqncia ilustrado na Fig. 9-7, que d a principal freqncia das vrias notas do piano. Tal como uma luz pura contendo apenas um X rara, tambm o um tom puro contendo somente uma freqncia. Diapases e osciladores de laboratrio so fontes de tons puros. Os tons de instrumentos musicais contm uma mistura de freqncias e a tonalidade geralmente determinada pelas freqncias predominantes. Sons comuns tais como latidos, rudos de trfego, conversa e msica representam misturas muito com plexas de muitas freqncias audveis em intensidades aproximadamente iguais (tais como aplausos e esttica de rdio) chamado rudo branco, por analogia com a luz branca. As dimenses foram conceituadas para descrever as energias que compem partes do nosso meio qumico, mecnico e trmico. Respostas relativas a cheiro e gosto esto baseadas em mudanas diferenciais na concentrao e estrutura molecular de gases no nariz e solues na lngua, respectivamente. Mudanas na temperatura superficial so detetadas por certos receptores que esto situados na pele. Para descrever os estmulos que se originam dos movimentos dos msculos e tendes, cham ados prop ri ocep tores, surgem problemas experimentais. A mensurao de mudanas no meio interno difcil sem se invadir cirurgicamente o organismo. A locali zao dos proprioceptores e seus receptores associados torna tais mudanas no meio interno relativamente inacessveis, tanto para medir como para manipular. Na prtica, os estmulos internos so, portanto, quase sempre mais inferidos que realmente observados. Note que nesta discusso empregamos um grupo de termos para descrever as dimen ses de estmulo e outro grupo para descrever as respostas comportamentais correspon dentes. Embora haja correlaes regulares entre esses estmulos e as dimenses da res posta (descritas extensamente na rea da psicologia chamada psicofsica) as denomina es dos estmulos e das respostas no devem ser contundidas. Frequncia e intensidade de energia luminosa so dimenses do estmulo; cor e brilho so dimenses da resposta. Freqncia e intensidade de energia sonora so dimenses do estmulo; volume e altura so dimenses da resposta. Cheiro, gosto, temperatura e peso so termos de resposta

- 189-

140
120 100

Sistem a dc am pliao de alta p o tn cia Avio - 1600 rpm . 5,5m M artelar em ao , 60 cm T rovo C aldeira de um a fbrica M etro, estao local (trem passando) . Local mais ru id o so em Niagara Falls ^ R ugido do leo 2STrafego m u ito in ten so , 4,5m ^ Rdio m uito alto - C onversao no rm al, lm E scritrio ru id o so ou uma loja E scrit rio m edio Rua residencial tran q ila Rua p o u co m ov im entad a R esidncia m dia Msica b<m suave Sussurro suave, l,5 m R udo m nim o ao ar livre

I8 0
(j 4 > 0 T3 3 s f 10 c 4 > ? 20 z o
T3

2 3 0

i
50

100

1,000 1 10 ,0 0 0 1 50Q 2 Q C 1.5 0 Q Q -. 20.0QQ

F re q n cia (ciclos p o r segundo).

Figura 9-6. Intensidade de alguns sons familiares (segundo Lewis, 1963).

associados com as dimenses de estimulo da estrutura qumica, energia trmica, quantidade de fora, e assim por diante. O reconhecimento da diferena entre os termos apropriados para descrever os estmulos e aqueles para descrever as respostas impedir bastante confuso e discusso desnecessria. 9.2 GENERALIZAO DE ESTIMULO A importncia de se ter dimenses quantitativas disponveis para descrever e manipu lar os ambientes dos organismos vista claramente na quantificao do fenmeno com portamental conhecido como generalizao de estmulo. Este fenmeno observado numa forma grosseira quando uma criana aprendendo a falar se refere a todos os objetos peludos como gatos e chama todos os homens adultos de papai . Ele exemplificado em nosso prprio comportamento, quando acenamos a um estranho por engano porque se assemelha a um amigo. Nestes exemplos a similaridade de estmulos parece estar claramente envolvida, mas at que possamos especificar as dimenses quantitativas s quais relacionar objetos tais corno gatos, coelhos e casacos de pele, uma avaliao precisa do grau de similaridade de duas quaisquer situaes de estmulo difcil. A disponibi lidade de dimenses de estmulos do tipo descrito na seo 9.1 permite um estudo mais sistemtico desse tipo de similaridade que pode ser experimentalmente reinterpretada como se segue. Depois que uma resposta foi fortalecida na presena de uma configurao

- 190 -

C mdio

M iC iW ^ A ^ C D E

T e c la d o d o p ian o

t
A ltu ra p a d r o : 4 4 0 cps
L J ------------------- 1 --------------------- 1 _____________ I__________________ I______________I_____________ I_____________ L_J

25

50

100

200

500

1000

2000

4000

F re q n c ia em ciclos p o r seg u n d o

F ig u ra 9-7. F re q n c ia s d o som de vrios to n s do p ia n o (seg u n d o B oring, L angfeld e W eld, 1 9 4 8 ).

particular do meio, ela ocorrer tambm, mas numa extenso menor, quando o meio estiver ligeiramente alterado de algum modo. A resposta pode desaparecer totalmente quando a mudana no meio fr grande demais. A importncia dessas proposies enfatizar os comentrios feitos na introduo deste captulo: o estado particular do ambiente na ocasio em que o operante fortalecido, um fator importante que controla a emisso da resposta. O mtodo para avaliar a importncia do ambiente predominante durante o condicio namento simples, em princpio. Um determinado operante de algum organismo deve ser fortalecido com o ambiente num estado ou configurao particular. Aps o processo de aquisio se completar, podem ser feitas variaes em algum aspecto bem controlado do ambiente e a fora da resposta pode ser testada na nova configurao ambiental. Na prtica, o experimento oferece bastante complicao para justificar uma descrio um pouco mais detalhada. Um pombo faminto pode ser colocado numa caixa do tipo descrito anteriormente (Fig. 5-11). A aparelhagem modificada como visto na ilustrao da Parte 2, p. 121 (segundo Guttman, 1956), de modo que o painel de bicar transluminado por uma luz pura vinda de um monocromador. O monocromador permite a seleo precisa e a apre sentao de qualquer um de um grande nmero de comprimentos de onda visveis. A aparelhagem tambm permite mudanas rpidas de um comprimento de onda para outro. Num experimento executado por Guttman e Kalish (1956), os animais foram modelados a bicar o disco que era transluminado por uma luz amarelo-esverdeada (ver Fig. 9-2) de 550my (my = milimicron = 106 cm: uma medida de X . comprimento de onda). Aps alguns treinamentos em crf, os animais foram colocados num esquema de intervalo varivel (IV 1 min). Quando o comportamento havia estabilizado em IV, realizou-se testes para se determinar at que ponto a luz especfica de 550 my- no disco estava controlando o comportamento. Este teste consistiu de um procedimento de extino no qual os animais foram expostos a sries aleatrias de apresentaes sucessivas de 30 seg de 11 comprimentos de onda diferentes, dos quais somente um era o 550 my realmente

- 191 -

U ia d o

no treinamento. Nenhuma outra mudana foi feita no ambiente dos animais. (O procedimento visto em notao nos diagramas abaixo).

tre in a m e n to

s+
1 ( 3 se g )- ]

estab iliza o em I V

_
S.">50 m ju

T(i min) * IR * |^"+

L_

[T (3 s e g )j

570

$510

m fi

T estes em e x tin o

-/-

-/->

X<30 seg)

[ (3 0 SCg)- * H(30 seg)

Quando os nmeros de respostas emitidas em extino sob cada um dos estmulos diferentes foram examinados, eles se apresentaram sob a forma da Fig. 9-8. Essa figura indica que os animais deram o nmero mximo de respostas em extino apenas na presena do estmulo de treinamento e deram gradualmente menos respostas aos estmulos-teste localizados progressivamente alm do estmulo de treinamento ao longo da dimenso X . Esta gradao do responder, observada quando a fora da resposta avaliada em ambientes algo diferentes daquele em que o fortalecimento original ocorreu, conhecida como gradiente de generalizao. Em termos tcnicos, o gradiente de generalizao operacionalmente definido por uma sucesso de decrscimos de um valor estabelecido de fora da resposta (Guttman. 1956). A tcnica de Guttman-Kalish ilustra bem como procedimentos tais como esquema de reforamento e extino podem ser combinados para avaliar certos fenmenos funda mentais do comportamento. Por exemplo, considere o objetivo do esquema IV no treino. Reexaminando a Fig. 7-9, v-se que o IV produz uma grande persistncia face extino. Vrios milhares de respostas podem ocorrer antes que a taxa de extino comece a cair apreciavelmente. Na generalizao, estamos preocupados com a extenso da fora da resposta a condies de estmulo outras que no aquelas ern que o reforamento realmente se efetivou. Para fazer os testes necessrios para se avaliar esse extenso, nunca devemos reforar na presena das novas e diferentes condies de estmulo. Caso contrrio qualquer resposta que observssemos podjria ser atribuvel ao reforamento direto na presena dos novos estmulos. Mas o uso do procedimento de extino enfraquece o comportamento. Como poderemos testar 1 1 valores diferentes de estmulo em face desse enfraquecimento? A soluo para esse problema se encontra em ( 1 ) fazer a apresentao de cada estmulo-teste diferente rapidamente (cerca de 30 seg), (2) apresentar os estmulos-teste diferentes numa ordem aleatria, e (3) usar um esquema IV no treino para desenvolver uma persistncia de vrios milhares de respostas potenciaisem extino, antes que os sinais caractersticos de enfraquecimento comecem a ocorrer
- 192-

Comprimento dc onda (milimicrons) Figura 9-8. Respostas em extino, emitidas na presena de 1 1 comprimentos de onda diferentes projetados um de cada vez na chave. O treino ocorreu apenas em 500m jj (Guttman, 1956)

Os resultados da Fig. 9-8 confirmam a vantagem de se representar quantitativamente os estmulos. Suponhamos que o experimento de Guttman e Kalish tivesse sido execu tado antes de se saber que a luz poderia ser representada por ondas e medida atravs do comprimento de onda. Se o pombo tivesse sido treinado a bicar um disco coberto com papel verde e, ento, testado em extino com papis verdes e de outras cores no disco, digamos azul, violeta, vermelho, laranja e amarelo, certamente teriam ocorrido diferenas no responder a essas cores. Mas, considere como um grfico igual ao da Fig. 9-8 poderia ter sido desenhado. O fato de que nenhuma dimenso quantitativa (numrica) existia para relacionar as diferentes cores umas s outras, teria excludo tal representao funcional. No nosso exemplo hipottico, no temos base para interpolar os valores da fora da resposta entre duas quaisquer cores empregadas. Na funo da Fig. 9-8, fizemos isso facilmente, conectando as foras da resposta para dois estmulos quantitativamente adjacentes com uma linha reta. Esta interpolao por linhas retas nos permite prever a quantidade de generalizao a luzes no usadas no experimento. O mximo que poderamos fazer com um experimento realizado antes da descoberta de especificaes numricas da luz por seus cumprimentos de onda, teria sido desenhar um grfico com barras do tipo visto na Fig. 9-9. Na falta de um mtodo melhor, as cores da Fig. 9-9 esto distribudas alfabeticamente ao longo da abeissa. O fato de nenhuma varivel independente ser designado para o eixo do X da Fig. 9-9 mostra quo deficiente esta representao teria sido. Aqui, temos alguma noo da importncia de dimenses quantitativas para especificar e relacionar as variveis independentes em qualquer cincia. Alm disso, o exemplo til para mostrar como uma cincia (no caso, psicologia), frequentemente toma emprestado os mtodos e descobertas de outra (no caso, fsica), e os explora para seu prprio uso em contextos inteiramente diferentes daqueles nos quais os mtodos foram originalmente desenvolvidos.
- 193

A forma real do gradiente de generalizao variar de acordo com as dimenses particulares do estmulo empregado , o esquema e tipo de reforamento no treino do organismo em estudo, e mesmo o valor do estmulo particular de treinamento numa dada dimenso. .Assim, qualquer busca do gradiente de generalizao deve ser abandonada. Algumas vezes, um gradiente pode mesmo no aparecer e uma curva achatada de generalizao obtida. Quando a freqncia de som usada num experimento seme lhante ao de Guttman e Kalish, o grandiente de generalizao do pombo para freqncias de sons apresenta a forma da Fig. 9-10. As curvas da Fig. 9-10 so essencialmente achatadas.

Fig 9-9. Respostas hipotticas em extino, emitidas s vrias cores depois de um treino na presena do verde.

Embora o bicar o disco fosse originalmente fortalecido exclusivamente em 1.000 cps, todos os tons entre 300 e 3.500 (e tambm nenhum tom) adquiriram igual poder de controlar a emisso da resposta. No fosse o fato, conhecido atravs de outros experi mentos, de que o pombo p o d e detetar diferencialmente esses vrios sons, seriamos incli nados a concluir que a dimenso de freqncia irrelevante em termos comportamentais. Como tal, seria anloga poro da dimenso X em torno da regio de radiao gama, ou dimenso que descreve o nvel de trfego numa rua de Tquio em relao a esse animal se comportando em Nova Jersey. Somos forados a adiar, todavia, uma discusso deta lhada das variveis responsveis pelas diferenas entre as Figs. 9-8 e 9-10 at que os princpios do prximo captulo sejam introduzidos.

Freqncia (ciclos por segundo) Figura 9-10. Gradientes de generalizao ao longo da dimenso de freqncia do som para trs animais. Um tom de 1.000 cps estava presente durante o fortalecimento da resposta de bicar o disco (Jenkins e Harrison, 1960).
-1 9 4 -

Mesmo ao longo da prpria dimenso comprimento de onda da luz, o uso de estmulos de treinamento diferentes de 550m y produz gradientes de formas diferentes. Blough(1961) obteve os dados apresentados na Fig. 9-11 quando treinou trs grupos de animais em 530 my, 550my e 570my, respectivamente. Como a figura indica, a forma real do gradiente obtido varia dependendo de onde o estmulo de treinamento se encontra na dimenso X . < u o
3 30

l igura 9-11. Gradientes dc generalizao em torno de cada um dos trs diferentes comprimentos de onda de treinamento. Oito animais deram origem s curvas - dois com 530 my quatro em 5 5 0 m y ,e dois em 570 m y (Blough, 1961).

Em 530 my, a rea maior do gradiente encontra-se esquerda do estmulo dc treina mento. Em 550 my por outro ho, encontra-se direita. Somente em 570 my aparece um gradiente simtrico. Note que o gradiente em torno de 550 my, na Fig. 9-11 difere um pouco do originalmente obtido por Guttman e Kalish em 1956 (visto na Fig. 9-8). A razo dessa diferena parece estar no fato de que Blough introduziu uma precauo adicional ao coletar seus dados. Sabendo que o olho do pombo mais sensvel a alguns comprimentos de onda que a outros, ele usou intensidades ligeiramente diferentes para cada estmulo-teste. A forma do gradiente obtido por Blough sugere que h regies circunscritas ao longo do espectro de nas quais a generalizao ocorre mais pronta mente. Treinado prximo ao centro de tal regio, o animal generalizaria dentro da regio, produzindo um gradiente simtrico e com o topo achatado. Treinado na extremi dade de tal regio, o animal generalizaria em direo regio; na outra direo, sua curva cairia mais rapidamente, produzindo um gradiente assimtrico (Blough, 1961, p. 38). As trs curvas da Fig. 9-1 1 sugerem que duas dessas regies esto centralizadas em aproximadamente 515 my e 570 my, respectivamente. tentador igualar a presena dessas duas regies s bandas de cores que o homem discrimina no espectro. Esses e outros resultados indicam que o estudo da generalizao comportamental promete elucidar as propriedades fundamentais do olho de organismos infra-humanos. O paradigma simples da generalizao pode ser ampliado, examinando*se os efeitos produzidos quando mais de um estmulo usado no treino. Num experimento de Kalish e Guttman (1957), luzes alternadas de 530 my e 560 my foram usadas durante o fortalecimento inicial e a estabilizao subsequente em IV. O teste de generalizao foi efetuado do modo usual. A curva obtida vista na Fig. 9-12. Parece que este gradiente um composto de gradientes individuais. Um trabalho posterior (Kalish eGuttm an, 1959) indicou que ele, provavelmente, representa uma simples superposio de dois gradientes de generalizao. Um aspecto importante desse procedimento de treino em mais de um valor do estmulo a sua capacidade para ampliar o gradiente de generalizao. Usando ainda mais que dois estmulos de treinamento, este gradiente pode ser ampliado o quanto
- 195-

Comprimento de onda (milimicrons).

Figura 9-12. Gradientes de generalizao ao longo da dimenso comprimento de onda, depois do treino na presena de dois estmulos: 530 my e 560 my (segundo Kalish e Guttman, 1957).

desejarmos, o que, como veremos mais tarde, e bastante signiticante para o ensino de conceitos gerais criana. Fora do laboratrio, naturalmente, a generalizao nunca limitada a uma nica dimenso ambiental. Quando ocidentais ingnuos observam que todos os orientais se parecem, est ocorrendo generalizao de um estmulo complexo (o primeiro oriental ou o primeiro ocidental visto) para outros estmulos teste (outros orientais, ou outros ocidentais). Um estmulo pode ser dito complexo quando mesmo sua descrio parcial envolve mais dimenses do que seria prtico enumerar. As generalizaes complexas, como as vistas fora do laboratrio, podem ser inferidas como sendo baseadas em espalhamentos do tipo da Fig. 9-8, ao longo de cada dimenso que o estmulo de treinamento e aos estmulosteste compartilham. Podemos tentar verificar esta hiptese, pelo menos parcialmente, ampliando nossos estmulos-teste experimentais de modo a incluir mudanas feitas simul taneamente em duas dimenses de um estmulo-teste. Ao se iluminar um disco de um pombo com luzes puras de vrios comprimentos de onda, estabelece-se uma dimenso de estmulo bem controlada, X, como j vimos. Na Fig. 9-13, a luz no disco forma uma espcie de barra. Se este padro de barra girado em torno do centro do disco para qualquer de vrias posies, adicionamos ao estmulo uma segunda dimenso indepen dente - orientao angular do padro de luz.

- 196-

Verde

Amarelo

Vermelho

Violeta

Figura 9-13. Estmulos criados pela manipulao independente de duas dimenses ambientais fisicamente definidas.

Suponhamos que um animal seja treinado e subsequentemente estabilizado em um esquema IV, na presena de um estmulo que pode ser descrito por um determinado valor de comprimento de onda (digamos 550 my, 4verde ) e por uma determinada orientao angular (digamos 0o, vertical). Ento, usando estmulos-teste que difiram tanto em ngulo como em comprimento de onda durante a extino, um gradiente de generalizao que se estende sobre duas dimenses, pode ser determinado. O tratamento detalhado dos resultados quantitativos de um experimento deste tipo est alm do obje tivo da presente considerao. suficiente notar que uma diminuio ordenada da gene ralizao ocorre para os estmulos-teste que diferem em duas dimenses do estmulo original de treinamento. Esta diminuio uma funo complexa da distncia de ambos os valores dimensionais do estmulo-teste em relao aos valores iniciais do estmulo original de treinamento (Butter, 1963). 9.3 GENERALIZAO DA EXTINO Assim como os efeitos fortalecedores do reforamento de uma dada resposta numa determinada configurao de estimulo difundem-se de modo a incorporar outras configu raes de estmulo, tambm os efeitos enfraquecedores da extino difundem-se para condies de estmulos outras que no aquela particular sob a qual a extino foi efe tuada. Este fenmeno chamado generalizao da extino. Para observ-lo, iniciamos com um operante que j existe com alta fora na presena de uma faixa de estmulos. Processa-se, ento, a extino, na presena de apenas um dos estmulos. Quando o processo de extino se completa para este estmulo, os outros estmulos de toda a faixa so testados para se verificara extenso em que eles tm ainda o poder de controlar a emisso da resposta. Este procedimento pode ser resumido em quatro fases: Fase I. Fase II. Fortalecimento inicial de um operante numa situao de estmulo. Manuteno do operante (usualmente com um esquema IV) na mesma e em outras situaes de estmulo. Extino prolongada do operante em apenas uma das situaes de estmulo previamente usadas. Testes de extino conduzidos com todos os esti mulos usados na Fase II.
19/

Fase III. Fase IV.

Homg v l5 o l) executou e:.e experimento e obteve os resultados apresentados na Fig. 9-14. A poro denominada iinha-base foi obtida na fase II. Nesta fase, pombos

Figura 9-14. Generalizao de extino ao longo do continuum comprimento de onda. O treino em IV foi efetuado em 1 3 valores, de 510 a 630 mjJ.A extino ocorreu em 570 m y ( segundo Honig, 1961).

famintos bicavam o disco num esquema de reforamento em IV que vigorou para 13 comprimentos de onda diferentes no curso do treinamento. Este procedimento uma extenso do treinamento empregado por Kalish e Guttman (1957) com dois compri mentos de onda diferentes (ver Fig. 9-12) e produz uma curva de generalizao aproxima damente achatada, ao longo de todo o continuum do espectro. Na fase 111, Honig efetuou a extino exclusivamente em 570 my. Finalmente, o gradiente em forma de U visto na Fig. 9-14 foi obtido testando-se as taxas de resposta em extino com os outros 12 estmulos. Sob as condies deste experimento, um gradiente de generalizao inver tido e algo mais achatado produzido, ao invs daqueles da seo 9.2. difcil dizer se a diferena no achatamento indica uma diferena fundamental entre generalizao de extino e generalizao de reforamento. Nn estudo de Honig, a extino em 570 mu
- 198-

no foi completada na Fase III; a parte inferior da funo em U da Fig. 9-14 mostra que, em 570 my, a taxa de resposta no teste est bem acima do nvel operante zero, normal mente associado com o operante de bicar a chave. A generalizao de estmulo na extino e a generalizao de estmulo no re fo r a m e n to so procedimentos inversos. Um envolve um espalhamento do enfraquecimento e o outro envolve um espalhamento do fortalecimento. A Tabela 9-1 contrasta seus procedimentos de definio. Tabela 9-1 UMA COMPARAO DOS PROCEDIMENTOS DE GENERALIZAO DE ESTIMULO NO REFORAMENTO E GENERALIZAO DE ESTIMULO NA EXTINO GENERALIZAO REFORAMENTO EXTINO

No iti cio

fora baixa de R numa faixa de Ss

Fora alta de R, numa faixa de Ss Enfraquecimento de R em um valor de S

Operao fundamental

Fortalecimento de R em um valor de S

Teste

Numerosos Ss, ao longo de uma faixa, so apresentados e c procedimento de extino fica constantemente em efeito.

9.4 ALGUMAS IMPLICAES DA GENERALIZAO Anteriormente, na seo 9.2, destacamos rapidamente alguns exemplos, fora do laboratrio, da generalizao de estmulo. Esses exemplos de crianas que confundem uma situao com outra atravs de respostas indiscriminadas so casos em que a generali zao parece impedir a adaptao de um organismo a seu mundo. Mas a generalizao . quase sempre, uma propriedade muito til do comportamento. Por exemplo, as habili dades aprendidas numa situao ambiental podem ser usadas em novas sistuaes ambien tais. Tendo aprendido a pegar uma bola jogada a uma distncia dei ,5m, podemos peg-la tambm a 3,0, 6,0 e talvez at 12,0 m. Os pais que ensinam suas crianas a dizerem obrigado em casa esto implicitamente contando com a generalizao para que o obrigado seja emitido fora de casa. Nosso sistema educacional est baseado na supo sio de que as habilidades adquiridas na escola se difundiro em ambientes fora da escola. No obstante, o gradiente de generalizao est a para lembrar e acautelar os educadores de que, quanto mais uma situao de treino se parecer com a situao na qual o comportamento ser necessrio mais tarde, tanto mais efetivo ser o treino. Escolas c outras agncias usam este princpio quando fazem a situao de ensino mais prxima possvel da vida real .
- 199 -

Os resultados vistos nus sees 9.2 e 9.3 fundamentam a concluso inevitvel de que ambos o reforamento e a extino so um tanto especficos ao estado do ambiente preciominante quando eles ocorrem. O termo 'um tanto tem uma significao precisa na forma dos gradientes de generalizao que podem ser observados quando mudanas controladas numa ou duas dimenses de estmulo, fisicamente especificadas, so feitas. Generalizao, assim, um conceito esttico. Ao contrrio de muitos dos fenmenos comportamentais j familiares (condicionamento, extino, diferenciao), a generali zao, em si mesmaj no um processo. Isto , ela no uma mudana no compor tamento, no tempo, com um procedimento fixo mantido constante. Em vez disso, ela um fenmeno que pode ser observado depois do fortalecimento ou enfraquecimento, atravs do emprego de uma certa seqncia de operaes (por exemplo, as fases da seo 9.3). Num processo comportamental verdadeiro, o tempo aparece como a varivel indepen dente. Mas, nos gradientes de generalizao, a diferena entre os estmulos de treino e de teste a varivel independente. Embora seja esttica neste sentido, veremos no prximo captulo como a generalizao do enfraquecimento e a do fortalecimento se combinam no paradigma de discriminao, gerando um dos mais fundamentais processos compor tamentais conhecidos. As descobenas de. laboratrio sobre a generalizao trazem certas implicaes para um velho problema filosfico, o do significado de similaridade. Os comentrios lcidos de C. E. Osgood ilustram a forma pela qual o mtodo experimental na psicologia pode/ ocasionalmente, fornecer uma re-interpretao moderna de problemas filosficos tradi cionais. Suponha que perguntemos (como temos muitas vezes perguntado em aulas introdu trias de filosofia): O que mais semelhante a um quadrado vermelho um quadrado verde ou um crculo vennelho? O psiclogo com uma orientao emprica cansa-se rapidamente de discutir assuntos como a relao de qualidades nicas e corre ao laboratrio para averiguar! Aps estabelecer uma reao, qualquer reao, ao quadrado vennelho, ele testa seu sujeito humano para a generalizao ao quadra do verde e crculo vermelho. Ir o crculo vennelho mostrar mais generalizao? Se assim o for, o crculo vennelho est mais perto do quadrado vennelho que o crculo verde! Isto significa que temos agora uma escala objetiva para m edirsimilaridade'?
Somente quando estamos interessados na similaridade quando definida pelo comporta mento de um organismo. E este deve ser um tipo especfico de organismo, desde que

a similaridade para o rato, assim definida (ou para o colono australiano, por exem plo), no seria necessariamente paralela do Homo Sapiens ocidental. Isto levanta um problema m enor re la tiv o ao jargo psicolgico ns tomamos conhecimento peridico mas nunca observamos na totalidade. Seguimos o mpeto, da nossa linguagem e dizemos que h mais generalizao entre esses dois estmulos porque eles so mais aproximadamente similares, e ento (como o psic logo jovem e impetuoso citado acima), afinnamos que 'esses dois estmulos so mais aproximadamente similares porque h mais generalizao entre eles. Ambas as pro posies so vlidas,, dependendo da definio particular de similaridade. Utilizando um analisador de freqncia de onda, podemos medir a similaridade fsica ( proximi dade no continuum de freqncia) de dois tons e ento medir a generalizao em funo desta similaridade. Por outro lado, podemos usar um grupo de organismos como instrumentos de medida da similaridade de tons, como na psicofi' ^a, o que, na verdade, c medir contnuos fsicos em termos de generalizao e disc run in ao.
- 200 -

Observe cuidadosamente, todavia, que no h garantia de que as duas medidas de similaridade sero paralelas; de fato, raramente o so. A ilustrao mais clara disto se encontra no fenmeno de generalizao de oitava. Tanto para o rato como para o homem, pelo menos, a generalizao de resposta a tons separados por uma oitava maior que a tons mais prximos no continuum fsico de freqncia, e eles soam mais aproximadamente similares. Mas, naturalmente, existem aqueles que diriam que o conceito de similaridade significante apenas em tennos do comportamento dos organismos. Neste caso, devemos nos contentar com tantos tipos de similaridades quantas so as especies e culturas dentro das espcies (Osgood, 1953, p. 361). 9.5 NOTAS SOBRE O DELINEAMENTO DE EXPERIMENTOS EM PSICOLOGIA USANDO ANIMAIS COMO SUJEITOS.

U uso de animais como sujeitos em experimentos de psicologia pode ser conveniente mente datado a partir dos experimentos iniciais de Thorndike sobre aprendizagem em tentativa e erro. Os prprios comentrios de Thorndike sobre as vantagens do uso de sujeitos animais em experimentos de psicologia so uma boa leitura, mesmo atualmente. Quando desejvel se obter um melhor controle da histria passada e presente de um organismo do que possvel com um ser humano; quando desejvel investigar faixas amplas de variveis como choques eltricos intensos, luz forte, e assim por diante; e quando exigimos um perodo de tempo maior do nosso sujeito do que o horrio de uni versitrio permita, frequentemente, podemos nos voltar para uma ou outra da grande variedade de espcies animais disposio, sem muita perda na generalidade dos nossos resultados. O objetivo das presentes notas no tanto considerar o problema da generali zao dos resultados de experimentos com animais para seres humanos, mas, mais que isso, fornecei uma frmula geral para o delineamento de experimentos com animais em psicologia. Nota A. Devemos comear com um animal adequado. (Em geral, desejamos que nossos resultados sejam aplicveis a uma larga faixa de espcies, incluindo o homem). Isto , primeiro, se o problema psicolgico em investigao um que requer comportamento de escolha ou comportamento instrumental (e praticamente todos requerem), ento de vemos escolher um organismo que emita este comportamento. Devemos, em outras pala vras, escolher um organismo que tenha operantes. De acordo com este critrio, podemos ento escolher vermes aneldeos, camelos ou delfins e no devemos escolher protozorios, esponjas ou moluscos j que nunca se demonstrou que estes organismos apresentam comportamentos que seguem as leis do fortalecimento operante. No precisamos, neces sariamente, escolher um animal prximo ao homem na escala filogentica, a menos que o nosso experimento pretenda estudar caractersticas comportamentais apresentadas so mente por esses organismos filogeneticamente superiores . Para muitos problemas em aprendizagem, discriminao, diferenciao ou encadeamento, animais to modestos como o rato ou o pombo comum satisfaro. Nota B. Tendo selecionado nossa espcie, devemos tratar do problema relacionado ao tipo de experincia passada que os animais particulares tiveram (ou no tiveram), se queremos que eles sejam sujeitos apropriados. Evidentemente, se estamos delineando um experimento para examinar o processo de aquisio e o nosso animal j adquiriu a resposta selecionada ou uma muito semelhante - ele no ser um sujeito adequado. Similarmente, se estamos interessados em resultados de extino, um animal com histria prvia de extino da resposta especificada se comportar de um modo bastante diferente
- 201 -

de um que no tenha esta histria. Frequentemente, em vez de manter um registro de histrias particulares os psiclogos escolhem animais que no tm qualquer histria experi mental e que foram criados em condies controladas. Esses animais, quando usados pela primeira vez, so ditos ingnuos experimentalmente. No sempre necessrio usar tais animais ingnuos; mas devemos nos certificar de que a histria particular de nossos animais no vai, indevidamente, prejudicar nossos resultados. A uniformidade de nossos resultados ser a nossa justificao final. Nota C. Finalmente, devemos motivar nosso animal. Aqui, o problema de controle e mensurao muito mais fcil que com humanos. Podemos privar nosso pombo de alimento por, digamos 22 horas, depois do que podemos usar pequenas quantidades de alimento como um reforador conveniente; ou podemos esfriar o compartimento de nosso rato at um nvel prximo ao do congelamento, depois do que podemos usar um breve sopro de ar quente como um reforador. As notas A, B e C so sugestes para se conseguir um animal representativo que sirva como uma preparao experimental para o estudo do compolam ento. REFERNCIAS PARA O CAPITULO 9. ' Blough, D. The shape of some wavelength generalization gradients. /. exp. Anal. Behav., 1 9 6 1 ,4 ,3 1 -4 0 . Boring, E. G., Langfeld, H. W., and Weld, H. P. Foundations of psy chology. New York: Wiley, 1948. Butter, C. M. Stimulus generalization along one and two dimensions in pigeons. J. exp. Psychol., 1963, 65, 339-345. G uttm an, N. The pigeon and the spectrum and other complexities. Psychol. Rep., 1956, 2 , 449-460. Guttm an, N., and Kalish, H. I. Discriminability and stimulus generaliza tion. J. exp. Psychol., 1956, 51, 7 9-88. Guttm an, N., and Kalish, H. I. Experiments in discrimination. Sci. Am er., Jan. 1958, 1 9 8 ,7 8 -7 9 . Honig, W. Generalization of extinction on the spectral continuum. Psychol: Rec., 1 9 6 1 ,1 1 ,2 6 9 -2 7 8 . Jenkins, H. ML, and Harrison, R. H. Effect of discrimination training on auditory generalization. J . exp. Psychol., 1960, 59, 246-253. Kalish, H. I., and Guttm an, N. Stimulus generalization after equal train ing on two stim uli./. exp. Psychol., 1957,53, 139-144. Kalish, H. I., and Guttm an, N. Stimulus generalization after training on three stimuli: a test of the summation hypothesis. J. exp. Psychol., 1 9 5 9 ,5 7 ,2 6 8 -2 7 2 . Lewis, D.' J. Scientific principles of psychology. Englewood Cliffs: Prentice-Hall, 1963. Osgood, C. E. M ethod and theory in experimental psychology. New Y ork: Oxford Univer. Press, 1953. Wald, G. Eye and camera. Sci. Am er., Aug. 1950, 182, 32-41. Wallach, H. Brightness constancy and the nature of achromatic colors. . exp. Psychol., 1948, 38, 310-324.
- 202 -

TERCEIRA PARTE
UNIDADES COMPONENTES DO COMPORTAMENTO

10 - DISCRIMINAO 11 - REFORADORES ADQUIRIDOS 12 - ENCADEAMENTOS

Captulo 10 DISCRIMINAO

Uma caracterstica marcante dos organismos a sua habilidade para formar discrimi naes. Definida como o responder diferencial na presena de situaes diferentes, a discriminao contrasta com a generalizao, definida como o responder similar em situaes diferentes. As discriminaes so demonstradas ao nvel humano pela habilidade de distinguir uma coisa da outra . Alguns de ns, por exemplo, discriminamos os quadros de Monet dos de Manet, manteiga de margarina, dois grupos de impresses digitais semelhantes, dois sinais morse semelhantes. Ao distinguir uma coisa da outra estamos fazendo nada mais nada menos do que demonstrando um responder diferencial em suas respectivas presenas. Para distinguir objetos desta forma, uma certa histria passada especfica parece ser um pr-requisito. Fazemos estas e outras discriminaes to casual e naturalmente, todavia, que frequentemente negligenciamos a necessidade desta histria passada. Lembre-se, do captulo anterior, que, tendo fortalecido uma resposta na presena de um estmulo, a resposta ocorrer, embora com menor fora, na presena de outros estmulos relacionados. Se um determinado estmulo muito semelhante ao estmulo de treino, ele pode controlar a resposta quase to bem quanto o estmulo real de treinamento. O procedimento de discriminao um mtodo para quebrar o controle generalizado do responder mantido por uma ampla classe de situaes, de modo que as situaes muito semelhantes passem a ser associadas com comportamentos muito diferentes. Em termos de generalizao quantitativa ao longo de uma nica dimenso de estmulo, esta diviso ou quebra determina o estreitamento de um gradiente particular da fora da resposta em torno de um valor de estmulo: um animal treinado a bicar apenas um disco verde e no outros, uma criana treinada a restringir o nome gato para um nico subconjunto de animais peludos. O procedimento pelo qual tais efeitos so obtidos direto: o reforamento de um determinado comportamento restrito a uma dada situao. Embora este procedimento de tornar o reforamento de um operante particular condicional existncia de uma situao o estmuloparticular seja suficientemente gerai para incluir todas as discriminaes, h bastante variaes que merecem uma classificao de discriminaes em termos de complexidade, como indicado pelo nmero de situaes e estmulos e correlaes de resposta associadas requeridas. Em cada um dos

- 205-

quatro exemplos que se seguem, um comportamento diferencial est associado com diferentes ambientes. 1 . O cinemeiro que discrimina no vai a todos os filmes que so levados ao cinema da vizinhana. Ele vai (R) a alguns (Sa), e no vai (ausncia de R) a outros (S r). 2. DizemosquealgunsgruposdcpcssoassK) discriminadas quando elas so tratadas de am modo diferente que outras pessoas so tratadas. Isto , o grupo discriminado (Sy\^ tratado de um modo (R a ), e outras pessoas (S r ) so tratadas de outro modo (R r ) 3. O provador de vinhos profissional pode discriminar uma variedade de vinhos que tm o mesmo sabor para o iniciante. A discriminao do profissional evidenciada por sua habilidade em dar um nome particular (Rj R2 , R 3 ........RlOO) Para cada um dc mil vinhos diferentes ( S j, S2 , S3 , . . S\ .000)4. Nas discriminaes sutis que um relojoeiro deve fazer quando coloca (Ry) cada uma de uma dzia de pequenas peas no lugar apropriado (Sx), a diferena entre a posio correta e incorreta medida em fraes de milmetros. Cada um dos quatro exemplos ilustra um nvel progressivamente mais complexo de discriminao. Nas discusses tcnicas que se seguem, volte atrs, quando necessrio, ao exemplo correspondente para uma base intuitiva. 10.1 DUAS CONDIES DE ESTMULO, UMA CLASSE DE RESPOSTA Ao analisar a mais simples de todas as possveis discriminaes, notamos que um oiganismo emite um certo comportamento com alta tora numa situao e no emite este comportamento em outra situao. A operao bsica para estabelecer tal discri minao entre duas situaes consiste em reforar um determinado operante na presena, ou depois, de um estmulo (S^), mas no liberar reforamento para este mesmo operante na presena, ou depois de outro estmulo (SA pronuncia-se esse delta ). Dois estmulos usados desta maneira so chamados um par de estmulos discriminativos, um positivo (SD) e outro negativo (S A ). Na prtica experimental, o procedimento geralmente complicado pela adio de vrias tcnicas de controle. Algumas destas asseguram que a discriminao formada entre os dois estmulos desejados e no com relao a outras mudanas esprias do meio. Outras fornecem maneiras e meios para a mensurao quantitativa e contnua da fora da resposta durante o processo de discriminao. A necessidade desses refinamentos pode ser vista no exemplo simples de fornecer um amendoim para cada resposta de puxar a corrente que o macaco emite, durante um perodo de 3 min, quando uma luz verde est acesa e, ento, desligar a luz e suspender o reforamento da resposta de puxar a corrente durante os prximos 3 min . . . . e assim sucessivamente. 1. Se o intervalo de SA mantido constante, pode ocorrer uma discriminao temporal, permitindo que a resposta venha a ficar sob o controle de um perodo de tempo fixo de SA . e no das propriedades ambientais de S^ Lembre-se de que os esquemas de reforamento em FI demonstram que o tempo, correlacionado deste modo com contingncias de reforamento, passa a controlar o comportamento efetivamente. 2. Neste procedimento, as contingncias de reforamento em S^ s'o crf. Em crf cada uma ae uma srie de respostas reforada e a taxa de resposta torna-se uma medida sem significado. Para todos os objetivos prticos, a taxa em crf inteiramente determinada pela quantidade de tempo que o animal passa comendo cada amendoim. Ass;m, quaisquer mudanas que possam ocorrer na fora da resposta durante S^ no so detectadas.
- 206 -

3. O macaco poderia fechar os olhos, nunca olhar para as luzes, e ainda fazer uma boa discriminao respondendo apenas esporadicamente. A primeira ocorrncia de reforamento para uma resposta espordica sinalizaria que todas as outras respostas seriam reforadas por um momento. Similarmente, a primeira resposta no reforada sinalizaria que todas as outras seriam por um momento extintas. Assim, o animal poderia basear a discriminao na presena ou ausncia de reforamento ao invs de na presena ou ausncia da luz verde. Herrick, Myers e Korotkin (1959) utilizaram um procedimento instrutivo, empregando ratos como sujeitos, no estudo da discriminao entre perodos de luz (S^) escuros (S ^ ), alternados aleatoriamente. Para evitar a falha 1 , eles usaram perodos de sA de durao varivel (30, 60 ou 90 seg). Para evitar a falha 2 e obter uma medida significance da taxa de resposta durante a formao da discriminao, eles usaram um esquema de reforamento VI 30 seg em S^. O esquema VI em S ^ evitou tambm uma discriminao baseada no reforamento ou no-reforamento (falha 3) j que (i) no reforado no indicava necessariamente S^ , e (ii) a obteno de um reforamento no significa que as respostas subsequentes seriam necessariamente reforadas. Para ajudar a simplificar a inspeo do processo comportamental que resulta de um procedimento de discriminao desta natureza, as respostas em c as respostas em podem ser registradas em registradores cumulativos separados. O registrador de S ^ corre somente enquanto o SD est em efeito, e o registrado de S^ corre somente em S^ . A Fig. 10-1 mostra os registros de presso a barra de um rato nas sesses 1 , 6 , 1 1 , 21 e 40 no procedimento de Herrick, Myers e Korotkin. A resposta reforada foi a presso a

Tempo Figura 10-1. Amostra de registros dirios de um rato durante alguns dos quarenta dias de treino discriminativo (Herrick, Myers e Korotkin,1959).

barra. O dia 1 essencialmente um teste de generalizao: o rato foi treinado originalmente em S ^ e ento, no dia 1 , S^ foi introduzido pela primeira vez, alternado com SD A Fig. 10-1 indica que as taxas em S ^ e S^ foram quase idnticas no dia 1 : ocorreu uma generalizao completa da taxa de respostas de S ^ para S^ (ver Fig. 9-10,
- 207 -

que e um caso comparvel). A medida que o treino discriminativo continuou, todavia, as taxas em e S se diferenciaram. A inclinao em parece aumentar e a inclinao diminuir atravs dos 40 dias do procedimento de discriminao. Vrios comentrios podem ser feitos sobre os dois processos comportamentais associados a S ^ e S ^ , respectivamente. O aumento na taxa em SD , provavelmente um exemplo do fato de que a exposio a um esquema de intervalo depois de crf sempre inicia, entre outras coisas, um aumento gradual na taxa (por exemplo, veja as curvas de RI na Fig. 7-4), que eventualmente atinge uma assintota. Russell (1960) mostrou que se 19 sesses de treino em IV so efetuadas em SD antes do incio do treino discriminativo, nenhum aumento na taxa em SD visto durante a discriminao propriamente dita. A mudana na taxa em vista na Fig. 10-1, evidentemente, no peculiar ac procedimento de discriminao. A segunda mudana comportamental, o declnio da taxa em SA simplesmente o processo familiar de extino. Em , a presso barra nunca reforada e, assim, est sendo continuamente extinta. O processo de extino em SA , sem dvida, prolongado por causa dos efeitos da generalizao resultantes da manuteno concorrente da fora da presso barra em S^. A fora da resposta que ocorre em difunde-se para S de acordo com os princpios da generalizao. Assim, o processo de discriminao, um procedimento onde a resposta reforada sob um estmulo (SD) e no sob outro (SA ), representado pela diferenciao gradual das foras da resposta nas duas situaes de estmulo. Para medir o estado do processo de discriminao em qualquer momento determinado, uma varivel composta conveniente pode ser formada, constituda de ambas as taxas em e S A . Podemos definir o ndice de discriminao (ID) como Taxa em lD Taxa em SD + Taxa em Evidentemente, quando a taxa em SD = taxa em = K (isto , quando a fora da resposta se generaliza completamente de S para ), o ndice torna-se

i -Jl -L
D 2A -

A medida que a discriminao prossegue, a taxa em aproxima-se do nvl operante (>0) e a taxa em permanece constante (K), ou aproximadamente constante e o ndice aproxima-se de i k 1 D = j = 1 Assim, a faixa til do ndice de discriminao vai de 0,5 (generalizao perfeita sem discriminao) a 1,0 (perfeita discriminao, sem generalizao). Valores intermedirios indicam graus intermedirios de discriminao. Valores menores do 0,5, se confiveis, indicariam uma preferncia de taxa para a condio SA .
- 208-

Variveis compostas como o ndice dc discriminao tm um papel importante na construo cientfica de teoria. O fsico define a densidade de uma substncia como sendo igual a sua massa por unidade de volume (D m/v). A velocidade mdia de um corpo em movimento uma razo entre a distncia que o corpo percorre e o perodo de tempo (V = d/t). A prpria taxa de resposta, nmero de respostas/tempo, uma varivel composta, j que envolve a razo de duas variveis mais simples. A justificativa para se' formar uma varivel composta a certas outras variveis na cincia so mais simples e informativas do que aquelas para as variveis componentes tomadas sozinhas, ento, a varivel composta dita til . No caso do ndice de discriminao, parece claro que nem a taxa em SD, nem a taxa em , sozinhas, poderiam dar uma boa aproximao do nosso conceito de discriminao. Por outro lado, alguma razo dessas duas taxas parece estar mais estritamente relacionada com os conceitos de discriminao e podemos esperar que a razo seja til no sentido formal descrito. Por exemplo, a Fig. 10-2 mostra que, no estudo de Herrick, Myers e Korotkin, o ndice est de fato regularmente relacionado ao nmero de sesses de treino de discriminao. Somos levados a inferir, pela Fig. 10-2, que o processo de discriminao est virtualmente completo na sesso 1 5, ocasio em que o ndice parece ter atingido sua assntota (11) 0,93).

CO

6 < D Q d C O C X c d e +-> +
o
CO

6 < D c d X cd

Figura 10-2. Mudanas no ndice de discriminao em quarenta sesses de treino numa discriminao luz-escuro (segundo Herrick, Myers e Korotkin. 1959).

A discriminao que ilustramos chamada "'simples poique envolve um nmero mnimo de respostas (uma) c um nmero mnimo de condies de estmulos diferentes (duas) necessrias para demonstrar uma discriminao. A despeito desta simplicidade, tal procedimento tem se mostrado til para avaliar habilidades e limitaes discriminativas nos animais. Pfaffman, Goff e Bare (1958) usaram esta tcnica para medir a habilidade do rato em detetar odores. Em S^ , uma concentrao controlada de gs odorante era liberada na caixa de Skinner do rato. Em SD, nenhum odor estava presente. Alm disso em SD as presses a barra eram reforadas intermitentemente com alimento, enquanto em no havia reforamento. Valores altos do ndice de discriminao indicariam que o ralo estava discriminando o gs experimentalmente introduzido. Valores do ndice
- 209 -

prximos de 0,5 indicariam que pouca ou nenhuma discriminao estava sendo feita. Com o ndice igual a 0,5, poder-se-ia dizer que o rato no detetava nenhum odor, uma vez que ele estaria respondendo na situao como se o gs estivesse ausente. Isto , sua taxa em S A seria a mesma que em SD. O lim ia r para a deteo de odor pode ser definido como a concentrao de odor que produz um valor do ndice de discriminao significativamente maior que 0,5. Diminuindo-se gradualmente a concentrao de gs ate' que o Iq caia a um ponto onde no seja mais significativamente diferente de 0 ,5 , o limiar (mnimo valor detetvel) de qualquer odor experimentalmente introduzido pode ser determinado (Goff, 1961). Exerccio 7. Delineie um experimento para determinar o som mais fraco que um chimpanz pode ouvir. Use apenas uma classe de respostas e esteja certo de no incorrer em qualquer das trs falhas indicadas. 10.2 O PARADIGMA DA DISCRIMINAO O prottipo de todas as discriminaes o paradigma definido pelo caso mais simples. Temos DADOS: 1. Uma classe de resposta 2. Duas condies de estmulo. PROCEDIMENTO: Reforar a resposta numa das condies de estmulo (S ^)e extinguir a resposta na outra condio de estmulo (S^ ). PROCESSO: As foras da resposta em S ^ e S^ se diferenciam gradualmente, ocorrendo um processo de extino prolongada em S^ RESULTADO:O organismo passa a responder em S^ e no em S^ Ao notar o procedimento dc discriminao, desejamos expressar a noo de que existe uma contingncia diferente para S ^ e S^ .

S R P - s+ i
[ 10 . 1]

SA SA or R />
2a

2b

No diagrama [ 10.1 ] a contingncia 1 lida: na presena de SD, se R, ento algumas vezes S + produzido . As contingncias 2a e 2b (ambas so maneiras de representar a mesma coisa) so lidas: na presena de S, se R, ento nenhuma mudana no ambiente.* A contingncia 2b talvez seja lida mais convenientemente como em S^ nenhuma resposta reforada . Evidentemente, cm termos de notao, o procedimento de discriminao simples pode ser definido como a alternao de dois tipos de contingncias e seus estmulos associados, como est representado nos colchetes 1 e 2 de 110 . 1 1.

- 210 -

10.3 DUAS CONDIES DE ESTIMULO, DUAS CLASSES DE RESPOSTA Com o passar dos anos, os psiclogos projetaram uma variedade de aparelhos para testar a capacidade discriminativa dos animais. Muitos desses envolvem pelos menos duas respostas e pelo menos duas condies de estmulo. Um aparelho popular em sua poca foi a plataforma de saltar de Lashley (Fig. 10-3). Neste aparelho, um rato faminto fica

Figura 10-3. Uma forma da plataforma de saltar paia testar reaes discriminativas em ratos (segundo Lashley, 1938 ; de Munn, 1950).

sobre uma plataforma elevada de frente para janelas sua direita e sua esquerda, que esto cobertas por cartes de papelo com desenhos. No treino preliminar, a plataforma elevada fica perto das janelas que esto abertas, tendo os desenhos sido removidos. O rato tem apenas que pular da plataforma, atravs de qualquer janela, para alcanar o alimento localizado atrs do aparelho. Quando o rato acaba de comer, ele pode ser pego novamente e colocado na plataforma para outra tentativa. Gradualmente, a plataforma movida para mais longe das janelas, at que uma verdadeira resposta de pular tenha sido sucessivamente aproximada (modelada). Ento, os cartes, que sero usados como estmulos discriminativos, so gradualmente inseridos para cobrir as janelas, primeiro parcialmente- e, depois, completamente. Um carto (algumas vezes chamado carto + ) ser preso levemente por uma mola que o solta se o rato pula em sua direo. Depois do salto, o rato encontra-se de frente a um delicioso prato de farelo amassado. O outro carto (chamado as vezes carto ), todavia, esta" preso de modo que, se o rato pula em

- 211 -

sua direo, ele cai na rede localizada abaixo. Essa conseqncia serve como punio para este pulo, alm de fornecer uma tentativa de extino. Considere um experimento em que dois cartes sejam usados: e El

Esses cartes sero alternados aleatoriamente nos dois lados, em tentativas sucessivas e a janela que contiver o + estar destrancada, enquanto que a janela que contiver o estar fechada. O rato se ajustar a um procedimento desta natureza numas poucas tentativas, o que pode ser observado no aumento gradual de 0,5 para 1,0 na probabilidade de respostas ao carto correto. No difcil descrever as contingncias existentes em tais discriminaes; a chave avaliar inicialmente todas as situaes de estmulos possveis. Os cartes individuais no so estmulos por si prprios. Apenas, o seu padro particular e suas posies relativas ajudam a definir a situao de estmulo em qualquer momento. No presente exemplo h, antes de saltar, duas possveis situaes de estmulo:

El

sA % Uma vez que o experimentador tentar manter todos os outros aspectos do ambiente do rato constantes, de tentativa para tentativa, no nos preocupamos em incluir esses aspectos constantes na descrio das duas situaes de estmulo. Chamemos as duas situaes de Sa e S 3 . Se ignoramos a rede, as contingncias so: Sa
re

--> s +

Sb R j. f*

[10.2]

RDf* onde

R D^ S +

^ = saltar esquerda RD - saltar direita S+ = alimento A comparao das notaes para a discriminao simples de | 10.1] e o presente caso apresentado em | 10 . 2 | leva concluso de que 110.2 | uma discriminao dupla. Se considerarmos a relaao dc somente uma resposta num determinado momento ao reforamento alimentar, vemos que 11 0 . 2 1 se assemelha a [ 10.1 | inteiramente, mas, em vez de uma contingncia nula prevalecer numa das duas situaes, temos uma segunda contingncia agindo em conjuno com uma segunda classe de resposta. O diagrama 11 0 . 2 1 confirma que os termos S^ e S^ so sempre relativos a uma determinada resposta e devem, portanto, ser cuidadosamente qualificados quando usados ora do paradigma simples de [10.1|. Aqui em [ 10.2 [, por exemplo, razovel dizer que SA o S^ para saltar esquerda bem como o SA para saltar direita. Da mesma forma, S 3 o SD para eo para Rp;. Em geral, quando nos referimos a alguma situao particular como um S^ ou S-A , a classe de resposta qual tal situao serve desta maneira, deveria ser mostrada ou pelo menos estar implcita 110 con texto.
-212-

Figura 1 04. Aparelho de puxar para macacos. Um dos blocos amarrados com barbante ter alimento escondido atrs (Harlow, 1948).

Embora o delineamento especfico de um aparelho de discriminao com duas respostas, dois estmulos varie para cada espcie diferente de animal, dependendo de suas capacidades de resposta, as contingncias, de discriminao, invariavelmente, obedecem form a geral de [10.2| . Macacos, chimpanzs, monos e crianas prestam-se convenientemente ao uso de aparelhos que requerem respostas de manipulao (ver Fig. 10 -4 ). O fato de que a resposta do organismo possa ser dirigida ao aspecto fsico do meio ao longo do qual o estmulo discriminativo pode ser definido, no deve permitir que se deixe de levar em conta as contingncias comuns em todas as discriminaes. Na seo 10 . 1 , examinamos um experimento no qual ratos pressionavam uma barra quando uma luz estava presente, mas, por convenincia experimental, eles poderiam ter apenas que correr em direo luz. Na Fig. 10-4, o comportamento do animal dirigido a um dos blocos e, alm disso, certas propriedades do estmulo, associadas aos prprios blocos, controlam essa resposta. Mas, em ambos os casos, a correlao de comportamentos diferentes com ambientes diferentes caracterizam-nos como discriminaes. 10.4 m CONDIES DE ESTMULO, n CLASSES DE RESPOSTA

Aumentando-se o nmero de estmulos discriminativos usados aumenta-se a complexidade da discriminao. Considere um caso em que um nico carto positivo, + e dois cartes negativos,F~le | | | possam aparecer. As situaes possveis antes da resposta (supondo que em cada situao uma, e somente uma, resposta possa ser reforada) so:

b
SA

e
S

B B
S</

B B
S|>
- 213 -

Em S \ e Sb, o pular a esquerda ser reforado, enquanto em Sc e Sd, o pular direita ser reforado. O uso de cartes adicionais negativos e/ou positivos cria ainda mais situaes e pode-se dizer que o grau de complexidade da discriminao aumenta correspondentemente. As discriminaes podem ser ainda mais complicadas pela especificao de contingncias para mais de uma ou duas classes de resposta. No Wisconsin General Test Apparatus (visto na Fig. 10-5) os movimentos de apanhar objetos a direita, esquerda e centro so frequentemente especificados. Pode-se colocar alimento em recipientes rasos, localizados debaixo de qualquer de trs objetos. O arranjo desses objetos serve para

Figura 10-5. O Wisconsin General Test Apparatus. As respostas do experimentador se limitam a apresentar e retirar a bandeja de estmulo, misturar os objetos na bandeja e colocar alimento nos recipientes que esto debaixo de alguns blocos. As respostas do sujeito se limitam a afastar qualquer dos blocos e pegar a comida (se alguma) no recipiente com alimento, debaixo do bloco deslocado <segundo Harlow, 1949).

definir os estmulos discriminativos. Se apresenta ao macaco a tarefa de escolher um cubo, em vez de uma pirmide ou uma esfera e supondo-se que cada objeto deva ser apresentado em cada tentativa, ento as possveis situaes de estmulo so arranjadas em

>
S.

& Sc

O Se

&

(S i

&

>

o Sp

Sr Sp trs grupos, dependendo da localizao espacial do cubo.


- 214 -

10.5

MUDANAS CONTINUAS NO COMPORTAMENTO EM FUNO DE MUDANAS CONTINUAS NUMA DIMENSO DO ESTIMULO

Ao apanhar corretamente urn objeto localizado em qualquer parte de uma mesa, empenhamo-nos numa discriminao que no pode ser facilmente descrita por um nmero fixo de respostas, em relao a um nmero fixo de estmulos discriminativos. Isto porque, para cada posio do objeto sobre a mesa, um e somente um conjunto de resposta otimamente reforado. Mas existem muitas posies possveis. Como uma aproximao, podemos representar uma mesa dividida como um tabuleiro de xadrez, com fileiras i e colunas j e, desta maneira, designar, artificialmente, um nmero limitado de classes de resposta e de estmulos discriminativos possveis (ver Fig. 10-6). Suponha que localizemos cada classe possvel de estmulos discriminativos pelo seu nmero na fileira (i) e seu nmero na coluna (j).
Coluna j

7/7

Figura 10-6

Ento, o objeto, no momento, repousa na fileira 3 e coluna 4. A classe de estmulo discriminativo que representa essa condio S3 ?4 e a classe de movimentos de apanhar que sero reforados pelo contato com o objeto denotada correspondentemente como R3 ,4 . Essa anlise pode ser generalizada como a contingncia S,J Rij onde S = objeto na posio i, j R = movimento de apanhar S+= contato com o objeto i = nmero de fileira j = nmero da coluna Uma vez que i e j so variveis, o Diagrama [10.3] representa um exemplo da representao funcionai da seo 6.14. As coordenadas espaciais da classe de resposta [10.3]

715 -

l igura 10-7. Quadros de uma aproximao simulada de um mssil a um alvo estratgico O bicar de um pombo fornece o sinal de controle (de Swartz, 1963, segundo Skinner, 1960)

~ 216 -

reforada so uma funo contnua das coordenadas espaciais do objeto estmulo. No presente exemplo, o ngulo e extenso da resposta de apanhar dependem da posio espacial do objeto. A funo complexa, mas no h razo para se 'suspeitar que o procedimento bsico de discriminao empregado em cada uma das outras sees deste captulo no seja o mtodo para formao dessa discriminao, ou melhor, conjunto de discriminaes. As respostas com determinados valores de ngulo e extenso, que caem em certos limites pequenos, so reforadas somente quando o objeto est numa certa posio relativa ao organismo. As respostas cujos valores de ngulo e extenso se desviam desses limites no so reforados. ( 0 objeto no apanhado)* Tal histria passada e subseqente controle do comportamento que ela confere posio espacial, c imediatamente aparente quando tateamos em busca de uma lanterna no escuro, ou quando procuramos por um lpis que cai debaixo c!e uma mesa, fora da viso.

0 comportamento envolvido quando um operador rastreia um alvo mvel o exemplo mais sofisticado de tais discriminaes. Ao dirigir um automvel ou apontar uma arma para um objeto que se move rapidamente, requer-se um conjunto de respostas que deve variar continuamente com as mudanas constantes das condies de estmulo. Embora tais discriminaes sejam complexas, elas so adquiridas atravs de uma histria adequada de contingncias de reforamento. O projeto ORCON (ORganic CONtrol), o resultado de um projeto de pesquisa da II Guerra Mundial, ilustra as sutilezas discriminate as que podem ser conferidas a um organismo to pouco ilustre como o pombo. O objetivo ORCON era treinar pombos para guiar msseis para alvos selecionados (Skinner, 1960). Os animais eram colocados no nariz, em forma de cone, de um mssil, frente a uma tela onde era projetada uma imagem simulada de um possvel alvo inimigo. Presos em jaquetas especiais, os pombos ficavam imobilizados, apenas com a cabea e o pescoo livres. Um eletrodo de ouro cobria a ponta do bico de cada pombo. Zomo a tela em que o animal havia sido treinado a bicar era feita de um material semicondutor, a localizao exata das bicadas podia ser detetada por um curcuito eletrnico no mssil. A informao assim obtida seria usada para disparar o mssil. Durante o treino, o reforamento era contingente a bicadas apenas no centro de um alvo selecionado. Uma vez que um mssil, movendo-se numa velocidade superior a 960 km/h poderia rapidamente mover o alvo na tela enquanto o animal parasse por alguns segundos, um esquema intermitente foi usado, mantendo uma alta taxa de bicar. Alguns quadros de uma aproximao simulada so vistos na Fig. 10-7.0 alvo passa a ser visto no quadro superior e o pombo comea a bicr. O animal continua a manter o mssil em curso por vrios minutos, como visto nos outros trs quadros. Os pombos foram treinados, com xito, a ignorar sinais esprios que aparecessem em suas telas, tais como avies da artilharia antiarea e nuvens, e a manter o curso de apenas um dos vrios alvos estratgicos particulares que poderiam aparecer no campo de viso.
10.6 DISCRIMINAO SEM RESPOSTAS EM SA Em trabalhos anteriores com o procedimento de discriminao simples, Skinner (1938) relatou que o processo de discriminao seria muito mais rpido se o procedimento de discriminao fosse efetuado simultaneamente com o fortalecimento original do operante. Em certos casos extremos, Skinner foi capaz de mostrar que ratos poderiam formar discriminao luz-escuro imediatamente.

- 217 -

Sugere-se a seguinte explicao para se levar em conta este efeito. Um processo de discriminao, tal como o descrito na seo 1 0 . 1 , prolongado principalmente devido ao processo de extino que deve ocorrer em S^ . Mas, uma das principais variveis que afetam a extenso de qualquer processo de extino o nmero de reforamentos obtidos na aquisio (ver seo 5.9). Se poucos reforamentos so dados antes da extino, esta ser rpida. No treino discriminativo, a resposta em S^ devida a generalizao do fortalecimento em S^ * O gradiente de generalizao implica em que o potencial de respostas em S ^ , gerado pela aquisio, ser menor que ou igual aquele estabelecido em S^. Nesta anlise, pressupe-se uma famlia hipottica de gradientes de generalizao, tais como os da Fig. 10-8. O parmetro da Fig. 10-8 o nmero de reforamentos fortalecedores durante a aquisio. Note que, quanto menor o nmero de reforamentos administrados, mais prximo S^ pode estar de SD, sem que ocorram respostas a S A atravs da generalizao. No procedimento de Skinner, o treino discriminativo comeou com uma luz presente (SD). A primeira presso a barra emitida, no nvel operante, foi reforada e S^ foi imediatamente substitudo por um perodo de 5 min de escuro (S ^ ). Depois do perodo de 5 min em , o S ^ foi reintroduzido e novamente a primeira resposta emitida foi reforada, seguida pelo aparecimento do S ^ e suas conseqncias de extino. Este ciclo foi repetido atravs do treino discriminativo. Sob essas condies, a generalizao a negligvel, havendo pouco ou nada para extinguir em sua presena. Devido ao fato de que o responder em S^ no ocorre na aquisio de tais discriminaes, elas so apropriadamente denominadas sem erro . H. S. Terrace (1963 a, b) estendeu essa tnica para demonstrar discriminaes sem erro entre pares de estmulos discriminativos muito prximos no gradiente de generalizao. No trabalho de Terrace, o princpio do mnimo fortalecimento inicial combinado com a tcnica de usar, inicialmente, estmulos bem diferentes como S ^ e SA e, ento, progressivamente, reduzir as diferenas fsicas entre eles.

Dimenso do Lstmulo Figura 10-8. Famlia hipottica de gradientes de generalizao com o parmetrc nmero de reforamentos no fortalecimento original. Cada curva representa um nmero diferente de reforamentos no treinamento em S ^ , de 1, 2, 3 ... a n.
- 218-

O treino discriminativo iniciado com um sA bastante diferente de para evitar generalizao (ver Fig. .10-8). medida que se prossegue o treino discriminativo, as diferenas entre e so gradualmente reduzidas, tornando-se o mais e mais semelhante a SD. Isto resulta em tornar o S ^ cada vez mais prximo do SD nas suas dimenses comuns de estmulo. Num dos procedimentos de Terrace, o bicar um disco vermelho foi modelado e receber poucos reforamentos. Uma discriminao entre vermelho (S^) e verde (S) foi estabelecida, virtualmente, com nenhuma bicada em com o seguinte mtodo: O bicar a chave condicionado a uma luz vermelha (Sl^). Seguindo cada um dos cinco primeiros reforamentos, a luz da chave era sempre vermelha. Depois do quinto reforamento, a chave foi obscurecida por 2 seg, depois do que a luz vermelha aparecia novamente. Seguindo os 20 prximos reforamentos, o intervalo (escuro) foi progressivamente aumentado at o intervalo mximo de 30 seg, com uma mdia de 15 seg, ser alcanado. Neste ponto, o S ^ foi introduzido. Inicialmente, S era uma luz verde fraca com 1 seg de durao. Durante tentativas sucessivas em SA , sua durao e intensidade foram aumentadas progressivamente, at que a durao de S A fosse de 5 seg e os brilhos de SD e S ^ fossem iguais (Terrace, 1963, b, p. 224). O mtodo de treino discriminativo de fortalecimento mnimo em S&,com reduo , parece ter um nmero de vantagens. Lm primeiro lugar, parece que tais discriminaes so formadas bem mais rapidamente do que aquelas em que se emprega os procedimentos das sees 10.1-10.5. Segundo, o valor assinttico de Id provavelmente mais prximo de 1 ,0 com esta tcnica. Terceiro, desde que poucas respostas, ou mesmo nenhuma, ocorrem em S ^ , no h os efeitos emocionais caractersticos da extino nessas discriminaes sem erros. Os distrbios que caracterizam esses efeitos emocionais (discutidos mais amplamente no captulo 18) so geralmente indesejveis na aprendizagem de habilidades e discriminaes cotidianas. Ento, o mtodo de treinamento de discriminao sem erro pode ter um emprego importante na tecnologia educacional.
progressiva de diferenas entre

10.7 TEMPOS DE REAO DISCRIMINATIVOS A histria caracterstica do treino discriminativo S ^ - S A estabelece controle de estmulo sobre os operantes. A medida que S ^ passa a controlar, progressivamente, seu operante, o tempo entre o aparecimento de S ^ e a ocorrncia do operante diminui. Este tempo, anlogo latncia do reflexo S2 > R 2 > chamado tempo de reao discriminativo (RT). Sob certas condies, o RT discriminativo pode ser um ndice da fora de uma resposta, ou do estado de um processo de discriminao. Durante o treinamento SD - S^ do tipo descrito nas sees 10.1 e 10.2, o RT diminui progressivamente, aproximando-se - no rato - de uma assntota de cerca de 1 seg. Existe uma vasta literatura sobre RTs assintticos em discriminao humana na medida em que se relacionam complexidade da situao de estmulo, nmero de contingncias possveis, dificuldades em discriminar S ^ e S ^ , intensidade de SD, administrao de drogas, etc. O RT discriminativo do frear quando ocorre uma situao onde um acidente pode acontecer, tem sido de algum interesse para as ^osquisas de
- 219 -

segurana de estradas. Como se sabe, este RT pode variar de uma pequena frao de segundo at vrios segundos, dependendo de fatores tais como a concentrao de lcool no sangue, nmero de horas na direo e presena ou ausncia de cafena no sangue. No laboratrio, os tempos de reao so frequentemente medidos dando-se instrues a um sujeito humano para pressionar uma chave telegrfica to rpido quanto possa, depois de receber um sinal. Tempos de reao da ordem de pequenas fraes de segundo (200 500 milisegundos) so obtidos com tal procedimento, particularmente se o sinal de Prepare-se precede o sinal verdadeiro para responder . No comportamento cotidiano, a maioria $e nossas respostas no emitida sob condies favorveis tais como as do labortrio e a necessidade de uma reao muito rpida apenas ocasional, como no atletismo, combate militar e controle de mquinas como o avio e o automvel. Por vrias razes, os valores alcanados em experimentos humanos de tempo de reao raramente so aproximados, mesmo nessas circunstncias. Os sinais de aviso frequentemente esto ausentes;pode-se no saber de que direo est vindo o estimulo; geralmente, a pessoa est empenhada em fazer outra coisa quando a resposta subitamente requerida; a resposta pode envolver a ao de grandes grupos de msculos em vez de pequenos grupos; o estmulo pode ser muito fraco, ou to forte que causa a imobilizao , e assim por diante. Ento, um grupo de jogadores de futebol americano pode levar em mdia at 400 mseg para desfazer uma formao de jogo a um sinal auditivo; e o tempo de reao de motoiistas de automvel pode aumentar de vrios segundos quando a ameaa de um acidente requer uma mudana do p do acelerador para o freio (Keller e Schoenfeld, 1950, p. 146). 10.8 AS IMPLICAES DO CONTROLE DE ESTIMULO OPERANTE Passando do simples para o complexo, tentamos mostrar os mtodos pelos quais o estado do ambiente imediato passa a controlar uma resposta operante. Operantes sob tal controle so chamados operantes discriminativos. Quando o rato salta para o carto apropriado, quando o macaco puxa o barbante correto, quando a criana pega um objeto e quando freamos o carro diante de uma luz vermelha a resposta emitida est sob um poderoso controle de estmulo. Logo, um operante discriminativo e o controle de estmulo depender, em cada caso, de uma histria anterior com os tipos de contingncias de reforamento descritos nas sees de 10.1 a 10.5. A natureza do controle de estmulo operante tal que, no apenas a ocorrncia da resposta, mas tambm certas propriedades d? resposta, podem vir a ser controladas pelo estmulo, dada uma histria passada particular de reforamento. No controle de respondentes por eliciadores, as propriedades da resposta tais como magnitude, durao e latncia so uma funo fixa do eliciador, determinada pelas leis do reflexo. No controle de estmulo operante, no existe uma relao nica entre a intensidade de S ^ e as propriedades da resposta tais como durao e RT. Por exemplo, a magnitude da resposta reforada pode ser, dentro de amplos limites, qualquer uma que as contingncias especifiquem que seja. Assim, poderamos construir um operante discriminativo que imitasse as leis do reflexo. Reforando-se adequadamente qualquer resposta determinada, a presso barra ou a expresso por favor , por exemplo, na presena de uma luz ou um tom, por exemplo, a fora da resposta reforada poderia ser diferenciada de modo a

- 220 -

s+

sr

[10.4]

ser proporciona] intensidade do estmulo prevalecente. Podemos representar isso, em notao, como onde y a fora da resposta e x a intensidade do estmulo, sendo y definido como proporcional a x. Um observador, olhando o organismo assim treinado, e que no conhece sua histria com as contingncias de [10.4] poderia ser inclinado a chamar a resposta observada, Ry, de um respondente. Note que este erro decorre ao se negligenciar a histria passada relevante desse organismo. Para evitar estas interpretaes erradas, deve-se sempre ter cautela ao considerar exemplos de comportamentos fora do laboratrio. Frequentemente, a histria passada relevante no pode ser descoberta. Nosso prprio comportamento discriminativo, por exemplo, to familiar, to automtico, que provavelmente no nos lembramos de como foi adquirido. Como um exerccio instrutivo, considere uma regra de contingncia em que o inverso da lei da magnitude do reflexo poderia ser obtido, tornando-se o y de [ 10 .4| = l/x . O resultado, agora, seria criar uma R cuja magnitude fosse uma funo inversa da intensidade do estmulo discriminativo na presena do qual ocorreu. Talvez, fique claro, com este exemplo, porque a magnitude da resposta no uma medida adequada do fortalecimento operante. A magnitude da resposta pode ser modelada arbitrariamente, dependendo das contingncias de reforamento. Uma vez que uma discriminao operante de qualquer tipo tenha sido formada, controlar a ocorrncia de SP uma forma de controlar a ocorrncia da resposta. Depois de 40 sesses de treino discriminativo, para fazer com que ratos como os de Herrick, Myers e Korotkin, pressionem uma barra basta somente apresentar a luz. De forma similar, para fazer com que ratos como os de Pfaffam, Goff e Bare pressionem uma barra, necessitamos somente retirar o odor de suas cmaras e apresentar ar fresco. Para fazer um homem se mover, pedimos que ele se mova. Em todos esses casos, a resposta est sob o controle de um estmulo anterior (a luz, o ar fresco ou o pedido), mas a relao da resposta com o estmulo difere consideravelmente daquela do respondente com seu eliciador. Em primeiro lugar, as leis do reflexo no se mantm entre o e sua R. Aumentos na intensidade de diminuiriam a probabilidade de R, de acordo com o princpio de generalizao. (Tente gritar seus pedidos s pessoas). Em segundo lugar, a relao entre e R depende da histria de discriminao. Essa histria dificilmente pode ser ignorada, porque sem ela um no poderia obter seu status de varivel controladora do comportamento. Para distinguir entre o tipo de controle que os eliciadores tm sobre seus operantes, dizemos que um estabelece a ocasio para uma resposta, isto , estabelecida uma ocasio onde a emisso de R produz reforamento. 10.9 A S1GNIFICNC1A DAS DIFERENAS ENTRE DUAS MDIAS Existem ocasies em que o comportamento em S ^ e SA to semelhante que assegurar a presena ou ausncia do responder diferencial, o sine qua non de uma discriminao, pode ser difcil. O responder muito similar em SD e em S A pode ocorrer quando o organismo no adquiriu o comportamento de observao adequado, quando SD e SA so muito semelhantes, quando influncias que tiram a ateno esto presentes, e assim por diante. Se as diferenas entre as taxas de resposta em S^ e S A so

- 221 -

r pequenas, o experimentador pode ficar inseguro se qualquer discriminao est sendo feita. O problema de avaliar pequenas diferenas numricas transcende as discriminaes. Sempre que dois grupos de medidas de qualquer tipo so muito semelhantes, ou h bastante variabilidade entre elas de modo que elas se sobreponham apreciavelmente, aparece uma necessidade de uma avalizao objetiva das diferenas numricas observadas. So as-diferenas observadas, embora pequenas, atribuveis aos efeitos sutis, mas possivelmente, teroricamente importantes, de condies experimentais diferentes, ou so apenas o produto de erros casuais de medida? Considere os dados da Tabela 10-1, indicados como histogramas na Fig. 10-9. Esses dados so 60 taxas fictcias de resposta que poderiam ter sido obtidas em 60 apresentaes de um minuto das condies S ^ e SA 5 alternadas ao acaso. Se isto ajuda a tornar a discusso completa, considere S ^ como perodos de 1 min de ar fresco e S ^ como perodos de 1 min de concentrao muito baixa de gs odorante, e o sujeito fictcio como um dos sujeitos de Pfaffman, Goff e Bare discutidos na seo 10-1. Os dados das condies em S ^ e S ^ so claramente semelhantes. H uma superposio substancial entre os dois histogramas da Fig. 10-9. Muitas respostas so emitidas em SA Tabela 10-1

1 MIN DE SD E S A ,
25 21 25

NMERO DE RESPOSTAS REGISTRADAS EM 60 PERODOS DE ALTERNADOS AO ACASO. OS VAI ORES DE SA ESTO EM NEGRITO (DADOS HIPOTTICOS) 13 25 25
11 25 8

30 27
11

24 23
0

29

22
15

24 29
28 19 32 31

27
23 19

16
26 27 26 23

26 27

37 26

22
25

30 25 27

28

6
23 21

24 26 23 6

27
25 19

16
24

20
20

26
22

29

25

.5 '5 c o cr t> t H u,

15 20 f25 Nmero de respostas emitidas em intervalos de teste de 1 min. 1'igura 10-9. Histogramas do nmero de respostas emitidas em 30 perodos de um minuto de sA (acima) c 30 perodos <te um minuto dcSD (cmbaivo) Dados fictcios

10

- 222 -

a discriminao entre ar fresco e odor, se existe, mnima. Contudo, existem,insinuaes de uma diferena entre o responder em e .A distribuio em SA est mais esquerda da discriminao S ^; a distribuio em contm a taxa mais baixa (0 respostas) enquanto a distribuio em contm a taxa mais alta (36 respostas); as modas das duas distribuies no so idnticas; a mdia da distribuio em S A 20,7 respostas/min e a da distribuio em 24,7 respostas/min. So as diferenas nestas duas distribuies o resultado de erros casuais de medida ou elas so, de fato, indicaes significantes de uma pequena discriminao? Neste ponto, til lembrar alguns aspectos pertinentes da assim chamada curva normal, discutida na seo 2.6 e reproduzida na Fig. 10-10. Em particular, desejamos lembrar que entre mais ou menos um certo nmero de unidades de desvio padro, 0 do centro, encontra-se uma certa percentagem de medidas contidas na rea sob tal curva. Para rever, 68 por cento das medidas se encontram sob a curva entre + 1 O da mdia central. Uma maneira

Figura 10-10. A curva normal.

alternativa de expressar esta propriedade dizer que, se estivssemos retirando aleatoriamente amostras de medida desta distribuio normal, a probabilidade de se obter uma medida que se encontre dentro desta regio seria de 0,68 e a probabilidade de se obter medidas que se encontrem fora desta regio seria de 0,32. Similarmente, 95 por cento das medidas esto entre . 2 O da mdia. Ento a probabilidade de se obter uma medida fora desta regio t 2 O apenas de 0,05. Agora, suponha que as nossas medidas da taxa de resposta em S ^ e S na Fig. 10-9 representem amostras de medidas tiradas de uma populao de dezenas de milhares de medidas potenciais e cuja distribuio seria parecida com a curva normal na Fig. 10-10. Esta distribuio normal teria um certo O a ela associado que descreveria sua variabilidade devido a erros de medidas. Se tivssemos esta distribuio ao nosso alcance e nos fosse dado ainda uma nica medida da taxa de resposta sobre a qual nada saberamos, exceto o seu valor e se nos perguntassem, subsequentemente, se tal medida pertence aquela distribuio, poderamos dar uma resposta significativa em termos de probabilidade. Precisamos apenas verificar de quantas unidades C esia nova medida se desvia da mdia da distribuio normal e dizer, ento, qual a probabilidade de que ela pertena a esta distribuio. Suponha que tal medida se encontre na regio sob a curva fora da linha limite de exatamente 2 O acima da mdia. Ento, a probabilidade apenas 0,05 de que ela faa parte da distribuio porque 0,95 (95%) dos valores desta
- 223 -

distribuio esto entre + 2 C J e somente 0,05 (5%) esto ora. Esta proposio no diz que a medida dissidente no veio desta distribuio; poderia ter vindo. Somente diz que algo improvvel que ela tenha vindo. i Nosso problema presente tem alguns elementos em comum com a avaliao de uma nica medida nova em referncia a uma distribuio conhecida. Avaliando nossos dados de discriminao no temos apenas uma comparao de uma medida com uma distri buio de medidas, mas uma comparao de duas distribuies separadas (S^ e SA) de medidas. O que gostaramos de saber se a distribuio em S^ difere sistematicamente, embora pouco da distribuio em S^. Uma maneira proveitosa de abordar este problema investigar se as mdias das duas distribuies diferem significativamente uma da outra. Em outras palavras, ser que a diferena de 4,0 entre 20,7 e 24,7 representa apenas flutuaes ao acaso na taxa de resposta momento-a-momento que, por acaso, foi detetada na nossa diviso arbitrria da sesso em perodos de S ^ e S A e, no que diz respeito ao rato, S ^ e S A constituem tratamentos iguais? Ou, ser essa diferena de 4,0 o resultado das condies SD realmente terem um efeito diferente de SA sobre a tendncia do responder? Uma maneira laboriosa de determinar a interpretao mais plausvel seria fazer mais sesses adicionais e idnticas do nosso experimento, mas usando um valor para SA que sabemos estar muito prximo de S ^ para ser discriminavelmente diferente dele (por exemplo, S ^ sA), de modo que quaisquer diferenas nas taxas em S^ e S ^ teriam que ser devidas apenas ao acaso. Essas sesses adicionais dariani um grande nmero dc novas mdias de taxas de resposta em S^ e sA . Poderamos subtrair a mdia de da mdia de S A para a sesso e obter uma diferena; poderamos subtrair a mdia dc SD da mdia de SA para a sesso 2 e obter outra diferena e assim, sucessivairente, para todas as sesses que tivssemos a pacincia de realizar. Terminaramos com um conjunto de nmeros, as diferenas entre as mdias emSD e S ^ . Poderamos fazer um grfico da distribuio dessas diferenas entre as mdias (os estatsticos nos asseguram que resultar numa curva normal) e calcular o desvio padro, o sigma das diferenas entre as mdias da amostra, O Md. Note que esta distribuio das diferenas entre as mdias da amostra deve ter o centro em torno de zero se, ao manter nossas condies experimentais constantes de sesso a sesso, nenhuma discriminao foi possvel entre S^ e sA . As diferenas observadas entre as mdias obtidas de sesso para sesso seriam, neste caso, apenas aquelas resultantes de flutuaes no responder, devido a influncias no controladas, mas presumivelmente no sistemticas, que poderiam ser tanto positivas quanto negativas em qualquer momento. Com a adio de sesses, elas se cancelariam mutuamente, deixando-nos uma diferena mdia entre as mdias igual a zero. Uma vez com essa distribuio das diferenas entre as taxas mdias de resposta durante perodos de S ^ e S A no discriminveis, poderamos, ento, comparar o nosso valor observado de 0,4 com a distribuio das diferenas casuais entre as mdias, para ver se 4,0 est alm de 2 (T Md unidades do centro em zero. O mtodo seria o mesmo atravs do qual comparamos uma nica medida com uma distribuio conhecida. L)e fato, no prtico e nem econmico repetir estes experimentos de controle ta.nlas vezes para obter uma estimativa razovel de como a distribuio das diferenas entre as mdias da amostra se apresentaria no caso onde houvssemos arranjado anteriormente para que as amostras no diferissem consideravelmente, exceto por acaso. Na prtica, podemos nos valer de uma derivao da estatstica matemtica que mostra
- 224 -

que uma estimativa do desvio padro crtico, O Md, pode ser obtido com um pouco dc matemtica aplicada s nossas 30 medidas originais em SD e S A. O que devemos fazer primeiro calcular o desvio padro do conjunto das 30 taxas observadas em e o desvio padro do conjunto das 30 taxas observadas em SA dos dados da Tabela 10-1. Combinamos, ento, esses dois desvios padres obtendo um desvio padro combinado (chamado cr D para distinguir de outros desvios padres) que para os dados da Tabela 10-1 =9,15. Neste ponto aplicamos uma frmula estatstica, com cuja origem no precisamos nos preocupar, para obter uma estimativa de o o desvio padro das diferenas entre as mdias da resposta em SD que esperaramos obter se repetssemos o experimento por muitas sesses. A frmula diz que CTj^ estimado por cr D /V N - onde N o nmero de pares de medidas que temos, neste caso, 30. O resltado, 9,15/ V 30 = 1,67, pode ser usado para determinar a probabilidade de que a nossa diferena mdia particular observada, 4,0, aparece apenas devido a erros envolvidos ao se medir as taxas de resposta em S^. Evidentemente, 4,0 maior que duas unidades do tamanho de 1,67. Isto , a diferena obtida, + 4,00, encontra-se na regio (+ 4,00 / 1,67) a unidades acima da mdia da distribuio terica das diferenas esperadas apenas por acaso. (Lembre-se de que a mdia desta distribuio terica, para o caso onde h somente erros casuais em para perturbar as medidas da taxa da resposta em zero). Realmente, uma diferena to giande como 4,0 entre duas mdias seria esperada surgir devido ao acaso menos que 5% das vezes. Uma diferena observada to improvvel de surgir devido a erros casuais de medida convencionalmente dita estatisticamente significante. neste sentido tcnico que, quando nos referimos a resultados numricos neste texto, a palavra significncia empregada. Iniciamos com uma certa diferena pequena entre duas distribuies de taxa de resposta. Utilizando certas propriedades da curva normal e certas derivaes da estatstica matemtica, fomos capazes de encontrar a probabilidade do que uma diferena entre as mdias de duas distribuies observadas de dados fosse to grande quanto o seria se atribuda apenas a erros casuais. Ao fazer assim, avaliamos a significncia estatstica da nossa diferena. A tcnica usada foi encontrar, primeiro, um desvio padro combinado representando a variabilidade em e SA e, segundo, desta estatstica derivar o O O mtodo supe que nmeros iguais de medidas sejam feitos nas duas condies. Esta restrio pode ser superada pelo uso de outras frmulas, algo menos intuitivas, encontradas em qualquer livro elementar de estatstica. Em geral, os mtodos para stimar a probabilidade de que as diferenas observadas entre duas mdias so devidas a erros casuais de medida so usados onde ( 1 ) as diferenas observadas so pequenas, ( 2 ) a variabilidade de medidas alta como um resultado de perturbaes no controladas ou no controlveis, (3) o tempo no permite a replicao do experimento bastante vezes de modo a fornecer uma base emprica para estimar a confiabilidade das diferenas encontradas entre as condies experimentais. REFERNCIAS PARA O CAPITULO 10 Goff, W. R. Measurement of absolute olfactory sensitivity in rats. Amer. J. Psychol., 1961, 74, 384-393. Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews (E d .), Methods of psychology. New York: Wiley, 1948.

- 225-

Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56, 51-65. Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in S and SA rates during the development of 'an operant discrimination. / . comp, physiol. Psychol, 1959, 52, 3 5 9 - 3 6 3 . Keller, F. S., and Schoenfeld, W. N. Principles of psychology. N e w York: Appleton-Century-Crofts, 1950. Lashley, K. S. The mechanism of vision X V . Preliminary studies of the rats capacity for detail vision. J. gen. Psychol. 1938, 18, 1 2 3 - 1 9 3 . Mienson, J. R. Random interval schedules of reinforcement. J. exp. Anal. Behav., 1963 6, 4 3 7 - 4 4 3 . Munn, N. L. Handbook of psychological research on the rat. Boston: Houghton Mifflin, 1950. Pfaffman, C., Goff, W. R., and Bare, J. K. An olfactometer for the rat. Science, 1958, 12 8, 1 0 0 7 - 1 0 0 8 . Russell, I. S. Analysis of the responding during operant discrimination. Unpublished doctoral dissertation, Indiana Univer., 1960. Skinner, B. F. The behavior of organisms. Chapter 5. N e w York: A ppleton-Century, 1938. Skinner, B. F. Pigeons in a pelican. Amer. Psychol., 1960, 15, 2 8 - 3 7 . Swartz, P. Psychology the study of behavior. Princeton: Van Nostrand, 1963. Terrace, H. S. Discrimination learning with and without errors. J. exp. Anal. Behav., 1963a, 6, 1 - 2 7. Terrace, H. S. Errorless transfer of a discrimination across two continua. J. exp. Anal. Behav., 1963b, 6, 2 2 4 - 2 3 2 .

- 226 -

Captulo 11 REFORADORES ADQUIRIDOS

fcil notar, mesmo com um exame rpido do mundo que nos cerca, que algumas das conseqncias especiais que denominamos reforadoras tm uma primazia mais natural ou biolgica do que outras. Poucos discutiriam que alimento, gua e sexo estar numa categoria diferente mais bsica do que livros, dinheiro e automveis. Mesmo assim, os organismos, uma vez ou outra, trabalham por todos esses. Podemos distinguir essas duas categorias pelo modo em que o organismo chega a possuir uma suscetibilidade ao reforamento. Para cada indivduo, existe uma classe de reforadores cujos poderes so meramente uma conseqncia biolgica da filiao do indivduo a uma certa espcie. Esses reforadores so uma propriedade das espcies tanto quanto as manchas do leopardo, a pele do gato a cauda do cachorro. As suscetibilidades ao reforamento que so c o n stru d as no organismo deste modo definem os reforadores primrios ou incondicionados. Eles sero discutidos em captulos subsequentes sobre Motivao. Para o presente, voltamo-nos para um segundo grupo de reforadores, secundrios , que parecem mais variveis e menos previsveis de indivduo para indivduo, comparados com os do primeiro grupo. Dinheiro, carros, lpis, jornais, prestgio, honra e um sem n&mero de outras coisas arbitrrias que os seres humanos trabalham para obter, constituem uma grande fonte de reforadores fidedignos e potentes. Mas essas coisas no tm valor algum para ns quando nascemos. Claramente, elas devem ter adquirido sua capacidade para reforar em alguma ocasio durante a histria passada de cada indivduo. Uma histria passada individual um pr-requisito; prova disto aquele adulto ocasional para quem alguns dos refor adores convencionais parecem no ter valor algum. Neste sentido, o outro tem pouca importncia para um monge Trapista, um homem primitivo dificilmente lutaria por uma cpia do New York Times e nem todos gostam de Brahms. Dinheiro, material impresso e os trabalhos de um compositor particular no tm o valor universal do alimento, gua e sexo, embora para um dado indivduo sua atrao possa parecer igualmente forte. Como mostraremos em seguida, os reforadores adquiridos obtm seu poder para fortalecer e manter o comportamento em virtude de uma histria passada de associao com reforadores primrios. sua dependncia sobre essa histria condicional para que tenham poder de reforar que lhes d o nome de
reforadores condicionados.

- 227 -

Os reforadores condicionados parecem ser especialmente difundidos na manutenao do comportamento humano. Realmente, eles esto ligados com a prpria noo de cultura humana. Contudo, eles so facilmente cultivados em sujeitos animais no laboratrio, onde as condies exatas para o seu estabelecimento e a medida precisa de suas foras relativas podem ser quantitativamente estudadas. 11.1 AS P R O P R I E D A D E S R E F O R A D O R A S DISCRIMINATIVOS POSITIVOS DOS EST MULOS

Antes do fortalecimento da resposta de presso barra de um rato faminto ou o bicar a chave de um pombo faminto, loma-se, geralmente, cuidado para antecipar cada instante de fornecimento de alimento por um breve clique e um flash de luz que emanam do lugar onde o alimento fornecido. Uma vez que o alimento est disposio somente aps a combinao clique-luz, este procedimento suficiente para tornar o clique-luz um estmulo discriminativo positivo (S^) para a resposta de aproximao ao comedouro. Mas, alm de tornar a situao clique-luz um S ^, um produto colateral inevitvel deste procedimento de discriminao dar ao clique e luz um poder de reforar. Este poder explorado, permitindo-se que a presso barra ou o bicar da chave produzam o S^. Deste modo, podem-se fornecer resposta conseqncias mais imediatas do que seria possvel com o alimento em si. O rato leva algum tempo para mover-se da barra para o comedouro e comer; mas o estmulo clique-luz pode alcan-lo mesmo antes de ter retirado as patas da barra. Este tipo de reforamento imediato, proporcionado pelo reforador secundrio clique-luz, essencial para produzir o fortalecimento rpido do operante (ver Fig. 4-2). O procedimento para demonstrar o poder reforador da combinao clique-luz pode ser representado como uma notao de duas fases: ( 1 ) estabelecer o clique-luz como um SD pelo mtodo usual de discriminao: SA Ri />
2

R, -+ S +

onde SD = SA = S+ = R, =

clique-luz ausncia de clique-luz alimento aproximao ao comedouro

(2) Ento, em S ^ , permitir que uma resposta no fortalecida anteriormente, por exemplo, presso a barra, produza o estmulo discriminativo positivo, S ^, retirando-se, ao mesmo tempo, o reforador primrio final. SA [Sn Ri /"* Rj -f> R 2 ----- >
2

[111]

onde R 2 = presso barra.


-2 2 3 -

Para testar a eficcia do clique-luz como agente reforador independente, o reforador primrio deve estar ausente. Na medida em que o alimento ocorrer no final da seqncia, o fortalecimento de um novo operante (em | 1 1 . 1 | , presso barra) pode ser inteiramente devido ao do reforador primrio; o clique-luz, por si s, pode ser irrelevante. claro que, durante o teste de 111 - 1 1 , a extino da resposta de aproximao ao comedouro proceder concorrentemente comquaisquer efeitos de fortalecimento que c procedimento possa estar exercendo sobre a presso barra. Assim mesmo, o resultado experimental de 111.1| inequvoco. A resposta de presso barra existindo anteriormente numa taxa baixa no nvel operante, rapidamente forlalccida apenas pelo SD clique-luz. A resposta barra condicionada a despeito do fato de nenhum alimento estar sendo apresentado, e*a despeito do fato de a resposta ao comedouro estar, simultaneamente, em processo de extino. Na Fig. 11-1, so vistas curvas cumulativas de quatro ratos neste procedimento. Pela primeira vez na histria de condicionamento dos ratos, cada presso barra produziu uma conseqncia especial - o para aproximao ao alimento., Durante o tempo em que a Fig. 11-1 foi registrada, o alimento nunca apareceu Comprrada* r.nm curvas de fortalecimento com reforamento primrio (por exemplo, alimento), as curvas so mais variveis e mais negativamente aceleradas (ver Fig. 4-2). Da observao do aumento geral na taxa de presso barra visto na Fig. 11-1, todavia, no h dvida de que tornar o contingente a presso barra, serve, temporariamente, para condicionar o operante. As curvas do fortalecimento apenas pelo clique-luz tomam a forma geral das curvas de extino. Isto nada tem de surpreendente porque, simultaneamente com o condicionamento de R2 (presso l\ barra) por SD? Rj (aproximao ao comedouro) est sendo extinta. Logo, o est perdendo, concorrentemente, seu poder para agir como para Rj e, por inferncia, tambm o valor reforador adquirido. Esta perda uma conseqncia inevitvel do teste de reforamento secundrio. 11.2 COMO AUMENTAR A DURABILIDADE DE REFORADORES CONDICIONA DOS

O princpio do reforamento adquirido foi entusiasticamente recebido pelos primeiros behavioristas que viram nele a chave para a explicao das atividades sociais complexas que, no homem , parecem medrar na ausncia de reforamento primrio. O reforamento condicionado parecia uma explicaco pronta para comportamentos sociais tais como o gregarismo ou cooperao e valores sociais tais como a conquista de prestgio, poder ou riqueza. Mas, na investida para contrapolar os conceitos de aboratrio sobre reforamento condicionado para o campo social, raramente se esclareceu que permaneciam ainda por realizar demonstraes experimentais poderosas do reforamento secundrio. As curvas de Skinner (1938) (Fig. 11-1) eram uma demonstrao bastante genuna de que os S^s tornavam-se realmente reforadores secundrios. Mas a produo de comportamentos mantidos pelo S ^ como um reforador condicionado era da ordem de 50 respostas em 45 min uma produo desprezvel e, certamente, uma demonstrao no muito convincente de que os reforadores condicionados do laboratrio poderiam, mesmo remotamente, ser a base dos incentivos sociais da vida humana. Por algum tempo, as tentativas dos pesquisadores, utilizando pistas, labirintos e barras, para produzir reforadores secundrios mais poderosos, que pudessem modelar e manter o comportamento por longos perodos sem os reforadores
- 229 -

Tempo (minutos)
Figura 11-1. Fortalecimento de um operante cie presso barra em quatro ratos famintos, quando o nico reforamento o que anteriormente determinava a ocasio para a aproximao ao comedouro (Skinner, 1938).

primrios, obtiveram pouco sucesso. E s recentemente foram descobertas tcnicas para ampliar a durabilidade de reforadores condicionados a um nvel em que se pudesse atribuir, de forma razovel, ao conceito experimental um papel importante na teoria da atividade humana. A habilidade para demonstrar o reforamento adquirido de uma forma convincente esperou o desenvolvimento dos procedimentos de reforamento intermitente, isto , esquemas de reforamento e as especificaes de operantes de ordem superior. A intermitncia desempenha dois papis crticos na ampliao dos efeitos dos reforadores condicionados. (1) Usada para programar o reforamento primrio (por exemplo, alimento) para um operante discriminativo no treino , ela pode construir uma alta resistncia extino do operante discriminativo (Rj na cadeia de 111 -11 \ 0 mtodo consiste simplesmente em se alternar o conjunto de contingncias. S
e

[SA
|R,
-h

O resultado o de limitar a emisso de R \ a e, alm disso, j que a contingncia 2 probabilstica, desenvolver uma resistncia potencial extino muito forte de R i em S^. (2) Usada ao se testar o valor reforador de S^, a intermitncia imposta entre a nova

- 230 -

R a ser condicionada e o SD contingente conserva o poder do reforador secundrio. O mtodo consiste, simplesmente, em deixar a nova R produzir o probabilisticamente, R2 - -> SD, ou alternativamente, incorporar R em um operante de ordem superior, nR SD Uma intermitncia bem escolhida, aqui, no somente ir conservar o poder de S^, mas manter tambm uma alta taxa de R2 . A conservao do poder de S^, neste procedimento, deriva de sua infreqncia de ocorrncia. no perder seu controle sobre R] at que R[ tenha ocorrido um certo nmero de vezes(jem reforamento) na presena de SD. Se SD aparece infrequentemente, Ri temapenas oportunidades infrequentes para enfraquecer. Numa variante deste mtodo, empregada por D. W. Zimmerman (1957,1959), ratos famintos foram treinados a correr numa pista, obtendo alimento na caixa-objetivo, no final. Uma tentativa na pista iniciava-se quando o rato era colocado na caixa de partida. Uma campainha soava brevemente, a porta da pista se levantava e o rato podia correr at a caixa-objetivo. O tempo de reao (RT) entre o som da campainha e a resposta de entrar na caixa-objetivo foi medido. At aqui este procedimento consiste de
S " D

R , -------> S +
onde SD = som da campainha na raixa de partida e porta aberta R i = correr para a caixa objetivo S+ - alimento Quando o RT havia se tornado assintoticamente pequeno (depois de cerca de 30 tentativas), o alimento era omitido em algumas tentativas. Isto , o operante discriminativo de correr foi colocado num esquema probabilstico de reforamento: S R,

>S '

Nas 60 tentativas seguintes, essa probabilidade foi gradualmente diminuda de 0,5 para cerca de 0,2. Isto , no final de 90 tentativas do treino de correr, somente cerca de 1 corrida em 5 terminava com alimento. Nas outras quatro corridas, o rato encontrava a caixa-objetivo vazia. Mesmo assim, o RT de correr campainha permaneceu curto; a campainha e a abertura da porta continuaram a agir como um S& para uma resposta vigorosa e veloz na pista. A situao neste ponto reminiscente do nosso prprio comportamento ao atender ao telefone. Embora somente poucas das chamadas possam ser realmente dirigidas a ns, o comportamento de atender permanece (como o comportamento de correr dos ratos de Zimmerman) com alta fora. Seguindo essas 90 tentativas do treino de correr, o alimento foi permanentemente removido e instalou-se uma barra na caixa de partida. Uma tentativa iniciava-se com o rato sendo colocado na caixa de partida como de costume, mas agora a campainha e a abertura da porta tornaram-se contingentes unicamente presso barra. Usando o S^ campainha-abertura da porta como o nico reforamento, Zimmerman modelou progressivamente um operante FR de 15 presses barra em trs sesses de 90 min. Durante as 11 sesses seguintes, a resposta FR 15 foi mantida completamente pelo S^
- 231

contingente, enquanto, em cada tentativa, o comportamento de correr subsequente foi lentamente enfraquecido em virtude de sua extino. Este estgio representado como R
2

R.
onde SD= som da campainha na caixa de partida e porta aberta SA = ausncia do som na caixa de partida, porta fechada R \ = correr para a caixa-objetivo t^2~ 15 presses barra

[ 11.2]

Exceto pelas diferenas em elementos especficos, os procedimentos de [11.2J e [11.11 so idnticos. Mesmo assim, antes que o poder de reforador condicionado fosse esgotado, os ratos de Zimmerman tinham emitido milhares de presses barra e continuaram trabalhando por 20 horas espaadas em vrias sesses. Curvas cumulativas da presso barra na caixa de partida nas sesses 1 , 5, 11 e 14 so vistas na Fig. 11-2. A forma dessas curvas indica claramente que o uso do S ^, no procedimento de Zimmerman, atuou de maneira semelhante ao reforamento primrio, gerando e mantendo os efeitos caractersticos de uma especificao FR de resposta. Pausas, seguidas de taxas altas de presso barra, so vistas. A medida que a extino continua, as pausas se tornam mais longas. Mesmo assim, quando o organismo responde, todo o operante FR tipicamente efetuado nipida e suavemente.

Figura 11-2. Presso barra em FR- 15 baseada apenas em reforamento condicionado Os traos oblquos representam a campainha e a porta aberta. O registrador corria apenas enquanto o animal estava na caixa de partida, antes de produzir o SD (Zimmerman, " 959).

Os desempenhos apresentados pelos ratos de Ziinmerman devem ser contrastados com o comportamento dos ratos de Skinner (Fig. 11-1), que emitiram apenas cerca de 50 presses para o S D e, ao fim de 45 min, pararam de responder. A diferena em potncia entre os reforadores condicionados, nos dois casos, pode ser atribuda dupla intermitncia usada por Zimmerman no treino e teste. (1) A conexo probabilstica entre o operante discriminativo (R j) e seu reforamento primrio (alimento) no treinamento de correr efetuado por Zimmerman, aumentou bastante a resistncia extino da resposta de correr ao S ^ (campainha-porta aberta). Assim, o S ^ por si s, permaneceu no controle do comportamento por um perodo de tempo maior que em [ 1 1 . 1 ] e reteve, portanto, seu poder de reforador condicionado por mais tempo. Os resultados de Zimmerman implicam em que Skinner poderia ter obtido mais presses barra se tivesse reforado probabilisticamente a aproximao ao comedouro quando do clique-luz. ( 2 ) Pela incorporao de presses individuais barra num operante de ordem superior constitudo de 15 elementos, o total da produo comportamental, medido pelo nmero de elementos de presso barra emitidos, foi grandemente aumentado (Weissman e Crossman, 1966). Ao mesmo tempo, a infreqncia de ocorrncia do S ^ conservou sua funo discriminativa no controle do correr. . Os resultados de Zimmerman sugerem que, enquanto o reforador condicionado permanece potente, os efeitos de torn-lo contingente a uma resposta parecem indistintos dos efeitos de tornar um reforador primrio contingente resposta. Os resultados de outros experimentos confirmam tal concluso. Kelleher (1961) tornou o clique de um comedouro um S ^ para o comportamento de aproximao ao comedouro, em pombos. Quando apenas o clique foi usado como um reforador para o bicar a chave em esquemas FI e especificaes FR e drl os animais apresentaram padres de resposta tpicos daqueles procedimentos com reforamento primrio. 11.3 RECOMPENSAS TOKEN A operao de um tipo de reforamento condicionado, tipicamente humano, de monstrada em estudos em que fichas de pquer (tokens) foram usadas para reforar primatas (Wolfe, 1936; Cowles, 1937). As fichas tomaram-se S^s para vrias respostas manipulativas, incluindo o ato de inser-las na mquina de vender para receber uvas, laranjas, amendoins e outros reforadores primrios. Foi esta histria de associao com reforamento primrio que transformou as fichas em tokens (dinheiro) com o poder de reforar. Em alguns dos experimentos de Wolfe (1936), chimpanzs foram treinados a inserir uma ficha branca numa mquina e obter, assim, uma uva. A resposta de insero foi modelada atravs de aproximao sucessiva. Um token foi inserido parcialmente na mquina pelo experimentador e qualquer empurro, no nvel operante, dado pelo chim panz, fazia com que o token acabasse de cair, aparecendo como resultado uma uva. O procedimento de modelagem continuou at que os animais pegassem fichas brancas no cho e as inserissem na mquina de vender uva.

Sc SB R2 -----> Ri ----- - S '

- 233 -

onde

Sg= ficha branca na mo. S = ficha branca no cho - uva Rl = inserir ficha na mquina R2 = apanhar a ficha.

Os animais foram, posteriormente, ensinados a puxar uma barra pesada para obter fichas, uma tarefa que aprenderam facilmente. Sq [S-c SB Kl ----- > 1^2 ----- Rj -----> S + onde So = nenhuma ficha presente R 3 = puxar uma barra. Posteriormente, foi estabelecida uma discriminao adicional entre fichas de metal que nada valiam isto , no operavam a mquina de vender, se nela inseridas e fichas brancas. Uma breve histria com este conjunto de contingncias foi suficiente para tomar os animais indiferentes s fichas de metal. Em outros experimentos (Cowles, 1937) com um aparelho anlogo plataforma de saltar de Lashley, na Fig. 10-3, os animais aprenderam discriminaes de padres espe ciais onde o nico reforamento consistia de ^tokens'. Nos experimentos de Cowles, a resposta era simplesmente a de empurrar para o lado o carto contendo o padro correto. As mquinas de vender ficavam em outra sala, onde, depois que a discriminao havia sido aprendida (Io > 1 ,0 ), as fichas acumuladas podiam ser trocadas. Nesses vrios experimentos, os chimpanzs adquiriram novos comportamentos quan do o nico reforamento imediato eram as fichas. As fichas so distintas de qualquer outro reforador secundrio apenas por suas propriedades fsicas, que as tornam manipu lveis, estocveis, etc. Naturalmente, um token no apenas o S^ para uma resposta de insero; ele tambm fornece os verdadeiros meios fsicos atravs dos quais tal resposta manipulativa pode ser emitida. Uma ficha implica tanto em reforamento para inserir como torna possvel a insero. Contudo, os tokens, tal como campainhas e cliques, tornam-se S^s simplesmente porque uma certa resposta reforada em sua presena. 11.4 REFORADORES GENERALIZADOS Muitos estmulos discriminativos positivos estabelecem a ocasio para mais de um nico tipo de resposta ser emitido e reforado. Alguns S^s, de fato, controlam numero sas respostas, cada uma das quais pode levar a um reforador primrio diferente. Fora do laboratrio, tais situaes so encontradas frequentemente. O dinheiro um exemplo excelente. Tendo dinheiro, muitas respostas podem ser emitidas, cada uma levando a seu reforador prprio e distinto. S(dinheiro) ^(comprar bilhetes de teatro)
St +

R(comprar um casaco novo) R(pedir uma refeio)

S2+ S3+

[11.3]

- 234

Ateno , algumas vezes, usado como um nome para um tipo semelhante de S^. De modo a obter reforamento para vrias respostas verbais, <juase sempre necessrio que uma pessoa obtenha a ateno de uma outra. Quando o Su ateno conseguido, muitas respostas (pedidos, ordens, etc.) podem, ento, ser emitidas com a chance de serem reforadas. Na ausncia de ateno , poderamos dizer que tais pedidos no so ouvidos ou notados, o que equivalente a dizer que eles esto sendo submetidos extino. Estmulos disc rim in ativos que podem estabelecer a ocasio para mais de uma seqn cia resposta-reforamento esto baseados numa histria de associao com mais de um reforador primrio. No diagrama [ 11.3| por exemplo, o dinheiro foi previamente asso ciado, atravs de treinamento - SA+, a entretenimento,calor, alimento, etc. Estmu los discriminativos associados desta maneira a mais de um reforador primrio e cuja disponibilidade se torna, ento, contingente a um novo comportamento, so chamados reforadores generalizados. Embora eles paream ter um importante papel na mediao do comportamento humano complexo, tais reforadores generalizados no tm sido estudados extensivamente no laboratrio.
EXERCCIO 8

Descreva um mtodo para criar um reforador generalizado para chimpanzs. Use, como reforadores primrios, alimento, gua, remoo da situao experimental. Empre gue um operante discriminativo diferente para cada reforador primrio. Use tokens como SD generalizado. Uma vez que o animal possua o " token , o que determinar o operante discrim inativo que ele emitir? 11.5 RESPOSTAS DE OBSERVAO Diz-se, s vezes que os estmulos discriminativos tm a propriedade de conduzir informao a respeito do estado das contingncias ambientais efetivas numa dada ocasio. Assim, quando o pressionar a barra por um rato reforado somente na presena de uma luz, pode-se dizer que a luz fornece informao de que uma certa contingncia de reforamento esta em efeito. Similarmente,quando a sirene para de tocar conduz informa o de que os avies de bombardeio inimigos se retiram e seguro sair. Reforadores tokens tambm conduzem informaes mas aqui a funo informativa est obscurecida pelas propriedades fsicas d o s tokens que lorn am possvel a resposta real. Quando a fechadura automtica da porta de um apartamento soa depois que voc toca a campai nha, voc informado de que pode abrir a porta e de que, quando o fizer, encontrar algum em casa. Um tipo diferente de informao fornecido por sinais indicativos de no fun ciona e saiu para o almoo , luz vermelha do trfego e sinais de ocupado. Estes so anncios de que certos comportamentos no sero reforados; como tal eles constituem S^s para esses comportamentos. Pode a informao sobre reforamento fornecida pelos S^s e SA s desses exemplos ser encarada como reforadora em si mesma? Pode-se fornecer uma resposta melhor fazendo-se referncias a experimentos. No procedimento de discriminao de Herrick, Myers e Korotkin (1959) da seo 10.1 os ratos aprenderam a discriminar entre perodos de luz e escuro alternados aleato riamente. As contingncias eram reforamento em VI durante S^ (luz) e extino duran
- 235-

te S A (escuro). Imagine que, em vez de se fornecer automaticamente, uma luz brilhante como SD e o escuro como SA 9 outro grupo de animais fosse treinado numa condio intermediria de iluminao fraca, que no mudasse quando cada perodo de V I se iniciava e terminava, nem quando cada perodo de extino se iniciava e terminava. Em linguagem vernacular, diramos que esses animais no teriam meios de dizer se estariam em VI ou em extino. Se o perodo de extino no fr muito prolongado, ratos treinados nessas condies ajustar-se-o, produzindo uma taxa constante de respostas tanto em VI como em extino. Suponha que, depois de tal estabilizao, uma nova contingncia seja introduzida pela primeira vez. Se agora o rato puxasse um cordo localizado em seu compartimento, a luz fraca seria imediatamente substituda pelo escuro (SA ) ou pela luz clara (S^), dependendo da contingncia que estivesse em efeito naquele momento. O que fizemos foi dar ao organismo a opo de produzir estmulos discriminativos. O resultado comportamental de tal opo claro. A contingncia age rapidamente para condicionar a respos ta de puxar a corda (Wyckoff, 1952). Quando uma resposta permite a um organismo observar uma situao correlacionada com o estado de suas contingncias de reforamento, referimo-nos a ela com uma res posta de observao. Ao observar meramente um aspecto do seu ambiente correlacionado com certas contingncias de reforamento, o animal no modifica qualquer delas, mas tem agora a oportunidade de evitar respostas no reforadas. As respostas de observao esto entre as mais comuns das nossas atividades dirias. Para discriminar uma nota genuna de uma falsa, certas respostas de observao muito detalhadas so necessrias. Uma grande parte do treinamento de peritos em notas falsas e impresses digitais envolve o fortalecimento de respostas de observao que usualmente permanecem incondicionadas no leigo. O perito deve aprender quais aspectosde uma situao deve estudar de modo a poder distinguir entre estmulos diferentes que possam estar presentes do seu ambiente puxando um cordo que produz S ^ o u S A s o perito em notas falsas pode checar a impresso significante numa nota bancria que a identificar como genuna ou falsa. Em ambos os casos, a resposta de observao, puxar o cordo ou examinar a impresso, permite ao organismo fazer uma discriminao que aumenta a probabilidade de ele ser reforado. A habilidade do perito em fazer discriminaes, seja entrevinhos, impresses digitais ou pinturas, frequentemente vista com algum espanto pelo novato. Para este ltimo, dois casos seguramente discriminados pelo perito parecem, soam ou tm sabor de seme lhante. O comportamento de observao no iniciante no foi fortalecido, no lhe permi tindo saber onde procurar as diferenas . Ao fortalecer o comportamento de observa o em humanos, p o d e m o s muitas vezes apontar , com xito, as diferenas nas situa es. Ao apontar os aspectos da situao de que dependem as diferenas entre e SA . aproveitamo-nos de uma histria passada em que o reforamento foi previamente contin gente ao olhar na direo em que o dedo aponta. Contingncias anlogas modelam respostas de escutar, bem como o comportamento de observao em outras modalidades sensoriais. Em geral, uma caracterstica importante de uma resposta de observao que ela aumenta a probabilidade de reforamento para o comportamento. Isto certamente c verdadeiro para o rato que tem a opo de produzir seus S^s e s. Se a discriminao do animal boa, apresentaes de S^ e SA iro, pelo menos, permitir que a resposta seja limitada a SD. Isto tem o efeito de aumentar a probabilidade geral de reforamento para a resposta, bem acima do que aconteceria se S^

e S^- distintos no estivessem disponveis. No basebol, o batedor que observa um movi mento rnnimo mas caracterstico do lanador prestes a lanar uma bola que descrever uma trajetria ci^va tem uma chance meihor de rebat-la do que teria sem tal S^. Frequentemente, os S^s e s produzidos pelo comportamento de observao so cruciais para a ocorrncia de qualquer reforamento. Tente enfiar uma linha na agulha com os olhos vendados, ou responder a uma questo de prova sem t-la lido antes. Em ambos os exemplos, a probabidade de reforamento to pequena que pode ser efetiva mente zero na ausncia de um comportamento de observao apropriado. O comportamento de observao frequentemente encoberto, tal como quando um homem se senta silenciosamente na presena de um rdio. Ele est ouvindo ou no? Isto , ele est observando ou no? Em geral, a resposta a esta questo pode ser obtida apenas pelo estabelecimento de contingncias de reforamento onde a probabilidade de que o indivduo emita certas palavras seria insignificantemente pequena na ausncia de um comportamento de observao anterior. Se perguntarmos o que foi dito no rdio, a resposta de repetir o que foi dito de fato tida como evidncia prima facie de que o comportamento de observao deve ter ocorrido. EXERCCIO 9 Faa a anotao das contingncias que predominam quando um organismo tem a opo de produzir e S ^ , como est descrito no incio desta seo. Para tmar o exerccio mais simples, suponha que um esquema de probabilidade uniforme seja alter nado com extino. 11.6 AS CONDIES NECESSRIAS E SUFICIENTES PARA SE CRIAR REFORADORES CONDICIONADOS

O contedo das sees 11.1 11.5 implica em que uma condio suficiente para tornar um estmulo um reforador condicionado faz-lo um S^ atravs do procedimen to de discriminao. Existe pouca evidncia de que tornar um estmulo um SD seja uma condio necessria e suficiente para torn-lo um reforador condicionado. (Myers, 1959; Kelleher e Gollub, 1962). Em vrias ocasies, observamos, que, medida que um estmulo perde sua funo de SD? ele perde tambm sua potncia como reforador con dicionado. Dinsmoor (1950) mostrou que a resistncia extino de um operante dis criminative) era a mesma se o operante fosse extinto na presena de seu SD, ou extinto com o SDcontingente a ele. Outro experimento (Notterman, 1951) mostrou que, quan to menor o treino discriminativo que o sujeito receba, menor o valor reforador que o SD adquiria.' Essas observaes sugerem que as funes discriminativas e reforadoras de um SD so estreitamente ligadas, se no diretamente paralelas. Schoenfeld, Antonitis e Bersh (1950) mostraram que a simples associao de um evento ambiental como um reforador primrio, por si s, insuficiente para tomar o evento um reforador condicionado. Ratos foram treinados a se aproximarem de seus comedouros recebendo uma pelota de alimento. Aps o rato ter pegado a pelota e j estar comendo-a, urna luz breve (1 seg) era apresentada. Cem associaes luz-comida no conferiu qualquer valor reforador potencial luz porque, em testes subsequentes, o animal no pressionava a barra para produzir apenas a luz. Indcios sobre as associaes necessrias e suficientes para produzir reforadores

237

Convencional

S I inefetivo

S,

__ D ____ 0-

st
R-*-S+

n n n nn n 1 1 1 .... i i i
I n te rm ite n te Sd re d u n d a n te

s, s,
R-*-S* I

__D ____ Q .
1

n n
1

n n

n . n

1 ... 1. .

Figura 11-3. Aguns arranjos de emparelhamentos possveis de estmulos neutros com reforamento.

adquiridos foram fornecidos por Egger e Miller (1962, 1963). A representao esquemtica, na Fig. 11-3, de trs eventos ambientais, S \, S2 e S+, ser conveniente para compreender seus resultados. Suponha que o S+ possua o poder de reforar o comportamento, enquanto S] e S2 no tm originalmente esse poder. Suponha tambm que a emiso de uma dada R seja necessria para produzir S+. Algumas das associaes na Fig. 11-3 correspondem de perto a algumas das relaes temporais do condicionamento Pavloviano, descritos na Fig. 3-5. Logo, esperar-se-ia que elas resultassem no condicionamento clssico de alguns respondentes, ao lado de qualquer valor reforador adquirido que elas emprestassem a S \ ou S2 . O caso da parte superior esquerda da Fig. 11-3 representa o paradigma convencional para cria r reforadores condicionados. Cada apresentao de S 1 , se sucedida imediatamente de R, seguida de S+. Quando Si no est presente, as respostas no so reforadas. Este o caso do exemplo do clique-luz da seo 11-1 e dos tokens e, em geral, neste caso Si submetido a uma histria de discriminao com relao a R. No caso da parte inferior esquerda, S+ vem depois de alguns S^s, mas no de todos. Para que as respostas sejam reforadoras, todavia, elas devem ocorrer depois de S \. Este o caso intermitente de Zimmerman e tambm estabelece S \ tanto como um S^ quanto como um reforador condicionado. Em cima, direita, uma contingncia de reforamento pode ocorrer depois de S j, mas tambm em certas outras ocasies. Se S+ ocorre com a freqncia de 50 por cento ou mais das vezes sem S j, este caso po confere poder reforador a Si (Melching, 1954). Sj no se torna um SD presumivelmente porque algumas respostas so reforadas na sua ausncia - uma violao do paradigma de discriminao. Note, todavia, que S2 toma-se um reforador condicionado porque contm a mesma relao a R>S+ que Si no caso convencional da parte superior esquerda.

- 238-

No caso inferior, direita, os dois eventos neutros so apresentados quase ao mesmo tempo (separados de poucos segundos), depois do que uma resposta pode produzir reforamento primrio;este caso conferir valor reforador condicionado a S j,m as no a S2 (Eggere Miller, 1962, 1963). Parece que S2 redundante, no fornecendo qualquer informao nova sobre a ocorrncia da contingncia de reforamento. Este resultado explicaria o insucesso de Schoenfeld, Antonitis e Bersh em tomar a luz um reforador condicionado. Em seu experimento, a luz era S2 ,j tendo sido precedida de S], a viso da pelota ou a pelota na boca, etc. Uma anlise geral dos quatro casos da Fig. 11-3 indica dois fatos relevantes. (1) Existem vrios paradigmas para estabelecimento de S^s e todos os S^s assim estabele cidos tambm adquirem o poder de reforador condicionado. (2) Somente quando um estmul informativo (isto , correlacionado no redundantemente com uma contin gncia de reforamento) que ele se torna um S ^ ou um reforador condicionado. Os argumentos discutidos nesta seo devem ser tomados provisoriamente, porque sua gene ralidade depende da confirmao de paradigmas temporais, respostas e reforadores pri mrios adicionais. 11.7 O REFORAMENTO SECUNDRIO NO COMPORTAMENTO SOCIAL Um estmulo que controla o comportamento com um SD ou reforador condicio nado no precisa originar-sc apenas do ambiente inanimado. Outros organismos (ou, os estmulos que se originam deles) podem agir desse modo tambm, e a est um fato de grande significncia para o homem, bem como para outra vida biolgica. O comporta mento social pode ser descrito como o comportamento para o qual os estmulos refora dores ou discrimnativos, so, ou foram, mediados pelo comportamento de outro organis mo. Por mediado queremos dizer que surge de, ou em conexo com e no h qualquer inteno de forar a conotao da palavra. No poderamos nem (1) incluir como social a liberao de uma pelota pelo experimentador, ao rato que pressiona a barra pode ser uma situao social para o experimentador, mas no para o rato. nem ( 2 ) excluir como no-social o comportamento do nufrago que fala para si mesmo ou faz roupas de peles, j que ambas as atividades foram adquiridas socialmente. A partir do nascimento, os estmulos sociais atuam em grande parte da vida dos seres humanos. Muitos cientistas, realmente, pensaram que a prpria sociedade tem sua origem na dependncia extrema e prolongada da criana. Seja como for, os pais, especial mente a me, esto entre os primeiros reforadores secundrios do tipo social que aparecem no crculo visual da criana. Sua potncia disc rim in ativa e reforadora rapida mente estabelecida pela associao contnua com alimento, calor, alvio da dor, etc. Se, todavia, a criana criada por uma enfermeira, ento ela se torna o reforador secundrio sempre presente e comumente se v que a ligao com a Enfermeira substitui a com a me. Os psiquiatras salientam que, na adolescncia e antes, os primeiros objetos sexual mente interessantes podem ser os pais, irmos ou irms. Dentro do ambiente social relativamente restrito da criana, os poucos organismos que servem como estmulos acompanhadores, quando o reforamento liberado ou retirado, podem adquirir um controle amplo e vitalcio sobre seu comportamento. Com o aumento da idade, a criana amplia suas excurses alm do lar, aumentando a faixa de reforadores secundrios que controlam suas reaes. Escola, amigos, clubes e atividades relacionadas de todos os tipos levam-na aos estmulos que so os sinais e acompanhamentos, sempre presentes, do

- 139 -

reforamento final, os S^s e os[reforadores condicionados]que so a trama e urdidura de sua vida na sociedade (Keller e Schoenfeld, 1950, pp. 257-258). Um rato ensinado a imitar outro rato est demonstrando uma habilidade, social rudimentar e mostrando a ao de um reforador social. Miller e Dollard (1941) treina ram ratos famintos a atravessar uma pista elevada em T, vista na Fig. 11-4. Alguns ratos

Figura 11-4. Uma pista elevada, em T, para estudai a imitao no rato (segundo Miller e Dollard, 1941).

foram treinados a correr para um carto branco ou preto. A posio dos cartes era distribuda aleatoriamente em tentativas sucessivas. Outros ratos foram treinados simples mente a correr consistentemente para a direita ou para a esquerda. Quando o rato executava uma corrida correta, ele encontrava alimento num recipiente colocado na base do carto. Esses ratos eram chamados de lderes eram treinados at que corressem 20 vezes consecutivas corretamente. Um segundo grupo de ratos foi treinado para seguir os lderes. Em qualquer tentativa em que seguiam os ratos lderes, os seguidores encontravam alimento descoberto num pequeno recipiente no meio do caminho da pista. Em qualquer tentativa em que no

- 240 -

seguiam os lderes, eles eram retirados da pista por um pequeno perodo e mais tarde fazia-se nova tentativa. As contingncias foram efetivas na produo de seguidores. Notou-se que os ratos imitavam os lderes quando estes viravam na presena ou ausncia de cartes brancos ou pretos, que imitavam os lderes que haviam sido treinados a ir para a direita ou para a esquerda e que imitavam indiscriminadamente ratos brancos e cinzentos. A relao social entre um aluno e um professor , provavelmente, vrias ordens de magnitude mais complexa do que qualquer habilidade social isolada como a imitao, mas os rudimentos de tal relao prestam-se anlise experimental. Do ponto de vista do reforamento social, podemos considerar que o comportamento do professor reforado pelas mudanas no comportamento do aluno. O aluno deve ser quase sempre reforado diretamente, ou pela promessa de alcanar certas habilidades teis ou por ameaa de punio. As contingncias envolvidas na situao educacional comum so complexas e raramente formalizadas de um modo consistente. Mas a idia fundamental - um organis mo fortalecendo ou participando do comportamento de outro organismo pode ser demonstrada com pombos, de uma maneira que expe o processo crtico envolvido. Na Fig. 11-5, dois pombos esto separados um do outro por um plstico transpa rente. Antes da demonstrao, ambos foram treinados a comer nos seus respectivos alimentadores. Alm disso, o professor foi treinado a bicar o disco plstico em refora mento internitente com alimento. A demonstrao comea com os animais colocados juntos pehi primeira vez. Cada vez que o professor bica o disco, liberado alimento para o aluno . O professor reforado por bicar somente quando o aluno est de p, em frente ao canto esquerdo. Consoante com sua histria, o professor comea a bicar rpida e indiscriminadamente com relao posio do aluno. Portanto, no incio, poucas bicadas do professor so reforadas. Gradualmente, todavia, medida que a demons trao prossegue, mais e mais vezes que o professor bica o disco, ambos os animais so alimentados. O comportamento de ambos vai sofrendo modificao pela interao social. Logo, um desempenho quase cmico evolui. O professor fica olhando para o aluno como se esperando que ele se mova at o canto esquerdo. Enquanto isso, o aluno imita suas atividades a uma ida repetitiva do alimentador para o canto esquerdo. To logo o aluno esteja parado de forma adequada. O professor bica, ambos coiYiem, e o padro repetido. Pode-se dizer que o professor manifesta um tipo de discriminao social primitiva. Seu comportamento reforado somente quando o aluno est desempenhando um certo ato ficar de p no canto esquerdo. este ato por parte do aluno que fornece o S ^ para o professor bicar o disco. Como tal esta situao precisa tambm funcionar como um leforador condicionado para o professor. Se o professor procura obter alimento, ele deve encontrar um modo de tomar essa situao possvel, pois, inicialmente, o aluno raramente ir ficar no lugar favorvel. Uma interao social sutil est presente: qualquer bicada que o professor d quando o aluno est em outro lugar resulta em alimento apenas para o aluno. 0 b ;car indiscriminado, ento, provavelmente fortalecer comportamentos do aluno outros que no o ir para o canto esquerdo. Esperar que o aluno v para o canto esquerdo fica sendo o nico comportamento que o professor tem disponvel para dirigir as respostas do seu aluno. O pombo professor rpido em descobrir o valor da pacincia.
241 -

(Herrnstein, 1964).

As demonstraes simples desta seo ilustram a continuidade existente entre o comportamento social e no-social. Nenhum princpio novo necessrio para explicar os resultados das contingncias de imitao, ou os resultados da interao dos pombos professor-aluno. O comportamento imitativo de correr dos ratos seguidores indistin guvel pela topografia, preciso ou complexidade, de qualquer outro operante de correr sob controle discriminativo. Do mesmo modo, os comportamentos adquiridos pelos nombos professor e aluno so apenas os operantes familiares que tratamos em detalhes no texto. As sutilezas do comportamento socialencontram-se,em grande partenascontingncias controladoras que surgem de uma fonte complexa de estimulao proporcionada por um outro organismo. REFERNCIAS PARA O CAPTULO 11
Cowles, J. T. Food- t okcns as incentives for learning by chimpanzees.

Comp. psychol. Motiogr., 1937, 14, 1-96.


Thnsmoor, J. A. A quantitative comparison of the discriminative and reinforcing functions of a stimulus. J. exp. Psychol., 1950, 40, 458-472." Egger, M. D., and Miller, N. E. Secondary reinforcement in rats as a function of information value and reliability of the stimulus. J. exp.

P s y ch ol 1 9 6 2 ,6 4 ,9 7 -1 0 4 .
Egcr, M. D , and Miller, N. E. When is a reward reinforcing? An experi mental studv of the information hypothesis. J. comp, physiol.

Psychol. , 1963, 56, 132-137.


- 242 -

Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in Sl) and rates during the development of an operant discrimination. J. com;), physiol. Psychol., 1959, 52, 359-363. Ilerrnstein, R. J. Will. Proc. Amer. Phil. Soc., 1964, 108, 455-458. Kclleher, R. Schedules of conditioned reinforcement during experimental extinction. /. exp. Anal. Behav., 1961,4, 1-5. Kelleher, R., and Gollub, L. A review of positive conditioned reinforce ment. J. exp. Anal. Behav., 1962, 5, 543-597. Keller, I7. S., and Schoenfeld, W. N. Principles of psychology, New York: Applcton-Century-Crofts, 1950. Melching, W. H. The acquired reward value of an intermittently pre sented neutral stimulus. J. comp, physiol. Psychol., 1954, 47, 3 7 0 374. Miller, N. E., and Dollard, J. Social learning and imitation. New Haven: Yale Univer. Press, 1941. Myers, J. L. Secondary reinforcement: a review of recent experim enta tion. Psychol. Dull., 1958, 55, 284-301. Notterm an, J. M. A study of some relations among aperiodic reinforce ment, discrimination training, and secondary reinforcement. J . exp. Psychol., 1951,41, 161-169. Schoenfeld, W. N., Antonitis, J. J., and Bersh, P. J. A preliminary study of training conditions necessary for secondary reinforcement. J. exp. Ps y ch ol 1 9 5 0 ,4 0 ,4 0 -4 5 . Skinner, B. F. The behavior of organisms. New York: Appletn-Century, 1938. Skinner, B. F. A case history in scientific method. Amer. Psychologist, 1 9 5 6 ,1 1 ,2 2 1 -2 3 3 . Weissman, N. W., and Crossman, E. K. A comparison of two types of extinction following fixed-ratio training. J. exp. Anal. Behav., 1966, 9 ,4 1 -4 6 . Wolfe, J. B. Effectiveness of token-rewards for chimpanzees. Comp. psychol. Monogr., 1936, 1 2 , 1-72. WyckofT, L. B., Jr. The role of observing responses in discrimination learning: Part I. Psychol. Rev., 1952, 59, 431-442. Zimmerman, D. W. Durable secondary reinforcement: method and theory. Psychol. Rev., 1957, 64, 373-383. Zimmerman, D. W. Sustained performance in rats based on secondary reinforcement. J. comp. physiol. Psychol., 1959, 5 2 , 353-358.

- 243 -

Captulo 12

ENCADEAMENTO

Na seo 11.1 vimos como, atravs do uso de recompensas tokens atuando como reforadores adquiridos, seqncias ou cadeias simples de comportamento podiam ser criadas. A mais simples dessas cadeias foi construda a partir de (1) uma resposta nova, no fortalecida previamente; (2) um previamente estabelecido; e (3) o operante controlado por este SP. Em geral, cadeias de qualquer tamanho desejado podem ser formadas pela incluso indefinida de um nmero sempre maior de elementos. 12.1 OS ELEMENTOS DE CADEIAS COMPORTAMENTAIS Uma cadeia de comportamento operante suscintamente descrita como uma seqncia de respostas operantes e estmulos discriminativos tal que cada R produz o SD para a prxima R. As Rs suscessivas numa cadeia so os seus membros; os S ^s sucessivos so os elos. Nas cadeias mais simples, o nmero de membros e o nmero de elos so idnticos. O elo de comportamento que envolve o pressionar a barra e o aproximar-se do comedouro, nosso prottipo de fortalecimento operante, constitui uma cadeia repetitiva simples desse tipo. O comportamento do rato estabelecido pelo procedimento

onde S3 = alimento ausente S2 = clique-luz S+ = alimento R3 = presso barra R 2 = aproximar-se do comedouro R | = comer

- 245-

O elo de [ 1 2 . 1 | um caso especial de uma cadeia comportamental, aquele em que a cadeia repetida indefinidamente. Um e b pode ser considerado uma cadeia que est fechada por permitir que a ltima resposta produza o SD para a primeira . Por exemplo, no elo de [ 1 2 . 1 ] comer a ltima resposta e produz o S ^ 5 ausncia de alimento, para a primeira resposta, pressionar a barra. O elo de [ 1 2 . 1 ) representado como sendo composto de trs membros da resposta. Por isto, convencionalmente descrito como uma cadeia de trs membros. Mas o nmero real de membros usados para representar uma cadeia comportamental arbitrrio, sendo ditado principalmente pela convenincia descritiva. Ao discutir o comportamento obser vado e reforado, trs membros servem adequadamente para ilustrar a natureza enca deada do ato. Ao mesmo tempo, trs membros no so muitos para nos assustarem com uma quantidade de detalhes. Ainda, para outros objetivos, podemos desejar representar o ato como se formado por mais membros. Por exemplo, para esclarecer tambe'm a topo grafia, do ato, poderamos duplicar o nmero de membros considerados e expandir r 1 2 . 1 ] para

[ 12.2]

onde S = alimento ausente S 5 barra S4 ~ clique-luz, barra pressionada S3 = clique-luz, barra solta S2 - no comedouro S+ = alimento nas patas R = levantar-se altura da barra R 5 = pressionar a barra r 4- soltar a barra K3 ~ introduzir-se no comedouro R 2 = apanhar o alimento Rj = colocar na boca.

0 diagrama [ 12.2 j representa o mesmo comportamento e o mesmo conjunto de contingncias que [ 12.11, mas 0 poder de ampliao foi dobrado em [12.2 | Levando-se em conta ainda detalhes topogrficos mais sutis e mudanas de estmulo mnimas, a resoluo poderia ser facilmente mais ampliada. Em geral, a composio de uma cadeia de comportamento pode ser representada como um nmero indefinido de operantes. O nmero no infinito porque, na subdiviso conceituai sucessiva, ser inevitavelmente alcanado um ponto onde a especificao de duas classes topogrficas adjacentes ser to sem elhante que no se poder observar que as duas classes funcionam independentemente uma da outra. Isto , seus membros se sobreporo completamente
- 246 -

nau ser possvel colocar o animal sob quaisquer condies para diferenci-los. Neste ponto, teremos alcanado um limite lgico para a resoluo da resposta. Na maior, parte, o comportamento subdivido a um nvel em que serve melhor para objetivos ilustrativos de procedimentos. A presso barra e a aproximao ao come douro so facilmente observadas, medidas e reforadas sem qualquer instrumentao especial. Em ltima an lise, estas so as consideraes que justificam seu status como unidades conceitualmente discretas. Uma cadeia tanto pode ser reduzida quanto ampliada. Em princpio, poderamos tambm escrever[ 1 2 . l|como
^ (presso barra, ir para comedouro) S (alimento ausente) ------ S + [1 2 3]

Os critrios para definir uma classe de resposta so que a classe seja especificvel como em 112.3] e que possa ser fortalecida ou mantida, como uma classe, pelo reforamento. A questo de se a R especificada em[ 12.3) reforvel uma questo experimental. Sua soluo depender de muitos fatores, tais como o peso e altura da barra, sua distncia espacial at o comedouro, a nitidez de quaisquer deixas intermedirias usadas para sinalizar a liberao de alimento, as diferenas individuais entre os ratos, e assim por dainte. Naturalmente, se esta R j foi sucessivamente aproximada e fortalecida, 112.3] uma maneira perfeitamente plausvel de abreviar as contingncias que iro subsequente mente, manter este comportamento. Infelizmente, todavia, o diagrama [ 12.3] representa as contingncias de reforamento frequentemente usadas quando o experimentador tem pouco tempo para se dedicar a uma modelagem real da resposta. O procedimeto de 1 1 2 .3 ] resulta do colocar o rato na caixa e esperar que o condicionamento ocorra a seu prprio modo . A criana que vai escola de quem se espera que aprenda meramente vendo e ouvindo, ou o universitrio que recebe um livro e a ordem para aprender o captulo 12, so todos vtimas freqentes de contingncias como em [ 12.31 . O resultado o mesmo tanto para ratos como para humanos alguns indivduos adquirem o comportamento desejado, outros no. Podemos praticamente dizer, com referncia a [12.3) quando comparado com um arranjo mais deliberado de contingncias, que o organismo aprende apesar da conexo no consistente entre os comportamentos reque ridos e o reforamento fornecido. 12.2 O DESENVOLVIMENTO DE UMA CADEIA COMPLEXA Os princpios com port am ent ais significantes usados no estabelecimento de cadeias so ( 1 ) aproximao sucessiva de cada membro, ( 2 ) colocar cada membro sob controle discriminativo, e (3) uso de estmulos com o duplo papel de deixa discriminai iva e reforador condicionado, para ligar cada membro ao prximo. Vrias proliferaes desses princpios podem produzir cadeias de complexidade e tamanho surpreendentes, mesmo no rato. O comportamento que pode ser adquirido, frequentemente surpreende o leigo, embora os princpios sejam simplesmente aqueles que operam na aquisio do pressionai a barra ou bicar o disco. Em geral, uma complexidade grande no comportamento no resulta de qualquer complexidade na topografia da resposta, nem mesmo das discrimi naes requeridas, mas das maneiras complexas em que as vrias contingncias podem ser permutadas.
- 247 -

Considere como um rato faminto pode ser treinado a pegar uma bola de gude na mo do experimentador, deposit-la num buraco localizado a alguma distncia, depois puxar um trapzio em miniatura dependurado em sua caixa e, finalmente, pressionar uma barra (ver Fig. 12-1). til delinear cinco classes de respostas, R5 R4 R3 R2 Rl = = = = = pegar a bola de gude carregar a bola de gude e segur-la acima do buraco. deixar cair a bola puxar o trapzio pressionara barra,

e notar que podemos desejar as Rs encadeadas na ordem R5 , R4 , R 3 , R 2 , Rl- As situaes de estmulo necessrias so mais convenientemente apresentadas no texto. As seguintes sugestes sero teis. 1. 2. 3. Fortalecer primeiro os membros que ocorrem mais prximos do reforamento primrio; isto , construir a cadeira de trs para frente. Colocar cada operante sob controle de estmulo; isto , tornar cada operante um operante disc rim in ativo antes de adicionar outro membro cadeia. Permitir que o para o operante que foi fortalecido aja como o reforador da prxima resposta a ser adicionada. Deste modo, adicionar membros cadcia um; de cada vez.

De acordo com a sugesto 1, R \ deve ser condicionada pelos mtodos usuais de fortalecimento operante (ver seo 4.2). Ento, aplicando o princpio 2 , deve-se converter Rj num operante discriminaiivo, reforando-a na presena de uma situao (SD) e no na presena de uma segunda situao (S A ). Ser til, como veremos em seguida, escolher para S ^ uma situao que tenha pelo menos duas dimenses de estmulo convenientemente manipulveis. Uma pequena luz em combi nao com uma campainha suave satisfar. Deixe a cigarra continuamente ligada e faa com que a ausncia de luz sirva comoS A para R \. Quando a discriminao atingir um ponto onde a luz controla a presso barra disc rim in adam ente, as sugestes 3 e 1 podem ser usadas para fazer com que o puxar o trapzio (R 2 ) produza a luz. O resultado deste procedimento ser, naturalmente, o fortalecimento de R 2 - At o momento, a campainha soou continuamente, no importando o estado de iluminao. Mas, depois que R 2 for fortalecida, a campainha pode ser ligada e desligada, permitindo-se que R 2 seja efetiva na produo da luz somente quando a campainha estiver presente. Deste modo, o puxar o trapzio, R 2 , logo ficar sob o controle disc rim inativo da campainha, embora permanea sob o controle reforador da luz. A adio do restante dos membros resposta(R 3 , R4 , R 5 ) feita de forma similar, embora uma certa quantidade de aproximao sucessiva seja necessria. Comece com a bola de gude colocada perto do buraco, sendo as condies de estmulo campainha e luz desligadas. As respostas progressivamente mais prximas da bola de gude so reforadas imediatamente pela produo do som da campainha e a continuao subsequente da cadeia. Por aproximao sucessiva, as respostas de tocar a bola de gude, suspend-la e deix-la cair so estabelecidas, sendo todas reforadas pelo som da campainha. O passo final a adio de R 5 . Isto feito, levando-se a bola de gude, gradualmente, para mais
- 248-

Figura 12-1. Um rato executando uma cadeia de comportamento (segundo Michael, 1963).

longe do buraco e exigindo respostas de carreg-la com durao cada vez maior. Eventual mente, a cadeia estar completa. A bola de gude est na mo do experimentador; o rato, quando colocado na gaiola, vai at o experimentador, pega a bola de gude, carrega-a at o buraco e deixa-a cair. A campainha soa e, ento, o rato puxa o trapzio. Acende-se a luz, o raio pressiona a barra, e o alimento liberado. As contingncias.so:
- 249 -

S5

R.,
5

S4 r4
4

S3
r,
3

s2
r2
2

S| Ri

-> S H

Onde S5 - bola de gude na mo de experimentador, campainha e luz desligadas S4 = bola de gude nas patas do rato, campainha e luz desligadas S3 = bola de gude sobre o buraco, campainha e luz desligadas S2 = nenhuma bola de gude, campainha ligada, luz desligada Si = nenhuma bola de gude, campainha ligada, luz ligada S+ = alim ento . Depois do treino, a cadeia completa ser executada suavemente sem os solavan:os que sugerem as unidades individuais que foram usadas no seu desenvolvimento. Dontudo, sem o fracionamento original do comportameento e nessas unidades menores, a seqncia completa nunca poderia ter sido desenvolvida. Analisando as cadeias vocais humanas que constituem a linguagem falada, h uma tendncia de se negligenciar a longa histria passada que torna possvel o desenrolar de longas sentenas, compostas do que, h muito tempo atrs, eram unidades em si mesmas: fonemas, slabas, palavras e frases. A continuidade (fluncia) aparente de um episdio de fala no nos deve distrair do fato de que a fala um produto de uma histria passada de encadeamento, m princpio, no diferente desta do rato educado que acabamos de descrever. Para amarrar o sapato, a criana se empenha numa cadeia, diferente apenas em detalhes daquela do rato. Cada operante individual, na cadeia de amarrar, serve para avanar o cordo para uma posio onde uma resposta ligeiramente diferente pode ser emitida e reforada. O reforameno final um n seguro. No treinamento de uma criana para amarrar um sapato, operam os mesmos princpios que no treino de um rato para executar uma cadeia. O melhor seria iniciar a cadeia pelo fim, com o sapato todo amarrado menos o ltimo aperto do lao. Quando esta resposta estiver fortalecida, o lao desamarrado ligeiramente e qualquer resposta que produza o S ^ para o lao final ser forada. As respostas executadas inapropriadamente simplesmente iro afrouxar o lao e, ento, sero extintas. Na prtica, as crianas raramente so ensinadas da melhor maneira, mas sim, na forma de [ 1 2.3| Os pais so frequentemente desiludidos pela falta do que chamam de inteligncia, quando uma criana no domina tarefas simples rapidamente. A deficincia no est na habilidade da criana em solucionar problemas, mas sim na apreciao dos princpios de encadeamento pelos pais. Uma criana pode aprender como amarrar um sapato em questo de minutos, se estes princpios so cuida dosamente seguidos. O ideal que o processo seja automatizado, com o uso de vrios sapatos, cada um num estado progressivamente mais desamarrado. O estudante pode perguntar: onde esto as luzes e campainhas na cadeia de amarrar o sapato? Por que elas foram necessrias para o rato e no para a criana? A discrepncia apenas aparente. Ao amarrar um cadaro, cada resposta na cadeia produz, naturalmente, uma situao de estmulo diferente, um cordo que est mais prximo de ser amarrado. Na caixa de Skinner, o pressionar a barra ou o puxar uma corda no afeta, naturalmente, o ambiente desta maneira, de modo que o experimentador e obrigado a acrescentar mudanas de estmulo algo artificialmente. Mas em ambas as cadeias, os S^s e S ^ s so as foras unificadoras. Quando o cordo est num estado particular, somente certas respostas podem avan-lo para o prximo estado. Assim, qualquer estado determinado
- 250 -

do cordo um para uma classe particular de resposta e um S A para o resto. (Note que a criana deve aprender a observar o estado atual do cordo para escolher os S ^s 'devantes). Tanto para o comportamento de amarrar os sapatos como para os movi mentos do rato, o status de encadearqento permanece uma seqncia de respostas operantes entremeadas com seus S^s. Pierrel e Sherman (1963) descreveram o treino de uma seqncia extica de compor tamento do rato. O rato subia uma escada em espiral, atravessava uma ponte estreita e subia uma escada de mo. Ento, puxava uma corrente ligada a um carro de brinquedo aberto, subia no carro e pedalava-o at uma segunda escada de mao. Depois de subir esta escada, ele passava atravs de um tubo e entrava num elevador. O peso dc rato fazia baixar lentamente o elevador at a plataforma inicial, onde, como um anticlmax, o animal pressionava uma barra e recebia uma pelota de alimento pelos seus esforos. Depois de comer, o rato estava em condies de iniciar novamente a seqncia. O observador casual, provavelmente, ficaria maravilhado pelo desempenho rpido e seguro desta cadeia, por um organismo to insignificante como o rato. Um exame da histria por trs de tal desempenho, todavia, revela que apenas os princpios bem estabelecidos dos captulos 4-11 foram empregados. O comportamento do rato foi adquirido pelos princpios de discriminao e modelagem e encadeado pelo uso criterioso de reforadores condicio nados. 12.3 A APRENDIZAGEM DE LABIRINTO COMO UM ENCADEAMENTO O labirinto tem sido associado com a psicologia h muito tempo. Em experimentos iniciais que datam da passagem do sculo, animais famintos eram colocados em aparelhos tais como os vistos na Fig. 12-2, permitindo-se que encontiassem o caminho at o alimento. O labirinto foi adaptado para sujeitos humanos com os olhos vendados de modo a permitir que eles traassem seu caminho com um estilete atravs dos caminhos tortuosos, com muitos pontos de escolha, talhados na madeira ou feitos de metal.
Caixa-objetivo da esquerda Caixa-objetivo da direita Caixa objetivo

partida

partida

igura 12-2. Labirintos representativos. Cada labirinto tem uma caixa de partida e uma ou mais caixas-objetivos ou sadas, onde o alimento pode ser encontrado. Um ponto no labirinto a partir do qual dois caminhos so possveis e chamado ponto de escolha.

A fora da resposta era inferida de mudanas (1) no nmero de erros ou entradas em becos sem sada, e (2) no tempo de reao (RT), da caixa de partida at a caixa-objetivo. Depois de um nmero variado de tentativas de treino, os indivduos colocados no ponto

- 251 -

de partida percorriam esses labirintos rapidamente e sem erros. As curvas obtidas quando erros ou RTs eram representados em funo do nmero de tentativas eram de vrias formas, dependendo da estrutura particular do labirinto usado.Geralmente, medida que se realizava mais e mais tentativas, os erros diminuam progressivamente at zero e os RTs diminuam progressivamente, aproximando-se de uma assntota. Havia muitas esperanas, originalmente, de que o estudo de animais em labirintos revelaria os segredos da ao instrumental e forneceria informao fundamental a respeito do processo de aquisio. Infelizmente, a histria confirmou poucas dessas espe ranas. Em comparao com a topografia de uma presso barra ou uma bicada na seqncia do labirinto constitui uma longa e complex a cadeia, cuja aquisio envolve uma mistura no analisada de discriminao, diferenciao e reforamento condicionado. Como todos esses aspectos do comportamento estaro inestricavelmente misturados durante o treino, no surpreendente que a aquisio no labirinto seja gradual em vez de abrupta. Os labirintos so usados at hoje na pesquisa psicolgica de problemas especiali zados onde o grau de anlise requerido mnimo; mas, a confuso de um grande nmero de fatores de aquisio acarreta dificuldades na interpretao de resultados cortiportamentais. O estudante aconselhado a encarar o comportamento no labirinto como uma cadeia de elementos resposta h e te ro g n e o s (isto , diferentes), que s gradualmente se tornam ligados em seqncias unitrias de resposta. 12.4 OS EFEITOS DA EXTINO SELETIVA EM PONTOS DIFERENTES DA CADEIA

Embora possamos concordar que seqncias complexas de comportamento operante so adquiridas como cadeiasque crescem gradativamente, ainda relevante per guntar se, uma vez formada, uma ao retm todos os aspectos encadeados. Por exemplo, os membros originais da resposta preservam seu status unitrio como respostas? Os experimentos em que o procedimento de extino aplicado seletivamente aos membros originais de um ato bem condicionado so instrutivos. Skinner (1938) encadeou a resposta de presso barra e a resposta de aproximao ao comedouro no elo usual (fase a ) Fase a:

__

s+ ^(presso barra) S (aproximao Rao comedouro) R ^(alim ento Lf (comer 2 3 ausente)

__

__

Ouando esta seqncia estava bem condicionada, introduziu-se a extino, no se permi tindo que a presso barra produzisse o som do alimentador (fase b). Esta operao de extino quebra a cadeia entre cadeia entre os elos 3 e 2. Fase b: ^(presso barra) ^(alim ento ausente)

Sob essas condies, os S^s para os dois membros finais (aproximao ao comedouro e comer) no podiam ser reproduzidos e, naturalmente, a presso bara no elo 3
- 252 -

enfraqueceu. Quando a resposta barra alcanou um nvel baixo, a cadeia foi restabe lecida para incluir o elo 2 , permitindo-se que a presso barra produzisse o som do alimentador. Mas nenhuma outra contingncia da cadeia foi restaurada (fase c ). Fase
c:

^(presso barra) S(alimento ausente)

S(som do alimentador) R(aproximao ao comedouro) -f-

Os resultados dessas operaes seletivas de extino aparecem nas curvas duplas de extino da Fig. 12-3.

Figura 12.3. A extino separada de membros dc uma cadeia. A extino de R (presso barra) foi conduzida at a seta. Depois da seta, tanto R (presso barra) como R (aproximao ao comedou.o) foram extintas (segundo Skinner, 1938).

Pela figura, parece que depois da reintroduo do som do comedouro (fase c ) , a resposta de presso barra readquiriu fora imediatamente e uma segunda curva de extino foi gerada. A interpretao desse resultado a seguinte. Durante a extino na fase b , a resposta de presso barra (na ligao 3) enfraqueceu; mas a resposta de aproximao ao comedouro (na ligao 2 ) no, porque esta ltima estava principalmente sob o controle do estmulo som do comedouro, que no ocorreu nesta fase. Uma vez ausente na fase b , o estmulo do comedouro no perdeu suas propriedadas de SD, n e m , a p a re n te m e n te , suas p ro p rie d a d e s d e re fo r a d o r c o n d ic io n a d o . Logo, o restabelecimento da contingncia 3 na fase c restituiu presso barra sua fonte usual de reforamento condicionado, o som do alimentador. Durante a fasec, a resposta discriminativa de aproxi mao ao comedouro enfraqueceu gradualmente atravs da extino, e o som do come douro perdeu, correspondentemente, suas propriedades de S ^, j que no estava sendo mais emparelhado com alimento (S+). A demonstrao de Skinnci sugere que, na extino, somente os membros de uma cadeia at o ponto de fracionamento diminuem em fora. A fora de membros e S^s alm desse ponto preservada. A extino pode ser aplicada de uma forma algo diferente para demonstrar ainda a natureza encadeada do comportamento estabelecido. Ratos so inicialmente treinados a percorrei um labirinto em forma de T (Fig. 12-2), obtendo o alimento que colocado numa das caixas-objetivo (digamos, direita). Quando os ratos vo para o lado direito consistente e rapidamente, esto prontos para a prxima fase do experimento. O alimento retirado da caixa-objetivo, os ratos so colocados diretamente na caixaobjetivo agora vazia (onde haviam outrora encontrado alimento depois de percorrer o

- 253 -

labirinto), permanecendo ali por um momento. Numa fase final de teste, os ratos so colocados na caixa de partida com o alimento ainda no presente na caixa-objetivo. O tempo requerido para percorrer a distncia entre a caixa de partida e a objetivo medido. O ato de percorrer o labirinto daqueles ratos que tiveram uma histria passada de serem colocados na caixa-objetivo vazia mostra uma extino rpida, foradonormal. No teste, estes ratos percorriam o labirinto mais devagar e cometiam mais erros do que cometeriam se no tivessem tido a oportunidade de descobrir que sua caixa-objetivo estava agora vazia, Esta reduo na fora da resposta define um fenmeno conhecido como extino latente . A escolha desta expresso para descrever o comportamento baseada numa interpretao discutvel da fase intermediria do experimento, em que os animais so colocados diretamente no compartimento vazio. Extino latente implica em que esta fase intermediria um perodo durante o qual a extino do comportamento de percor rer o labirinto est ocorrendo de forma implcita, ou latente. tentador dizer que os ratos param rapidamente de correr no labirinto, em extino, porque, j tendo t*do bastante tempo para investigar a caixa-objetivo vazia, eles sabem , antes de correr, que a encontraro vazia. Infelizmente, esta explicao baseia-se no futuro como o fator controlador do comportamento e contm todas as falhas de tais explicaes , mencio nadas anteriormente (seo 4.1) Uma interpretao mais simples, embora mais austera, est baseada na extino manifesta e perdas no reforamento condicionado. No treina mento, os ratos aprenderam a percorrer o labirinto. Treino: _ _ ___ S(caixa-objetivo) S(ponto de escolha) S(caixa de partida) R(dirigir-se ao recipiente com R(virar direita) ; R(correr) ----- 1 alim ento)-----* S + 2 Na fase intermediria, os ratos estavam na caixa-objetivo, agora vazia, resultando em alguma extino verdadeira de R \. S(caixa de partida) R( dirigir-se ao recipiente com alimento) **

1
No teste, toda a cadeia foi submetida a um procedimento padro de extino. Teste: S(caixa de partida) R(correr)------^
3

S(ponto de escolha) R(virar direita)----

~2 '

S(caixa-objetivo) R(dirigir-se ao recipiente com 1 alimento)

Os membros resposta associados com as contingncias 3 e 2 foram significativamente enfraquecidos pela fase intermediria. A explicao dessa diminuio na fora encon trada na reduo drstica do poder reforador da caixa-objetivo que ocorreu nesta fase. Na extino latente , esta reduo parece regredir por toda a cadeia, diminuindo o poder reforador de todos os SDs anteriores. Os resultados da extino latente e do experimento de extino seletiva de Skinner sugerem a seguinte generalizao composta de duas partes. Todos os membros de urna cadeia at o ponto em que, nesta cadeia, um membro tenha'sido submetido a extino, sofrem um enfraquecimento, se ou no estes membros foram realmente emiti
- 254-

dos. Por outro lado, nenhum dos membros alm do ponto de extino enfraquecido. A generalizao de algum interesse como um mtodo prtico para reduzir o comporta mento no desejado pela simples extino dos reforadores condicionados dos quais ele depende. Se o comportamento no desejado consiste de uma seqncia grande e de longa durao, tal princpio, se que ele se mantm para cadeias de qualquer tamanho, deve ser bem recebido pelos educadores que acham desejvel extinguir velhos pontos de vista antes de ensinar os novos. 12.5 ESQUEMAS ENCADEADOS Nem sempre fcil avaliar as foras das vrias respostas e reforadores condicionados numa cadeia estabelecida do tipo que descrevemos. (1) O problema da medida. As respostas nessas cadeias so heterogneas, isto , as respostas sucessivas na cadeia diferem uma da outra quanto forma Quando um rato rola uma bola de gude at um buraco, puxa um cordo e pressiona uma barra, pouco provvel que esses comportamentos ocorram com taxas idnticas. As respostas variam na topografia, durao e esforo requerido. Assim, seria surpreendente se suas taxas de ocorncia fossem comparveis. Mas uma cadeia, cujos membros correm com taxas variadas devido s variaes topogrficas, presta-se pouco como um meio para o estudo dos efeitos quantitativos que vrias operaes experimentais, tais como drogas, leso fisiolgica e esquemas de reforamento poderiam exercer no comportamento encadeado. (2) O problema da sensibilidade. Quando essas cadeias esto bem estabelecidas,elas funcionam como unidades. Isto o que queremos dizer quando nos referimos aos seus membros como estando ligados no que eqivale a um operante de ordem superior. A estrutura unitria dessas cadeias uma conseqncia da manuteno dos membros sob o controle funcional do reforamento, como fazemos para um operante mais simples. Embora tenhamos visto que a extino seletiva uma forma de revelar a estrutura essencialmente encadeada de tais atos, muitas operaes experimentais parecem afetar a seqncia como uma unidade. A cadeia como um todo pode variar em fora, em funo dessas diferentes variveis experimentais, mas as foras relativas dos membros individuais da cadeia permanecem insensveis a essas variveis. Em contraste com a cadeia simples, o esquema encadeado (Ferster e Skinner, 1957) fornece uma linha-base quantitativa e sensvel para avaliar as propriedades de cadeias. Como as cadeias j descritas, os esquemas encadeados consistem de uma sucesso de contingncias ligadas. Mas, ao contrrio dessas cadeias, os esquemas encadeados especi ficam que cada membro da resposta produz a contingncia seguinte probabilisticamente. Assim, em qualquer ligao nica, um nmero de respostas pode ter que ser emitido para avanar a cadeia para a prxima ligao. A vantagem disso que, em qualquer ligao probabilstica, a taxa, frequncia ou padro do responder fornece uma varivel depen dente sensvel que pode ser estudada independentemente da taxa, freqencia ou padro dos membros resposta numa ligao em qualquer ponto da cadeia. Alm disso, j que os membros individuais no esquema encadeado podem ser convenientemente especificados como classes de respostas idnticas (homogneas), o problema de medida associado com as topografias heterogneas em cadeias mais simples contornado. Considere um esquema encadeado homogneo com duas ligaes. Lembre-se de que o termo ligao se refere aosS ^s sucessivos do esquema. Na notao, os colchetes sucessivos de um diagrama denotam as ligaes. Numa cadeia simples, cada ligao c

255 -

associada com uma e somente uma resposta, mas no esquema encadeado esta correspondncia um-a-um entre resposta a ligao no est presente. Um esquema encadeado representativo est abreviado em [ 12A\ .0 bicar a chave de um pombo na presena de uma luz vermelha produz, num esquema RI, uma luz verde; o bicar a chave na presena da luz verde produz, num esquema FI, o reforamento com alimento. S(vermelho) R (bicar) RI > S (verde) R(bicar) FI ^

g+

[12.4]

0 diagrama [12.4 (descreve uma cadeia de duas ligaes mas uma que gera tipicamente muitas respostas de bicar a chave por reforamento. Alm disso, padres diferentes de resposta se desenvolvem nas diferentes ligaes, sendo cada padro apropriado para a contingncia especfica da ligao em que ocorre. Assim, as curvas na Fig. 12.4A mostram que efeitos tpicos de RI ocorrem na segunda ligao, a situao luz vermelha; as curvas naFig 12-4B mostram que efeitos tpicos de FI so gerados na primeira ligao, a situao luz verde. Dois registradores foram usados para obter a Fig. [ 12-4[.Bicadas na presena da luz vermelha (ligao 2 ) foram registradas num registrador; bicadas na presena da luz verde (ligao 1) foram registradas em outro. Quando o animal estava na situao associada a uma determinada ligao, somente o registrador apropriado para esta ligao era operado. O procedimento do esquema encadeado tem aplicao na avaliao, em detalhes quantitativos, do poder reforador de um reforador condicionado. Na seo 11.2, estvamos preocupados com a durabilidade de um reforador condicionado: isto , quanto tempo um reforador adquirido retm seu poder de manter comportamentos. Mas a fora de um reforador condicionado em qualquer momento determinado ,

r f ' ' f ,

6 min (A)

(B)

Figura 12-4. Respostas produzidas num esquema encadeado RI 45 seg - FI 45 seg. Bicadas na chave so as respostas de pombos famintos. O aparecimento de uma luz verde associada contingncia FI o reforamento em (A). O alimento o reforamento em (B). (Dados no publicados de J. R. Milienson).

- 256-

frequentemente, de igual interesse. Em linguagem coloquial, a fora de um reforador porporcional quantidade de trabalho que o animal despender para obter o reforador. Uma discusso completa sobre a fora de reforadores encontra-se no captulo 15. No momento, suficiente notar que a taxa em que um organismo trabalha numa situao (onde seu trabalho tenha, no passado, produzido o reforador) urna medida de tal fora. Em geral, um homem que deseja algo ardentemente trabalhar muito para conse^u-lo. Assim tambm o pombo. Quando o EI da primeira ligao em 112.41 aumentado, ou diminudo, a taxa total de bicadas do animal nesta ligao FI dificilmente afetada. Mas sua taxa de bicadas na ligao RI precedente se altera sistematicamente. A funo suave e apresentada na Fig. 12-5. A funo foi obtida com um procedimento igual ao de [ 12.4 1 . Em vrios meses de experimentao diria, quatro valores de FI na ligao 1 foram estudados. De acordo com a Fig. 12-5, quanto maior o Fl menos o animal tende a trabalhar para produzir a ligao associada ao FJ e, assim, por inferncia, menor o valor reforador a ela associado Os esquemas encadeados podem ser combinados com especificaes de resposta de ordem superior, formando cadeias tais como V I-R F , V I-drl e F R -F I. O nmero de ligaes permissveis pode ir alm de dois. Demonstrou-se que cadeias VI-VI-VI-VI-VI mantm o comportamento (Kelleher e Gollub, 1962). Muitos fenmenos cmportamentais interessantes ocorrem, encadeando-se uma variedade de procedimentos. O estu dante interessado pode consultar Ferster e Skinner (1957) e Kelleher e Gollub (1962) para detalhes adicionais.

Figura 12-5. Respostas por m inuto na segunda ligao de um esquema encadeado duas ligaes em funo do esquema FI na primeira ligao (dados no publicados de J. R. MilIcYjson).

12.6 O COMPORTAMENTO HUMANO COTIDIANO COMO ENCADEAMENTO No c o m p o rta m e n to hum ano, quase toda ao ou habilidade, desde o atravessar uma sala at o assobiar uma cano, tem a forma de uma cadeia operante. Tais cadeias so compostas da maneira em que as sries de movimentos foram combinadas pelos r-tos descritos na seo 12.1? Os S^s separam cada movimento simples no desem

- 257 -

penho humano e servem para ligar a seqncia como um todo? A anlise sugere uma resposta afirmativa para ambas as questes. No comportamento conhecido como caminhar, uma perna erguida, estendida e toca o cho. A outra perna, ento, repete um padro semelhante. A cadeia claramente algo como

[12.5]

onde So =ambas as pernas apoiadas no cho e ps juntos S6 =perna esquerda acima do cho S5 =perna esquerda estendida S4 =perna esquerda apoiada no cho e p esquerdo adiante S3 =perna direita acima do cho S2 =perna direita estendida S\ =perna direita apoiada no cho e p direito adiante

R()-erguer a perna esquerda R6 =estender a perna esquerda R 5=abaixar a perna esquerda R4 =erguer a perna direita R3 = estender a perna direita R2 = abaixar a perna direita R \ =eiguer a perna esquerda

Nesta cadeia, as descries dos estmulos podem ser questionadas em termos prticos. Quando caminhamos, em geral no observamos continuamente a posio de nossas pernas em uma relao outra. De quajqucr foram, caminhamos adequadamente no escuro. Evidentemente, existem eventos dentro do organismo que so parte dos Ss em cada colchete de [ 12 . 5 ]. Estes elementos internos de cada situao de 112.5 | surgem dos prprios movimentos do corpo. Mencionamos brevemente, na seo 9.1, os receptores conhecidos como proprioceptores, que se acham localizados nos msculos c tendes. Esses receptores tm a propriedade de responder diferencialmente a vrios movimentos de msculs e tendes. Assim, cada S em 11 2.5 | pode ser descrito mais completamente, notando-se no apenas o estado do membro em referncia ao ambiente externo como fizemos, mas tambm o estado exato dc tenso dos conjuntos particulares de msculos usados. No andar comum, esses estados so usados como as deixas principais para manter uma seqncia dc movimentos bem coordenada. Contudo, a sensibilidade muscular no sempre suficiente, especialmente na aquisio de seqncias mais complexas, para a coordenao ideal do comportamento. Ao aprendermos um novo passo de dana, um instrutor pode ter que nos aconselhar a no olharmos para nossos ps. Nosso comportamento de observar uma maneira bvia de assegurar que colocamos nossos ps onde deveriam ser colocados durante a dana. Mas, o comportamento visual de observar no incentivado pelos mestres de dana porque ele viola certos padres estticos, retarda a aquisio do controle apropriado pela propriocepo e torna quase impossvel que duas pessoas dancem juntas. Em certas doenas ou leses da medula vertebral, os receptores proprioceptivos no operam. Nesles

- 258-

casos, as pessoas continuam a caminhar, mas somente pela observao visual da posio de suas pernas. A duplicao de indcios e a superposio informativa comumente encontrada nas situaes explorada na tcnica conhecida como substituio gradual de controle". As cadeias so frequentemente formadas utilizando-se elementos bem grosseiros das situa es como S^s preliminares. Ento, medida que a aquisio prossegue, os controles so gradualmente transferidos para pores cada vez mais sutis das situaes. Isto pode ser feito no se liberando o reforamento quando um comportamento grosseiro de observa o detetado, como no exemplo da dana, ou removendo-se gradualmente certos aspectos da situao. Por exemplo, ao aprender a dirigir um carro, o novato pode depen der, inicialmente, de comandos verbais do seu instrutor de direo para manter uma cadeia suave de comportamento. Esses comandos so vistos entre aspas em 12.6 na designao dos S^s.
SA R
a

SB -

>

Rn

---- > Rc

-* SD

[ 12.6]

onde S \ Coloque em marcha lenta+ carro parado RA = colocar a alavanca de cambio em marcha lenta Sb =Pise no acelerador * alavanca em marcha lenta Rg =pisar no acelerador S ~ Solte a embreagem + motor com rotao moderada R =soltar a embreagem Sd = Muito bem! + carro move-se para a frente O instrutor pode, gradualmente, comear a omitir os elementos verbais das situaes, de modo que as deixas provenientes do pedal de embreagem e da alavanca de cmbio passem a atuar diretamente. Os professores, ocasionalmente, se esquecem de que no mundo fora da sala de aula, deixas verbais faladas e escritas como as instrues de 22.6 so muitas vezes chamadas raramente esto presentes. Assim, importante que no ensino formal, as deixas verbais usadas no incio sejam retiradas antes que o estudantes possa ser considerado treinado. esta eliminao gradual de partes de uma situao de S^, deixando apenas aspectos mnimos do estmulo em controle, que conhecida como
s u b s t it u i o

gradual de controle.

Outros casos de substituio gradual de controle surgem quando um msico aprende uma composio musical de cor. Inicialmente, as notas individuais escritas na pauta fornecem os S^s. Na passagem

1 4

a cadeia R (tocar FA), R (tocar MI), R (tocar SI), R (tocar LA), determinada. Inicialmen te, os membros individuais da cadeia so controlados pela partitura. Eventualmente, toda via, a partitura gradualmente removida, as respostas de observar diretamente a partitura no

- 259 -

so incentivadas pelo instrutor e finalmente os prprios sons das notas fornecem todos os S^s necessrios. Em geral, o paia tocar uma nota iio ser necessariamente o som da nota imediatamente procedente, mas, em vez disso, uma combinao dos sons de vrias notas anteriores uma passagem. Assim, por exemplo, a deixa para a execuo das nota E acima, geralmente no ser apenas a nota B anterior, mas tal execuo estar sob o controle de uma longa srie de notas precedentes, sendo a B apenas a ltima dessas. Como seria esperado, portanto, as passagens de execuo mais difcil so aquelas que so semelhantes, isto , aquelas que contm seqncias de notas idnticas terminando numa nota final diferente. Para tocar a nota correta, o nico disponvel est localizado a alguma 'istncia (nas passagens muito semelhantes, talvez uma meia dzia ou mais notas anteriores) as notas imediatamente precedentes devem, no momento, ser ignoradas. Uma quebra no encadeamento explica a hesitao que um artista algumas vezes exibe ao iniciar uma passagem. No h um nico no incio da partitura. Um problema semelhante pode ocorrer na memorizao de poesia. Uma vez comeada, cada palavra falada marca a ocasio para a prxima palavra, mas necessrio alguma deixa verbal para se iniciar. Quando crianas recitam poesia, frequentemente se observa que elas fazem uma pausa entre as linhas. Este o resultado de se memorizar linha por linha, de modo que a ltima palayra da linha anterior no adquire poder suficiente de para a primeira palavra da linha seguinte. 12.7 CADEIAS VOCAIS No somente a poesia, mas todo comportamento verbal humano (comunicativo) encadeado. A sentena uma cadeia de palavras, sendo que cada palavra falada uma resposta que produz um S ^ (o som dessa palavra) que marca ocasio para a prxima palavra. No distinguimos os rudos emitidos por seres humanos como sendo fundamen talmente diferentes de outros operantec humanos e animais. Num captulo anterior (sees 4.10 e 4.11) descrevemos experimentos que indicavam que o comportamento vocal de crianas e estudantes universitrios fortalecido e enfraquecido de acorda com as contingncias, de reforamento apropriadas. Desejamos ampliar, nesta seo, o que j explicamos, indicando, ao mesmo tempo, como a linguagem alcana um status tipica mente encadeado. Considerando-se que a linguagem to intimamente uma parte aa arte, cincia e culjura humanas, estudiosos _e cientistas de vrias disciplinas tm sido levados a aplicar seus diferentes pontos de vista e tcnicas para analisar a linguagem. O corpo de conheci mento resultante constitui a lingstica. No presente texto, restringimos nosso interesse a trs problemas psicolgicos da linguagem: ( 1 ) O que constitui uma descrio compor tamental conveniente da linguagem? (2) Como este comportamento adquirido? (3) Qual o significado da linguagem? Nesta seo, restringimos nossa ateno aos dois primeiros problemas, adiando a anlise do significado (que melhor descrito pela enumerao de condies especficas que controlam as seqncias particulares de lingua gem) para o captulo posterior sobre aquisio de conceito. Na seo 4.10 notamos que, bem cedo na vida da criana, a distribuio da freqn cia relativa de vrios fonemas torna-se semelhante aos histogramas de fonema para a comunidade em que a criana est sendo criada. A correspondncia presumivelmente o efeito de contingncias de reforamento seletivo peculiares a essa comunidade. Embora tais distribuies possam nos dizer quais so os sons bsicos que mais provavelmente "GO

sero enunciados por um dado indivduo, elas fornecem pouca informao sobre a estru tura do comportamento verbal. Esta estrutura convenientemente descrita como cadeias de palavras. Alm disso, as prprias palavras faladas so convenientemente representadas como cadeias de slabas ou fonemas. Naturalmente, da mesma forma que os membros resposta no comportamento encadeado do rato relativo presso barra, as unidades de cadeias verbais tambm desaparecem nas seqncias que fluem suavemente. Sob certas condies, a natureza encadeada das palavras facilmente demonstrvel. Na aquisio de uma palavra nova e difcil, de modo a podermos repetir a palavra corretamente. A palavra Monongahela , dos ndios Delaware, de difcil pronncia para estrangeiros. Quando a palavra representada como uma cadeia, os S^s dos sons e as Rs de falar so convenien temente descritos como slabas [12.7.| Inicialmente, os sons podem ser

[12.7]
l < h e >

I < la >

S "la '

produzidos pelo aparelho vocal de um instrutor ou, em princpio, por uma mquina. As respostas de 112.7Jso aquelas de um organismo aprendendo a pronunciar a palavra. Na notao, os elementos falados (R) das palavras so colocados entre colchetes oblquos < > ; enquanto os sons (S) das palavras so colocados entre aspas . No incio da aquisio, os S^s de qualquer ligao determinada em [12.7 |no tm controle suficiente sobre as Rs desta ligao para produzir seguramente um comporta mento. O instrutor pode ter que fornecer uma deixa verbal para a slaba desejada. Por exemplo, aps o erro comum mongonga , o instrutor pode aconselhar um reinicio e, depois que o aprendiz responde , mo , ele mesmo pode dizer non . Sob instrues apropriadas para imitar, o S non provavelmente controlar a R non . Naturalmente, o instrutor eventualmente remover essas deixas verbais de modo que a pronncia correta se torne independente da sua presena. Uma nota sobre imitao aqui inserida entre parnteses. A imitao , inquestio navelmente, um mtodo valioso para controlar o comportamento. Mas, como uma maneira rpida para o processo completo de aquisio, ele pode ser muitas vezes superesti mado. Os professores frequentemente se surpreendem ao observar que, dando ao aluno um pouco de informao, frequentemente nada ensinam ao estudante. O desempenho complicado de um danarino, de um acrobata hbil ou de um msico no pode ser colocado no repertrio de um novato atravs da mera imitao. Observar algum a dirigir um carro ou pilotar um avio no desenvolve, por si s, estas habilidades no observador. A imitao quase sempre til para aumentar a fora de respostas previamente adquiri das, mas no to til para encadear os membros numa seqncia de qualquer tamanho ou complexidade. A natureza encadeada das palavras claramente exposta em experimentos que alte ram a sucesso normal de S^s. Se respostas silbicas do tipo visto em [ 12.7 ]no produ zem seus S^s caractersticos imediatamente, o padro da fala rompe-se e se torna cati co, sujeito pode comear a garguejar e, em casos extremos, totalmente incapaz de falar. No Feedback auditivo com atraso, as relaes normais R -* S^ na fala de cada uma das suas prprias Rs de falar, por cerca de 1/5 de seg. (Lee, 1950). O termo feedback foi emprestado da linguagem da eletrnica, onde parte de um sinal de sada out-put (por exemplo, na sua vitrola, parte da energia amplificada que ordinariamente iria para
261 -

seu altofalante) retornada (feedback) para a entrada input (o lugar onde voc coloca a tomada de sua vitrola) do mesmo circuito. Por analogia, uma resposta pode ser considerada uma sada do sistema comportamental; o ambiente pode ser considerado a entrada deste sistema. Quando um organismo opera em seu ambiente, emitindo operantes, as mudanas no ambiente produzidas pelas prprias respostas do organismo podem ser consideradas um feedback para o organismo. A palavra feedback , despida de sua caracterstica eletrnica, anloga quelas conseqncias especiais que chamamos refor adores primrios e secundrios. Imagine um sujeito numa sala prova de som. Fones de ouvido confortavelmente ajustados e paredes e tetos que absorvem sons impedem-no de escutar sua prpria voz pela propagao normal atravs do ar. (Uma recepo muito reduzida possvel atravs da propagao nos ossos). Os sons produzidos pelas respostas de falar vo para um gravador atravs de um microfone. Eles so retardados pelo simples procedimento de primeiro grav-los e, ento, uma frao de segundo mais tarde, toc-los amplificados para o sujeito. A amplificao serve para anular quase toda a conduo ssea de S^s. O eteito obtido um exagero daquele observado quando um orador fala para o pblico, num sistema de alto-falante, estando o alto-falante localizado a alguma distncia de seu micro fone. Num caso tpico de distoro da fala produzida por este tipo de atraso de som, a pronncia de Monongahela torna-se monongahelala. Considere este efeito em relao cadeia do diagrama [12.7 |. Na ligao da contingncia 1, o sujeito acabou de pronunciar R < la > e, em circunstncias normais, ouviria imediatamente S Ia , o final na cadeia. Mas, devido ao atraso, ele escuta S he , que ainda controla outra R < la>. O efeito mais pronunciado no final da cadeia porque, na fala normal, o comportamento no meio da cadeia da palavra mantm-se ligado pelos movimentos imediatamente antecedentes do aparelho vocal, em adio aos efeitos sonoros produzidos por esses movimentos. A R final,uma pausa deliberada, mais dependente do som da slaba terminal. (A maneira mais segura de voc saber que terminou de falar uma palavra escutar sua ltima slaba). O mtodo de feedback auditivo com atraso, quando com um atraso fixo, pode no ser o melhor para quebrar a cadeia da fala. Com a prtica, parece razovel que o sujeito passe a usar os S^s atrasados, uma vez que eles ainda tm uma relao fixa com o comportamento anterior (sempre 1/5 seg mais tarde). Se o atraso fosse uma mdia de intervalos aleatrios igual a 1/5 seg, intervalos esses que variassem de momento a momen to, esperar-se-ia um rompimento mais completo da cadeia de linguagem falada. As sentenas podem ser analisadas de forma anloga s palavras. Durante a infncia, a aquisio de sentenas baseada na ligao de combinaes cada vez mais longas de palavras. No levando em conta o problema do significado, as cadeias de sentenas diferem das cadeias de comportamento do rato at aqui consideradas, no sentido em que seus membros resposta (palavras) so combinados em muitas seqncias diferentes permissveis. (Isto tambm verdadeiro nas cadeias de slabas que formam as palavras). A cadeia o cachorro morde o homem controlada por uma situao muito diferente da cadeia o homem morde o cachorro. Logo, as unidades bsicas das sentenas (palavras) no podem ser aprendidas em qualquer seqncia fixa da maneira em que o rato da seo 12.2 aprendeu os membros de sua cadeia. A sentena construda pea por pea, empre gando as palavras como unidades. medida que a criana cresce, a mdia do tamanho de suas sentenas faladas aumenta, como visto na tabela 12 - 1 .

- 262-

Tabela 12-1 TAMANHO MDIO DE SENTENAS FALADAS EM VRIAS IDADES ( s e g u n d o M c C a r th y , 1954 ) Idade (anos) Nmero de nalavras 1.5
1.2

2.0

2.5 3.1

3.0 3.4

3.5 4.3

4.0 4.4

4.5 4.6

Como as unidades de palavras so organizadas em sentenas? O mecanismo parece ser um encadeamento de operantes discriminativos discretos. Por exemplo, o comporta mento verbal de uma criana pode ser modelado (de acordo com os princpios dos Captulos 7 e 8) de tal modo que a palavra bola venha a ser pronunciada, quando solicitada, na presena de objetos esfricos. Similarmente, pode-se tomar o reforamento contingente emisso de certos sons pela criana (<azul> <vermelho>,<verde >, etc.), na presena de objetos apropriadamente coloridos. Finalmente, a criana pode ser treina da a vocalizar < Eu tenho... > nas circunstncias em que esteja com um certo objeto para o qual ela tenha aprendido um nome, como aprendeu bola . A chave para esta anlise que cada palavra ou conjunto de palavras fica sob o controle de uma situao ambiental e s p e c f i c a , ou, mais exatamente, um conjunto de situaes: S (bola)
^ ^ b o !a > *S
,

S (objeto vermelho) R< vermelho>----- >-S \

S ( de posse de... ) R < E u tenho... >

s+

Embora a criana nunca possa ter completado esta seqncia, a questo O que voc u il a? pode produzir a nova cadeia, R < eu tenho > lumajR < bola > R < verme lha> , se os elementos da seqncia em conjuno com certas regras gramaticais a respeito de artigos indefinidos e suas posies com relao a outras palavras e as regras que governam a ordem dos adjetivos e substantivos j existem no repertrio comporta mental. Naturalmente, no h necessidade de que a criana seja capaz de verbalizar estas egras; ela precisa apenas empreg-las apropriadamente. Tipicamente, o fortalecimento do ornportamento de verbalizar regras gramaticais reservado para os professores de Portu gus. 12.8 CADEIAS RAMIFICADAS E REPRESENTAO DO DIAGRAMA DE FLUXO No estudo das recompensas tokens com chimpanzs, estabeleceu-se uma discrimi nao entre fichas brancas com valor e fichas de metal sem valor (seo 11.3) Numa variao do procedimento, os chimpanzs tinham que puxar uma barra para obter fichas. Algumas vezes, eles obtinham uma ficha branca pelo seu esforo, mas outras vezes obtinham uma de metal. Quando recebiam uma ficha branca, eles a colocavam numa mquina de vender que fornecia uvas ou gomos de laranja. Mas, nas ocasies, em que recebiam fichas de metal, os animais desprezavam-nas e voltavam barra para uma nova tentativa. Eles aprenderam que colocar fichas de metal na mquina de vender nunca produzia o reforamento.

- 263-

As contingncias de puxar a barra para os chimpanzs parecem de alguma forma com aquelas de um motorista que se aproxima de um cruzamento. O comportamento que o motorista emite no cruzamento depender de ele encontrar uma luz verde, uma luz vermelha, um sinal para prosseguir ou um policial de trnsito. As conseqncias de estimulo do comportamento de aproximao do motorista e do comportamento de puxar a barra do chimpanz esto sujeitas a um grau de incerteza. Em ambos os casos, uma determinada resposta puxar a barra ou aproximar-se do cruzamento pode levar a vrias situaes possveis. E a resposta apropriada que se segue na cadeia(inserir a ficha ou puxar a barra novamente; parar ou seguir) depender da situao particular em que de fato ela ocorreu. Quando uma resposta numa cadeia de comportamento pode, deste modo, levar a uma de vrias situaes possveis, diz-se que as contingncias naquele ponto se ramificam. Notamos as contingncias simples, ramificadas, nas sees anteriores, desenhando vrias setas partindo de uma R e indicando as probabilidades de cada conseqncia de estmulo. Muitos dos problemas cotidianos so mais complexos que aqueles encontrados pelo chimpanz e o motorista. Nestes casos, as solues so encontradas apenas cruzando-se uma cadeia complexa de tais contingncias ramificadas. No problema tpico, as contin gncias so compostas de modo a formar uma rede complexa de ramos, sub-elos, interconexes, becos sem sada e rotas alternadas. E conveniente analisar o arranjo de contingncias de reforamento no caso de reso luo de um problema mais complexo. Ao achar a diferena entre dois nmeros, uma criana est resolvendo um problema . Para o adulto sofisticado, naturalmente, o exerccio de subtrao parece uma execuo trivial de uma seqncia comportamental automtica. O sabor de um problema h muito se perdeu; todavia, por essa razo que uma anlise dever ser esclarecedor a.De fato, o fracionamento do exerccio simples revela uma cadeia bastante complexa de contingncias, em que pelo menos trs habilidades comportamentais participam. Considere o seguinte problema 60048 152

Para os objetivos de anlise, referir-nos-emos aos inteiros 6 ,0 ,0 ,4 e 8 , que aparecem no nmero superior, como inteiros superiores, ou simplesmente superiores ; e, aqueles nmeros 1, 5 e 2, que aparecem no nmero inferior, como inteiros inferiores, ou simples mente inferiores . Supomos que quaisquer espaos existentes sob um superior (por exemplo, aqueles sob o 6 e o ltimo zero esquerda do mesmo problema) so conside rados zeros. Podemos identificar trs operantes que o repertrio comportamental do invidduo deve incluir para que ele execute as vrias cadeias que levaro soluo do problema. 1. Um repertrio de respostas simples de subtrao deve estar presente. Uma criana treinada para responder trs ao comando subtraia quatro de sete ; a responder oito ao comando dezessete menos nove ; e assim sucessivamente. Em geral, uma lista de operantes discrim in ativos adquirida, de modo que a criana pode dar corretamente a resposta a qualquer subtrao onde o superior no maior que 18 e o inferior no maior que 9. (Acima desses limites, uma subtrao ser solucionada pelo processo a ser
- 264-

descrito). Esta lista de respostas constitui um conjunto de operantes discriminativos usualmente adquiridos atravs da aprendizagem de decorar e ditos serem memorizados . As respostas poderiam, naturalmente, ser rapidamente retiradas de uma tabela, mas elas so usadas to frequentemente em problemas de aritmtica que o procurar numa tabela atrasaria drasticamente a execuo da cadeia de soluo. 2. O comportamento de pedir emprestado deve ter sido previamente adquirido. Dado um inferior maior que seu superior 60048 152 deve-se ser capaz de examinar o primeiro superior diferente de zero localizado esquerda (60048), e diminuir 1 dele. Deve-se, ento, transformar quaisquer zeros existen tes entre os dois superiores em questo em noves (59948), e finalmente adicionar 10 ao superior cujo inferior originalmente o excedia (599 114.81). 3. O indivduo deve ser capaz de discriminar o maior de dois inteiros. Essa discrimi nao consiste, primeiro, de uma resposta de observao dirigida para o inferior , e, ento, para o superior logo acima dele. Se o inferior maior do que o superior , ento uma resposta (pedir emprestado) deve atuar; de outro modo, outra resposta (subtrair) dever atuar. Quando tentamos representar por Rs, Ss e colchetes, as contingncias que combi naro essas tres habilidades componentes de tal forma que produzam uma soluo, encontramos uma dificuldade. Este problema aritmtico relativamente simples quando comparado com muitos outros problemas numricos e no numricos. Contudo, suas contingncias compreendem tantos ramos,sub-elos, nterconcxes e rotas alternadas, que nossa notao sobrecarregada para fornecer uma representao manejvcl. Uma represen tao menos confusa da estrutura comport am en tal de tais tarefas necessria. As respostas e discriminaes que o indivduo faz ao solucionar um problema como a subtrao contm certa semelhana com as operaes que um computador digital realiza para solucionar problemas similares. A mquina e o homem podem no empregar mto dos idnticos, mas ambos alcanam uma soluo atravs da aplicao de habilidades componentes no momento e local apropriados. Os cientistas de computadores desenvol veram uma notao para descrever o fluxo seqencial das operaes da mquina. Os elementos desta notao so a caixa de teste (Fig. 12-6) com uma entrada e duas sadas, correspondendo comportamentalmente a uma discriminao, e a caixa de operao Fig. 12-7) com uma entrada e uma sada, correspondendo comportamentalmente a uma seqncia fixa de respostas.
entrada entrada

operaao

sada 2 Figura 12-6

sada Figura 12-7

- 265-

A Fig. 12-8 um diagrama de fluxo de testes e operaes que descrevem as etapas que levam soluo do nosso problema de encontrar a diferena entre dois nmeros. Um sub-elo (visto em pontilhado) descreve o comportamento de observao que precede o processo real de soluo do problema. O comportamento pode circundar vrias Incio

Figura 12-8. Diagrama de fluxo comportamental para se encontrar a diferena entre do::, nmeros

- 266-

vezes esse elo antes de alcanar as condies de que permitem o avano da cadeia. O pedir emprestado visto como um caminho que pode ter que ser percorrido, dependendo dos resultados do teste do inferior mais esquerda do diagrama. O arranjo das habilidades componentes na estrutura vista na Fig. 12-8 garante uma soluo para o problema definido. Comportamentalmente, uma soluo constitui-se da produo de uma situao (SD) com certas propriedades. No caso presente, este um nmero que, quando somado a 152 resulta em 60048. Quando um conjunto de contingncias, testes e operaes pode ser arranjado de modo a dirigir o comportamento para a produo inevitvel de um da soluo, referimo-nos cadeia resultante como um algoritmo. Muitos problemas prticos do cotidiano, desde costurar e cozinhar at calcular e desenhar, so analisados em termos dessas cadeias algortmicas de comporta mento. 12.9 CADEIAS DE COMPORTAMENTO ENCOBERTO Uma das caractersticas principais das cadeias de linguagem a sua capacidade de se tornarem encobertas, de modo que difcil dizer por observao direta o que a pessoa est fazendo, se o estiver, quando est resolvendo um problema por si mesma . Como nos referimos repetidamente ao comportamento como tudo o que se pode observar que um indivduo fazendo, existe a um problema real de definio. Estamos lidando com o comportamento quando uma criana resolve um problema de subtrao para si mesma ? Por inferncia, existe uma razo para se acreditar que uma cadeia ramificada do tipo da Fig. 12-8 realmente est se processando, embora a observao minuciosa da criana no revele movimento dos lbios, lngua, olhos ou bca. O valor de tal inferncia, naturalmente, encontra-se na sua capacidade de prever e explicar outros compor tamentos. Uma das teorias mais interessantes de J. B. Watson (1914-1920) foi a reduo do fenmeno conhecido como pensamento em termos de cadeias de comportamento encoberto. Watson citou, em apoio a esta teoria, o fato de as crianas, se no punidas por isto, frequentemente pensarem alto. De fato, uma histria de aproximao sucessiva de respostas cada vez mais silenciosas necessria para fazer a criana falar para si mesma . Alm disso, quando os adultos solucionam problemas difceis, seus lbios frequentemen te se movem e se o problema muito difcil, o indivduo pode comear a falar aber tamente. Watson sups que a evidncia para a linguagem encoberta, provavelmente, poderia ser detetada por instrumentos sensveis ligados aos msculos usados na linguagem. Ele sugeriu que, ao se pensar em atividades tais como andar de bicicleta ou dirigir um carro, ocorrem respostas de pequena escala nos msculos do corpo normalmente usados nestas atividades. A teoria de Watson tinha precedentes histricos. Plato havia observado que o pensamento e a linguagem estavam intimamente ligados a vrios autores do sculo XIX chegaram quase a antecipar Watson. Mas ningum antes de Watson atreveu-se a expor a tese de que todo pensamento era resposta encoberta. Vista com um enfoque moderno, a posio de Watson pode parecer mais ou menos extrema, dependendo dos preconceitos filosficos de cada um. Mas, cientificamente falando, a equao proposta entre pensa mento e contraes musculares desnecessria e, talvez, intestvel. Todavia, a noo de que as cadeias de comportamento podem tornar-se reduzidas em magnitude at que no sejam mais observveis a olho nu, permanece como uma proposio cientfica capaz de
- 267 -

gerar experimentos, identificando-se ou no algum ou nenhum pensamento com estas cadeias. Neste sentido, a hiptese de Watson permanece como um desenvolvimento cria tivo importante na h istria da cincia comportamental. Infelizmente, pouca experimentao conclusiva resultou da hiptese de Watson. Em sua prpria poca, aparelhos de registros sensveis ainda no haviam sido aperfeioados ao ponto necessrio para se fazer as medidas exigidas. Dois experimentos, entretanto, feitos em 1930, fornecem alguma evidncia preliminar de que a resposta encoberta ocorre nos msculos apropriados quando so dadas, aos sujeitos, instrues para pensar . Num experimento, colocou-se eletrodos em vrias partes do corpo do sujeito (bceps direito e esquerdo) e o sujeito foi instrudo a imaginar o movimento de um membro (Jacobson, 1932). As respostas eltricas dos msculos foram registradas num quimgrafo de movimento rpido (do tipo no cumulativo). Na Fig. 12-9, os registros obtidos do
(A )
(B)

<C>

(A) Imagine-se erguendo um peso de dez libras com seu brao direito . (B) Imagine-se erguendo-o com o brao esquerdo . (C) Imagine-se martelando um prego duas vezes, estando o martelo seguro pela sua mo direita .

Figura 12-9. Potenciais musculares registrados do bceps direito depois de vrios tipos de instrues (segundo Jacobson, 1932).

bceps direito esto justapostos com as vrias instrues que os precedem. As instrues claramente tiveram um efeito seletivo na atividade do msculo e, como mostra o registro (B), o efeito foi localizado no brao direito somente quando a instruo se referia ao brao direito. Durante o registro de (A), (B) e (C ), o experimentador no foi capaz de detetar qualquer movimento real do brao, a olho nu. Noutro experimento, os eletrodos foram colocados nos msculos da lngua e sob os lbios. Sob instrues de se imaginar contando, ou lembrando poemas ou canes ou multiplicando nmeros, os potenciais musculares ocorriam na musculatura da fala do sujeito. A forma da atividade eltrica, embora reduzida em amplitude, era muito parecida com a atividade eltrica que ocorreu quando a instruo imagine foi substituda pela instruo de fale em voz baixa . . Noutros experimentos independentes, os eletrodos foram colocados nos braos de sujeitos surdomudos, cuja linguagem consiste de gestos com as mos e dedos. Quando os mudos eram instrudos a pensarem em palavras ou resolver problemas de multiplicao de forma encoberta, geralmente apareciam potenciais musculares na regio do antebrao. Os potenciais musculares de sujeitos que podiam ouvir e falar foram usados como base para a comparao. Sob instrues semelhantes, ou sujeitos normais no apresentaram potenciais nas suas regies do antebrao (Max, 1937). Em concluso, a teoria de Watosn fornece um certo conforto intelectual para o cientista do comportamento: o pensamento tem um lugar no esquema de eventos comportamentais e pode, ento, ser descartado como outros fantasmas mentais do passado. Mas os experimentos no fluem imediatamente da posio de Watson, talvez um pouco devido s dificuldades de se fazer registros musculares. Mesmo as melhores teorias, frequentemente podem levar a uma complacncia que, em vez de favorecer a
- 268 -

pesquisa, pode atravanc-a. Existem numerosos problemas interessantes a respeito de cadeias encobertas de resposta, como elas so adquiridas, siia superioridade em eficincia em relao s cadeias manifestas correspondentes, questes sobre a sua manuteno, e assim por diante. Mas, enquanto as respostas encobertas forem consideradas apenas uma explicao para o pensamento , esses problemas pennanecero enterrados. Neste sentido, o trabalho de Hefferline e Keenan (1963), mencionado na seo 8.5 animador porque fornece o tipo de neutralidade terica que promete esclarecer esses problemas e reabrir a discusso sobre as respostas encobertas, to audaciosamente intro duzida por Watson h mais de meio sculo.

REFERNCIAS PARA O CAPITULO 12 Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New York: Appleton-Century-Crofts, 1957. Chapter 1 2 . Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a small-scale (covert) operant. J. exp. Anal. Behcv., 1963, 6 , 307 315. Jacobson, E. The electrophysiology of mental activities. Amer. J. Psychol ., 1932, 44, 677-694. Kelleher, R., and Gollub, L. A review of positive conditioned reinforce ment. /. exp. Anal. Behav., 1962, 5, 543-597. Lee, B. J. Effects of delayed speech feedback. J. acoust. Soc. Am er., 1950, 22, 824-826. M cCarthy, Dorothea. Language development. In L. Carmichael (E d .), Manual of child psychology. New York: Wiley, 1954. M ax, L. W. Experimental study of the motor theory of consciousness. IV. Action-current responses in the deaf during awakening, kinaesthetic imagery and abstract thinking. J. comp. Psychol., 1936, 24, 301-344. M ichael, J. Laboratory studies in operant behavior. New Y ork: McGrawHill, 1963. Pierrel, Rosemary, and Sherman, J. G. Train your pet the Barnabus way. Brown Alum ni M onthly, Feb. 1963, pp. 8-14. Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938. W atson, J. B. Behavior, an introduction to comparative psychology. New York: Holt, 1914. W atson, J. B. Is thinking merely the action of language mechanisms? Brit. J. Psychol, 1920, 11, 87-104.

- 269-

QUARTA PARTE
CONTINGNCIAS COMPLEXAS

13. AQUISIO DE CONCEITO 14. SOLUO DE PROBLEMAS E INTELIGNCIA

Captulo 13 AQUISIO DE CONCEITO

Os princpios elaborados nos captulos precedentes permitem-nos descrever e classi ficar uma grande parte do comportamento aprendido de organismos animais e humanos. Mas se terminssemos nossa avaliao do comportamento com as operaes aquisio simples, discriminao, diferenciao, encadeamento, reforamento secundrio e generali zao, seriamos, ento, forados a admitir que a parte principal do comportamento humano complexo permaneceu intata. As atividades que podem ser classificadas como comporta mentos humanos complexos so, naturalmente, muito diversas. Uma caracterstica que todos eles parecem compartilhar, todavia, uma afiliao ntima com a linguagem. De fato, uma implicao dos captulos precedentes de que a existncia e o uso da lin guagem talvez seja o nico atributo comportamental do homem que o distingue dos seus parentes inferiores. Embora possamos concordar que o comportamento inicial de lingua gem seja adquirido atravs do processo de aproximao sucessiva e que as palavras tor nam-se S^s, o significado da linguagem, contudo, parece estar alm dos conceitos derivados de animais no laboratrio. O prprio termo significado apresenta numerosos problemas de definio. Mas, os aspectos do comportamento humano a que se refere constituem fenmenos bastante reais. Alm disso, claro que qualquer cincia do com portamento que pretenda ser amplamente compreensvel deve, eventualmente, dirigir-se para a descrio desses fenmenos. No podemos ignorar os comportamentos humanos complexos simplesmente porque eles so pobremente especificados. Na verdade, a prin cipal razo pela qual eles so to pobremente especificados que eles aguardam uma descrio em termos de uma linguagem geral, compreensivae rigorosa. Assim, a descrio destes comportamentos complexos em termos da estrutura conceituai de fenmenos comportamentais simples resultaria, simultneamente, na sua compreenso e esclareci mento. No presente captulo, portanto, estendemos a anlise comportamental para o campo do comportamento humano complexo. Escolhemos como nosso ponto de partida a rea conhecida como formao de conceito. So tantas as atividades caracteristicamente humanas que tm sido relacionadas a conceitos pensamento, compreenso, significado de palavras, raciocnio, soluo de problema que podemos estar certos de que, se se pudermos estabelecer um contato experimental aqui, estaremos numa posio favorvel para nos dirigir a uma anlise de muitas formas de comportamento humano complexo. Iniciamos com uma considerao de um tipo de comportamento, desenvolvido no

- 273-

laboratrio animal, que compartilha de certas propriedades importantes com o comporta mento humano conceituai. Novamente, este comportamento de laboratrio surge de uma configurao de operaes familiares de aquisio, extino, discriminao e generali zao. Devido a suas relaes com comportamentos simples e complexos, ele parece representar uma ligao importante entre as duas classes. A simplicidade relativa dos fenmenos de laboratrio ajudar-nos- identificar o termo conceito com certas caracte rsticas precisas de comportamento. Uma vez tenhamos compreendido esta palavra-chave, alguns experimentos simples com sujeitos humanos, onde os aspectos especiais da lingua gem no so utilizados, iro elaborar ainda mais a lgica geral do comportamento con ceituai Finalmente, guiados pelos nossos paradigmas experimentais, poderemos explorar brevemente os comportamentos humanos complexos associados com termos tais como compreenso, significado, instruo, percepo e (no prximo captulo) soluo de pro blemas. 13.1 DISPOSIO PARA APRENDER (SIMPLES) No captulo 10 (Discriminao), notamos que uma classe de discriminao compre endia duas situaes e duas respostas e descrevemos os aparelhos experimentais prprios para o estabelecimento de tais contingncias. Um desses aparelhos, o Wiscosin General Test Apparatus, foi mostrado na Fig. 10-5. No WGTA, pode-se apresentar a um macaco ou outro primata vrios objetos numa bandeja mvel, sendo que debaixo de um desses objetos encontra-se um recipiente contendo um amendoim. Suponha que sejam usados dois objetos: uma cruz de madeira macia e um objeto em forma de U, tambm de madeira macia. O amendoim sempre encontrado debaixo da cruz, quer ela aparea direita ou esquerda. As duas contingncias possveis podem ser diagramadas como 1 [13.1] R E -* S + e Rd ^
2

s+

onde a contingncia 1 representa a cruz esquerda e a contingncia 2 representa a cruz direita. Uma resposta incorreta (isto , R q em 1, o u Re em 2) leva remoo da bandeja. Depois de um pequeno intervalo, uma das contingncias novamente colocada em efeito. Uma resposta correta (isto , Rg em 1, ou Rj) em 2) produz um amendoim (S+). Aps um pequeno intervalo, uma das contingncias novamente estabelecida. Chamemos de uma tentativa uma nica apresentao, pelo experimentador, de uma ou outra das situaes e contingncias de fl3 :l|.C o m o que sabemos sobre discriminao, podemos estar certos de que, dado um nmero de tais tentativas, ocorrer um processo comportamental. Durante as primeiras tentativas, o comportamento do animal no estar sob o controle da cruz e, logo, Rs incorretas ocorrero: R p em 1 e/ou Rg em 2. Eventualmente, todavia, a medida que mais tentativas so realizadas, o comportamento do animal, gradualmente, passa a ficar sob o controle da localizao da cruz. Uma vez que este processo gradual, dezenas ou centenas de tentativas, dependendo da espcie e de diferenas individuais, podem ser necessrias para se atingir um valor assinttico de aproximadamente 100 por cento de respostas corretas .

1 no decorrer deste captulo, Rg, R e Rq referir-se-o a pegar o objeto esquerda,


no centro e direita.

- 274-

At agora, descrevemos apenas um conjunto de contingncias de discriminaes de 2S 2R. Denominemos um nico conjunto de tais contingncias (como em [13.1]), um problema de discriminao. Suponha que, uma vez o processo de discriminao tenha atingido sua assntota, apresentemos uma nova srie de congingncias. Escolhemos o novo problema de modo que ele difira das contingncias anteriores apenas em relao aos objetos usados como seus 2 Ss; por exemplo, uma esfera de madeira macia e um cone de madeira invertido. O problema, com exceo disso, idntico. Qual ser a natureza deste novo processo de discriminao? De fato, muito semelhante ao primeirc processo. C animal comea desempenhando pouco melhor do que se e s p e r a r^ pelo acaso. Mas, even tualmente, ele passa a escolher o objeto correto (agora a esfera) todas as tentativas. Uma inspeo mais detalhada destes dois processos pode revelar, todavia, um desloca mento ligeiramente mais rpido em direo assntota, no segundo caso. Esta comparao de dois processos sucessivos de discriminao sugere um interes sante delineamento experimental geral. Evidentemente no estamos limitados a um. dois, ou mesmo alguns de tais problemas de discriminao. Podemos continua a apre sentar novos problemas, um depois do outro, enquanto pudermos encontrar objetos diferentes e nossa pacincia aguentar. Felizmente para o ltimo fator, descobrimos que, medida que apresentamos mais e mais problemas, os processos de discriminao tornam-se apreciavelmente mais rpidos. Embora dezenas a centenas de tentativas possam ter sido necessrias para se chegar ao desempenho assintticonos problemas iniciais, talvez menos de meia-dzia de tentativas sejarn necessrias para um desempenho sem erro quando 100 discriminaes tiverem sido aprendidas. Eventualmente, depois de vrias centenas de problemas, descobrimos um resultado notvel. O macaco, agora, capaz de solucionar qualquer problema deste tipo, imediatamente. Se, por acaso, ele escolhe c objeto correto na primeira tentativa, ele continua, da em diante, a escolher o objeto correto. Sc, por acaso, escolhe o objeto errado na tentativa 1, ele inverte o padro de resposta imediatamente e escolhe o objeto correto da tentativa 2 em diante. Em ambos os casos, o desempenho do macaco quase sempre perfeito a partir da tentativa 2. De fato, a apresentao de uma longa srie problemas semelhantes erradicou o processo gradual de discriminao. Ficamos com um animal que soluciona novas discrimi aes imediatamente. . O exemplo precedente ilustra o desenvolvimento de uma disposio para aprender (leaming-set ou L-setj, um paradigma geral estudado extensivamente e assim denominado por H. F. Harlow. A Fig. 13-1 mostra mais precisamente os resultados obtidos do proce dimento de disposio para aprender em macacos rhesus. Cada curva da Fig. 13-1 a mdia de um nmero de processos de discriminao. Os processos so apresentados apenas nas tentativas de 1-6. A chave logo abaixo do grfico diz exatamente que dis criminaes so representadas por cada curva. A Fig. 13-1, ento mostra com detalhes as mudanas mdias na forma dos processos de sicriminao sucessivas. O processo de discriminao de 1-8 gradual e em forma de / e claro que a sua assntota se encontra alm da sexta tentativa de aqirsio. O processo mdio para os problemasde 9-16 menos gradual; a curva mais inclinada e atingir sua assntota mais rapidamente. Os processos subsequentes so ainda mais inclinados, at o problema 232, depois do que no h um processo propriamente dito. H somente o resultado: na tentativa 2 o macaco quase sempre acerta. 1
- 275 -

4 Tentativas

H i m ii

Discriminaes |-8 ------------- 33-132 9-16 ------------- 133 -232 17- 24 *+++++ + 23 3 -2 8 8 25-32 ------------- 2 8 9 -3 4 4

I igura 13.1. Mudanas cm blocos sucessivos de processos de discriminao de 2S 2 R. As curvas so os resultados mdios de oito macacos, mas podemos supor que sejam representativas de um nico sujeito (segundo Harlw, 1949).

este resultado comportamental de se apresentar sucessivamente contingncias de discriminao semelhantes uma habilidade adquirida para solucionar qualquer um de uma classe de problemas de discriminao semelhantes com eficincia mxima que usualmente descrito como uma (L-set). A natureza adquirida de tal habilidade sugere que ela pode ter um processo caracterstico prprio. E, realmente, a curva que descreve o desenvolvimento do I^set pode ser derivada da Fig. 13-1, se usarmos o desempenho na tentativa 2 como um ndice do seu desenvolvimento. A eficincia mxima para solucionar este tipo de discriminao seria indicada pelo desempenho sem erro na tentativa. 2. Deve ficar claro que o desempenho na tentativa 1 no pode ser acima de 50 por cento correto. De imediato, o macaco no tem uma base para discriminar qual dos dois novos objetos o correto e, assim, ele apanhar o objeto correto ao acaso. A Fig. 13-2 mostra o nvel de desempenho na tentativa 2 em funo do nmero de problemas previamente apresen tados. A figura ento, uma descrio conveniente do processo de aquisio do L-set. Um aspecto importante do processo visto na Fig. 13-2 o seu carter gradual e contnuo.
Assim, a habilidade para solucionar um problema de discriminao numa tentativa adquirida atravs de um processo gradual.

- 276 -

N mero mdio de discriminaes anteriores. 1'igura 13-2. Um processo de disposio para aprender (L-set), derivado dos dados da Fig 13-1., baseado no desempenho da tentativa 2.

Ao contrastar o processo de discriminao da Fig. 13-1 e o processo de L-set da Fi<: 13-2, note que na discriminao, a varivel independente: o tempo em relao qual o comportamento muda com a exposio prolongada a um procedimento constante chamada de tentativa. No processo de L^set, por outro lado, a varivel independente: tempo em relao qual o comportamento muda chamada de problemas. Note tambm que o resultado de cada processo individual da Fig. 13-1 chamado uma discriminao; mas o resultado do processo da Fig. 13-2 um I^set a habilidade de solucionar um tipo de discriminao imediatamente. No devemos supor que a disposio para aprender seja restrita ao tipo particular de discriminao descrito em nossos exemplos. Nas discriminaes das Figs. 13-1 e 13-2, o comportamento gradualmente colocado sob o controle de um entre dois objetos o objeto que cobre o amendoim reforador na tentativa 1. Mas a noo geral de um L-set consiste de uma habilidade adquirida para solucionar discriminaes de uma determinada classe ao primeiro contato. Assim, o colocar o comportamento sob o controle do maior entre dois objetos, o objeto verde ou o de forma triangular entre dois objetos, constitui outros Insets de 2S 2R simples que podem ser convenientemente estabelecidos por um procedimento semelhante a este descrito. Em geral, podemos supor que o procedimento de l^set aplicvel sempre que fr possvel se estabelecer um conjunto de problemas de discriminao relacionados. Aps o animal ter sido exposto a um subconjunto desses problemas, ele pode adquirir a habilidade para solucionar todos eles. Se tentarmos formular o paradigma da (L-set), descobriremos que ele possui um PROCEDIMENTO PROCESSO RESULTADO Uma srie de discriminaes relacionadas apresentada no organismo; : Os processos individuais de discriminao gradualmente mudam sua forma de lenta e gradual para rpida e abrupta; : Discriminaes novas, mas relacionadas, so resolvidas com o mximo de eficincia.

- 277 -

O termo Uset normalmente empregado com referncia ao resultado deste paradig ma. 13.2 ALGUMAS VARIVEIS QUE INTERFEREM NA AQUISIO DA DISPOSIO PARA APRENDER (L-SET) Harlow (1959) fez um resumo das pesquisas sobre a formao do L-set nas quais usou vrias espcies de organismos, incluindo crianas. As crianas testadas nesses proce dimentos tipicamente superam chimpanzs e macacos no desempenho geral mas elas tambm apresentam um processo contnuo de aquisio do L-set. Os primatas inferiores na escala filogentica ao macaco rhesus micos e saguis, por exemplo mostram um processo de aquisio de Uset mais gradual que o descrito na Fig. 13-2. Mesmo depois de 1000 ou mais problemas, a assntota de seus processos de L-set significativamente mais baixa que o desempenho perfeito. Outros animais, como ratos e gatos, mostram um aumento da inclinao nos processos sucessivos de discriminao, mas nunca alcanam resultados sofisticados no Lset dentro dos limites dos experimentos que tm sido executados. Todavia, recomendamos cautela ao se concluir que L-sets verdadeiros so uma habilidade privilegiada dos primatas, em vista das dificuldades metodolgicas em se estabelecer ordena omparveis de problemas de discriminao para animais i n f e r i o r e s O num ero de tentativas destinado para cada problema afeta nitidamente a aquisio do L set Uma vez que os processos iniciais de discriminao so os mais graduais, um grande nmero de tentativas necessrio nos primeiros problemas para que o comportamento atinja um determinado critrio, digamos um desempenho 70 por cento correto. medida que so dados mais problemas, o processo de discriminao acelera-se e menos tentativas so necessrias para se chegar quele mesmo critrio. Esta diferena foi considerada ao se obter as curvas da Fig. 13-1. Para os primeiros problemas realizaram-se 50 tentativas e para os ltimos apenas 6 ou 9 tentativas.E interessante notar, todavia, que mesmo quando poucas tentativas, por exemplo, 6 , so realizadas para todos os problemas, o L-set ainda emerge. Desta maneira, mais problemas, naturalmente, so necessrios para compensar o nmero menor de tentativas por problema. A combinao ideal tentativa-problema tem que ser ainda elaborada. A taxa de L-set uma funo da dificuldade dos problemas sucessivos de discriminao. Harlow manteve todos os problemas na mesma srie uniformemente di fceis. Uma progresso gradual de discriminao fcil para difcil pode produzir o L-set mais eficientemente. 13.3 L-SETS MAIS COMPLEXOS Evitamos usar o termo conceito nas discusses precedentes sobre L-set mas parece natural perguntar se podemos dizer, em relao a um organismo, que possui um L-set para o maior de dois objetos, ou para o verde entre dois objetos, que ele possui o conceito o maior de dois ou o verde de dois . Tais especulaes estariam em boa companhia, porque o prprio Professor Harlow levantou a hiptese de que todos m conceitos tais como triangularidade, vermelhido, nmero, e lisura surgem somente da formao de L-set (Harlow, 1959, p. 5 10).

- 278

Adiando, por enquanto, uma definio rigorosa do termo conceito, apenas sugerimos que o conceito adquirido nas Figs. 13-1 e 13-2 o objeto entre dois debaixo do qual havia um amendoim na tentativa anterior . Sua descrio verbal maior que a dos conceitos mencionados por Harlow. Falta uma palavra nica que o identifique, talvez porque as contingncias que compreendem este conceito so raras 110 mundo fora dos laboratrios de comportamento dos macacos. Um exemplo de um L-set mais complexo ser til para esclarecer a relao estreita entre L-set e conceitos. Uma classe importante de L-sets consiste de discriminaes de singularidade . Nes sas discriminaes, um grupo de objetos apresentado. O reforamento contingente escolha de um nico objeto que difira, de algum modo, dos outros objetos do grupo. Tal discriminao pode consistir das contingncias vistas na Tabela 13-1. Estas contingncias contm dois tipos de objetos, seis situaes e trs respostas. Tabela 13-1 UM GRUPO DE CONTINGNCIAS DE SINGULARIDADE SITUAES RESPOSTA REFORADA

S, s2 S3 s< Ss Sr

O A A O A O

A O O A A O

A O A O O A

Re Rc Rd

Uma vez o sujeito primata tenha adquirido a discriminao a um certo nvel do critrio, um novo problema apresentado. Dois novos tipos de objetos so usados no novo problema, mas as contingncias permanecem de tal modo que a posio do objeto singu lar entre os trs novamente correlacionada com o reforamento. Depois de uma srie de vrios destes problemas, o macaco adquire uma disposio para aprender que poderia ser chamada de escolha o objeto singular entre trs. O sujeito bem treinado na ilustrao da Parte Quatro, p. 271 est demonstrando o comportamento tpico desta L-set. O desempenho sofisticado do macaco rhesus alcanado somente depois da apresentao de muitos problemas semelhantes. Estes resultados indicam o grau de sucesso dos proce dimentos de L-set ao colocar o comportamento operante de animais sob o controle de relaes bem sutis existentes nas situaes. Tal controle comportamental em sujeitos humanos frequentemente abase sobre a qual empregamos a palavra conceito . Por exemplo, concordamos que uma criana tem o conceito de propriedade quando ela pode discriminar suas prprias possesses daquelas de qualquer outra pessoa. Dizemos que uma criana tem o conceito de uma frase substan tiva quando ela pode escolher frases substantivas entre sentenas no familiares. Similar mente, creditamos-lhe o conceito de igualdade de nmero quando ela pode identificar quantidades iguais em conjuntos no familiares, por exemplo, quando ela pode equiparar o nmero de contas numa jarra com o nmero de mas em cima de uma mesa. Todavia estas ilustraes so apenas sugestivas. Logicamente, precisamos de uma definio mais
- 279 -

rigorosa de conceito se desejamos examinar em detalhes a relao entre L-sets e concei tos. Ser conveniente, portanto, voltarmos a alguns dos primeiros experimentos sobre formao de conceitos com sujeitos humanos. aqui que encontramos uma tentativa explcita para traduzir a formao de conceitos, em sujeitos humanos, em termos comportamentais, com a questo sistemtica. O que uma pessoa faz quando se diz que ela revela um conceito ? Quando esta questo puder ter uma resposta satisfatria, estare mos em condies de determinar os procedimenos pelos quais estes comportamentos conceituais so adquiridos. 13.4 EXPERIMENTOS SIMPLES SOBRE A FORMAO DE CONCEITO EM SUJEITOS HUMANOS

C.L. Hull (1920) tomou como seu ponto de partida o estudo da formao de concei to a histria atravs da qual uma criana adquire o conceito de cachorro . Uma criancinha encontra-se numa certa situao, reage a ela aproximando-se e ouve dizer que isto se chama cachorro. Depois de um perodo indeterminado de intrveno, ela encontra-se numa situao algo diferente e ouve dizer que aquilo se chama cachorro . Mais tarde, encontra-se numa situao ainda algo diferente e ouve dizer aquilo tambm se chama cachorro . Assim o processo continua. As experin cias de cachorro aparecem em intervalos irregulares (Hull, 1920, p. 5). Como um resultado dessas experincias , surge um momento em que se diz que a criana possui o conceito de cachorro. A interpretao dada por Hull a este conceito foi uma caracterstica mais ou menos comum a todos os cachorros e incomum a gatos, bonecas e ursinhos (Hull, 1920, p. 6 ). Se um conceito consiste de uma caracterstica comum a um grupo diverso de situa es, deve ser possvel estabelecer condies de laboratrio para estudar como o compor tamento passa a ficar sob o controle das caractersticas comuns de um grupo de situa es. Como elementos para seus conceitos experimentais, Hull escolheu os 144 caracteres chineses vistos na Fig. 13-3. A nao familiaridade destes caracteres para seus sujeitos, universitrios americanos, assegurou que nenhum dos conceitos experimentais havia sido previamente adquirido. De modo a produzir grupos de situaes contendo uma carac terstica comum, selecionaram-se grupos de caracteres contendo certos elementos comuns. Note, por exemplo, que na Fig. 13-3 todos os caracteres na fileira 1 contm em suas estruturas, de um modo geral diferentes, o trao comum em forma de escova. Em geral, cada carter numa determinada fileira horizontal est relacionado a todos os outros nessa mesma fileira por possuir algum elemento comum. No experimento, os caracteres foram combinados em grupos (colunas verticais da Fig. 13-3) de modo que cada grupo continha um e somente um dos caracteres com um elemento comum parti cular. Mostrava-se, ento, aos sujeitos, os caracteres do grupo 1, um de cada vez e pedia-se-lhes que dessem a resposta de identificao verbal de acordo com o que se v na coluna esquerda da Fig. 13-3. O nome correto era pronunciado pelo experimentador poucos segundos depois da apresentao de cada carter. A tarefa do sujeito era nomear o carter antes que o experimentador o fizesse. A primeira tentativa, naturalmente, era diferente, pois permitia que o sujeito tomasse conhecimento do grupo de identificadores verbais. Quando o critrio de duas tentativas perfeitas era alcanado, isto , quando o sujeito nomeava corretamente todos os caracteres do grupo 1 duas vezes numa fileira, os
- 280 -

Elemento comum

Identificador verbal
yer

Grupo 1 2 3 4 5 6

72 caracteres teste

oo r # H s (*& & & & & & & & & M & & M & .X f i fa to M #

deg -ET
Img i A :

mm&wQer
fe ^ rL .3 ? :

chun vo na

Mrn fR&f
X \$ * &

M & &J % M M ;m a
% & Z t t f i i H m u m
m w k

Figura 13-3. Os 144 caracteres chineses usados por Hull para estudar a aquisio de conceito. So mostrados para cada srie a resposta de identificao verbal e o elemento comum (Hull, 1920).

caracteres do grupo 2 eram apresentados at que todos fossem identificados, ento os do grupo 3 e assim sucessivamente, at o grupo 6 . Uma vez que o sujeito tivesse aprendido a identificar estes 72 caracteres chineses (6 grupos x 12 caracteres por grupo), o experimentador fazia um teste de generalizao. Ele apresentava os restantes 72 caracteres, mas no mais pronunciava o identificador. Seria o sujeito capaz de identific-los, mesmo iunca os tendo visto antes? Hull descobriu que os sujeitos identificaram corretamente mais de 70 por cento destes novos caracteres. De fato, os sujeitos frequentemente faziam identificaes corretas, embora fossem incapazes de verbalizar a regra para a incluso numa classe particular. No experimento de Hull, cada membro de uma dada classe de S tinha um certo trao em comum. Smoke (1932) salientou que os conceitos no mundo real raramente, se alguma vez, consistem de uma classe de situaes com elementos comuns explcitos. A formao de conceito, geralmente, envolveria uma resposta sob o controle de relaes comuns a um grupo de padres de estmulo. Considere, por exemplo, as figuras da Fig. 13-4 geradas por uma relao bastante artificial sugerida por Smoke. Todas as figuras esquerda da Fig. 13-4 so membros da classe de S^ denominada dax , enquanto que nenhuma das figuras direita da Fig. 134 dax. A regra para dax um crculo e dois pontos: um ponto dentro do crculo e outro fora. Smoke descobriu que sujeitos humanos adquiriam rapidamente o comportamento generalizado de categorizar outros padres como dax , mesmo quando seu nico treino discriminativo anterior consis tisse da apresentao de algumas figuras dax e no dax apropriadamente indicadas e com instrues para se observar as diferenas. Embora fossem frequentemente incapazes
-28 1 -

Figura 13-4. Amostras de S ^ s e S s dax (de Kimble e Garmezy, segundo Smoke, 1932).

de verbalizar a regra para a incluso na classe, os sujeitos, mesmo assim, podiam identi ficar corretamente novas figuras dax que no tinham visto antes. Nos experimentos de Hull e de Smoke, diz-se que os sujeitos adquirem certos con ceitos. Podemos agora perguntar de que modo estes experimentos demonstram a aprendi zagem de conceito: 1. Tanto no experimento de Hull como no de Smoke, os sujeitos adquiriram a habilidade de dar um rtulo verbal comum para qualquer membro de uma classe de situaes. 2 . O comportamento adquirido generaliza-se para novas situaes s quais o sujeito no havia sido exposto antes. 3. A classe de situaes determinada por alguma relao comum um trao ou uma regra geomtrica complicada. Partindo desses dados, somos levados a duas concluses sobre o comportamento de conceito. Primeiro, diz-se que um organismo revela um conceito quando ele pode identi ficar qualquer membro de um conjunto de situaes relacionadas. Segundo, o organismo adquire esta habilidade atravs de uma histria explicita de reforamento (ou instrues fundamentadas numa histria de reforamento prvio) na presena de um subconjunto das situaes. E stam o s agora em condies de ver a relao do paradigma do L set c o m a f o r m a o de c o n c e i t o . O p r o c e d i m e n t o de L s e t simplesmente uma maneira sistemtica de ordenar a histria de reforamento que conduz ao comportamento de conceito. Embora os macacos no falem, o comportamento que eles ad q uirem com os p ro c e d im e n to s de Lset parece precisamente anlogo ao que os sujeitos humanos fazem, em experimentos sobre formao de con ceito, usando respostas verbais. O macaco escolhe o objeto singular de um grupo de objetos que ele pode nunca tervistG anteriormente. O homem escolhe o dax entre um grupo de padres que ele pode nunca ter visto anteriormente. Na vida real, parece que raramente adquirimos nossos conceitos atravz da progresso ordenada de um problema relacionado para outro, a seqncia caracterstica das disposies para aprender. A criana na escola, em casa e no parque adquire seus conceitos concorrentemente e muito mais casualmente do que em quaisquer arranjos de procedimento no laboratrio. Todavia, quando ela pode identificar um novo cachorro como um cachorro, ou uma nova situao social como aquela que requer boas manpiras , ela est se empenhando em comportamentos do tipo produzido pelos vrios procedimentos que descrevemos.
- 282-

Note que o termo conceito, como descrito, no se refere a uma coisa. Como discrimi nao, condicionamento e extino, o termo refere-se a certos fatos comportamentais e certas relaes entre comportamento e ambiente. A palavra conceito denota o fato comportamental de que uma determinada resposta* est sob o controle de uma classe relacionada de SDs. Um corolrio interessante dessa definio que ela no separa um conceito de uma discriminyo. Podemos lembrar qiie uma discriminao (Resultado) um nome para o fato comportamental de que um passa a controlar uma resposta operante. Mas sabemos que a generalizao toma impossvel descobrir um caso perfeito de discriminao onde apenas um controla a resposta. 0 treino discriminativo prolon gado pode limitar a classe de eventos ambientais qe estabelecem a ocasio gara a resposta, mas a classe permanece uma classe. Se tivssemos sido treinados para dizer amarelo na presena de um certo comprimento de onda da luz a probabilidade da resposta amarelopermaneceria alta quando pequenas mudanas fossem feitas no comprimento de onda. Tais resultads, que indicam a persistncia da generalizao mesmo aps um longo treino discriminativo, expressam as limitaes na capacidade do organismo de fazer dis criminaes infinitamente refinadas. Se um conceito tambm se refere a uma classe de S^s que controlam a emisso de uma resposta, em que ele difere de uma discriminao? Evidentemente, a diferena apenas de grair nos seus limites, a distino vaga e arbitrria. Logo, plausvel se falar ou do concr.tc de amarelo ou da discriminao de amarelo. O emprego da palavra nurti caso particular ser determinado meramente pela extenso da classe de S ^ s controla dores. Se a classe de S^s parecer relativamente pequena, chamamos o comportamento uma discriminao; se parecer relativamente ampla mais provvel chamarmos o compor tamento de um conceito. Embora a noo de extenso per se seja muito imprecisa para permitir uma distino rigorosa entre conceitos e discriminaes com base nos comportamentos observados, ela sugere que a distino entre os dois pode ser feita em termos de procedimento. Suponha que estivssemos interessados em treinar um organismo a fazer discriminaes cada vez mais refinadas entre um determinado tringulo (S^) e todos os outros tringulos. Nosso procedimento consistiria em apresentar tringulos gradualmente mais semelhantes ao tringulo S^, sem liberar o reforamento na sua presena. Com efeito, melhoramos a discriminao ampliando a classe de s experimentados. Na formao do conceito de triangularidade, por outio lado, apresentaramos e reforaramos respostas a tringulos semelhantes ao tringulo original, aumentando, assim, a classe de SD. Isto justamente o que Hull fez oara oo , Smoke fez para dax e Harlov fez para a singularidade. Todas essas variantes de procedimento servem gradualmente para estabelecer a agregao de S^s que controlam uma determinada resposta, seja o comportamento dc dizer oo , de dizei dax ou de selecionar o objeto singular. Os procedimentos para formao de conceitos c discriminaes iniciam-se similarmente, com reforamento na presena de um nico S^, mas eles divergem da em diante para alcanar seus efeito diferentes. O treino discrimi nativo limita a classe de S^s controladores, enquanto a formao de conceito amplia a classe de S^s controladores. A frase de Keller e Schoenfeld (1950) discriminao inter classes e generalizao intra-classes adequada para resumir a caracterstica comporta mental de um conceito e nos lembra os processos que participaram na sua evoluo.

13.3 ESTUDOS SOBRE FORMAO DE CONCEITO EM AN1MAS De acordo com a anlise apresentada at aqui, um conceito representa o controle adquirido de um conjunto de situaes relacionadas (Ss) sobre uma determinada res posta. Na seo precedente, sugerimos que o mtodo geral para estabelecer este controle era o uso anterior de um subconjunto de Ss como SDs num paradigma de discriminao. Esta descrio est de acordo com os procedimentos de treinamento especfico de Harlow e Hull que apresentaram uma srie de contingncias de discriminao relacio nadas. A descrio tambm est de acordo com o procedimento de Smoke, na medida em que supusermos que suas instrues permitiram que seus sujeitos se administrassem um treino discriminativo com os padres de S^ e S A das figuras geomtricas que lhes foram apresentadas. Esses trs experimentos representam apenas uma pequena amostra dos procedimentos de treinamento que satisfazem a definio de um procedimento de aquisio de conceito. Existem vrias maneiras de se arranjar uma histria de discriminao com um subconjunto dos membros de uma classe ampla de Su s relacionados. Na pre sente seo, consideraremos alguns desses procedimentos adicionais, chamando a aten o, ao mesmo tempo, para a variedade de conceitos que tm sido estabelecidos ao nvel infra-humano. Kelleher (1958) reforou presses chave telegrfica em chimpanzs famintos (num esquema probabilstico p= 0,01 de reforamento alimentar) apenas quando certos padres visuais estavam presentes num arranjo de 3 x 3 de pequenas janelas de plexiglass acima da chave. Outros padres foram associados com contingncias de extino para a presso chave. No treinamento do conceito, 13 padres de SD e 13 padres de foram apresentados numa seqncia aleatria. A Fig. 13-5a apresenta uma amostra de trs dos padres de SD e trs dos padres de S & . Os registros cumulativos de resposta abaixo desses padres mostram um desempenho tpico alcanado aps um treinamento extensivo neste procedimento. As trs amostras dos padres de mostram que a classe de Su foi limitada pela regra trs janelas inferiores iluminadas . O comportamento da

dois problemas de conceito. Os quadrados escuros correspondem a janelas iluminadas Os tras obliquos representam mudanas de um estmulo para outro. Os padres e as respostas cm S^so indicadas por (+ );o s padres e respostas em S ^ so indicados por ( ) ( Kellenher, 1958).
- 284 -

Fig. 13-5a representa uma discriminao estvel j avanada, com as respostas limitadas principalmente s ocasies, em que os padres de estavam presentes. Em (b), foi feito um teste para o comportamento de conceito, utilizando-se 6 padres de no fami liares e 6 novos padres de S ^ na seqncia de estmulo, sem alterar as contingncias de reforamento. Trs de cada um dos novos padres so vistos na Fig. 13-5b. Como os registros cumulativos na Fig. 13-5b mostram, o comportamento no foi perturbado, indicando que a formao de conceito foi obtida. O comportamento estabelecido poi uma histria de discriminao anterior com um subconjunto de estmulos foi generali zado para novos membros da classe de Como no exemplo de Hull com os caracteres chineses, esses padres de da Fig. 13-5a e b tm elementos comuns iluminao das trcs janelas inferiores. Um resultado um pouco diferente foi obtido quando o experimentador tentou desenvolver um con ceito baseado no nmero de janelas iluminadas. Os padres de estmulo na seo superior da Fig. 13-5c, ilustram as contingncias de treinamento do segundo conceito. Aqui, a classe de limitada pela regra iluminao de trs janelas . Por outro lado, os padres de S^' contem duas ou quatro janelas iluminadas. Os registros cumulativos da Fig. 13.5c indicam a excelente discriminao alcanada no treino, usando-se a seqncia de 13 padres de SD e 13 padres de . Todavia, quando 6 novos padres de e S A foram introduzidos (Fig. 13-5d), o desempenho deteriorou-se nitidamente. Um nmero substan cial de respostas ocorreu na presena dos novos padres de SA , enquanto se observou uma diminuio no nmero de respostas na presena dos novos padres de S^. O teste crtico para o comportamento de conceito falhou porque no se demonstrou que o responder do animal estava sob o controle geral da classe de trs janelas acesas . Este resultado negativo serve para enfatizar o critrio para a existncia do comporta mento de conceito. Depois de se estabelecer o controle discriminativo de uma R com um subconjunto dos membros de uma classe de S, procuramos ver se o controle discrimi nativo se generalizou de modo a incorporar os membros restantes da classe de S. Os exemplos descritos nas sees anteriores preencheram o teste requerido; da, sua designao como comportamento de conceito. Isto no aconteceu com o segundo proble ma de conceito de Kelleher (Fig. 13-5d). Da, conclumos que o segundo problema resultou apenas numa discriminao, no num conceito. Todavia, h 9!/3!/6! ~ 84 padres de possveis de acordo com a regra trs-janelas-acesas, e possvel que o treino com um subconjunto com mais de 13 padres de fosse bem sucedido no estabelecimento do conceito (Ferster, 1964). conveniente comparar o procedimento do experimento de Kelleher com o para digm a de Lset p o rq u e am bos p re te n d em ser paradigmas de conceito. No procedimento de disposio para aprender, o subconjunto de cada c SA s arranjado em termos de problemas" cada um dos quais contendo algumas contingncias repetidas. Um novo problema geralmente no apresentado ate que o anterior tenha sido adquirido de acordo com o critrio. No procedimento de Kelleher, todo o subconjunto de cada e apresentado num nico problema . Mas seria fcil re-delinear o ex p e rim e n to de Kelleher, moldando-o na forma de L-sets, atravs do uso de uma srie de problemas de discriminao de 2S ---- > IR. Para o conceito 1 , podemos apresentar p r im e ir o Problema 1:

versus


- 285-

at que o ndice de discriminao tenha atingido algum valor arbitrariamente alto. Ento apresentaramos

Problema 2:

versus

S2A

e assim sucessivamente. Nosso teste da aquisio do conceito feito, automaticamente, com o incio de cada problema porque neste momento o organismo se defronta com S^s e SA s nunca visto antes. Poucos experimentos sistemticos tm sido realizados para testar qual a combinao de todos os possveis procedimentos treina mais eficientemente o comportamento de conceito. O paradigma da disposio para aprender tem a virtude de proporcionar um;i curva da aquisio de conceito (ver Fig. 13-2) que uma estimativa do grau dt* obteno do conceito em qualquer momento durante o experimento. Mas deve ficar claro que, na vida real, aprendemos nossos conceitos de maneira similar dos chimpanzs de Kelleher para quem vrias combinaes de S^s e S ^ s apareceram em ordem aleatria. O fato de os chimpanzs no terem adquirido o conceito de tres-janelas-acesas sugere que o tamanho do subconjunto dos membros de usados no treino uma varivel imporatnte na aprendizagem de conceito. Isto parece estar bem documentado. Andrew e Harlow (1948)treinaram macacos a discriminar um nico tringulo de um crculo. Os macacos foram subsequentemente testados em vrias situaes diferentes que incluam mudanas na orientao do tringulo original, assim como novos tringulos de tamanhos e ngulos diferentes. Os macacos apresentaram pouca indicao de terem formado o conceito tringulo com a sua histria com um nico membro da classe de tringulos. No estudo de Hull com os caracteres chineses, um grupo de sujeitos aprendeu a identifi car apenas trs grupos de caracteres, ao invs dos seis usuais. Para contrabalanar sua exposio a um nmero menor de grupos, os sujeitos tiveram duas vezes mais tentativas nestes trs grupos. Apesar disso, os sujeitos dos trs grupos mostraram um desempenho muito pior ao identificar os caracteres que nunca tinham visto. Dentro de limites, parece que a formao de conceito depende diretamente do nmero ou variedade de S^s empregados no treino. A tcnica experimental conhecida por escolha de acordo com o modelo proporciona um conjunto de contingncias de discriminao bem apropriado para o estudo do com portamento de conceito em animais, o comportamento de escolha de acordo com o modelo estudado convenientemente em pombos, usando um aparelho contendo trs discos para bicar, cada um dos quais pode ser transiluminado por cores ou padres.Para o estudo de escolha de matiz, a seqncia de eventos est descrita esquematicamente pela Fig. 13-6. Durante o treino preliminar, as duas chaves laterais so ocasionalmente ilumi nadas com luzes de cores diferentes. O bicar uma ou outra chave , ento, reforado. Quando o bicar est seguramente sob o controle das chaves laterais iluminadas, a cadeia de comportamento pode ser ampliada. As chaves laterais so apagadas e apenas a chave central fica iluminada com uma luz colorida (Fig. 13-6, parte superior). Quando a chave central iluminada bicada, ambas as chaves laterais so iluminadas e a chave do centro apagada. Uma das chaves laterais algumas vezes a esquerda, outras vezes direita apresentar o mesmo matiz que a chave do centro apresentou no momento anterior (Fig.
-2 8 6 -

i O

r- t
P adro na chave c e n tra l a t q u e o anim al o ligue

E sco lha d ire ita

E scolha e s q u erd a

Reforamento se a escolha for correta. Ca so contrio, um breve time-out de todas as contingncias. Figura 13-6. A seqncia de eventos na escolha de acordo com o modelo. A iluminao est indicada pelas chaves pontilhadas ou com linhas transversais.

13-6, centro). O bicar a chave lateral que tem o mesmo matiz reforado. Uma escolha incorreta, todavia, seguida pelo apagar de todas as luzes e time out de todas as contingncias por alguns segundos. Aps o reforamento ou o time-out , a luz central acende-se novamente e uma nova tentativa inicia-se. Experimentos com dois ou trs matb.es indicam que o pombo pode ser treinado a escolher matizes de acordo com o padro com uma preciso acima de 90 por cento (Comming e Berryman, 1961). Nenhum experimento tentou ainda estabelecer um conceito geral de escolha usando muitos matizes e muitos padres. Para estabelecer o conceito geral de escolha, o comportamento de bicar a chave lateral teria que ser colocado sob o controle de qualquer padro apresen tado imediatamente antes na chave central. Quando tais escolhas so feitas com padres nunca vistos no treino, podemos dizer que o comportamento revela um conceito geral de escolha. A escolha apenas um de um nmero de conceitos relacionados sutis que podem ser estudados experimentalmente atravs desta tcnica de trs chaves. Nas contingncias indicadas pela Fig. 13-7, requer-se um conceito algo mais complicado. O animal deve bicar a figura que est girada de 90(- no sentido anti-horrio, em relao figura padro. O estabelecimento destes conceitos em animais, no laboratrio, est ainda no estgio preliminar. H razo para se esperar que sua produo aguarde combinaes adequadas dos procedimentos familiares dc aquisio, discriminao e aproximao sucessiva e no quaisquer novos princpios de comportamento.
- 287-

OIO
p -.l ^ ' ' ^ " " ^ p --1

+ d

Figura 13-7. Estmulos para o estabelecimento do conceito relacionai de ro tao de 90^ em sentido anti- horrio. O + indica a chave onde a bicada ser reforada (Goldiamond, 1966)

Que tais conceitos no esto, provavelmente, alm do alcance do pombo sugerido por uma demonstrao interessante feita por Herrnstein e Lovland (1964). Estes pesquisa dores treinaram pombos a bicar uma chave plstica por alimento apenas quando uma placa translcida prxima chave estava iluminada. Os pombos adquiriram rapidamente a discriminao de bicar quando a placa estava acesa e no bicar quando estava apagada. No procedimento final, a placa foi iluminada com projees de slides coloridos de 35 mm contendo fotografias de ambientes naturais, incluindo campo, cidades, rios, rvores e campinas. Cada slide era apresentado por cerca de um minuto. Em metade dos slides, havia pessoas em vrias posturas e posies e essas projees eram as ocasies para o reforamento intermitente do bicar a chave. Os outros slides no continham pessoas e eram SA s para o bicar a chave. Centenas de slides diferentes foram apresentados durante vrios meses de treino com essas contingncias. Eventualmente, os animais passaram a iimitar suas bicadas s ocasies em que os slides com pessoas eram projetados. Quando um novo grupo de slides foi apresentado, os animais continuaram a bicar predominan temente quando havia pessoas presentes, embora nunca tivessem visto estes slides antes. Uma vez que os slides que continham pessoas variavam bastante no nmero de pessoas mostradas, suas roupas, se estavam perto ou longe, se adultos ou crianas, pode-se dizer que os pombos estavam demonstrando um conceito sofisticado de pessoa . Mesmo s ocasies em que os pombos erravam eram interessantes. Eles ocasionalmente bicavam quando os slides mostravam objetos frequentemente associados a pessoas tais como casas, barcos e automveis. 13.6 CLASSES ARBITRRIAS DE SD: CONCEITOS DISJUNTIVOS Nas sees anteriores, sugerimos que, quando o comportamento de organismos est sob o controle discriminativo de membros de uma ampla classe de S^s, esses organismos esto demonstrando um comportamento conceituai. Indicamos vrios tipos diferentes de histrias de discriminao que permitem estabelecer-se tal controle complexo. Nos con ceitos discutidos, as classes de controlador podem ser descritas como um conjunto de estmulos ligados por uma relao comum de arranjo espacial ou estrutura topolgica. Assim, no importando o quo nico seja cada animal que constitui a classe de

- 288-

gato , cada membro desta classe compartilha de certas relaes fsicas em comum com todos os outros membros. 0 mesmo verdadeiro para os caracteres chineses agrupados no conceito oo , as figuras dax etc. Em geral, estas relaes comuns caracterizam os nossos conceitos de objetos tais como casa , livro, mesa e a letra impressa E. Em outros conceitos como maior que , proveniente de , direita de / um membro de* e conduz a , as relaes comuns que ligam todos os S^s no so a estrutura espacial mas outros tipos de relaes que so identificadas pelas prprias respostas verbais que elas ocasionam . Assim, maior que uma resposta verbal que identifica a relao compartilhada pelos membros da classe de controlador. Deveria ficar claro que os conceitos relacionais so muito difundidos. Apesar disso, frequentemente pode-se observar que o comportamento est sob o controle de amplas classes de estmulos cujos membros parecem no ter relaes comuns de estmulo. No existe, por exemplo, uma relao bvia de estmulo fsico nos S^s para alimento . Uma cenoura, uma ervilha, uma folha de espinafre e um copo de leite aparecem como objetos extremamente diversos. Levando-se em conta apenas suas caractersticas visuais, uma ervilha parece-se mais como uma bola de gude do que com uma folha; uma cenoura parece-se mais com um basto do que com um copo de leite. Uma heterogeneidade semelhante encontra-se nos cristais brancos de iodo, no bromo lquido vermelho e no gs incolor conhecido como cloro que constituem, parcialmente, a classe halogneo. O conjunto de situaes apresentadas na Fig. 13-8 controla o comportamento de parar, embora elas tenham pouca semelhana entre si.
a

Figura 13-8. Situaes de estmulo fisicamente diferentes que controlam a mesma resposta rparar (Goldiamond, 1966)

Evidentemente, a diversidade nos membros de uma classe ampla de SD no prejudica sua capacidade de controlar uma resposta semelhante. Podemos demonstrar experimentai- 289 -

mente o controle apresentado por uma classe de ampla, mas heterognea, comum p ro ced im en to de L set. Se trein arm o s um m acaco a escolher ou o tringulo ou a esfera entre dois objetos e nunca apresentarmos um tringulo e uma esfere juntos, o comportamento do macaco ficar sob o controle de tringulos ou esferas Alm disso, o controle se generalizar para novos tringulos e novas esferas. Aqui, a classe de SD controlador consiste de duas subclasses muito diferentes. Os membros triangulares so agrupados devido sua relao geomtrica comum e os membros esfricos tambm. Mesmo assim, falta uma relao comum entre tringulos e esferas. Estendendo o procedimento para diversos SDs adicionais, podemos ampliar a classe de SD do macaco para uma lista indefinida de objetos heterogneos. Se mantivermos os novos elementos de SD no relacionados aos antigos, no haver razo para se esperar que o macaco generalize para qualquer S novo que decidirmos incluir na classe. Os exemplos das classes heierogneas dc S^ do cotidiano e o comportamento do macaco citado no ltimo pargrafo ilustram o que conhecido como conceito disjuntivo. Os membros da classe de S^ ou tringulos ou esferas, ou cenouras ou ervilhas, ou espinafre ou leite...; ou um guarda de trnsito no cruzamento ou u m a luz vermelha e assim por diante. Em cada caso, uma resposta est sob o controle de uma ampla classe de S^s e, portanto, preenche um dos critrios importantes do comportamento de conceitos. Contudo, a falta de uma nica relao comum, algo que una todos os membros da classe, impede a generalizao a novos membros, o que tpico de outros conceitos. A dificuldade em se incluir novos membros de uma classe de S ^ disjuntivo na base da generalizao pode ser uma das razes pelas quais se diz, algumas vezes, que a humani dade abomina conceitos disjuntivos (Bruner, Goodnow e Austin 1956). Felizmente, muitas vezes possvel encontrar uma relao subjacente entre os membros de uma classe disjuntiva de S^ que pode fornecer a base para a generalizao. Por exemplo, os alimentos, embora diferentes em aparncia, tm a propriedade comum de serem substn cias que so ingeridas pelos organismos vivos e transformadas em constituintes vitais do corpo. Similarmente, o bromo, cloro e iodo tm a propriedade comum de se combinarem com metais, formando sais cristalinos brancos que, de fato, so intimamente relacionados um ao outro. Nestes e em muitos outros conceitos disjuntivos, uma relao subjacente revelada atravs de uma operao comportamental que transforma os membros de uma classe de SD, originalmente heterogneas e diversos, em um novo conjunto de membros homog neos e semelhantes. Essas situaes novas tm uma relao comum e esta relao fornece a base para a generalizao normal. Algumas vezes, a operao requerida simples. Para descobrir se certa substncia um alimento , precisamos apenas inger-la e esperar pela situao transformada resultante. Para descobrir se alguma substncia nova um halogneo, deixamo-la reagir com o sdio e verificamos se um sal cristalino branco halogenado produzido. Frequentemente, pode ser difcil reduzir classes disjuntivas em conceitos relacionais subjacentes. Uma parte significante da atividade cientfica consiste em se tentar fazer operaes em eventos superficialmente diferentes na esperana de transform-los em situaes que so de fato semelhantes. Grande parte deste livro se dedica elucidao de relaes subjacentes descobertas nos eventos comportamentais que, superficialmente, parecem muito diferentes. Por exemplo, um animal bicando um disco e um estudante opinando apresentam uma relao subjacente. A procura de relaes subjacentes , de modo algum, limitada cincia. Considere a
-2 9 0 -

longa tentativa de se descobrir o padro absoluto para a arte ou a msica. Tal padro, se pudesse ser encontrado, seria uma regra para relacionar as ocorrncias extremamente diversas do que identificamos como boa arte ou boa msica. O fracasso em se encontrai tais regras pode nos forar, na exasperao, a concluir que boa msica aquela que os crticos, dizem ser boa; ou, para citar uma ilustrao da psicologia, diz-se, algumas vezes, que a inteligncia o que os testes de inteligncia medem . Ningum descobriu ainda uma operao para ser realizada em pinturas ou composies musicais que proporcio nasse um conjunto de situaes em que o genial e o medocre fssem inequivocamente distintos. O conceito de genialidade permanece disjuntivo., Quando parar tambm retem uma certa arbitrariedade. No existe uma operao para transformar os diversos elementos da Fig. 13.8 em elementos que apresentem uma relao de estmulo comum. A classe feita pelo homem e a escolha dos elementos de estmulo arbitraria. Por esta razo, no h uma base para a generalizao quando um novo S introduzido. Tudo o que se pode fazer testar cada novo exemplo medida que aparece determinando-se a incluso da classe apenas pelas contingncias de reforamento. Tal classe estabelecida de um modo similar aquele atravs do qual formamos, no macaco, o conceito de tringulo-ou-esfera. Em ltima anlise, a nica relao comum a todos os tipos de conceitos disjuntjvos que seus membros diferentes controlam a mesma resposta. Alguns conceitos disjuntivos, por exemplo, alimento e halogneos, tm uma propriedade alm, de modo que seus membros diferentes podem ser transformados e apresentarem uma relao subjacente comum. Outros conceitos disjuntivos tais como a boa msica a inteligncia podem ter uma relao subjacente; outros ainda, tal como o conceito experimental tringulo-ouesfera , permanecem ihteiramente arbitrrios e dissimilares. 13.7 S IG N I F I C A D O E C O M P R E E N S O INTERRELAES ENTRE CONCEITOS C O N S ID E R A D O S COMO

O significado de uma palavra (resposta verbal) h muito tido como relacionado formao de conceito, mas a ausncia de uma estrutura sistemtica para descrever os conceitos tem dificultado uma anlie exata da relao. Ao discutir como uma criana desenvolve o conceito de cachorro, Hull equacionou a formao de conceito com a noo de significado. Uma criana sabe o significado de cachorro quando pode, apropriada mente, identificar novos objetos como objetos cachorros. Podemos concordar que o emprego apropriado de uma resposta verbal para identificar os membros de uma classe de SD do conceito parte do que tido como saber o significado de uma resposta verbal. Ao equacionar significado com comportamento discriminativo, sentimos que est fal tando algo. Considere o conceito de leite. Ser que concordaramos que uma criana sabe o significado de leite quando pode identificar corretamente garrafas de leite, copos de leite e leite derramado? Pode-se dizer que a criana sabe um pouco o significado de leite se tudo o que ela pode fazer identificar membros da classe de S^, mas somos inclinados a concluir que sua compreenso do conceito no muito profunda. Analogamente, um chimpanz pode^ser treinado a escolher os tringulos entre qualquer grupo de objetos, mas poucos psicologos empregariam termos como significado ou compreenso ao descre ver o comportamento observado. Significado e compreenso so, todavia, coisas que tentamos ensinar nas escolas. Mesmo a cincia e a arte, algumas vezes, procuram por eles.

Logo, conveniente perguntar que comportamentos a mais podem estar envolvidos quando se diz que um organismo sabe o significado de, ou comprenede um conceito. Precisamos primeiro examinar a noo de que um organismo pode adquirir um conceito que, por sua vez, formado de dois ou mais conceitos. Usando a nossa termino logia, uma resposta (verbal ou outra qualquer), pode ser controlada por uma ampla classe de SD que, por sua vez, pode ser dividida em duas ou mais classes de S^, cada uma controlando sua prnoria resposta particular. Considere, por exemplo, o conceito de gelo , cujo equivalente gua gelada . A classe de SD para gelo , evidentemente, a interseo do conjunto de objetos congelados (C) e o grupo de objetos gua (A). Gelo ento, representado pela regio sombreada no diagrama Venn de [ 13.2| .

[13.2]

Poucos dos nossos conceitos cotidianos so to simples como indica esse diagrama, mas a maoria dos conceitos adquiridos pelos organismos humanos podem ser analisados em termos de outros conceitos. Assim, um operante o < conjunto de respostas>que est sob o < controle de > suas <conseqncias>. Uma enseada uma < poro de gua>< protegida>, com< ancoradouros>. Pai o < progenitor> do <sexo masculino>. Podemos mesmo inventar tais conceitos, como no exemplo tigleo =o <filho> de um <tigr^>< macho> e um <leq> ^ fm ea^ Muitos desses conceitos so formas generalizadas de

conceito como um conceito c o n ju n t iv o . A natureza composta de um conceito conjuntivo sugere uma questo experimental, a saber, se uma histria anterior com seus conceitos componentes afeta a aquisio de tal conceito conjuntivo. Um experimento de Kendler e Vineberg (1954) indica que quando seus componentes so previamente conceituados, um conceito baseado na sua conjuno adquirido mais rapidamente. Neste experimento, cada uma das 32 figuras da Fig. 13-9 foi desenhada num carto e a tarefa dos sujeitos era arranjar aleatoriamente, os 32 cartes em duas classes. As respostas de arranjar foram reforadas com certo ou errado de acordo com a regra a qual diferia para os diferentes grupos de sujeitos. Dois grupos de sujeitos foram reforados para agrupar todas as figuras curvas numa pilha e as figuras retilneas em outra. Um terceiro grupo de sujeitos foi reforado para agrupar todas as figuras acromticas (sem cor) numa pilha e todas as figuras cromticas (coloridas) em outra. Assim, os trs grupos de sujeitos aprenderam primeiro a classifi cao em termos de forma ou cor. Quando isto estava bem aprendido, as regras para o reforamento foram mudadas. Os sujeitos do primeiro grupo eram, agora, reforados para arranjar todas as figuras grandes num grupo e as figuras pequenas em outro, isto , um arranjo pelo tamanho. 0 segundo grupo era, agora, reforado para agrupar por cores e o terceiro grupo para arranjar todos os tringulos e crescentes num grupo e todos os crculos e quadrados em outro. No fim desse treinamento, todos os grupos haviam1
- 292-

Pequeno

Grande

Acromtica

5 G

C ores o-

c c c
curvas

ei

A c A n A

C ro m tica ^ *

c? * d

circulo

A
trigio

c m A
curvas F o rm a retiln eas

crescente quadrado

circulo crescente quadmdo tm ngub

rctiln ea s

F igura 1 3-9c As 32 figuras usadas p o r K endler e V in eb erg (1954) p a ra e s tu d a r a aq u isio d e c o n c e ito s co n ju n tiv o s.

aprendido dois conceitos, como se v na primeira e segunda coluna de conceito na Tabela 13-2. No procedimento terminal, todos os sujeitos foram reforados para arranjar os cartes em quatro grupos: curvos pequenos, curvos grandes, retilneo pequeno, retlineo grande. Tal arranjo feito na base de conceitos conjuntivos que consistem de conceitos de tamanho e forma. O grupo 1 aprendeu este arranjo final mais rapidamente que o grupo 2, que por sua vez, foi mais rpido que o grupo 3. Os autores concluiram que a taxa de aquisio do conceito conjuntivo est diretamente relacionada ao nmero de conceitos componentes aprendidos previamente. Tabela 13-2 AS CONDIES DE TREINO USADAS POR KENDLER E VINEBERG (1954) PARA ESTUDAR A AQUISIO DE CONCEITO CONJUNTIVO Primeiro Conceito Grupo 1 Grupo 2 Grupo 3 Segundo Conceito Terceiro Conceito

Forma Forma Cor

Tamanho Cor A C vs O

Tamanho e forma Tamanho e forma Tamanho e forma

Na tarefa final do conceito, no experimento de Kendler e Vineberg, dois conceitos componentes (tamanho e forma) foram relacionados, por conjuno, para formar um novo conceito (tamanho-forma). A conjuno , todavia, apenas uma das muitas maneiras em que os conceitos podem estar relacionados e uma anlise de tais relaes inter-conceito e mais pertinente para o significado ou a compreeno de um conceito. Argumentamos anteriormente, nesta seo que uma criana que podia identificai exemplos do conceito de leite, ou o macaco que podia pressionar uma barra sempre que fosse apresentado um tringulo, no exibiram todo comportamento necessrio para que
- 293-

pudssemos dizer que eles estavam demonstrando compreenso. O tipo de comporta mento adicional que parece ser requerido est representado esquematicamente na Fig. 13-10 para o conceito de leite. A Fig. 13-10 explicada como se segue. Cada um dos crculos do diagrama refere-se a uma classe de S^s do tipo descrito previamente. Assim, a criana, para quem pode-se dizer que a Fig. 13-10 tem uma estrutura significante, pode identificar garrafas deleite copos de leite, leite derramado, e assim por diante. Mas ela pode tambm identificar (com respostas verbais diferentes) vacas de vrios tipos, cereais de um tipo ou de outro, queijos, sorvetes e leiteiros. Se ela for uma aluna de ginsio que estuda nutrio, ento, ela poder ser capaz de identificar o soro, a nata e o clcio. Mas, igualmente importante, o organismo humano sofisticado pode dar uma identificao relacionai para uma situao composta que consiste de um S ^ para o leite e um de qualquer outra classe de S^ indicada. Esta habilidade conceituai est indicada pelas linhas entre os crculos com as proposies que descrevem a relao. Cada proposio relacionai, todavia, tambm um conceito; na verdade, o tipo de conceito que encontramos frequentemente nas sees anteriores. O treino requerido para os conceitos relacionais como proveniente de e um componente de precisamente anlogo ao treino dado ao macaco quando conceitos como o singular , o mais alto, 90 graus de rotao foram adquiridos. Dizemos que uma criana sabe o significado, ou tem uma compreenso mais completa de leite quando ela pode identificar as relaes entre os membros da classe de SD que formam o leite e os membros de vrias outras classes de S ^

F ig u ra 13-10. U m a rep re sen tao esq u e m tic a do c o n c e ito de leite e suas relaes com vrio s o u tro s co n ceito s.

Deve ficar claro que a representao estrutural de significado da Fig. 13-10 est isolada artificialmente. De fato, mostramos apenas as relaes entre um nico
- 294 -

conceito e um grupo de outros negligenciando as interrelaes dos conceitos perif ricos com os outros e com todos os conceitos que o organismo' revela. Uma representa o completa do repertrio conceituai de qualquer indivduo seria uma tarefa insupe rvel, embora uma amostra limitada de conceitos e suas interrelaes possa ser, possivelmente, descrita,(Reitman, 1965, R. Quillian, manuscrito no publicado). A Fig. 13-10 uma maneira grosseira de representar os vrios graus de com preenso. Quanto mais densas as interconexes e maior o nmero de classes de que possam ser unidas, mais facilmente diremos que um individuo compreende um con ceito. A compreenso que uma criana tem de leite difere daquela do administrador da leiteria ou do especialista em nutrio, principalmente no nmero menor de conceitos aos quais a criana pode relacionar o leite. Minha compreenso do meu carro incompleta comparada com a do meu mecnico, que pode relacionar a palavra carro a milhares de outras classes de incluindo, em particular, o que chamamos as partes do veculo. Contudo, sua compreenso pode terminar com a mecnica da mquina. Um caso interessante proporcionado pelo fsico que pode ser capaz de analisar conceitos tais como frico, acelerao, trabalho e energia a um nvel muito mais bsico que o mecnico poderia. Mas quando seu carro no d a partida, o fsico no estar preparado para repar-lo, a menos que possua conceitos tais como feixe de mola, vela de ignio, cilindro, distribuidor e suas vrias interrelaes. As interrelaes entre os conceitos, para qualquer indivduo, depende da histria passada deste indi vduo: as contingncias para o chofer de automvel esto ligadas a certos conjuntos de situaes, as para o mecnico a um outro e para o fsico ainda a outro. As diferenas entre seus repertrios conceituais sugerem uma distino de nvel embora, frequen temente seja muito difcil estabelecer, na prtica, os nveis relativos de conceitos. Numerosos autores estudaram uma ou outra relao entre conceitos na tentativa de esclarecer, em geral, a estrutura relacionai entre os conceitos. Muitos de nossos prprios conceitos mostram uma estrutura hierrquica interessante (Welch, 1947; Brown, 1958 a, b). Isto , o conceito cachorro, por exemplo, pode conter como seus membros poodles, dalmatas, ces de caa.
S eres A n im ad o s V egetais A nim ais In a n im a d o s

Peixes

Aves

Q u ad r p ed es

[13.3]
C avalos C oelhos | C ach o rro s]

D alm atas

P oodles

T erriers

O cach o rro do o u tro la do da ru a

-2 9 5 -

terriers e assim por diante. Mas Prncipe, meu dlmata tambem um conceito com pleto. Considere todas as situaes em que podemos usar a palavra Principe para identifica-las: o Principe em casa, o Principe fora de casa caando gatos Principe acor dado etc. A estrutura hierrquica se estende a ambas direes o Principe no apenas um cachorro - um quadrpede , um animal e um ser animado (Brown, 1958a). Eviden temente, as classes de S ^que formam os nossos conceitos podem ser ou conjuntos con tendo outros conceitos ou subconjuntos de outros conceitos. Por exemplo, ver o dia grama 13.3 . Adquirir um repertrio verbal que colocar um conceito no seu lugar apropriado numa hierarquia uma parte importante do que queremos dizer por com preender um conceito. n E por responder s interrelaes entre conceitos, ou classes de Su que as respostas de linguagem tm uma vantagem especial sobre outras formas de comportamento. Para ensinar uma criana que o leite proveniente das vacas, no necessrio trazer uma amostra de leite e uma vaca para a criana e reforara escolha do leite sob uma srie de contingncias anlogas s contingncias da escolha do acordo com o modelo que usamos com o pombo. Se a criana j adquiriu os conceitos < vaca >< leiteiros > e< proveniente de > , isto , ela emprega as palavras vaca, leiteiros e proveniente de , nas situaes apropriadas, podemos tratar diretamente com o comportamento verbal. Podemos, primeiro, fornecer uma deixa verbal e, ento, reforar a sentena composta: o leite proveniente das vacas . A nica vantagem da linguagem que, ao contrrio de barras, chave e botes, ela proporciona um repertrio de resposta porttil que o organismo pode carregar alm das situaes originais em que o comportamento foi modelado. Alm disso, quando as respostas de linguagem de um organismo podem ser colocadas sob o controle discrim in ativo das situaes arbitrrias que constituem a palavra impressa, ou as palavras faladas de um segundo organismo, esta vantagemi adquire ainda mais fora. Mas essa grande flexibilidade no controle e emisso do sistema de comportamentos que chamamos de linguagem pode ser tambm uma desvantagem por apresentar a possibilidade de aquisio de cadeias verbais sem o amplo controle de SD ambiental colateral caracterstico de conceitos. Uma criana pode adquirir o que chamamos verbalism os vazios. John Dewey, um conhecido teorista da educao, da gerao de Thorndike, uma vez perguntou a um grupo de crianas escolares o que elas encontrariam se cavassem profundamente a terra. Foi recebido com olhares vazios. A professora rapidamente, explicou a Dewey que ele havia feito a pergunta de modo errado. Qual o estado do centro da terra? ela perguntou. A resposta veio em coro: Fuso gnea . Aqui, uma seqncia verbal estava sob o controle discriminativo das palavras faladas por um segundo organismo (a professora), mas parece que nenhuma criana seria capaz de identificar qualquer dos membros das classes de SD <Jusq> ou < gnea>, ou relacionar o conceito <centro da terra>com <cavar na superficie>. Estas so as diferenas principais entre o que muitos educadores chamam de memorizat de cor e aprendizado significativo. Muitas crianas aprendem o Juramento Bandeira sem compreender sequer uma palavra dele; isto , sem serem capazes de identificar exemplos dos conceitos representados pelas vrias palavras do Juramento. A presente anlise ajuda a esclarecer o papel da definio na linguagem. Considere a definio familiar de um operante = uma resposta que est sob o controle de suas conseqncias. Tal definio uma proposio de um conceito composto constitudo de < resposta > < sob controle de > e < conseqncias - Os estudantes, algumas vezes, tentam adquirir a cadeia verbal do lado direito do sinal de igualdade, pre

- 296-

parando-se para serem apresentados com apenas o termo do lado esquerdo, num teste. Mas muitos instrutores tm expectativas maiores. Uma definio dita ser com preendida quando pode ser analisada gramaticalmente, isto , decomposta em seus conceitos componentes. Se esta anlise efetuada sucessivamente, conceito por con ceito, eventualmente, atinge-se um ponto onde os componentes do conceito original so reduzidos a conceitos simples, em vez de compostos. Cada um desses conceitos simples so podem ser especificados, fazendo-se uma lista de algumas das situaes reais do ambiente que constituem sua classe S^. Neste nvel,diz-se, algumas vezes, que o conceito primitivo. Ilustramos esse tipo de anlise conceituai na Fig. 13-11. Esta figura, como a Fig. 13-10, apenas uma outra maneira de se representar a estrutura parcial do significado. Parece que o grande poder de uma definio est na sua habilidade de codificar um grande nmero de conceitos e suas interrelaes numa nica unidade de comportamento verbal. A definio tpica seria um exemplo muito complexo do tipo de conceito estudado por Kendler e Vineberg. As notas nesta seo fornecem um indcio do que est faltando nas anlises expe rimentais do comportamento de conceito nas sees anteriores. Nestas, os pesqui sadores, ao treinarem seus animais atravs da L set ou de outros procedimentos de conceito, tm tentado estabelecer apenas um nico conceito. De modo a simular a forma mais simples de compreenso, pelo menos trs conceitos
Operante = [Resposta] | S ob o controle de | ss [conseqncias]

A classe dc jco m p o i | ^ cst^ sb cn- Urr [:estmulo| que segue uma resposta r trole de P quando Quma funo de P J Qualquer coita que um organism o | faz | Correr Saltar Dizer da Uma unidade d o | ambientef

Uma j descrio | fsica das energias presentes a qualquer controlar o comportamento do orgaaismo tempo dado capaz de

O telefone alimento perto de Joo apresentado a *oca um pombo

Trs objetos numa bandeja, diretamente em frente de um macacc

Figura 12-11. Uma analise parcial da definio da palavra Operante em alguns dos seus conceitos componentes. Os conceitos comportamentais importantes esto dentro dos quadvados c alm disso so analisados.

- 297 -

parecem necessrios: duas classes independentes de e uma classe a mais de que conteria, entre seus elementos, situaes compostas consistindo de um elemento de cada uma das duas primeiras classes de S^. Isso seria equivalente a dois conceitos e um conceito relacionai unindo seus membros. A tecnologia comportamental precisa ainda ser desenvolvida ao ponto de se poder colocar um nmero de comportamentos sob o tipo de controle ilustrado pelas Figuras 13-10 e 13-11, mas um progresso nessa direo est ilustrado no comportamento do macaco nos dois quadros da Fig. 13-12. No quadro inferior, o macaco est escolhendo um objeto de forma entre trs e seu comportamento est parcialmente sob o controle da cor da bandeja. Quando esta cor mudada, como no quadro superior da Fig. 13-12, o macaco escolhe o objeto de cor diferente entre os mesmos trs objetos. Aqui, dois conceitos relacionais foram desen volvidos pelos procedimentos de disposio para aprender: Singularidade de forma e singularidade de cor e ambos esto sob o controle discriminativo da cor da bandeja. Mas mesmo estas demonstraes so pequenas para simular as interrelaes complexas caractersticas da compreenso . Nestes e em outros experimentos com animais descritos neste captulo, apenas um repertrio limitado de resposta desenvolvido. Parece que a anlise experimental das relaes de conceitos requer o desenvolvimento de repertrios de resposta mais amplos que tenham um papel anlogo ao do compor tamento verbal do organismo humano. 13.8 A AQUISIO DE CONCEITO ATRAVZ DA INSTRUO PROGRAMADA Uma parte da seo anterior foi especulativa por necessidade, uma vez que a tecnologia comportamental ainda no alcanou um estgio onde uma avaliao detalha da da aquisio de conceito complexo e da interao de conceito possa ser feita em organismos inferiores. Esperamos suplementar nossa informao experimental sobre a aquisio de conceito atravs da anlise da aprendizagem humana mas, quando nos voltamos para o lugar onde a aprendizagem humana de conceito mais sistemtica supostamente ocorre, a escola, encontramos muitas generalizaes amplas mas poucos princpios. Todos so a favor da aprendizagem significante e contra a memorizao de cor. Conceitos, concorda-se universalmente, so o que queremos ensinar e no fatos vazios . Mesmo assim, poucos negariam que, enquanto muitas crianas adquirem os conceitos bsicos que so os objetivos dos seus cursos na escola muitas outras no o fazem. Isto dificilmente seria devido falta de material conceituai, pois t) currculo escolar est impregnado de uma variedade de conceitos isolados. Considere alguns exemplos adaptados de Brownell e Hendrickson (1950): nao, governo, constituio cidado (estudos sociais); lei, elemento, im, feagente, clula, osmose, massa, cido, ion/cincia); eroso, latitude, regio, mapa (geografia); voz, tempo, flexo, sentenas, pargrafo (linguagem); diviso, frao, expoente, equao, nmero base (aritmtica); escala, tom, clave, intervalo, harmonia (msica). Entre esta diversidade de material conceituai seria surpreendente se no consegussemos aproveitar algo de um exame crtico de como estes conceitos so ensinados. Infelizmente, existe, uma dificuldade dupla: (1) Nenhum mtodo tradicional de ensino garante a aquisio de conceito, e mesmo assim ( 2 ) algumas crianas parecem adquirir conceitos, independente de qual seja o mtodo. Isto mostra a impossibilidade de se extrair dos mtodos tradicionais de ensino as condies necessrias e suficientes para produzir a aquisio de conceito. Os mtodos apropriados para as classes heterogneas no permitem um controle adequado

- 298 -

SpSdo1 3 <,cT,Jw'O lK ,,n " rlM 9,C 0 m P l S "P " '"l" 'n W* U ~

- 299-

das contingncias individuais de reforamento para assegurar o desempenho desejado em cada organismo As implicaes deste fato levaram B. F. Skinner (1954, 1958, 1961) a considerar as possibilidades de um mtodo que permitiria um controle melhor das condies de aprendizagem de cada estudante individual. Skinner props que se programasse as contingncias envolvidas no ensino das matrias cm pequenos passos sistemticos e se fornecesse reforamento imediato para os comportamentos corretos. Skinner notou que os mtodos tradicionais no garantiam a resposta do estudante. Ao ministrar uma aula para o estudante, ao lhe dar como tarefa a leitura de um livro ou mesmo com a ajuda de material audiovisual sofisticado como aulas televisionadas, o professor no tem meios de estar seguro de que o estudante est ouvindo ou lendo cuidadosamente. Em termos comportamentais, diramos que o professor no tem meios de estar seguro de que o aluno est respondendo ativamente.

Figura 13-13. Uma mquina de ensinar. O estudante Ir o quadro e escreve sua resposta. I.nto. move uma barra para descobrir a resposta correta e compar-la u resposta secunde' Skinner, 195R).

- 300 -

As contingncias programadas dc Skinner supunham implicitamente os tipos de habilidades intelectuais adquiridas nas escolas, e tradicionalmente vistas como idias, compreenso, interesses, associaes, conhecimento e assim por diante, eram compor tamentos operantes complexos. Assim sendo sua aquisio e manuteno deveriam seguir todas as leis de comportamento que j descrevemos. Mas o ensino programado, baseado nos princpios de aproximao sucessiva, discriminao, etc., exige uma ateno mais sistemtica para as contingncias individuais do que as salas de aula tradicionais permitem. Skinner props uma soluo para este problema sob a forma de uma mquina para apresentar seriadamente o material de ensino e para estabelecer as contingncias de reforamento para o comportamento. A mquina tem trs aspectos essenciais. ( 1 ) O material apresentado para o estudante em pequenas pores discretas, chamadas quadros, (2) Este material estabelece a ocasio para algum operante discriminativo por parte do estudante, tal como escrever uma palavra ou sentena, preencher uma lacuna ou escolher uma resposta. (3) O comportamento emitido reforado imediatamente, apresentando-se a resposta correta to logo o estudante tenha respondido e permitindo-lhe avanar para o prximo quadro. Uma dessas mquinas usadas por Skinner vista na Fig. 13-13. Nesta verso, os quadros esto escritos num disco rotativo, e um quadro dc cada vez aparece no centro da janela. Depois de ler o quadro, o estudante escreve sua resposta numa tira de papel exposta atravs de uma abertura direita. Ele, ento, levanta uma barra que h na frente da mquina, movendo o que ele escreveu sob uma cobertura transparente e revelando a resposta correta na janela central. Os quadros individuais so organizados em pequenos passos seqenciais. O estudante pode progredir no seu prprio ritmo atravs da sucesso de quadros, chamada um programa, cometendo muito pouco erro. Mas a apresentao de progu.mas desse tipo no se limita apenas a mquinas. Os aspectos crticos pequenos passos seqenciais, resposta ativa e reforamento ime diato - podem ser organizados na forma de um livro. Uma amostra de um texto programado encontra-se, neste livro, no Captulo 4. Muito tem sido escrito a respeito dos mritos e possibilidades da instruo programada. A elaborao de um programa e uma arte delicada e quando um programa est perfeito o professor programador poder entrar em contato com um nmero indefinido de estudantes individuais atravs de contingncias ntimas de reforamento. Apesar da sua natureza individual que prossegue lenta e metodicamente, procurando estar seguro de que cada ponto compreendido antes de passar para o prximo. O teste e reviso repetidos de um programa em estudantes individuais at que ele seja bem sucedido em ensinar o que pretende, uma caracterstica da programao que. com freqncia, falta completamente nos mtodos tradicionais de ensino. Essas vanta gens da instruo programada podem bem ser a base para elevar a qualidade dos mtodos mais convencionais de ensino. Quando h um programa apropriado para ensinar os conceitos bsicos, o professor fica l ivre para discutir pontos sutis, levar os estudantes soluo de problemas criativos e para treinar as habilidades adquiridas atravs da mquina num contexto algo mais relacionado com a vida. A programao est ainda num estgio inicial para que possamos estimar com exatidb o quo radicalmente ela ir mudar nossas prticas educacionais. De qualquer modo, nosso interesse atual no este. Estamos interessados no programa como um veculo experimental para a aquisio de conceitos. conveniente classificar o contedo verbal .que constitui um quadro em dois tipos
- 301 -

de proposies: regras e exemplos (Evans, Holme e Glaser, 1962). Uma regra pode ser considerada como uma especificao geral ou definio de uma classe de SU, enquanto um exemplo pode ser considerado como a ocorrncia de um dos membros da classe de SD. Uma instruo programada pode ser encarada como um arranjo de vrias regras e exemplos, onde algumas pores de cada regra ou exemplo so omitidas, sendo necessrio, ento o comportamento por parte do aprendiz para complet-las. Deve estar claro que uma apresentao de um subconjunto de exemplos associados com um?, determinada regra anloga apresentao de um subconjunto de Ss individuais de uma ampla classe de e o reforamento de uma determinada resposta de identifi cao, digamos, a palavra leite ou a resposta de apanhar o objeto singular. Considere os quatro quadros de um programa para ensinar alguns conceitos de imagem em poesia, vistos na Fig. 13-14. Antes destes quadros, os conceitos de imagem, objeto e similitude foram ensinados atravs de exemplos. Os quadros 48, 49 e 50 so trs exemplos de uma classe de SD que deve ser identificado como smile. Note que cada quadro arranjado de modo a permitir que as deixas contextuais aumentem a probabilidade da resposta requerida. Os trs quadros usados como S^s e para o smile tm certas similaridades, mas tambm certas diferenas. Uma vez que o
Figura 13-14. Quatro quadros dc um programa delineado para ensinar conceitos relativos imagem na poesia ( cortesia de Susan Stitt).

48. Uma imagem que expressa uma similitude entre objetos de classes diferentes, mas que no significa exatamente o que diz, chamado um smile. A imagem a menina como uma flor u m .......................................................................................
Resposta. Smile

49. Pelo fato de expressar uma similitude entre objetos de classes diferentes mas no significar exatamente o que diz, a imagem a face do homem iluminou-se como o sol um ...................................................................................................................... ..
Resposta. Smile.

50. Um smile no introduzido apenas pela palavra como, mas pelas palavras ta! qual, como se ou como quando. Assim, a imagem o homem est vermelho tal qual um pimento um ...............................................................................................
Resposta. Smile.

51. Por outro lado, uma frase que expressa a identidade entre dois objeto mas no significa exatamente o que diz, no um smile. Assim, a imagem seus olhos so estrelas (/no ) um smile.
Resposta. No _____________ _________________________________________

programador deseja que o conceito de smile seja to amplo quanto possvel, as contingncias de reforamento so estabelecidas na presena de uma grande variedade de exemplos da classe de S^. O quadro 51, todavia, um caso de SA . Na aquisio de conceito em humanos e em animais, importante apresentar situaes onde no haja membros da classe de e retirar o reforamento da resposta ou, como neste caso, reforar uma resposta incompatvel. O quadro 51 ajuda a estabelecer o que o smile no .
- 302 -

Outro exemplo de rormao de conceito mostrado no quadro da Fig. 13-15. Posteriormente, neste programa, o estudante encontrar figuras de outros organismos com e sem seis pernas e com muitos outros aspectos que variam. Mas a palavra inseto s ter deixas e ser reforada na presena de figuras de organismos com seis pemas. Eventualmente, o conceito de inseto se generalizar para uma vasta classe de orga nismos com seis pemas atravs desta histria com um subconjunto dos membros. Ainda outro exemplo no campo da anlise comportamental fornecido nos quadros da Fig. 13-16. O conceito a ser adquirido o de evento resposta. Note que os quatros fornecem SDs e S ^ s para o conceito. Eventualmente, aparecer num quadro onde se pedir ao aprendiz que induza a definio geral com base na sua histria passada com numerosos exemplos.

Os exemplos de formao de conceito atravs da instruo programada indicam que as noes fundamentais da aquisio de conceito discutidas nas sees anteriores so aplicveis tambm aprendizagem humana. Os exemplos vistos representam ilustraes razoavelmente simples de como o controle de uma resposta verbal (smile, inseto, evento resposta) por uma ampla classe de S^s pode ser estabelecido atravs da apresentao sistemtica de exemplos, com reforamento 1 para a resposta verbal desejada. claro que os conceitos desenvolvidos so conceitos compostos de outros. O smile composto de certas relaes entre os conceitos de objeto, similitude e imagem; inseto a conjuno de organismos e seis pernas evento resposta um composto de ao e agente. Num programa completo, cada conceito a ser adquirido estabelecido atravs de um conjunto de contingncias apropriadas com um subconjunto de seus membros e muitos dos conceitos adquiridos so, ento, relacionados entre si atravs de exemplos compostos apropriados. este entrelaa mento de conceitos que parece ser o carimbo da verdadeira compreenso de um assunto. Ao se programar a aquisio de conceito surgem algumas questes sistemticas relativas ao papel de certas variveis que o programador tem sob o seu controle. O programador pode controlar o nmero de exemplos de e S ^ ; pode controlar sua
1 Note que para sujeitos humanos normais '"obter a resposta 'co rre to ' frequen temente um reforador suficiente. Veja, por exemplo, o programa na seo 4.3.
-3 0 3 -

Figura 13-16. Uma srie de quadres delineados para estabelecer o conceito de eventoresposta. As Rs corretas esto indicadas pelas letras pequenas direita do quadro (Mecliner, 1963).

1 . Seu nascimento no foi um evento-resposta para voc. Voc jogar seu chocalho
fora do seu bero foi um evento-resposta para voc. Marque as respostas abaixo que descrevem um evento-resposta para. a pessoa ou animai nelas indicado (nota: voc pode marcar qualquer nmero de sentenas). a. b c. d. e. Clara pintou o cabelo de vermelho Herman morreu. Joo tem uma crie. Aroldo foi ao dentista. 0 gato miou. a

d e

2 . Quando voc bate em algum, o evento-resposta seu. Quando outra pessoa lhe
bate, o evento-resposta no seu. Para cada sentena abaixo marque o quadrado se a sentena descrever um eventoresposta para o organismo nela indicado. a. b. c. d. e. f3. n n Filipe corre depressa Gregrio foi atropelado. Alice colou no exame. Maria foi pega colando. 0 canrio perdeu todas as suas penas. 0 cachorro pegou o doce no primeiro salto

Marque as proposioes que descrevem eventos-resposta para voc. a. b. c. d. Voc resolveu um problema difcil dematemtica Seu professor lhe deu uma boa nota. Voc um dentista. Voc est estudand.o para ser um dentista. a

4.

A sentena Um gato corre refere-se a um evento-resposta. A sentena Uma pessoa corre refere-se a um evento-resposta. A sentena O carro corre no se refere a um evento-resposta. Marque os eventos-respostas abaixo: a. b. c. d. e. f. g

0 furaco passou ontem aqui (para o furaco) Tom bateu em Harry, (para Tom) Tom bateu em Harry, (para Harry) O relgio bateu dez horas (para o relgio) Voc come uma cenoura (para voc) Um mosquito pica voc (para voc) Um mosquito pica voc (para o mosquito)

- 304-

diversidade e suas seqncias. o desenvolver alguns conceitos diierentes, ele pode escolher um exemplo multidimensional concreto, apresentando-o sob vrios pontos de vista , ou pode usar vrios exemplos mais simples, apresentando cada um sob o nico ponto de vista. H pouca informao sistemtica disponvel a respeito de qualquer destas variveis, mas como um meio experimental que a programao tem potenciais importantes par elucidar relaes fundamentais na aquisio de conceito. 13.9 AS CONSTNCIAS PERCEPTIVAS A noo de uma coisa como uma entidade imutvel est to fortemente arraigada que talvez seja uma surpresa que coisas to primitivas como objetos possam ser descritas como conceitos. Imagine que a face de um amigo no seja um nico estmulo visual. Algumas vezes, ele aparece na sombra, outras na claridade. s vezes, ele est sorrindo, s vezes franzindo as sobrancelhas. Algumas vezes, voc o v de perfil, outras, de frente. Alm disso, perfis e vises frontais so, por sua vez, uma coleo de perfis e vises frontais, nenhum dos quais , alguma vez, exatamente repetido. Apesar do fato de que voc nunca veja a mesma face duas vezes, voc no tem dificuldade para identificar seu amigo. Em linguagem tcnica, seu amigo uma ampla classe de S^s e voc responde similarmente a todos os membros. Considere o objeto mostrado na Fig. 13-17. Todos os quatro desenhos represen tam a mesma porta , contudo, os vrios padres que atingem o olho e que constituem as quatro situaes que chamamos porta , so bastante diferentes. claro que para portas, ou qualquer outro objeto que possamos imaginar, o nosso conceito do deter minado objeto no consiste de uma nica situao, mas de uma ampla classe de situaes. Os exemplos que acabamos de dar so casos do que pode ser denominado constncia do objeto. Apesar das mudanas marcantes na situao, ns retemos uma resposta constante na presena de todas as suas variantes. Que tipo de conceito representado pela constncia do objeto? Tomados in dividualmente, os quatro desenhos da Fig. 13-17 sugerem que o conceito de objeto disjuntivo, j que essas quatro situaes parecem to diferentes. Mas a Fig. 13-17 apenas uma amostra do conjunto infinito de situaes que variam de aberta a fechada, todas as quais controlam a resposta porta. E todas essas situaes esto mutuamente

- = r

Figura 13-17

Quatro membros da classe de S ^ porta (Gibson, 1950)

- 305-

relacionadas pelo fato de que uma situao Aporta pode ser continuamente trans formada em outra. Tal srie de transformaes relaciona as situaes de qualquer objeto particular. A constncia do objeto apenas uma classe do que geralmente chamado de constncias perceptivas. Outro exemplo mostrado atravs dos dois pedaos de carvo colocados sobre o papel branco, na Fig. 13-18. Dizemos que o carvo preto e o papel branco sem levar em considerao a intensidade absoluta de luz que apenas ou o carvo ou o papel reflete. sombra, o pedao de carvo no painel esquerda da Fig. 13-18. reflete somente 1 millilambert de luz, enquanto que o mesmo pedao de carvo luz do sol (painel direita da Fig. 13-18) reflete 100 vezes mais luz. Ainda

Figura 13-18. Um caso de constncia de cor neutra. Um pedao de carvo colocado sobre uma tolha de papel branco (Hochberg, 1964).

assim, dizemos que o carvo preto, embora ele agora reflita 10 vezes mais luz que refletia o papel branco sombra. A resposta cor neutra (cinza) depende da iluminao relativa do objeto com respeito ao seu fundo ou regio imediatamente adjacente. Assim, preto um conceito j que a resposta na presena de uma classe ampla de S^s relacionados: objeto que reflete 1 unidade de luz, fundo que reflete 9 unidades de luz objeto que reflete 10 unidades de luz, fundo que reflete 90 unidades; objeto que reflete 100, fundo que reflete 900; e assim por diante. Um exemplo final proporcionado pelo fenmeno conhecido como constncia de tamanho. medida que uma pessoa caminha em sua direo, voc no capaz de relatar que sua imagem visual est aumentando de tamanho. Contudo, medida que ela se aproxima, a imagem aumenta de tamanho na sua retina, de uma maneira inversamente proporcional sua distncia de voc. Dentro de limites voc diz que ela est do mesmo tamanho, independentemente do tamanho da imagem na sua retina. Desse modo, o conceito de tamanho dependente de uma classe de SD onde a regra para incluso na classe uma funo complexa do tamanho retnico do objeto mais os valores de muitas outras variveis visuais que variam com a distncia de um objeto. A Fig. 13-19 mostra que o conceito de tamanho constante no controlado pelo tamanho retnico constante. Os trs cilindros da Fig. 13-19 so todos os mesmo tamanho (mea-os) mas tendemos a classific-los como progressivamente maiores da esquerda para a direita devido s mudanas na perspectiva linear, uma das variveis que em geral, muda progressivamente com a distncia. Naturalmente, no por acidente que as constancias de objeto, cor neutra e tamanho se desenvolvem. Contingncias de reforamento esto frequentemente correla cionadas com os objetos (um pssaro deve se manter fora de todas as situaes que

- 306 -

Figura 13-19. Resposta ao tamanho quando determinada por variveis de distncia (Gibson, 1950).

chamamos gato, se quiser viver muito), bem como as variveis de estmulo com posto que controlam a constncia de cor acromtica e a constncia de tamanho. Raramente, consideramos que> um objeto est mudando de cor ou tamanho quando sua iluminao ou distncia muda. Por outro lado, conveniente classificar aquele animal que est se movendo rapidamente em sua direo como grande, embora o tamanho de sua imagem seja ainda muito pequeno. Nossos conceitos espelham-se nas contingncias de reforamento da natureza, embora seja uma especulao interessante

- 307 -

saber se esses conceitos perceptivos so geralmente adquiridos na histria passada de cada indivduo ou se, tendo sido bem adquiridos pelos seus ancestrais, so agora uma parte permanente do seu eauioamento de resposta visual. REFERENCIAS PARA O CAPITULO 13.
Andrew, G., and Harlow, H. F. Performance of macaque monkeys on a test of the concept of generalized triangularity. Comp, psychol. Monogr., 1 9 4 8 ,1 9 , 1 -2 0 . Brown, R. H ow shall a thing be called? Psychol. Rev., 1958a, 65, 1 4 -2 1 . Brown, R. Words and things. Glencoe, 111.: Free Press, 1958b. Brownell, W. A ., and Hendrickson, G. How children learn information, concepts and generalizations. In Learning and instruction, 49th Yearb., Nat. Soc. Study Ed., 1950, Part I. Bruner, J., Goodnow, Jacqueline J., and Austin, G. A. A Study of think ing. N ew York: Wiley, 1956. Cumming, W. W., and Berryman, R. Some data on matching behavior in the pigeon. J. exp. Anal. Behav., 1961, 4, 2 8 1 -2 8 4 . Evans, J. L., Homme, L. E., and Glaser, R. The ruleg system for the construction of programmed verbal learning sequences. J. educ. Res., 1962, 5 5 ,5 1 3 - 5 1 8 . Ferster, C. B. Arithmetic behavior in chimpanzees. Sci. Amer., May 1964, 210, 9 8 -1 0 6 . Gibson, J. J. The perception of the visual world. Cambridge: The River side Press, 1950. Goldiamond, I. Perception, language, and conceptualization rules. In B. Kleinmuntz (E d .), Carnegie Institute of Technology annual sym posium on cognition, N ew York: Wiley, 1966. Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56, 5 1 -6 5 . Harlow, H. F. Learning set and error factor theory. In S. Koch (E d .), Psychology: a study of a science, V ol. 2. New York: M cGraw-Hill, 1959. Harlow, H. F., and Kuenne, M. Learning to think. Sci. Amer., 1949, 181, 3 6 -3 9 . ^ Herrnstein, R. J., and Loveland, D. H. Complex visual concept in the pigeon. Science, 1964, 146, 5 4 9 -5 5 1 . Hochberg, J. E. Perception. Englewood Cliffs: Prentice-Hall, 1964. Hull, C. L. Quantitative aspects of the evolution of concepts. Psychol. Monogr., 1920, 28, Whole N o. 123. Kelleher, R. Concept formation in chimpanzees. Science, 1958, 128, 7 7 7 -7 7 8 . Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York: Appleton-Century-Crofts, 1950.
- 308 -

Kendler, H. H. Basic psychology. N ew York: Appbton-Century-Crofts, 1963. Kendler, H. H ., and Vineberg, R. The acquisition of compound con cepts as a function of previous training. / . exp. Psychol. , 1954, 48, 2 5 2 -2 5 8 . Kimble, G. A ., and Garmezy, N. Principles of general psychology. (2nd ed .) N ew York: Ronald Press, 1963. Lysaught, J. P., and Williams, C. M . A guide to programmed instruction. N ew York: Wiley, 1963. Mechner, F. Science education and behavioral technology. New York: Basic Systems, 1963. Reitman, W. R. Cognition and thought: an information processing ap proach. New York: Wiley, 1965. Skinner, B. F. The science of learning and the art of teaching. Harvard educ. Rev., 1954, 24, 8 6 -9 7 . Skinner, B. F. Teaching machines. Science , 1 9 5 8 , 128, 9 6 9 -9 7 7 . Skinner, B. F. Why we need teaching machines. Harvard educ. R e v .t 1 9 6 1 ,3 1 , 3 7 7 -3 9 8 . Smoke, K. L. A n objective study o f concept formation. Psychol. Monogr., 1932, 42, Whole N o. 191. W elch, L. A behaviorist explanation of concept formation. / . genet. P sych o l , 1 9 4 7 ,7 1 ,2 0 1 - 2 2 2 .

- 309 -

Captulo 14 SOLUO DE PROBLEMA E INTELIGNCIA

O TERMO PROBLEMA SURGIU OCASIONALMENTE nas discusses ante riores. lhorndike colocou gatos numa caixa quebra-cabea que continha uma tramela que pode ser aberta atravs de vrios movimentos (Fig. 1-1). Foi dito que os gatos que no tinham uma histria anterior com as contingncias deste aparelho se defrontavam com um problema escapar da caixa. Pode-se dizer, assim, que a aquisio de qualquer comportamento instrumental contem elementos de soluo de problema. Nos pro cedimento de disposio para aprender do ltimo captulo, descrevemos, conjuntos su cessivos de contingncias discriminativas apresentadas durante o treino como uma srie de problemas de discriminao. Os macacos solucionaram estes problemas e como resul tado adquiriram a habilidade para resolver novos problemas similares como uma eficin cia maior. 14.1 A ESTRUTURA DE UM PROBLEMA E A NATUREZA DE UMA SOLUO Os problemas que os gatos de Thorndike e os macacos de Harlow tinham diante de si diferem em vrios aspectos, mas particularmente nas contingncias existentes. As contingncias estabelecidas para os gatos eram predominantemehte diferenciaes e para os macacos, discriminaes. Logo, a notao de um problema no denota qualquer classe particular de contingncias de reforamento. Discriminaes e diferen ciaes podem ser problemas. O fato de se um conjunto de contingncias pode ou no ser interpretado como um problema para um organismo depende dos comportamentos predominantes quando o organsimo se defronta pela primeira vez com a situao problema. Os gatos de Thorndike, evidentemente, defrontaram-se com um problema,na caixa quebra-cabea nas suas primeiras tentativas. Eventualmente, medida que o comportamento que conduzia abertura da tramela era repetidamente reforado, a situao perdia sua caracterstica de problema. To logo os gatos eram colocados na caixa, eles j se encontravam fora dela. Um desenvolvimento semelhante ocorre na formao da disposio para aprender. O macaco com uma disposio para aprender de singularidade bem formada resolve imediatamente, qualquer discriminao nova de singlaridade. A situao de singularidade no pode mais ser descrita como um pro blema para este organismo. Essas idias simples no esto limitadas a grupos de problemas artificiais estabe-

- 311 -

lecidos para animais nos laboratrios de psicologia. Para um aluno de segundo ano primrio 25 -18 constitui um problema, mas um ano ou mais depois isto no ser mais o caso. Similarmente, voc pode no achar que / e ^x dx seja problema, dependendo de se voc possui certos comportamentos usualmente ensinados nos textos do primeiro ano de clculo. No extremo de um continuum, podemos dizer que sabemos como acabar com as guerras um problema desde que uma soluo universal ainda no existe. Em resumo, nenhuma classe de contingncias, nem qualquer contingncia em particular, podem ser descritas como um problema at que saibamos que comportamento o organis mo vai apresentar na presena daquela contingncia. Tentemos, agora, descrever este ponto de vista mais rigorosamente. Para isso, veremos que os conceitos sobre encadeamento introduzidos no Captulo 12 so indispensveis. Numa cadeia de comportamento, um organismo emite operantes numa ordem se qencial. A ordem particular controlada pelas conseqncias estabelecidas para cada operante isolado. Para solucionar um problema de diviso, uma criana bem treinada realiza a multiplicao, subtrao, emprstimo, transporte, etc., numa certa seqncia que depende do resultado de vrias discriminaes. Uma criana sem as habilidades componentes no pode executar a cadeia requerida. Esta criana ilustra a possibilidade de que, em qualquer situao determinada, pode no existir qualquer cadeia que produzir a situao associada com o reforamento. Isto pode surgir de uma entre duas maneiras relacionadas. (1) o organismo no adquiriu, no passado, uma parte ou toda a cadeia necessria para conduzi- lo da situao presente, S^, para a situao reforadora, Sb , embora tal cadeia possa ser conhecida por outros organismos. (2) No existe qualquer cadeia conhecida cuja execuo garanta a transformao de Sa em Sb . Examinemos, agora, vrios problemas representativos. 0 problema na caixa-quebra-cabea revela certos aspectos interessantes da soluo de problema. Os gatos foram colocados na situao inicial, a caixa fechada, S \ . Alguns comportamentos foram gerados inicialmente. Os gatos correram, miaram, colocaram suas patas nas barras, arranharam as bordas dos orifcios maiores, olharam em vrias direes e assim sucessivamente. Muitos destes comportamentos representam operantes generalizados de uma histria passada de reforamento em situae similares. No passado, quando colocados num espao pequeno, os gatos, normalmente, escapavam olhando ao redor do ambiente, aproximando-se de qualquer orifcio, arranhando as partes soltas do ambiente, e assim por diante. Alguns outros comportamentos, como miar, esto indubitavelmente estabelecidos na estrutura do gato. Independentemente de como foram fortalecidos, certos comportamentos, R i, R2, R 3 , R4 ..., surgem na situao problema inicial. Alm disso, embora esses comportamentos no sejam aleatrios, eles no esto ainda arranjados na seqncia bem ordenada que emitida quando o gato, eventualmente, soluciona o problema. O repertrio inicial do gato consiste de um conjunto seletivo de comportamentos que ele traz para a situao e com os quais ele opera nela. Eventualmente, uma dessas Rs pode ser bem sucedida em abrir a tramela. Quando isto acontecer, o gato transformou a situao de porta fechada em porta aberta.

- 312-

SA
R, R2 R3 R4 S (porta aberta) R (Sair pela > Sg (fora da caixa) Porta)

Na nova situao, S(p0rta abertaV 0 Sat0 tem uma secluncia de resposta bem estabele cida predominante, sair pela poria aberta. Este problema simples ilustra vrios aspectos importantes de soluo de problema em geral. (1) Um organismo leva um conjunto de respostas R j, R2 , R 3 ... para a situao, ou devido sua histria passada com situaes similares ou devido sua estrutura geneticamente determinada. (2) Essas Rs no so igualmente provveis de ocorrerem; algumas (arranhar as bordas de orifcios, miar), tm maior fora do que outras (explorar o teto da caixa; ficar de p, parada). (3). Uma vez que uma determinada resposta seja bem sucedida em transformar a situao numa fami liar, uma seqncia bem estabelecida pode levar o animal situao reforadora, Sg. Thorndike, assim como outros antes dele, referiu-se aos dois primeiros aspectos descritos como responder por tentativa e erro. O animal emite (tenta) muitas respostas na situao problema, a maioria delas consistindo de erros. Eventualmente, a R correta ocorre, ao acaso, e o animal atinge o sucesso. Kohler (1925) criticou

- 313 -

esta caracterizao da soluo de problema. Ele argumentou que a situao de Thorndike no era represencativa de problemas em geral. Os gatos, dizia Kohler, no podiam, logo no incio, observar a relao entre a tramela e a caixa aberta. Mas muitos problemas reais, argumentou, permitem ao organismo observar mais aspectos e relaes na situao do que no caso dessses gatos. Assim, Kohler estabeleceu o seguinte problema para os animais (Fig. 14-1). Uma banana foi colocada do lado de fora da gaiola do macaco. Havia duas varas de bambu dentro da gaiola, mas nenhuma delas era bastante comprida para alcanar a banana. Uma vara, todavia, tinha um dimetro menor e podia ser facilmente inserida em qualquer das pontas da outra vara com pondo, assim, uma nica vara, bastante comprida para alcanar a banana. Os macacos de Kohler, quando colocados nesta situao, apresentavam, inicialmente, comportamentos que haviam sido reforados no passado. Eles estendiam uma ou outra vara, movendo-as para frente e para trs em direo banana. Depois de certa quantidade de extino, esta resposta enfraquecia. Neste ponto, alguns animais sentavam-se calmamente durante um certo tempo, aps o que, de repente, encaixavam as duas varas e puxavam a banana. Sulto, antes de tudo, agacha-se indiferentemente na caixa colocada um pouco atrs da grade. Ento, ele se levanta, pega as duas varas, senta-se novamente na caixa e brinca descuidadamente com elas. Ao fazer isso, acontece de se encon trar segurando uma vara em cada mo de modo que elas ficam em linha reta. Ele empurra a mais fina em direo abertura da mais grossa, pula corre em direo s grades... e comea a puxar a banana em sua direo com as duas varas encaixadas (Kohler, 1925, p. 27). Kohler chamou esta soluo sbita de insight e sugeriu que isto era uma propriedade tpica da soluo de problema. Ele afirmava que Sulto e outros sujeitos resolviam o problema porque a estrutura do problema tornava-se clara imediatamente e no porque o comportamento de encaixar as duas varas fosse um operante que predominasse na situao. Birch (1945) todavia, demonstrou que uma certa histria passada crtica para solucionar este tipo de problema. Kohler no especificou com detalhes a histria passada de seus macacos. Birch resolveu pesquisar se a manipulao anterior da vara era essencial. Pegou um grupo de macacos que nunca haviam tido experincias com varas e estabeleceu-lhes contingncias de um problema idntico. Ao contrrio dos resultados de Kohler, nenhum desses sujeitos foi capaz de solucionar o problema numa sesso de 30 min. Birch, ento, realizou vrias sesses em que permitia que os macacos brincassem com pequenas varas. Ele observou que os animais passavam, gradualmente, a usar as varas como extenses de seus braos para cutucar, espreitar, revolver, cavoucar e outras operaes similares. Num segundo teste, todos os animais resolveram o problema das duas varas em menos de meio minuto. A concluso inevitvel. A manipulao prvia das varas essencial para a soluo de um problema que requer isto como uma habilidade componente; a estrutura lgica da situao no ajudar um organismo que no possua quaisquer habilidades para utilizar esta estrutura. A natureza encadeada dos comportamentos componentes que constituem a soluo de um problema nos ajuda a explicar a caracterstica sbita das solues observadas por Kohler, e outros. Uma vez que o organismo tenha produzido uma

-3 1 4 -

situao que uma deixa para uma seqncia bem estabelecida de corpporamento, o problema termina. Uma vez que Sulto havia transformado aquelas duas varas pequenas numa mais longa, o problema chegou a um fim, o que nos permite supor, razoavelmente, que Sulto possua uma histria anterior de cutucar objetos com varas de vrios tamanhos. 14.2 QUEBRA-CABEAS
P ara estudar a soluo de problemas em sujeitos humanos, os psicologos atribuem uma variedade de tarefas aos seus sujeitos. Algumas delas so os quebra-cabeas. Um quebra-cabea muito conhecido visto na Fig. 14-2. 0 sujeito instrudo a unir os nove pontos com quatro linhas retas sem tirar o lpis do papel e sem retraar uma linha. As linhas podem se cruzar, se necessrio. A maioria dos sujeitos tenta resolver o problema com um grupo de operantes de conectar os pontos, traando as linhas na

Figura 14-2. O quebra-cabea dos nove pontos

periferia. Essa seqncia falha, todavia, e outra resposta emerge com alta fora traado de uma diagonal. Esse novo comportamento de pouca ajuda, j que a diagonal mais as trs linhas perifricas deixam ainda um ponto isolado. Muito rapi damente, ento, o sujeito exaure seu repertrio usual para lidar com tais problemas e, neste ponto, ele concordar que aquilo realmente um quebra-cabea. Uma soluo para o problema dos nove pontos consiste dos prolongamentos de linhas alm dos limites da matriz do ponto (veja o apndice deste captulo). O fato de esta soluo simples requerer algum tempo e, frequentemente, no ser de todo alcanada, mostra um aspecto importante dos quebra-cabeas. Muitos pro blemas ou quebra-cabeas so difceis de serem resolvidos porque eles tendem a controlar respostas muito fortes mas inapropriadas. Os quebra-cabeas, frequen temente, parecem-se com situaes passadas em que certas respostas eram adequadas e reforadas. O problema dos nove pontos por exemplo, muito semelhante a uma situao que contem apenas oito pontos (imagine que o ponto central da Fig. 14-2 no existe) e que poderia ser facilmente resolvida , traando-se quatro linhas na periferia. A emisso repetida de comportamento inadequado numa situao problema comumente chamado disposio, usado no sentido em que dizemos que algum est
- 315-

Tabela 14-1 OS PROBLEMAS DA JARPA DE GUA (LUCHINS 1942) CAPACIDADES DAS JARRAS NMERO DO PROBLEMA 1 2 3 4 5 6 7 8 9 10 11 A 29 B 3 127 163 43 42 59 49 39 76 48 36 C QUANTIDADE REOUERIDA

_
3 25

21
14 18 9

20 100
99 5

10 6
4 3 3 3 4

21
31

20
23 15 28 18 14

20
18 25

22 6

disposto a alguma coisa . O restringir as respostas de traar linhas periferia da matriz dos nove pontos um exemplo de disposio. Muitos problemas podem ser resolvidos apenas atravs de respostas no usuais, assim, conveniente instruir as pessoas que solucionam os problemas de um modo que sua variabilidade de compor tamento aumente. fcil demonstrar que a disposio est sob o controle da histria de reforamento do organismo. Luchins (1942)' solicitou aos sujeitos que solucio nassem uma srie de problemas numricos que requeriam a mensurao da quantidade de gua atravs de vrias jarras de medidas. A Tabela 14-1 mostra 11 desses problemas. O problema 1 foi um exemplo introdutrio. Mostrou-se ao sujeito que, para obter 20 unidades de gua (o valor da coluna mais direita), ele teria que encher a jarra de 29 unidades e derramar 3 unidades, 3 vezes. O sujeito, ento, trabalhava nos outros dez problemas. Note que (excluindo o exemplo introdutrio) todos os problemas, exceto o nmero 9, esto de acordo com a regra B menos A menos 2 C: encha primeiro, a jarra maior, B; ento, derrame 1 jarra A e 2 jarras C. Os problemas de 7 a 11, todavia, tm uma soluo alternativa usando apenas duas jarras, o que pode ser interpretado como uma cadeia mais simples de comportamento. Contudo, sujeitos do primeiro ano primrio at ao nvel de ps-graduao raramente empregaram a soluo das duas jarras. Sua histria de reforamento nos problemas de 2 a 6 tornaram a seqncia de trs jarras forte o bastante para dominar todas as outras cadeias. A noo de disposio aparece no clebre problemas dos dois cordes, visto na Fig. 14-3. A situao inicial, S ^, consiste de dois cordes pendurados no teto de um quarto praticamente vazio. A situao reforadora terminal, Sb , consiste das duas pontas dos dois cordes amarradas uma outra. Todavia, a distancia entre os dois cordes muito grande para que o sujeito alcance um deles enquanto segura a ponta do outro. Numa verso do problema, o nico objeto a mais, presente na situao experimental era um rel magntico. A soluo do problema mostrada na Fig. 144.
-3 1 6 -

O sujeito amarrou o rel ao cordo e colocou-o em movimento, como um pndulo. Assim, ele poderia pegar o cordo em movimento, enquanto segurava o outro, e as duas pontas podiam ser facilmente amarradas. Os sujeitos que tiveram uma sesso anterior em que foram instrudos a usarem o rel

Figura 14-3. O problema dos dois cordes. Os dois cordes devem ser amarrados um ao outro, embora estejam muito afastados para se segurar um enquanto se pega o outro.

Figura 14-4. Uma soluo para o problema dos cinco cordes. O Sujeito amarrou o rel a um cordo e colocou em movimento.

como um componente de um circuito eltrico mostraram-se muito deficientes na soluo deste problema (Birch e Rabinowitz, 1951)- Novamente aqui, uma certa histria passada (usar o componente eltrico como um componente eltrico) impediu os comportamentos necessrios para a soluo do problema (usar o compoennte eltrico como um peso). Como um exemplo final, considere os problemas dos palitos de fsforo da Fig. 14-5. Os problemas dos palitos de fsforo ilustram um aspecto comum a muitos
- 317 -

(A)

(B)

(C)

(D)

(E)

L L _ LLLI LL! LU L I LU

LULU

___U

LLUU U

II II LU

Figura 14-5. Os problemas dos palitos de fsforo de Katona (1940). Em A - C mova trs palitos e produza uma nova figura que tenha um quadrado a menos que a figura original. Em D, produza uma nova figura com apenas cinco quadrados, movendo tres palitos. Em E, mova dois palitos e produza uma figura com quatro quadrados. (Ver as solues no apndice deste captulo)

problemas, a saber, a soluo a ser alcanada especificada apenas de uma forma geral.A legenda da Fig. 14-5 diz quais as propriedades gerais que a soluo deve ter mas no expecificada, em detalhes, a situao terminal, S3 . Com exceo do problema dos nove pontos, nossos problemas e quebra-cabeas anteriores especificavam a si tuao reforadora exata, Sb, em vez de sua estrutura geral. O macaco solucionava o problema quando a banana estava na gaiola; 0 problema dos dois cordes era resolvido quando os cordes eram amarrados. Mas os problemas dos palitos de fsforo so solucionados apenas quando a contagem de quadrados igual ao nmero requerido. Para esses problemas, existem vrias solues aceitveis, com muitas maneiras para se chegar at elas. (Veja 0 apndice deste captulo). 143 ESTRATGIAS DE PROCURA DE HEURSTICAS A nossa caracterizao geral de problemas enfatizou sua natureza encadeada ou composta. Mas a anlise da maioria das amostras de problemas das sees anteriores no requer um encademaento detalhado. Ampliemos portanto, o conceito de um problema . Consideremos o cadeado de segredo da Fig. 14-6. A maioria dos cadeados de segredo deste tipo tm 50 ou 100 posies discretas, mas 5 sero suficientes para a nossa ilustrao. Pode-se dizer que um homem para quem tal cadeado barra a entrada para alguma situao reforadora est diante de um problema se ele no tem a seqncia dc comportamentos disposio para abrir o cadeado. Por outro lado, pode-se executar um algoritmo sistemtico (ver seo 1 2 .8 ) para abrir o cadeado tente

Figura 14-6. Um cadeado de segredo de cinco posies.

-3 1 8 -

cada combinao at voc ser bem sucedido. Esta, provavelmente, a noo de comportamento de tentativa e erro que Kohler e outros psiclogos atriburam a Thorndike ao criticarem sua anlise da soluo de problema pela falta dos elementus para uma soluo estruturada. Contudo, Thorndike nunca relatou que os gatos se empenhavam em todos os comportamentos possveis em todas as seqncias possveis. De fato, os gatos restringiam sua ateno aos orifcios e partes moveis da caixa quebra-cabea, apresentando um conjunto altamente seletivo de comportamentos. Mas um problema de um cadeado de segredo ilustra um responder mais puro por tentativa e erro. Assim, um cadeado de 50 nmeros, que se abre quando a seqncia correta de 3 nmeros girada, exigir 50^/2 (= 62,500) seqncias a serem tentadas, em mdia, antes de se abrir. Se cada seqncia dura 6 seg, o tempo mdio para abrir este cadeado ser de 4 dias detrabalho contnuo. bvio porque tal cadeado serve como uma proteo, mesmo embora quase todas as pessoas tenham uma cadeia algortmica apropriada forte que, eventualmente, poderia abr-lo. Uma estrutura em rvore uma maneira conveniente de representar as seqncias de comportamento nesse tipo de problema (Fig. 14-7),. Os crculos ou ndulos numa
Situao original, SA

Sigura 14-7. Uma estrutura em rvore representando alguns dos comportamentos e situaes resultantes que surgem do girar os nmeros do cadeado da Fig. 14-6. O segredo (3,5,4) visto como linhas pontilhadas que ligam os crculos cheios. Por questo de espao, apenas algumas das ramificaes do terceiro nvel (inferior) so mostradas.

estrutura em rvore representam as situaes que podem ser produzidas pelas vrias respostas disponveis para o organismo. Assim, o ndulo superior a situao original, onde nenhum nmero foi ainda girado. Os 5 primeiros nmeros possveis so vistos como ndulos no nvel imediatamente inferior. Analogamente, os 25 ndulos no prximo nvel representam o conjunto de situaes que resulta do girar ainda um outro nmero. As possibilidades no nvel inferior, resultantes do girar um terceiro nmero, so tantas (125) que podemos representar convenientemente apenas uma amostra destas no diagrama. Na rvore da Fig. 14-7, as linhas representam as respostas operantes de girar. A estrutura nos proporciona uma maneira de representar as situaes possveis que podem surgir quando todas as respostas disponveis em um problema so especificadas e todas as suas conseqncias resultantes conhecidas. Examinando a Fig. 14-7, fica claro que um homem que deseja abrir este cadeado ter que percorrer muitas ramificaes at que ocasionalmente, acerte.
- 319 -

Muitos outros problemas podem ser representados na torma de uma rvore de seqncias operantes e suas situaes resultantes. Se um simples cadeado de 5 nmeros pode levar a tantas ramificaes possveis (125), como ser que um indivduo sempre resolve problemas realmente difceis tal como descobrir uma boa jogada no xadrez, integrar uma funo, provar um teorema da lgica? As situaes possveis que resultam de apenas doze tipos distintos de respostas conduzidos a um nvel de seqncia igual a 12 1212 Evidentemente, a tentativa e erro simplesmente no seriam suficientes para solucionar um problema de qualquer dificuldade. Suponha que houvesse alguma maneira da pessoa que soluciona o problema limitar suas operaes alternativas. Isto , suponha que se dissesse ao indivduo .que o primeiro nmero no tipo de cadeado da Fig. 14.6 comumente 3. Em geral, os problemas que so solveis tm associadas a eles vrias regras ou heursticas que permitem que o organismo restrinja sua topografia de resposta a certos grupos de operaes. Essas heursticas so geralmente caracterizadas como regras prticas que ajudam a limitar a seqncia de comportamento. Ao contrrio de um algoritmo, seu emprego no garante uma soluo, mas frequentemente ajudam a encontr-la. Podemos supor que os gatos de Thorndike exibissem tais heursticas quando limitavam sua ateno aos orifcios e partes mveis da caixa quebra-cabea. No passado, estas respostas compensavam com maior freqncia do que outros comportamentos. Uma heurstica possvel para o problema do cadeado de segredo pode ser a observao de que, algumas vezes, as pessoas fecham um cadeado e deixam o ltimo nmero da combinao na posio. Isto no sempre verdadeiro, mas pode servir como uma heurstica til. Nos pro blemas complexos, conveniente diagnosticar se est ocorrendo um retrocesso ou um progresso em direo soluo. Isto , se se est ficando quente . medida que retrocedemos de frequentemente possvel interpretarmos as situaes interme dirias (ndulos) como mais prximas ou mais distantes da situao terminal, SgSuponha que coloquemos um homem com os olhos vendados numa sala grande e digamos-lhe que sua tarefa atirar um dardo na mosca lo alvo. A localizao da caixa de dardos e o alvo no lhe conhecida. Permitimos ao nosso sujeito duas respostas, caminhar e atirar os dardos. Concordamos em avis-lo, todavia, depois de cada passo que ele d, se ou no est chegando mais perto da caixa de dardos. Alm disso, uma vez que ele chegue at a caixa e comece a atirar os dardos, avis-lo-emos se os seus lanamentos esto prximos ou distantes do alvo. Isto uma verso do brinquedo de chicote-queimado ( voc est ficando mais quente) e se o nosso alvo no fr muito pequeno, o nosso sujeito solucionar este problema rapidamente. Mas, bvio que um homem que no receba os S^s progressivos ( avisos) ao longo do caminho poder nunca solucionar o problema. Em geral, uma anlise da soluo de problema tem a forma de (1) notar as heursticas apropriadas que restringem a topografia da resposta a serem usadas e as situaes que valem a pena ser exploradas; (2 ) notar as discriminaes intra-problema importantes que devem ser feitas para que se possa detectar se uma resposta colocou o organismo mais perto ou mais longe da situao terminal. Se estes so realmente os componentes crticos do comportamento de soluo de problema, deve ser possvel incorpor-los na estrutura de uma mquina que poderia, ento, resolver problemas semelhantes. O comportamento desta mquina pode ser de interesse por vrias razes. Primeiro, ela poderia verificar a suficincia do conjunto de heursticas e discriminaes que podemos supor como necessrias para qualquer con-

- 320 -

junto determinado de problemas. Segundo, variando as jcaractensticas da maquina poderemos descobrir um meio de desenvolver um solucionador de problemas mais eficiente c, ento, aplicar essas descobertas prtica educacional. Devido sua rapidez de operao (25.000 ou mais operaes por seg), o computador digital ideal para explorar esses modelos de soluo de problemas. As representaes das situaes podem ser programadas, vrias operaes correspondentes s respostas do organismo podem ser simuladas e uma estratgia para transformar sucessivamente uma situao em outra pode ser construda na mquina. Newell e Simon (1963) descreveram um programa dc computador chamado General Problem Solver (GPS) para tratar com certos quebra-cabeas e problemas. O programa emprega uma variedade de estratgias de procura heurstica e testes de discriminao para avaliar se as situaes recmcriadas representam um progresso em direo situao terminal, S b Um dos seus problemas o domnio da lgica simblica. Pode-se pedir mquina que prove que (Rl>\P). ( ^ .R ^ Q ) equivalente aO; ,(^ Q.P). D-se mquina a mesma informao que um universitrio possui, a saber, uma dzia de regras para transformar os smbolos atravs da adio de termos, supresso de termos, mudanas das conexes, dos sinais, dos grupos, e assim por diante. O programa que torna o computador um solucionador de problemas proporciona-lhe a habilidade de aplicar essas regras (responder) e discriminar as diferenas entre as situaes que ela produz. E o mais importante, talvez, o programa proporciona-lhe um nmero de heursticas para dirigir sua procura atravs da rvore do problema. Uma heurstica conveniente restringe o GPS de tentar transformar uma situao (ndulo) se esta fr mais difcil de transformar do que uma situao anterior (ndulo). O GPS constri os seus prprios critrios de dificuldade de transformao. O GPS espera que as diferenas entre as suas situaes sucessivamente geradas, S j, S 2 , S3 e a situao terminal, S[$, diminua medida que prossegue trabalhando atravs de suas sries de transformaes. Se isto no acontecer, o GPS volta a um nvel superior (em direo S \ ) e percorre uma nova ramificao. Outra heurstica fora o GPS a abandonar uma ramificao quando esta vai abaixo dc uma determinada profundidade (a diminuio vertical na Fig. 14-7) e a situao Sb ainda no apareceu. O GPS parece resolver seus problemas to bem quanto estudantes universitrios e, talvez mais importante, frequentemente incorre nos mesmos tipos de erro. Outros programas para solucionar demonstraes geomtricas, jogar xadrez c damas, integrar c estabilizar linha de montagem tem sido projetados, todos empregando as idias de estratgias de procura dc heurstica. 14.4 IDENTIFICAO DO CONCEITO Quando um indivduo adquiriu um conjunto dc conceitos pelos mtodos do Captulo 13, a sua habilidade em induzir ou identificar qualquer conceito particular atravs da inspeo de apenas alguns membros S^ do conceito pode ser de interesse. Apesar de certas semelhanas dc procedimento entre a aquisio de conceitos e a identificao de conceito, o ltimo mais propriamente tratado no contexto da soluo de problema. Na identificao de conceito, temos um sujeito que j adquiriu todos os conceitos empregados no experimento. O processo de aquisio de conceito est bem sedimentado. Suponha que mostremos a um sujeito uma figura de um pssaro, um avio e um balo e pedimos-lhe que identifique (nomeie) o "conceito (a classe de So) que eles exemplificam. O sujeito adquiriu h muito tempo atrs o

- 321 -

conceito dc fc objeto voador atravs de uma histria de discriminao com lais objetos.Agora, sua tarefa simplesmente apresentar o comportamento verbal ad quirido, dando o nome k 4 objeto voador . Em geral, a tarefa do sujeito na identificao dc conceito consiste cm examinar um nmero de situaes e induzir o conceito delas (isto , propor uma regra geral para a classe de S^). Ele informado, para cada situao, se esta ou no um caso da classe de desconhecida. Nesta tarefa, tipicamente o sujeito emprega estratgias, ou seqncias sistemticas de respostas, que levam identificao correta.

Bruner, (ioodnow e Austin (1956) apresentaram os 81 cartes vistos na Fig. 14-8 aos seus sujeitos. Esses cartes variavam de quatro maneiras; (1) o nmero de figuras (1, 2 ou 3 );(2) a cor das figuras (vermelha, verde ou preta); (3) a forma das figuras (... cru/, crculo ou quadrado ) c, (4) o nmero de linhas perifricas (1, 2 ou 3). Primeiro, mostrava-se ao sujeito um determinado carto (digamos, aquele com trs crculos vermelhos c duas 1in lias perifricas, 30V2p) e dizia-se-lhe que esse era um caso positivo de um conceito que ele deveria identificar. O sujeito era, ento, avisado dc que poderia escolher cartes adicionais entre os 80 restantes para obter informaes. Depois dc cada escolha, ele era avisado se o carto particular que escolhera era ou no

\ j J

OO
o o o

OO

5 l

ooo

fc>oo] o o o
o

FIH

o o >

1 Ti

pm aj

o o

I I Dl o o i

FI
l - l

2 J E I a JI

fp<x>l l 0 0 l !

Ml

Figura 14-8. Um conjunto de cartes usados para estudar a identif icao de conceito. As formas variam em (1) nmero, (2) forma, (3) cor, e (4) nmero de linhas perifricas (Bruner, Goodnow e Austin, 1956).

um caso do conceito. Quando a tarefa consistia de identificar conceitos conjuntivos (crculos vermelhos, duas figuras verdes, etc.), a maioria dos sujeitos adotou uma estratgia que consistia em escolher cartes que variavam em uma e somente uma dimenso do carto positivo inicial conhecido. Dessa maneira, cada seleo eliminava um ou mais conceitos. Um exemplo dos tipos de seqncias de scolha usando essa estratgia seria o seguinte:
- 322-

llllll 01

o exemplo inicial positivo dado primeira escolha: elimine trs figuras como um elemento relevante. 3 QVerde2 p ( ) segunda escolha: retenha o vermelho como um elemento relevante. 3V2p ( ) terceira escolha: retenha o circulo como um elemento relevante. 30Vlp (+) quarta escolha: elimine duas linhas perifricas como um elemento relevante. Logo: o conceito crculos vermelhos . Bruner, Goodnow e Austin demonstraram que um nmero de variveis, tal como o tipo do conceito a ser identificado, a maneira em que os 81 cartes eram expostos e o nmero de exemplos que se permitia aos sujeitos escolherem, afetava o tipo de estratgia sistemtica empregada. 14.5 A MENSURAO DE HABILIDADES PARA SOLUCIONAR PROBLEMA: TESTES DE INTELIGNCIA

30V2p (+) 20V2p (+)

Talvez, nenhuma palavra seja to mstica em toda a psicologia quanto inteli gncia . uma palavra que todos empregam mas dificilmente definem. Desde 1905, os psiclogos mantm a curiosa posio de preparar e defender os testes de inteligncia e, ento, negar sua responsabilidade por eles, dizendo que ningum sabe o que a palavra realmente significa (Wechsler, 1958). Veremos que a soluo de problema proporciona um veculo conveniente para tratar o tpico inteligncia. Em todos os testes que se propem a medir a inteligncia, veremos apenas uma srie de problemas proposta a um sujeito e vrias medidas do seu desempenho registradas. A idia de um teste de inteligncia, ou como preferirmos cham-lo, um teste de soluo de problma, suigiu originalmente de consideraes puramente prticas. Em 1904, o psiclogo francs Alfred Binet foi encarregado de preparar um teste que apontasse aquelas crianas cujas deficincias em solucionar problemas tornava im provvel que elas pudessem tirar proveito da instruo regular da escola. O testes resultante de Binet era uma srie de problemas com gravuras, blocos de madeira, tabuleiros, etc., prprios para serem administrados a uma criana de cada vez. Este foi o primeiro teste de inteligncia que obteve sucesso. Durante a Primeira Guerra Mundial, surgiu uma necessidade premente nos Estados Unidos de avaliar as habilidades para solucionar problemas de vrios milhes de convocados o mais rpido possvel. Testes de lpis e papel que poderiam ser administrados, simultaneamente, a um grupo de recrutas foram desenvolvidos para suprir essa necessidade e foram aplicados na seleo de homens para vrias tarefas. Com o tempo, estes testes de grupo passaram a ser universalmente empregados. Muitas escolas, atualmente, usam seus resultados para selecionar estudantes. Universidades e escolas de ps-graduao confiam enormemente nos seus escores para decises sobre admisso. Nossa preocupao, todavia, no com a aplicao prtica de tais testes. Desejamos, em vez disso, averiguar certas con tribuies que os testes de inteligncia tm fornecido nossa anlise dos compor tamentos humanos de solucionar problema. Qual a natureza dos problemas usados nos testes de inteligncia? No h melhor maneira de descrev-los do que atravs de exemplo. No teste tpico, aparece um nmero de subtestes destinados a avaliar vrias habilidades para solucionar
- 323-

/ / / / 2 /s a / / / /
Quantos blocos existem?
L

( ba ( bhJ S_B_
Qual bandeira igual da esquerda?

Se X vem antes de U no alfabeto, marque oA abaixo Caso contrrio, marque o B

ixioiyioioixioioioi i i ii ii r n
Complete a srie tie Sx e Os

B Copie esta figura comeando pelo circu'o

Marque o grupo de letras diferente


CCZO AC BC SC LC RC MA

Ache o caminho da sada

Se quatro IF:s ustam 50 centavos, quantos voc compraria com 1 cruzeiro?________

INICIO

1 i

esta para

ffl

H B ffl
esta para.

XL

Assim como

Figura 14-9. Amostras de itens do tipo usado nos testes grupais de lpis e papel para habilidades dc solucionar problemas (Kimble e (.arme/y, 1963 ).
p r o D l c m a . Uma amostra de um conjunto de itens apresentada na Fig. 14*9. Os itens da Fig. 14-9 testam uma variedade de habilidades. Alguns problemas baseiam-se principalmente em habilidades de linguagem, outros em habilidades discriminativas e perceptivas. A maior parte procura empregar itens que testem habilidades gerais para solucionar problema e a habilidade para aplicar conceitos amplos e disposio para aprender. Esse ideal, todavia, nunca c completamente realizado.

Os escores obtidos com testes de soluo de problema deste tipo nos dizem algo sobre as habilidades relativas para solucionar problema de indivduos num determinado grupo cultural. No restante desta seo (1) examinaremos algumas cias variveis a que os escores tm sido relacionados, e (2) faremos uma anlise mais detalhada dos prprios escores. Um dos resultados melhor documentado a funo que relaciona os escores de soluo de problema idade do sujeito. Curvas tpicas que ilustram a relao bsica em cinco sujeitos que foram testados e re-testados em vrias idades so vistas na Fig. 14-10. Os cinco indivduos bastante diferentes da Fig. 14-10 continuaram a progredir em suas habilidades para solucionar problemas no decorrer de um perodo de 25 anos. Por volta dos 25 anos, a taxa de aumento na habilidade de solucionar problema comea a diminuir para alguns sujeitos, mas no todos. A populao em geral mostra uma queda aguda antes dos treze anos e apenas um ligeiro acrscimo na habilidade de solucionar problema entre os 20 e 50 anos. Suponha que desejemos relacionar o escore de soluo de problema de um indivduo com o escore de pessoas da sua idade. Para isto, necessrio administrarmos um determinado teste para muitos indivduos da mesma idade. Uma vez tenhamos os

- 324-

escores do grupo, podemos comparar os escore^ de qualquer indivduo com aqueles dos outros no grupo. Um aspecto interessante ^destes escores de teste que eles se apresentam aproximadamente com uma distribuio normal.

Idade (anos) Iigurn 14-10. Habilidade para solucionar provlcina cm tun^o da idade( Baylcy, 1955 ).

Isto , se testarmos bastante indivduos, as frequncias relativas em que os vrios escores possveis ocorrem podem ser descritas pela curva em forma de sino da parte superior da Fig. 14-11. Nas sees 2.6 e 10.9, vimos que existe uma relao ntima entre o desvio padro e a percentagem de medidas que caem nas vrias regies da curva normal. Fssa relao permite-nos estabelecer a escala de percentil vista logo abaixo da curva. Se, por exemplo, olharmos detalhadamente a Fig. 14-11, veremos que o ponto +2 O em relao mdia corresponde ao percent il 98. Um escore no percentil 98 indica que apenas 2% dos escores so maiores do que seu valor. Simi larmente, o ponto +1 c est no percentil 84, a mdia no percentil 50, e assim por diante. Um mtodo ainda mais comum de expressar a habilidade relativa de solucionar problema encontrar um Quociente dc Inteligncia , definida como 01 escore obtido na soluo de problema 100------------------;-------------------------------------escore mdio na soluo de problema

O escore do indivduo o numerador deste quociente. O denominador do quociente o escore mdio na soluo de problema do grupo de indivduos da mesm* idade. (Os

escores de crianas so geralmente comparados com os de outras crianas da mesma idade; os escores de adultos so usualmente comparados com os de outros adultos sem levar em conta a idade, na suposio de que a habilidade mdia de solucionar problema varia muito pouco depois dos vinte anos). Se o escore de um indivduo o mesmo que a mdia do grupo, ento, o numerador = ao denominador e o QI calculado 100. A relao entre o ndice de 01 e a faixa de percentil vista na Fig. 14-11. O desvio padro do ndice de QI cerca de 16 pontos de QJ. Assim, um indivduo cujo QI calculado como 1 16 est cerca de 16 acima da mdia do seu grupo de idade e, portanto, encontra-se no percentil 84. Apenas 16 por cento dos indivduos do seu grupo de idade tero um escore mais alto.

Percent is (cent is)


I.. . . I ,. ..I . . . . I,... I . . .. I.. . mi n, i l i M, 111.il ni .lii iili

60

70

80

90

100 110 120 130 140

Quocientes de inteligncia Figura 14-1 1. Relaes entre escores de soluo de problema, percentis e o ndice de QI (segundo Cronbaeh, 1963).

Muitos pesquisadores tm criticado a derivao, e o uso subsequente de um nico nmero como o QI, do desempenho em problemas com o aqueles da Fig. 14-9. Dois indivduos podem obter escores de QI idnticos de 116 (digamos) apesar de suas habilidades de solucionar problemas poderem ser radicalmente diferentes. Para ilustrar, fazendo-se referncia Fig. 14-9, um sujeito pode solucionar os problemas dos blocos ocultos com um alto grau de proficincia, mas se sair muito mal nos problemas que requerem a completao da srie de letras. O outro indivduo pode apresentar um repertrio inverso habilidades superiores para a srie de letras combinadas com pouca habilidade para solucionar os problemas de relaes espaciais. Mas, ao somar os escores de ambos os testes obtemos o mesmo total para os dois indivduos. Uma grande parte de resistncia a uma anlise mais refinada do desempenho em diferentes tipos de problemas, provavelmente, devida noo histrica de que Inteligncia representa uma capacidade fixa do organismo para solucionar problemas de todos os tipos. No h uma evidncia total, mas estudos recentes indicam que a habilidade de um indivduo para solucionar problemas melhor representada como um grupo de habi lidades de solucionar problemas. Thurstone (1945) sugeriu o que ele chama uma anlise de perfil (ver Fig. 14-12). As habilidades de um indivduo para solucionar problemas so caracterizadas com o sendo constitudas das oito habilidades bsicas vistas na parte superior ua Fig. 14-12. Esse perfil fornece muito mais informaes sobre as habilidades de um indivduo para solucionar problemas que qualquer escore de QI, mas a anlise pode ser ainda insuficiente. Alguns pesquisadores, atualmente, sugerem que 120, em vez de 8 habilidades bsicas para solucionar problemas, podem

- 326-

Percentual

Verbal

Numrica

Abstrata

Fspaciai

Mec| nica

1 scri- Soleta trao

Scntcnas

90

75

60 50 40

25

10

111 h 1 111 1 11

17 60 0 76 91 55 15 16

Percentil

Figura 14-12. Um perfil tpico das habilidades de um indivduo hipottico para solucionar problema. (Bennett, Seashore e Wesman, 1951).

ser necessrias para descrever o desempenho de um indivduo satisfatoriamente. Com um nmero to grande como 120, podemos bem indagar em que sentido a palavra bsico pode ser aplicada. O contexto em que os lestes de inteligncia se desenvolveram raramente levou os pesquisadores a procurar maneiras de modificar os comportamentos de solucionai problema que eles iso!aram. Todavia, bem conhecido que a preparao ou o treino das habilidades especiais que fazem parte dos problemas de Ql, pode aumentar os escores significativamente. Se a fig. 14-10 examinada cuidadosamente, veremos que a idade em que o aumento na habilidade de solucionar problema comea a diminuir coincide precisamente com a poca em que muitos indivduos terminam o seu treino escolar ormal. Mas embora a educao formal contribua enormemente para o au mento na habilidade geral de solucionar problema com a idade, no se fez ainda uma tentativa ampla de modelar habilidades de solucionar problema do tipo avaliado nos testes de QL Parece que, se estas habilidades so bsicas em qualquer sentido, um programa sistemtico, iniciado na tema idade, para model-las atravs das tcnicas discutidas nos captulos anteriores seria conveniente. 14.6 CORRELAO, TESTE DL CONFIABILIDADE F VALIDADE

Em vrias partes ao longo deste texto, o termo correlao foi empregado no sentido de relao . Foi dito que os reflexos de correlaes entre eliciadores e

- 327 -

respondentes; que o reforamento est correlacionado com a ocorrncia de um operan te especificado. 0 sentido dado ao te mio foi o de relao ou dependncia. A contrao pupilar est estritamente relacionada (depende de) (lashes de luz; a liberao de alimento est estritamente relacionada ao (depende de) bicar a chave. Em geral, quando uma varivel dependente de outra, pode-se dizer que ela est correla cionada com esta; o contrrio, como veremos, no necessariamente verdadeiro. Na descrio mais completa de relaes ou correlaes particulares entre duas variveis, somos, tipicamente, levados representao grfica. As correlaes que constituem as leis do reflexo so descritas pelas funes que relacionam as propriedades do eliciador s propriedades do respondente. As correlaes que constituem as leis do fortaleci mento operante tomam a forma de uma curva da taxa de resposta em funo do tempo. Quando falamos de duas variveis que so correlacionadas, importante separar as noes de como e quanto elas esto correlacionadas. Perguntar sobre como duas variveis esto correlacionadas indagar sobre a forma da relao entre elas. A medida em que uma varivel aumenta, a outra aumenta, diminui, ou permanece inalterada? A relao melhor representada por uma linha reta, uma curva simples ou uma curva complexa com depresses e picos? As pginas anteriores podem ser consultadas, pois contm amostras de uma larga variedade de formas. Perguntar sobre o quanto duas variveis esto correlacionadas indagar sobre a preciso com que somos capazes de predizer o valor de uma delas sabendo o valor da outra. A resposta ao quanto independente da resposta ao como . A forma de relao poderia ser linear, curvilnea ou qualquer outra e, mesmo assim, a variabilidade na medida poderia ser to grande que pouco mais que uma predio grosseira poderia ser efetuada. O contraste entre uma forma altamente definida e um grau baixo de correlao esl ilustrado nos dados hipotticos da Fig. 14-13. Nove medidas de U aparecem para cada valor de X na Fig. 14-13. Os valores mdios dos Ys esto conectados por uma linha reta. F ^ evidente que X est diretamente relacionado a Y e a forma da relao indiscutivelmente linear. 0 grau de correlao , todavia, baixo. Onde o valor de X 2, por exemplo, os valores de Y variam de menos de 1 a mais do que 3. Fm geral, a previso de Y a partir de X, na Fig. 14-13 deficiente. Para melhorar o grau de correlao na Fig. 14-13, os valores de Y par,, qualquer valor de X deveriam estar mais prximos. Isto , os valores de Y teriam que ser muito menos variveis. Nas vrias relaes grficas, ou correlaes, descritas nas pginas anteriores, a varivel no eixo horizontal tipicamente uma varivel independente (medida e mani pulada), enquanto a varivel no eixo vertical tipicamente uma varivel dependente (medida, mas no diretamente manipulada). Ao tratar estas relaes funcionais, dirigi mos nossa ateno principalmente para a forma das correlaes isto , como as variveis esto relacionadas. 0 grau de correlao, isto , a habilidade preditiva ou o quanto as variaveis esto relacionadas., foi considerado ser alto devido ao controle experimental cuidadoso, dispositivos precisos de mensurao, e assim por diante. Algumas vezes, acontece que no h quaisquer manipulaes experimentais dispo nveis para se determinar como uma varivel influenciada por mudanas sistemticas em outra. Nesse caso, podemos ser forados a basear-nos nas relaes entre duas variveis dependentes. O grau de correlao entre as variveis nestas relaes entre duas variveis dependentes no pode ser tomado como certo. Nenhuma das variveis est

328

X
Figura 14-1 3. Relao linear hipottica entre duas variveis.

sob o controle experimental direto e, j que somos, frequentemente, incapazes de controlar influncias que podem afetar uma ou outra de maneiras complexas, muito mais variabilidade nos dados deve ser esperada. Tivemos pouca ocasio para discutira relao entre duas variveis dependentes neste texto, mas sua avaliao um empreen dimento comum, frequentemente, com importncia prtica. Os escores que um indi vduo obtm num teste padronizado de lpis e papel de soluo de problema e sua taxa de progresso como uma pessoa que est sendo treinada para uma tarefa so ambos variveis dependentes do desempenho. Mesmo assim, se as duas variveis so altamente correlacionadas, as predies sobre uma delas podem ser feitas conhecendose o valor da outra. O grau de correlao entre duas variveis dependentes pode variar de muito baixo - onde conhecer o valor de uma de pouca ajuda para prever o da outra - a muito alto - onde sabendo-se o valor de uma torna possvel predizer com preciso qual ser o valor da outra. Entre estes extremos encontram-se todos os graus de correlaes intermedirias. Por exemplo, h algum grau de correlao entre altura e peso (ambas variveis dependentes); pessoas altas tendem a pesar mais do que pessoas baixas. Mas o grau de correlao est longe de ser perfeito, desde que se pode prever apenas aproximadamente o peso de um homem a partir de sua altura. Os estatsticos desenvolveram um ndice numrico, ou coeficiente, para indicar o grau de correlao. O coeficiente vai de -1 at + 1 , passando pelo zero. Mais 1 representa o caso onde duas variveis esto diretamente relacionadas e pode-se prever perfeitamente uma delas a partir da outra. Valores altos de uma acompanham valores altos da outra, valore: intermedirios acompanham valores intermedirios e assim por diante. Menos 1 epresenta o caso onde as duas variveis esto inversamente relacionadas e perfeitamente previsveis. Valores altos de uma acompanham valores baixos da outra e vice-versa. Uma correlao igual a 0 representa uma relao aleatria entre duas variveis; conhecer o valor de uma no de ajuda alguma para predizer o valor da outra.

329

Coeficientes intermedimos representam graus intermedirios de previsibilidade. A Fig. 14-14 indica graficamente os tipos de elaes que esto associadas aos vrios valores do coeficiente de correlao. Nosso X e Y poderiam ser quaisquer duas variveis dependentes relacionadas: por exemplo, escore no teste de lpis e papel (X) versus realizao no trabalho (Y ), ou altura (X) versus peso (Y).

Figura 14-14.

As correlaes entre duas variveis dependentes frequentemente apresentam pro blemas de interpretao que esto ausentes quando a varivel X de uma relao c uma varivel independente. Sabe-se que a habilidade de solucionar problema na criana, por exemplo, est correlacionada com o comprimento do dedo do p. A medida que a criana cresce, sua capacidade de solucionai problemas aumenta ao mesmo tempo que seus ossos esto aumentando de comprimento e, assim, os dois mostram uma correla o significante. Isto pode ajudar o estudante a ver que, embora a correlao moslre a relao causai em alguns casos, ela no significa, necessariamente, que uma das duas coisas correlacionadas causa a outra (Hebb, 1958, p. 237). Aqui existe uma terceira varivel independente, a idade do indivduo, que funcionalmente relacionada a ambas as variveis, acarretando, assim, uma correlao entre elas. Duas correlaes subordinam-se ao conceito e mensurao da inteligncia. ( ! ) A habilidade relativa de um indivduo para solucionar um tipo particular de problema numa ocasio correlaciona-se, at certo grau, com sua habilidade relativa para solu cionar esse tipo de problema numa ocasio posterior. No tosse por essa consistncia intra-classe na habilidade de solucionar problema, no haveria um conceito de inte ligncia. (2) A partir do quo bem um indivduo resolve os problemas a, b, c n podemos predizer como ele resolver os problemas a \ b \ c........ n \ Sem esta consistncia inter-classe na soluo de problema no haveria uma medida da inte ligncia. Desde Binet, o tratamento prevalente da inteligncia tem sido uma tentativa contnua de melhorar o grau de correlao inter-classe atravs de selees cada vez melhores dos problemas a, b, c....... n. Isto , os psiclogos tm se preocupado com o estabelecimento de grupos padres de problemas (a, b, c, n, chamados problemas testes, ou testes de Ql) cuja correlao, com outros grupos de problemas ( a \ b \ c'...... n \ cormimente, a realizao na escola, universidade ou no trabalho, ou mesmo outros testes de 01) sein aim A medida da intengencia, como todas as medidas, depende de dois requerimento: a mais que, por meio de anlise, v-se que envolvem correlaes. O primeiro requeri mento estipula que os instrumentos de medida sejam confiveis, isto , que o seu uso repetido proporcione resultados similares. Uma rgua confivel quando suas medidas repetidas de uma mesa fornece resultados que concordam exatamente entre si. Simi larmente. se um leste de soluo de problema um instrumento de medida confivel, seu u>r repetido deve levai ao mesmo valor para a habilidade de solucionar problema
- 330 -

de um determinado indivduo. O requisito confiabilidade , com eteito, uma neces sidade para um alto grau de correiao entre os resultados do teste em ocasies diferentes. Dada uma nica medida, devemos ser capazes de predizer a prxima: ela dever ser aproximadamente a mesma. A confiabilidade depende, parcialmente, das condies constantes de medida e, parcialmente, do prprio ato de medir que afeta desprezvelmente o que est sendo medido. A confiabilidade de um teste de solucionar problema geralmente mais baixa do que a de uma rgua porque muitas operaes podem facilmente ocorrer entre as medidas, m udando o desempenho de soluo de problema do indivduo. Por exemplo, prticas demasiadas em vrios problemas afetar a concordncia das medidas repetidas de 01. Alm disso, o instrumento de medida afeta dc algum modo, o que est sendo medido: a aplicao repetida de testes de QI pode afetar os e s c o r e s - o sujeito torna-se versado em teste . Um segundo requerimento imposto s medidas que elas sejam teis a qualquer objetivo para o qual so feitas. A utilidade, no contexto de medida, chamada v a lid a d e . Se temos um piano na rua e queremos estar certos, antes de carreg-lo por trs lances dc escada, que ele passar atravs de uma certa porta, ser melhor medir o seu lado mais largo. Comparando esta medida com as dimenses da porta, seremos capazes dc predizer se podemos entrar com o piano. Poderamos fazer muitas outras medidas do piano - poderamos determinar o seu valor na praa ou pes-lo - mas nenhuma dessas medidas seria vlida para os nossos objetivos presentes. Bias no seriam convenientes para aquilo que pretendamos fazer, no m omento, com o piano. Segue-se, portanto, que elas no, seriam medidas vlidas para o passar atlavs da porta1.
A validade uma forma simulada de correlao pois, no exemplo que acabamos de descrever, a largura do piano a varivel que est mais correlacionada com a possibilidade dc pass-lo atravs da porta. O peso menos correlacionado e, a menos que, nos pianos, o valor na praa e o ta m anho sejam relacionados, o valor na praa, provavelmente, ter uma relao aleatria (0) com esta possibilidade. Algumas vezes, a validade pode assumir a forma de uma estimativa do grau dc correlao entre uma dimenso da medida ( D j ) cuja utilidade j oi bem estabelecida e uma dimenso da medida (D 2 ) diferente c pior estabelecida. Este problema surge frequentemente quando o mtodo de medida existente envolve dificuldades prticas e um segundo mtodo mais simples e rpido proposto. Se desejarmos medir uma grande rea de terra, veremos que impraticvel (mas, em princpio, possvel) medir o seu perm etro com uma rgua. Em vez disso, adotamos um procedim ento de medida totalmente diferente e mais rpido, usando equipamento tico de medida. A justificao para este m todo sua alta correlao com os resultados obtidos quando, de fato, usavam-se rguas para conferir os valores medidos. A validade exigida de um escore de teste de inteligncia desse tipo. Certas dimenses de medida vigentes existem na forma do desempenho na escola, habilidades 110 trabalho, e assim por diante. Mas, frequentemente, impraticvel avaliar todas as habilidades de solucionar problemas numa criana, ou medir, o repertrio com pleto de solucionai problema 110 trabalho num indivduo. Poderamos at desejar prever o desempenho de um homem antes de ele assumir o trabalho. O teste de QI proposto como um dispositivo rpido de medida que procura medir os aspectos de uma dimenso complexa da soluo de problema de uma maneira mais simples, atravs de operaes de lpis e papel. O grau em que os testes de QI reaJizam isso dado pelo grau de correlao

- 331 -

entre seus escores e o desempenho, no trabalho ou na sala de aula, pa solucionar problema. Quanto mais alto o grau de correlao, maior a validade (utilidachdo escore do lpis e papel. APNDICE DO CAPITULO 14.

Figura 14-15. Soluo do quebra-aibra tios nove pontos.

(A)

(B)

(C)

(D)

(E)

LL U U

LLU U

JJJJ L IL i

_IJ_ LLLL L IL I L II J

Figura 14-16. Solues para os problemas dos palitos de lstoro.

REFERNCIAS PARA O CAPTULO 14 Bayley, Nancy. On the growth of intelligence. Am er. Psychologist, 1955, 10, 805-818. Bennett, G. K., Seashore, H. G., and Wesman, A. G. Counseling from profile. A case book for the Differential Aptitude Tests. New York: Psychological Corp., 1951. Birch, H. G. The relation of previous experience to insightful problem solving. J . comp. Psychol., 1945, 38, 367-383. Birch, H. G., and Rabinowitz, H. S. The negative effect of previous experience on productive thinking. J. exp. Psychol., 1951, 41, 121 125.

- 332 -

Bruner, J. S., Goodnow, Jacqueline J., and Austin, G. A. A study of thinking. New Y ork: Wiley, 1956. Cronbach, L. J. Educational psychology. New York: Harcourt, Brace and World, 1963. Hebb, D. O. A textbook of psychology. Philadelphia: Saunders, 1958. Katona, G. Organizing and memorizing: studies in the psychology of learning and teaching. New York: Columbia Univer. Press, 1940. Kendler, H. H. Basic psychology. New Y ork: Appleton-Century-Crofts, 1963. Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd ed.) New York: Ronald, 1963. Kohler, W. The mentality of apes. New York: H arcourt, Brace, 1925. Luchins, A. S. Mechanization in problem solving: The effect of Einstellung. Psychol. Monogr., 1942, 54, No. 248. Newell, A., and Simon, H. GPS, a program that simulates human thought. In E. A. Feigenbaum and J. Feldman (E d s.), Computers and thought , New York: McGraw-Hill, 1963, pp. 279-293. Thurstone, L. L. Testing intelligence and aptitudes. Hygeia, 1945, 53, 32-36. Wechsler, D. The measurement and appraisal of adult intelligence , Balti m ore: Williams and Wilkins, 1958.

- 333-

QUINTA PARTE

DINMICA DO REFORAMENTO

15. MOTIVAO I 16. MOTIVAO II 17. CONTINGNCIAS AVERSIVAS 18. COMPORTAMENTO EMOCIONAL

Captulo 15 MOTIVAO I

A motivao do comportamento geralmente interpretada como o conjunto de d e t e r m i n a n t e s ou c a u s a s d o c o m p o r t a m e n t o . Ma s d e v e t e r ficado claro, nos captulos anteriores, que a elaborao das causas do comportamento o campo de toda a psicologia. Desde os reflexos at a soluo de problemas complexos, um objetivo unificador da cincia tem sido uma elaborao experimental das causas ou leis do comportamento. O tpico Motivao , se que devemos distingui-lo dos procedimentos e processos dos captulos anteriores, deve compreender as causas de comportamento at aqui negligenciadas, ou deve oferecer fenmenos novos para anlise. Antes de nos dedicarmos a um tratamento experimental da motivao, til inserir algumas notas sobre c#usa e efeito na cincia, em geral, e na psicologia, em particular. 15.1 CAUSA E EFEITO E A NOO DE L E I CIENTFICA

Os termos causa e efeito tm uma. longa histria de uso em todas as tentativa sistemticas para explicar a natureza tanto filosfica quanto cientfica. Os termos so parte de nossa linguagem cotidiana para descrever os aspectos de furaces, revolues, epidemias, assassinatos e acidentes aireos, assim como eventos mais triviais do dia-a-dia nas relaes humanas. Podemos, aissim, ficar surpresos em descobrir, ao voltarmo-nos para a literatura cientfica contempornea, a falta evidente desses termos. Em seu lugar, podemos encontrar referncia apenas a relaes entre variveis, correlao de eventos c leis relacionando fenmenos. No que o cientista tenha perdido o interesse nas causas de seus fenmeno^. que, simplesmente, tudo o que ele encontra aps executar experimentos so rela-es entre eventos ou variveis. Para ele, descobrir as causas de um fenmeno y equivailente a descobrir quais outras variveis u, v, w, x, e assim por diante, esto sistematica mente (funcionalmente) relacionadas a y. . Toda a cincia est cheia dc exemplos de relaes funcionais que se propem a ocupar o lugar de noes mais ordinrias de canisa e efeito. Considere a lei de llookc: enquanto o limite de elasticidade no excedido, a distenso de um corpo diretamente proporcional fora nele aplicada- A lei pode ser resumida como a relao entre duas variveis, Fora -----^ Distenso. A relao seria descrita mais

- 337-

extensivamente por um grfico em que as unidades de fora (a varivel independente) so representadas em funo das unidades de distenso (a varivel dependente). Podemos, se desejarmos, considerar a causa de qualquer distenso particular como sendo a fora particular que atua no corpo. Mas, ao chamar a fora de causa da distenso, no acrescentamos qualquer informao adicional prpria relao fun cional. De fato, enquanto a lei descreve a forma exata da relao para inmeras foras e distenses, a designao de causa limitada proposio lgica - se uma fora, ento a distenso. Na relao Aquecer a gua at 100C gua ferve, a aplicao de calor pode ser considerada como causa da ebulio. Mas se persistirmos em perguntar por que a gua ferve quando suficientemente aquecida, estaremos nos referindo a uma outra relao funcional entre a presso do vapor da gua e a temperatura. Exatamente a 100, segundo nos dizem, a presso de vapor da a'gua igual da atmosfera. Isto pode ou no satisfazer nossa curiosidade sobre a ebulio da gua mas, em qualquer caso, a forma das respostas que obteremos para qualquer porque a mais ser a mesma - mais relaes funcionais. As relaes so igualmente importantes para o processo explanatrio na cincia biolgica. O acasalamento de moscas de fruta, em que macho e fmea tm olhos brancos, gera invariavelmente filhos de olhos brancos. Casal de pais de olhos brancos > prole de olhos brancos.

Existe uma relao funcional entre a cor dos olhos dos pais e a cor dos olhos dos filhos. Todas essas relaes funcionais revelam uma lgica comum. Se considerarmos a varivel antecedente nessas relaes como x e a conseqente que produzida como y sua lgica parece ser:
Se x, ento y

e seu corolrio
Se no y, ento no x.

Assim, se uma fora (x) aplicada, ento observaremos distenso (y). Mas, se nenhuma distenso foi observada (no y), ento a fora no deve ter sido aplicada (no x). Similarmente, se a temperatura da gua sobe a 100 (x) ento a gua ferve (y). Alm disso, se a gua no est fervendo (no y), ento a temperatura deve estar abaixo de 100 (no x). Finalmente, se ambos os pais tm olhos brancos (x) ento todos os filhos tero olhos brancos (y). Mas, se os filhos no tem olhos brancos (no y) ento os pais no poderiam ter, ambos, olhos brancos (no x). No devemos ficar desapontados ao aprender que as leis cientificas do uma representao exata da natureza somente quando certas condies so alcanadas. As leis cientficas se mantm num'contexto, algumas vezes amplo, algumas vezes estreito, dependendo da generalidade da relao particular; mas nenhuma lei cientfica verdadeira sob todas as condies. Alm do limite de elasticidade, a lei de Hooke falha e a distenso no mais proporcional fora aplicada. A menos que certas variveis tais como a presso atmosfrica e a pureza da gua sejam mantidas constantes, a gua

- 338-

nao ferve a 100 A irradiao da mosca de fruta complica as relaes de heredita riedade. Nas leis descritas, os termos x ey das relaes funcionais so conceitos baseados em quantidades observveis. A intimidade pela qual tais conceitos esto ligados a observveis a razo porque tais leis so chamadas empricas. Podemos observar t medir eventos que so conceituados como foras e distenses de corpos, temperatura e estados da gua, reproduo sexual e cor dos olhos das moscas de frutas. Os tipos de explicao proporcionados por leis empricas devem ser contrastados com explicaes pr-cientficas. Antes da descoberta das leis que relacionam a atividade de micro organismos doena, esta era frequentemente atribuda demnios alojados no corpo. Por muito tempo, acreditou-se que o comportamento animal e humano era devido s almas e espritos animais. Nessas explicaes pr-cientficas a doena e o compor tamento eram relacionados a eventos hipotticos (demnios e almas), que eram livres para assumir quase toda propriedade que o teorista lhes desejava impor. A falta de restries sobre a natureza hipottica desses conceitos tornou possvel que eles, em princpio, explicassem tudo. Mesmo assim, sua imunidade no-confirmao por qualquer procedimento colocou-os na posio paradoxal de, na verdade, nada ex plicarem. Em contraste com o vazio de tais explicaes fictcias, a relao funcional da cincia possui habilidades poderosas para a predio, interpretao e controle da natureza. Quando existe uma lei funcional entre x e y , se soubermos o valor de x podemos predizer o valor de y. Tendo a lei mo, sempre que suspeitarmos que x e y esto agindo no mundo cotidiano, estamos em condies de interpretar eventos reais fora do laboratrio. Finalmente, se pudermos manipular x como desejarmos, ento temos os meios de controlar y como desejarmos. No modelo da relao funcional, temos o poder e a versatilidade do empreendimento cientfico revelados de um modo surpreendente. 15.2 CAUSAS FICTCIAS DO COMPORTAMENTO

Quando examinamos as causas tradicionais do comportamento notamos que trs classes principais de causas fictcias dominaram o campo. Numa delas, o comportamento explicado por referncia a eventos observveis que so fortuitamente correlacionados com ele, tal como a posio dos planetas no nascimento, a direo das linhas na palma da mo, a proeminncia relativa de vrias protuberncias no crnio. Embora tanto o comportamento quanto o agente causai sejam observveis, qualquer relao entre eles no sistemtica e, assim, qualifica-se como acidental em vez de regular . Na segunda, o comportamento frequentemente atribudo a eventos supostamente localizados no sistema nervoso central (crebro e medula). Quando dizemos que um homem esperto porque tem crebro , que no pode trabalhar porque seus nervos esto esgotados, ou que precisa fazer um exame da cabea quando age estranhamente, estamos invocando eventos causais aparentemente localizados dentro da estrutura nervosa. Na prtica, todavia, raramente se faz a observao real desses eventos. Nestes exemplos, o sistema nervoso existe apenas como um repositrio para explicaes fictcias do comportamento. As propriedades das causas hipotticas so especificadas apenas a grosso modo e nenhuma relao especfica observada ou teorizada entre elas e o comportamento observado.

- 339 -

Na terceira, o comportamento comumentc explicado por processos mentais ii*ternos hipotticos. Diz-se que fechamos uma porta porque a queremos fechada, que assobiamos uma melodia porque temos um mpeto para assobiar, lemos um livro porque sentimos vontade de l-lo. Pelo fato de tais proposies parecerem to naturais e inofensivas, difcil notarmos que elas implicam numa forma de causa e efeito que difere marcaritemente das leis da seo 15-1. Contudo, em cada vontade , mpeto ou sentimento interno no observvel est sutilmente designado o status de uma causa de algum comportamento. Aqui, novamente, estas causas no possuem quaisquer propriedades independentes que possam ser relacionadas ou pela teoria ou pela observao, ao comportamento real a ser explicado. O mpeto e a vontade so fictcios porque so inferidos inteiramente do comportamento que se propem a explicar. O surgimento de uma psicologia cientfica , em grande parte, uma mudana de causas fictcias do comportamento para causas funcionais. Basta que examinemos os vrios procedimentos e processos dos captulos anteriores para encontrar vrias dessas relaes funcionais. Como um preldio para a anlise dos fenmenos de motivao, ser til faz.cr uma reviso desses paradigmas comportamentais familiares dc modo a enfatizar como seus procedimentos constituem uma classe importante dc causas com portamentais. 15.3 HISTRIA PASSADA COM CONTINGNCIAS DE CONDICIONAMENTO E EXTINO COMO CAUSA DO COMPORTAMENTO

Na medida em que uma histria passada com os vrios paradigmas de condicio namento operante uma maneira eficaz dc modificar o comportamento de um organismo, uma histria particular deve ser considerada uma causa genuna do com portamento. Assim, o reforamento anterior pode causar o aparecimento de uma cadeia comportamental e o declnio de outro comportamento na situao. Ao con trrio, o no-reforamento (extino) do comportamento pode levar ausncia ou baixa probabilidade de algum comportamento. Combiirmdo os procedimentos de extino c condicionamento, passamos para causas mais complexas. O controle exer cido sobre o comportamento por S^s pode ser compreendido apenas com referncia a uma histria passada de treino operante discriminativo. O surgimento de uma nova forma de comportamento pode, quase sempre, ser explicada apenas pelas condies especiais de reforamento estabelecidas por aproximaes sucessivas. Certos padres temporais caractersticos da resposta requerem uma histrica passada especfica com um esquema de reforamento intermitente. As causas do, ou aquilo que controla o comportamento, nesses exemplos, encontram-se na maneira em que o comportamento esteve relacionado ao reforamen to, no passado. Como as causas da distenso de uma mola, ebulio da gua e cor dos olhos da mosca, essas causas so melhor descritas sob a forma dc relaes funcionais. Aqui, as relaes so entre um determinado grupo de contingncias, aplicadas anterior mente, e o aparecimento de mudanas comportamentais. As mudanas de compor tamento que esto associadas a essas histrias passadas ocorrem, caracteristicamente, no tempo. Logo, as curvas que chamamos de processos comportamentais so as descries fundame itais dessas leis. Uma idia prevalentc em todas essas causas c a noo de que certos efeitos
- 340 -

comp ort amen tais so condicionais a uma certa histria de condicionamento e extino. Alguns casos gerais esto resumidos na Tabela 15-1, dc modo a incluir os paradigmas operantes dos captulos anteriores. Note que cada caso pode ser reduzido a uma combinao de apenas dois ingredientes: condicionamento e extino. A variedade de comportamentos que podem ser adquiridos e mantidos atravs dessas operaes, e a complexidade dos controles ambientais sobre o comportamento que a sua correlac com estmulos pode induzir, atestam a potncia notvel dessas duas operaes opostas. Tabela 15-1 ALGUMAS CAUSAS DO COMPORTAMENTO QUE SE ENCONTRAM NA HIS TRIA DE REFORAMENTO DO ORGANISMO CAUSA 1. Uma resposta tem uma histria de ser seguida por /eforamento SIMBOLICAMENTE R EFEITO Fora alta de R

2. Uma resposta tem uma historia de extino

R+>

Fora baixa de R

3. Uma histria passada com o procedimento de discriminao

SD R - , S* R -h

SD controla a ocorrncia de R, e toma-se um reforador

R x-b R ^ S + Ry -/-> 4. O comportamento (R^) r 2-> R2-b r 2- 5 + deve sua existncia a uma Uma nova unidade de com histria prvia de reforportamento adicionada ao R., s+ mento de seus ancestrais repertrio Ln* relacionados (Estgios sucessivos no tem po -* )

5. Uma histria passada com uma contingncia probabilistica particular

'

Um padro caracterstico de respostas no tempo

- 341 -

15.4

MOTIVOS E REFORADORES

Apesar de todo o seu poder, os procedimentos da Tabela 15-1 so inteis a menos que as conseqncias ambientais que eles proporcionam ao comportamento sejam do tipo especial que denominamos reforadores. Nas discusses anteriores, tomamos como seguro o poder reforador de eventos tais como alimento e gua, adiando at agora uma anlise das variveis que modulam suas propriedades reforadoras. a elaborao dessas variveis que constitui o campo da motivao. Podemos questionar, de incio, o que essa definio de motivao tem em comum com as concepes mais clssicas de motivao como o estudo de necessidades, vontades, aspiraes, interesses, desejos, impulsos e outras energias ou motivos do comportamento. Para o presente, notaremos apenas que estas necessidades e desejos e outros motivos parecem estar intimamente relacionados ao conceito de reforadores. Quarido se diz que um organismo necessita de alimento ou gua, a inferncia de necessidade usualmente feita a partir da observao de que provvel que um organismo, que tenha estado sem alimento ou gua por um perodo, coma e beba. Diz-se que uma pessoa deseja beber se ela pede gua ou que, de outra forma, se empenha num comportamento que tenha anteriormente produzido gua. As necessi dades e desejos referem-se ao fato de que, devido a um periodo de sua ausncia, alimento e gua tornaram-se reforadores. Fazemos uma restrio nossa anlise experimental de motivao identificando como seu domnio a anlise dos reforadores primrios apenas. A restrio serve para excluir aqueles reforadores cujo poder reforador depende de uma histria passada de condicionamento, em particular, do paradigma de discriminao No linguajar comum, naturalmente, os motivos no so sutilmente distinguidos na base de se eles se referem a reforadores primrios ou secundrios. De fato, um motivo pode referir-se a quase todos os porqus do comportamento. Uma necessidade de superar os outros, um desejo dc ateno e um desejo de possuir um automvel caro ou status social podem todos qualificar-se como motivos legtimos. No obstante o linguajar comum, as leis que governam tais motivos so aquelas que governam os reforadores adquiridos. Consequentemente, tais motivos adquiridos so mais apropriadamente tratados como fenmenos de condicionamento. O dinheiro, um bom exemplo de um tal motivo, satisfatoriamente descrito como um reforador positivo generalizado adquirido. Sua significncia reforadora depende de sua histria ou paradigma de discriminao onde sua presena estabeleceu a ocasio para Rs que, eventualmente, produziam refor adores primrios. Ateno; necessidade de poder, afiliao, realizao; competio e muitos outros motivos sociais parecem se adequar ao paradigma de reforamento secundrio descrito no Captulo 11. Logo, teremos poucas novidades para adicionar a sua anlise neste captulo. O problema dc como estudar os motivos adquiridos foi solucionado no Captulo 1 1 , atravs da formulao de um conjunto de princpios para converter qualquer situao de estmulo arbitrria num reforador condicionado. Ao estudar os re foradores primrios, preocupar-nos-emos com a elaborao de um nmero de variveis que se mostram intimamente relacionadas ao aumento e diminuio no valor de tais reforadores. Como uma ajuda para ampliar o conceito de reforamento primrio do estudante, apresentaremos, nas discusses que se seguem, uma variedade de re foradores primrios diferentes.

- 342 -

15.5

OPERAES DE IMPULSO

Uma operao fundamental que afeta o poder ou valor reforador de todos os reforadores primrios positivos conhecidos o procedimento de privar o organismo do reforador por um perodo de tempo. Numa primeira aproximao, digamos que o valor reforador de um reforador aumenta diretamente medida que aumenta a durao da privao. Nas discusses anteriores sobre os efeitos do condicionamento (Pavloviano e operante) partimos do princpio que as variveis de privao foram reguladas para dar um valor reforador moderado aos estmulos usados como reforadores. Embora trabalhando por trs do cenrio at agora, as variveis de privao tm, de fato, um papel central em tomar possveis os processos comportamentais que estudamos. A existncia deste novo grupo de variveis, do qual o comportamento depende to criticamente, tem duas implicaes para anlise comportamental que nopodemos ignorar. (1) O comportamento multi-determinado. Um cavalo pode no beber a gua que lhe apresentada porque no foi privado de gua, ou porque nunca adquiriu o compor tamento de beber gua no cocho. Mas, se ele bebe, ento deve ser porque possui o comportamento necessrio e est privado de gua. Nem privao, nem o con dicionamento passado apenas, sero suficientes para causar padres de comportamento. (2) Uma operao de privao aumenta o valor reforador de uma classe de estmulos dos quais muitas cadeias de comportamento podem depender. Quando privamos um homem de alimento, aumentamos a probabilidade de que ele coma. Mas aumentamos tambm a probabilidade de que ele pea alimento, caminhe para uma certa rua onde. h um restaurante, entre num mercado e assim por diante. Nas explicaes tradicionais de motivao este aumento concomitante na fora de muitos comportamentos a base para se considerar a privao como uma forma de dirigir, impulsionar o organismo para o reforador. Contudo, usado deste modo, o conceito de impulso tem pouco mais que um valor metafrico. Se o organismo no adquiriu o comportamento que o levar ao reforador, a privao por si prpria no resultar em reforamentos. E conveniente despir o termo impulso de suas conotaes comuns e dar-lhe uma redefinio tcnica que enfatize a habilidade de certas operaes em estabelecer reforadores. A palavra impulso usada para indicar que, como um resultado de alguma operao efetuada no organismo (por exemplo, privao), algum S torna-se um reforador, S+. Assim definido, impulso uma palavra como reflexo, significando uma certa relao entre variveis. Se concordarmos em empregar a palavra apenas neste sentido tcnico, devemos ter cuidado e evitar dizer que um organismo respondeu por causa de um impulso. Sendo uma relao entre alguma operao e o comportamento, um impulso no pode causar qualquer comportamento. Pode-se efetuar operaes apropriadas de privao para cada reforador primrio. A observao casual sugere, e experimentos confirmam, que muitas outras operaes tm efeitos semelhantes privao de reforadores. Exerccio forado, diminuio da temperatura da sala, injeo de insulina, leses cirrgicas numa regio localizada do crebro, estimulao de alguma regio do crebro; administrao de certas drogas, oferecimento de aperitivos, introduo de um animal que est comendo junto ao primeiro todos podem tornar o alimento um reforador e, assim, so operaes de impulso.
- 343-

Assim como existem vrias operaes para estabelecer e aumentar o valor dos reforadores, tambm h operaes de impulso para reduzir ou eliminar o valor do reforador. Podemos cham-las de operaes de reduo do reforador. A mais univer sal delas a saciao - apresentao repetida do reforador at que ele perca o seu poder de reforar. Certas drogas, a injeo de sangue de animais saciados, eventos que produzem emoo, leses numa parte localizada do crebro e estimulao numa determinada regio do crebro, reduzem o valor reforador do alimento. Cada reforador primrio tem suas prprias operaes particulares de estabele cimento e reduo do reforador. O paradigma [15.1| esquematiza algumas operaes que tornam a gua um reforador. Privar de todos os lquidos Forar a excreo Injetar atropina Alimentar com sal Obstruir os dulos salivares Estimular o crebi o em certa regio

[15.1]

H uma forte tendncia para se dizer que essas operaes de impulso tornam o organismo sedento e, portanto, ele bebe. Mas a sede um agente causai dbio. Tudo o que vemos que um nmero de operaes tem um efeito similar tornam a gua um reforador. Como conceitos explicativos, o termo sede e seu correlativo fome dificilmente so sustentveis, simplesmente porque eles no apontam qualquer relao emprica ou terica entre o comportamento e outros eventos observados ou especificados. Mesmo como termos descritivos, eles podem prender em armadilhas o descuidado. Quando dizemos que um homem est sedent quando o vemos beber, ou faminto quando o vemos comer, estamos inferindo que gua e alimento tor naram-se reforadores por alguma operao de privao. Mas, de fato, as pessoas comem e bebem por muitas razes. Elas podem encontrar varias presses sociais para assim o fazer, podem faz-lo para reduzir a ansidade, ou podem faz-lo tal como uma criana que bebe seu leite ou come seu espinafre para chegar a reforadores como a sobremesa. 15.6 PERIODICIDADES NO VALOR DO REFORAMENTO Considere a seguinte lista alfabtica de alguns dos mais conhecidos reforadores primrios para sujeitos humanos e certos animais superiores gua Alimento Amor,e Afeio Ar Atividade Atividades maternas Calor Novidade Sexo Sono

O estudo experimental dos reforadores primrios comea com o de que todos os itens desta lista, algumas vezes, so reforadores e Essa variabilidade facilmente vista num reforador como o alimento, reforador passa por ciclos medidos em horas; menos facilmente vista
-3 4 4 -

a observa outras no. cujo valor no ar, cuja

periodicidade so ciclos pequenos de respirao dos animais, medidos em segundos ou menos. Todavia, o fato geral claro algumas vezes, alimento, gua, ar, sexo e assim por diante so reforadores, outras no o so. A anlise experimental da motivao uma tentativa sistemtica de relacionar essa variabilidade a variveis observveis no ambiente presente ou passado do organismo. Em resumo, pesquisamos as leis comportamentais da motivao. A determinao da natureza cclica dos reforadores primrios o primeiro passo em tal anlise. Nem os homens, nem os animais comem continuamente. Quando provido com um estoque inesgotvel de alimento, q rato normal come periodicamente. A natureza cclica do comer vista na Fig 15.1 . Cada resposta de presso barra

Figura 15.1. Comportamento cclico de alimentao apresentado pelo rato (Anliker e Mayer, 1956)

emitida pelo rato produz uma pequena pelota de alimento e uma contingncia de reforamento contnuo mantida permanentemente em efeito. Pode-se observar na Fig. 15.1 que uma refeio inicia-se com uma taxa de presso constante, mantida entre 3-5 horas (portanto, comendo). Da em diante, a taxa de presso-comer declina, terminando usualmente numa completa cessao de presso-comer por umas 6 horas. Deixando-o beber gua quando preferir, o rato produz ciclos caractersticos de beber e no beber, como indicam as curvas cumulativas do beber da Fig. 15-2. H relativamente poucas respostas de beber entre as 6 e as 18 horas, isto , durante o dia O beber, ento, aumenta gradualmente e, em geral, atinge o seu mximo por volta de meia-noite.

- 345-

ligura 15.2. Curvas cumulativas do beber para quatro ratos. O grfico mostra perodos de beber e no beber gua destilada que estava constantemente disponvel (Young e Richey, 1952).

O sono humano caracterizado por periodicidades que mudam nas vrias idades. A Fig. 15-3 mostra graficamente como os ciclos mudam medida queosujeito humano envelhece. O ciclo muda tanto seu perodo (nmero de sonecas por dia) como sua fase (quando a primeira soneca comea) com a idade. 15.7 PARADIGMAS DE PRIVAO E SACIAO A descoberta de uma perioricidade regular no valor reforador representa apenas o incio de uma anlise experimental da motivao. Um progiesso maior alcanado quando se obtm o controle direto dos ciclos. A operao de privao fortemente identificada com motivao porque a supresso de reforadores primrios um mtodo universal para variar o valor reforador de todos os reforadores primrios conhecidos. Quando privamos um organismo de uma classe de reforadores primrios por um perodo fixo de tempo e, ento, permitimos o acesso ao reforador, podemos observar o efeito que a nossa operao de privao tem sobre o comportamento. No caso de alimento e gua, o comportamento real de consumir o reforador quase sempre de interesse.Depois de um perodo de privao, um animal come e bebe uma certa quantidade de alimento e gua e, ento pra. Dizemos, assim, que o animal est saciado. A descrio comportamental desse processo de saciao assume,

- 346-

Um ano

Quatro auos

Dez anos

Adulto

I
18

I
meia-noite

I
meio-dia

I
18

Figura 15.3. Ciclos de sono em idades diterentes (Kleitman, 1963).

convenientemente, a forma da mudana na taxa de uma resposta que produz alimento ou gua em contingncias de crf. Uma vez que cada resposta reforada, a taxa de comer indicada pela taxa de emisso dessa resposta. As curvas de saciao de alimento no tm todas a mesma forma, mas a forma mais comum parece ser a de uma taxa constante de comer seguida por uma cessao um tanto abrupta (Smith e Smith, 1939 ; Reese e Hogenson, 1962). Na Fig. 15-4, so vistas vrias curvas de saciao da resposta de bicar uma chave de um pombo, reforada com alimento. As curvas foram obtidas depois de vrios perodos de privao de alimento, como indicado. Por apresentarem uma diminuio na taxa, as curvas de saciao podem ter uma semelhana superficial com as curvas de extino. A forma de uma curva de saciao , todavia, caracterizada por uma cessao muito mais abrupta da taxa (ver Fig. 15-4). Alm disso, se a cadeia de comportamento adquirido examinada com ateno, notar-se- que ela permanece intacta medida que o processo prossegue. O processc de extino, por outro lado, est associado com uma desintegrao marcante da cadeia de comportamento. O paradigma da saciao pode ser esquematizado como se segue: DADOS: 1 - Privao de um reforador primrio (ou alguma outra operao apropriada para estabelecer o reforador). 2 Um comportamento apropriado, previamente fortalecido por este reforador. PROCEDIMENTO: R -> S + PROCESSO: Uma taxa razoavelmente constante de R, seguida por uma cessao abrupta. RESULTADO: Cessao da taxa de R.

-3 4 7 -

Figura 15.4. Curvas individuais de saciao de alimento. As curvas esto assinaladas com o nmero de horas de privao anterior de alimento. Um trao oblquo acima de cada curva indica que o animal no comia aps a resposta de bicar (Reese e Hogenson. 1962).

Note que, em geral, o resultado tambm difere do resultado da extino. Enquanto a extino volta o comportamento ao nvel operante, a saciao volta-o a um nvel prximo de zero que pode ser inferior ao nvel operante. Saciados de todos os outros reforadores, os organismos frequentemente vo dormir. 15.8 A MENSURAO DOS IMPULSOS Frequentemente, referimo-nos ao fato de que um indivduo est mais fortemente motivado algumas vezes do que outras e, de fato, inferimos um continuum de fora motivacional. Podemos traduzir essa proposio numa equivalente relativa a um continuum de fora do impulso. A noo de que um impulso pode variar em fora, de
- 348-

um valor muito baixo a um valor muito alto, parece referir-se, principalmente observao de que os reforadores primrios podem variar suas foras de valores muito baixos a muito altos. Assim dizemos que uma pessoa est fortemente motivada para alimento quando o alimento um reforador forte para o comportamento instrumental daquela pessoa. Similarmente, uma pessoa que est altamente motivada para o sexo empenha-se frequentemente em comportamento que produz reforadores sexuais. Note que, nestes exemplos, apesar de falarmos em termos dc uma alta fora de motivao, tudo o que realmente observamos a capacidade de um conjunto particular de reforadores primrios fortalecer e manter o comportamento. Na medida em que se puder demonstrar que essa capacidade varia de baixa a alta, dependendo das circunstncias, podemos indicar o seu valor por uma varivel que chamamo, dc valor reforador primrio dos estmulos. Como podemos medir o valor reforador dos estmulos? Parece que no h uma maneira de med-lo, salvo pela medida dos efeitos comportamentais dos estmulos quando eles so contingentes a respostas operantes. Assim, muitas das medidas comportamentais familiares citadas nos captulos anteriores, tais como a taxa de resposta e resistncia extino, sero teis para avaliar a fora da motivao. Segue-se uma curiosa implicao dessa versatilidade. O comportamento que o experimentador escolhe para medir no pode, sozinho e em si mesmo, determinar que fenmeno est sob estudo. A presso barra, bicar uma chave e a vocalizao estou com fome tm significado somente quando esto associados a outros eventos. Em termos mais gerais, esta a razo porque a prpria disciplina da psicologia no pode ser definida s como o estudo do comportamento. Ela considerada mais adequadamente como o estudo do comportamento na medida em que este se relaciona com o ambiente. Em captulos anteriores, as taxas de respostas de operantes representativos foram usadas fre q u e n te m e n te para estudar o condicionamento, extino, discriminao, encadeamento e outros fenmenos, dependendo do procedimento particular imposto ao organismo quando o comportamento estava sendo medido. Agora, descobrimos um outro emprego para as medidas operantes. Quando os parmetros de condicionamento so mantidos constantes e o comportamento est relacionado a operaes de impulso, as propriedades do comportamento que est sendo emitido podem servir como uma medida do valor reforador relativo (ou fpra) de reforadores primrios. Note bem como essa estratgia experimental contrria quela utilizada em captulos anteriores, onde as operaes de impulso eram sempre mantidas constantes e as contingncias de reforamento eram manipuladas. Empregando aquela metodologia a taxa de comportamento era tomada geralmente para representar a fora do comportamento. Na metodologia da motivao, a taxa de comportamento ser frequentemente tomadc para representar a fora do reforador. Evidentemente, o significado dc comportamento derivado apenas pela considerao da varivel ou variveis s quais c comportamento est sendo relacionado. Discutiremos abaixo algumas tcnicas comportamentais que tm sido usadas para medir o valor reforador primrio dos estmulos e, assim, por inferncia, a motivao. Ao mesmo tempo, ilustraremos uma variedade de respostas e reforadores primrios diferentes.
1. Resistncia saciao

Nossa intuio nos diz que quanto mais sedentos estivermos, mais gua

- 349-

poderemos consumir c que quanto mais famintos estivermos, mais alimento poderemos comer. Como podemos quantificar essas impresses? Uma forma examinar as propriedades do processo de saciao em relao durao de tempo em que se tenha impedido a um indivduo o acesso a todos os reforadores de uma certa classe. Com efeito, examinamos curvas de saciao obtidas a vrios graus de privao. Suponha que, depois de um perodo de privao, estabeleamos uma contingncia de modo que alguma cadeia arbitrria de comportamento possa produzir o reforamento. Ento, ou o tempo que o organismo leva para alcanar algum critrio arbitrrio de taxa baixa ou o nmero de respostas reforadas emitidas antes de ser atingido o critrio de taxa baixa, proporcionariam uma medida da resistncia saciao. evidente que, se contingncias de crf esto em efeito e se a quantidade de reforamento mantida constante, a ltima medida seria equivalente quantidade de substncia consumida. A resistncia saciao calculada de modo anlogo resistncia, extino (seo 5.5). Usando o me'todo de resistncia saciao, Siege (1947) mediu a quantidade de gua bebida pelos ratos num perodo de 5 minutos em funo de quanto tempo os animais haviam sido privados de gua. A reiao obtida vista na Fig. 15-5. De 0 at 48 horas de privao, a resistncia saciao, medida pela quantidade de gua consumida, aumentou. A taxa de aumento, todavia, parece diminuir depois de 12 horas. Resultados similares podem ser obtidos para privao de alimento. Com perodos muito grandes de privao, todavia, a quantidade de alimento ingerido declinar, presumivelmente como um resultado da contrao do estmago e inanio. Dentro de certos limites, entretanto, a resistncia saciao aumenta medida que o tempo de privao aumenta. A resistncia saciao, embora uma tcnica til, no sempre inteiramente satisfatria para medir o valor reforador. Uma dificuldade encontra-se nas complicaes fisiolgicas que ocorrem com longos perodos de privao, causando,

N m ero de h o ras de privao de gua

Figura 15-5. Quantidade de gua ingerida por ratos num pen'odo teste de 5 minutos m funo do nmero de horas em que no tiveram acesso a qualquer lquido (segundo Siegel, 1947).

-3 5 0 -

algumas vezes, um consumo reduzido. Outra dificuldade surge se desejarmos saber quo forte o reforador em vrios pontos do processo de saciao. Em qualquer nvel de privao, um organismo pode comer ou beber numa taxa constante e alta at que o processo chegue a uma cessao abrupta (Fig. 15-4). Logo, difcil avaliar a fora momentnea do reforador atravs da inspeo do processo dc saciao. As curvas de saciao tendem a diferir principalmente nos seus pontos terminais, c no nas suas inclinaes (Fig. 15-4). Ento, somos forados a esperar at que a saciao seja alcanada para sabermos quo faminto ou sedento o animal estava no incio.
2. Taxa de respostas reforadas intermitentemente.

Uma tcnica em geral mais conveniente para medir o valor reforador observar a taxa de resposta apresentada por um organismo quando o comportamento est sendo intermitentemente reforado. Um esquema de intervalo, por exemplo, pode ser programado para fornecer uma taxa de reforamento bastante baixa, de modo que o comportamento possa ser mantido sem a ocorrncia de saciao por um longo perodo de tempo. Skinner (1938) usou essa tcnica para avaliar os efeitos comportamentais de quantidades especificadas de alimento dadas aos ratos, antes do teste. Primeiro, os ratos foram privados de alimento por 23 horas e, ento, durante vrios dias, foram alimentados com quantidades diferentes de alimento logo antes do teste com as contingncias de intervalo. Os resultados para um desses ratos aparecem na Fig. 15-6. Os nmeros associados a cada curva referem-se quantidade de alimento, em gramas, dado ao rato previamente. evidente que, quanto mais o rato se alimentava imediatamente antes do trabalho, menor era a taxa de resposta no esquema. F. C. Clark (1958) estudou os efeitos de vrios graus de privao de alimento sobre as taxas de respostas estabilizadas , em intervalo varivel (IV), em ratos.

Figura 15-6. Quatro registros dirios de um rato sob contingncias de intervalo, privado por 23 horas, e alimentado com diferentes quantidades de alimento imediatamente antes do teste (Skinner, 1938).

- 351 -

Vrios IVs diferentes foram usados. Clark obteve as curvas da Fig. 15-7 quando representou a taxa de respostn dos ratos em funo das horas de privao. O efeito do aumento de privao foi o dc aumentar a taxa de resposta sob todos os esquemas de IV. A maneira pela qual a privao e os esquemas de reforamento interagem para determinar as taxas de resposta da Fig. 15-7 de algum interesse. A similaridade na forma das curvas da Fig. 15-7 significa que a privao interagiu com o esquema IV de modo que, cm todos os nveis de privao, a razo entre a taxa num IV c a taxa no outro IV era uma constante. Por exemplo, com 5 horas de privao, a taxa em V-3 era cerca de 4 R/min. e em IV-1 era 2,5 vezes isto, cerca de 10 R/min. Quando a privao foi aumentada para 20 horas, as duas taxas eram aproximadamente 6 e 15 respectivamente, de modo que a taxa em IV 1 era ainda 2,5 vezes maior do que a taxa em IV-3. No experimento de Clark, o intervalo mximo de privao foi de 23 horas. Heron e Skinner (1937) pesquisaram sobre a privao alimentar prolongada, em ratos, que se estendia at a morte do animal. Eles descobriram que a taxa de resposta reforada com alimento em IF aumentava progressivamente durante o perodo de inanio at atingir um mximo, depois do que declinava rapidamente e logo se seguia a morte como resultado da inanio. A taxa mxima no ocorreu no mesmo ponto para todos os ratos. No experimento de Heron e Skinner, ela ocorreu entre 4 e 12 dias. O resultado apoia as teorias que equiparam a motivao a um deficit corporal

T em po de privao (h o ras)

Figura 15-7. Taxa mdia de resposta em IV em funo do tempo de privao. O parmetro o IV mdio (Clark, 1958).

- 352-

(necessidade ). Embora o deticil alimentar do rato continue a aumentar atravs da privao, parece que o valor reforador do alimento no aumenta. Veremos mais tarde quais outras medidas comportamentais substanciam essa concluso. 3.Resistncia extino. A taxa dc resposta durante a extino e outras medidas de resistncia extino (seo 5.5) tm sido usadas, com freqncia, para medir os efeitos comportamentais da nrivao e outras operaes similares. Crocetti (1962) treinou ratos com 7 horas de privao de alimento a pressionar uma barra, reforando-os com alimento. Os sujeitos foram, ento, distribudos em cinco grupos e cada grupo foi extinto depois de uma durao diferente de privao. Na Fig. 15-8, visto o nmero total de respostas emitidas por cada grupo, depois de 3 horas de extino. A curva mostra o aumento usual na taxa de resposta medida que o tempo de provao aumenta. Mas observe que a forma dessa curva difere daquelas da Fig. 15-7. Diferenas como essas levantam o problema sistemtico de qual ndice comportamental representa melhor o valor do reforador. No presente, no h uma soluo definida para esse problema e os teoristas so frequentemente forados a adotar a posio de que as medidas que se correlacionam melhor entre si representam melhor a fora do reforamento.

H oras d e Privao

I igura 15-8. A relao entre horas de privao e o nmero de respostas dc presso barra durante a extino (segundo Crocetti. 19 ^ A

4. Aquisio

Poderamos esperar que, com um aumento no poder do reforador, houvesse um aumento concomitante na velocidade do processo de aquisio. Quando a aquisio envolve uma longa cadeia de respostas (por exemplo, o comportamento de percorrer uma pista) ou uma discriminao, essa predio verificada. Broadhurst (1957) treinou ratos a percorrerem, submersos, um labirinto equivalente ao labirinto cm Y. Os ratos eram submersos na caixa de partida, a ficando por alguns segundos permitindo-se, ento, que nadassem debaixo dagua at ao ponto de escolha. L.

- 353-

era-lhes apresentada uma discriminao luz-escuro, com contingncias do tipo discutido em relao ao aparelho de saltar de Lashley (seo 10.3). Se, no ponto de escolha, o rato nadasse para o lado claro, encontrava uma porta aberta que permitiria o acesso para um lugar seco. Se, todavia, nadasse para o lado incorreto, encontrava uma porta trancada e tinha de nadar de volta para o ponto de escolha e, ento, dirigir-se para o outro brao do Y para sair. Todo o procedimento foi efetuado debaixo dgua. O procedimento , esquematicamente,

onde Sa = na caixa de partida, porta fechada Sb = na caixa de partida, porta aberta Rg =nacjar para 0 ponto de escolha $D = H O RD = virar direita Se = ~IB RE virar esquerda. S+ = lugar seco onde Tx a varivel independente, a privao de ar por Tx segundos. Broadhurst variou tambm a diferena de intensidade entre as duas partes do estmulo visual do ponto de escolha. Quanto maior essa diferena, mais fcil a tarefa discriminativa (Frick, 1948). Logo, uma grande diferena de iluminao corresponde a uma discriminao fcil; uma diferena pequena corresponde a uma discriminao difcil .

Figura 15-9. Nmero de escolhas discriminativas corretas em 100 tentativas de aquisio em funo da privao anterior de ar. Os dados so de tres discriminaes que variam em dificuldade (segundo Broadhurst, 1957).

- 354 -

Os resultados da aquisio so apresentados na Fig. 15-9. E visto o nmero de escolhas corretas em 100 tentativas de aquisio das duas discriminaes. Para a diferena grande de iluminao (discriminao fcil), podemos resumir os resultados dizendo que, quanto maior o tempo de privao de ar, mais eficiente era o desempenho de aquisio. Mas quando uma pequena diferena de iluminao era usada (discriminao difcil), a aquisio era mais eficiente num valor mdio (2 seg.) de privao de ar e menos eficiente com privaes maiores e menores. Se esse resultado puder ser generalizado, parece que com tarefas difceis possvel ter-se muito mais motivao para um desempenho timo. Certamente, as diferenas na forma entre as duas curvas da Fig. 15-9 indicam que o mtodo de aquisio deve ser usado cauteiosamente como uma medida da fora do reforador. Por exemplo, um resultado bem diferente foi obtido numa situao que requeria o nadar debaixo dagua, em linha reta, sem contingncias discriminativas. Ento, numa faixa de privao anterior de ar de 0 a 10 seg, os ratos nadavam tanto mais rpido quanto maior a privao anterior de ar. 5. Superar obstculos. Quanto mais reforador um estmulo, de se esperar que um organismo supere mais obstculos, impedimentos e barreiras para produzir o reforador. Esta a razo da Caixa de Obstculo de Colmbia vista na Fig. 15-10. Um rato colocado na caixa de partida e uma grade eletricamente carregada interposta entre ele e o alimento, gua ou um companheiro localizado na caixa objetivo (o rato foi previamente treinado a correr para a caixa objetivo sem receber qualquer choque eltrico). Se o rato atravessa a grade, ele tem um breve acesso ao reforador e , ento, recolocado na caixa de partida para outra tentativa. O nmero de vezes que ele atravessa a grade eletrificada em 30 minutos fornece uma medida da fora do comportamento. Warden (1931) pesquisou sobre vrios reforadores primrios e procedimentos de privao com este aparelho. Ele acreditava que esta era uma maneira de comparar objetivamente as foras mximas de vrios reforadores primrios. Um grupo interessante das funes de Warden aparece na Fig. 15-11.

Figura 15-10. A caixa de Obstculo de Columbia. H uma grade eletrificada (B) entre o compartimento do rato (A) e um reforador colocado na caixa objetivo (C)
( segundo Warden, 1931, de Harlow, 1948 ).

- 355-

Atravs dessas funes, vemos que se as operaes so efetuadas por bastante tempo, o comportamento que produz o reforador chega a uma fora mxima e, ento, declina. Warden sups que as alturas relativas dos mximos poderiam ser interpretadas como significando que impulsos para gua e alimento so mais fortes do que o impulso para sexo. Mas, esta concluso justificvel? Devemos nos lembrar de que as funes comportamentais dependem de muitas variveis alm daquela particular que o experi-

Dias d e privao

Figura 15-11. Nmero de travessias de uma grade eletrificada em funo dos dias de privao do reforador primrio apropriado (segundo Warden, 1931).

mentador est pesquisando. O valor reforador, em particular, depende de fatores tais como a qualidade e quantidade de reforamento. A concluso de Warden suponha que, de algum modo, esses fatores haviam sido equacionados para sexo, alimento e gua, de maneira que a privao era a nica varivel na situao. Mas at que ponto, alm do mais trivial, pode-se afirmar que (digamos) exposies de 10 segundos a um rato-femea, um recipiente de gua e um pedao de queijo so iguais? E mesmo que fosse encontrada alguma forma para igualar dois reforadores, os processos de saciao associados a cada classe de reforador so, quase certamente, to diferentes que a mdia de travessias numa sesso de 30 min refletiria uma composio diferente de valores reforadores para cada reforador. Essas consideraes indicam que a classifica o de Warden dos impulsos para gua, alimento e sexo no deve ser tomada muito seriamente. A questo de qual impulso o mais forte pode nem mesmo ser experimentalmente significante.
6 . Tcnica do Trabalho Mximo.

- 356-

A tcnica do trabalho mximo semelhante, em linhas gerais, caixa de obstcu lo, mas evita um dos efeitos colaterais indesejveis desta ltima a contaminao dos resultados pelos efeitos emocionais do choque eltrico. A tcnica do trabalho mximo est baseada na noo de que, quanto mais forte o reforador, mais trabalho o indivduo efetuar para obt-lo. Hodos (1961) delineou um procedimento engenhoso no qual um organismo trabalha num esquema de reforamento em razo, onde o valor real da ra zo aumenta progressivamente com cada reforamento sucessivo. Num experimento, a sesso iniciava com uma razo 2 e cada reforamento sucessivo aumentava razo de mais 2, de modo que os animais deveriam emitir 2 respostas para o primeiro reforamen to, 4 para o segundo, 6 para o terceiro, e assim por diante. Eventualmente, atinge-se uma razo to alta que o animal se recusa a continuar trabalhando. O ponto em que is to ocorre chamado de ponto de quebra, definido no trabalho de Hodos como 15 mi nutos sem nenhuma resposta. Usando ratos como sujeitos e leite condensado para o re foramento, Hodos manipulou o esquema de privao de seus sujeitos, alimentando-os todo dia apenas com alimento suficiente para manter o peso de seu corpo numa percen tagem fixa de seu peso com alimento livre. Assim, um rato mantido a 80 por cento de seu peso normal est fortemente privado; um rato mantido a 95 por cento de seu peso normal est apenas um pouco privado. Este procedimento comumente empregado pa ra controlar a privao de sujeitos experimentais, e alguns acham que ele permite um controle um pouco melhor da motivao do que men tendo os sujeitos com uma dura o fixa de privao, digamos 23 horas. A medida do comportamento usada por Hodos foi o nmero de respostas na ltima razo completada antes do ponto de quebra. Esta razo final a razo mxima que o rato poderia completar sob as condies do experi mento. A Fig. 15-12 mostra que, medida que os ratos estavam mais privados, eles com pletavam uma razo mxima maior. Interpretamos isso como significando que com uma privao maior o rato apresentar maior quantidade total de trabalho.
7, Adulterao do reforador.

Quando estamos ligeiramente famintos, somos muito seletivos com relao aquilo que comemos. Eventualmente, medida que ficamos mais famintos, nossos padres so bre aquilo que aceitaremos sero menos exigentes. Se estivermos com uma privao mui to grande, comeremos qualquer coisa. Essas impresses sugerem que o impulso poderia ser medido pela quantidade de uma substncia desagradvel que pode ser misturada com o alimento de modo a fazer o organismo parar de consumir o alimento adulterado ou de trabalhai por ele. Os pesquisadores com interesse nas relaes crebro-comportamento tem comu mente recorrido destruio experimental (leses) de pequenas regies localizadas dosistema nervoso a fim de localizar regies especficas do crebro associadas a comporta mentos especficos. Numa regio profunda do crebro (o ncleo ventro-medial do hipotlamo) tal destruio experimental produz um imal que, depois de reabilitar-se da ci rurgia, come vorazmente. Num perodo dc dois meses, ele dobrar o seu peso se tiver acesso contnuo ao alimento. (Teitelbaum, 1955 ). Embora tais ratos operados comam quantidades enormes de alimento e se tornem obesos, Miller, Bailey e Stevenson (1940) mostraram anteriormente que esses ratos nao trabalham para obter alimento em esque mas de razo tanto quanto trabalhariam ratos normais.

- 357 -

120
Rato SO
R ato 77 I

80-

100

95

90

85

80

P ercentagem do peso com a lim e n to livre

Figura 15-12. Razo mxima que produz o leite e que os ratos emitiro, em funo do grau dc privao de alimentos (Hodos, 1961).

Essa uma das vrias descobertas a mostrar que a quantidade de alimento consumido (resistncia saciao) e o trabalho realizado pela obteno de alimento no esto perfeitamente correlacionados. Miller, Bailey e Stevenson tomaram os dados da razo como significando que os ratos obesos no estavam to famintos quanto os ratos normais, embora, se o alimento estivesse livremente disponvel, eles consumissem relativamente muito mais alimento. Teitelbaum utilizou o mtodo de adulterar o alimento do rato com uma pequena quantidade fixa de quinino (uma substncia que sujeitos humanos acham amarga) para averiguar interpretao de Miller, Bailey e Stevenson. Ele descobriu que, durante os dois meses depois da operao, quando os ratos estavam se tomando obesos, o quinino no detinha seu consumo anormal de alimento. Em outras palavras, durante este perodo no qual os ratos turnavam-se muito gordos, o alimento era um reforador forte. Mas, uma vez que os ratos tornavam-se obesos, uma quantidade de quinino muito pequena para afetar o consumo de alimento pelos ratos normais, detinha completamente o comer dos animais obesos. Parece que o alimento menos reforador para o rato completamente obeso do qus para o rato normal. Mesmo assim, se se d acesso continuo a alimentao no adulterada, o animal obeso comer muito mais sua resistencia saciao maior que a do normal.
8. Preferncia.

Suponha que seja possvel emitir uma, mas no ambas, de duas cadeias de comportamento. Na medida em que um organismo emite o comportamento que produz um reforador em vez de e m itir o comportamento que produz um outro, dizemos que j tem uma preferncia pelo primeiro reforador. Se a quantidade de esforo para completar ambas as cadeias aproximadamente a mesma, tal preferncia poderia ser considerada como uma expresso do valor reforador superior do primeiro reforador. Assim, o comportamento de preferncia torna-se um mtodo para avaliar o valor reforcador relativo de dois ou mais reforadores.

- 358-

Quando as glndulas supra-renais de ratos so removidas cirurgicamente, ocorre uma mudana drstica na balana inica de sdio e potssio. A menos que uma grande quantidade de sdio seja ingerida diariamente, o animal logo morrer. Quando a operao realizada, os ratos mudam sua preferncia normal por gua para solues salinas (clo reto de sdio) e ingerem grandes quantidades de soluo salina, conseguindo, assim manterem-se vivos e sadios. Esta mudana de comportamento a evidncia de que a operao age de modo a aumentar o valor reforador do sal.
Sumrio.

Descrevemos brevemente vrios mtodos, mostrando que vrios tipos de compor tamento variam de uma maneira ordenada com mudanas na privao, saciao e ope raes associadas. Parece existir um conjunto de medidas comportamentais que, dentro de certos limites, covaria com a privao do reforador.Por exemplo, quando se aumenta a privao de alimento, o indivduo trabalha mais depressa num esquema de intervalo de reforamento alimentar, realiza um total maior de trabalho (razo progressiva), supera mais obstculos e adulteraes do reforador ou adquire mais rapidamente uma nova habilidade. Resumimos isto no Diagrama 115.21. I 15.2|

Operao de estabele cimento do reforador Mais trabalho realizado Um reforador de qualidade inferior tolerado Maior preferncia pelo reforador. A covariao sistemtica em um nmero de medidas comportamentais independentes em relao a uma nica operao (por exemplo, privao) fornece uma base para a introduo de um conceito que ir resumir e denominar essa covariao. O termo valor reforador, para o qual, intencionalmente, adiamos uma definio formal at agora, justamente este conceito. Pode-se dizer que o valor do reforamento denota a covariao dos comportamentos do lado direito de [ 15.2]. Estamos agora em condies de fundir os Diagramas [15.1] e [15.2], pois o significado do lado direito de [15.1 ] expresso mais exatamente por [15.2]. Similarmente, o lado esquerdo de [15.2] mais adeauadamente referido em [ 15d} . O verdadeiro conceito de impulso pode agora ser formalmente definido como a conjuno (relao) dos termos dos Diagramas [15.1] e [15.2]. Isto e\ um impulso c a relao entre uma operao de estabelecimento do reforamento e o valor reforador de uma classe de estmulos. Mas podemos, agora, apreciar a grande diversidade de in formao que o termo impulso contm. O conceito traz consigo um gr^u de complexi dade que no dve ser esquecido quando usarmos a palavra impulso sozinha. Se, de fato,
- 359-

compreendermos completamente o seu status como um conceito abstrato dc compilao, ser pouco provvel que o empreguemos metaforicamentcTio sentido de incitao ou fora que dirige, impulsiona o organismo , ou como uma causa do comportamento. Similarmente, evitamos referncias sua localizao (j que uma abstrao no tem localizao) ou sua satisfao (pois, como pode uma abstrao scr satisfeita? ). Nenhuma das metforas de uso comum apropriadamente aplicada ao conceito de ilmpulso que explicamos. O termo mostra uma relao complexa e significa, nada mais nada menos, que Diagramas como [ 15.1 ] e 115.2]. REFERNCIAS PARA O CAPITULO 15 nliker, J., and Mayer, J. perant conditioning tchnique for studying feeding patterns in normal and obese mice. /. appl. P h y s i o l 1956, 8, 667-670. Broadhurst, P. L. Emotionality and the Yerkes-Dodson law. /. exp. Psychol, 1957, 54, 345-352. Clark, F. C. The effect of deprivation and frequency of reinforcement on variable interval responding. /. exp. Anal. Behav., 1958, 1, 221 228. Crocetti, C. P. Drive level and response strength in the bar-pressing ap paratus. Psychol. Rep., 1962, 10, 563-575. Frick, F. C. An analysis of an operant discrimination. / . Psychol., 1948, 2 6 ,9 3 -1 2 3 . Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews (E d .), Methods of psychology, New York: Wiley, 1948. Heron, W. T., and Skinner, B. F. Changes in hunger during starvation. Psychol. Rec., 1937, 1, 51-60. Hodos, W. Progressive ratio as a measure of reward strength. Science, 1961, 134, 943-944. Kleitman, N. Sleep and wakefulness, (rev. and enlarged ed.) Chicago: Univer. of Chicago Press, 1963. Miller, N. E., Bailey, C. J., and Stevenson, J. A. F. Decreased hunger" but increased food intake resulting from hypothalamic lesions. Science, 1950, 11 2 ,2 5 6 -2 5 9 . Reese, T. W., and Hogenson, Marilyn J. Food satiation in the pigeon. /. exp. Anal. Behav., 1962, 5, 239 245. Siegel, P. S. The relationship between voluntary water intake, body weight loss, and number of hours of water privation in the rat /. comp, physiol. Psychol., 1947, 40, 231-238. Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938. Smith, M argaret F., and Smith, K. U. Thirst-motivated activity and its extinction in the cat. /. gen. Psychol., 1939, 21, 89-98. Teitelbaum, P. Sensory control of hypothalamic hyperphagia. J. comp, physiol. Psychol., 1955, 48, 156-163.
-3 6 0 -

Captulo 16

MOTIVAO 1 1

Diz-se frequentemente que os drives (1) ativam ou do energia ao organismo, e (2) dirigem-no para um objetivo. Em vista de nossa definio no captulo anterior de drive como sendo uma relao sumria entre dois grupos de observveis (veja diagramas (15.1) e(15.2) , somos forados a rejeitar a noo metafrica de que um drive por si s possa ativar ou dirigir um organismo. Contudo, no devemos ser to drsticos ao ponto de rejeitar tdas as idias que envolvem a ativao e direo. A partir da anlise, algumas podem se referir a propriedades fundamentais do comportamento, que negligenciamos at agora em nossa discusso de motivao. * 16.1 ASPECTOS DE ATIVAO F DIRECIONAIS DA MOTVAO Na terminologia presente, a ativao pode ser interpretada como um aumento na chamada atividade difusa geral do organismo. Tal atividade, no rato, compreende toilete, locomoo, fungar, mudanas dc posio, explorao e assim por diante. Realmente, o nvel operante de respostas incondicionadas, estudado em captulos anteriores, uma forma desse tipo de atividade. Como nem o reforo passado nem o presente, para essas atividades, esto aparentes, os comportamentos so frequentemente mencionados como atividade espontnea. Espontneo provavelmente um nome mal empregado desde que, como veremos, essas atividades podem ser experimentalmente controladas em alguma extenso. Referir-nos-emos a elas, daqui em diante, como atividades gerais. Um aparelho conhecido como roda de girar (ou roda de atividade) tem sido usado, desde o incio do sculo, para estudar a atividade geral em pequenos mamferos (ratos, cricetos e camondongos). A roda (fig.16-1) quase sempre ligada gaiola-viveiro do organismo e o animal c livre para entrar na roda a qualquer hora e correr. A questo de se a motivao est relacionada ativao abordada de uma forma direta pelo estudo da relao de vrias operaes de drive atividade de correr na roda. Um resultado representativo a descoberta de Richter (1922), de que a atividade aumenta regularmente com a privao de alimento at o terceiro dia de privao (72 hr), depois do que: continuando a inanio, advem uma diminuio da atividade de correr. Muito pouco trabalho foi feito para explorar os efeitos da privao de gua na atividade na roda de girar, \ evidncia existente sugere uma atividade aumentando progressivamente como funo do aumento de privao (Hall, 1961).
- 361 -

Figura 16-1. Uma roda de atividade.

Na seo 15.6, vimos que o valor reforador de reforadores primrios peridico. A periodicidade que uma rata mostra na receptividade sexual est correlacionada com periodicidade na secreo de hormnio sexual e ovulaao (chamada ciclo estrual) e vista muito claramente na atividade de correr. Um ciclo de atividade tpico de uma rata madura aparece na fig. 16-2. Pode ser visto que aproximadamente cada 4 dias a rata extremamente ativa. Medidas fisiolgicas correspondentes mostram que precisamente durante ste perodo ativo que ocorre a ovuiao, colocando a fmea maximamente susceptvel inseminao. Durante este perodo, diz-se que a fmea est no cio e ento mais receptiva a avanos sexuais do macho. Durante as partes de baixa atividade do ciclo, todavia, a fmea provavelmente resistir copulao e lutar contra avanos do macho. Ento, para a rata, existe uma correlao ntima entre atividade geral e valor reforador do sexo. Um outro aparelho, que registra um conjunto algo diferente de atividades gerais o estabilmetro (Fig. 16-3). O estabilmetro consiste de uma gaiola (quase sempre triangular) cujo piso montado sobre um sistema de suspenso pneumtica. Pequenos movimentos na gaiola e mudanas no equilibrio pelo animal inovem o piso ligeiramente, mudando o equilbrio da presso do ar. Essas mudanas so transmitidas a uma pena registradora que permite um registro permanente da atividade a ser mantida. Os movimentos registrados no so necessariamente do mesmo tipo que os movimentos de
- 362-

correr na roda. e portanto no devemos tomar como um paradoxo que alguns investigadores tenham relatado que as privaes de alimento e gua afetam apenas ligeiramente, ou nada, as atividades registradas em estabilmetros. Em geral, os tipos de atividades medidos pela roda parecem ser alterados pela privao, enquanto os medidos em estabilmetro so muito menos afe+ ados. Bolles (1963) suspeitou que essa diferena significasse que atividades especficas diferentes eram diferencialmente afetadas pela privao. Com a ajuda de vrios assistentes, ele observou periodicamente as atividades de dois grupos de ratos, por um nmero de dias, em suas gaiolas. Uma vez por hora, os experimentadores olhavam brevemente cada rato, e clci^sificavam o que ele estava fazendo em uma de seis atividades: dormindo, descansando quietamente, de p em um local, fazendo toilete, comendo, bebendo. Um grupo (faminto) foi alimentado com 10 g de alimento uma vez ao dia. Como resultado, esse grupo experimentou uma perda de 15 a 20 por cento em relao ao peso com livre acosso ao alimento. O outro grupo tinha acesso irrestrito ao alimento e assim foi chamado de grupo ad lib. O regime de privao de alimento resultou em desvios do padro de atividade do ad lib. Os ratos famintos faziam mais movimentos (levantar e locomover) e descansavam mais quietamente que os ratos ad lib. A privao de alimento parece, assim, mudar o padro de atividade, aumentando algumas atividades e diminuindo outras. O nvel operante da resposta, isto , a atividade operante antes de fortalecida, sensvel a operaes de privao. Crocetti (1962) obteve a curva vista na Fig. 16-4, quando registrou o nvel operante de ratos que pressionavam uma alavanca sob cinco

- 363-

valores diferentes de privao de alimento. A comparao da curva da fig. 16-4 com a da fig. 15-8 (ambas contendo dados dos mesmos ratos) mostra que a privao de alimento afetou o nvel operante de presso barra na mesma maneira que afetou a resistncia extino da resposta aps o seu fortalecimento experimental.

Figura 16-3. Um estabilimetro para registrar movimentos de pequenos animaisOiarlow, 1948).

A evidncia apresentada de vrias fontes sugere que algumas operaes de drive aumentam realmente certas atividades, mesmo que essas atividades nunca tenham sido diretamente relacionadas ao reforador primrio associado com a operao de drive utilizada. Embora esta proposio possa ser generalizada para incluir muitos reforadores primrios, no verdadeira para todos. Por exemplo, certas deficincias de vitamina esto associadas com uma diminuio e no com um aumento de atividade (Hall, 1961). Ao tentar compreender como as operaes de privao esto relacionadas a atividades, alguns presquisadores apelam para a evoluo das espcies. Na histria evolutiva das espcies, pareceria que uma espcie que se torna mais ativa quando foi mais privada de substncias vitais devia ter uma certa vantagem de sobrevivncia sbre uma espcie que no tivesse esta tendncia. O tornar-se mais ativo devia levar o organismo a achar alimento ou gua que um indivduo mais inativo poderia nunca descorir. Quando nos voltamos para a anlise da chamada propriedade diretiva das operaes de drive, notamos que a idia expressa menos experimental que de interpretao. Uma operao de drive direcional no sentido em que age seletivamente no comportamento associado com uma dada classe de reforadores, e no em todos os comportamentos igualmente. Assim, a privao de alimento afeta maximamente comportamentos reforados com alimento, a privao de gua afeta maximamente comportamentos reforados com gua, e assim por diante. Afetando-se seletivamente os reforadores, certos comportamentos vm a ter maior probabilidade de ocorrncia que outros. Por exemplo, quando um chimpanz, que tenha sido altamente privado de alimento e apenas ligeiramente privado de uma companhia, colocado numa situao onde pode desempenhar ou uma cadeia de comportamento que leva ao alimento (digamos, pressionar uma alavanca) ou uma que leva a um companheiro (digamos, entrar em um compartimento onde seu companheiro est confinado), provavelmente far o primeiro.
-3 6 4 -

Figura 16-4. Nvel operante da taxa de presso barra em relao a horas de privao de alimento ( segundo Crocetti, 1962)

Esta a essncia da direo, e realmente a direo baseia-se parcialmente na operao de drive. Mas outra condio crtica para a direo baseia-se na histria passada de condicionamento. A menos que exista o comportamento para levar ao reforador, a operao de drive no dirigir o organismo para ele. O melhor que far ser mudar o padro de atividade geral, ou fazer com que a aquisio ocorra mais rapidamente; por si s, a operao de drive no tem poder de dirigir. O exemplo do chimpanz levanta o problema interessante sbre o que acontece se suas operaes de drive so executadas simultaneamente, e as cadeias de comportamento so topograficamente incompatveis. Isto , consideremos um chimpanz privado tanto de alimento quanto de sexo, e colocado em uma situao onde a execuo de um comportamento que leva a um reforador impede a obteno do out o. Se o animal corre para seu companheiro, desliga seu de alimento. Se comea a pressionar a alavanca para o alimento, uma porta se fecha bloqueando sua passagem para o companheiro. Esta uma das situaes frequentemente descritas como um conflito de motivos. Quantas vzes nos vemos forados a escolher entre um reforador e outro? Na presente terminologia, a situao revela-se semelhante ao mtodo de preferncia usado para avaliar valores relativos de reforo. Talvez o conflito seja, ento, melhor descrito como um conflito entre valores de reforo.
16.2 INCENTIVO

A qualidade e quantidade de um reforador, duas variveis relacionadas, esto associadas de perto com o valor do reforo. J vimos como um alimento pode ser adulterado com quinino para diminuir seu valor reforador. A qualidade de um reforador alimentar pode tambm ser adversamente afetada pela mistura com uma poro de celulose no metabolizada. Jsto constitue, com efeito, uma diluio do reforo e como tal uma maneira de variar o valor reforador mantendo constante o volume da substncia ingerida. A diluio, naturalmente, particularmente conveniente para manipular o valor reforador de lquidos. Gutman (1953) reforou a presso barra por

- 365 -

ratos famintos, com uma gota de soluo de sacarose em um esquema IV. A medida que a concentrao de sacarose na soluo aumentava, a taxa de presso barra aumentava, alcanando um mximo quando a concentrao de sacarose era de 32%. Concentraes acima ds te valor produ/iam um declnio na taxa de resposta. Os efeitos comportamentais da quantidade de reforador podem ser estudados de vrias maneiras. Se o reforador alimento, e a qualidade mantida uniforme, o volume pode ser variado. Km geral, ratos adquirem cadeias de labirinto mais rpido e estabilizam em urna assntota mais baixa de erros por corrida, quando recebem mais alimento por sua performance. A quantidade pode tambm ser estudada pela variao do tempo de acesso ao reforador. Sujeitos ratos correm mais rpido paia um companheiro se se permite que permaneam mais tempo com ele: pombos bicam mais rpido se se permite mais tempo de acesso ao gro reforador contingente. Os efeitos comportamentais da variao da quantidade e qualidade de reforo primrio podem ser categorizados sob o rtulo de funes de incentivo Como um substantivo, incentivo um sinnimo de reforo, mas, como um adjetivo, podemos us-lo para denotar a classe de variveis que mudam o valor reforador atravs de mudanas nas propriedades do estmulo reforador. Para um sumrio e interpretao dos vrios efeitos comportamentais que as variveis de incentivo podem ter, o estudante interessado pode consul tar Cofer e Applcy (1964). 16.3 FATORES FISIOLGICOS NA MOTIVAO Temos tido pouca oportunidade para mencionar as propriedades do sistema nervoso neste tratamento dos princpios comportamentais. Esta negligncia no deve ser vista como uma negao de que estruturas e funes nervosas esto ligadas aos vrios comportamentos que descrevemos. Em vez disso, isto advm do reconhecimento de que o imenso volume de informao que constitue a cincia comportamental deve, por necessidade, ser dividido em partes algo arbitrrias. Psicologia, Sociologiae Antropologia constituem tais divises: assim fazem as disciplinas hbridas de gentica do comportamento e psicologia fisiolgica. Embora tenhamos notado em outro lugar que as leis do comportamento no podem ser subordinadas ou substitudas pelas leis de fisiologia (ou qumica, ou mecnica, ou fsica nuclear) o sistema nervoso esta intimamente envolvido em todos os fenmenos comportamentais. Um crebro e medula intactos, funcionando, so um pr-requisito para tdas as leis do fortalecimento operante c muitas das leis do reflexo. Evidentemente, os fenmenos naturais transcendem as fronteiras arbitrrias de disciplinas. Assim, o comportamento envolve um complexo de eventos fsicos, ioqumicos, psicolgicos, fisiolgicos e sociolgicos. A posio que adotamos ditada pela convenincia: a psicologia preocupa-se com relaes funcionais entre meio e comportamento. Leis relacionando comportamento funo nervosa levam-nos do territrio estritamente psicolgico para o da fisiologia. Mas sempre que o comportamento a varivel dependendo de estudos de fisiologia, les contribuem para o nosso conhecimento de comportamento e fisiologia; da a designao psicologia fisiolgica. Em um tratamento introdutrio de psicologia, todavia, a psicologia fisiolgica deve ser vista como uma especialidade avanada, que no pode ser tratada com certo grau de profundidade. Resolvemos introduzir alguns de seus achados no contexto de motivao, porque o quadro que est emergindo do mecanismo fisiolgico subjacente ao reforo

- 366-

ajuda a compreender o conceito comportamental de drive. Us estudos fisiolgicos prometem dar-nos o conceito de valor reforador, com um referente fsico, em vrias estruturas anatmicas, e a juntar um nmero de operaes de drive ambientalmente diversas, descobrindo seus efeitos comuns no organismo.
Mecanismo de comer e beber. Na elaborao gradual dos mecanismos corporais associados com a alimentao, encontramos um exemplo representativo da procura de eventos fisiolgicos subjacentes a fenmenos comportamentais. Mais precisamente, essa procura diz respeito a certos eventos e processos internos que acompanham mudanas no poder reforador de alimento. Desde a antiguidade at tempos recentes, pensava-se que o estado do estmago tinha um papel importante no controle do valor reforador do alimento. O fato de as caimbras de fome frequentemente acompanharem informaes de grande fome em humanos levou a investigaes sbre as relaes entre cimbras de fome, contraes do estmago e fome. Cannon e Washburn (1912) estudaram contraes do estmago usando uma tcnica simples em que um sujeito humano engolia um pequeno balo de borracha. Uma vez no estmago, o balo era inflado, e qualquer contrao estomacal que ocorresse apertava o balo. As variaes resultantes de presso do ar no balo eram por sua vez transmitidas a uma pena registradora. O sujeito pressionava uma chave telegrfica sempre que sentia cimbras de fomel. Cannon e Washburn mostraram que as contraes estavam bastante correi aciona das com o relato de cimbra de fome, e concluram que essas contraes eram a causa da fome. A hiptese ganhou ateno imediata porque parecia oferecer um mecanismo simples e direto para comer e beber. Mas logo foi visto que pacientes que no tinham estmago comiam de maneira normal, e relatavam fome embora nunca tivessem contraes de estmago. As implicaes dessas observaes foram ampliadas em experimentos que mostraram que ratos comiam normalmente, embora os nervos do estmago fssem isolados cirurgicamente do crebro. Outras observaes mostraram que as contraes de fome eram abolidas pelas primeiras mastigadas de alimento, embora o alimento continuasse a ter um alto valor reforador muito depois que as contraes cessavam. No fim, a teoria de fome de contrao do estmago teve que ser abandonada, porque no explicava muitos dos fatos do comportamento de comer.

Um mecanismo mais complicado foi indicado pelos primeiros experimentos de Tschukilshew (citado em Templeton e Quigley, 1930) em que a transfuso de sangue de animais privados de alimento para animais bem alimentados aumentou a motilidade do estmago do receptor. Experimentos mais recentes mostraram que a transfuso de sangue entre ratos famintos e saciados (Fig. 16-5) afeta o consumo de alimento dsses animais. A alimentao e o jejum parecem mudar algum aspecto do sangue, o que, por sua vez, afetaria mecanismos cerebrais, levando a uma mudana no valor reforador do alimento. Mayer (1953) teorizou que uma varivel mediadora possvel a concentrao relativa de glicose arterial e venosa, e que as clulas no crebro onde essa concentrao pode ser medida situam-se em uma regio restrita do hipotlamo (Figc 16-6).

1.

Os trmos "fo m e " e "sde" so usados no seu sentido descritivo com o palavras breves para significar que alimenxo e gua, respectivamente, tm alto valor reforador.

- 367-

Trabalho experimental independente confirmou que certas estruturas no hipotlamo esto intimamente relacionadas ao poder reforador do alimento. Km uma subseo anterior, descrevemos efeitos comportamentais causados pelo dano experimental na regio ventromedial do hipotlamo. Ratos com destruio nessa regio comem demais e tornam-se obesos. A estimulao eltrica dessa regio do crebro tambm tem efeito no comportamento motivado por alimento.

I igura 16-5. Quando sc transfere o sangue de um rato faminto pura um bem alimentado, o consumo de alimento 6 alterado (Sanford, 1961).

Finos eletrodos podem ser implantados no crebro em localizaes bem precisas, sem lesar estruturas vizinhas. Os eletrodos so guiados no tecido nervoso atravs de um buraco perfurado no crnio, e ento colocado um pedao de plstico cimentado no crnio, cobrindo o buraco. Finalmente, o couro cabeludo costurado. Depois de alguns dias de recuperao da operao, o animal operado recupera a sade normal. O animal no parece de modo algum importunado pela adio dos eletrodos, e vive normalmente. Atravs dos eletrodos implantados, podem ser aplicadas correntes eltricas diminutas estrutura do crebro onde esto localizadas as pontas dos eletrodos. Os efeitos comportamentais de tal corrente eltrica so ento medidos. Quando a regio ventromedial do hipotlamo assim estimulada, o consumo de alimento diminui. Foram encontradas outras reas do crebro onde a estimulao leva um animal saciado a comear a comer. O quadro dos mecanismos fisiolgicos subjacentes privao e alimentao complexo e ainda fragmentrio. Nenhuma estrutura corporal nica medeia o valor reforador do alimento. O estmago, o sangue, o crebro e provavelmente outros sistemas corporais interagem para determinar quando o alimento ser reforador. Pode-se contar uma histria experimental anloga para o mecanismo de beber, mas podemos indic-la somente brevemente. As primeiras explicaes foram centralizadas no papel da secura relativa da garganta e boca e na importncia das secrees salivates. Boca e faringe secas eram igualadas a sede. Trabalhos posteriores mostraram que a salivao poderm no ser crucial desde que animais tanto bebiam como paravam de beber normalmente mesmo quando seus dutos salivares eram fechados. Ao contrrio, em
- 368-

I igura 16-6. Diagrama esquemtico do crebro humano (Rosenzwcig, 1962).

experimentos em que a gua que os cachorros bebiam nunca alcanava seus estmagos, mas saa por uma fistula no pescoo (Fig. 16-7), cachorros privados de gua continuaram a beber indefinidamente; embora suas gargantas e bocas fossem mantidas constantemente molhadas. A ateno experimental mudou gradualmente para o papel da gua contida nas clulas do corpo. Um pequeno deficit de concentrao normal de gua nas clulas do corpo c sangue parece ser um fator crtico no beber (Gilman, 1937). O trabalho recente tem se dedicado localizao de centros cerebrais no hipotlamo que regulam o comportamento de beber e parar de beber. Voltamo-nos agora uma breve descrio de alguns mtodos pelos quais os psicofisiologistas tentam descobrir a lgica da mecnica corporal interna. Suas principais tcnicas so (1) estimulao do tecido nervoso por corrente eltrica ou por substncias qumicas ou drogas, (2) destruio cirrgica ou farmacolgica ou isolamento de reas

I igura 16-7. (Segundo Rosen/woig, 1962).

consideradas cruciais, (3) registro de atividade eltrica local no crebro, (4) modificao de aiguma estimulao encontrada na funo normal, enquanto se deixa outros aspectos intatos (tal com o o experimento de beber simulado da Fig. 16-7), (5) medidas de numerosas variveis fisiolgicas em relao ao com portamento (tal com o nvel de glicose no sangue c gua contida nas clulas), (6) comparao de processos comportamentais com processos fisiolgicos (por exem plo, a comparao do processo de saciao com contraes no estmago mostrou que os dois no eram paralelos, indicando que um, provavelmente, no subjacente ao outro).

Os mtodos dos psicofisiologistas podem levar a importantes descobertas comportamentais. Olds e Milner (1954) implantaram eletrodos profundamente em crebros de ratos com o objetivo de verificar se a estimulao em uma regio associada com o sono facilitaria ou dificultaria a aquisio de operantes simples. Os investigadores ficaram surpresos ao descobrir que a estimulao, por si s, tinha um efeito marcante no comportamento do rato. No experimento teste que estvamos realizando, o animal foi colocado em uma grande caixa com os cantos rotulados A, B, C e D. Sempre que o animal ia para o canto A, era dado um choque eltrico fraco em seu crebro pelo experimentador. Quando o teste foi realizado no animal... ste continuou voltando para o canto A. Depois de vrios retornos no primeiro dia, finalmente foi para um lugar diferente e dormiu. No dia seguinte, todavia, parecia mais interessado no canto A. Neste ponto supusemos que o estmulo devia provocar curiosidade; no pensvamos ainda nisto como recompensa. Experimentao continuada ccm o mesmo animal logo indicou, para nossa surprsa, que essa resposta ao estmulo era mais do que curiosidade. No segundo dia, depois que o animal havia adquirido o

ligura 16-K Rdlo t.*stimulamlo-sc em uma faixa ik' Skinner (seguiuU* Okls. 1956).

-370-

hbito de vdtar ao canto A para ser estimulado, comeamos a tentar lev-lo para o canto B, dando um choque ellrico sempre que ele tomava um passo nessa direo. Em questo de cinco minutos o animal estava no canto B. Depois disso, o animal podia ser dirigido para quase todos os pontos na caixa ao desejo do experimentador. Cada passo na direo certa era pago com um pequeno choque; com a chegada no lugar apontado, o animal recebia uma srie mais longa de choques (Olds, 1956). Evidentemente, a estimulao do crebro estava agindo como um reforador com o qual o comportamento operante podia ser rapidamente modelado. Depois o animal foi colocado na caixa de Skinner (Fig. 16-8) e se permitiu que ele estimulasse seu prprio crebro em qualquer taxa que escolhesse. Altas taxas de resposta foram emitidas sob contingncias crf. As similaridades entro a recompensa de estimulao do crebro e reforadores positivos mais convencionais tais como alimento e gua so pronunciadas. Como outros reforadores positivos, a recompensa de estimulao do crebro mantm operantesRF, gerando alta resistncia extino depois de contingncias intermitentes, e permite poderoso controle de esquema (Pliskoff, Wright e Hawkins, 1965). Por outro lado, os ciclos de privao e saciao da recompensa de estimulao do crebro parecem ser mensurveis em segundos, em vez de horas ou dias. Trabalho adicional por Olds e outros indica que no h um, mas um nmero de locais, no crebro, onde a estimulao eltrica exerce efeito reforador (Olds, 1962). Muitos desses so os mesmos lugares que parecem, de outros experimentos, estar ligados c i eficcia do alimento, sexo, atividade e outros reforadores primrios. 16.4 REFORADORES PRIMRIOS ADICIONAIS Muitos dos princpios de comportamento elaborados nos captulos anteriores vieram dos estudos em que os reforadores primrios consistiam de alimento para organismos privados de alimento, ou, ocasionalmente, gua para indivduos privados de gua. gua e alimento so reforadores poderosos e seguros e suas privaes fornecem uma operao direta e exata para ativar sua fora. Todavia, h uma quantidade de outros reforos primrios que, ao contrrio de gua e alimento, no so essenciais para a vida do organismo. Nesta seo, consideraremos brevemente reforadores primrios tais como atividade, novidade, explorao, manipulao, afeio e contato corporal. A importncia de alguns desses reforadores primrios foi reconhecida apenas recentemente. Em muitos casos, ainda temos muito o que descobrir sbre as operaes que determinam suas foras reforadoras. Em outros casos, tais como explorao, novidade e afeio, a especificao real da classe de estmulos reforadores est longe de ser estabelecida. Embora sses problemas apresentem dificuldades reais para o desenvolvimento do conceito de drive nos termos desses reforadores, les no diminuem a importncia emprica de tais reforadores em modificar e controlar o comportamento. Muito do comportamento dc sres humanos, que vivem em uma sociedade onde fome e privao de lquidos so raras, parece estar muito distante de drives associados com privao de alimento ou gua. provvel que a anlise de reforadores primrios adicionais mostre ser essencial para interpretar a complexa motivao humana. 1. Atividade. Numa seo anterior, consideramos vrias tcnicas para medir as chamadas propriedades de ativao da privao de alimento, sexo e gua. Alm dsse controle sobre a atividade geral, parece que a privao de atividade, por si s, serve como

-371 -

uma operaao de drive para atividade. Por exemplo, um rato confinado em uma pequena cmara onde seus movimentos so restritos, ir, dando-se-lhe acesso a uma roda de correr, correr uma quantidade quase proporcional ao tempo em que esteve, anteriormente, confinado. A atividade , assim, uma funo que aumenta com as horas de confinamento (Hall, 1961). O valor reforador de atividade aumentado depois de confinamento pode ser demonstrado tambm por um aparelho, o estabilmetro (gaiola de balano). Quando colocados em uma gaiola de balano depois de longos perodos de inatividade forada, ratos movem-se muito mais que o usual. Kagan e Barkun (1954) mostraram que ratos pressionavam uma alavanca para ter acesso a uma roda em que pudessem correr. Aparentemente, a atividade pode servir como um reforador primrio para respostas operantes. 2. Explorao. Em condies normais, os organismos preferiro quase sempre colocar-se em uma situao nova. Isto particularmente verdadeiro quando a situao nova apresenta uma oportunidade para explorao. bem conhecido que um rato faminto, quando introduzido em uma situao nova que contm alimento, ir invariavelmente explorar a situao antes de comer. Isto sugere que o valor reforador da explorao suplanta o do alimento, pelo menos inicialmente. Como uma demonstrao experimental desse reforador, imagine um labirinto T em que um dos braos contm um elaborado labirinto tipo tabuleiro (Fig. 12-2), e outro brao contm uma caixa pequena e comum no fim. Ratos que no esto privados nem de alimento nem de gua iro correr consistentemente para o lado que tem o labirinto em tabuleiro se se permite por um breve perodo de tempo que explorem o labirinto em tabuleiro quando chegam a ele. Estmulos novos no precisam ser to complicados como o labirinto em tabuleiro. Ratos e camondongos pressionaro uma alavanca se cada presso produz um breve flash

operante discriminativo de empurrar um painel a/.ul (segundo Murray, 1964, baseado na descrio de Butler, 1953).

- 372 -

importante em se um rato pretere pressionar uma aJavanca qut liga uma luz, ou pressionar a outra alavanca que desliga uma luz (Lockard, 1963). Reforadores capazes de fortalecer o comportamento algo vagamente denominado curiosidade foram demonstrados por Butler (1953). Macacos novos foram colocados em uma caixa opaca em penumbra com duas janelas cobertas, uma azul e outra amarela. Empurrar a janela amarela no tinha nenhum efeito, mas o empurrar a janela azul abria-a por 30 seg, mostrando vrias cenas (Fig. 16-9). Algumas cenas tais como um grande cachorro rosnador, no eram reforadoras e levavam um pequeno empurro. Outras cenas, como viso do laboratrio e experimentador, outros macacos e objetos de brinquedo mveis tinham valor reforador aprecivel. Os macacos confinados rapidamente discriminavam a cr do painel e produziam as cenas reforadoras frequentemente. Esse comportamento parece conter alguma relao com privao, desde que quanto mais o animal era confinado na caixa sem oportunidade de produzir uma cena, maior sua taxa de resposta quando dada a oportunidade. Butler (1957) encontrou a funo vista na fig. 16-10, quando a presso ao painel era reforada em um esquema IV com a viso, por 12 seg; de uma colnia de macacos. Crianas novas gastam muito tempo com brincar e manipular objetos. Essa manipulao parece ter propriedades reforadoras intrnsecas e no precisa ser dependente da associao com outros reforadores primrios. Harlow (1950) demonstrou que macacos iro desmanchar quebra-cabeas mecnicos do tipo visto na Fig. 16-11, sem nenhum reforo adicional . Parece que sses macacos resolvero os problemas meramente pelo gosto de resolv-los. por isto que tais reforadores so chamados intrnsecos. Por um perodo de 10 hr. de observao, Harlow notou que o nmero de quebra-cabeas abertos diminua progressivamente, sugerindo um processo de saciao. 3. Contato fsico para organismos jovens: reforadores de "afeio" : Pode-se suspeitar que o contato fsico com a me deve ser um reforador para um organismo jovem. Tal reforador teria, obviamente, utilidade biolgica para manter o organismo jovem perto de sua me onde alimento, abrigo e proteo poderiam ser encontrados

No. de horas de privao da explorao visual.

I igura 16-10. Taxa de resposta cm IV reforada por uma breve exposio a uma cena visual com funo de horas de privao visual ( Butler,!957).

- 373 -

Pesquisa realizada por Harlow demonstrou que o contato do corpo um reforador muito poderoso, e alm disso no depende de reforos primrios adicionais de alimento, abrigo e proteo com os quais normalmente associado. O contato, por si s, um reforador primrio poderoso e especfico. Harlow (1960) criou macacos jovens em completo isolamento de suas mes. Das observaes do reflexo de segurar, em macacos bebs (Fig. 16-12), Harlow suspeitou que poderia ser construda uma me sub-rodaga (substituta) que poderia fornecer certos aspectos do contato fsico que as mes verdadeiras fornecem.

Figura 16-11. Quebra-cabeas mecnico que macacos resolvero sem qualquer reforo adicional (Harlow, 1950).

O reflexo de segurar e tocar eliciado por um objeto cilndrico; ento, objetos do tipo na Fig. 16-13 foram colocados nas gaiolas dos bebs macacos desde o nascimento. Esses objetos cilndricos (mes substitutas) eram idnticos em construo exceto por suas cabeas (um aspecto determinado mais tarde como irrelevante) e suas superfcies. Ambos os objetos foram construdos de arcabouos de arame, mas o arcabouo de arame de um estava coberto por uma camada grossa de tecido , enquanto o arcabouo do outro estava exposto. Harlow referiu-se ao objeto coberto de tecido macio como me de pano ; e o outro objeto ele chamou de me de arame. Os macacos criados em gaiolas contendo ambas essas mes substitutas permaneciam muito tempo de sua vida infantil em contato com a me de pano , segurando-se a ela muito maneira do reflexo de segurar da Fig. 16-12. Por outro lado, eles ignoravam virtualmente a me de arame. Para determinar se o reforador de contato constante fornecido pela me de pano dependia da histria de associao com reforo de alimento, alguns macacos mamavam de uma mamadeira inserida no trax da macaca de arame e o restante mamava de uma mamadeira da macaca de pano. Mas a associao da me de arame com alimento no modificou a preferncia do infante macaco por segurar-se na me de pano. O nmero de horas gastas com as duas mes para os dois grupos de macacos visto na Fig. 16-14. Os macacos alimentados na me de arame passavam menos tempo nela do que os macacos alimentados na me de pano. Na Fig. 16-13 vemos como alguns macacos resolviam o

-374-

problema de alimentar-se de Uina me enquanto t i n h a t a t o com a outra. Em outros experimentos, Harlow demonstrou que o valor reforador da me de pano perdurava at dois anos. Essas descobertas atestam a grande durabilidade desse reforador. As propriedades reforadoras crticas da substituta parecem ser (1) sua forma cilndrica e (2) sua maciez. Quando se usou uma tbua chata coberta de tecido, esta no gerou os efeitos vistos pelo cilindro coberto de pano da Fig. 16-13. O abrao no era possvel com uso da tbua.

I igura 16-1 2. Reflexo de segurar, em macacos rhesus recm-nascidos, eliciado por um objeto cilndrico (Harlow, 1960 ).

Harlow indicou que o privar os bebs macacos de suas mes* ou de mes substitutas apropriadas, pode interferir marcantemente com respostas emocionais e padres de companhia, mais tarde . Evidentemente, a disponibilidade do reforador de contato no incio da vida crtica para a ocorrncia normal de certos padres de comportamento na vida adulta. O trabalho de Harlow fornece um incio impressionante neste problema muito difcil dos efeitos de experincias iniciais em comportamentos maduros posteriores. Desde Freud, os psicanalistas tm enfatizado que certas experincias iniciais crticas so de grande importncia para o ajustamento de padres emocionais de sres humanos adultos; mas, atravs de experimentao controlada, a explorao dessas idias tem sido difcil. O paradigma de Harlow pode oferecer um esquema til para testar algumas dessas idias.

- 375-

1 *igura 16-13. Macaco rhesus jovem mamando dc um objeto de arame cilndrico, enquanto agarra-se a um objeto semelhante coberto com tecido (Harlow, 1960).

Idade mdia em dias Figura 16-14. Horas, por dia, passadas com as mes substitutas de pano e arame em vrias idades, em dias (Harlow, 1960).

16.5 DRIVES ADQUIRIDOS No tratamento presente de motivao exclumos completamente uma discusso sbre reforadores adquiridos. Justificamos essa excluso baseados em que as propriedades dos reforadores condicionados eram bem explicadas atravs de uma certa histria passada com contingncias comportamentais de discriminao. Neste capitulo e no captulo 15 limitamos nossa ateno a operaes outras, que no aquelas na histria passada de condicionamento do organismo, que afetam os reforadores. Se, todavia, fosse possvel criar um reforador que (1) desse evidncia de ser um reforador terminal de uma cadeia de comportamento e (2) uma vez criado, fosse sensvel a vrias operaes de estabelecimento e reduo muito maneira pela qual os reforadores primrios so, teramos que concordar que tal reforador alcana as condies necessrias para um drive adquirido. Ao contrrio dos reforadores condicionados do captulo 11, esses reforadores adquiridos no seriam dependentes de reforo primrio subsequente para que sua fora continuasse. Dois fenmenos comportamentais, retirados de contextos algo diferentes, parecem permitir uma considerao tentativa como drives adquiridos deste tipo. 1. Imprinting. Certos objetos em movimento, se apresentados no incio da vida, podem adquirir propriedades reforadoras para espcies cujos filhotes so capazes de se locomover logo depois do nascimento. Os primeiros relatrios descrevem o comportamento exibido por gansos, patos e pintos e outras aves, de seguir certos objetos em movimento. Hess (1958) descreveu as primeiras observaes do zoologista austraco Konrad Lorenz: Em uma fazenda perto de Viena, Lorenz dividiu um grupo de ovos postos por uma gansa em d d s grupos. Um grupo foi chocado pela gansa; outro grupo foi chocado por uma incubadeira. Os gansinhos chocados pela gansa imediatamente seguiram sua me pela fazenda. Os outros, todavia, no viram sua me. A primeira coisa que eles viram foi Lorenz. E ento seguiram Lorenz pela fazenda (Hess, 1958, p. 81) .

Figura 16-15. Um aparelho usado no estudo de imprinting. Consiste de uma pista circular na qual um pato chamariz pode ser movimentado. No desenho, visto um patinho seguindo o chamariz (Hess, 195 9).

-377 -

Esse fenmeno, no qual uma experincia no incio da vida dos gansos influenciou seu comportamento mais tarde, Lorenz chamou de imprinting. Logo foi estabelecido que a experincia tinha que ocorrer durante um perodo crtico no incio da vida do organismo para ser efetivo. Trabalhes subsequentes devotados ao imprinting tm demonstrado que os tipos de objetos que podem fazer surgir tais comportamentos dc seguir so to arbitrrios como caixas de papelo ou esferas em movimento. Esses trabalhos posteriores tem tentado qualificar as condies sob as quais ocorrer o imprinting.

Horas por dia I-igura i 6-16. Teste positivo de resposta dc preferencia para o objeto-teste (Hess. 1959).

Tm indicado tambm que seguir simplesmente uma manifestao de que um certo objeto tornou-se um reforador poderoso. Qualquer comportamento instrumental que traga a ave jovem a uma maior proximidade com o objeto fortalecido. O aparelho utilizado por Hess (visto na Fig. 16-15) consiste de uma pista circular fechada de Plexiglass na qual um pato chamariz pode ser movido por um motor a vrias velocidades. Um patinho, nascido poucas horas antes, c colocado na pista e o modelo comea a mover-se em volta da pista. Em alguns experimentos, um som sai de um alto falante de dentro do modelo. A operao de imprinting consiste de 1 hora, ou menos, de exposio ao objeto em movimento. Mais tarde, os patinhos, so testados para determinar preferncia de resposta para o modelo de imprinting em comparao com outros objetos. Um achado surpreendente que a operao de imprinting deve ocorrer durante um perodo de idade para ser efetiva na determinao da preferncia. A fig. 16-16 mostra isto graficamente. Para o caso de patinhos selvagens, uma idade de 13-16 h depois do nascimento d o mximo de imprinting. Parece que, alm de 30 h depois do nascimento, o imprinting j no possvel nesta espcie. A fim de estabelecer que o objeto imprinted age como outros reforadores, Hoffman, Searle, Toffcy e Kozma (1966) modelaram uma resposta de bicar na chave que produzia uma iluminao breve (5 seg) do objeto imprinted em movimento. Em seus

- 378-

estudos, a arbitrariedade do objeto imprinted foi enfatizada. 0 ubjeto era uma mamadeira de leite sendo levada em um vago de um trem modelo. Os patinhos recebiam uma exposio, anterior ao imprinting, mamadeira de leite e mais tarde adquiriram as Rs de bicar a chave quando cada bicada produzia um aparecimento breve da mamadeira em movimento como reforador. Subsequentemente, uma razo 5-1 foi mantida. Os sujeitos que no tiveram exposio anterior ao imprinting mamadeira no bicavam a chave, mostrando que a operao de imprinting foi essencial para a criao desse tipo de reforador. Embora o objeto imprinted parea adquirir propriedades reforadoras, essas podem no durar indefinidamente. Hoffman, Toffey, Searle e Kozma mediram a quantidade de tempo pelo qual os patinhos imprinted, vivendo constantemente no aparelho, mantiveram a viso da mamadeira de leite pelo bicar da chave. Os experiment adores descobriram que, medida que os animais cresciam, tendiam a trabalhar cada vez menos pelo objeto. Alguns resultados tpicos so vistos na Fig. 16-17. Por volta de 60 dias, o valor do objeto em movimento como reforador havia quase dissipado completamente. Um fato interessante o de que o reforador podia ser restabelecido temporariamente atravs de choque nos patinhos, ou pela apresentao de outros estmulos geradores de emoo.

Dias aps a incubao Figura 16-17. Quantidade mdia de tempo por dia, em que um objeto em movimento foi mantido vista como uma funo da idade dos patinhos. A operao de imprinting com este objeto havia sido executada anteriormente, cada ponto representa uma mdia de 3 dias entre trs sujeitos (H.S. Hoffman, dados no publicados).

Os resultados dos estudos de imprinting sugerem que o procedimento de imprinting uma operao que cria uma classe de reforadores que se parecem com o objeto imprinted . Como esse novo reforador um reforador terminal de uma cadeia de comportamentos, suas propriedades se parecem mais com aquelas dos reforadores

- 379-

Figura 16-18. Rato viciado toma injeo de droga vontade, pela presso barra. A soluo de droga vem pelo tubo e ento, atravs de uma cnula cronicamente implantada, penetra na veia jugular. Uma corrente em uma coleira impede que o tubo gire quando o animal se move na gaiola (segundo Weeks, 1964).

primrios do que com as de reforadores secundrios. Ao contrrio de um reforador condicionado, no sujeito a um procedimento de extino, nem serve como um para uma resposta que produza um reforador subsequente mais primrio. 2. Vcio Sabe-se bem que a administrao repetida de certas drogas cria uma dependncia em sua administrao contnua. Alm disso, essas drogas (tal como o pio e seus derivados morfina, herona e demorol) vem a adquirir propriedades reforadoras poderosas. Os humanos que desenvolvem tais dependncias, chamadas de vcios, tudo faro para obter injees da droga. A despeito de sua prevalncia na sociedade moderna, as condies que controlam o vcio (suas causas e curas) rio so bem entendidas. Estudos recentes com sujeitos animais tm utilizado tcnicas de resposta de operante livre para estudar o poder reforador dessas drogas depois do vcio. 0 principal objetivo desses estudos clarificar as condies que esto relacionadas ao vcio. A operao que cria o reforador de vcio consiste da apresentao repetida (usualmente por injeo) de morfina e outros compostos em doses gradualmente maiores. Como uma conseqncia dessa srie de administraes, a droga adquire poderosas propriedades reforadoras. 0 vcio experimental tem sido produzido em ratos e macacos por sse mtodo de aumentar gradualmente a dose da droga. As propriedades do reforador adquirido da droga foram estudadas permitindo-se a um rato viciado os

-3 8 0 -

meios para administrar o narctico em si prprio (Weeks 1964). O rato viciado trabalhava numa caixa de Skinner onde cada presso barra inicialmente produzia injeo controlada de um narctico selecionado. O sistema de injeo consistia de um tubo e uma cnula pela qual a droga era levada, em soluo, diretamente para a veia jugular do rato (Fig. 16-18). Os resultados mostram que ratos viciados adquirem a R de pressionar a alavanca quando isso leva a vrias quantidades de morfina. Curvas tpicas de RF associadas com razes variando entre 10 e 400 presses barra para uma nica injeo demonstram a natureza extremamente poderosa do reforador morfina. Embora ocorressem periodieidades de pouca durao no vdor reforador adquirido (efeitos de saciao), a durao a longo prazo do reforador era indefinida. Um macaco trabalhando sob condies semelhantes a essas descritas para o rato permaneceu viciado por 21 meses (Weeks 1964). A tcnica revela-se promissora em trazer resultados que podem sugerir os procedimentos a serem usados no controle das propriedades do reforo de drogas, uma vez que tenha ocorrido o vcio. O controle dos reforadores de vcio tem implicaes bvias para o controle de de vcios em humanos. REFERNCIA PARA O CAPTULO 16 Bolles, R. C. Effect of food deprivation upon the rats behavior in its home cage. / . comp, physiol. Psychol., 1963, 56, 456-460. Butler, R. A. Discrimination learning by rhesus monkeys to visualexploratory motivation. J. comp, physiol. Psychol., 1953, 46, 95-98. Butler, R. A. The effect of deprivation of visual incentives on visual exploration motivation in monkeys. J. comp, physiol. Psychol., 1957, 50, 177-179. Cannon, W. B., and Washburn, A. L. An explanation of hunger. Amer. J. Psychol., 1912, 29, 441-452. Cofer, C. N., and Appley, M. H. Motivation: theory and research. New York: Wiley, 1964. Crocetti, C. P. Drive level and response strength in the bar-pressing apparatus. Psychol. Rep., 1962,10, 563-575. Gilman, A. The relation between blood osmotic pressure, fluid distribu tion, and voluntary water intake. Am er . J. Physiol., 1937, 120, 323-328. Guttman, N. Operant conditioning, extinction, and aperiodic reinforce ment in relation to concentration of sucrose used as reinforcing agent. J. exp. Psychol., 1953, 46, 213-224. Hall, J. F. Psychology of motivation. New York: Lippincott, 1961. Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews (E d .), Methods of psychology, New York: Wiley, 1948. Harlow, H. F. Learning and satiation of response in intrinsically moti vated complex puzzle performance by monkeys. J. comp, physiol. Psychol., 1950, 43, 289-294. Harlow, H. F. Primary affectional patterns in primates. Amer. J. Ortho-

381 -

psychiat., 1960, 30, 676-684. Hess, E. H. Imprinting in animals. Sci. Amer., 1958, 195, 81-90.
Hess, E. H. Imprinting. Science, 1 9 5 9 , 130, 133-141. Hoffman, H. S., Searle, J. L., TofTey, Sharon, and Kozma, F. Behavioral control by an imprinted stimulus. J. exp. Anal. Behav., 1966, 9, 177-189. Kagan, J., and Berkun, M. The reward value of running activity. J. comp, physiol. Psychol., 1954, 47, 108. Lockard, R. B. Some effects of light upon the behavior of rodents. Psychol. Bull., 1963, 60, 509-529. Mayer, J. Glucostatic mechanism of regulation of food intake. New England J. Med., 1953, 249, 13-16. M urray, E. J. Motivation and emotion. Englewood Cliffs: Prentice-Hall, 1964. Olds, J. Pleasure centers in the brain. Sci. Amer., Oct. 1956, 195, 105 116. Olds, J. Hypothalamic substrates of reward. Physiol. Rev., 1962, 42, 554-604. Olds, J., and Milner, P. Positive reinforcement produced by electrical stimulation of septal area and other regions of rat brain. J. comp, physiol. Psychol, 1954, 47, 419-427. Pliskoff, S. S., Wright, J. E., and Hawkins, T. D. Brain stimulation as a reinforcer: intermittent schedules. J. exp. A n a l Behav., 1965, 8, 7 5 -88. Richter, C. P. A behavioristic study of the activity of the rat. Comp. Psychol Monogr., 1922,1, No. 2. Richter, C. P. Animal behavior and internal drives. Quart. Rev. B iol, 1927,2, 307-343. Rosenzweig, M. The mechanisms of hunger and thirst. Chap. 3 in L. Postman (E d .), Psychology in the making. New York: Knopf, 1962. Sanford, F. Psychology, a scientific study of man. Belmont, Calif.: W ads worth, 1961. Templeton, R. D., and Quigley, J. P. The action of insulin on the mobility of the gastro-intestinal tract. Amer. J. Physiol , 1930, 91, 467-474. Weeks, J. R. Experimental narcotics addiction. Sci. Amer., Mar. 1964, 210, 46 -5 2 .

- 382-

Captulo 17 CONTINGNCIAS AVERSIVAS

Nossas discusses sobre o comportamento operante tm, at aqui, lidado exclusiva mente com casos em que, pela manipulao da correlao entre uma classe especifica da de resposta c eventos tais como alimento c gua, ocorrem certas mudanas no comportamento. Aquisio, discriminao, esquemas dc reforamento, diferenciao, aproximaes sucessivas e encadeamento so as denominaes dos procedimentos especficos que ditam a forma precisa da correlao resposta-reforamento. O termo impulso agrupa as variaes 110 comportamento operante que esto sob o controle dc operaes que alteram o valor reforador daqueles reforadores. Em todos os diversos procedimentos tratados, o comportamento mantido por reforadores que so definidos como estmulos que tm a habilidade de aumentar a probabilidade das respostas que seguem. Volt amo-nos, neste captulo, para uma nova classe de estmulos reforadores que no preenchem essa definio de reforadores positivos, embora modifiquem c mantenham o comportamento de maneira caracterstica. 17.1 REFORADORES NEGATIVOS Pouco mais do que a observao casual necessria para se detetar que, sob circunstncias apropriadas, a re m o o de certos eventos ambientais exerce efeitos comportamentais poderosos. Observamos que as aves encontram abrigo durante as tempestades, os ces dirigem-se para a sombra quando o sol do vero incide sobre eles e as pessoas fecham as janelas quando o barulho do trfego est alto. Nesses exemplos, o comportamento emitido remove ou termina algum evento ambiental tal como chuva, calor e luz, c barulho, listas observaes sugerem a existncia de uma classe distinta de eventos reforadores. Como a operao que define esses eventos como reforadores (sua remoo) e oposta, cm carter, quela dos reforadores positivos (definida por sua apresent ao), eles so conhecidos como re fo r a d o re s n e g a tiv o s (S~ ). Em geral, os reforadores negativos constituem-se daqueles eventos c u jo t rm in o (ou reduo 11a intensidade) fortalecer c manter operantes. Os reforadores negativos incluem os eventos que, no linguajar comum, chamamos de irritantes , desconfortveis , dolorosos , desagradveis , nocivos c assim por diante. A maioria desses termos envolve um domnio de referncia no compor tame ntal que, provavelmente, no ser adequado para uma anlise funcional. Com um

-383-

sinnimo para reforador negativo, o termo aversivo mais neutro que qualquer um desses adjetivos e tem a vantagem dc sugerir a noo apropriada de evitar , mover-se para longe de ou fugir de uma situao. No laboratrio, os estmulos aversivos tm, tipicamente, a forma de choques eltricos, imerso prolongada na gua e certas intensidades de luz, som e temperatura, 17.2 CONDICIONAMENTO DE FUGA Podemos verificar a qualidade aversiva de qualquer estmulo tornando sua remoo contingente a um operante at ento no condicionado. Se a fora deste operante aumenta, subsequentemente, diz-se que o estmulo aversivo.

eltrico Figura 17-1. Labirinto em T para estudar o comportamento de fuga (segundo Meunzinger e Fletcher, 1936).

Um experimento de Muenzingcr c Fletcher (1936) representativo deste procedi mento de fuga. Um rato foi colocado num labirinto cm forma de T, que continha um piso de grades eletrificadas. O piso estava ligado a uma fonte de modo que, enquanto o animal permanecesse na grade, um choque contnuo era administrado cm suas patas (Fig. 17-1). Uma cobertura sobre o labirinto (no mostrada) impedia o rato de escapar do choque pulando para fora do aparelho. Mas, havia uma maneira de fugir - o animal podia se livrar do choque correndo consistcntcmentc para um determinado brao do T. O comportamento no labirinto cm T comumente medido cm cada tentativa pela contagem do tempo que o rato leva do incio at o brao sem choque ou pela contagem do nmero de vezes que o animal se dirige para o brao incorreto
- 384-

( erros ). Nas primeiras tentativas, o virar para a esquerda ou direita so igualmente provveis, mas medida que a aquisio da resposta dc virar para o lado seguro prossegue, as respostas para o lado incorreto diminuem. Vemos a tendcncia media de 25 ratos na Fig. 17-2. Podemos inferir a partir da diminuio do nmero de erros na curva da Fig. 17-2 que a resposta de virar para o lado seguro ocorreu depois de 100 tentativas de treinamento. () processo comportamental representado na Fig. 17-2 exige que ampliemos o nosso conceito de fortalecimento operante. As respostas podem ser fortalecidas ou pela produo de reforadores positivos ou pela terminao de reforadores negativos (S"~ ). A ltima variante

s"R ----- >S0

Blocos de dez tentativas Figura 17-2. Percentagem de respostas incorretas em 100 tentativas de treino de fuga (segundo Muenzinger, e Fletcher, 1936).

Uma resposta (R) conduz o organismo de uma situao aversiva, S diferente, menos aversiva,

s0.

para uma

17.3 PARMETROS DE S A Fig. 17-3 esquematiza os eventos, variveis e relaes inerentes s contingncias de fuga no reforamento negativo. As variveis independentes de maior interesse na Fig. 17-3 so (1) a intensidade de estmulo aversivo prevalente, (2) a durao do perodo com estmulo ausente, (3) a quantidade em que a intensidade reduzida depois da resposta, (4) a natureza da intermitcncir, se alguma, existente entre R e a terminao ou reduo de S'", e (5) o atraso, se algum, que intervm entre uma R c- o trmino ou reduo subsequente do estmulo.
- 385-

intensidade

durao do perodo sem estmulo contingncia intermitente

I I
R

reduo parcial na intensidade do estmulo

! !

atraso na terminao

j~*- tempo de reao Figura 17-3. Variveis nus contingcncias dc fuga.

Se uma fonte dc estimulao aversiva adicionada aparelhagem da caixa de Skinner, a presso barra torna-se conveniente para o estudo do reforamento negativo. A caixa de Skinner tem o mrito dc deixar o animal livre para responder a qualquer momento. Em conseqncia, a taxa dc resposta torna-se disponvel como uma medida dependente sensvel e ampla dos efeitos comportamentais cm sujeitos individuais. Para objetivos especiais, o tempo dc reao, RT (ver Fig. 17-3) pode suplementar tais medidas dc taxa. Um procedimento usado por Dinsmoor e Winograd (1958), serve como uma demonstrao-prottipo, assim como ilustra a ao dc alguns parmetros dc S Ratos aprenderam a pressionar uria barra quando este era o nico comportamento que desligava choques clctricos liberados atravs das grades do piso do seu compartimento experimental. O choque era desligado por 2 minutos aps a presso barra (durao do perodo sem estmulo), depois do que a estimulao aversiva era restabelecida. Presses na ausncia de choque no tinham conseqncias especiais. 0 procedimento simplesmente

Quando o RT entre S e R diminuiu ate um valor assinttico baixo, uma contingncia dc IV 30 seg foi adicionada ao procedimento:

As respostas eram efetivas para a fuga do choque apenas depois que o choque estivesse ligado por uma durao mdia de 30 seg. O procedimento gerou uma laxa moderada c constante de presso barra na presena do choque. O padro do comportamento assemelha-se resposta reforada com alimento em IV Dinsmoor c Winograd exploraram os efeitos da variao da intensidade dc S sobre esta linha-base de resposta dc fuga em IV. Sua tcnica foi a dc iniciar a sesso com uma determinada intensidade de S presente, digamos lOOjLiamps, obseivar a fre qncia de resposta por um perodo de tempo suficiente para obter uma medida
-386-

confivel da taxa, depois dc mudar para um valor diferente dc S , digamos 400 y amps, e repetir o processo. Numa sesso de 2 horas, eles puderam obter medidas da taxa de fuga para seis valores diferentes de intensidade de S . O comportamento de um rato durante uma parte da sesso aparece na Fig. 17-4. O registro cumulativo mostra que cada valor dc intensidade de choque controla uma nica taxa de resposta de fuga. O efeito comportamental da mudana de um valor dc intensidade para outro (marcada pelos traos) c quase instantneo: independente de sua taxa anterior, o animal muda abruptamente para uma taxa, apropriada nova intensidade dc choque. Quando a taxa total dc resposta colocada cm funo da intensidade dc choque, restrita a Fig. 17-5A. Essa funo foi obtida do inesmo rato cuja curva cumulativa aparece na Fig. 17-4. A Fig. 17-5A indica que, na faixa estudada, medida que a intensidade do choque aumenta a taxa de resposta dc fuga tambem aumenta continuamente.

Figura 17-4. Respostas de fuga em IV acumuladas para intensidades diferentes de choque (Dinsmoor e Winograd, 1958).

As Figs 17-5B e 17-5C documentam os resultados dc experimentos semelhantes com outros agentes aversivos. A Fig. 17-5B ilustra os efeitos do aumento da intensidade de um som sobre a taxa de presso barra em IV de fuga, cm gatos. Os resultados da Fig. 17-5C loram obtidos dc um grupo dc ratos que, pressionando um painel sob contingncias dc IF, terminavam luzes de vrias intensidades. Tanto o painel (B) como o painel (C) da Fig. 17-5 demonstram que os mximos no comportamento de fuga ocorrem quando a intensidade do estmulo aversivo c muito grande. O declnio nas respostas associado com eventos aversivos muito intensos no c bem compreendido. Pensa-se que ele seja devido a um efeito supressivo geral (cmocional) dos estmulos aversivos fortes.
- 387 -

choquc eltrico (microamperes)

Nvel do rudo (millivolts)

luz incandescente (milliamberts) a

(A)

(B)

(C)

Figura 17-5. Taxa de resposta de fuga em funo da intensidade do estmulo aversivo. A abscissa est em unidades logartmicas (A) Dinsmoor e Winograd, 1958; (B) Barry e Harrison, 1957; (C) Kaplan 1952.

Ser conveniente fazer um paralelo ocasional entre o reforamento positivo c negativo. A que varivel, no campo do reforamento positivo, podemos perguntar, corresponde a intensidade dc um estmulo aversivo? Superficialmente, a intensidade dc um reforado negativo parece anloga magnitude de um reforador positivo. A intensidade dc S e a magnitude dc S 1 so, ambas, propriedades de estmulo do reforador e o aumento cm ambas as variveis gera aumento nas respostas (ver seo J6.2). Mas, uma anlise mais profunda do papel funcional que essas duas variveis desempenham no reforamento negativo e positivo, respectivamente, sugere que a analogia apenas superficial. O principal efeito do aumento na intensidade de uma luz, um som, ou um choque, de um valor baixo para um valor alto, c que o reforamento do comportamento lorna-se possvel atravs do trmino da nova intensidade. O aumento na intensidade de um S tem, assim, a lgica de uma operao de estabelecimento dc reforamento: torna possvel o fortalecimento do comportamento. Assim, na presena de uma intensidade fraca de luz, um rato no apresentar o condicionamento de uma resposta que termine a luz. Assim, tambm, com um pequeno valor de privao dc alimento, uma resposta que produz alimento no ser fortalecida. Por outro lado, valores altos de ambas intensidade do choquc e privao de alimento tornam possvel usar a terminao do choque e apresentao de alimento como reforadores para condicionar operantes. Se as funes das Figs. 17-5 e aquelas na seo 15.8 forem examinadas, ser encontrado um paralelo na maneira em que as horas de privao e a intensidade de S controlam o comporta mento. Tais consideraes implicam num status conceituai interessante para os estmulos aversivos. Sua apresentao simultaneamente uma operao de impulso e negaiivameue reforadora. H, naturalmente, uma varivel no campo do reforamento negativo que corres ponde magnitude dc S 1. Considere a durao do tempo que decorre entre o trmino de um estmulo aversivo e seu restabelecimento subsequente, indicada como a durao do perodo sem estmulo na Fig. 17-3. Fis aqui uma varivel independente que corresponde estritamente magnitude ou durao de S*. Quanto maior a durao do perodo com o, estmulo aversivo ausente, maior a fora da resposta de fuga. Usando uma contingncia de fuga em crf e medindo o Kl da presso barra ao S Dinsmoor e Hughes (1956) obtiveram o gradiente de reforamento de fuga reproduzi do na Fig. 17-6. Quando as presses barra produziam um perodo longo sem cheque.

-38 8-

o rato respondia prontamente ao aparecimento do clioque. Mas, quando perodos pequenos sem choques eram a conseqncia do pressionar, os RTs ao aparecimento do choque eram longos, indicando que estes valores pequenos de durao do perodo sem choque proporcionavam pouco ou nenhum reforamento. No c necessrio que um operante termine completamente um estmulo aversivo para que seja fortalecido. A

1 igura 17-6. Tempo dc reao (RT) de fuga em funo dc vrios valores de durao do perodo sem choque (segundo Dinsmoor e Hughes, 1956).

simples reduo do nvel de intensidade do estmulo c quase sempre suficiente para condicionar e manter o comportamento operante. Pequenas redues na intensidade, quando contingentes presso burra, formam a base dc um procedimento para medir o nvel de estimulao aversiva que um organismo ir tolerar (Weiss e Latics, 1959, 1963). Neste procedimento, cada presso barra produz uma pequena diminuio na intensidade de um estmulo aversivo prevalcntc. Um perodo fixo de tempo sem uma nica presso barra produ/ um pequeno aumento na intensidade do estmulo. As relaes entre R e S sto ilustradas esqucmulicamentc na Fig. 17-7. A primeira R emitida na Fig. 17-7 reduz a intensidade de S um pouco. Uma segunda R segue logo a primeira R e a intensidade diminui um pouco mais. 0 critrio de tempo, ento, decorre sem que alguma resposta ocorra e, como resultado, esse S 6 aumentado um pouco. Passa-se mais um perodo sem uma R e outro aumento em S ocorre. As prximas 6 Rs ocorrem com freqncia suficiente para diminuir a intensidade aversiva ao nvel dc zero. Subsequentemente, a intensidade aumenta por trs ve/.es na ausncia de outras respostas emitidas.

S
i i_________ i i i i

0 seg. f Tempo i ______ i ______ i --------- 1 --------- --------- 1 --------- 1 --------- 1 ---------L F ig u r a i 7-7.

-3 8 9 -

liste procedimento age dc modo a originar um estado dc equilbrio. O organismo conserva uma taxa de resposta que mantm a intensidade de S * dentro de uma pequena faixa de intensidades (usualmente baixa). Quando o S~ choque elctrico, esse equilbrio denominado nvel de tolerncia ao choque. O nvel real mantido varia com um nmero de parmetros do procedimento e sensvel administrao de certos agentes farmacolgicos, tais como analgsicos c anestsicos. A Fig. 17-8 ilustra a estabilidade comportamental tpica que esse procedimento gera. Alm disso, a figura mostra o resultado comportamental da administrao intravenosa de uma pequena quantidade dc morfina num macaco rhesus trabalhando neste procedimento. (A Fig. 17-8 significa um registro bem detalhado e ampliado do contorno de S' da Fig. 17-7). A injeo dc morfina seguida rapidamente por um aumento da tolerncia ao choque a um novo nvel de intensidade, que pcrmanccc pelos 40 minutos restantes apresentados. O efeito confirma as propriedades clnicas bem conhecidas da morfina, e sugere que o procedimento fornecc um instrumento experimental adequado para medir as propriedades analgsicas dc vrias drogas.
25
20

"3 d >

2 3 - , 0i f
-5

0
Figura 17-8. Efeito da administrao intravenosa de sulfato de morfina, 0,25 mg/kg, sobre o nvei de tolerncia ao choque. O registro iido da direita para a esquerda (Weitzman, Ross, Hodos e Gaiambos, 1961).

17.4 ESTMULOS AVERSIVOS CONDICIONADOS Quando fugimos de um carro que vem cm nossa direo, desviamo-nos de um murro intencional e samos de um campo dc golfe ao ver nuvens dc tempestade, nosso comportamento toma a forma dc fuga dc estmulos que no so aversivos em si mesmos. Veculos em nossa direo, brao levantado c uma nuvem escura so eventos cujo significado deve ser adquirido de algum modo. Parece existir uma classe de estmulos aversivos adquiridos que podem ser apropriadamente chamados de reforado res negativos secundrios. Para analisar a maneira pela qual os estmulos adquirem propriedades de reforadores negativos secundrios, leremos que recorrer aos conceitos do condicionamento clssico. Acontece que uni evento ambiental originalmente neutro adquire propriedades aversivas se ele emparelhado, de maneira Pavloviana, com eventos como choques, sons intensos e luz. Estes ltimos agentes aversivos tem uma funo comportamental dupla. Eles lm tanto o status dc reforadores negativos primrios (S ^), como o de eliciadores incondicionados (S 2 ) do aumento na axa cardaca, respirao rpida e outros respondeutes. Quando u mS j emparelhado com

- 390 -

um desses eventos S 2 , S\ passa a (1) evocar uma CR semelhante a R2 pelas leis do condicionamento respondente; c (2) adquirir poder aversivo. A maneira atravs da qual as propriedades dc reforadores negativos so conferidas s situaes anteriormente neutras pode ser demonstrada, no rato, com o aparelho visto na Fig. 17-9. Dois compartimentos esto separados por u m a porta que pode ser aberta, deixando uma barreira entre eles. Cada compartimento tem um piso gradeado atravs ao qual podem ser liberados choques. Lmpadas e alto-falantes fornecem sinais quando desejados. Uma vez que conseqncias especiais podem ser contingentes ao pular a barreira de um compartimento para o outro, isto e, ao ir e voltar para um e outro compartimento, o aparelho comumcntc conhecido como caixa do vai-e-vem.

Figura 17-9. Uma caixa do vai-e-vem para o estudo do controle de estmulo aversivo (segundo Miller, 1951).
- 391 -

Brown c Jacobs (1949) colocaram ratos num compartimento de uma caixa do vai-e-vcm e emparelharam um tom pulsantc h luz (S j) com 6 seg. dc choque inevitvel (SJ). Vinle e dois emparelhamentos de Sj c S2 foram administrados cm um perodo dc dois dias. O choquc foi ento permanentemente desligado e testaram-sc as propriedades aversivas de Sj. A porta entre os compartimentos foi levantada, S\ apresentado e estabelecida uma contingncia tal que qualquer tentativa dc pular para o outro compartimento terminava o Sj toin-luz. 0 efeito das tentativas dc teste foi condicionar o saltar a barreira. Desde que o choquc nunca foi apresentado no teste, esse condicionamento deve ter sido a conseqncia da fuga do Sj tom-luz. E desde que os ratos normalmente no tentam escapar dos tipos de tons c luzes usados neste experimento, a operao de emparelhar os tons c luzes com o choquc deve ter sido crtica. Ao testar o reforamento positivo condicionado (seo 11.1), podemos lembrar, permitiu-se que um novo operante produzisse um S^, mas o reforamento primrio foi removido. O novo operante foi inicialmente fortalecido em virtude do contingente, mas, medida que o tempo passava, o perdia o seu poder de reforador condicionado, uma vez que no mais estabelecia a ocasio para o reforamento primrio. Esla perda apareceu como um declnio eventual na fora do novo operante. Um aumento similar e uma queda na probabilidade de um novo operante ocorrcin ao se testar o podor de um estmulo aversivo condicionado. No teste da caixa do vai-e-vcm, cada vez que tom + luz apresentado sem choque, ocorre uma tentativa dc extino Pavloviana. Isto , o tom + luz perde algumas das propriedades cliciadoras que lhes foraih conferidas pelos emparelhamentos prvios com o choque. Com a extino do poder eliciador dc Sj ocorre uma reduo gradual no poder de S\ reforar negativamente uma resposta. O resultado, naturalmente, que, cm ccrto ponto, os ratos param de pular a barreira quando Sj apresentado. No experimento de Brown e Jacobs, o RT de pular a barreira ante o aparecimento de S\ diminui nas 20 primeiras tentativas do teste; ento, nas 20 tentativas subsequentes, o RT comea a aumentar, indicando que o poder controlador do tom-luz est diminuindo. Precisamos ter essas relaes dchcadas cm mente quando lidarmos com os fenmenos das sees seguintes. 17.5 CONDICIONAMENTO DE ESQUIVA O fenmeno do comportamento de esquiva levanta um problema geral con cernente ao lugar da inteno na metodologia cientfica. Dizemos que viramos o volante de um carro que derrapa, na direo oposta derrapagem, para evitar uma batida; que se constri uma ponte de um certo modo para evitar sua queda; que um veado foge a fim de evitar um lobo que o persegue. O termo para , ou a fim de , d uma certa qualidade intencional ao comportamento. O objetivo de um determinado ato e, consequentemente, sua explicao aparente, fornecido numa proposio das conseqncias aversivas ou indesejveis que teriam ocorrido se no fossem evitadas pelo ato. As explicaes propositais ou teolgicas so geralmente rejeitadas pelos cientistas com o argumento de que tais explicaes propem que um evento futuro (e, logo, no existente) seja a causa de um evento presente (existente) e porque as explicaes propositais nada adicionam aos fatos. Dizer, por exemplo, que uma pedra cai ao cho a fim de retornar a seu lugar natural de repouso, a terra, nada mais diz que a

- 392-

proposio puramente descritiva: as pedras caem na terra. E, alm disso por parecer ser uma explicao suficiente, a proposio teleolgica tende a desencorajar um exame adicional do fenmeno, pospondo assim uma anlise funcional. A explicao, na cincia, um assunto complexo e de muitas facetas, mas alguns estudiosos acham que ela pode ser reduzida a (1) descries extensas dos eventos em questo, incluindo suas relaBes com outros eventos; e (2) familiaridade com estas descries e relaes. A explicao cientfica, de acordo com este ponto de vista, cm grande parte um problema de fornecer relaes entrelaadas entre os fenmenos da experincia sensorial. Eventualmente, essas relaes tornam-se to familiares que parecem lgicas, ou auto-evidentes. Assim, as reformulaes radicais de uma gerao so o bom senso da gerao seguinte. Compare este tipo de explicao com a do tipo proposital. Embora achemos estranho, 300 anos depois de Galileu, pensar que as pedras possuem um desejo de retornar terra, frequentemente, content am o-nos em considerar o comportamento como sendo dirigido pela vontade ou inteno. Todavia, assim como o propsito irrelevante para explicar a queda das pedras, tambm o para a anlise do comportamento. Dizer que os organismos respondem para (a fim de) produzir reforadores no traz mais informao do que dizer que eles respondem quando suas respostas so frequentemente seguidas por reforadores. Frequentemente, propem-se explicaes teleolgicas para o comportamento de esquiva. Ao dizermos que nos abrigamos, quando vemos uma nuvem de tempestade para no ficarmos molhados, estamos implicitamente invocando uma explicao proposital para o nosso comportamento. Todavia, nossa proposio (ou crena) no constitui uma explicao no sentido tcnico descrito (a saber, uma proposio de alguma relao funcional entre o comportamento que est sendo descrito e alguma outra varivel), mas meramente uma reproposio dos fatos quando o cu est escuro e trovejando, movemo-nos de um certo modo. A esquiva de um evento ambiental que ainda no aconteceu (a chuva) dificilmente pode controlar o com portamento presente. Supor que isto poderia acontecer criar o problema lgico de como explicar um evento em termos de outro evento que ainda no ocorreu. Em vez disso, procuramos uma explicao (descrio) do comportamento em termos de variveis que (1) atuam por ocasio do comportamento, e (2) agiram, no passado, em condies similares. Ao fazer isto, baseamos nossa explicao nos conceitos intro duzidos nas trs sees anteriores. Iniciamos nossa anlise do comportamento de esquiva com uma demonstrao experimental do fenmeno. Talvez encontremos, no exame cuidadoso dos eventos comportamentais que ocorrem na situao de esquiva, algumas relaes invariantes nas quais possamos basear uma explicao mais aceitvel do fenmeno. Brogden, Lipman e Culler (1938) colocaram cobaias em rodas de atividade individuais. Um tom de 1000 cps era apresentado ao animal e, 2 seg mais tarde, um choque era administrado atravs do piso da gaiola. Se o animal corresse na roda, fazendo-a girar 2,5 cm ou mais quando o som se iniciava, ele poderia evitar o choque. O girar a roda atravs da corrida tambm terminava o som. Note a estrutura bsica para os paradigmas de esquiva. Primeiro, ocorre algum evento ambiental de aviso (o tom); ento, aps um lapso de tempo, segue-se um segundo evento ambiental, aversivo. Enquanto isso, h uma contingncia estabelecida por um experimentador ou pela natureza - de modo que, se uma resposta especificada ocorre entre o aparecimento do primeiro estmulo e o aparecimento do estmulo aversivo, o estmulo aversivo omitido e o primeiro estmulo terminado.
- 393-

- No experimento de Brogden, Lipman e Culler, as cobaias aprenderam a girar a roda, e, assim, evitar o choque em quase todas as tentativas. A Fig. 17-10 relaciona o aumento observado na percentagem das respostas de girar a roda com o nmero mdio de dias em que cada percentagem particular foi atingida.
100

80

S' 60 I

40

y
20

//

/ s *s * * s/ s*

// //

s ss

"7*----------s

/S \\ V \\ \ \ \ \\ \
2 4 6 8
Mdia do nmero de dias de treinamento

Figura 17-10. Aquisio do comportamento de esquiva. Dados de quatro cobaias (segundo Brogden, Lipman e Culler, 1938).

Os fatos sobre a esquiva so claros, mas sua representao um outro problema. evidente que o fortalecimento comportamental observado no condicionamento operante por reforamento positivo, desde que nenhum reforador positivo era contingente resposta. Parece pouco provvel que o girar a roda tenha sido condicionado classicamente, uma vez que a resposta tem um carter de emisso. Mas ser conveniente considerar a possibilidade. O paradigma

Si > Rj
[17.1] S2 -----> R-2

onde S j = S rRj = R^ = C = K
- 394 -

tom dc 1000 cps choque elctrico no mdida correr, pular, guinchar, etc. semelhante a R 2 ,

aparentemente, e adequado. Note, todavia, que o Diagrama [17.11 no descreve o efeito que o correr na roda (CR) tem sobre o choque (Sj). No verdadeiro condicionamento Pavloviano, a CR no impede a ocorrncia de S2- Quando um cachorro passa a salivar ante um som, a salivao no evita a ocorrncia de alimento. O fato de a resposta condicionada na esquiva evitar a ocorrncia de S2 pode ou no ser significante. Brogden, Lipman e Culler supuseram que se o correr que eles observaram era realmente uma CR, ento a omisso do choque no deveria fazer qualquer diferena no comportamento de correr. O procedimento Pavloviano meramente uma prescrio para emparelhar dois eliciadores. Realizou-se, ento, um segundo experimento em que o tom de 1000 cps era apresentado e, 2 seg mais tarde, o choque era administrado como no primeiro experimento. No segundo experimento, todavia, as respostas de correr que ocorriam antes do choque no tinham efeito na liberao subsequente do choque. O experimento, ento, proporciona um emparelhamento estrito de um S\ e S j. Se a resposta de correr condicionada pelos princpios Pavlovianos, deveramos esperar que o novo reflexo S\ CR (Tom-Correr) aumentasse em fora. Os resultados do experimento, vistos na Fig. 17-11, so nitidamente diferentes daqueles do primeiro experimento, vistos na Fig. 17-10. Durante o segundo experi mento, a fora da resposta de correr flutuou, aumentando vagarosamente at um mximo (cerca de 50 por cento das tentativas dirias no 13o. dia) e, ento, declinando at um nvel baixo, prximo de zero, l pelo vigsimo d ia (5000^ tentativa), quando o experimento terminou. Contraste este resultado com o desempenho de 100 por cento dos animais no primeiro experimento (Fig. 17-10) depois de apenas 8 dias (120 tentativas). O fracasso em se condicionar o correr atravs de um procedimento Pavloviano elimina a possibilidade de que o condicionamento de esquiva seja um tipo de condicionamento respondente.

dias de treinamento 1 - iguni 17-11. Percentagem dc respostas dc correr, quando o correr no evita S? (segundo liroirden. I ipinan c Cuiier, 193S). ~

- 395-

O condicionamento de esquiva nem um fortalecimento operante