B - BAUM, W. (2012) - Repensando o Reforçamento, Alocação, Indução e Contingência

REPENSANDO O REFORAMENTO: ALOCAO, INDUO E CONTINGNCIA
Autor: William M. Baum Tradutores: Diego Lima, Lunna Toffano de Abreu e Lima, Karollane Sapucaia, Andresa De Souza, Guilherme Chirina
O conceito de reforamento pelo menos incompleto e quase certamente incorreto. Uma forma alternativa de organizar nosso conhecimento sobre comportamento pode ser construda em torno de trs conceitos: alocao, induo e correlao. Alocao a medida do comportamento e capta a centralidade da escolha: todo comportamento implica em escolhas e consiste em escolhas. Alocao muda como resultado de induo e correlao. O termo induo abrange fenmenos como comportamentos adjuntivos, interinos e terminais - comportamentos induzidos em uma situao por ocorrncia de comida ou outro Evento Filogeneticamente Importante (Phylogeneticly Important Event PIE) na situao. A induo se assemelha ao controle de estmulos no fato de que no existe relao de um-para-um entre o evento que induz e o comportamento induzido. Se se permitisse que algum controle de estmulo fosse o resultado de filogenia, ento a induo e o controle de estmulos seriam idnticos, e um PIE seria semelhante a um estimulo discriminativo. Muitas evidncias sustentam a ideia que um PIE induz todas atividades relacionadas ao PIE. Pesquisas tambm apoiam a ideia de que estmulos correlacionados a PIEs se tornam indutores condicionais relacionados a PIEs. Contingncias criam correlaes entre atividades operantes (como presso barra) e PIEs (como comida). Quando uma atividade se torna relacionada a um PIE, ela induzida pelo PIE bem como outras atividades ligadas a PIEs. Contingencias tambm restringem possveis performances. Essas restries tambm especificam funes de retorno (feedback), o que explica fenmenos como a maior taxa de respostas em esquemas de razo comparado a esquemas de intervalo. Alocaes que incluem muitas atividades operantes so selecionadas apenas no sentido em que elas geram uma frequncia maior da ocorrncia do PIE na situao: contingencia e induo fazem a seleo. Palavras chave: reforamento, contingencia, correlao, induo, estmulo indutor, indutor, alocao, Evento Filogeneticamente Importante, restabelecimento _________________________
O objetivo desse artigo expor um modelo conceitual para compreender o comportamento em relao ao ambiente. No tentarei explicar todos os fenmenos conhecidos pelos analistas do comportamento; seria impossvel. Em vez disso, vou oferecer esse modelo como uma forma de pensar nesses fenmenos. A inteno substituir o modelo tradicional, que j tem mais de 100 anos, segundo o qual reforadores supostamente fortalecem a resposta ou a conexo estimulo-resposta, e no qual o condicionamento clssico e condicionamento operante so considerados dois processos distintos. Espera-se que leitores que conhecem esse assunto no encontrem nenhuma novidade aqui, pois os pedaos desse modelo j existiam, e eu simplesmente juntei-os. Ele baseia-se em trs conceitos: (1) alocao, que a medida do comportamento; (2) induo, que o processo motivador do comportamento; e (3) contingncia, que a relao que compele e conecta eventos comportamentais e ambientais. Como nenhum destes existe em um dado momento, eles necessariamente implicam em uma viso molar do comportamento. Conforme expliquei em trabalhos anteriores (Baum, 2001; 2002; 2004), as vises molar e molecular no competem entre si, so paradigmas diferentes (Kuhn, 1970). A escolha entre elas no feita com base em dados, mas baseada em plausabilidade e elegncia. Nenhum teste experimental pode escolher entre elas, pois so incomensurveis ou seja, diferem ontologicamente. A viso molecular diz a respeito a respostas discretas, estmulos discretos e contiguidade entre estes eventos. Ela oferece estes conceitos para a construo de teorias. Foi projetada para explicar mudanas no comportamento a curto prazo, abruptas, tais como as que acontecem em registros cumulativos (Ferster & Skinner, 1957; Skinner, 1938). J quando aplicada a fenmenos temporalmente estendidos, como escolha, os resultados so fracos, pois suas teorias e explicaes quase sempre lanam mo de construtos hipotticos para lidar com lacunas temporais, o que faz com que sejam implausveis e deselegantes (Baum, 1989). A viso molar refere-se a atividades extensas, contextos extensos e relaes extensas. Efeitos a curto prazo so tratados como fenmenos localizados, menos extensos (Baum, 2002; 2010; Baum & Davison, 2004). Como o comportamento, por sua prpria natureza, necessariamente se desenrola no tempo (Baum, 2004), as
teorias e explicaes construdas baseando-se na viso molar tendem a ser simples e diretas. Qualquer teoria molar ou molecular especfica pode ser invalidada pelo teste experimental, mas ningum deveria pensar que o paradigma portanto invalidado; uma nova teoria sempre pode ser inventada dentro do paradigma. O paradigma molar supera o paradigma molecular produzindo teorias e explicaes que so mais plausveis e elegantes.
A Lei do Efeito E.L. Thorndike (2000/1911), ao propor a lei do efeito, escreveu: De vrias respostas mesma situao, aquelas que so acompanhadas ou seguidas de perto pela satisfao da vontade do animal, sendo as outras coisas mantidas iguais, so mais firmemente conectadas com a situao, de maneira que, quando esta ocorrer novamente, tero maior probabilidade de ocorrer novamente... (p. 244). Desde o incio, a lei foi bastante criticada. J.B. Watson (1930), ridicularizando a teoria de Thorndike, escreveu: A maioria dos psiclogos... acreditam que a formao de hbitos implantada por fadas bondosas. Por exemplo, Thorndike fala em prazer carimbando o movimento bem sucedido e desprazer apagando os movimentos mal sucedidos. (p. 206). Assim, j em 1930, Watson era ctico com relao ideia de que consequncias satisfatrias poderiam fortalecer respostas. Ainda assim, a teoria continuou apesar de criticas ocasionais (e.g. Baum, 1973; Staddon, 1973). A teoria de Thorndike se tornou a base da teoria do reforamento de B. F. Skinner. No entanto, Skinner fez uma distino entre observao e teoria. Em seu trabalho Teorias de aprendizagem so necessrias? Skinner (1950) escreveu ... a Lei do Efeito no nenhuma teoria. Ela simplesmente especifica um procedimento para alterar a probabilidade de uma dada resposta. Ento, Skinner defendeu que a Lei do Efeito se referia observao de que quando, por exemplo, alimento torna-se contingente presso barra, a presso a barra aumenta em frequncia. No entanto, assim como Thorndike, ele tinha uma teoria de como isso aconteceu. Em seu trabalho de 1948 Superstio no Pombo, Skinner reafirmou a teoria de Thorndike com uma nova linguagem: Dizer que reforamento contingente a uma resposta pode no significar nada alm do que ele segue a resposta... provavelmente o condicionamento acontece apenas por causa da relao temporal, expressa em termos da ordem e proximidade entre resposta e reforamento. Se substituirmos satisfao por reforamento e acompanhado ou seguido de perto por ordem e proximidade retornaramos teoria de Thorndike acima. Skinner persistiu em sua viso que ordem e proximidade entre resposta e reforador so a base do reforamento; isso apareceu novamente em Cincia e Comportamento Humano (Skinner, 1953): No que se refere ao organismo, a nica propriedade importante da contingncia temporal. O reforador apenas segue a resposta... Devemos supor que a apresentao de um reforador sempre refora algo, j que necessariamente coincide com algum comportamento. (p.85). Da presente perspectiva, sabemos que a observao sobre contingncia de Skinner estava correta. No entanto, sua teoria sobre ordem e proximidade estava incorreta, pois um reforador no refora aquilo com o qual coincide. Isso no acontece no dia-a-dia; se eu por acaso estiver assistindo televiso quando o entregador de pizzas chegar, estarei eu inclinado a assistir mais televiso? (Embora, como veremos, a pizza importe, medida que agrega valor a, digamos, assistir um jogo de futebol na televiso.) Tambm no acontece em laboratrio, como Staddon (1977), entre outros, mostrou. Quando Staddon e Simmelhag (1971) repetiram o experimento de "superstio de Skinner, eles observaram que muitas atividades diferentes ocorriam durante os intervalos entre as apresentaes de alimento. Significativamente, as atividades muitas vezes no eram seguidas de perto por alimento; algumas apareciam depois da apresentao do alimento e desapareciam assim que ele era apresentado. A Figura 1 mostra alguns dados apresentados por Staddon (1977). O grfico esquerda mostra os efeitos de apresentar alimento a cada 12s para um pombo faminto. As atividades de se aproximar da parede da janela da cmara e de bater as asas aumentou e depois desapareceu, minando qualquer noo de que foram acidentalmente reforadas. O grfico direita mostra o efeito de apresentar alimento a um rato faminto a cada 30s. No comeo do intervalo o rato bebe e corre, mas estas atividades desapareceram antes que pudessem ser seguidas por alimento.
Pesquisas subsequentes confirmaram estas observaes muitas vezes, contradizendo a noo de fortalecimento por contiguidade acidental (e.g. Palya & Zacny, 1980; Reid, Bacha & Morn, 1993; Roper, 1978).
Fig 1. Comportamento induzido por alimento peridico. Esquerda: atividades realizadas por pombo apresentado a alimento a cada 12s. Direita: atividades realizadas por rato apresentado a alimentado cada 30s. Atividades que desapareceram antes do alimento ser entregue no puderam ser reforados. Reimpresso de Staddon (1977). Diante de resultados como os da Figura 1, algum teorizando com base no paradigma molecular tem pelo menos duas opes. Primeiramente, a contiguidade entre respostas e o alimento pode ser esticada para sugerir que as respostas so reforadas de forma fraca diante de atraso. Segundo, a contiguidade alimento-resposta pode ser exercida baseando-se na ideia de que o alimento pode eliciar respostas. Por exemplo Killeen (1994) teorizou que cada entrega de alimento eliciava excitao, um construto hipottico. Ele props que a excitao saltava seguindo o alimento e ento se dissipava depois de tempo sem alimento. Nesse caso, o desenvolvimento da excitao supostamente causava as respostas da Figura 1. Como veremos mais a frente, o paradigma molar evita a entidade hipottica ao basear-se por sua vez na relao estendida de induo. Para alguns pesquisadores, a inadequao do reforo baseado em contiguidade pode no ser novidade (Baum, 1973). Uma resposta para essa inadequao tem sido ampliar o conceito de reforamento tornando-o sinnimo de optimizao ou adaptao (e.g. Rachlin, Battalio, Kagel & Green, 1981; Rachlind & Burkhard, 1978). No entanto, essa redefinio requer questionamentos sobre o mecanismo. Assim como Herrnstein (1970) escreveu: Retroceder ao senso comum e concluir que os animais so adaptativos, i.e., fazem o que mais lhe traz beneficio, uma tentao que vale a pena ser resistida, pois a adaptao quando muito uma pergunta, no uma resposta (p.243). A definio baseada em contiguidade, por mais errada que fosse, ao menos tentava responder pergunta de como podem surgir aproximaes de comportamento timo ou adaptativo. Este artigo oferece uma resposta que evita a viso estreita dos conceitos de ordem, proximidade e fortalecimento e permite explicaes plausveis do comportamento tanto em laboratrio como no dia-a-dia. Por ela omitir a ideia de fortalecimento, poder-se-ia duvidar que este mecanismo devesse ser chamado de reforamento.
Alocao de Tempo entre Atividades Vemos na Figura 1 que alimento peridico muda a alocao de tempo entre atividades, como a de bater asas e bicar ou beber e correr. Algumas atividades aumentam de frequncia enquanto outras diminuem. Nenhuma noo de fortalecimento precisa entrar neste quadro. Pelo contrario, precisamos apenas perceber a mudana na alocao. Estar vivo se comportar, e podemos assumir que em uma hora de observao poder ser observado uma hora vlida de comportamento, assim como em um ms de observao poder ser observado um ms vlido de comportamento. Portanto, podemos comparar a alocao de comportamento a cortar uma pizza em pedaos. A Figura 2 ilustra essa ideia com um exemplo hipottico. O grfico mostra a alocao do tempo no dia de um estudante tpico. Aproximadamente 4 horas so gastas assistindo aula, 4 h estudando, 2,5 h se alimentando, 0,5 h no banheiro, 3 h em recreao e 2 h trabalhando. Isso tudo totaliza 16 h, sendo as outras 8 h usadas dormindo. Como um dia tem apenas 24 h, para que qualquer atividade aumente, outras tm que decrescer, e se alguma decrescer, outras tm que aumentar. Como veremos mais tarde, a finitude do tempo importante na compreenso dos efeitos das contingncias.
Fig. 2 Ilustrao hipottica do conceito de alocao. As horas gastas em atividades por um estudante tpico em um dia tpico totalizam 16 h, as outras 8 h sendo usadas para dormir. Se mais tempo for gasto em uma atividade, menos ser gasto em outras, e vice versa. Medir o tempo gasto em uma atividade pode apresentar desafios. Por exemplo, quando exatamente est um pombo bicando um boto ou um rato pressionando uma barra? Ligar um dispositivo ao boto ou barra permite que se mea o tempo gasto com base no nmero de vezes em que o dispositivo ativado. Por sorte, este mtodo em geral confivel; contar as vezes em que o dispositivo ativado e por quanto tempo em cada vez gera dados equivalentes (Baum, 1976). Apesar de no passado os pesquisadores muitas vezes acreditarem que contavam respostas discretas (bicadas e presses), no presente ponto de vista estavam usando a ativao de dispositivos para medir o tempo gasto em atividades contnuas (bicar e pressionar). Fora variaes assistemticas que podem ocorrer de amostra para amostra, a alocao do comportamento muda sistematicamente como resultado de duas fontes: induo e contingncia. Como vemos na Figura 1, um evento ambiental indutor como alimento aumenta algumas atividades e, como o tempo finito, necessariamente diminui outras. Por exemplo, alimento induz pombos a bicarem, choque eltrico induz agresso em ratos e macacos, e a remoo de alimento induz agresso em pombos. A Figura 3 mostra um exemplo hipottico. Acima (em Time 1) est representada a alocao de tempo entre atividades por um pombo em situao experimental que inclui um espelho e alimento peridico frequente. O pombo passa muito tempo se alimentando e descansando e pode direcionar algum comportamento agressivo ou reprodutivo para o espelho. Abaixo (Time 2) est representado o resultado do aumento do intervalo entre as entregas de alimento. Agora o pombo passa muito mais tempo apresentando comportamento agressivo para o espelho, menos tempo comendo, menos tempo descansando e pouco tempo em comportamento reprodutivo.
Fig. 3. Um exemplo hipottico ilustrando a mudana de comportamento devido a induo como mudana de alocao. Em Time 1, as atividades de um pombo em um espao experimental apresenta Alocao 1 em reposta ao recebimento peridico de alimento. Em Time 2, o intervalo entre os recebimentos de alimento foi aumentado, resultando um aumento de agresso direcionado ao espelho. Outras atividades necessariamente diminuem. Uma contingencia liga um evento ambiental a uma atividade, resultando em um aumento ou reduo da atividade. Por exemplo, fazendo-se uma ligao entre comida e presso barra, aumenta-se o tempo gasto a pressionando; fazendo-se uma ligao entre choque eltrico e presso a barra, geralmente diminui-se o tempo gasto pressionando. A Figura 4 ilustra com um exemplo hipottico. O diagrama de cima mostra a possvel alocao de comportamento de uma criana em uma sala de aula. Muito tempo gasto batendo em outras crianas e gritando, mas pouco tempo nas tarefas. H tempo usado na interao com o professor, o que no tem relao com estar fazendo as tarefas. O diagrama de baixo mostra o resultado da ateno do professor ter se tornado contingente a se dedicar s tarefas. Agora a criana dedica muito tempo s tarefas, menos tempo batendo e gritando, e um pouquinho mais de tempo interagindo com o professor provavelmente agora de uma forma mais amigvel. Como o aumento de uma atividade diminui outra, uma contingencia positiva entre recompensa e uma atividade implica em uma contingencia negativa entre a recompensa e outras atividades quanto mais gritos e batidas, menos ateno do professor. Uma forma de capturar ambos estes aspectos da contingncia considerar que a alocao inteira entra na contingncia com recompensa (Baum, 2002).
Fig. 4. Um exemplo hipottico ilustrando mudana de alocao por correlao. Em Time 1, as atividades de uma criana em sala de aula mostram Alocao 1, incluindo altas frequncias de atividades inoportunas. Em Time 2, depois que a ateno do professor se tornou contingente a fazer as tarefas, Alocao 2 inclui mais tempo dedicado s tarefas e necessariamente menos tempo a atividades inoportunas.
Induo O conceito de induo foi introduzido por Evalyn Segal em 1972. Para definir, ela se baseou nas definies de dicionrio estimular a ocorrncia de e ocasionar, e comentou ela implica em uma certa indireo em causar algo a acontecer, e parece apta para falar sobre operaes que podem ser eficazes apenas em conjuno com outros fatores (p.2). Na viso molar, essa indireo crucial, pois o conceito de induo significa que, em um dado contexto, a mera ocorrncia de certos eventos, como alimento i.e. indutores resulta na ocorrncia ou aumento de tempo dedicado a certas atividades. Todas as vrias atividades que em algum ponto foram chamadas de interinas, terminais, facultativas, ou adjuntivas, como as apresentadas na Figura 1, podem ser agrupadas como atividades induzidas (Hinline, 1984). So induzidas em qualquer situao que inclui eventos como alimento ou choque eltrico, os mesmos eventos que previamente foram chamados de reforadores, punidores, estimulos incondicionais, ou libertadores. A induo distinta da ideia mais estreita de eliciao, que presume uma relao temporal prxima entre estimulo e resposta. Um motivo para a introduo de um termo novo, mais amplo que os indutores no precisam de uma relao temporal prxima s atividades as quais induzem (Figura 1). Sua ocorrncia em uma dado ambiente o suficiente para induzir atividades, a maioria das quais esto estreitamente relacionadas ao evento indutor nas interaes da espcie com seu ambiente alimento induz a atividades relacionadas a alimento (por exemplo pombos a bicarem), choque eltrico induz a atividades ligadas a dor (como agressividade e corrida), e uma possvel companheira induz a cortejo e cpula.
Induo e Controle de Estmulo A induo se assemelha ao conceito de controle de estmulos de Skinner. Um estmulo discriminativo no se constitui de uma relao temporal um-para-um com o responder, mas sim aumenta a taxa de tempo gasta na atividade em sua presena. Em termos presentes, um estmulo discriminativo modula a alocao de atividades em sua presena; ele induz uma certa alocao de atividades. Pode-se dizer que um estmulo discriminativo estabelece a ocasio ou contexto para uma atividade operante. De forma similar, pode-se dizer que um indutor pode ocasionar ou criar um contexto para a atividade induzida. O controle de estmulos pode s vezes parecer mais complicado, como em uma discriminao condicional que requer uma certa combinao de eventos, mas no importa o quo complexa seja a discriminao, a relao com o comportamento a mesma. De fato, embora ns concebamos o controle de estmulo como um produto da histria de vida do indivduo (ontogenia), se ns aceitarmos a ideia de que algumas instncias do controle de estmulos podem existir como resultado da filogenia, ento o controle de estmulos e a induo seriam dois termos diferentes para o mesmo fenmeno: o efeito do contexto na alocao comportamental. A seguir, assumirei que a induo ou o controle de estmulos podem surgir tanto como resultados da filogenia ou da histria de vida. Apesar de Pavlov ter pensado em termos de reflexos e medido apenas secreo estomacal ou salivao, hoje podemos aplicar os termos atuais retrospectivamente e dizer que ele estava estudando induo (Hineline, 1984). Zener (1937), repetindo o procedimento de Pavlov com ces no restritos, observou que durante a execuo de um som que precedia a comida, os ces se aproximariam da vasilha de comida, balanariam suas caudas, e assim por diante tudo isso sendo comportamento induzido. Os experimentos de Pavlov nos quais estmulos condicionais como sons e imagens eram correlacionados com indutores como comida, choque eltrico e cido na boca, mostraram que correlacionando um estmulo neutro com um indutor muda-se a funo do estmulo. Nos termos atuais, ele se torna umestmulo indutor condicional ou um indutor condicional,
equivalente a um estmulo discriminativo. De forma semelhante, atividades ligadas por contingncia a indutores se tornam atividades relacionadas a indutores. Por exemplo, Shapiro (1961) descobriu que quando a presso barra por um co produzia comida, o co salivava sempre que esta era pressionada. Ns desenvolveremos essa ideia subseqentemente, quando discutirmos os efeitos das contingncias.
Eventos Filogeneticamente Importantes Por adquirirem a capacidade de induzir como o resultado de muitas geraes de seleo natural da filogenia eu os chamo de Eventos Filogeneticamente Importantes (PIEs; Baum, 2005). Um PIE um evento que afeta diretamente a sobrevivncia e reproduo. Alguns PIEs aumentam as chances de sucesso reprodutivo por sua presena; outros reduzem-no. Entre os eventos que aumentam, temos comida, abrigo e oportunidades de acasalamento; entre os eventos que reduzem, temos exemplos como predadores, parasitas e condies climticas severas. Os indivduos para os quais esses eventos no eram importantes produziram menos descendentes sobreviventes que seus competidores - para os quais eles eram importantes - e no esto mais representados na populao. Os PIEs so muitos e variados, dependendo do ambiente em que uma espcie evoluiu. Nos humanos, eles incluem eventos sociais como sorrisos, expresses zangadas e contato visual, eventos que afetam a aptido por causa de nossa longa histria de vivncia em grupos e pela importncia do pertencimento a um grupo para sobrevivncia e reproduo. PIEs incluem tambm eventos perigosos e amedrontadores como ferimentos, lugares altos, cobras, e objetos grandes se aproximando rapidamente. De acordo com sua origem evolutiva, PIEs e seus efeitos dependem da espcie. Breland e Breland (1961) relataram a intruso de atividades induzidas em suas tentativas de treinar diversas espcies usando contingncias com comida. Porcos procuravam por moedas de madeira da mesma forma que procurariam por comida; guaxinins limpavam moedas como se eles estivessem limpando comida; galinhas ciscavam o cho no mesmo espao que elas eram alimentadas. Quando a relevncia da filogenia foi amplamente reconhecida, artigos e livros comearam a apontar para restries biolgicas (Hinde & Stevenson-Hinde, 1973; Seligman, 1970). Em humanos, para as reaes a eventos como comida e ferimentos, ns podemos acrescentar a induo de respostas especiais para indivduos da mesma espcie conhecidos ou desconhecidos, como o sorriso, o levantamento de sobrancelha, o mostrar de lngua (Eibl-Eibesfeldt, 1975). Relatos de reforadores e punidores que no fazem referncia histria evolutiva falham em explicar por que esses eventos so efetivos da forma que so. Por exemplo, Premack (1963; 1965) props que o reforamento pode ser pensado como uma contingncia na qual a disponibilidade de uma atividade de alta probabilidade depende da ocorrncia de uma atividade de baixa probabilidade. Timberlake e Allison (1974) elaboraram essa ideia acrescentando que qualquer atividade restrita a ocorrer abaixo de seu nvel de linha de base, quando est livremente disponvel, est em privao de resposta e, quando feita contingente a qualquer atividade com um nvel mais baixo de privao, reforar essa atividade. Seja qual for a validade dessas generalizaes, elas requerem o questionamento Por que os nveis de linha de base de atividades como comer e beber so mais altos que os nveis de linha de base de correr e pressionar a barra? Privao e fisiologia no so respostas, a questo permanece, Porqu os organismos so constitudos de tal forma que quando a comida (ou gua, abrigo, sexo, etc. ) est em estado de privao, ele se torna um potente indutor? Ao ligar a importncia maior de comer e beber (comida e gua) filogenia explica-se porqu esses eventos so importantes em um sentido ltimo, e que o conceito de induo explica como eles so importantes para a flexibilidade do comportamento.
Fig. 5. Diagrama ilustrando que Eventos Filogeneticamente Importantes (PIEs) constituem um subconjunto de eventos relacionados aos PIEs, que por sua vez so um subconjunto de todos os eventos.
A Figura 5 ilustra que, dentre todos os eventos possveis estmulos ambientais e atividades simbolizados pelo crculo maior, PIEs so um pequeno subconjunto, e estmulos e atividades relacionados aos PIEs so um subconjunto maior. O fato de o subconjunto de estmulos e atividades relacionadas aos PIEs incluir o subconjunto de PIEs indica que os prprios PIEs geralmente so do tipo relacionados a PIEs, porqu ambientes naturais e situaes de laboratrio mostram que a ocorrncia de um PIE como comida prediz como e quando mais comida estar disponvel. Comida geralmente prediz mais comida, e a presena de um predador geralmente prediz perigo contnuo. Um conceito chave sobre indues que um PIE induz qualquer atividade relacionada ao PIE. Se um PIE, como comida, feito contingente a uma atividade como presso barra, a atividade (presso barra) se torna relacionada a um PIE (relacionado comida). A base experimental para esse conceito pode ser encontrada em experimentos que mostram que PIEs funcionam como estmulos discriminativos. Existem muitos experimentos deste tipo, e eu ilustrarei com trs exemplos mostrando que comida contingente a uma atividade induz essa atividade. Bullock e Smith (1953) treinaram ratos por 10 sesses. Cada sesso consistiu em 40 pelotas de comida, cada uma produzida por uma presso barra (isto , Razo Fixa 1) seguidas por 1 hora de extino (presso barra ineficaz). A figura 6 mostra o nmero mdio de presses durante a hora de extino durante as dez sesses. O decrscimo se assemelha ao decrscimo em erros que ocorrem durante a formao de uma discriminao. Foi assim que Bullock e Smith interpretaram seus resultados: O estmulo positivo (SD) foi presso-mais-comida, e o estmulo negativo (S) foi presso-sem-comida. A comida foi o elemento crtico controlando o responder. Sendo assim, os resultados apoiam a ideia de que a comida funciona como um estmulo discriminativo.
Fig. 6. Resultados de um experimento no qual a prpria comida serviu como estmulo discriminativo. O nmero de respostas durante uma hora de extino seguindo 40 respostas que produziram comida decresceu durante 10 sesses de experimento. As respostas seriam anlogas a erros. Os dados foram publicados em um artigo por Bullock e Smith (1953). O segundo achado ilustrativo, relatado por Reid (1958), referido como restabelecimento e tem sido estudado extensivamente (por exemplo, Ostlund & Balleine, 2007). A figura 7 mostra o resultado de forma esquemtica. Reid estudou ratos, pombos e estudantes. Primeiro, ele treinou o responder ao seguir cada resposta com comida (ratos e pombos) ou uma ficha (estudantes). Uma vez que o responder foi bem estabelecido, ele o submeteu no primeiro dia a 30 minutos de extino. Isso foi repetido nos dias 2 e 3. Ento, no dia 3, quando o responder desapareceu, ele apresentou um pouco de comida (ratos e pombos) ou uma ficha (estudantes). Essa recompensa gratuita foi imediatamente seguida por um aumento rpido no responder (circulado na figura 7). Assim, a comida ou ficha dada gratuitamente reinstalou o responder, funcionando da mesma forma que um estmulo discriminativo.
Fig. 7. Imagem dos resultados de Reid (1958) com o restabelecimento do responder seguindo a extino depois de uma nica apresentao do evento originalmente contingente (comida para ratos e pombos; fichas para estudantes) de forma independe da resposta. Um aumento rpido no responder (circulado) seguiu a apresentao, sugerindo que o evento contingente funcionou como um estmulo discriminativo ou um indutor. Como uma terceira ilustrao, ns temos dados que o prprio Skinner apresentou em seu artigo de 1948 sobre superstio. A figura 8 reproduz o registro cumulativo que Skinner diz ter mostrado o recondicionamento de uma resposta de pular de um lado ao outro por reforo adventcio. Olhando de perto para as duas primeiras ocorrncias de comida (setas circuladas), entretanto, ns vemos que nenhuma resposta ocorreu imediatamente antes da primeira ocorrncia e nem possivelmente imediatamente antes da segunda ocorrncia. O pular seguiu a comida; ele no o precedeu. Os resultados de Skinner mostram restabelecimento, no reforamento. Em outras palavras, o registro mostra a induo por comida de forma peridica similar quela mostrada na figura 1.
Fig. 8. Registro cumulativo que Skinner (1948) apresentou como evidncia do recondicionamento de uma resposta de pular de um lado para o outro. A comida foi proporcionada a cada minuto independente do comportamento do pombo. As disponibilizaes de comida (rotuladas reforadores) so indicadas por setas. Nenhuma resposta precedeu imediatamente a primeira e possivelmente a segunda disponibilizao de comida (circuladas), indicando que o resultado , de fato, um exemplo de restabelecimento. Copyright 1948 pela American Psychological Association. Reproduzida por permisso. Todos os trs exemplos mostram que a comida induz atividades operantes ou instrumentais que esto correlacionadas com ela. O PIE induz atividades relacionadas a ele, e esses exemplos mostram que atividades relacionadas ao PIE incluem atividades operantes que estiverem correlacionadas com ele atravs de contingncia. Contrria viso corrente de reforadores que sua funo primria fortalecer a resposta qual eles so contingentes, mas que eles tm um papel secundrio como estmulos discriminativos a viso presente afirma que existe apenas a funo do estmulo. Nenhuma noo de fortalecimento ou reforamento precisa ser levada em conta. Uma forma de entender o poder indutor de um PIE como a comida reconhecer que na natureza e no laboratrio a comida geralmente um sinal de que mais comida estar presente naquele ambiente para aquela atividade. Um pombo ciscando por sementes de grama, ao achar uma semente, tem uma probabilidade maior de achar mais sementes se continuar ciscando aquele local (busca focal; Timberlake & Lucas, 1989). Uma pessoa que est buscando um encontro na internet, ao encontrar uma perspectiva esperanosa em um site, provvel de encontrar mais se continuar buscando naquele site. Por essa razo, Michael Davidson e eu sugerimos que a metfora do fortalecimento deveria ser substituda pela metfora de orientao (Davidson & Baum, 2006). Um artigo por Gardner e Gardner (1988) argumentou vigorosamente em favor de um papel maior ao processo de induo em explicar as origens do comportamento, sugerindo at mesmo que a induo sua principal determinao. Eles chegaram a essa concluso a partir de estudos de filhotes de chimpanzs criados por humanos. A induo pareceu explicar muito do comportamento dos chimpanzs. Mas apenas a induo no pode explicar a seleo entre atividades, porque devemos tambm explicar a ocorrncia dos PIEs que induzem a vrias atividades. Isso requer que consideremos o papel da contingncia, porque as contingncias governam a ocorrncia de PIEs. O relato dos Gardner no d nenhuma explicao para a flexibilidade do comportamento dos indivduos, porque eles negligenciaram a importncia da contingncia dentro da evoluo comportamental (Baum, 1988).
Analogia com a Seleo Natural Como mencionado anteriormente, a otimizao por si s no uma explicao, mas requer explicao por um mecanismo. A evoluo de uma populao por seleo natural oferece um exemplo. A evoluo darwiniana requer trs ingredientes: (1) variao; (2) recorrncia; e (3) seleo (por exemplo, Dawkins, 1989; Mayr, 1970). Quando esto todos presentes, a evoluo acontece; eles so necessrios e suficientes. Os fentipos em uma populao variam em seu sucesso reprodutivo ou seja, no nmero de descendentes sobreviventes que eles produzem. Os fentipos tendem a recorrer de gerao em gerao isto , descendentes tendem a se parecer com seus pais porqu os pais transmitem material gentico para seus descendentes. A seleo ocorre devido capacidade do ambiente de suportar uma populao impor um limite para seu tamanho, e como conseqncia muitos descentes no sobrevivem, e o fentipo com mais descendentes sobreviventes aumenta naquela populao. A evoluo do comportamento em um curso de vida (ou seja, modelagem), visto como um processo darwiniano, tambm requer variao, recorrncia e seleo (Staddon & Simmelhag, 1971). A variao ocorre nas atividades em si e entre atividades. J que cada atividade composta de partes que so tambm atividades, a variao em uma atividade tambm variao entre atividades, mas em uma escala menor de tempo (Baum, 2002; 2004). PIEs e estmulos relacionados a PIEs induzem vrias atividades em qualquer situao. Portanto, a induo o mecanismo de recorrncia, fazendo as atividades persistirem no tempo, de forma anloga reproduo que permite que os fentipos persistam em uma populao com o passar do tempo. A seleo ocorre por causa da finitude do tempo, o que anlogo ao limite do tamanho da populao definido pela capacidade do ambiente de suportar essa populao. Quando os PIEs induzem vrias atividades, essas atividades competem entre si, uma vez que o aumento em uma exige que outras diminuam. Por exemplo, quando o pombo treinado para bicar teclas que ocasionalmente produzem comida, a bicada induzida por comida, mas o bicar compete pelo tempo com outras atividades de segundo plano como ficar se arrumando e descansar (Baum, 2002). Se a tecla da esquerda produz comida cinco vezes mais que a tecla da direita, ento a combinao de tecla da esquerda e comida induz mais bicadas na tecla da esquerda do que bicadas na tecla da direita a base para a relao de pareamento (Herrnestein, 1961; Davidson & McCarthy, 1988). Devido ao limite superior no bicar determinado por sua competio com atividades de segundo plano, o bicar na tecla da esquerda compete por tempo com o bicar na tecla da direita (Baum, 2002). Se ns calcularmos a taxa de bicadas na tecla da esquerda pela taxa de bicadas na tecla da direita e as compararmos com a taxa de comida conseguida com esquerda pela taxa conseguida pela direita, o resultado pode variar do pareamento estrito entre taxa de bicada e taxa de comida entre as duas teclas (Baum, 1974; 1979), mas os resultados geralmente se aproximam do pareamento, e simples evidncias matemticas mostram o pareamento como sendo ideal (Baum, 1981b). Sendo assim, embora a evoluo de populaes de organismos e a evoluo comportamental possam ser vistas como processos darwinianos otimizantes, elas funcionam por mecanismo prprios. O resultado a aproximao da otimizao, mas os mecanismos explicam esse resultado. Para compreender a evoluo comportamental completamente, ns precisamos no apenas entender os efeitos de competio dos PIEs, mas ns precisamos levar em considerao a ocorrncia dos PIEs como eles so produzidos pelo comportamento. Ns precisamos incluir os efeitos das contingncias.
Contingncias Sempre se soube que a noo de reforo incompleta. Por si mesma, ela no inclui nenhuma explicao da origem do comportamento a ser fortalecido; o comportamento precisa ocorrer antes que possa ser reforado. Segal (1972) pensou que talvez a induo pudesse explicar a origem do comportamento operante. Talvez a contingncia selecione comportamento originalmente induzido. Antes de seguir essa ideia, precisamos estar esclarecidos sobre o significado do termo contingncia. Nas citaes que vimos anteriormente, Skinner definiu contingncia como contigidade um reforador precisaria apenas seguir a uma resposta. Contrria a essa viso baseada em ordem e proximidade, uma contingncia no uma relao temporal. Rescorla (1968; 1988) pode ter sido o primeiro a apontar que apenas a contigidade no pode especificar uma contingncia, porqu uma contingncia requer uma comparao entre pelo menos duas ocasies diferentes. A figura 9 ilustra
o fato com uma tabela 2 por 2, na qual as colunas mostram a presena e ausncia do Evento 1, e e as linhas mostram a presena e ausncia do Evento 2. O evento 1 poderia ser um som ou bicada na tecla; o evento 2 poderia ser comida ou choque eltrico. A clula superior esquerda representa a conjuno entre esses dois eventos (isto , contigidade); a clula inferior direita representa a conjuno da ausncia dos dois eventos. Essas suas conjunes (marcas) devem ambas ter alta probabilidade para uma contingncia ocorrer. Se, por exemplo, a probabilidade do Evento 2 fosse a mesma, independente da presena ou ausncia do Evento 1 (clulas superior esquerda e superior direita), ento nenhuma contingncia existiria. Portanto, a presena de uma contingncia requer a comparao entre duas ocasies temporalmente separadas (Evento 1 presente e evento 1 ausente). Uma correlao entre a taxa de uma atividade e a taxa de comida implicaria em mais de duas comparaes por exemplo, notando vrias taxas de comida durante vrias taxas de bicadas (a base de uma funo de feedback; Baum, 1973, 1989). Contrrio a ideia de que a contingncia requer apenas conjuno temporal, a figura 9 mostra que contingncias acidentais deveriam ser raras, porqu uma contingncia acidental iria requerer pelo menos duas conjunes acidentais.
Fig. 9. Porqu uma contingncia ou correlao no simplesmente uma relao temporal. A tabela 2 por 2 mostra que as conjunes possveis da presena e ausncia de dois eventos, E1 e E2. Uma contingncia positiva existe entre E1 e E2 somente se duas conjunes ocorrem com alta probabilidade entre em tempos diferentes: a presena de ambos os eventos e ausncia de ambos os eventos (indicadas por marcas). A conjuno dos dois eventos isoladamente (contigidade) no suficiente. No que as relaes temporais sejam completamente irrelevantes, mas apenas que elas so relevantes de forma diferente daquela que uma concepo do reforo tradicional iria requerer. Considerando que as formulaes de Skinner atriburam um papel direto contiguidade, a concepo de contingncia ilustrada na figura 9 sugere em vez disso que o efeito da contiguidade indireto. Por exemplo, inserir atrasos no sinalizados em uma contingncia geralmente reduz a taxa de atividade (por exemplo, bicada na tecla) que produz o PIE (por exemplo, comida). Esses intervalos devem afetar o grau da correlao. Uma medida de correlao como o coeficiente de correlao (r) deveria decrescer ao passo que o atraso mdio aumentasse. Atrasos afetam a clareza de uma contingncia como aquela da figura 9, e afetam a varincia em uma correlao (para futuras discusses, ver Baum, 1973).
Esquiva Nenhum fenmeno ilustra melhor a inadequao da viso molecular do comportamento do que a esquiva, porque toda a funo da esquiva que quando a resposta ocorre, nada se segue. Por exemplo, Sidman (1953) treinou ratos em um procedimento no qual a presso barra adiava choques eltricos que, na ausncia de presso, ocorriam a uma taxa regular. Quanto maior a taxa de presso barra, menor a taxa de choque, e se a presso ocorresse a uma taxa suficientemente elevada, a taxa de choque era reduzida a um valor prximo de zero. Para tentar explicar a presso barra, teorias moleculares recorrem ao medo invisvel eliciado por estmulos invisveis, a reduo do medo resultante de cada presso barra ento chamada de teoria dos dois fatores (Anger, 1963; Dinsmoor, 2001). Em contraste, uma teoria molar de esquiva no faz referncia a variveis ocultas, mas se baseia na reduo mensurvel na freqncia de choque resultante da presso barra (Herrnstein, 1969; Sidman, 1953; 1966). Herrnstein e Hineline (1966) testaram a teoria molar diretamente atravs do treinamento de ratos em um procedimento onde a presso barra reduzia a freqncia do choque, mas no podia reduzi-la zero. Uma explicao molecular requer postular uma reduo invisvel do medo que depende unicamente da reduo da taxa de choque, admitindo implicitamente a explicao molar (Herrnstein, 1969). Em nossos termos, a contingncia negativa entre a taxa de choque e taxa de presso barra resulta em tornar a resposta de presso barra uma atividade relacionada ao choque. Choques, ento, induzem a presso barra. No procedimento de Herrnstein-Hineline, esta induo clara, porque o choque nunca desaparece por completo, mas no procedimento de Sidman, podemos supor que o contexto experimental - cmara, barra, etc - tambm induz a presso barra, como estmulos discriminativos ou indutores condicionais. Muitas evidncias apiam essas idias. Choques extras no contingentes a resposta
aumentam a freqncia de respostas de presso barra (Sidman, 1966; cf. restabelecimento discutido anteriormente); a extino da esquiva de Sidman prolongada quando a taxa de choque reduzida a zero, mas torna-se mais rpida na repetio (Sidman, 1966; cf. o estudo de Bullock & Smith discutido anteriormente); a extino na esquiva de HerrnsteinHineline na qual a presso barra passa a no reduzir a taxa de choques depende da quantidade de reduo da taxa de choque durante o treinamento (Herrnstein & Hineline, 1966); as sesses de esquiva de Sidman geralmente comeam com um perodo de aquecimento, no qual choques so apresentados at que inicie a presso barra - isto , at que o choque induza a presso barra (Hineline, 1977).
Fig. 10. Diferentes correlaes ou contingncias induzem ou a atividade alvo ou atividades outras que no a alvo, dependendo se o Evento Filogeneticamente Importante (PIE) envolvido normalmente aumenta ou diminui a aptido (sucesso reprodutivo) por sua presena. A Figura 10 ilustra por que o choque se torna um estmulo discriminativo ou um indutor condicional nos procedimentos de esquiva. Esta tabela dois-por-dois mostra os efeitos de contingncias positivas e negativas (colunas) pareados com PIEs que elevam ou diminuem a aptido (linhas). A seleo natural garante que PIEs perigosos (redutores de aptido, como leses, doenas, ou predadores) induzam atividades defensivas (por exemplo, esconder-se, paralisar-se, ou fugir) que removem ou atenuam o perigo. (Aqueles indivduos da populao que no conseguiram se comportar confiavelmente de tal modo geraram menos descendentes sobreviventes.) Na esquiva, uma vez que choque ou leso so redutores de aptido, qualquer atividade que possa evit-los ser induzida por eles. Aps o treino de esquiva, a atividade operante (por exemplo, presso barra) torna-se uma atividade de manuteno de aptido defesiva (condicional), e induzida juntamente com outras atividades relacionadas ao choque; o choque em si e a (perigosa) cmara operante fazem a induo. A clula inferior direita na tabela corresponde s relaes tipicamente chamadas de reforamento negativo. A seleo natural garante tambm que os PIEs que elevam a aptido (como, presas, abrigo, ou um companheiro) induzam atividades de aumento de aptido (por exemplo, alimentar-se, abrigar-se, ou cortejar). (Indivduos na populao que se comportaram confiavelmente de tal modo deixaram mais descendentes sobreviventes.) Na clula superior esquerda na Figura 10, um PIE que eleve a aptido (por exemplo, alimento) est em uma relao positiva com uma atividade alvo (operante), e o treinamento resulta na induo da atividade alvo juntamente com outras atividades de melhoria de aptido relacionadas a PIEs. Esta clula corresponde a relaes tipicamente chamadas de reforamento positivo. Quando a resposta de presso barra relacionada com comida ou quando relacionada com choque, a comida ou o choque funcionam como estmulo discriminativo, induzindo a presso barra. A comida prediz mais comida; o choque prediz mais choques. Uma correlao positiva entre a taxa de comida e a taxa de presso barra gera a condio para que a presso barra se torne uma atividade relacionada comida. A correlao negativa entre a taxa de choque e taxa de presso barra gera a condio para que a presso barra se torne uma atividade relacionada com o choque. Mais precisamente, as correlaes criam as condies para a comida e o choque induzirem alocaes que incluam quantidades substanciais de tempo gasto pressionando barra. Nas outras duas clulas da figura 10, a atividade alvo iria ou produzir um PIE de reduo de aptido - a clula tipicamente chamada de "punio positiva" - ou evitar um PIE de aumento de aptido - clula normalmente chamada de "punio negativa". De qualquer maneira, a atividade alvo reduziria a aptido e seria impedida de fazer parte de outras atividades relacionadas PIEs. Em vez disso, outras atividades, incompatveis com a atividade alvo, que manteriam a aptido, so
induzidas. Experimentos com punio positiva configuram um conflito, porque a atividade alvo geralmente produz tanto PIE de aumento de aptido quanto PIE de diminuio de aptido. Por exemplo, quando a atividade operante (como, pombos bicando uma tecla) produz tanto comida como choque eltrico, comum que a atividade se reduza a nveis abaixo do seu nvel na ausncia de choque (Azrin & Holz, 1966; Rachlin & Herrnstein, 1969). A comida induz a resposta de bicar, mas outras atividades (por exemplo, bicar fora da tecla) so negativamente correlacionadas com a taxa de choque e so induzidas pelo choque. O resultado uma alocao de compromisso incluindo menos bicadas na tecla. Chegaremos a uma concluso semelhante sobre punio negativa, em que a atividade alvo (por exemplo, bicar) cancela um PIE de aumento de aptido (apresentao de comida), quando discutirmos auto-preservao negativa. A ideia de que a punio induz atividades alternativas atividade punida ainda apoiada pela observao de que se a situao inclui outra atividade que positivamente correlacionada com a comida e no produz nenhum choque, essa atividade predominar (Azrin & Holz, 1966).
Os efeitos da Contingncia A contingncia relaciona uma atividade a um evento indutor e altera a alocao de tempo entre as atividades pelo aumento do tempo gasto nas atividades relacionadas. O aumento no tempo gasto em uma atividade digamos, presso barra - quando a comida feita contingente a ela foi no passado atribudo ao reforo, mas os nossos exemplos sugerem que seja devido induo. O aumento nas respostas de presso barra resulta da combinao de contingncia e induo, porque a contingncia transforma a presso barra em uma atividade relacionada comida (relacionada a PIE), como mostrado nos experimentos de Bullock e Smith (1953) (Figura 6) e de Reid (1958) (Figura 7). Podemos resumir essas idias da seguinte forma: 1. Eventos filogeneticamente importantes (PIEs) so indutores incondicionais. 2. Um estmulo correlacionado com um PIE torna-se um indutor condicional. 3. Uma atividade correlacionada positivamente com um PIE que aumente a aptido torna-se uma atividade relacionada a PIE condicional induzida - normalmente chamada de "operante" ou atividade "instrumental". 4. Uma atividade negativamente correlacionada com um PIE redutor de aptido torna-se uma atividade relacionada a PIE condicional induzida - normalmente chamada de esquiva operante. 5. Um PIE induz atividade operante relacionada a ele. 6. Um indutor condicional induz atividade operante relacionada ao PIE ao qual est relacionado.
Os efeitos da contingncia no precisam incluir nenhuma noo de fortalecimento ou reforo. Considere o exemplo da resposta de presso barra mantida por choque eltrico. A Figura 11 mostra um exemplo de registro cumulativo da presso barra de um macaco-de-cheiro do estudo de Malagodi, Gardner, Ward, and Magyar (1981). As curvas assemelham-se s produzidas por um esquema de intervalo fixo de comida, comeando com uma pausa e, em seguida, acelerando a uma taxa de resposta maior at ao fim do intervalo. No entanto, neste registro a ltima presso barra do intervalo produz um choque eltrico. O resultado requer, contudo, que o macaco seja previamente treinado para pressionar barra para evitar o choque eltrico. Embora no treino de esquiva o choque funcione como um estmulo aversivo ou punidor, na Figura 11 atua, paradoxalmente, para manter a resposta de presso barra, como se fosse um reforador. O paradoxo resolvido quando reconhecemos que o choque, como um PIE, induz a presso barra porque o treino de esquiva feito anteriormente tornou a resposta de presso barra uma atividade relacionada ao choque. Nenhuma noo de reforo atua - apenas o efeito da contingncia. O choque induz a presso barra, a presso barra produz o choque, o choque induz a presso barra, e assim por diante, em um ciclo.
Fig. 11. Registro cumulativo de um macaco-de-cheiro pressionando uma barra que produz um choque eltrico, no final do intervalo fixo. Mesmo que o macaco tenha sido previamente treinado para evitar o mesmo choque, ele agora continua a pressionar quando o pressionar produz o choque. Este resultado aparentemente paradoxal explicado pela viso molar do comportamento como um exemplo de induo. Reproduzido de Malagodi, Gardner, Ward, e Magyar (1981).
Os diagramas da Figura 12 mostram como a contingncia fecha um ciclo. O diagrama esquerda ilustra somente a induo. O ambiente E produz um estmulo S (choque), e o organismo O produz as atividades induzidas B. O diagrama direita ilustra o efeito de contingncia. Agora, o ambiente E liga o comportamento B ao estmulo S, resultando em um ciclo de induo e contingncia. O leitor j deve ter percebido que a mesma situao e o mesmo diagrama se aplicam s experincias com outros PIEs, como comida. Por exemplo, a Figura 1 mostra que, entre outras atividades, o alimento induz o bicar em pombos. Quando uma contingncia funciona de forma que bicadas tambm produzam alimentos, temos o mesmo tipo de ciclo como mostrado na Figura 12, exceto que o estmulo S a comida e o comportamento B bicar. A comida induz a atividade, e a atividade (operante) produz o alimento, o que induz a atividade, e assim por diante, como mostrado pelos resultados de Bullock e Smith (1953) (Figura 6) e do efeito de restabelecimento de Reid (1958) (Figura 7).
Fig. 12. Maneira pela qual a contingncia completa um ciclo no qual uma atividade operante (B) produz um evento indutor (S), que por sua vez induz mais da atividade. O representa organismo. E representa o ambiente. Esquerda: somente induo. Direita: a contingncia fecha o ciclo. Induo ocorre porque a atividade operante ou se torna relacionada com o indutor (S; um PIE). A Figura 13 mostra os resultados de um experimento que ilustra os efeitos de contingncias positivas e negativas (Baum, 1981a). Pombos treinados a bicar uma tecla de resposta que, ocasionalmente, produz comida, foram expostos a sesses dirias em que o cronograma de recompensa comeava com uma correlao positiva entre a taxa de bicar e a de comida. Era um tipo de esquema de intervalo varivel, porm era necessria apenas uma ocorrncia do bicar em qualquer momento do intervalo programado para que a comida fosse apresentada ao final desse intervalo (tecnicamente, um esquema conjunto de intervalo varivel de 10 s e razo fixa 1). Num ponto imprevisvel na sesso, a correlao mudava para negativa; agora, o bicar durante um intervalo programado cancelava a apresentao de comida ao final do intervalo. Finalmente, a um ponto imprevisvel, a correlao revertia para positiva. A Figura 13 mostra quatro registros acumulados representativos de 4 pombos deste experimento. Inicialmente, o bicar ocorria a uma taxa moderada, em seguida, diminuiu quando a correlao mudou para negativo (primeira linha vertical), e depois aumentou novamente quando a correlao reverteu-se para positivo (segunda linha vertical). A efetividade da contingncia negativa variou entre os pombos; suprimiu completamente o bicar a tecla no Pombo 57, e relativamente pouco no Pombo 61. Seguindo a nossa linha presente, estes resultados sugerem que quando a correlao era positiva, a comida induzia o bicar a tecla a uma taxa mais elevada do que quando a correlao foi negativa. De acordo com os resultados mostrados na Figura 1, no entanto, espera-se que a comida continue induzindo as bicadas. Como esperamos a partir da clula superior direita da Figura 10, face a uma contingncia negativa, pombos tipicamente bicam fora da tecla, por vezes, bem prximo a ela. A correlao negativa entre a comida e o bicar a tecla constitui uma correlao positiva entre a comida e o bicar fora da tecla; a atribuio entre as duas atividades se altera nas trs fases mostradas na Figura 13. Os resultados na fase do meio dos registros na Figura 13 se assemelham a auto-manuteno negativa (Williams & Williams, 1969). Em auto-modelagem, um pombo repetidamente apresentado a uma breve luz em uma tecla, que seguida por comida. Cedo ou tarde, a luz passa a induzir bicadas na tecla, e o bicar a tecla iluminada se torna persistente; automodelagem torna-se auto-manuteno. Na auto-manuteno negativa, bicar a tecla cancela a apresentao de comida. Esta contingncia negativa provoca uma reduo no bicar a tecla, como na Figura 13, ainda que no o suprima totalmente (Sanabria, Sitomer & Killeen, 2006). Presumivelmente, um comprometimento ocorre entre o bicar na tecla e o bicar fora da tecla - a atribuio de tempo entre o bicar na tecla e bicar fora da tecla muda de um sentido para o outro. Possivelmente, a luz da tecla pareada a comida induz o bicar na tecla, enquanto que o alimento induz o bicar fora da tecla.
Fig. 13. Resultados de um experimento mostrando a discriminao de correlao. Quatro registros cumulativos de sesses completas de 4 pombos so mostrados. No incio da sesso, a correlao entre bicar e alimentar-se positiva; se uma bicada ocorresse em qualquer parte do intervalo de tempo programado, a comida era entregue no final do intervalo. Seguindo a primeira linha vertical, a correlao mudou para negativa; uma bicada durante o intervalo cancelava a apresentao de comida no final do intervalo. A taxa do bicar caiu. Seguindo a segunda linha vertical, a correlao reverteu-se para positiva, e a taxa de bicar voltou a subir. Adaptado de Baum (1981a).
Um teste Para testar o ponto de vista molar de contingncia ou correlao, podemos aplic-la para explicar um enigma. W. K. Estes (1943; 1948) relatou dois experimentos onde pr-treinou ratos em duas condies: (a) um tom foi pareado com comida sem nenhuma barra presente, e (b) presso barra foi treinada fazendo a comida contingente presso barra. A ordem das duas condies no fez diferena para os resultados. O ponto-chave era que o tom e barra nunca ocorriam em conjunto. Estes testou os efeitos do tom o apresentando enquanto a presso barra era colocada em extino (sem comida). A Figura 14 mostra um resultado tpico. A presso barra diminui ao longo do intervalo de 5 minutos, mas cada vez que o tom ocorria, a presso aumentava. Este achado apresentou um problema para a viso molecular de Estes - isto , para uma teoria dependente de contigidade entre eventos discretos. A dificuldade era que, uma vez que o tom e a barra nunca haviam ocorrido juntos, nenhum mecanismo associativo baseado em contigidade poderia explicar o efeito do tom na presso barra. Alm disso, a pelota de comida no poderia fazer a mediao entre o tom e a barra, porque a comida nunca tinha precedido a presso barra, apenas a seguido. A explicao de Estes era criar o que ele chamou de estado antecipatrio condicionado (CAS). Ele props que pareando o tom com comida resultou na eliciao do CAS pelo tom e que o CAS, ento, afetou a resposta de presso barra durante o teste de extino. Esta idia, entretanto, levanta a questo: Por que o CAS elevaria a presso barra? Ele tambm nunca havia precedido a presso barra. A explicao s faz piorar a questo, porque, enquanto o enigma comeou com a explicao para o efeito do tom, agora mudou para uma entidade hipottica no observada, o CAS. A confuso ilustra bem como a viso molecular do comportamento leva a entidades hipotticas e pensamento mgico. O ponto de vista molecular pode explicar o resultado de Estes somente se utilizar-se de mediadores invisveis (Trapold & Overmier, 1972). (Veja Baum, 2002, para uma discusso mais completa.)
Fig. 14. Resultados de um experimento em que a presso barra passando por extino foi aumentada pela apresentao de um tom que tinha sido previamente pareado com o alimento que tinha sido usado no treinamento de presso barra. Porque o tom e a presso barra nunca tinham ocorrido juntos antes, o ponto de vista molecular tem dificuldades em explicar o efeito do tom sobre a resposta de presso barra, mas o ponto de vista molar explica como a induo da presso barra como uma atividade relacionada a alimento. Os dados foram publicados por Estes (1948).
O paradigma molar (por exemplo, Baum, 2002; 2004) oferece uma explicao clara do resultado de Estes. Primeiro, parear o tom com a comida faz do tom um estmulo indutor (um indutor condicional). Isto significa que o tom ir induzir qualquer atividade relacionada comida. Em segundo lugar, tornar a comida contingente a presso barra - isto , correlacionar presso barra a comida - torna a presso barra uma atividade relacionada comida. Assim, quando o tom reproduzido na presena da barra, induz a presso barra. Quando tiramos o foco da contiguidade, o resultado parece bvio.
Restrio e Conexo Os efeitos da contingncia vo alm de simplesmente "fechar o ciclo". A contingncia tem dois efeitos: (a) cria ou causa uma correlao entre a atividade operante e o evento contingente - o equivalente ao que um economista chamaria de uma restrio; (b) como isto ocorre repetidamente, logo faz com que a atividade operante torne-se relacionada ao evento contingente (indutor) - serve para conectar os dois. A contingncia assegura o aumento da atividade operante, mas tambm restringe o aumento, restringindo os possveis resultados (alocaes). A Figura 15 ilustra estes efeitos. O eixo vertical mostra a frequncia de um evento indutor representado como tempo gasto em uma atividade de melhoria de aptido, como comer ou beber. O eixo horizontal indica o tempo gasto em uma atividade induzida ou operante, como a presso barra ou correr na roda. A Figura 15 diagrama situaes estudadas por Premack (1971) e por Allison, Miller, e Wozny (1979); assemelham-se tambm a um diagrama de Staddon (1983; Figura 7.2). Em uma condio de linha de base, sem contingncia, muito tempo gasto na atividade indutora e relativamente pouco tempo gasto na atividade que ir tornar-se um operante. O ponto rotulado "linha de base'' indica esta alocao. Quando uma contingncia introduzida, representada pela linha slida na diagonal, que indica uma contingncia tal como num esquema de razo, uma dada durao da atividade operante permite uma dada durao da atividade indutora (ou certa quantidade de PIE). A contingncia restringe as possveis alocaes entre o tempo na atividade contingente (comer ou beber) e o tempo na atividade operante (presso barra ou correr). Qualquer alocao que ocorra deve estar sobre a linha; alocaes fora da linha no so mais possveis. O ponto na linha ilustra o resultado usual: uma alocao que inclui mais atividade operante do que na linha de base e menos do PIE do que na linha de base. O aumento da atividade operante teria sido chamado de um efeito de reforamento, no passado, mas aqui aparece como um resultado da combinao de induo com a restrio da linha de contingncia (tambm conhecido como funo de feedback; Baum, 1973, 1989, 1992). A diminuio do PIE poderia ter sido chamada de punio de comer ou beber, mas aqui tambm um resultado da restrio imposta pela contingncia (Premack, 1965).
Fig. 15. Efeitos de contingncia. Em uma condio de linha de base, sem contingncia, pouco da atividade que ir tornar-se um operante (por exemplo, presso barra ou correr na roda, a atividade a-ser-induzida) ocorre, enquanto muito da atividade a ser contingente relacionada a PIE (por exemplo, comer ou beber; a atividade de induo) ocorre. Esta a alocao de linha de base (ponto superior esquerdo e linhas tracejadas). Depois que o PIE (comida ou gua) feito contingente a atividade operante, toda alocao que ocorrer deve estar na linha slida. A seta aponta para a nova alocao. Tipicamente, a nova alocao inclui um grande aumento na atividade operante sobre a linha de base. Assim, a contingncia tem dois efeitos: a) restringir possveis alocaes, e b) tornar o comportamento operante relacionado a PIE de modo que seja induzido em grande quantidade. Outra forma de expressar os efeitos na Figura 15 pode ser dizer, ao restringir as alocaes possveis, a contingncia agrega valor atividade operante induzida. Uma vez que a atividade operante se torna relacionada ao PIE, a atividade operante e o PIE se tornam partes de um "pacote". Por exemplo, bicar e comer tornam-se partes de uma alocao ou pacote que pode ser chamado alimentao, e pode-se dizer que o alimento ou comer emprestam valor para o pacote de alimentao. Se a presso barra for necessria para um rato correr em uma roda, a presso barra se torna parte da resposta de correr (Belke,
1997; Belke & Belliveau, 2001). Se a presso barra for necessria para um camundongo obter material para o ninho, a presso barra torna-se parte da construo do ninho (Roper, 1973). A Figura 15 indica que isso no ocorre sem algum custo, tambm, porque a atividade operante no aumenta o suficiente para levar o nvel de comer ao seu nvel de linha de base; algum nvel da atividade de alimentao sacrificado em favor de um nvel mais baixo da atividade operante. Em um exemplo dirio, suponha que Tom e seus amigos assistam futebol todos os domingos e, geralmente, comam pizza enquanto assistem. Fazendo referncia Figura 9, podemos dizer que assistir futebol (E1) correlacionado com o comer pizza (E2), uma vez que as frequncias mais elevadas so as conjunes nas caixas marcadas, e as conjunes nas caixas vazias so relativamente raras. Ao invs de apelar para o reforo ou o fortalecimento, podemos dizer que ver futebol induz a comer pizza ou que as duas atividades formam um pacote com valor mais alto do que qualquer um dos dois isoladamente. No preciso introduzir conceito de valor, porque tudo que ele significa que o PIE induz atividades relacionadas ao PIE, mas esta interpretao de agregar valor serve para ligar a presente discusso com a economia comportamental. Outra possvel ligao seria a de olhar para a demanda como a induo da atividade (por exemplo, trabalho, ou fazer compras) pelo produto demandado e elasticidade como a mudana na induo com a mudana no esquema a de pagamento ou funo de feedback. No entanto, um relato quantitativo completo das alocaes que realmente ocorrem est alm do escopo deste artigo (ver Allison, 1983; Baum, 1981b; Rachlin, Battalio, Kagel, e Green, 1981; e Rachlin, Green, Kagel, e Battalio, 1976 para exemplos). Parte de uma teoria pode ser formulada por meio da quantificao de contingncia com o conceito de funo de feedback, porque as funes de feedback permitem a especificao mais precisa das variedades de contingncia.
Correlaes e Funes de Feedback Toda contingncia ou correlao especifica uma funo de feedback (Baum, 1973; 1989; 1992). Uma funo de feedback descreve a dependncia da taxa de resultado (digamos, taxa de disponibilidade de comida) e da atividade operante (digamos, taxa de bicadas). A linha de restrio na Figura 15 especifica uma funo de feedback para um esquema de razo no qual a taxa do indutor da contingncia diretamente proporcional taxa da atividade induzida. A funo do feedback para um esquema de intervalo varivel mais complicada, visto que precisa aproximar-se da taxa de resultado programada tal como um assntota. Veja o exemplo na Figura 16. A curva superior tem trs propriedades: (a) ela passa pela origem, pois no existe disponibilidade de comida se no houver atividade operante; (b) se aproxima de uma assntota; e (c) conforme a atividade operante se aproxima do zero, a inclinao da curva se aproxima relao recproca do parmetro a na equao descrita (1/a; Baum, 1992). Ela restringe possveis desempenhos, porque qualquer que seja a taxa da atividade operante, a taxa de resultado (indutor) deve estar sobre a curva. A curva inferior sugere uma distribuio de frequncia da atividade operante em vrias ocasies. Embora a taxa mdia de operantes e a taxa mdia de indutores corresponderiam a um ponto na curva de feedback, a distribuio indica que a atividade operante deveria variar em torno da moda e no necessariamente se aproximaria da taxa de atividade mxima.
Fig. 16. Exemplo da funo de feedback para um esquema de intervalo varivel. A curva superior, funo de feedback, passa pela origem e se aproxima de uma assntota (60 PIEs por h; um IV 60s). Sua equao aparece no lado direito inferior. A mdia do intervalo t igual 1.0. O parmetro a igual 6.0. esperado que a taxa de resposta varie de tempos em tempos, como se v na distribuio abaixo da funo do feedback (frequncia est representada no eixo vertical direita). A Figura 17 traz dados no publicados obtidos por John Van Sycke (1983), um estudante da Universidade de New Hampshire. Vrias sesses de emisso de respostas de um rato em um esquema de intervalo varivel foram estudadas atravs da anlise de amostras de intervalos sucessivos de 2 minutos onde foram contados o nmero de presses barra e a disponibilizao de comida em cada intervalo. Todos os intervalos de tempo foram agrupados de acordo com o nmero de presses barra. Posteriormente, a taxa de presso barra e a taxa de disponibilidade de comida foram calculadas para cada nmero de presso. Estes dados so representados pelos pontos que esto traados no grfico. A mesma equao como a descrita na Figura 15 se ajusta aos pontos; o parmetro a estava perto de 1,0. A distribuio de frequncia da taxa de presso
demonstrada pela curva sem smbolos (ordenada direita). Percebe-se que algumas das amostras de 2 minutos no possuem presses, poucas possuem somente uma (0,5 presso/minuto), e uma moda aparece em torno de 5 presses/minuto. Taxas de presso que superam 15 presses/minuto (30 presses em 2 minutos) so raras. Desta maneira, a combinao de induo de presso a barra atravs da disponibilidade ocasional de comida junto com a funo de feedback resulta em uma performance estvel demonstrada pelos resultados.
Fig. 17. Exemplo emprico da funo de feedback em um esquema de intervalo varivel. O nmero de presso a barra e nmero de comida disponibilizada foram avaliados em intervalos consecutivos de 120-s. A taxa de comida e de presso barra foi calculada para cada nmero de presso por 120 s. Losangos abertos representam a taxa de comida. A equao dd feedback da Figura 15 foi ajustada para estes pontos. A distribuio da frequncia (eixo vertical direita) abaixo mostra a percentagem das frequncias de vrias taxas de resposta. Os quadrados fechados mostram a mdia da taxa de resposta. Embora o parmetro a esteja perto de 1,0 na Figura 17, ele normalmente excede 1,0, variando em at 10 ou mais quando outros conjuntos de dados esto includos na mesma equao (Baum, 1992). Isto representa um quebra-cabea, pois algum pode supor que a partir do momento em que a taxa de resposta se reduzir a nveis extremamente baixos, a disponibilidade de comida estaria estabelecida antes de cada resposta, e cada resposta ocasionaria a disponibilizao de comida. Isso resultaria na aproximao de taxas semelhantes ao esquema de razo fixa 1 prximo origem, pela ao da funo do feedback. Uma possvel explicao da razo pela qual a inclinao (1/a) continua reduzida a 1,0 prxima da origem refere-se ao fato de que quando a disponibilidade de comida torna-se rara, ocorre uma espcie de efeito reestabelecedor, e cada disponibilizao de comida induz uma exploso de presso barra. J que a disponibilidade de comida no foi reestabelecida, a exploso normalmente fracassa em produzir comida e desta maneira garante vrias presses para cada vez que comida disponibilizada. A relevncia da funo de feedback tem sido desafiada por dois tipos de experimentos. No primeiro, uma contingncia de curto prazo foi comparada a uma contingncia de longo prazo. Neste caso, a contingncia de curto prazo demonstrou ser capaz de governar o desempenho numa extenso maior do que a contingncia de longo prazo (ver, Thomas, 1981; Vangha & Miller, 1984). Nesses experimentos, o bicar a tecla ou a presso barra produzia comida na contingncia de curto prazo, porm cancelava a comida na contingncia de longo prazo. O nvel de resposta ficou abaixo do ideal, pois a taxa de comida teria sido mais elevada se nenhuma resposta ocorresse. O fato de que respostas ocorreram nesses experimentos sustenta a presente perspectiva. A comida positivamente correlacionada induz a atividade relacionada comida (presso ou bicar); na outra situao onde a comida negativamente correlacionada, quando ocorre, simplesmente contribui para a induo da atividade operante. Estes experimentos podem ser comparados a situaes como a auto-manuteno negativa (Williams & Williams, 1969) ou o que Hermstein e Loveland (1972) chamou de esquiva da comida. Mesmo considerando que bicar a tecla cancela a disponibilidade de comida, ainda assim o pombo bica, pois quando a comida disponibilizada induz o bicar (incondicionalmente; Figura 1). No entanto, Sanabria, Sitomer e Killen (2006) demonstraram que, sob algumas condies, a contingncia negativa altamente eficaz reduzindo a taxa de bicada a nveis baixos, independentemente do fato da comida estar sendo ocasionada continuamente. Retomando a discusso da Figura 13, a contingncia negativa entre bicar a tecla e a comida implica tambm em uma contingncia positiva entre outras atividades e comida, particularmente as atividades de bicar fora da tecla. Consideraes similares explicam o contrafreeloading - a observao de que um pombo ou rato ir bicar a tecla ou pressionar a barra mesmo se a mesma comida produzida contingente bicada na tecla ou presso barra estiver livremente disponvel (Neuringer, 1969; 1970). A bicada ou presso so aparentemente induzidas pela comida produzida, ainda que outra fonte de comida esteja disponvel. Mesmo no caso em que no exista uma tecla para ser bicada, Palva e
Zacny (1980) perceberam que pombos que no haviam passado por treinamento e que eram alimentados em um determinado horrio do dia, bicavam por toda parte por volta daquele mesmo horrio. O outro desafio da relevncia das funes de feedback apresentado por experimentos onde a funo de feedback alterada sem nenhuma mudana concomitante no comportamento. Por exemplo, Ettinger, Reid e Staddon (1987) estudaram o efeito da presso barra produzindo comida em um esquema onde ambos, tempo e presso intercambiavam entre si para promover a disponibilidade da comida. Durante taxas de respostas baixas, o esquema se assemelhava a um de intervalo, pois o esquema transcorria principalmente com a passagem do tempo, enquanto que durante altas taxas de respostas, o esquema se assemelhava a um de razo, pois os esquemas transcorriam principalmente devido emisso de respostas de presso barra. Ettinger et al. variaram os esquemas e descobriram que a taxa mdia de respostas diminua de um modo linear quando a taxa de comida aumentava, porm esta variao no esquema no teve nenhum efeito nesta relao. Eles concluram que a funo de feedback foi irrelevante. No entanto, os esquemas escolhidos por eles eram todos funcionalmente equivalente a esquemas de razo fixa e os ratos responderam exatamente como responderiam em esquemas de razo-fixa. Em desempenhos de razo fixa, comportamentos induzidos que no sejam o de presso barra tendem a limitar-se a perodos imediatamente aps o recebimento de comida, tal como demonstrado na Figura 1; uma vez que a presso barra inicia-se, existe uma tendncia de proceder nessa resposta ininterruptamente at que a comida seja novamente disponibilizada. O perodo ps-comida aumenta conforme a razo aumenta, conservando a proporcionalidade relativa de presso barra e de outras atividades induzidas. A inclinao da funo linear de feedback determina o perodo ps-comida, porm a taxa de resposta em esquemas de razo indiferente a isso (Baum, 1993; Felton & Lyon, 1966). A reduo na mdia da taxa de resposta observada por Ettinger et al. ocorreu pelo mesmo motivo que acontece com esquemas de razo: o perodo ps-comida, ainda que menor para razes menores, estava numa proporo crescente do intervalo entre-comida em funo da diminuio da razo efetiva. Portanto, a concluso de que funes de feedback so irrelevantes foi injustificada. Funes de feedback se tornam indispensveis quando tentamos entender fenmenos bsicos, tal como a diferena entre esquemas de razo e de intervalo. Essas duas funes diferentes de feedback linear para esquemas de razo (Figura 15) e curvilnea para esquemas de intervalo (Figuras 16 e 17) explicam a diferena nas taxas de respostas dos dois tipos de esquemas (Baum, 1982b). Em esquemas de razo, o ciclo de contingncia demonstrado na Figura 12 inclui somente o feedback positivo e direciona a taxa de resposta em direo ao seu nvel mximo frente s restries da situao. Esse nvel mximo de taxa de resposta necessariamente indiferente variao da razo e da taxa de comida. Em esquemas de intervalo, onde os nveis de taxa de comida se estabilizam, a comida induz taxas de respostas mais moderadas (Figura 17). Essas diferenas na funo de feedback importante para que se possa compreender essas situaes de laboratrio e tambm situaes do dia-a-dia que envolvem outras contingncias, tais como os esquemas de razo onde o prprio comportamento do indivduo responsvel pelos resultados, em contraste com contingncias envolvendo esquemas de intervalo, nas quais outros fatores fora do controle das pessoas, parcialmente determinam o resultado.
Poder Explicativo O poder conceitual desse modelo alocao, induo e contingncia supera aquele do conceito de reforamento, baseado na contiguidade. Caso este termo seja redefinido e chamado de reforamento, ou receba outro nome (induzimento?), ele explicaria uma vasta srie de fenmenos. Vimos que este modelo explica resultados padronizados tais como condicionamento operante e respondente, a interao operante-respondente e comportamento adjuntivo. Podemos dizer que capaz de explicar esquiva e resposta mantida por choque. Explica tambm o efeito de eventos no-contingentes (ex., reforamento nocontingente, um oximoro). Vamos agora finalizar com alguns exemplos de estudos sobre escolha, estudos sobre controle de estmulos e observaes do dia-a-dia. Dinmicas da escolha. Em um experimento tpico de escolha, um pombo bica em duas teclas de resposta que individualmente operam um distribuidor de comida de maneira ocasional e imprevisvel baseado na passagem do tempo (esquema de intervalo varivel). Escolha ou preferncia medida como um logaritmo da razo de bicadas em uma chave pelas bicadas na outra. Para olharmos para o reforamento putativo, ns examinamos o logaritmo da razo de bicada na tecla produtiva (esquerda ou direita) pelas bicadas na outra tecla (direita ou esquerda). Com o procedimento correto, se analisamos a preferncia seguida de comida, somos capazes de separar qualquer efeito do fortalecimento do efeito indutor da comida (ex., Cowie, Davison, & Ellife, 2011). Por exemplo, um resultado impressionante demonstrou que comida e estmulos que
predizem comida induzem outras atividades que no incluem aquela que produz o resultado (Boutros, Davison, & Elliffe, 2011; Davison & Baum, 2006; 2010; Krageloh, Davison, and Elliffe, 2005). Para uma total compreenso dos processos de escolha necessrio uma anlise de vrias escalas de tempo, desde extremamente curtas focando em relaes momentneas extremamente longas focando em relaes estendidas (Baum, 2010). Muitas pesquisas sobre escolha concentraram-se em relaes estendidas pelo argrupamento de dados de vrias sesses. (Baum, 1979; Herrnstein, 1961). Alguns estudos tem examinado o processo de escolha com foco em situaes momentneas atravs do agrupamento dos dados de um momento de disponibilizao da comida ao outro (Aparicio & Baum, 2006; 2009; Baum & Davison, 2004; Davison & Baum, 2000; Rodewald, Hughes, & Pitts, 2010). Em uma anlise mais momentnea se examinaria as mudanas das escolhas nos intervalos entre comida, desde o momento imediatamente aps a liberao da comida at a prxima vez em que a comida for disponibilizada. comum se observar nos resultados dessa anlise que imediatamente aps a comida haja um impulso a preferir a alternativa que foi efetiva em produzir a liberao da comida (ex., Aparicio & Baum, 2009; Davison & Baum, 2006; 2010). Aps um momento inicial de alta preferncia, tpico que a escolha tenda indiferena, apesar de que possvel que nunca se torne realmente indiferente. Esses impulsos de preferncia parecem ser um reflexo da induo momentnea de respostas envolvendo somente a alternativa que produz o resultado. Uma anlise mais momentnea ainda avaliaria as trocas de preferncia entre as alternativas ou as alternaes nas aproximaes s duas alternativas (Aparicio & Baum, 2006, 2009; Baum & Davison, 2004). Uma aproximao longa alternativa que produz o resultado acontece segue a liberao da comida produzida por tal alternativa, e isso tambm parece ser resultado de induo momentnea, assumindo que, por exemplo, bicadas na esquerda associadas com comida induzem bicadas na tecla esquerda enquanto que bicadas na direita associadas com comida induzem bicadas na tecla direita. Em um artigo anterior foi demonstrado que os impulsos de preferncia so derivados das aproximaes, desta maneira longas aproximaes podem ser um reflexo mais direto da induo (Baum, 2010). Efeito de consequncias diferenciais. Em relao ao efeito das consequncias diferenciais, uma discriminao aprimorada quando as diferentes alternativas de respostas produzem resultados diferentes (Urcuioli, 2005). Em um procedimento de tentativa discreta, por exemplo, um estimulo auditivo (S1) apresentado a ratos em algumas das tentativas e um outro estmulo auditivo (S2) apresentado em outras tentativas. Na presena de S1, a presso barra esquerda (A1) produz comida (X1), enquanto que na presena de S2, a presso barra direita (A2) produz um lquido aucarado (X2). A discriminao que se estabelece pressionar a barra esquerda na presena de S1 e pressionar a barra direita na presena de S2 maior nessa situao do que nas condies onde as respostas A1 e A2 produzem a mesma consequncia. Esse resultado representa um desafio para o paradigma molecular, pois, focando em contiguidade, o efeito das diferentes consequncias pode ser visto como o efeito de eventos futuros sob o comportamento atual. A soluo encontrada para esta problemtica tem sido trazer o futuro para o presente adotando representaes ou expectativas invisveis geradas por S1 e S2 e supor que esses eventos invisveis determinem A1 e A2. Na viso molar atual, podemos considerar esse resultado como o efeito da induo diferencial decorrente de consequncias diferenciais (Ostlund & Balleine, 2007). A combinao de S1 e X1 faz de S1 um indutor condicional das atividades relacionadas a X1. A contingncia entre A1 e X1 faz A1 uma atividade relacionada a X1. Em resultado, S1 induz A1. Da mesma forma, as relaes de contingncia entre S2 e X2 e as relaes de contingncia entre A2 e X2, fazem com que S2 induza A2 como uma atividades relacionada a X2. Em comparao, quando A1 e A2 produzem a mesma consequncia X, a nica base para discriminao a relao de S1, A1, e X em contraste com a relao entre S2, A2, e X. A1 induzido atravs da combinao S1+ X, e A2 induzido pela combinao S2+X. J que S1 e S2 so ambos indutores condicionais relacionados a X, S1 tenderia a induzir A2 at certo ponto, e S2 tenderia a induzir A1 at certo ponto, reduzindo portanto a discriminao. Essas relaes no ocorrem somente em tentativas isoladas, mas sim como um padro em muitas tentativas. J que no existe a necessidade de postular-se eventos invisveis, essa explicao ultrapassa a explicao molecular com base na plausibilidade e elegncia. Transmisso Cultural. A perspectiva atual oferece uma boa explicao para a transmisso cultural. Analisando a evoluo cultural como um processo darwiniano, percebemos que a recorrncia de prticas que passam de gerao para gerao ocorre parcialmente por imitao e parcialmente por regras (Baum, 1995b; 2000; 2005; Boyd & Richerson, 1985; Richerson & Boyd, 2005). Um pombo em um compartimento onde a entrega de comida ocorre ocasionalmente observa outro pombo bicando uma bola de ping-pong e, subsequentemente, bica uma bola similar (Epstein, 1984). A bicada do pombo modelo induz um comportamento similar no pombo observador. Quando uma criana imita seu pai, o comportamento do pai induz o comportamento da criana e, se o comportamento da criana se assemelha ao comportamento do pai, dizemos que a criana imita o pai. Conforme crescemos, outros adultos servem de modelo, particularmente aqueles com sucesso aparente
professores, treinadores, celebridades, e assim por diante e seus comportamentos induzem comportamentos similares em seus imitadores (Boyd & Richerson, 1985; Richerson & Boyd, 2005). No entanto, um fator crucial para a transmisso so as contingncias nas quais o comportamento induzido, fruto de imitao, se envolve. Quando isso acontece, estaria correlacionado com recursos, aprovao, ou oportunidade de acasalamento? Se sim, ento agora sero induzidos pelos PIEs e no necessitam mais do modelo. Regras, que so estmulos discriminativos gerados por um falante, induzem o comportamento do ouvinte. O comportamento induzido, se persistir, entra em correlao com ambos os PIEs de curto prazo oferecidos pelo falante e, algumas vezes, com PIEs de longo prazo em relaes de longo prazo com o (agora no mais) comportamento governado por regras (Baum, 1995b; 2000; 2005). Trabalhando por remunerao. Finalmente, vamos considerar um exemplo do cotidiano: o trabalho remunerado. Zack trabalha diariamente como lavador de pratos em um restaurante por 8 horas por dia de tera a sbado. Ao final do seu turno no sbado ele recebe um envelope com dinheiro. Tentar explicar a sua persistncia nessa atividade representa uma problemtica para o paradigma molecular, pois o dinheiro do sbado muito distante em tempo do trabalho realizado na tera ou at mesmo de todo trabalho realizado no prprio sbado. Ningum d dinheiro a Zack em outras ocasies digamos, aps cada prato lavado. Para solucionar esse problema, o paradigma molecular tem assumido a existncia de reforadores ocultos que frequentemente fortalecem o comportamento durante a execuo do seu trabalho. Ao invs de recorrermos a tais causas invisveis, podemos adotar a perspectiva molar e afirmar, utilizando o bom senso, que o dinheiro por si s mantm o comportamento de lavar pratos. Ns podemos analisar essa situao da mesma maneira que analisamos o rato que pressiona a barra, porm em uma escala bem maior. O dinheiro induz o lavar os pratos, no somente por uma semana, mas como um padro de trabalho por muitas semanas. Porm, ns explicamos a primeira semana de Zack no trabalho de outra maneira. Zack traz um padro de comparecer diariamente no trabalho atravs do perodo em que frequentava a escola, o que induzido pelas promessas de seu chefe. O padro de trabalho precisa ser tambm avaliado em um contexto mais amplo envolvendo as atividades de Zack, porque o dinheiro um meio para atingir uma finalidade, no a finalidade por si s; o dinheiro permite outras atividades, tais como alimentar-se e socializar-se (Baum, 1995a; 2002).
Omisses e inadequaes Como eu mencionei no incio, impossvel abordar neste artigo todos os fenmenos conhecidos da anlise do comportamento. Este artigo visa estabelecer um modelo conceitual que entrelace esses fenmenos de uma maneira no contemplada pelo modelo tradicional. Talvez a omisso mais significativa seja a anlise completa dos efeitos do contexto ou, o que tradicionalmente chamado de controle de estmulos. No paradigma molar, o contexto necessita ser considerado na mesma magnitude que o comportamento estendido no tempo e ocorrendo em diferentes escalas de tempo. Em uma discriminao simples, os estmulos indutores por exemplo, uma luz vermelha e uma luz verde podem ser observados em um curto espao de tempo. No entanto, no pareamento com o modelo, onde um modelo precede a exibio das alternativas de escolha, o perodo de tempo maior, pois necessrio incluir o modelo mais a alternativa correta (ou seja, partes). Configuraes mais complexas exigem um maior espao de tempo. Por exemplo, experimentos com contextos relacionais inspirados pela Teoria dos Quadros Relacionais exigem um tempo maior para a especificao de um contexto complexo destinado a uma atividade simples tal como a de uma criana apontando um carto (Berens & Hayes, 2007). No dia-a-dia, as condies para certos comportamentos podem se estender por semanas, meses ou anos. Um agricultor pode levar vrios anos para perceber que a plantao de milho mais lucrativa que a plantao de alfafa, embora a plantao de alfafa seja mais lucrativa em alguns anos. Eu posso necessitar de muitas interaes com uma pessoa durante um longo tempo antes de concluir que essa pessoa confivel. Eu gostaria de ter falado mais sobre a metfora tradicional da fora tal como utilizada para se referir fora de resposta, fora de ligao ou fora associativa. Uma das virtudes do paradigma molar que este permite um entendimento sobre o comportamento onde se omite a metfora da fora, substituindo-a por alocao e orientao (Davison & Baum, 2006; 2010). O conceito de extino de comportamento tem sido estreitamente ligado noo de fora da resposta. O tpico sobre extino sob a viso do paradigma molar ser tratado em um trabalho futuro. Eu no falei de comportamento verbal. Este tema abordado no meu livro Compreender o Behaviorismo(Baum, 2005). Este um tpico importante que dever ser tratado no futuro, mas pode-se dizer que o paradigma molar observa o comportamento verbal em diversos perodos de tempo. Enunciao apresenta-se como um conceito til, porm existem diversas partes que
ocorrem dentro de enunciaes semelhantes e que provocam um efeito diferente no ouvinte (ex., Me deixe ir versus Nunca me deixe) e so induzidas por contextos diferentes. Partes relativamente locais como uma terminao de plural ou um sufixo possessivo so tambm induzidas por contextos diferentes. Enunciaes, no entanto, so partes de atividades mais extensas, tais como conversas. Normalmente, conversas so partes de atividades ainda mais extensas, tal como a construo de um relacionamento ou a tentativa de persuadir algum a lhe emprestar dinheiro. Eu falei pouco sobre comportamento governado por regras, o qual se faz muito importante para o entendimento de cultura. Eu discuti esse tpico em artigos anteriores (Baum, 1995b, 2000). O paradigma molar muito til para discutir sobre o papel das regras nas relaes de curto e longo prazo entre grupos e para indivduos dentro de grupos. A lista de omisses sem dvida longa, porm o leitor interessado em utilizar esse modelo conceitual ir encontrar muitas maneiras de aplic-lo.
Concluses Juntos, os conceitos de alocao, induo e correlao (ou contingncia) sustentam uma srie de fenmenos reconhecidos na esfera da anlise do comportamento desde os anos de 1950. Eles oferecem uma abordagem mais elegante e plausvel do que as velhas noes de reforamento, fortalecimento, e eliciao. Eles tornam estes conceitos suprfluos. Induo no resolve somente o problema da origem, como tambm explica os efeitos dos estmulos PIEs e dos estmulos relacionados a PIEs. A induo explica tambm os efeitos das contingncias, pois uma contingncia estabelece uma correlao que converte uma atividade operante em uma atividade relacionada a PIE. Juntas, contingncia e induo explicam alocao e escolha. Tambm explicam as mudanas em alocao ou seja, mudanas no comportamento. Nenhuma destas consideraes necessita do conceito de reforamento como fortalececimento. A conhecida formulao do comportamento operante como Antecedente-Comportamento-Consequncia pode ser conciliada com esta concluso. Quando consequncias aumentam uma atividade, elas no a fortalecem, e sim induzem mais da mesma atividade, tal como os antecedentes fazem. De fato, a consequncia o antecedente do comportamento que se segue, demonstrado nas Figuras 6 e 7. Quando consequncias reduzem uma atividade, eles no a enfraquecem, mas sim induzem outros comportamentos incompatveis com tal atividade (Figura 10). A formulao esboada aqui parte de uma perspective molar do comportamento que foca no tempo despendido em atividades ao invs de respostas discretas (e.g., Baum, 2002; 2004; Baum & Rachlin, 1969). Criticas perspectiva molecular baseadas nas respostas discretas e contiguidade temporal como conceitos centrais podem ser encontradas em artigos anteriores (Baum, 1973; 2001; 2002; 2004). Essa discusso evidencia a superioridade da perspectiva molar na tentativa de auxiliar a anlise do comportamento a reconsiderar seus conceitos fundamentais e oferecer uma melhor explicao para os fenmenos comportamentais observados no laboratrio e na vida diria.
REFERNCIAS
Allison, J. (1983). Behavioral economics. New York: Praeger. Allison, J., Miller, M., & Wozny, M. (1979). Conservation in behavior. Journal of Experimental Psychology: General, 108, 434. Anger, D. (1963). The role of temporal discriminations in the reinforcement of Sidman avoidance behavior. Journal of the Experimental Analysis of Behavior, 6, 477506. Aparicio, C. F., & Baum, W. M. (2006). Fix and sample with rats in the dynamics of choice. Journal of the Experimental Analysis of Behavior, 86, 4363. Aparicio, C. F., & Baum, W. M. (2009). Dynamics of choice: Relative rate and amount affect local preference at three different time scales. Journal of the Experimental Analysis of Behavior, 91, 293317. Azrin, N. H., & Holz, W. C. (1966). Punishment. In W. K. Honig (Ed.), Operant behavior: Areas of research and application (pp. 380447). New York: Appleton-Century-Crofts. Baum, W. M. (1973). The correlation-based law of effect. Journal of the Experimental Analysis of Behavior, 20, 137153. Baum, W. M. (1974). On two types of deviation from the matching law: bias and undermatching. Journal of the Experimental Analysis of Behavior, 22, 231242.
Baum, W. M. (1976). Time-based and count-based measurement of preference. Journal of the Experimental Analysis of Behavior, 26, 2735. Baum, W. M. (1979). Matching, undermatching, and overmatching in studies of choice. Journal of the Experimental Analysis of Behavior, 32, 269281. Baum, W. M. (1981a). Discrimination of correlation. In M. L. Commons, & J. A. Nevin (Eds.), Quantitative analyses of behavior: Discriminative properties of reinforcement schedules (Vol. I, pp. 247256). Cambridge, MA: Ballinger. Baum, W. M. (1981b). Optimization and the matching law as accounts of instrumental behavior. Journal of the Experimental Analysis of Behavior, 36, 387 403. Baum, W. M. (1988). Selection by consequences is a good idea. Behavioral and Brain Sciences, 11, 447448. Baum, W. M. (1989). Quantitative prediction and molar description of the environment. The Behavior Analyst, 12, 167176. Baum, W. M. (1992). In search of the feedback function for variable-interval schedules. Journal of the Experimental Analysis of Behavior, 57, 365375. Baum, W. M. (1993). Performances on ratio and interval schedules of reinforcement: Data and theory. Journal of the Experimental Analysis of Behavior, 59, 245264. Baum, W. M. (1995a). Introduction to molar behavior analysis. Mexican Journal of Behavior Analysis, 21, 725. Baum, W. M. (1995b). Rules, culture, and fitness. The Behavior Analyst, 18, 121. Baum, W. M. (2000). Being concrete about culture and cultural evolution. In N. Thompson, & F. Tonneau (Eds.), Perspectives in Ethology (Vol. 13, pp. 181212). New York: Kluwer Academic/Plenum. Baum, W. M. (2001). Molar versus molecular as a paradigm clash. Journal of the Experimental Analysis of Behavior, 75, 338341. Baum, W. M. (2002). From molecular to molar: A paradigm shift in behavior analysis. Journal of the Experimental Analysis of Behavior, 78, 95116. Baum, W. M. (2004). Molar and molecular views of choice. Behavioural Processes, 66, 349359. Baum, W. M. (2005). Understanding behaviorism: Behavior, culture, and evolution (2nd edition). Malden, MA: Blackwell Publishing. Baum, W. M. (2010). Dynamics of choice: A tutorial. Journal of the Experimental Analysis of Behavior, 94, 161174. Baum, W. M., & Davison, M. (2004). Choice in a variable environment: Visit patterns in the dynamics of choice. Journal of the Experimental Analysis of Behavior, 81, 85127. Baum, W. M., & Rachlin, H. C. (1969). Choice as time allocation. Journal of the Experimental Analysis of Behavior, 12, 861874. Belke, T. W. (1997). Running and responding reinforced by the opportunity to run: Effect of reinforcer duration. Journal of the Experimental Analysis of Behavior, 67, 337351. Belke, T. W., & Belliveau, J. (2001). The generalized matching law describes choice on concurrent variableinterval schedules of wheel-running reinforcement. Journal of the Experimental Analysis of Behavior, 75, 299310. Berens, N. M., & Hayes, S. C. (2007). Arbitrarily applicable comparative relations: Experimental evidence for a relational operant. Journal of Applied Behavior Analysis, 40, 4571. Boutros, N., Davison, M., & Elliffe, D. (2011). Contingent stimuli signal subsequent reinforcer ratios. Journal of the Experimental Analysis of Behavior, 96, 3961. Boyd, R., & Richerson, P. J. (1985). Culture and the evolutionary process. Chicago: University of Chicago Press. Breland, K., & Breland, M. (1961). The misbehavior of organisms. American Psychologist, 16, 681684. Bullock, D. H., & Smith, W. C. (1953). An effect of repeated conditioning-extinction upon operant strength. Journal of Experimental Psychology, 46, 349 352. Cowie, S., Davison, M., & Elliffe, D. (2011). Reinforcement: Food signals the time and location of future food. Journal of the Experimental Analysis of Behavior, 96, 6386. Davison, M., & Baum, W. M. (2000). Choice in a variable environment: Every reinforcer counts. Journal of the Experimental Analysis of Behavior, 74, 1 24. Davison, M., & Baum, W. M. (2006). Do conditional reinforcers count? Journal of the Experimental Analysis of Behavior, 86, 269283. Davison, M., & Baum, W. M. (2010). Stimulus effects on local preference: Stimulusresponse contingencies, stimulusfood pairing, and stimulusfood correlation. Journal of the Experimental Analysis of Behavior, 93, 4559. Davison, M., & McCarthy, D. (1988). The matching law: A research review. Hillsdale, NJ: Erlbaum Associates. Dawkins, R. (1989). The Selfish Gene (New edition). Oxford: Oxford University Press. Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock are inherently reinforcing. Journal of the Experimental Analysis of Behavior, 75, 311333. Eibl-Eibesfeldt, I. (1975). Ethology: The biology of behavior (2nd edition). New York: Holt, Rinehart, and Winston. Epstein, R. (1984). Spontaneous and deferred imitation in the pigeon. Behavioural Processes, 9, 347354. Estes, W. K. (1943). Discriminative conditioning. I. A discriminative property of conditioned anticipation. Journal of Experimental Psychology, 32, 150 155. Estes, W. K. (1948). Discriminative conditioning. II. Effects of a Pavlovian conditioned stimulus upon a subsequently established operant response. Journal of Experimental Psychology, 38, 173177.
Ettinger, R. H., Reid, A. K., & Staddon, J. E. R. (1987). Sensitivity to molar feedback functions: A test of molar optimality theory. Journal of Experimental Psychology: Animal Behavior Processes, 13, 366375. Felton, M., & Lyon, D. O. (1966). The post-reinforcement pause. Journal of the Experimental Analysis of Behavior, 9, 131134. Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts. Gardner, R. A., & Gardner, B. T. (1988). Feedforward versus feedbackward: An ethological alternative to the law of effect. Behavioral and Brain Sciences, 11, 429493. Herrnstein, R. J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267272. Herrnstein, R. J. (1969). Method and theory in the study of avoidance. Psychological Review, 76, 4969. Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243266. Herrnstein, R. J., & Hineline, P. N. (1966). Negative reinforcement as shock-frequency reduction. Journal of the Experimental Analysis of Behavior, 9, 421 430. Herrnstein, R. J., & Loveland, D. H. (1972). Foodavoidance in hungry pigeons, and other perplexities. Journal of the Experimental Analysis of Behavior, 18, 369383. Hinde, R. A., & Stevenson-Hinde, J. (Eds.). (1973). Constraints on learning. New York: Academic Press. Hineline, P. N. (1977). Negative reinforcement and avoidance. In W. K. Honig, & J. E. R. Staddon (Eds.), Handbook of operant behavior (pp. 364414). Englewood Cliffs, NJ: Prentice-Hall. Hineline, P. N. (1984). Aversive control: A separate domain? Journal of the Experimental Analysis of Behavior, 42, 495509. Killeen, P. R. (1994). Mathematical principles of reinforcement. Behavioral and Brain Sciences, 17, 105171. Krageloh, C. U., Davison, M., & Elliffe, D. M. (2005). Local preference in concurrent schedules: The effects of reinforcer sequences. Journal of the Experimental Analysis of Behavior, 84, 3764. Kuhn, T. S. (1970). The structure of scientific revolutions (2nd edition). Chicago: University of Chicago Press. Malagodi, E. F., Gardner, M. L., Ward, S. E., & Magyar, R. L. (1981). Responding maintained under intermittent schedules of electric-shock presentation: Safety or schedule effects? Journal of the Experimental Analysis of Behavior, 36, 171190. Mayr, E. (1970). Populations, species, and evolution. Cambridge, MA: Harvard University Press. Neuringer, A. J. (1969). Animals respond for food in the presence of free food. Science, 166, 399401. Neuringer, A. J. (1970). Many responses per food reward with free food present. Science, 169, 503504. Ostlund, S. B., & Balleine, B. W. (2007). Selective reinstatement of instrumental performance depends on the discriminative stimulus properties of the mediating outcome. Learning and Behavior, 35, 4352. Palya, W. L., & Zacny, J. P. (1980). Stereotyped adjunctive pecking by caged pigeons. Animal Learning and Behavior, 8, 293303. Premack, D. (1963). Rate differential reinforcement in monkey manipulation. Journal of the Experimental Analysis of Behavior, 6, 8189. Premack, D. (1965). Reinforcement theory. In D. Levine (Ed.), Nebraska symposium on motivation (pp. 123180). Lincoln: University of Nebraska Press. Premack, D. (1971). Catching up with common sense, or two sides of a generalization: reinforcement and punishment. In R. Glaser (Ed.), The nature of reinforcement (pp. 121150). New York: Academic Press. Rachlin, H., Battalio, R. C., Kagel, J. H., & Green, L. (1981). Maximization theory in behavioral psychology. Behavioral and Brain Sciences, 4, 371417. Rachlin, H., & Burkhard, B. (1978). The temporal triangle: Response substitution in instrumental conditioning. Psychological Review, 85, 2247. Rachlin, H., Green, L., Kagel, J. H., & Battalio, R. C. (1976). Economic demand theory and psychological studies of choice. Psychology of Learning and Motivation, 10, 129154. Rachlin, H., & Herrnstein, R. J. (1969). Hedonism revisited: On the negative law of effect. In B. Campbell, & R. M. Church (Eds.), Punishment and aversive behavior (pp. 83109). New York: Appleton-Century-Crofts. Reid, A. K., Bacha, G., & Moran, C. (1993). The temporal organization of behavior on periodic food schedules. Journal of the Experimental Analysis of Behavior, 59, 127. Reid, R. L. (1958). The role of the reinforcer as a stimulus. British Journal of Psychology, 49, 202209. Rescorla, R. A. (1968). Probability of shock in the presence and absence of CS in fear conditioning. Journal of Comparative and Physiological Psychology, 66, 15. Rescorla, R. A. (1988). Pavlovian conditioning: Its not what you think it is. American Psychologist, 43, 151160. Richerson, P. J., & Boyd, R. (2005). Not by genes alone: How culture transformed human evolution. Chicago: University of Chicago Press. Rodewald, A. M., Hughes, C. E., & Pitts, R. C. (2010). Development and maintenance of choice in a dynamic environment. Journal of the Experimental Analysis of Behavior, 94, 175195. Roper, T. J. (1973). Nesting material as a reinforcer for female mice. Animal Behaviour, 21, 733740.
Roper, T. J. (1978). Diversity and substitutability of adjunctive activities under fixed-interval schedules of food reinforcement. Journal of the Experimental Analysis of Behavior, 30, 8396. Sanabria, F., Sitomer,M. T., & Killeen, P. R. (2006). Negative automaintenance omission training is effective. Journal of the Experimental Analysis of Behavior, 86, 110. Segal, E. F. (1972). Induction and the provenance of operants. In R. M. Gilbert, & J. R. Millenson (Eds.), Reinforcement: Behavioral Analyses (pp. 134). New York: Academic. Seligman, M. E. P. (1970). On the generality of the laws of learning. Psychological Review, 77, 406418. Shapiro, M. M. (1961). Salivary conditioning in dogs during fixed-interval reinforcement contingent on lever pressing. Journal of the Experimental Analysis of Behavior, 4, 361364. Sidman, M. (1953). Two temporal parameters of the maintenance of avoidance behavior by the white rat. Journal of Comparative and Physiological Psychology, 46, 253261. Sidman, M. (1966). Avoidance behavior. In W. K. Honig (Ed.), Operant behavior: Areas of research and application (pp. 448498). New York: AppletonCentury-Crofts. Skinner, B. F. (1938). Behavior of organisms. New York: Appleton-Century-Crofts. Skinner, B. F. (1948). Superstition in the pigeon. Journal of Experimental Psychology, 38, 168172. Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193216. Skinner, B. F. (1953). Science and human behavior. New York: Macmillan. Staddon, J. E. R. (1973). On the notion of cause, with applications to behaviorism. Behaviorism, 1(2), 2563. Staddon, J. E. R. (1977). Schedule-induced behavior. In W. K. Honig, & J. E. R. Staddon (Eds.), Handbook of operant behavior (pp. 125152). Englewood Cliffs, NJ: Prentice-Hall. Staddon, J. E. R. (1983). Adaptive behavior and learning. Cambridge: Cambridge University Press. Staddon, J. E. R., & Simmelhag, V. (1971). The superstition experiment: A re-examination of its implications for the principles of adaptive behavior. Psychological Review, 78, 343. Thomas, G. (1981). Contiguity, reinforcement rate and the law of effect. Quarterly Journal of Experimental Psychology, 33B, 3343. Thorndike, E. L. (2000/1911). Animal intelligence. New Brunswick, NJ: Transaction Publishers. Timberlake, W., & Allison, J. (1974). Response deprivation: An empirical approach to instrumental performance. Psychological Review, 81, 146164. Timberlake, W., & Lucas, G. A. (1989). Behavior systems and learning: From misbehavior to general principles. In S. B. Klein, & R. R. Mowrer (Eds.), Contemporary learning theories: Instrumental conditioning theory and the impact of biological constraints on learning (pp. 237275). Hillsdale, NJ: Erlbaum. Trapold, M. A., & Overmier, J. B. (1972). The second learning process in instrumental learning. In A. H. Black, & W. F. Prokasy (Eds.), Classical conditioning. II. Current research and theory (pp. 427452). New York: Appleton-Century-Crofts. Urcuioli, P. J. (2005). Behavioral and associative effects of different outcomes in discrimination learning. Learning and Behavior, 33, 121. VanSyckel, J. S. (1983). Variable-interval and variable-ratio feedback functions. Unpublished masters thesis, University of New Hampshire. Vaughan, W. J., & Miller, H. L. J. (1984). Optimization versus response-strength accounts of behavior. Journal of the Experimental Analysis of Behavior, 42, 337348. Watson, J. B. (1930). Behaviorism. New York: W. W. Norton. Williams, D. R., & Williams, H. (1969). Automaintenance in the pigeon: Sustained pecking despite contingent nonreinforcement. Journal of the Experimental Analysis of Behavior, 12, 511520. Zener, K. (1937). The significance of behavior accompanying conditioned salivary secretion for theories of the conditioned response. The American Journal of Psychology, 50, 384403.
Recebido: 7 de Janeiro de 2011 Aceite final: 6 de Setembro de 2011
Obrigado a Howard Rachlin, John Staddon e Jesse Dallery pelos comentrios que ajudaram muito nas primeiras verses deste artigo.
Endereo para correspondncia: William M. Baum, 611 Mason #504, San Francisco, CA 94108 (e-mail: wmbaum@ucdavis.edu; ou wbaum@sbcglobal.net).
William Baum: "Precisamos repensar a teoria do reforamento"
Imagine que um fsico dissesse pra voc que gravidade, eletromagnetismo, foras nucleares, nada disso conta na verdade. Ou que um qumico afirmasse categoricamente que ligaes moleculares so uma fico sem sentido. O efeito o mesmo, penso eu, do artigo que acabo de ler, onde William Baum (ele mesmo, o autor do celebrado "Compreender o Behaviorismo"), diz que esse papo de "reforamento" no explica patavina nenhuma do comportamento. Baum detona um dos alicerces fundamentais do Behaviorismo Radical com a pretenso de colocar outro modelo, mais elegante e sofisticado, no lugar. O artigo em questo se chama: "RETHINKING REINFORCEMENT: ALLOCATION, INDUCTION, AND CONTINGENCY", e foi publicado em janeiro de 2012 no JOURNAL OF THE EXPERIMENTAL ANALYSIS OF BEHAVIOR (T fresquinho o artigo, hein? Nada como se atualizar sempre). A bem da verdade, Baum no diz que a teoria do reforo est errada, mas sim que est incompleta. Ela se baseia na Lei do Efeito, de Thorndike, que j tem seus 100 anos e apesar de ter sido criticada por Watson, passou batida por Skinner. A lei do efeito diz, a grosso modo, que uma ao associada a algo positivo ser reforada, e se leva a algo negativo, ser enfraquecida. Parece bvio que assim, n, gente? Pois , mas o tio Baum diz que no ! Que se trata de mais um mal entendido, e que a Cincia contraria novamente o senso comum. Baum destaca que Skinner no estava errado no que postulou baseado na teoria do reforo, apenas deixou de pegar alguns pontos (Estava, repete Baum, incompleto). Em todo caso, ele destaca dois problemas graves da Teoria do Reforo: #1 - Um reforo no refora qualquer coisa com que ele coincide. Ex: se o entregador de pizza chega na hora que estou vendo TV, provvel que eu no tenha o hbito de ver TV reforado; #2 - A teoria do reforo no explica a procedncia do comportamento. O comportamento tem que ocorrer primeiro para depois ser reforado, o que gera um paradoxo: o reforo s existe porque antes houve um comportamento por ele reforado. A teoria do reforo oferece um modelo molecular para explicar o comportamento, baseado em eventos (estmulos e respotas) discretos interligados prximos no tempo, isto , por contiguidade. J o modelo que Baum oferece molar. A tabela a seguir resume a diferena entre ambos:
Molecular (Thorndike; Skinner) Respostas discretas. Ex: pressiona a barra Estmulos discretos. Ex: luz acende.
Molar (Baum) Atividades extensas. Ex: todo o processo desde a disposio de pressionar a barra at o ato, e depois dele. Contextos extensos. Ex: estar em um lugar por algum tempo.
Contiguidade entre estmulos e respostas. Ex: A luz acende e o ratoatividades e contextos no precisam ser contguas, isto As relaes entre pressiona a barra imediatamente. , no precisam necessariamente de proximidade temporal.
Baum sustenta, baseado em experimentos, que seu modelo molar muito mais elucidativo, mais til, repleto de vantagens sobre o molecular. Algumas delas: #1 - Explica melhor os processos comportamentais envolvendo eventos extensos, como as contingncias sociais; #2 - unifica o comportamento respondente e o operante num mesmo processo (classicamente eles so tratados como 2 distintos); #3 - permite quantificaes mais apuradas, pois no leva em conta apenas a frequncia de respostas e estmulos discretos, mas a durao dos termos das contingncias tambm; #4 - o modelo molar torna desnecessrio inferir variveis no observadas em alguns casos. P.e., se o rato pressiona a barra e com isso evita choques pelo modelo molecular infere-se respondentes de medo no rato, j pelo molar o mesmo explicado por correlao negativa (esse conceito fica mais claro logo a seguir, continue lendo).
Ok, mas como que ento essa tal teoria que viria a substituir a do Reforo? O framework que substitui a teria do reforo, segundo Baum, formado por 3 conceitos-chave: alocao, induo e correlao. 1) A alocao o tempo gasto pelo organismo fazendo algo. Como o tempo finito e o organismo um s, ele precisa selecionar, "escolher", o que far. Todo comportamento determinado, mas todo comportamento tambm envolve escolha (Lembrando que Baum tambm clebre pelo seu trabalho sobre escolhas e a Lei da Igualao). OBS: Vale lembrar que o organismo sempre est fazendo algo: no existe "No fazer", pois no fazer fazer uma coisa, que evitar uma outra, emitir uma resposta X incompatvel com uma Y. Ao invs de se quantificar apenas a ocorrncia de estmulos e respostas (ex: taxa de respostas de pressionar a barra), o tempo de alocao de atividades do organismo tambm passa a ser alvo de anlise. P.e., se o rato est se coando ele no est comendo; no caso o tempo foi alocado para se coar porque essa atividade foi mais induzida que a atividade comer. A "escolha" que o organismo faz de como usar o seu tempo finito em atividades extensas, ou seja, a alocao, uma varivel relevante. A alocao muda os outros dois processos: induo e a correlao (A seguir). 2) A induo faz cair por terra o conceito de reforadores, estmulos condicionados, punidores, etc. Tudo isso passa a ser chamado de "indutores". Os principais indutores de comportamentos so do tipo "Phylogenetically Important Event" (PIE), que so indutores incondicionados. Os PIEs so a chave para se entender a induo, pois eles explicam a sensibilidade do organismo aos eventos ambientais. P.e., comida induz bicadas em pombos, e tir-la induz agressividade. Portanto errado dizer que a comida refora bicadas pois ela no gera apenas esse efeito: ela induz um efeito quando apresentada e outro bem diferente quando retirada. OBS: Quem achou o conceito de induo parecido com o de Controle de Estmulos acertou na mosca! 3) Por fim, a correlao um vnculo entre um evento ambiental indutor (PIE ou no), e uma atividade alocada (seja ela operante ou respondente). Quando a correlao aumenta a incidncia de uma atividade ela no "reforou um comportamento", apenas induz que ele ocorra novamente. Quando a correlao diminui a ocorrncia de uma atividade, ela no est"enfraquecendo um comportamento", mas sim induzindo atividades incompatveis com aquela que foi reduzida. Por fim, Baum prope uma explicao alternativa at mesmo para o conceito de contingncia (J que ela deixa de ser "contingncia de reforamento", j que reforamento na verdade no existe...). Vejamos pelo diagrama a seguir:
A contingncia ocorre quando o ciclo do diagrama acima est fechado: uma atividade do organismo (operante ou respondente) se tornou relacionada a algum indutor. Note que a contiguidade deixa de ser um critrio importante. Algumas contingncias ocorrem em extenses vastas de tempo, em intervalos muito espaados, mas ainda assim so contingncias.
Importante: o artigo de Baum de janeiro de 2012. Apenas um ms atrs. Obviamente muita gua ainda vai rolar. Tem behaviorista que vai criticar duramente, outros vo adorar e aderir de cara. Eu, como no sou da comunidade acadmica, prefiro sentar e assistir o debate, pra ver no que vai dar. Assim como tambm estou observando de longe o debate sobre as metacontingncias e sobre os quadros relacionais. Meu interesse nesses debates s vai crescer mesmo quando o conhecimento correlato for maduro o bastante para ser tecnolgico. Em todo caso, me alegra saber que o Behaviorismo Radical continua inovando, evoluindo. Novas ideias vem, so criteriosamente selecionadas pelo seu valor pragmtico, e no final um estado melhor de conhecimento alcanado. assim que na Cincia!

B - BAUM, W. (2012) - Repensando o Reforçamento, Alocação, Indução e Contingência

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

B - BAUM, W. (2012) - Repensando o Reforçamento, Alocação, Indução e Contingência

Enviado por

Direitos autorais:

Formatos disponíveis

REPENSANDO O REFORAMENTO: ALOCAO, INDUO E CONTINGNCIA

Recebido: 7 de Janeiro de 2011 Aceite final: 6 de Setembro de 2011

William Baum: "Precisamos repensar a teoria do reforamento"

Você também pode gostar