Você está na página 1de 35
1900-1930 | Década de 1920 Aprendizagem e recompensa Década de 1960-90 ‘Aprenzagem como um void tn 182 eed Pee ee edd 1970-Década de 90 | Década de 1990- Astasesnaris a 2000 encnagee Oe Ge | Models de reds eurais once ‘eveadas em computador ccersenalee S| Campus meres Me tas ivearta eaten | ee aahon nodes npn ne en 200 ces a GAZZANIGA @ HEATHERTON frequéncia para lidar com as condigdes infernais da guerra. As estimativas sugerem que, na década de 1960, 0 uso de drogas entre os soldados americanos, incluindo substncias narcéticas como heroina e épio, atingiu proporsées epidémicas. O difundido uso de drogas nao foi muito surpreendente — a década de 1960 foi uma época em que os jovens experimentaram uma variedade de drogas, os soldados tinham facil acesso a muitas delas e as drogas eram temporariamente efetivas para ajudéos a lidar com os horrores da guerra. Eles as utiizavam para lidar com 0 medo, a depressio, a saudade de casa, 0 tédio ea repressividade dos requlamentos do exército. Os soldados também eram atraidos plas qualidades euforizantes e recompensadoras das drogas: eles gostavam de ficar “altos”. Embora o exército estivesse ciente do uso de drogas pelos soldados, isso era praticamente ignorado, visto como algo que aliviava a pressao que eles sofriam, Comecando em 1971, 0 exército passou a testar obrigatoriamente os soldados quanto 20 uso de drogas, a fim de identificar e desintoxicar os usuarios antes de eles voltarem aos Estados Unidos. Mais de 1 em 20 soldados testaram positive para drogas narcéticas, mesmo sabendo antecipadamente que seriam testados. Imaginando que muitos dos que nao conseguiam ficar sem a droga sequer por um curto periodo de tempo teriam se tornado adictos a narcéticos, os responsaveis temeram que uma multidao de soldados aditos retornando do Vietna invadissem as instituigdes de tratamento existentes. A Casa Branca pediu a uma equipe de cientistas comportamentais que acompanhassem um grupo de soldados que estava retornando, para avaliar a extens3o do problema de adicao. Chefiada pela epidemiologista comportamental Lee Robins, a equipe de pesquisa examinou uma amostra aleatoria de 898 soldados que deixaram o Vietna em setembro de 1971. Robins e colaboradores encontraram niveis extremamente elevados de uso de drogas entre os soldados estadunidenses no Vietna (Robins et al,, 1975). Mais de 90% relataram beber alcool, quase trés quartos usavam maconha e quase metade usava narcéticos como heroina, morfina e Opi ‘Aproximadamente metade dos soldados que usavam narcéticos tinha sintomas de adiccao ou acreditava que nao conseguiria abandonar 0 habito de usar drogas. Os achados sugeriam que aproximadamente 1 soldado em 5 dos que voltavam do Vietnd era adicto. Dada a idéia prevalente de que a adicgao era um transtorno biolégico com uma baixa taxa de recuperagio, esses achados indicavam que dezenas de milhares de adictos de heroina logo estariam inundando as cidades dos Estados Unidos. Mas iss0 nao aconteceu. Robins e colaboradores examinaram uso de drogas entre os soldados depois, que eles voltaram aos Estados Unidos. Dos que aparentemente estavam adictos a narcéticos no Vietnd, s6 metade buscou drogas ao voltar aos Estados Unidos, e um rnGmero ainda menor manteve a adicco a narcéticos. Aproximadamente 95% dos adictos ja no usavam drogas alguns meses apés seu retorno, o que é um indice de O: soldados americanes que lutararn no Vietna usavam drogas com CIENCIA PSICOLOGICA abandono espantosamente elevado, considerando-se que o indice de sucesso dos melhores tratamentos é, tipicamente, de apenas 20%-30%, Um estudo de seguimento de longo prazo realizado no inicio da década de 1990 confirmou que oucos dos que eram adictos no Vietna continuaram adictos, Como € possivel que individuos adictos a narcdticos tenham conseguido, simplesmente, abandonéios a0 mudar de ambiente? Nés encontraremos algumas das respostas neste capitulo quando examinarmos o impacto do ambiente e das recompensas sobre 3 aprendizagem, incluindo como as pessoas desenvolvem habitos como uso de drogas e os fatores que mantém esses comportamentos. Aaprendizagem é uma mudanca relaivamente duradoura de comportamento resultante da ex- periéncia, Ela acorre quando 0s organismos se beneficiam da experiéncia para que seus futuros comportamentos sejam mais bem adaptados ao ambiente. Os teércos da aprendizagem costumam focar 0 comportamento observvel ¢ nao os estadosinternos ou os processos mentas, uma aborda- gem as vezes referida como behaviorismo, A aprendizagem compartlha aspectos comuns com @ meméria (o que discutiremes no préximo capitulo), no sentido de que ambas se referem a mudancas duradouras que se seguem a uma exposigéo ao ambiente. Mas os psicélogos, adicionalmente, tm visto a aprendizagem e a memtia como separadas, com os tedricos da aprendizagem concentrando- sena aqusicdo de comportamentos, e 05 teéricos da meméria focando a retengio e recuperacio de conhecimentos. Além disso, 0 etudo da aprendizagem base's, tipicamente, em sujetos nao-hu- ‘manos, especialmente ratos, ao passo que a pesquisa da memoria tem sido conduzida principalmen- te com humanos. No entanto, a dstingdo entre aprendizagem e memoria ¢ um tanto atbitréia, pois hd uma sobreposiéo significativa na visdo que os cientistas psicoldgicos contemporineos tém dos dois processos. Na verdade, mecanismos biol6gicos similares estao envolvidos na aprendizagem ena ‘meméria,O foco deste capitulo seré na relagio entre os estimulos ambientais e as respostascompor- tamentais manifesas, COMO SE DESENVOLVEU O ESTUDO COMPORTAMENTAL DA APRENDIZAGEM? O surgimento da teoria da aprendizagem no inicio do século XX deveu-se em parte 8 insatisfagio de alguns psicélogos com o difundido uso de relatos verbas para avaliar estados mentais. Na época, as idéas freudianas estavam no émago da teotizacio psico- l6gica. Para avalir os processos mentaisinconscientes que acreditavam ser os determi- nantes primérios do comportamento, Freud e seus seguidoresutlizavam técnicas como a andlise de sonhos e a associagao live. O psiodlogo estadunidense John B. Watson (1878-1968) (Figura 6.1) desprezava qualquer forma de empreendimento psicolégico centrado em coisas que no podiam ser observadas diretamente, tis como os eventos rmentais das pessoes. Ele argumentava que a tori freudiana era nicienificae bas camente sem sentido. Segundo Watson, o comportamento manifesto era o tinico indica- Aor vido da aividade psicl6gica, Embora reconhecesse a existéncia de pensamentos e crencas, ele negava que pudessem ser estudados por métodos cientfcos. ‘Watson fundou a escola do behaviorismo, que se baseava na crenga de que 0s ani mais eos humanos nascem como potencial de aprender qualquer coisa. Baseado na idéia de John Locke da tdbula rasa (do latim, “lousa em branco”), que arma que os bebés nascem sem saber nada e que todo o conhecimento é adquirdo por experiéncias senso tials, o behaviorismo afirmava que o ambiente e seus efeitos associados sobre os orgais ‘mos eram os tinios determinantes da aprendizagem, Watson estava to convencido da preeminéncia do ambiente que afrmou, ousadamente:“Dé-me uma dzia de bebés sadi «, ben-formados e 0 meu préprio mundo especificado para crélo, e eu garanto que Poderei tomar qualquer um dees, aleatoriamente, e treind-lo para se tornar um especia lista em algo que ex escolher — médico, advogado, artista, comercante, sim, incisive FIGURA 67 183 ‘aprendizagem Uma mudanca comida) Hoe Fe fs Reforgo negatvo a (Gressionara £ alavanca~> desiga 0 chodue) FIGURA 6.12 Visio geal do reorgo eda punicio negativs e postvos CIENCIA PSICOLOGICA senda é apropriada e geralmente efetiva para impedir que a crianca toque em um fogio quente ou atravesse a rua correndo sem olhar. Para que a punigdoseja eftiva, deve fazer trés cosas. Primeiro, la deve ser imediata, Segundo, deve ser suficientemente desagradavel para superar 0s aspectos reforcadores do comportamento. Finalmente, deve ser seguida de reforgo do comportamento apro- priado. Uma punigdo comum utllzada em creches para lidar com criancas desobedientes é o inter 4 ou tempo fora, em que a crianca & removida da stuacdo para pensar sobre as conseqiéncas do comportamento inadequado, O sucesso das técnicas de um tempo fora depende da disposiqao dos cuidadores de exeeutar a punigio, Um dos erros mais comuns dos pais € ameacerfreqientemente com castigos ¢ nunca colocé-los em prética. Os pais que no cumprem suas ameacas ensinam as ciangas que as ameacas podem ser seguramenteignoradas. O condicionamento operante é influenciado por esquemas de reforco Com que freqiéncia deve ser dado o reforgo? Para uma aprendizagem répida, voce poderia reforgar o comportamento desejado cada vez que ele ccarrer, 0 que é conhecido como reforgo continuo. No mundo real, o comportamento raras vezes & reforgado continuamente. Os animais rio encontram comida todas as vezes que procuram por ela, as pessoas nio recebem elogios sempre que se comportam de maneitaaceitével. A maioria dos comportamentosé reforcada inter ‘entemente, o que ¢ referido como reforgo parcial. 0 efeto do reforco parcial sobre o condiciona mento depend do esquema de reforgo, Esquemas de razao e de intervalo 0 reforeo parcial pode ser administrado com base no snmero de respostas comportamentais ou na passagem do tempo. Por exemplo, os operios de uma fébrica podem ser pagos pela producio (resposta comportamental) ou por hora (passagem do tem Po). No esquema de razdo, o reforco se baseia no mimero de vezes que o comportamento ocorte, ‘como, por exemplo, reforar cada terceira ou décima ocorréncia do comportamento. Nos esque- ‘mas de intervalo, o reforco se baseia em uma unidade de tempo espectica, como um minuto ov tuma hora. Em geral,o reforgo de razdo leva a maior resposta do que o reforgo de interval, Os coperirios pagos por producéo geralmente so mais produtivos do que os pagos por hora, especial- mente se houver incentivos para niveis mais elevados de produtividade Esquemas fixos e varidveis 0 reforco parcial também pode ser dado em um esquema fxo ‘ou varivel. No esquema fixo, 0 reforco & dado consistentemente,seguindo-se a um nimero espe- cifieo de ocorréncias ou depois de uma quantidade espectica de tempo. Independentemente de serem pagos por produco ou por hora, os operdrios normalmente so pagos de acordo com um indice fixo, ganhando o mesmo por cada peca produzida ou por cada hora. O indice de reforgo é inteiramente prevsivel No esquema varidvel de reforgo, o reforgo ¢ aplicado em indices diferen- {es ou em momentos diferentes. O sujeito ndo sabe quantos comportamentos precisam ser executa dos ou quanto tempo precisa passar antes que o reforgoocorra. Um exemplo de um reforgo vardvel € 0 vendedor que s6 é pago quando um cliente concorda em comprar um produto, Ainfluéncia dos esquemas de reforgo sobre o comportamento pode ser observada nos hdbitos de estudo dos alunos. Kdealmente, os alunos vao estudar ao longo de todo o semestre, mas a realida- de & que, quando os exames siorealizados em pontos fixos, os alunos tendem a estudar muito antes do exame e a ndo estudar nada depois. E tipico do reforgo de interval fixo que o comportamento s6 seja realizado quando é 0 momento de o reforgo ser administrado, Quando os exames sio num esquema de intervalo varvel, tal como testes-surpresa, 0s alunos tendem a estudar mais freqiente ‘mente e mais consistentemente. Os padrées de comportamento tipicamente observados em diferen- tes esquemas de reforco podem servstos na Figura 6.13. Persisténcia comportamental 0 esquema de reforgo também afeta a perssténcia do com- Portamento. O reforco continuo é altamenteefetvo para a aquisigéo de um comportamento, mas se © reforgo para, o comportamento se extingue rapidamente. Por exemplo, sempre que voce coloca dinheiro em uma maquina de venda de algum produto, ela Ihe dé esse produto. Se ela péra de Ihe dar o produto, vocé rapidamente deixard de lhe dar dinheiro. Em contaste, uma méquina caca- niquels paga em um esquema de razdo vardvel. As pessoas continuam colocando seu dinheiro nas reforso continuo Um tipo de ‘aprendizagem em que 0 comportamento desejado é reforcado sempre que ocorre. reforco parcial_Um tipo de ‘aprendizagem em que o comportamento 6 reforcado intermitentemente. ‘esquema de razo_ 0 reforco é bbaseado no numero de vezes que © ‘comportamento ocorre. esquema de intervalo 0 reforco. @ baseado em uma unidade de ‘tempo especifica. ‘esquema fixo 0 reforco é ‘oferecido consistentemente sempre ‘que o comportamento ocorre. ‘esquema varidvel 0 reforgo é aplicado em indices diferentes ou ‘em momentos diferentes, 196 GAZZANIGA ¢ HEATHERTON méquinas caga-niqueis mesmo que a maquina raramente reforce sew comportamento. O efeito de extinedo do reforco parcial descre- ‘ea maior pesisténcia de comportamento sobo reforgo parcial, devido A difculdade de detectar a auséncia de reforg. Durante o reforgocon- tinuo ¢ facil detectar quando oreforgo cessou, Mas se comportamen- to 6 reforgado s6 parte do tempo, osujeito precisa repetir o comporta- ‘mento comparativamente mais vezes para detectar a auséncia de reforc. Assim, quanto menos fregiente oreforgo durante oteinamento, maior 4 resisténcia & extingo. Para condicionar um comportamento que voe® ‘quer qu persist reforce-ocontinuamente durante a aquisgaoinicial e depois mude lentamente para o reforgo parcial. Os pais seguem natu- ralmente essa estratégia ao ensinar os fos a usar 0 vaso sanitéro e 750 Intervalo fix0 @ 1 2% 30 4 50 60 70 so outros comportamentos. Tempo (rrinutos) A biologia e a cognicao influenciam o FIGURA 6.13 Es curves mostam a aprendizagem tica em comportamento operante diferentes esquemas de ergo, Quanto mais ingreme a inha, mais altos os indices de resposta. As marcas nas nha inccam quando reforo fo Behavioristas como BE Skinner acreitavam que todos os compor- dado. Observe que 0 refogo de razdo lve 2 inice mas elvado de tamentos podiam ser explicados por prineipios simples de condiciona- resposta ‘mento, O romance de Skinner, Walden Two, descreve uma utopia em que todos os problemas de sociedade lo resolvids por meio de princpios de concicionamento operante. Na realdade, contudo,exstem limites para cxplcarocomportamento humano por meio de esquemas de reforo. 4 biologiaimpelmites &apren- izagem, eo reforgo nem sempre tem de estar presente para que a aprendizagem acontes. Limitagdes biolégicas _Embora os behaviorist acreditassem que qualquer comportamento Podia ser moldado por melo de reforgo, agora esté claro que os animais tém dificuldade em aprender comportamentos que se opdem a sua adaptacdo evoluiva, Um bom exemplo de limites biol6gios foi | obtido pelos Breland, um casal de psicdlogos que utlizou téenias de condicionamento operante para treinaranimais para comerciais (Breland e Breland, 1961) Eles descobriram que muitos dos animais recusavamse a realizar cetas tarefas que Thes tinham sido ensinadas. Por exemplo, eles treinaram um guaxinim para colocar moedas em um cofrinho em formato de porco, mas embora 0 uaxinim iniialmente tenha aprendido a tarefa, ele eventualmente se recusou a depositar as moe: das, Em vez disso, ele ficou sobre o cof eesfregou as moedas com as patinhas. O comportamento de esfregarndo foi reforgado; ele, na verdade, adiou oreforgo. Uma explicagio para ocomportamen- todo guaxinim é que atarefa era incompativel com comportamentos adaptativos inatos. O guaxinim associou a moeda & comida e a tratou da mesma maneira:esfregar oalimento com as patas € inato nos guaxinins. Em uma linha semelhante, os pornbos podem ser treinados para bicar chavesafim de evitar choques elétricos. Entretanto, eles podem aprender a evtar choques batendo as ass, porque esse € 0 seu meio natural de escapar, O psicslogo Robert Bolles argumenta que os animais tém reaches inatas de defesa a estimulos ameagadores (Bolles, 1970). 0 condicionamento é mais efetivo | quando a associagio entre a resposta comportamental eo reforgo é semelhante as predisposigdes ‘natas do animal. ‘A perspectiva evolutiva v6 o cérebro como uma compilacio de médulos especitics para dife- rentes dominios, cada um responsdvel por diferentes fungies cognitvas. Isso sugere que a aprendi- 2agem é 0 resultado de muitos mecanismos inicos que resolvem problemas individuais adaptative, no o resultado de mecanismos de aprendizagem geral (Rezine Kalat, 1971; Shettleworth, 2001). Conforme argumenta 0 psicdlogo evolutvo Randy Galistel (2000), as pessoas acitam prontamente que os pulmses sio adaprados para a respraclo, eos ouvidos, para aaudigio. Ninguém argumenta- ria que os pulmbes podem ser usados para owt e os pulmes, para respirr. Nao existe nenhum “érgio geral dos sentidos”, Assim, faz igual sentido postular que existe uma variedade de mecans- ‘mos de aprendizagem que tém evolu para resolver problemas especfcos. Considere uma formiga afta ere eevran eourereve {que deixa o ninho para procurar comida Tipicamente, a formiga faz um caminho tortuoso e indireto Le ae ore paral ‘até encontrar comida, momento em que toma um caminho direto para o ninho, mesmo em territério ddo.que sob reforco continuo. ‘desconhecido. Iso difere do que seria esperado de modelos tradicionais de aprendizagem. A formi- ga jamais foi recompensada por seguir o caminho, e nunca houve uma associacéo classicamente CIENCIA PSICOLOGICA 197 condicionada entre os objtos ambientais pouco familiares e ocaminho mais diretoparao nino. Em vex disso, processos mentais que calculam pequenas madancas de dstnciae drecéo fornecem uma solugéo para o caminho mais dieto para casa. O que Gallistel quer dizer & que a aprendizagem consiste em capacidades de aprencizagem especalizades, que resolvem os problemas adaptativos enfrentados pelos animais em seu ambiente Distingdo aquisicdo-desempenho Outro desafio idéia de que o reforgo & responsdvel ‘Por todos os comportamentos ¢ que a aprendizagem pode ccorrer sem reforgo. Edward Tolman, um dos primeirasteércos cognitive, argumentou que oreforgo tem maior impacto sobre o desempenho do que sobre a aprendizagem. Na época, Tolman estava realizando experimentos em que ratost- sham de aprender a percorre laitintos complexos para obteralimento, Tolman acrditava que os ratos riavam mapas cognitivos, representagies espaciais do labirinto, que os ajudavam a apren- der a encontrar rapidamente a comida, Para tetar sua teora, Tolman e seus alunos estudaram trés ‘grupos de ratos cuja taefa era percorrer um labirinto até uma ‘caixa-lvo” que coatinha o reforgo, geralmente comida, O primeio grupo néo recebeu qualquer reforo,e seu desempenko foi bastante ffaco, Sem nenhuma caxa-aivo a encontrar, 0s ratos vagavam pelo labirinto. Um segundo grupo foi reforgado em cada tentativa e aprendeu a encontrar a caixealvo rapidamente. O grupo critico foi o terceto, ue néo fo eforgado nas primeiras deztentatvas, mas fi depois reforcado nas subseqien- tes. Tolman descobriu que esse grupo apresentou uma curva de aprendizagem surpreendentemente répida, de modo que aleangou imediatamente o grupo que fora continuamente reforcado (Figura 6.14), Esse resultado implica que os rato tinham aprendido um mapa cognitvo do lbirinto e foram

Você também pode gostar