1 PB

ACTA COMPORTAMENTALIA Vol. 17, Nm. 1 pp.
5-24
Efeitos de diferentes histrias de reforamento e extino sobre a variabilidade comportamental(*)

(Effects of different histories of reinforcement and extinction on the behavioral variability)
Marcos Takashi Yamada e Maria Helena Leite Hunziker

Universidade de So Paulo (Received March 27, 2008; Accepted August 28, 2008)
O comportamento varivel aquele que difere de outros comportamentos considerados como referentes dentro de um universo de anlise (Hunziker & Moreno, 2000). Pesquisas tm demonstrado ao menos dois processos comportamentais responsveis pela variabilidade comportamental: a induo, produzida pela intermitncia do reforo e pela extino operantes (Antonitis, 1951; Eckerman & Lanson, 1969), e o controle pelas consequncias (Page & Neuringer, 1985). O estudo do controle da variabilidade pelas suas conseqncias, realizado tanto com organismos no humanos quanto humanos, ampliou a noo de reforo ao demonstrar que o reforo contingente variao produz elevados nveis de variabilidade comportamental (ver Neuringer 2002; 2004, para uma reviso de rea). Por exemplo, foram realizados estudos sobre variabilidade operante como funo de diferentes contingncias de reforamento, tanto em pessoas saudveis (Neuringer, 1986; Hunziker & Yamada, 2007) como com quadro leve de depresso (Hopkinson & Neuringer, 2003) ou autismo (Miller & Neuringer, 2000), sendo apontada, ainda, a relao entre variabilidade e criatividade (Stokes, 1999). Com animais, o comportamento de variar foi analisado em funo da contingncia em vigor (Abreu-Rodrigues, Lattal, Santos, & Matos, 2005), controle de estmulos (Curvinel, 2002; Denney & Neuringer, 1998; Souza, 2006), da interao das contingncias com substncias qumicas (Abreu-Rodrigues, Hanna, Cruz, Matos, & Delabrida, 2004; Cohen,
Endereo para correspondncia: Maria Helena Leite Hunziker Universidade de So Paulo. Av. Prof. Mello Moraes, 1721 CEP 05508-030 So Paulo SP. FAX: (11) 3091-4357 e-mail: hunziker@lexxa.com.br (*)Nota de rodap: Esse trabalho parte da dissertao de mestrado defendida pelo primeiro autor, na Universidade de So Paulo, em 2007, sob a orientao da segunda autora. Ele foi parcialmente apresentado na XXXVII Reunio Anual de Psicologia, da Sociedade Brasileira de Psicologia, realizada em Florianpolis, em 2007. Apoio do CNPq com Bolsa de Mestrado e Bolsa Produtividade em Pesquisa.
VARIABILIDADE COMPORTAMENTAL
2009
Neuringer, & Rhodes, 1990; Mook & Neuringer, 1993), diferenas genticas (Hunziker, Saldana, & Neuringer, 1996), gnero e idade (Neuringer & Huntley, 1991), entre outros. Embora diferentes contingncias possam reforar a variabilidade, estudos tm demonstrado que os resultados obtidos so determinados pelo grau de exigncia de variao que a contingncia impe. Por exemplo, Hunziker, Yamada, Manfr, Ferreira e Lee (2002) compararam os efeitos do reforamento de seqncias de respostas que no repetiam as n anteriores (contingncia LAG-n) com o reforamento de sequncias menos freqentes e recentes (contingncia RDF), tanto em ratos como em humanos. Os resultados mostraram que os nveis de variabilidade da seqncia dependeram da exigncia de variao para liberao do reforo: dentro dos parmetros utilizados nesse estudo, a contingncia de RDF, que exigia maior variao para obter o reforo, produziu maior variabilidade do que a contingncia LAG-n, a qual, por sua vez, produziu variabilidade crescente na medida em que foram aumentados os valores do n. Grunow e Neuringer (2002) obtiveram dados semelhantes utilizando a contingncia de RDF e manipulando em paralelo a freqncia de reforamento (diferentes esquemas de intervalo varivel): seus resultados mostraram que o comportamento de variar dependeu mais da contingncia em vigor (quanto mais alta a exigncia, maior a variao da resposta) do que da quantidade de reforamento. Alm das contingncias atuais, diversos estudos demonstraram que a variabilidade (reforada ou induzida) tambm controlada por contingncias histricas: a exposio prvia ao reforamento contingente variao ou repetio, bem como ao reforamento independente desses padres de comportamento, pode alterar o controle exercido pela contingncia em vigor (Hunziker & Yamada, 2007; Vilela, 2008). Foi sugerido que a histria de reforamento tem maior probabilidade de exercer controle sobre o comportamento atual se o comportamento produzido pelas contingncias histricas no envolver perdas de reforos na contingncia vigente; caso essas perdas ocorram, passa a predominar o controle pelas contingncias em vigor (Hunziker, Caramori, Silva, & Barba, 1998; Hunziker, Lee, Ferreira, Silva, & Caramori, 2002; Stokes, Mechner, & Balsam, 1999). Os efeitos da extino sobre a variabilidade operante tambm dependem da histria de reforamento. Neuringer, Kornell e Olufs (2001) compararam os efeitos da extino sobre a variabilidade do comportamento de animais com histria prvia de reforamento contingente variao, repetio ou com reforamento independente da variabilidade. Os resultados mostraram que sujeitos com histria de reforamento por variar foram os que apresentaram maior variabilidade, tanto na fase de reforamento quanto na fase de extino; os sujeitos que tinham histria de reforamento independente da variao apresentaram aumento da variabilidade durante a fase de extino, e os animais reforados inicialmente por repetir apresentaram pouca variabilidade na fase de reforamento e um aumento da variabilidade na fase de extino. Portanto, o
Vol. 17 Nn. 1
MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER
procedimento de extino, que por si s induz variabilidade, parece ter seus efeitos sobre a variabilidade operante influenciados pela histria de reforamento dos sujeitos. Esse conjunto de condies relacionadas aos efeitos da histria de reforamento e de extino sobre a variabilidade operante tem utilizado comparaes de contingncias opostas, tais como variao/repetio, ou liberao do reforo dependente/ independente da variabilidade. Porm, outras relaes podem ser exploradas. Ser que contingncias de reforamento que controlam diferentes graus de variabilidade podem tambm sofrer efeitos da histria comportamental, ou seja, produzir efeitos dependentes da ordem de exposio a elas? Ser que essa ordem de exposio s contingncias de reforamento pode afetar os efeitos da extino operante sobre a variabilidade, bem como os efeitos da retomada do reforamento aps a extino? O presente experimento foi delineado para responder a essas perguntas, tendo por objetivos especficos: (1) Comparar a variabilidade comportamental produzida por duas contingncias de reforamento; (2) Verificar se a ordem de exposio a essas contingncias interfere na instalao e na manuteno da variabilidade comportamental; (3) Verificar se as diferentes histrias de reforamento produzem efeito diferenciado em condies de interrupo (extino) e reinstalao de reforamento contingente variao. MTODO Sujeitos Foram utilizados 14 ratos experimentalmente ingnuos, machos, albinos, Wistar, com aproximadamente 90 dias de idade no incio do experimento, provenientes do Biotrio do Instituto Butant. Os sujeitos foram mantidos em gaiolas de metal individuais, alimentados com rao seca balanceada, da marca Purina, constantemente disponvel. Quarenta horas antes do incio do experimento, foi retirada a gua da gaiola-viveiro. A partir da primeira sesso, os animais foram mantidos em regime dirio de 5 min de acesso gua, administrado aps a sesso experimental. Portanto, ao iniciar as sesses experimentais os animais estavam em privao de gua por aproximadamente 23 h. Nos dias em que no ocorriam sesses, e ao fim de cada sesso de extino, os animais receberam 10 min de gua. Os sujeitos foram pesados semanalmente, para acompanhar seu estado de sade, tendo-se por limite que no ficassem abaixo de 80% do seu peso ad lib. No biotrio vigorou ciclo luz/escuro de 12 horas (7-19 h), sendo as sesses experimentais conduzidas na fase de luz.
2009
Equipamento Foram utilizadas oito caixas experimentais, cada uma medindo 27,5 X 22,5 X 28,0 cm (comprimento, largura e altura), com parede frontal, traseira e teto em acrlico transparente e as demais paredes em alumnio. O piso era composto por peas cilndricas de metal, de 0,3 cm de dimetro, distando 1,3 cm entre si. Na parte superior da parede esquerda existia uma lmpada de 12 W (luz ambiente). Duas barras retangulares de alumnio localizavam-se na parede direita da caixa, sendo uma direita (barra D) e outra esquerda (barra E) em relao ao centro dessa parede e ao bebedouro, que ficava no nvel do piso. Cada barra media 5,0 X 2,0 cm (comprimento e largura), ficando eqidistantes das laterais, afastadas 9,0 cm entre si (centro a centro), 7,0 cm acima do piso. Uma presso de no mnimo 45,0 gf. (grama/fora) acionava um dispositivo eletromecnico, sendo registrada como uma resposta. O reforo correspondia a uma gota de gua de 0,05 cc, disponibilizada no bebedouro por um mecanismo eletromecnico que o mantinha ao alcance do sujeito pelo tempo especificado na contingncia. O controle do experimento e registro dos dados foi feito por um computador PC (486 SX), com programa especialmente desenvolvido para essa pesquisa. Procedimento Treino Todos os sujeitos foram submetidos a trs sesses, com 24 h de intervalo entre elas. Na primeira, ocorreu a modelagem, por aproximaes sucessivas, da resposta de presso a barra, seguida de 100 reforos em esquema de reforamento contnuo (CRF), com o reforo disponvel para o sujeito por 5s. Na segunda sesso, os sujeitos receberam reforos liberados em esquema CRF, ficando o reforo disponvel por 3s. Na terceira sesso, uma seqncia de quatro respostas foi exigida para reforamento (FR4), ficando o reforo disponvel por 2s. As duas ltimas sesses foram encerradas aps o recebimento de 200 reforos. Em todas as sesses a luz ambiente permaneceu acessa, sendo que respostas em qualquer das barras (D ou E) foram igualmente conseqenciadas. Etapa Experimental Nessa etapa, a unidade comportamental considerada para reforamento passou a ser a seqncia de quatro respostas de presso a qualquer das duas barras. Dada a
Vol. 17 Nn. 1
combinao de duas barras (D e E) e quatro respostas, o sujeito tinha a possibilidade de emitir 16 seqncias diferentes entre si, a considerar a localizao das respostas D ou E dentro da seqncia (por exemplo, DDDD, EDDE, EEDD, DEDE, etc). Os animais foram divididos em dois grupos (n=7), expostos a cinco fases experimentais, com sesses com 24h de intervalo entre si. Cada sesso teve como critrio de encerramento a emisso de 200 seqncias, ou 45 minutos, o que ocorresse primeiro. Fase 1 Os sujeitos foram submetidos a 15 sesses com reforamento dependente da variabilidade das seqncias emitidas. Ao iniciar a sesso, a luz ambiente estava acesa. As seqncias reforadas foram seguidas da apresentao da gota de gua e seqncias no reforadas seguidas por um perodo de 2s com a luz ambiente apagada (chamado timeout), quando nenhum reforo era apresentado nem as respostas registradas. Aps esse perodo de timeout, a luz ambiente acendia-se novamente, reinstalando as condies de reforamento para nova seqncia. Para os sujeitos de um grupo (G1), o reforo era liberado contingente seqncia desde que ela diferisse das cinco ltimas seqncias emitidas (contingncia LAG-5). No outro grupo (G2), a probabilidade de reforamento era inversamente proporcional freqncia e recncia da unidade comportamental (esquema de reforamento dependente da freqncia -RDF). A freqncia de emisso de cada seqncia era relativa emisso das 16 seqncias possveis, de forma que o reforamento s era apresentado se ela no ultrapassasse o limiar preestabelecido de 1/16 (ou seja, freqncia relativa de emisso no superior a 0,0625). Assim, quanto mais freqente fosse a seqncia, menor sua chance de reforamento. Alm disso, cada seqncia emitida produzia a multiplicao do fator 0,99 (chamado de coeficiente de amnsia) sobre a freqncia das demais previamente emitidas. Assim, a cada emisso de uma seqncia, as demais (menos recentes) tinham reduzido o registro de suas freqncias, o que aumentava as suas probabilidades de reforamento. Portanto, menor freqncia e menor recncia determinavam, em conjunto, a maior probabilidade de reforamento de uma dada seqncia. Fase 2 Essa fase contou com 15 sesses de reforamento da variabilidade, com procedimentos invertidos em relao fase anterior: os sujeitos do G1 foram submetidos ao esquema RDF, enquanto que os sujeitos do G2 ao esquema LAG-5.
10
2009
Fase 3 Todos os sujeitos foram submetidos a 10 sesses com o mesmo procedimento descrito na Fase 1. Fase 4 Durante 5 sesses, as seqncias emitidas foram apenas registradas, porm nunca reforadas (extino), sendo sempre seguidas pelo timeout. Fase 5 Os sujeitos foram submetidos a 5 sesses sob a mesma contingncia de reforamento das Fases 1 e 3. A Quadro 1 resume esse procedimento. Quadro 1
Treino (3 sesses) Experimental A
Sujeitos
(15 Sessoes) (15 Sessoes) (10 Sessoes) (5 Sessoes) (5 Sessoes)
G1 Modelagem + 100 ref em CRF 200 ref em CRF 200 ref em FR4 G2
LAG-5
RDF
LAG-5
Extino
LAG-5
RDF
LAG-5
RDF
Extino
RDF
Resumo do procedimento utilizado no Experimento.
Vol. 17 Nn. 1
11
A variabilidade do comportamento foi considerada sobre a uniformidade distributiva das 16 seqncias possveis (Barba, 2006; Neuringer, 2002; 2004). Para tanto, foi utilizada a distribuio U, calculado como pi .log 2 ( pi ) U= - log 2 (n) , na qualpi a frequncia relativa de emisso de cada sequncia particular e n o nmero total de respostas possveis (aqui, 16). Este ndice estatstico pode adquirir valores dentro de um contnuo de 0,0 a 1,0: quanto mais os valores se aproximam de 1,0, maior o grau de variabilidade, enquanto que valores prximos de zero indicam alto grau de repetio. Para anlise estatstica das diferenas obtidas, foi utilizado o teste GLM Multivariado com Medidas Repetidas sendo que as variveis independentes foram a ordem das contingncias e cada uma das sesses experimentais. Foi testado se existiu efeito da ordem das contingncias apenas nas trs primeiras fases experimentais, do nvel de exposio contingncia e da interao entre ordem e nvel das contingncias. Adotamos um nvel de significncia de 5%, levando-se tambm em conta o poder observado (PO), que indica significncia a partir do valor 0,8, evitando a aceitao ou rejeio da Hiptese Alternativa do teste por meio de Erro Tipo I ou II. Para verificar o efeito univariado da ordem das contingncias, foi utilizado o teste post hoc Tuckey, verificando em qual dade est a mudana na taxa de respostas. RESULTADOS Em funo de problemas tcnicos, um dos sujeitos do Grupo G2 foi eliminado, ficando esse grupo com n = 6. As Figuras 1 e 2 mostram os desempenhos individuais dos sujeitos dos grupos G1 e G2, respectivamente, ao longo das 50 sesses experimentais: na parte superior so apresentados os ndices de variabilidade (U), na parte central a porcentagem de reforamento (% ref) e na inferior a taxa de resposta (R/min). Quanto aos ndices de variabilidade, os resultados na parte superior das Figuras 1 e 2 mostram que ambas as contingncias controlaram nveis de U acima de 0,700, porm com diferenas sistemticas entre si. Comparativamente ao RDF, o LAG-5 produziu, no geral, nveis inferiores de variabilidade, maior disperso intragrupo e uma pequena, porm sistemtica, reduo dos valores de U ao longo das sesses, independente da ordem de apresentao dessas contingncias. No G1, a mudana de LAG-5 para o RDF produziu aumento dos valores de U j nas primeiras sesses (Fase 2), valores esses que se mantiveram altos e constantes durante toda essa fase. Essa mudana tambm reduziu a disperso intragrupo obtida anteriormente sob LAG-5, produzindo
12
2009
desempenho mais homogneo entre os sujeitos. O retorno contingncia LAG-5 produziu retorno ao padro da primeira fase, com queda dos nveis de variabilidade acentuando-se no decorrer das sesses, e aumento da disperso intragrupo. A introduo da fase de extino no modificou esse padro de comportamento quando foi reinstalado o LAG-5. No G2, as mesmas relaes gerais foram obtidas: ndices U altos, estveis e homogneos intragrupo na condio de RDF; a mudana para LAG-5 produziu queda nos nveis de U, mais acentuadas no decorrer das sesses, e aumento da disperso intragrupo; o retorno ao RDF reinstalou o padro anteriormente descrito sob essa contingncia, embora necessitando de maior nmero de sesses para retornar aos nveis de variabilidade da Fase 1, comparativamente ao obtido no G1. A fase de extino no produziu mudanas sistemticas nesse padro de variabilidade reforado pelo RDF. A anlise dessas diferenas entre as trs primeiras fases, feita atravs do teste GLM, confirmaram a anlise por inspeo visual. No grupo G1, o teste GLM Pareado mostrou diferena significativa entre a ordem das contingncias (F (39, 240) =66,88; p<0,001; PO = 1,000), bem como a interao entre a ordem e nvel de exposio das contingncias (F(39, 240) = 1,68; p<0,05; PO=0,972). Anlises post hoc mostraram que os resultados controlados pela contingncia RDF diferiram dos obtidos nas duas fases de LAG-5 (p<0,001), que por sua vez no apresentaram diferena entre si. No G2, as diferenas foram significantes em funo das contingncias (F (39,200) = 45,85; p<0,001; PO = 1,000), sesses (F (39, 200) =2,91; p<0,001; PO = 0,994) e na interao entre contingncias e sesses (F (39, 200) = 4,87; p<0,001; PO = 1,000). O teste Tukey mostrou que o comportamento em LAG-5 diferiu do apresentado nas duas fases RDF, que tambm diferiram entre si (p<0,05). Os grficos centrais das Figuras 1 e 2 mostram uma relao sistemtica entre a porcentagem de reforamento e a contingncia em vigor. Essa relao segue sentido inverso descrita para variabilidade: maior porcentagem de reforamento em LAG-5 (em torno de 40 a 70%) que em RDF (em torno de 30 a 50%), independente da ordem de apresentao dessas contingncias, em ambos os grupos. Estatisticamente, as diferenas foram significantes no G1 em funo das contingncias (F(39, 240) = 145,79; p<0,001; PO = 1,000), sendo a porcentagem de reforamento obtida sob RDF diferente da obtida nas fases de LAG-5 (p<0,001), que no diferiram entre si. No G2 ocorreram diferenas significantes em funo das contingncias (F (39, 200) = 137,98; p<0,001; PO = 1,000), sendo que a porcentagem de reforamento em LAG-5 diferiu das fases RDF, que tambm diferiram entre si (p<0,001). Na parte inferior das Figuras 1 e 2, os resultados mostram que as taxas de respostas (R/min) de todos os sujeitos foram mais baixas nas primeiras sesses do experimento (em torno de 10 e 20 R/min), aumentando no decorrer das sesses at se estabilizarem,
Vol. 17 Nn. 1
13
em torno da sesso 9, na faixa de 15 a 30 R/min. As mudanas de contingncias no produziram qualquer efeito nas taxas de respostas, em ambos os grupos, as quais se mantiveram relativamente constantes, da etapa final da fase 1 at a fase 3. Durante a extino essas taxas caram prximo a zero, tendo retomado os padres anteriores ao ser reinstalado o reforamento. No G1, foram significantes as diferenas em funo das contingncias (F (39, 240) =10,95; p<0,001; PO = 0,991), sesses (F (39, 240) = 2,09; p<0,05; PO = 0,956) e interao entre contingncias e sesses (F (39, 240) =2,86; p<0,001; PO=1,000). Os resultados obtidos na primeira exposio ao LAG-5 diferiram dos resultados obtidos nas fases subseqentes (p<0,05), que no diferiram entre si. No G2 ocorreram diferenas significantes em funo das contingncias (F (39, 200) = 82,81; p<0,001; PO = 1,000), sesses (F (39, 200) = 6,15; p<0,001; PO = 1,000) e interao entre contingncias e sesses (F (39, 200) =3,30; p<0,001; PO = 1,000). O resultado obtido sob a primeira exposio ao RDF tambm diferiu das trs fases subseqentes (p<0,001), que no diferiram entre si. Como a freqncia de respostas foi baixa em todas as sesses de extino, no foi possvel calcular o U a cada sesso dessa fase, uma vez que esse clculo necessita, para sua validao, ser realizado sobre um mnimo de eventos (Barba, 1996), no atingidos nas sesses isoladamente. Portanto, para fazer a anlise do U na condio de extino utilizamos o total (T) de seqncias emitidas nas cinco sesses. Para se ter uma comparao desse dado com o da sesso anterior e posterior extino, foram tambm calculados os ndices U dessas sesses utilizando-se o mesmo nmero de seqncias emitidas pelo sujeito na fase de extino (T). Dessa forma, se o sujeito emitisse nas cinco sesses um total de 120 seqncias (T=120), trs ndices U eram calculados: um relativo s 120 seqncias durante extino, outro relativo s ltimas 120 seqncias emitidas na fase de reforamento anterior extino e o ltimo sobre as primeiras 120 seqncias emitidas sob reforamento logo aps a extino. Os resultados mostraram que no foram sistemticas as mudanas obtidas nos nveis de variabilidade, comparando-se a fase de extino com as de reforamento anterior e posterior. Contudo, a anlise isolada dos ndices de variabilidade em extino mostra que sofreram interferncia do esquema de reforamento prvio (Figura 3): os sujeitos anteriormente reforados em LAG-5 (G1) apresentaram, no geral, menor ndice de variabilidade em extino do que os que haviam sido reforados em RDF (G2). Todos os sujeitos G2 mostraram U igual ou acima de 0,900, enquanto apenas 57% dos sujeitos do G1 atingiram esse patamar. Essa figura tambm mostra que a disperso intragrupo foi mais acentuada no G1, enquanto que no G2 esses ndices foram mais uniformes. A ANOVA one way confirmou que houve diferena de nveis de variabilidade apresentados na extino pelos animais G1 e G2 (F (1, 63) =26,71 p<0,001).
14
G1
2009
1,0
LAG 5
RDF
LAG 5
EXT
LAG 5
0,8
0,5
80,0
LAG 5
RDF
LAG 5
EXT
LAG 5
60,0 %R E F
40,0
20,0
0,0
LAG 5
40,0
RDF
LAG 5
EXT
LAG 5
30,0 R /m in
20,0
10,0
0,0 1 6 11 16 01 06 21 26 Se s s e s 02 03 07 08 31 05 36 41 46
Figura 1. Dados obtidos com sete sujeitos do G1 ao longo das 50 sesses experimentais. O grfico superior apresenta os ndices de variabilidade expressos pelos valores de U, o central mostra a porcentagem de reforamento e o grfico inferior apresenta as taxas de respostas (R/min).
Vol. 17 Nn. 1
15
G2
RDF
1,0
LAG 5
RDF
EXT
RDF
0,8
0,5
RDF
80,0
LAG 5
RDF
EXT
RDF
60,0
40,0
20,0
0,0
40,0
RDF
LAG 5
RDF
EXT
RDF
30,0 R /m in
20,0
10,0
0,0 1 6 11 16 09 13 21 26 Se s s e s 10 14 31 11 15 36 41 46
Figura 2. Dados obtidos com seis sujeitos do G2 ao longo das 50 sesses experimentais. O grfico superior apresenta os ndices de variabilidade expressos pelos valores de U, o central mostra a porcentagem de reforamento e o grfico inferior apresenta as taxas de respostas (R/min.).
16 VARIABILIDADE COMPORTAMENTAL 2009
Figura 3. Comparao dos valores de U, obtidos pelo clculo do total de sequncias emitidas (T) em todas as sesses de extino pelos sujeitos G1 e G2.
Vol. 17 Nn. 1
17
DISCUSSO Os resultados obtidos nos permitem afirmar que a contingncia de RDF, comparativamente de contingncia LAG-5, controlou nveis de variabilidade mais elevados e estveis no decorrer das sesses, alm de menor disperso intragrupo. Essas diferenas se deram, de uma maneira geral, independentemente da ordem de exposio aos esquemas de reforamento, o que sugere que foi a contingncia em vigor, e no a histria de reforamento, que exerceu o maior controle sobre o grau e a estabilidade dos ndices de variabilidade individuais. A condio de extino produziu queda na taxa de respostas mas manteve a variabilidade em nveis prximos aos da fase anterior, com pequena interferncia da histria de reforamento. A variabilidade obtida sob reforamento na ltima fase do experimento no foi afetada pela exposio prvia extino. Portanto, embora com diferenas entre si., as duas contingncias de reforamento utilizadas nesse estudo foram adequadas para instalar e manter seqncias variveis. Aparentemente, antes de se criar uma histria com diferentes contingncias, o comportamento de variar dependeu basicamente do grau de exigncia de variao imposto pela contingncia em vigor. Em LAG-5, a exigncia de no repetio das cinco ltimas seqncias permitia que o reforo fosse obtido sem que o sujeito emitisse todas as seqncias possveis. Portanto, teoricamente o sujeito poderia receber todos os reforos programados mesmo se emitisse apenas seis seqncias que se alternassem sistematicamente, ou seja, apresentando um padro cclico com apenas 37,5% do universo de seqncias possveis, o que geraria um baixo ndice de variabilidade. No foi esse o resultado obtido nas sesses iniciais, onde os ndices de variabilidade foram relativamente altos, replicando outros estudos (por exemplo, Hunziker et al., 1996; Page & Neuringer, 1985). Porm, a exposio a sesses consecutivas de reforamento em LAG-5 produziu decrscimos graduais da variabilidade sem que isso produzisse reduo equivalente na porcentagem de reforamento. J o reforamento em RDF gerou nveis mais altos de variabilidade que a contingncia LAG-5, e menor porcentagem de reforamento, a despeito da ordem de exposio s fases experimentais. Os parmetros utilizados na contingncia RDF (freqncia relativa de emisso no superior a 0,0625 e coeficiente de amnsia de 0,99), tornavam o reforo tanto mais provvel quanto maior fosse a distribuio das seqncias entre as 16 possveis, o que no impedia que uma seqncia pouco emitida ao longo da sesso se tornasse elegvel para reforamento em emisses sucessivas. Portanto, sob essa contingncia, o sujeito era tanto mais reforado quanto mais distribusse suas seqncias entre as 16 possibilidades existentes, embora, eventualmente, pudesse receber reforos repetindo uma mesma
18
2009
seqncia. Deve-se considerar que essas diferentes exigncias estabelecidas pelas duas contingncias atuam sobre um universo de seqncias que no so igualmente provveis. As 16 seqncias aqui analisadas podem ser classificadas em quatro categorias, a depender da necessidade de haver mudana entre barras D e E: apenas duas seqncias envolvem a emisso de quatro respostas de presso barra (DDDD ou EEEE); as demais requerem uma, duas ou trs respostas de mudana de barra que, somadas s quatro respostas de presso barra, compem seqncias de cinco, seis ou sete respostas para atingir o reforamento, respectivamente. A reposta de mudana, por envolver o deslocamento do rato entre dois pontos da caixa, requer mais tempo para a sua emisso do que a presso barra que est frente ao rato. Portanto, a diferena quanto ao nmero e natureza das respostas exigidas nas quatro categorias de seqncias redunda em maior ou menor tempo para obteno do reforo a partir da emisso da primeira resposta da seqncia. Conseqentemente, funcional para o sujeito que ele emita as seqncias mais curtas, ou seja, com menos respostas de mudana. Essa anlise corroborada por estudos anteriores que mostraram que, no havendo exigncia de variao, a probabilidade de emisso da seqncia inversamente proporcional quantidade de alternaes requeridas entre as barras (Barba & Hunziker, 2002; Hunziker et al., 1996; 2002). Portanto, vivel supor que as contingncias interagiram com esses controles paralelos sobre a probabilidade de emisso da seqncia. Na contingncia LAG-5, a exigncia de no repetio levou a uma variabilidade relativamente alta, uma vez que variar evitava a repetio. A grande disperso dentre os animais expostos a essa contingncia pode ter sido decorrente do fato de que, embora LAG-5 no exija a emisso de muitas seqncias diferentes, tambm no penaliza os altos nveis de variabilidade. Portanto, se variar evita a repetio, os sujeitos podem ter diferentes graus de grau de variao sem diferirem quando porcentagem de reforamento recebido. Contudo, a exposio continuada a essa contingncia produz uma seleo gradualmente mais refinada, onde o custo de emisso da seqncia adquire maior controle, tornando gradualmente menos provveis as seqncias mais longas, o que faz cair o nvel de variabilidade desse comportamento. Na contingncia RDF, a grande distribuio das seqncias continuamente necessria para reforamento, sendo penalizada (com a no obteno do reforo e apresentao do timeout) a reduo do universo de seqncias emitidas. Com isso, a exposio continuada contingncia RDF no permite ao sujeito estratgias sistemticas de reduo do custo de resposta, pois isso implica em reduo do reforamento recebido. Com os parmetros aqui utilizados, a contingncia RFD neutralizou os controles paralelos, produzindo ndices de variabilidade muito elevados, estveis e homogneos entre os sujeitos. Tais resultados
Vol. 17 Nn. 1
19
replicam os obtidos em outros estudos que utilizaram as contingncias RDF e LAG (Barba, 1996; Barba & Hunziker, 2002; Hunziker, Manfr, & Yamada, 2006; Page & Neuringer, 1985). Esses resultados gerais tm uma aparente contraposio a outros experimentos que apontaram a interferncia da histria de reforamento na variabilidade comportamental (Hunziker et al., 1998; 2002; Vilela, 2008). Entretanto, no se pode considerar o efeito da histria de forma isolada: as relaes histricas esto em contnua interao com as contingncias atuais de forma que na funcionalidade dessa interao que se situa o controle que ir predominar. Assim, ao se comparar os diferentes estudos deve-se considerar o grau de perda ou ganho que a interferncia da histria produz frente contingncia em vigor. Tem sido sugerido que o controle pela contingncia histrica ser tanto maior quanto mais a contingncia presente for desfavorvel maximizao dos reforos. Por exemplo, Hunziker et al. (1998; 2002) demonstraram, com ratos e estudantes universitrios, respectivamente, que sob reforamento no contingente variabilidade (condio de acoplamento -ACO), o nvel de variao foi maior para os sujeitos previamente expostos a LAG-4, ou seja, ao reforo contingente resposta de variar. Como na condio de acoplamento (ACO) o nvel de variabilidade no muda a probabilidade de reforamento, a influncia da histria no produziu perdas para esses sujeitos, resultados esses que se ajustam relao sugerida acima. O mesmo no ocorreu na mudana da condio ACO para a condio LAG-4, onde a manuteno do desempenho histrico geraria perdas de reforos. Nessa ltima condio, o controle foi acentuadamente da contingncia em vigor. No presente estudo, apesar dos nveis de variabilidade terem se mantido diferenciados em funo do esquema em vigor, a ordem RDF/LAG/RDF produziu uma pequena interferncia no padro de retorno contingncia original (ou seja, no segundo RDF), efeito esse no verificado na ordem LAG/RDF/LAG (ou seja, no segundo LAG 5). Deve-se considerar que embora a contingncia de RDF tenha produzido um controle mais estrito sobre os diferentes sujeitos, ela foi a condio que gerou menos reforamento. Assim, a histria de reforamento dada aos sujeitos de ambos os grupos produziu efeitos em direes diferentes. No G1, os animais passaram de uma contingncia menos exigente e mais reforador (LAG-5) para outra mais exigente e menos reforadora (RDF). Quando retornaram primeira contingncia, essa mudana foi altamente favorvel ao retorno ao primeiro padro comportamental, uma vez que mesmo variando menos eles podiam ganhar mais. No G2, contudo, a ordem foi inversa, bem menos vantajosa para um retorno ao padro da primeira fase: iniciando com muita exigncia e pouco reforo (RDF), os animais experimentaram, em seguida, mais reforos com menos exigncia (LAG-5) e, ao retornar primeira condio, demoraram algumas sesses para se adaptar a ela. Esses resultados so compatveis com a anlise
20
2009
anteriormente feita da otimizao no sentido de que o aumento do treino no LAG-n produz queda da emisso de seqncias desnecessrias (daquelas que requerem mais alternaes) sem perda de reforos. Aparentemente, ao longo das sesses LAG-n, a relao custo/benefcio vai sendo otimizada, dentro dos limites permitidos por essa contingncia. Como a mesma relao no existe no RDF, a queda na variabilidade no se verifica ao longo das sesses. Quando h mudana de contingncias, essa relao parece ser crtica para controlar o retorno ao padro original. Aqui, com o retorno contingncia LAG-5, depois da contingncia RDF, os ganhos eram otimizados, ao contrrio da mudana do LAG-5 para o RDF, que gerava maior exigncia de variar e menor porcentagem de reforamento. Assim, os resultados do atual experimento no contradizem os que apontavam efeito da histria sobre a variabilidade comportamental. Eles apenas fortalecem o argumento de que a influncia da histria de reforamento depende da relao de otimizao com a contingncia em vigor: se o controle pela contingncia histrica no interfere (ou facilita) as chances de reforamento frente s contingncias presentes, o seu efeito maior. Quanto ao nvel de variabilidade em extino, os dados do presente estudo mostram que ele tambm foi afetado pela histria de reforamento, sendo maior nos animais com histria predominante de reforamento RDF do que de LAG-5. Portanto, essa variabilidade no pode ser explicada apenas pelo efeito indutor da extino (Antonitis, 1951). Nossos resultados so compatveis com os apresentados por Neuringer et al. (2001) que extrapolam o efeito indutor da extino no controle da variabilidade. Alm disso, variabilidade aqui obtida durante extino compatvel com a anlise da ressurgncia comportamental, proposta por Epstein (1983), no sentido de que comportamentos que foram anteriormente reforados, sob circunstncias similares, tendem a reaparecer durante a extino (ver tambm Stokes et al., 1999). Por exemplo, Villas-Bas (2006) analisou a semelhana das respostas emitidas na extino com as observadas durante o Nvel Operante ou treinadas durante fases experimentais anteriores. Os resultados apresentados mostraram que durante a extino ocorreu um aumento de respostas que no foram treinadas anteriormente e que no foram observadas durante o nvel operante. Contudo, essas novas respostas apresentaram semelhanas (na parte inicial da seqncia) com as ltimas seqncias treinadas antes da extino, sugerindo que as novas respostas tinham relao direta com a histria de reforamento recente do sujeito. A taxa de respostas aqui obtida aparentemente no se relaciona com o nvel de variabilidade ou com a porcentagem de reforamento: os dados sugerem que ela foi um efeito direto do treino, sendo crescente nas sesses iniciais at atingir um patamar, que se manteve estvel at o final do experimento. Contudo, a porcentagem de reforamento variou em funo da contingncia em vigor, sendo inversamente relacio-
Vol. 17 Nn. 1
21
nada com os nveis de variabilidade, sem sofrer efeito da histria de exposio a outra contingncia. A despeito da ordem de exposio ao LAG-5 ou ao RDF, a porcentagem de reforamento foi sempre maior em LAG-5, contingncia que controlou a menor variabilidade. Essa relao inversa aqui obtida pode sugerir que os diferentes nveis de variabilidade obtidos sob as duas contingncias aqui testadas seriam, ao menos em parte, fruto da induo produzida pela intermitncia do reforamento (Eckerman & Lanson, 1969; Schwartz, 1982). Embora haja slidas demonstraes na literatura de que a variabilidade pode ser diretamente reforada, pode-se perguntar qual a parcela de controle da variabilidade aqui obtida cabe ao seu reforamento direto ao mera intermitncia do reforo. O delineamento utilizado nesse atual experimento no permite separar ambos os processos. Uma maneira de responder experimentalmente a essa questo seria utilizar a contingncia de acoplamento (Page & Neuringer, 1985), que garantiria a mesma intermitncia de reforo obtida sob cada uma das contingncias, porm sem exigir dos sujeitos o comportamento de variar. Esse teste poder ser realizado em novos estudos. REFERNCIAS
Abreu-Rodrigues, J. J., Hanna, E. S., Cruz, A. P., Matos, R., & Delabrida, Z. (2004). Differential effects of midazolam and pentylenetetrazole on behavioral repetition and variation. Behavioural Pharmacology, 15, 535-543. Abreu-Rodrigues, J., Lattal, K. A., Santos, C. V., & Matos, R. A. (2005). Variation, repetition, and choice. Journal of Experimental Analysis of Behavior, 83 (2), 147-168. Antonitis, J. J. (1951). Response variability in the rat during conditioning, extinction, and reconditioning. Journal of Experimental Psychology, 42 , 273-281. Barba, L. (1996). Variabilidade Comportamental Aprendida. Dissertao de Mestrado, Universidade de So Paulo, So Paulo. Barba, L. (2006). Variabilidade comportamental: Uma taxonomia estrutural. Acta Comportamentalia, 14 (1), 23-46. Barba, L., & Hunziker, M. H. L. (2002). Variabilidade comportamental produzida por dois esquemas de reforamento. Acta Comportamentalia, 10, 5-12. Cohen, L., Neuringer A., & Rhodes, D. (1990). Effects of ethanol on reinforced variations and repetitions by rats under a multiple schedule. Journal of Experimental Analysis of Behavior, 54 (1), 01-12. Curvinel, A. (2002). A produo de variabilidade de respostas pelo reforamento de mudanas na dimenso durao. Dissertao de Mestrado, Pontifcia Universidade Catlica de So Paulo, So Paulo. Denney, J., & Neuringer, A. (1998). Behavioral variability is controlled by discriminative stimuli. Animal Learning & Behavior, 26 (2),154-162. Eckerman, D., & Lanson, R. (1969). Variability of response location for pigeons responding under continuous reinforcement, intermittent reinforcement, and extinction. Journal of Experimental Analysis of Behavior, 12 (1), 73-80. Epstein, R. (1983) Resurgence of previously reinforced behavior during extinction. Behavior Analysis
22
2009
Letters, 3, 391-397. Grunow, P., & Neuringer A. (2002). Learning to vary and varying to learn. Psychonomic Bulletin and Review, 9 (2), 250-258. Hopkinson, J., & Neuringer A. (2003). Modifying behavioral variability in moderately depressed students. Behavior Modification, 27 (2), 251-264. Hunziker, M. H. L., Caramori, F. C., Silva, A. P., & Barba, L. (1998). Efeitos da histria de reforamento sobre a variabilidade comportamental. Psicologia: Teoria e Pesquisa, 14 (2), 149-159. Hunziker, M. H. L., Lee, V. P. Q., Ferreira, C. C., Silva, A. P., & Caramori, F. C. (2002). Variabilidade comportamental em humanos: Efeitos de regras e contingncias. Psicologia: Teoria e Pesquisa, 18 (2), 139-147. Hunziker, M. H. L., Manfr, F. N., & Yamada, M. T. (2006). Reforamento positivo da variabilidade e da repetio imuniza contra o desamparo aprendido. Revista Brasileira de Analise do Comportamento, 2, 53-66. Hunziker, M. H. L., & Moreno, R. (2000). Anlise da noo de variabilidade comportamental. Psicologia: Teoria e Pesquisa, 16 (2), 135-143. Hunziker, M. H. L., Saldana, L., & Neuringer, A. (1996). Behavioral variability in SHR and WKY rats as function of rearing environment and reinforcement contingency. Journal of the Experimental Analysis of Behavior, 65 (1), 129-144. Hunziker, M. H .L., & Yamada, M. T. (2007). Estudo comparativo da variabilidade operante em animais e humanos: Efeitos de contingncias e histria de reforamento. Em H. Guilhardi & N.C. Aguirre (Orgs). Sobre Comportamento e Cognio, vol. 19 (pp.181-191). Santo Andr: ESETec. Hunziker, M. H. L.,Yamada, M. T., Manfr, F.N., Ferreira, C. C., & Lee, V. P. Q. (2002). Estudo comparativo da variabilidade operante em animais e humanos Resumos de comunicaes cientficas. XXXII Reunio Anual de Psicologia (pp. 110), Florianpolis (SC): SBP. Miller, N., & Neuringer, A. (2000). Reinforcing variability in adolescents with autism. Journal of Applied Behavior Analysis, 33 (2), 151-165. Mook, D. M., & Neuringer, A. (1993). Different effects of amphetamine on reinforced variations versus repetitions in spontaneously hypertensive rats (SHR). Physiology & Behavior, 56 (5), 939-944. Neuringer, A. (1986). Can people behave randomly?: The role of feedback. Journal of Experimental Psychology: General, 115 (1), 62-75. Neuringer, A. (2002). Operant variability: Evidence, function, and theory. Psychonomic Bulletin & Review, 9 (4), 672-705. Neuringer, A. (2004). Reinforced variability in animals and people. American Psychologist, 59 (9), 891906. Neuringer, A., & Huntley (1991). Reinforced variability in rats: Effects of gender, age and contingency. Physiology & Behavior, 51, 145-149. Neuringer, A., Kornell, N., & Olufs, M. (2001). Stability and variability in extinction. Journal of Experimental Psychology: Animal Behavior Processes, 27 (1), 79-94. Page, S., & Neuringer, A. (1985). Variability is an operant. Journal of Experimental Psychology: Animal Behavior Process, 11 (3), 429-452. Schwartz, B. (1982). Failure to produce response variability with reinforcement. Journal of the Experimental Analysis of Behavior, 37 (2), 171-181. Souza, A. S. (2006). Propriedades Discriminativas de Contingncia de Variao e Repetio. Dissertao de Mestrado. Universidade de Braslia, Instituto de Psicologia, Braslia.
Vol. 17 Nn. 1
23
Stokes, P. (1999). Variability, constraits, and creativity. American Psychologist, 56, 355-359. Stokes, P. D., Mechner, F., & Balsam, P. D. (1999). Effects of different acquisition procedures on response variability. Animal Learning & Behavior, 27 (1), 28-41. Villas Bas, A. A. (2006). Efeitos do Procedimento de Extino sobre o Responder em Ratos: Sequncias de Respostas como Operante. Dissertao de Mestrado, Universidade de So Paulo, So Paulo. Vilela, J. B. (2008). Efeitos de contingncias de variao e de repetio sobre a formulao de relatos verbais. Dissertao de Mestrado, Universidade de Braslia, Braslia.
RESUMO
Os objetivos desse trabalho foram (1) comparar a variabilidade comportamental controlada por duas diferentes contingncias de reforamento positivo (2) observar se a ordem de exposio a essas contingncias interfere na aquisio e na manuteno da variabilidade, e (3) verificar como a extino interfere no padro de reaquisio da variabilidade. Quatorze ratos foram divididos em dois grupos, que diferiram entre si devido ordem de exposio a duas contingncias (LAG-5 e RDF), apresentadas de acordo com o delineamento ABACA ou BABCB, onde A correspondeu contingncia LAG-5, B contingncia de RDF e C extino. Foi avaliada a variabilidade na emisso de sequncias de quatro respostas em duas barras. Os resultados indicaram sensibilidade diferencial s diferentes contingncias de reforamento da variao, sendo sua aquisio e manuteno controladas principalmente pela contingncia em vigor, com pouca interferncia da histria de reforamento. Alm disso, a condio de extino se mostrou indutora de variabilidade, no interferindo, porm, no controle operante da mesma. Os conceitos de ressurgncia, otimizao e maximizao so considerados na anlise desses dados. Palavras-chave: variabilidade operante, variabilidade induzida, extino, histria comportamental, reforamento positivo, comportamento animal, ratos.
ABSTRACT
This study attempted to (1) compare the behavioral variability produced by two contingencies, (2) verify whether the order of exposure to these contingencies might interfere with the acquisition and maintenance of variability, and (3) establish how extinction interferes in the reacquisition of variability. Reinforcement was delivered to fourteen male Wistar rats contingent upon four lever-pressing responses on two levers (right -D and left -E). The behavioral unit examined was the sequence of four responses which, depending on the combination between D and E, could result in 16 different sequences (e.g., EDDE, DEDD, EEEE, etc.). While under LAG-5 contingency, the sequence was reinforced only if it differed from the five previous sequences. Under RDF contingency, the reinforcement was delivered only if the relative frequency of the sequence was equal to or less than 0.0625 (1/16). In addition, every response sequence that was emitted caused the frequency of every other sequence to be multiplied by a factor of 0.99, decreasing their frequency and, consequently, increasing their reinforcement probability. Therefore, when under RDF contingency, the lower the frequency and recency of the current sequence, the higher the probability of reinforcement; under LAG-5 contingency, the reinforcement probability was 1.0 as long as the current sequence differed from the last five, and 0.0 for those that did not meet this criterion. The subjects were divided into two groups, exposed to two contingencies of reinforcement and the extinction procedure. The groups differed from each other relative to the order of exposure to these contingencies. The experimental conditions were arranged according to an ABACA or a BABCB design, where A stood for the LAG-5
contingency, B for the RDF and C for the extinction. The results showed that (1) both contingencies produced behavioral variability, but to different extents: higher levels of variation were systematically observed under RDF schedule, whichever the order of exposure to the contingencies; (2) the condition of extinction generated a decrease in the response rate, but maintained the variability levels close to those obtained in the previous phase, with only a small interference from the reinforcement history; (3)the variability obtained under reinforcement in the last experimental phase was not affected by the previous exposure to extinction: the patterns of responding presented under LAG or RDF were typical of these schedules. These results indicate behavioral sensitivity to different reinforcement contingencies for variation, with its acquisition and maintenance controlled primarily by the contingency in effect, with little interference from the reinforcement history. Moreover, extinction induced variability, but did not interfere in its operant control. The processes of resurgence, optimization, and maximization have been considered for data analysis. Key words: operant variability; induced variability; extinction; behavioral history; positive reinforcement; animal behavior, rats

1 PB

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

1 PB

Enviado por

Direitos autorais:

Formatos disponíveis

ACTA COMPORTAMENTALIA Vol. 17, Nm. 1 pp.

Efeitos de diferentes histrias de reforamento e extino sobre a variabilidade comportamental(*)

Marcos Takashi Yamada e Maria Helena Leite Hunziker

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

(15 Sessoes) (15 Sessoes) (10 Sessoes) (5 Sessoes) (5 Sessoes)

Resumo do procedimento utilizado no Experimento.

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

16 VARIABILIDADE COMPORTAMENTAL 2009

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

MARCOS TAKASHI YAMADA E MARIA HELENA LEITE HUNZIKER

Você também pode gostar