Você está na página 1de 50

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ

ESCOLA DE CIÊNCIAS DA VIDA


CURSO DE PSICOLOGIA

MARIA LUÍZA ELIAS BATISTA


PAULA MANSUR FERREIRA DOS SANTOS
THAIS AGUIAR SANTOS

MANUTENÇÃO E ENFRAQUECIMENTO DA RPB DE UM SUJEITO VIRTUAL

CURITIBA
2020
MARIA LUÍZA ELIAS BATISTA
PAULA MANSUR FERREIRA DOS SANTOS
THAIS AGUIAR SANTOS

MANUTENÇÃO E ENFRAQUECIMENTO DA RPB DE UM SUJEITO VIRTUAL

Relatório apresentado na disciplina de Análise


Experimental do Comportamento no curso de
Graduação em Psicologia da Pontifícia
Universidade Católica do Paraná como forma
parcial de avaliação da disciplina.

Orientadora: Prof.ª Antoniela Yara M. da Silva


Dias

Curitiba, novembro de 2020


RESUMO
O objetivo dos procedimentos de manutenção do RPB é comparar o desempenho do
sujeito sob esquemas de reforçamento intermitente. Para os experimentos de
esquemas de reforçamento intermitente foram utilizados com base no Software Sniffy
Pro 3.0. O objetivo dos procedimentos de enfraquecimento da resposta é comparar o
desempenho do sujeito sob os procedimentos: extinção pós CRF, extinção pós
intermitente, extinção com punição leve e extinção com punição severa. O
experimento do Intervalo Fixo constou de três procedimentos: IF2 segundos, IF 4
segundos e IF 6 segundos, iniciou-se com o arquivo de CRF e o software foi
programado para liberar reforço a cada 2 segundos no IF2s, sendo encerrado após o
sujeito receber 100 reforços; foi salvo e a partir desse arquivo o reforço foi programado
para ser liberado a cada quatro segundos no IF4s, sendo encerrado após a
decorrência de 5 minutos, a partir desse procedimento o reforço foi programado para
ser liberado após um intervalo de tempo de 6 segundos no IF 6s, encerrado após ter
completado 10 minutos de duração. Já no experimento de Intervalo Variável foi
aplicado mais três procedimentos: IV 2 segundos, IV4 segundos e IV 6 segundos,
iniciando com o arquivo de CRF, o software foi programado para a liberação de reforço
em intervalo médio de 2 segundos no IV2, sendo este encerrado após o animal
receber 100 reforços; foi salvo e a partir desse arquivo o reforço foi organizado para
ser liberado a cada 4 segundos no IV4, o qual foi encerrado após 5 minutos; através
desse procedimento, o reforço foi programado novamente e dessa vez foi para que
ele fosse liberado depois de um intervalo de tempo de 6 segundos no IV6, que por
sua vez, teve seu término depois de ter completado 10 minutos de duração. O
experimento de razão fixa foi realizado com 3 procedimentos: RF2, RF4 e RF6.
Iniciando-se também com o arquivo do CRF e através disso, na RF2 o software foi
programado para a liberação de reforço após a emissão fixa de 2 RPB, o qual foi
encerrado após o sujeito receber 100 reforços; foi salvo e a partir desse arquivo o
software foi estruturado para os reforços serem liberados depois da emissão continua
de 4 RPB na RF4, este foi encerrado após 5 minutos de duração; através do
procedimento anterior, o reforço foi organizado novamente para a RF6 e dessa vez
eles eram liberados após a emissão fixa de 6 RPB, esse teve seu término depois de
um período de 10 minutos. O experimento de razão variável foi realizado com 3
procedimentos: RV2, RV4 e RV6, iniciou-se com o arquivo do CRF e no RV2 o
software foi programado para a liberação de reforço após a emissão média de 2 RPB,
este foi encerrado após o sujeito receber 100 reforços; foi salvo e a partir desse
arquivo o software foi programado para liberar reforços depois da emissão média de
4 RPB para a RV4, que por sua vez foi encerrada depois de 5 minutos de duração; o
software foi programado novamente a partir do procedimento anterior para a RV6 e
dessa vez ele foi organizado para liberar reforços após a emissão média de 6 RPB,
sendo encerrado após 10 minutos de duração. Para os experimentos de extinção foi
utilizado o Software Sniffy Pro 3.0. No experimento de extinção pós CRF, o software
foi programado para a não liberação de reforço após a emissão de RPB, o critério de
encerramento foi a duração máxima de 25 minutos de experimento e que pelo menos
nos últimos minutos o sujeito não emitisse RPB; já no procedimento de extinção pós
intermitente a programação ocorreu para não gerar reforço após a emissão da
resposta e seu critério de encerramento foi 25 minutos; o experimento de extinção
com punição leve foi programado para a liberação de um choque elétrico suave na
emissão da primeira resposta para as demais não gerarem reforço, seu critério de
encerramento foi a duração de 25 minutos; por último, o experimento de extinção com
punição severa foi programado para a liberação de um choque de alta intensidade na
emissão da primeira resposta para as demais não gerarem reforço, seu critério de
encerramento foi a duração de 15 minutos.
Palavras-chave: Extinção. Punição. Experimento. Procedimento. Critério.
Encerramento.

O reforço é um fenômeno dado para explicar uma situação que torna um


determinado comportamento provável de acontecer novamente, ou seja, é um padrão
de respostas que tendem e/ou podem ser repetidas em contextos semelhantes
(Alloway, Wilson & Graham, 2006 apud Skinner, 1938). Esse procedimento se divide
em duas vertentes muito trabalhadas na análise do comportamento, uma vez que
estas se atentam com o intuito de reforçar um comportamento eliminando um
estímulo, seja este aversivo ou não. A primeira vertente se baseia no reforço positivo
que consiste em uma dada consequência – isto é, um reforçador será apresentado –
para um determinado comportamento que o fará ser repetido outras vezes em um
futuro, já o reforço positivo, sendo a outra vertente, é quando há a retirada de algum
estímulo ruim que permitirá o sujeito reforçar e repetir novamente tal comportamento
desejado. Basicamente, o fenômeno reforço significa o que é no seu literal, em outros
termos, é aquilo que possui como finalidade aumentar a frequência de um
comportamento para que este possa ser reproduzido em circunstâncias futuras
(Alloway, Wilson & Graham, 2006). De acordo com Moreira e Medeiros (2019), o
comportamento é controlado pelas suas consequências, sendo estas reforçadores
que aumentam a probabilidade de uma situação ocorrer novamente e os autores
ressaltam que esses acontecimentos fazem parte do cotidiano de cada um. Na parte
experimental, o rato dentro de uma gaiola é a fonte de observação do examinador e
este sujeito está privado de alimento, uma vez que o reforço só será liberado quando
o rato acionar a barra. Quando ele pressionar a barra e receber o alimento, o
comportamento de pressão à barra irá ser adicionado ao seu repertório e virá ter uma
maior probabilidade de acontecer novamente, já que o sujeito recebe reforços (pelotas
de alimento) cada vez que emite o comportamento em questão (Catania, 1999).
Um esquema de reforçamento reside em um processo de conhecimento no
qual é necessário para saber quando uma resposta, ou mais de uma resposta,
consequentemente ocasionam um reforçamento, ou seja, este indica qual a
característica das respostas reforçadoras ou não reforçadoras. Seguindo a mesma
linha de raciocínio, o conceito dito em questão se divide em duas vertentes, sendo
estas: esquema de reforçamento contínuo e esquema de reforçamento intermitente.
O CRF – esquema de reforçamento contínuo e o mais simples em relação aos outros
– é um procedimento incluso no reforçamento positivo que consiste em reforçar todas
as respostas emitidas pelo organismo. Nesse esquema, a ocorrência das respostas
é, consideravelmente, rápida, sem um intervalo de tempo. O processo no qual o
esquema de reforçamento se constitui baseia-se na contagem das respostas emitidas
versus na medição do tempo em que estas respostas são emitidas (B. F. Skinner &
C. B. Ferster, 1957).
Uma das diferenças do esquema de reforçamento contínuo para o esquema de
reforçamento intermitente, além de que este não reforça todas as respostas, é a
facilidade do desenvolvimento de uma extinção, ou seja, o intermitente possui a
capacidade de extinguir uma resposta, já o contínuo não. Isso se dá pelo fato de que
a intermitente, muitas vezes, deseja reforçar somente alguns comportamentos e não
todos e, neste caso, a sequência destes comportamentos tendem a aumentar em
comparação ao reforço contínuo (Alloway, Wilson & Graham, 2006). O esquema de
razão é um dos tipos de arranjos do esquema de reforço intermitente e consiste em
fazer com que um organismo emita uma quantidade específica de respostas a fim de
reforça-las, além disso, há também o esquema de intervalo que é parecido com o
esquema de razão, entretanto, uma resposta só será reforçada depois de algum
intervalo de tempo, isto é, neste caso a quantidade de respostas não é importante.
Um esquema de intervalo pode ser variável do mesmo modo que um esquema de
razão poderá ser. A única distinção entre os dois tipos variáveis é que em relação ao
esquema de intervalo o que varia é o período e no esquema de razão o que varia são
as respostas. Em contrapartida, ainda existem mais duas formas de categorizar os
esquemas, as quais são: esquema de intervalo fixo que constitui-se pelo fato de um
comportamento só ser reforçado após um período de tempo o qual foi exposto, ou
seja, um indivíduo passa a semana inteira afadigado; quando chega sexta-feira este
se anima – neste caso, a resposta do sujeito foi, e será, reforçada somente e/ou perto
do final da semana. E o esquema de razão fixa consiste em uma quantidade específica
de emissão de respostas para que estas sejam reforçadas (A. C. Catania, 1999).
Catania (1999) cita alguns exemplos de esquemas de reforçamento diferenciais
que dão ênfase na velocidade em que a resposta é emitida. Dentre estes exemplos
está o reforçamento diferencial de altas taxas de respostas, o DRH, que consiste em
uma ampla quantidade de respostas rápidas para adquirir o reforço em um
determinado intervalo de tempo, no entanto, o autor afirma que é um procedimento
difícil de lidar. Outro esquema é o DRL que é um reforço diferencial de taxas baixas,
uma vez que as respostas se baseiam em pausas longas e o reforço é apresentado
ao sujeito com base no “espaçamento temporal”, devido a esse fato, a taxa de
responder consequentemente diminui. O reforço diferencial de outro comportamento
(DRO) consiste em reforçar todos os comportamentos exceto aquele que deseja
diminuir a frequência. Já o DRP (reforço diferencial de responder espaçado) é um
esquema que estabelece limites inferiores e superiores e foca no comportamento
entre o intervalo de tempo de uma resposta emitida anteriormente, formando um ritmo.
Por fim, a contenção limitada (LH) dispõe de um reforçador que só permanece por um
período de tempo limitado podendo dar um aumento nas taxas de respostas, no
entanto, como o reforçador não se apresenta por muito tempo, isto é, com uma
contenção muito curta, as respostas podem diminuir até que não se responda mais
(Catania, 1999).
De acordo com Moreira e Medeiros (2019), a generalização pode ocorrer da
forma respondente e operante. A primeira delas se dá ao assimilar um estímulo neutro
a um estímulo previamente condicionado fisicamente similar – quanto a cor, tamanho,
textura, forma etc. –, dessa forma, o indivíduo passa a eliciar a resposta condicionada
referente. As propriedades da resposta a ser eliciada, isto é, sua magnitude, duração
e latência, vai depender do quão semelhante é o novo estímulo com aquele já
condicionado, quanto mais semelhante for, maior será a magnitude e duração da
resposta, e menor será a latência. (Moreira & Medeiros, 2019). Um exemplo da
generalização respondente é quando uma pessoa, ao ser aranhada por um gato
branco de porte médio, passa a ter medo de animais ou até estímulos que sejam
similares ao gato que a aranhou, como por exemplo um outro gato, coelho branco,
cachorro branco com tamanho similar, ou até mesmo se ouvir o sibilar de um outro
felino.
A generalização de estímulos operante é bem similar à respondente, a
diferença é que nesta o indivíduo emite uma resposta que fora reforçada no passado
na presença de um estímulo semelhante fisicamente do estímulo discriminativo que
foi originalmente reforçada, ou seja, o sujeito emite uma mesma resposta para
estímulos parecidos com aquele que foi anteriormente treinado. Como Ramos-
Cerqueira et al. (1999) exemplifica ao relatar o mesmo padrão de respostas de uma
pessoa ao submeter-se aos outros em dois contextos diferentes, no relacionamento
amoroso e no trabalho. Tal como ocorre no respondente, a probabilidade de o sujeito
emitir a mesma resposta vai depender do quão parecidos fisicamente for o novo
estímulo com aquele que foi previamente reforçado, quanto mais semelhante, maior
a probabilidade. A generalização é um processo muito importante para a nossa
aprendizagem, assim como traz Moreira e Medeiros (2019) ao defender que “A
generalização é um processo importante porque as respostas tornam-se prováveis
sem a necessidade de um procedimento específico de treino discriminativo delas na
presença de cada novo estímulo apresentado.”. Portanto, sendo a generalização
respondente ou operante, ela basicamente ocorre quando um estímulo adquire um
controle sobre uma determinada resposta, o qual é compartilhado por outros estímulos
com propriedades comuns (Skinner, 2003).
De maneira oposta à generalização, a discriminação, conforme Moreira e
Medeiros (2019) descrevem, se caracteriza pela eliciação/emissão de respostas
específicas na presença de estímulos específicos. Como traz Skinner (2009), esse
processo comportamental é consequente do reforço de uma resposta apenas quando
determinada propriedade estiver presente, assim, esta resposta se tornará mais
específica e será mais propensa de ocorrer quando aquela propriedade estiver
presente. Pelo fato de representar uma resposta mais específica, a discriminação é
evidenciada quando a mudança de um estímulo/contexto resulta na mudança de
comportamento do indivíduo. Um exemplo de laboratório é visto quando a resposta
do rato de pressão à barra ocorre apenas quando a luz está acesa e não apagada –
no caso a luz acesa e apagada funcionam cada uma como um estímulo discriminativo.
Ou então no caso de uma adolescente se comportar diferentemente com seus amigos
e com seus pais – amigos e pais funcionam cada um como um estímulo discriminativo
(Baum, 2006).
A privação e a saciação são compreendidas como operações estabelecedoras,
isto é, operações que mudam a condição/efetividade da consequência de um estímulo
como reforçador ou punidor. Catania (1999) afirma que no caso da saciação, ocorre a
oferta constante e em grande quantidade de um reforçador, resultando na redução de
sua efetividade como reforçador e, assim, ocasionando o enfraquecimento da emissão
do comportamento responsável por gerar a recompensa, naquele momento. Esta
operação pode acontecer conforme as respostas são reforçadas ou programadas
independente de ocorrer uma resposta (Catania, 1999).
O método da saciação é comumente utilizado para controlar e eliminar
comportamentos indesejáveis, como eliminar o comportamento de birra de uma
criança ao lhe dar todo o doce que ela puder comer. No entanto, apesar de o controle
do comportamento da criança através do reforçamento com doces funcionar, só terá
resultados momentâneo, dessa forma, recomenda-se a oferta de poucos doces em
diferentes ocasiões (Skinner, 2003). Um exemplo das operações estabelecedoras
citadas acima – privação e saciação – é vista no caso de uma pessoa que gosta muito
de ir à praia, mas ficou sem ir há alguns meses. Quanto esta chega na praia, o
ambiente tem um efeito reforçador muito grande, pois ficou houve uma privação do
evento durante um tempo, no entanto se essa pessoa ficar durante 3 dias seguidos,
o dia todo, na praia, ocorrerá a saciação do evento, e o ambiente perderá o grande
efeito reforçador que tinha – pelo menos momentaneamente.
No que se trata de enfraquecimento da resposta de pressão a barra, é
necessário a análise do desempenho do sujeito sob 4 experimentos: extinção pós
CRF, extinção pós intermitente, extinção com punição leve e extinção com punição
severa. Segundo Catania (1999) a suspensão de um reforço é caracterizada como
extinção, isso faz com que os comportamentos retornem aos seus níveis iniciais,
comprovando que os efeitos dos reforços são temporários, ou seja, sem a extinção os
efeitos do reforçamento seriam eternos, por isso ela é de extrema importância para
que assim, as respostas determinadas por reforçamento não durem a vida toda. Ainda
mais, a extinção diz respeito ao processo de desaparecimento de uma resposta do
repertório de um indivíduo. Em relação ao modelo respondente, a extinção acontece
quando um estímulo condicionado para de eliciar uma certa resposta (Moreira &
Medeiros 2019). Um exemplo claro de extinção é a retirada do comedouro quando
existe reforçamento alimentar, assim, a conexão entre as respostas e o comedouro
são interrompidas (Catania, 1999).
Visto isso, a primeira forma de extinção citada no parágrafo anterior ocorre
quando o CRF se firma, ela é caracterizada como sendo a extinção pós CRF que
segundo Gomide e Dobrianskyj (1993) visa saber o que acontece com a frequência
da resposta de RPB logo após a suspensão da condição experimental que tem como
função promover o aumento ou aparecimento do comportamento e assim mantê-lo,
ou seja, é saber o que ocorre com a frequência da resposta de pressionar a barra
quando um reforço logo após a resposta não é apresentado. Já a extinção pós
reforçamento intermitente compara a taxa de resposta desse procedimento com a taxa
de resposta de extinção após reforçamento contínuo (Gomide e Weber, 2003). Essa
extinção, por sua vez, causa efeitos mais fracos. Nela, não são vistas respostas
emocionais nem o aumento repentino na frequência de respostas no início da
extinção. Sendo assim, a redução na frequência de resposta é mais lenta (Moreira &
Medeiros 2019). A terceira forma de extinção é a com punição leve que tem como
característica um choque inicial com baixa intensidade que reduz a frequência do
comportamento do sujeito (Alloway & Wilson Graham, 2006). Vale ressaltar que ela
não acaba eternamente com o processo de extinção operante, apenas o prorroga para
mais tarde (J. R. Millenson, 1967). Caso o objetivo focasse em eliminar totalmente a
pressão a barra, não seria cabível usar esse método, visto que seu efeito é
infrequente. A quarta maneira de extinção é a com punição severa, nela o sujeito
recebe um choque com alta intensidade que reduz o comportamento do mesmo em
pressionar a barra (Gomide, P. Weber., L., 2003). Essa extinção, por sua vez faz com
que o indivíduo sinta medo em pressionar a barra novamente, extinguindo assim seu
comportamento.
Outro mecanismo de enfraquecimento de resposta é o de esquecimento, onde,
segundo afirma Skinner (2003), perde-se o efeito do condicionamento somente
através da passagem do tempo, além de que, para que ele ocorra é necessário que
se evitem ocasiões em que aquele comportamento era emitido. Esse processo é
comumente confundido com o processo de extinção, no entanto no primeiro caso o
enfraquecimento da resposta se dá pela passagem do tempo, enquanto a segunda
ocorre quando a resposta é emitida sem que seja reforçada (Skinner, 2003). Pelo fato
de depender do tempo para que um comportamento seja enfraquecido, esse processo
geralmente exige um maior tempo para acontecer do que o que a extinção exige, por
exemplo. De acordo com Skinner (1969), além de já ser um processo mais demorado,
a velocidade que ocorre o esquecimento é também influenciada pela intensidade da
aquisição daquele comportamento. Dessa forma, se uma resposta foi muito bem
treinada, é provável que demore mais para ser esquecida que aquelas em que o
treinamento ocorreu de maneira inferior.
A punição pode ser apresentada de duas maneiras: a positiva e a negativa. A
positiva consiste em adicionar um estímulo aversivo e a negativa se baseia na retirada
de um estímulo bom, que reforça o comportamento. Ambas as descrições de punição
diminuem a probabilidade de o comportamento acontecer novamente, já que no seu
significado literal: elas punem. O uso desse fenômeno possui um efeito imediato em
relação à resposta desejada, no entanto, a punição pode trazer graves efeitos
emocionais no sujeito que podem prosperar pela sua vida inteira. O indivíduo que
passou por experiências punitivas costuma se sentir inseguro e culpado todo tempo
além de, quando presenciam a punição e sabem o que irá vir depois, eliciam respostas
de choro, palpitações, taquicardia bem como tremores. (Moreira & Medeiros, 2019).
Sidman (2009), em sua obra “Coerção e suas Implicações”, discute abrangentemente
sobre os efeitos colaterais que a punição traz e dá o exemplo de um cachorro que
está aprendendo a sentar quando seu dono pede. Quando ocorre o comportamento
desejado, o qual seria sentar, o cachorro recebe comida como forma de um reforçador
aumentando a probabilidade futura dele se sentar sob um comando. No entanto, se
quando o dono manda o cachorro sentar e ao invés desse comportamento, ele pula,
o dono não fica satisfeito e joga a comida fora – representando uma punição negativa,
uma vez que está retirando um estímulo bom, mas, diante desse fenômeno, o
cachorro poderá diminuir o comportamento de pular. Ademais, se para que o cachorro
emita o comportamento de sentar sob um comando, o dono o batesse, isso serviria
como punição positiva, pois está adicionando um estímulo aversivo no ambiente e o
animal sentaria a fim de cessar com a coerção que está recebendo. Esse exemplo
que Sidman apresenta mostra como a punição não tem o comprometimento de
ensinar igualmente um reforçador positivo faz.
Catania (1999) faz menção de algumas situações que envolvem estímulos
aversivos primários/naturais e secundários/condicionados da punição. Em um
estímulo aversivo primário/natural pode-se encontrar uma resposta fisiológica do
sujeito, como por exemplo, da pele do rato na qual pode perder sua resistência quando
entra em contato com o choque elétrico, já em um estímulo aversivo
secundário/condicionado o rato pode evitar receber choque elétrico, uma vez que o
animal aprendeu que a fonte de choque o machuca podendo também pressionar a
barra com sua parte das costas onde se localiza a maior parte dos pelos que servem
como um isolante. O autor descreve e demonstra uma curva característica de um
experimento de punição com um rato que consiste em uma frequência igual a zero de
respostas de pressão à barra no momento em que o sujeito leva um choque elétrico.
Após essa experiência punitiva, a curva se mantém em um “nível baixo e constante”,
no entanto, se o animal não recebe mais choques, ocorre a recuperação e a curva da
frequência torna-se maior.
Todorov (2001) cita Azrin e Holz (1966) onde estes apresentaram 14
circunstâncias necessárias para que a punição obtenha um sucesso no cancelamento
de um comportamento:
“1. Não pode haver fuga possível do estímulo punitivo. 2. O estímulo deve
ser tão intenso quanto possível e, (3) tão frequente quanto possível. 4. A
punição tem que ser imediata. 5. A intensidade não pode ser aumentada
gradualmente – desde a primeira aplicação, o estímulo tem que ser tão
intenso quanto possível. 6. Se a intensidade for baixa, os períodos de
punição devem ser curtos. 7. A punição não deve ser associada à
apresentação de um estímulo reforçador positivo, para não adquirir
propriedades de estímulo discriminativo. 8. A punição deve sinalizar um
período de extinção para a resposta. 9. O grau de motivação para a
resposta deve ser diminuído. 10. A frequência de reforço positivo para a
resposta deve ser diminuída. 11. Uma resposta alternativa à que é punida
deve estar disponível. 12. Se não há resposta alternativa na situação, o
sujeito deve ser levado a outra situação com acesso ao estímulo
reforçador. 13. Se um estímulo aversivo primário não pode ser aplicado
após a resposta, pode-se usar um estímulo aversivo condicionado. 14.
Em último caso, punição pode ocorrer pela apresentação de timeout ou
pelo aumento no custo da resposta.” (Todorov, 2001 apud Azrin & Holz,
1966).

1. OBJETIVOS

O objetivo do experimento de razão fixa foi observar o desempenho do sujeito


para que este emitisse um número fixo de respostas de pressão à barra a fim de
receber o reforço (pelotas de alimento). O número de RPB neste procedimento é fixo
e imutável, uma vez que a partir de uma sequência determinada de respostas o sujeito
é apresentado ao seu estímulo reforçador (Moreira & Medeiros, 2019).
O objetivo do experimento de razão variável foi observar o desempenho do
sujeito de receber o estímulo reforçador após um número variável de respostas de
pressão à barra. Neste procedimento, o comportamento de pressionar a barra é
mutável de um reforço para o outro, ou seja, em um momento do experimento o sujeito
aperta 3 vezes a barra e recebe pelotas de alimento, no entanto, depois, pressiona 8
vezes para que assim ele seja apresentado ao reforço (Alloway, Wilson & Graham,
2006).
O objetivo do experimento de intervalo fixo foi observar o desempenho do rato
de pressionar a barra após um determinado período de tempo para receber a pelota
de alimento. Neste procedimento, o período de tempo é sempre o mesmo para que o
sujeito possa ser apresentado ao estímulo reforçador (Alloway, Wilson & Graham,
2006).
O objetivo do experimento de intervalo variável foi observar o desempenho do
rato de pressionar a barra após um período de tempo mutável para receber a pelota
de alimento. Neste procedimento, o período de tempo varia de um reforço para o outro,
ou seja, é uma média temporal que o sujeito tem entre o pressionar a barra e a
apresentação do estímulo reforçador (Alloway, Wilson & Graham, 2006).
O experimento da extinção pós CRF objetiva proporcionar a observação do
efeito que a suspensão do reforçamento gera sobre a frequência de respostas de
pressão à barra, até que esta frequência seja a mesma da encontrada no nível
operante (Gomide & Dobrianskyj, 1993), partindo do ponto que o rato se encontra
condicionado pelo esquema de reforçamento contínuo à pressionar a barra e receber
a pelota de alimento, a qual possui efeito reforçador.
Assim como descrevem Gomide e Dobrianskyj (1993), o objetivo do
experimento da extinção pós-intermitente é observar o efeito que o esquema de
reforçamento intermitente gera sobre a taxa de resposta quando suspendido o reforço,
e, assim, comparar o resultado obtido com aquele encontrado no experimento de
extinção pós CRF. Presume-se que a taxa de respostas seja significativamente maior
no pós-intermitente do que nas do pós CRF.
O objetivo do experimento de extinção com punição severa é a observação de
que a partir da aplicação de um choque com alta intensidade a frequência do
comportamento do rato em pressionar a barra seja diminuída (Gomide, P. & Weber,
L., 2003).
O objetivo do experimento de extinção com punição leve é observar o impacto
que apenas um choque com baixa intensidade pode causar, reduzindo assim a
frequência do comportamento do sujeito em pressionar a barra (Alloway, Wilson &
Graham, 2006).

2. MÉTODO

SUJEITO

“O programa Sniffy Pro permite que você prepare e execute uma grande
variedade de experimentos de condicionamentos clássicos e operante, e lhe permite
colher e dispor dados de uma maneira que simula o modo como os psicólogos
trabalham em seus laboratórios. Além disso, em razão de o programa simular e
mostrar simultaneamente alguns dos processos psicológicos que os psicólogos
acreditam ser empregados pelos animais (e pelas pessoas), o Sniffy Pro apresenta-
lhe alguns aspectos da aprendizagem que você não poderia observar caso estivesse
trabalhando com um animal vivo. Em um rato real, a aprendizagem é o resultado de
interações bioquímicas entre bilhões de neurônios no cérebro. Como consequência
desses processos fisiológicos, os animais adquirem informações a respeito de
eventos no mundo externo e a respeito de como seu comportamento afeta esses
eventos. (...) Até certo ponto, o relacionamento entre processos neurofisiológicos e
explicações psicológicas da aprendizagem é análogo ao relacionamento entre a
atividade elétrica nos circuitos eletrônicos de seu computador e os processos
psicológicos simulados que formam a base para o comportamento de Sniffy. Seu
computador contém o equivalente a diversos milhões de transistores que, de certo
modo, são análogos aos neurônios no cérebro do rato. O programa Sniffy usa o
conjunto de circuitos eletrônicos de seu computador para simular os mecanismos
psicológicos que muitos psicólogos utilizam para explicar a aprendizagem em animais
e pessoas reais.” (Alloway, Wilson & Graham, 2006)

LOCAL

Sala de aula do bloco 3 da Pontifícia Universidade Católica do Paraná (PUC-PR).

INSTRUMENTOS/APARELHOS

Para a realização dos experimentos foram utilizados os seguintes


instrumentos/aparelhos:

a) laptop da marca Dell modelo latitude 3470, número do modelo 06F2 com
processador core i5 e armazenamento de 465 GB de identificação 1;
b) cronômetro através do celular Apple modelo 7;
c) cronometro através do celular Apple modelo XR;
d) software Sniffy 3.0 Pro.

PROCEDIMENTOS

O experimento de intervalo fixo de 2 segundos iniciou-se ao clicar em file >


open e então, abrir o experimento de CRF que foi realizado anteriormente. Após essa
etapa, clicou-se em design operant experiment > fixed e selecionamos a opção de 2
segundos. Foi esperado que o sujeito emitisse 100 reforços de pressão a barra. Para
encerrar este experimento foi preciso clicar em file > save as > save in e optamos em
salvar no pendrive bem como na pasta do notebook. O arquivo foi denominado como
“FI2”.
O experimento de intervalo fixo de 4 segundos foi iniciado ao clicar em file >
open e ao abrir o arquivo de FI2. Para configura-lo nas expectativas recomendadas
clicamos em design operant experiment > fixed e selecionamos a opção de 4
segundos. Este processo teve como critério observar o sujeito durante 5 minutos. Para
encerrar este experimento, foi preciso clicar em file > save as > save in e salvar no
pendrive e na pasta do notebook o arquivo chamado “FI4”.
O experimento de intervalo fixo de 6 segundos se iniciou ao clicar em file >
open e selecionar o arquivo anterior de intervalo fixo de 4 segundos. Configuramos
esse experimento clicando em design operant experiment > fixed e colocamos a opção
de 6 segundos. O critério foi observar o rato durante 10 minutos de experimento. Para
encerrá-lo, clicou-se em file > save as > save in e optamos em denomina-lo como
“FI6” e salvá-lo no pendrive e na pasta do notebook.
O experimento de intervalo variável de 2 segundos foi iniciado ao clicar em file
> open a fim de abrir o procedimento de CRF feito anteriormente. Após isso, clicamos
em design operant experiment > variable e aplicamos a opção de 2 segundos. Este
experimento obteve como critério observar o sujeito até que se completasse 100
reforços. Finalizando essa etapa, foi preciso clicar em file > save as > save in e salvar
no pendrive bem como na pasta do notebook com o nome de “VI2”.
O experimento de intervalo variável de 4 segundos iniciou-se ao clicar em file
> open e ao abrir o experimento de VI2 realizado anteriormente. Posteriormente,
selecionamos o design operant experiment > variable e aplicamos a opção de 4
segundos. O critério imposto foi com a finalidade de observar o rato durante 5 minutos.
Encerrando este experimento, clicamos em file > save as > save in e salvamos no
pendrive bem como na pasta do notebook e, por fim, denominamos de “VI4”.
O experimento de intervalo variável de 6 segundos foi iniciado ao clicar em file
> open bem como ao abrir o experimento anterior denominado VI4. Configuramos este
processo clicando em design operant experiment > variable > 6 > seconds. Neste
procedimento, o critério foi observar o sujeito durante 10 minutos. Encerrando-o
selecionamos a aba file > save as > save in e optamos em salvar no pendrive e na
pasta do notebook. O arquivo foi denominado de “VI6”.
O experimento de razão fixa de 2 respostas foi iniciado ao clicar em file > open
a fim de abrir o experimento CRF realizado anteriormente. Configuramos ao clicar na
aba de design operant experiment > fixed e aplicar a opção de 2 respostas. Esse
procedimento dispôs de um critério de obter 100 reforços do sujeito e, ao encerrar,
tivemos que selecionar a opção file > save as > save in salvando-o com o nome de
“FR2” e guardando o arquivo no pendrive e na pasta do notebook.
O experimento de razão fixa de 4 respostas iniciou-se ao clicar em file > open
e ao abrir o arquivo de FR2 configuramos o procedimento na aba de design operant
experiment > fixed > 4 > responses. O critério deste experimento foi observar o rato
durante 5 minutos. Ao finalizar, selecionamos file > save as > save in para salvá-lo no
pendrive bem como na pasta do notebook com o nome de “FR4”.
O experimento de razão fixa de 6 respostas foi iniciado clicando em file > open
para abrir o experimento de FR4 realizado anteriormente. Para iniciar, selecionamos
a janela de design operant experiment > fixed para configurar 6 respostas. Este
procedimento obteve critério de observar o sujeito por 10 minutos. Após isso, o
experimento foi encerrado clicando em file > save as > save in a fim de salvar na pasta
do notebook além do pendrive com o nome de “FR6”.
O experimento de razão variável de 2 respostas iniciou-se ao clicar na aba file
> open a fim de abrir o arquivo de CRF realizado anteriormente. Neste procedimento,
configuramos em design operant experiment > variable > 2 > responses, no qual o
critério esperado foi de observar o sujeito emitir 100 reforços. Ao finalizá-lo, clicamos
em file > save as > save in para salvar no pendrive bem como na pasta do notebook
e denominamos de “VR2”.
O experimento de razão variável de 4 respostas foi iniciado ao clicar na aba file
> open para abrir o exercício de VR2 realizado anteriormente. Em seguida, para
configurar o experimento, tivemos que selecionar a janela de design operant
experiment > variable e clicamos na opção de 4 respostas para poder observar o rato
durante 5 minutos. Após finalizar o procedimento, foi preciso clicar em file > save as
> save in a fim de salvar no pendrive e na pasta do notebook com o nome de “VR4”.
O experimento de razão variável de 6 respostas iniciou-se clicando na aba file
> open para poder abrir o experimento feito anteriormente, o VR4. Configuramos ao
clicar na aba de design operant experiment > variable > 6 > responses a fim de
observar o sujeito durante 10 minutos de experimento. Ao finalizar, clicamos
novamente na aba file > save as > save in para salvá-lo com o nome de “VR6” e
guardá-lo no pendrive bem como na pasta do notebook.
O experimento de extinção pós CRF foi iniciado ao abrir o software Sniffy Pro
3.0. Para iniciar este procedimento, clicamos na aba file > open e abrimos o arquivo
de CRF que havíamos realizado anteriormente, diante disso, passamos para a etapa
de clicar em design operant experiment e aplicar a opção de extinction. O critério para
o experimento de extinção foi observar o sujeito durante 15 minutos para que
possamos notar se há uma diminuição de frequência de RPB, caso o rato continuasse
pressionando a barra era preciso adicionar mais 10 minutos de observação.
Encerrando essa etapa de extinção, tivemos que clicar novamente em file > save as
> save in para poder salvá-lo no pendrive bem como na pasta do notebook com o
nome de “Extinção”.
O experimento de extinção pós-intermitente foi iniciado abrindo o software
Sniffy Pro 3.0 e clicando na aba file > open para abrir o arquivo de FR6 ou VR6, no
entanto, nosso grupo optou pela VR6. Adiante, selecionamos a aba de design operant
experiment e acionamos a opção de extinction. O critério para esse experimento foi
observar o rato durante 15 minutos sem que este continuasse com uma alta frequência
de RPB, ou seja, fosse diminuindo. Para encerrar o procedimento clicamos novamente
em file > save as > save in para salvá-lo no pendrive e na pasta do notebook com o
nome de “Extinção Intermitente”.
O experimento de extinção com punição suave foi iniciado ao abrir o software
Sniffy Pro 3.0 e clicando na aba file > open a fim de abrir o experimento de VR6.
Seguindo para a próxima etapa, abrimos a aba de design operant experiment e
selecionamos a opção de extinction > punish bar press > first press only > mute pellet
dispenser para o experimento começar. O critério do procedimento foi observar
durante 15 minutos o comportamento de RPB do sujeito diminuir, devido a punição na
primeira pressão à barra. Encerrando-o, tivemos que clicar novamente na aba file >
save as > save in para salvá-lo no pendrive bem como na pasta do notebook com o
nome de “Extinção P. Suave”.
O experimento de extinção com punição severa foi iniciado ao abrir o software
Sniffy Pro 3.0. Para inicia-lo, clicamos na aba file > open a fim de abrir o experimento
de VR6 que havíamos realizado anteriormente. Diante disso, abrimos a aba de design
operant experiment e aplicamos a opção de extinction > punish press bar > high
punishment. O critério deste procedimento foi observar o sujeito durante 15 minutos
para que seu comportamento de RPB diminuísse, uma vez que havia recebido uma
punição severa. Para encerrar, tivemos que clicar novamente na aba file > save as >
save in e optamos por salvar o arquivo no pendrive e na pasta do notebook com o
nome de “Extinção P. Severa”.

3. RESULTADOS E DISCUSSÃO

Os experimentos de esquemas de intervalo e razão obtiveram praticamente os


mesmos critérios, uma vez que o de intervalo fixo de 2 segundos e o de razão fixa
tiveram como objetivo observar o rato Sniffy até que atingissem 100 reforços de
pressão à barra, no entanto, o primeiro procedimento exigia uma resposta a cada 2
segundos e o segundo procedimento exigia um reforço a cada 2 respostas. No
experimento de FI4, a pelota de alimento só era liberada com a passagem de 4
segundos se encerrando em 5 minutos de procedimento, e no experimento de FI6 a
aplicação foi com a mesma estrutura, porém com números diferentes, ou seja, o
sujeito só receberia o reforço a cada 6 segundos durante 10 minutos de observação.
Os experimentos de intervalos variáveis obtiveram três etapas: de 2, 4 e 6
segundos. Nestes procedimentos, as pelotas de alimentos eram distribuídas
variavelmente, isto é, no esquema de intervalo variável de 2 segundos, a liberação do
reforço era dado ao animal em um intervalo médio de 2 segundos até que este
pudesse completar 100 RPBs. Já o intervalo variável de 4 segundos, a liberação do
reforço era dada em qualquer segundo deste intervalo em questão totalizando 5
minutos de experimento e no intervalo variável de 6 segundos os critérios são os
mesmos, ou seja, a pelota de alimento era liberada em qualquer período destes 6
segundos totalizando 10 minutos de experimento.
O experimento de razão fixa de 4 respostas consiste na liberação de reforço
após 4 RPBs emitidos pelo sujeito durante 5 minutos de procedimento, já o de razão
fixa de 6 respostas as pelotas de alimento eram distribuídas após a emissão de 6
RPBs com um período de 10 minutos. Os procedimentos de razão variável consistem
em liberar reforços em uma emissão média de 2, 4 e 6 RPBs. No esquema de 2
respostas o experimento durou até que o Sniffy completasse 100 reforços de pressão
à barra, no esquema de 4 respostas as pelotas de alimento eram liberadas
aproximadamente depois de 4 comportamentos emitidos resultando em 5 minutos de
procedimento e, por fim, no esquema de 6 respostas, o software programava liberar
os reforços após uma média de 6 comportamentos de RPBs totalizando 10 minutos
de experimento.
Os experimentos de extinção se dividiram em 4 procedimentos, sendo estes: o
de pós CRF, o pós-intermitente, o com punição suave e o com punição severa. O
experimento de extinção pós CRF teve duração de 25 minutos com 73 respostas de
pressão à barra acumuladas. Já o experimento de extinção pós-intermitente foi
igualmente disposto de 25 minutos de observação totalizando 276 RPBs. O
procedimento de extinção com punição suave totalizou 25 minutos com 238 respostas
de pressão à barra acumuladas e, por fim, o experimento de extinção com punição
severa totalizou somente 2 RPBs durante 15 minutos de experimento.
A Figura 1 a seguir representa uma curva de frequência acumulada das
respostas de pressão à barra (RPB) elaborada com os dados obtidos no esquema de
reforçamento intermitente de intervalo fixo (IF) e variável (IV) – 2s, 4s e 6s cada – e
de razão fixa (RF) e variável – 2, 4 e 6 cada, no decorrer de 19 minutos de experimento
de cada um dos esquemas.

RPB nos esquemas intermitentes


160
140
120
100
Frquência

80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Tempo (min)

IF IV RF RV

Figura 1 – Curva de frequência acumulada das respostas de pressão à barra (RPB) nos esquemas de
reforçamento intermitente de intervalo fixo (IF) e variável (IV) e de razão fixa (RF) e variável (RV).

Pode-se observar na Figura 1 que até o 3º minuto, as curvas apresentam uma


semelhança e, a partir daí, pode-se verificar que o esquema de reforçamento
intermitente de intervalo variável do sujeito teve a maior frequência, enquanto que na
curva de razão fixa o rato apresentou menor frequência na emissão de respostas.
Segundo Moreira e Medeiros (2019) o intervalo variável é conhecido por ser um
esquema que possui taxas moderadas e constantes de respostas e ausência de
pausas pós reforçamento. Os autores explicam que essa ausência ocorre porque as
vezes respostas ocorridas imediatamente após a apresentação do estímulo reforçador
são novamente reforçadas, mas, em outras, só serão reforçadas após longos
intervalos (pág. 131). Já o padrão comportamental de razão fixa é caracterizado por
pequenas pausas pós reforçamento e altas taxas de respostas (Moreira & Medeiros,
2019). Sendo assim, pode-se observar que os resultados para o experimento foram o
esperado, uma vez que o esquema de intervalo variável não possui pausas pós
reforçamento, influenciando assim, sua alta frequência.
Em relação a curva de aprendizagem, pode-se afirmar que está representada
de acordo com o previsto pela literatura de Moreira e Medeiros (2019), onde é
afirmado que as curvas se iniciam em um baixo nível e vão aumentando durante o
resto do experimento, pois essas acabam por representar frequências acumuladas.
A Tabela 1 foi preparada com os mesmos dados utilizados anteriormente nas
Figuras 01, 02, 03 e 04 referentes aos experimentos de reforçamento intermitente de
razão fixa e variável – de 2, 4 e 6 – e de intervalo fixo e variável – de 2, 4 e 6 segundos.
Além das frequências utilizadas, na tabela consta o tempo em minutos de cada
experimento, sendo calculada, assim, a taxa em resposta/minuto (r/min.) de cada
esquema.
Frequência Tempo (min) Taxa (r/min)
CRF - 131 30 4,37
2s 35 4 8,75
4s 30 5 6
IF
6s 36 10 3,6
Total 101 19 5,31
2s 37 4 9,25
4s 43 5 8,6
IV
6s 72 10 7,2
Total 152 19 8
2 27 4 6,75
4 20 5 4
RF
6 30 10 3
Total 77 19 4,05
2 28 4 7
4 22 5 4,4
RV
6 36 10 3,6
Total 86 19 4,52

Tabela 1 – Tabela comparativa da frequência, tempo (min.) e taxa (r/min) das respostas de pressão à
barra (RPB) nos experimentos de esquema de reforçamento intermitente de intervalo fixo (IF), intervalo
variável (IV), razão fixa (RF) e razão variável (RV).

Na Tabela 1 fica evidente um padrão nas taxas encontradas de respostas de


pressão à barra em cada um dos esquemas de reforçamento: a taxa diminui de acordo
com o aumento do tempo do intervalo/valor da razão. Como exemplo o primeiro
experimento apresentado, o de intervalo fixo (IF), as taxas encontradas de 2, 4 e 6
segundos de intervalo são 8,75 r/min, 6 r/min e 3,6 r/min, respectivamente. No entanto
os resultados encontrados no esquema de IF, especificamente, não foram os
esperados, ou seja, não são correlatos com o que a literatura diz. Segundo Moreira e
Medeiros (2019), o esquema de reforçamento de intervalo fixo produz as menores
taxas de respostas em comparação com os outros esquemas de reforçamento
intermitente (IV, RF e RV), devido ao intervalo definido para liberação da recompensa,
o que gera uma improbabilidade da ocorrência do comportamento dentro deste
intervalo – o que não geraria recompensa. Essa discrepância entre os resultados
obtidos e a literatura pode ser explicada pelo fato de que o experimento de esquema
de IF foi o primeiro a ser realizado pelas experimentadoras entre os esquemas
intermitentes, o que pode ter gerado uma ansiedade e influenciado o registro correto
dos dados. Essa incoerência com a literatura também ocorre no experimento do
esquema de intervalo variável (IV), que teoricamente era para apresentar uma taxa
de resposta moderada em comparação com os esquemas de razão, aspecto que não
é observado na tabela, mas sim que o esquema de IV possui a taxa mais alta de todos
os esquemas, possuindo a taxa total de 8 r/min, enquanto nos outros esquemas de
IF, RF e RV são 5,31 r/min, 4,05 r/min e 4,52 r/min, respectivamente (Moreira &
Medeiros, 2019). Já nos esquemas de razão os dados foram correlatos com a teoria
no que diz respeito à taxa mais alta de respostas no esquema de RV (7 r/min, 4,4
r/min e 3,6 r/min) em relação À RF (6,75 r/min, 4 r/min e 3 r/min), visto que neste
primeiro quase não há pausas pós-reforçamento, enquanto que no segundo caso essa
pausa está presente, mesmo que de maneira reduzida (Moreira & Medeiros, 2019).
Além disso, observa-se que a taxa de RPB no experimento do CRF foi de 4,37 r/min,
a qual representa uma frequência baixa em relação às outras taxas totais descritas na
tabela. Isso se deve ao fato de que para realizar os experimentos dos esquemas
intermitentes, usou-se o arquivo em que o CRF já havia sido concluído, ou seja, o rato
já havia sido condicionado para pressionar a barra e receber pelotas de alimento.
Dessa forma, a resposta de pressionar a barra se tornou muito mais fácil e rápida, não
necessitando de um tempo inicial para este assimilar os estímulos, e, assim,
resultando em uma taxa mais expressiva.
A Tabela 2 apresenta os resultados obtidos em função da taxa de frequência
no seu tempo em minutos nos esquemas de extinção da resposta de pressão a barra
pós CRF, pós intermitente, extinção com punição leve e extinção com punição severa.

Pós Com punição Com punição


Pós CRF
Intermitente suave severa
Frequência 73 276 238 2
Tempo (min.) 25 25 25 15
Taxa (r/min.) 2,92 11,04 9,52 0,13
Tabela 2 – Tabela comparativa da frequência, do tempo (min.) e da taxa (r/min.) das respostas de
pressão à barra (RPB) entre os experimentos de extinção pós CRF, extinção pós intermitente, extinção
com punição suave e extinção com punição severa

Na Tabela 2 é analisado que o experimento de extinção pós intermitente possui


a maior taxa de respostas por minuto (11,04r/min) e consequentemente, sua
frequência também é a mais alta (276), já o procedimento de extinção com punição
severa tem por sua vez as menores taxas de respostas por minuto (0,13r/min), sendo
assim, sua frequência também é a mais baixa (2). Segundo Moreira e Medeiros (2019)
um comportamento severamente punido, gera efeitos emocionais advindos do contato
com o estímulo aversivo, que eliciam no sujeito sentimento de culpa e vergonha. No
caso do experimento com punição severa o indivíduo recebe um choque com alta
intensidade que acaba servindo como um estímulo punitivo fazendo com que o rato
não emita respostas de pressão a barra durante o processo e como resultado, sua
taxa de respostas acaba sendo baixa. Já a extinção pós intermitente causa efeitos
mais fracos, nela, não são vistas respostas emocionais nem o aumento repentino na
frequência de respostas no início da extinção. Sendo assim, a redução na frequência
de respostas é lenta (Moreira & Medeiros, 2019), justificando então sua alta taxa de
respostas de pressão a barra. Por fim, a alta taxa do experimento de extinção com
punição leve é explicado pelo fato de que o choque que o sujeito recebe nesse
experimento apenas prorroga o processo de extinção operante para mais tarde
(Millenson, 1967), entende-se então que ele resiste a um estímulo aversivo depois
dos primeiros minutos e isso faz com que sua taxa aumente.
A Figura 2 apresenta a comparação entre os seguintes esquemas de extinção:
extinção pós intermitente, extinção pós CRF, extinção com punição leve e extinção
com punição severa. Os dados são apresentados a partir das respostas de pressão
acumulada em relação ao tempo em minutos. Entre eles, os experimentos de extinção
pós intermitente, extinção pós CRF e extinção com punição leve tiveram duração de
25 minutos, já o procedimento de extinção com punição severa teve duração de 15
minutos.
frequências de RPB
300
270
240
210
Frequência

180
150
120
90
60
30
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Tempo (min.)

Pós CRF Pós Intermitente Punição suave Punição severa

Figura 2 – Curva de frequência acumulada de respostas de pressão à barra (RPB) nos experimentos
de extinção pós CRF, extinção pós-intermitente, extinção com punição suave e extinção com punição
severa.

A partir da observação da Figura 2 é possível analisar que o experimento de


extinção pós intermitente teve uma média de resposta de pressão acumulada de 276,
o de extinção com punição suave de 238, o procedimento de extinção pós CRF de 73
e o de extinção com punição severa de 2. É observável que as respostas de pressão
acumulada foram maiores na extinção pós intermitente e menores na extinção com
punição severa. Moreira e Medeiros (2019) afirmam que os comportamentos com
bastante reforço são mais resistentes a extinção, sendo assim, é justificável que a
frequência tenha sido mais alta no experimento de extinção pós intermitente visto que
anteriormente o rato tinha sido reforçado pelo mesmo comportamento que estava
sendo extinto. Também é necessário analisar que não houve nenhuma punição no
procedimento de extinção pós intermitente, levando em conta que a punição pode se
basear na retirada de um estímulo bom que reforça o comportamento, tornando assim
menos provável o responder do indivíduo (Catania, 1999) é explicado então mais um
fator que interfere no acontecimento da resposta de pressão acumulada desse
experimento ter sido tão alta e a do experimento de extinção com punição severa ter
sido tão baixa. Ainda mais, a literatura de Moreira e Medeiros (2019) explica que um
estímulo aversivo causa medo ao indivíduo, então é possível dizer que devido a isso
o rato não emite RPB após o recebimento do choque com punição severa. Em relação
ao experimento de extinção com punição leve, Millenson (1967) afirma que a punição
leve não extingue eternamente processo de extinção operante, apenas o adia. Sendo
assim, entende-se o fator do porque a resposta de pressão acumulada desse
experimento foi maior do que a do procedimento de extinção com punição severa.
E, além disso, o gráfico representa uma curva característica de punição suave,
uma vez que a frequência é igual a zero de respostas de pressão à barra no momento
em que o sujeito leva um choque elétrico, isto é, logo no início do experimento. Após
essa experiência punitiva, a curva se mantém em um “nível baixo e constante”, no
entanto, após o passar do tempo, o rato não recebe mais choques e,
consequentemente, ocorre a recuperação e a curva da frequência torna-se a crescer
(Catania, 1999). Por fim, conclui-se que os resultados da figura estão de acordo com
o esperado pelas literaturas citadas.
CONSIDERAÇÕES FINAIS

Diante dos experimentos realizados ao longo do trabalho em questão, o


principal aprendizado que se estabeleceu foi que nós, seres humanos, somos muito
mais complexos que os ratos, no entanto, os princípios do behaviorismo são os
mesmos. Somos modelados pelo ambiente em que crescemos e vivemos bem como
o rato virtual em que trabalhamos. Vale ressaltar que só aprendemos quando estamos
motivados para aprender e esta situação foi devidamente compreensível nos
experimentos. Algumas vezes era necessário voltar e fortalecer um determinado
comportamento do sujeito, uma vez que a resposta que queríamos que fosse emitida
não estava fortalecida. Esse trabalho nos proporcionou um ampliamento de
conhecimento, pois obtivemos uma visão mais clara de como é condicionar e modelar
um organismo, aplicando toda a parte teórica em que aprendemos dentro de sala de
aula. Ademais, foi possível compreender como o behaviorismo trabalha com a
observação e a relação do comportamento diante de suas contingências.
FOLHAS DE REGISTRO DOS EXPERIMENTOS

INTERVALO FIXO 2s
INTERVALO FIXO 4s
INTERVALO FIXO 6s
INTERVALO VARIÁVEL 2s
INTERVALO VARIÁVEL 4s
INTERVALO VARIÁVEL 6s
RAZÃO FIXA 2
RAZÃO FIXA 4
RAZÃO FIXA 6
RAZÃO VARIÁVEL 2
RAZÃO VARIÁVEL 4
RAZÃO VARIÁVEL 6
EXTINÇÃO PÓS CRF
EXTINÇÃO PÓS-INTERMITENTE
EXTINÇÃO COM PUNIÇÃO SUAVE
EXTINÇÃO COM PUNIÇÃO SEVERA
REFERÊNCIAS

Alloway, T.; Wilson, G. & Graham, J. (2006). Sniffy: o rato virtual. São Paulo: Thomson Learning.

Baum, W. (2006). Compreender o Behaviorismo: comportamento, cultura e evolução (2ª ed., Silva, M.
T. A. et al. Trad.). Porto Alegre: Artmed. (Obra original publicada em 2005).

Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (4ª ed.). Porto Alegre,
RS: Artmed. (Original publicado em 1998).

Dobrianskyj, L.N. & Gomide P. I. C. (1993). Análise Experimental do Comportamento: Manual de


Laboratório. 3.ed.

Ferster, C. B. & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.

Gomide, P.I. C & Weber, L.N.D. (2003). Análise Experimental do Comportamento: Manual de
Laboratório. Curitiba, PR: Ed. UFPR.

Medeiros, C. Moreira, M. (2019). Princípios Básicos da Análise do Comportamento. São Paulo. Artmed

Millenson, J. R. (1967). Princípios de análise do comportamento. Brasília: Thesaurus.

Ramos-Cerqueira, A. T. A. et al. (1999). Sobre Comportamento e Cognição: aspectos teóricos,


metodológicos e de formação em análise do comportamento e terapia cognitivista (2ª ed.). Santo André,
SP: ARBytes.

Skinner, B. F. (2003). Ciência e comportamento humano (11ª ed., Todorov, J. C., Azzi, R. Trad.). São
Paulo: Martins Fontes. (Obra original publicada em 1953).

Skinner, B. F. (1969). Contingências do Reforço: Uma Análise Teórica. (Moreno, R.).

Skinner, B. F. (2009). Sobre o Behaviorismo (15ª ed., Villalobos, M. P. Trad.). São Paulo: Editora Cultrix.
(Obra original publicada em 1974).

Todorov, J. C. (2001). Quem tem medo de punição? Revista Brasileira de Terapia Comportamental e
Cognitiva vol. 3, nº 1 (pág. 37-40).

Você também pode gostar