Você está na página 1de 65

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ

ESCOLA DE CIÊNCIAS DA VIDA


CURSO DE PSICOLOGIA

MARIA LUÍZA ELIAS BATISTA


PAULA MANSUR FERREIRA DOS SANTOS
THAIS AGUIAR SANTOS

INSTALAÇÃO E FORTALECIMENTO DA RESPOSTA À BARRA DE UM RATO


VIRTUAL

CURITIBA
2020
MARIA LUÍZA ELIAS BATISTA
PAULA MANSUR FERREIRA DOS SANTOS
THAIS AGUIAR SANTOS

INSTALAÇÃO E FORTALECIMENTO DA RESPOSTA À BARRA DE UM RATO


VIRTUAL

Relatório apresentado na disciplina de Análise


Experimental do Comportamento no curso de
Graduação em Psicologia da Pontifícia
Universidade Católica do Paraná como forma
parcial de avaliação da disciplina.

Orientadora: Prof.ª Antoniela Yara M. da Silva


Dias

Curitiba, outubro de 2020


1. FUNDAMENTAÇÃO TEÓRICA

A teoria da Análise do Comportamento teve seu início real com John B. Watson,
com seu manifesto “Psicologia Como um Behaviorista a vê” (1913), que lançou uma
"teoria pura e objetivamente experimental sobre a ciência natural", baseada nos
experimentos de condicionamento de Ivan Pavlov, "com o objetivo teórico de predizer
e controlar o comportamento" (WATSON, 1913, p. 158). No mesmo artigo (1913), ele
desconsidera completamente a introspeção para a interpretação da consciência, já
que objetos físicos como estímulos - cujo termo foi base de sua teoria - formariam o
fenômeno total que um cientista deveria analisar. Os estados mentais deveriam ser
observados, e o que não fosse visto não poderia ser caracterizado como determinante
de um comportamento. Watson não negava as emoções, mas em seu pensamento
estas eram condicionadas por estímulos físicos e apenas isso.
Em uma tentativa de comprovar, realizou o teste no Pequeno Albert, a fim de
experimentar se assim como novos reflexos poderiam ser aprendidos, respostas
emocionais seguiriam o mesmo caminho. Utilizou de um estímulo aversivo para o
menino de 10 meses, o qual caracterizava um som alto, observando suas reações
perante o barulho - resposta de medo. Então, apresentou ao bebê um rato de
laboratório como estímulo neutro, e a criança demonstrou interesse pelo animal. Em
seguida, o cientista agregou os dois estímulos em um: assim que o animal aparecia
para o menino, o som estridente aversivo era lançado. Por fim, o pequeno Albert
demonstrava medo do rato sempre que este era apresentado, provando que as
respostas podem ser aprendidas e condicionadas (Moreira e Medeiros, 2019). Watson
não tem sua teoria extinta da Análise do Comportamento, mas errou ao
descaracterizar os processos mentais e tratar a Psicologia de maneira inteiramente
positivista. Sua teoria mais tarde foi definida como Behaviorismo Metodológico.
Skinner fala sobre esse processo em seu livro “Sobre o Behaviorismo” (1974):

“O próprio Watson fez importantes observações acerca do comportamento


instintivo e foi, na verdade, um dos primeiros etologistas no sentido
moderno; impressionou-se muito, porém, com as novas provas acerca
daquilo que um organismo podia aprender a fazer, e fez algumas alegações
exageradas acerca do potencial de uma criança recém-nascida. Ele próprio
considerou-as exageradas, mas, desde então, tais alegações têm sido
usadas para desacreditá-lo.”

O cientista não refutou em nenhum momento a tese proposta no início do


século, ainda afirmou tratar-se de uma “ciência nascida prematuramente”, e que o
maior erro de Watson era que “sua ciência e seus exemplos não eram incompatíveis
com um controle manipulador”. E dessa maneira, nasceu o Behaviorismo Radical,
filosofia proposta por Skinner sobre a Ciência do Comportamento (Skinner, 1974),
mais tarde definida como Análise do Comportamento, afim de estudar e compreender
como este acontece, suas funções e sua causalidade – para que o comportamento
ocorre. Mesmo reformulando a teoria mecanicista de Watson, os analistas do
comportamento admitem que Skinner herdou em seus primeiros artigos uma visão um
tanto quanto mecanicista (Hanna, Moreira 2012). Porém, Micheletto (1997/2006,
apud, Hanna, Moreira, 2012, p. 3) propõe dividir o psicólogo em duas fases: A primeira
com heranças newtonianas da Física mecânica, e a segunda composta pelas ciências
biológicas, principalmente a teoria da evolução das espécies por seleção natural de
Darwin (1859). Sua última fase por fim afasta-se da visão mecanicista e oferece uma
leitura de uma correlação funcional entre estímulo e resposta, como dois eventos
observáveis.
Além disso, o behaviorismo radical considera o mentalismo antes apresentado,
mas não de maneira metafísica, como se fosse algo inalcançável para observação.
Skinner (1974) explica que, enquanto o Behaviorismo Metodológico utiliza
“exclusivamente de acontecimentos externos antecedentes” desviando da “auto-
observação e autoconhecimento”, o Behaviorismo Radical “não insiste na verdade por
consenso e pode, por isso, considerar os acontecimentos ocorridos no mundo privado
dentro da pele. Não considera vai acontecimentos inobserváveis e não os descarta
como subjetivos." Para o autor, o que é sentido não é uma parte imaterial da
consciência, mas “apenas o corpo do próprio observador”, que ao interagir com o
ambiente é modificado por este, e o contrário acontece também. Outra contribuição
da filosofia do comportamento é a análise das consequências dessa interação, e como
estas condicionam o comportamento, já que, Para Skinner (1953/1998, apud Hanna,
Moreira, 2012, p. 15), a ciência deve ser utilizada para prever ações e assim evitá-las
ou mantê-las. De nada adianta entender o motivo de um suicídio, mas não poder
identificar potenciais suicidas.
A seleção das consequências se dá por três níveis de causalidade: filogenética,
ontogenética e cultural, cada uma com seu diferente impacto, mas complementares.
"São as contingências entrelaçadas, ou os comportamentos sociais, que permitem
aos indivíduos humanos agir sobre o ambiente e serem afetados por ele de forma que
não seriam possíveis de outro modo” (Andery, M.A . Sério, T.M. 1999). Skinner (1984)
afirma que "não se nega a importância, qualquer que seja nossa filosofia do
comportamento, do mundo que nos cerca." Com isso, entende-se que no nível
filogenético, ocorre a determinação de certos comportamentos de nossa espécie por
parte do ambiente. Os comportamentos reflexos inatos são um exemplo, além da
adaptação por consequências (Moreira e Medeiros, 2019). Como explica Baum (2005)
“as influências genéticas favorecem genótipos responsáveis pela capacidade de
comportamento respondente, em que inúmeros estímulos neutros podem se tornar
promessas ou ameaças", portanto, o ambiente seleciona comportamentos específicos
inatos ao ser, para sua adaptação ao meio em que está inserido. Cada indivíduo
comporta-se de maneiras diferentes a estímulos distintos, e com isso formam-se os
processos privados, juntamente com os outros dois níveis.
Isso explica o nível ontogenético, que determina como um indivíduo reagirá às
diferentes consequências apresentadas às suas respostas no ambiente, com base em
sua história pessoal. É a maneira individual de mudança, de como o comportamento
foi condicionado por perspectivas pessoais sobre o meio (Moreira e Medeiros, 2019).
O reforçamento pelo resultado das ações individuais influencia diretamente nas
mudanças que o meio sofrerá por esses agentes condicionados, “controlados pelo
efeito de nossa própria ação” (Micheletto, 1999, p. 118). B.F. Skinner (1984) explica
esses processos, que mais tarde denominou como privados, onde cada ambiente
possui uma percepção diferente por parte de cada indivíduo, mesmo que
compartilhem o mesmo lugar (1984) “alegrias, tristezas, amores e ódios são
particularmente nossos. Com respeito a cada indivíduo, em outras palavras, uma
pequena parte do universo é privada.”
No âmbito cultural, há diversos fatores que determinam como indivíduo irá se
portar perante à sociedade, pois cada lugar possui suas singularidades e é explicado
de determinada maneira, o que define a aprendizagem do ser. Para Skinner (2003),
alguns lugares são fundamentais para tornar o ambiente condicionante ao moldar o
ser:
“As agências religiosas, governamentais, econômicas e educacionais
diferem largamente no poder e na extensão de seu controle. Os efeitos da
família e das organizações sociais e comerciais também são diferentes.
Como resultado, os russos e os americanos mostram repertórios
comportamentais, ou “caracteres”, muito diferentes.”

A nível cultural, determina-se as influências advindas de outras pessoas, como


movimentos artísticos, ideologias e preconceitos. Aprende-se "pela observação de
modelos ou por instruções, o que compreende a aprendizagem social responsável
pela emissão de grande parte dos comportamentos humanos” (Moreira e Medeiros,
2019). Não há como separar o homem de sua história, assim como não é possível
analisar a história separadamente, pois estes são produtos da espécie e da cultura
presente (Micheletto, 2019. p. 39). Por fim, se a causa de um comportamento precisa
ser investigada, precisa ser por uma das três contingências. Os processos mentais
estão inclusos nisso e devem ser analisados funcionalmente, como comportamentos
devidamente selecionados pelos três níveis, pois estes são determinantes para uma
análise do comportamento (Moreira e Medeiros, 2019). "Como afirma Skinner, 'se
queremos que a espécie sobreviva, é o mundo que fizemos que temos que mudar’
(1987b/1989, p. 70. apud Micheletto, 1999, p. 42).
O comportamento reflexo inato ocorre quando uma alteração no ambiente elicia
uma alteração no organismo, é uma relação entre um estímulo (S) e uma resposta
(R), entretanto não é um comportamento aprendido, mas sim um comportamento
incondicionado através da bagagem genética da espécie. Esses reflexos involuntários
estão presentes desde a vida a vida intrauterina do ser, pois fazem parte do repertório
comportamental dos humanos, sendo assim são uma preparação mínima que o
organismo tem para sobreviver no ambiente. Exemplos: o estímulo “aumento na
temperatura” elicia a sudorese; o estímulo “fogo próximo a mão” elicia a contração do
braço; o estímulo “martelada no joelho” elicia a extensão da perna; o estímulo
“alimento na boca” elicia a salivação, e o estímulo “luz incide sobre a pupila” elicia a
contração do olho (Moreira & Medeiros, 2019).
Os reflexos são produtos da seleção natural – teoria de Darwin (1859) que
concluiu que os genes de um indivíduo são selecionados por gerações anteriores pelo
fato de serem favoráveis a sobrevivência e ao sucesso da espécie, e assim são
herdados sucessivamente. Ou seja, esses comportamentos têm origem na filogênese.
Desse modo, Darwin concluiu que um estímulo do ambiente estimula órgãos
sensórias no organismo e reflete, através do sistema nervoso – que impulsiona o
sistema muscular ou glandular, uma resposta (Baum, 2005).
Segundo Moreira e Medeiros (2019), pesquisadores e cientistas do
comportamento estudaram o reflexo incondicionado a fim de entender os padrões de
ocorrência e estabelecer relações constantes entre os estímulos e respostas, a partir
dessa investigação criaram leis que descrevem as regularidades nos fenômenos
repetidamente observados e testados, são elas as leis primárias e secundárias. As
primárias englobam:

Lei do Limiar: se o estímulo estiver dentro do limiar, ou seja, dentro da


intensidade mínima necessária para que esse seja captado pelos órgãos sensoriais,
provocará uma resposta, contudo, se estiver fora do limiar não será captado e,
consequentemente, não eliciará uma resposta (Moreira & Medeiros 2019).
Lei da Intensidade: a intensidade da mudança no ambiente (estímulo) é
diretamente proporcional à intensidade da mudança no organismo (resposta), em
termos técnicos, quanto maior a intensidade maior será a magnitude, o oposto
também é válido. A intensidade do estímulo também tem uma relação diretamente
proporcional à duração da resposta (Moreira & Medeiros 2019).
Lei da Latência: o tempo (T) de reação à um estímulo é inversamente
proporcional à intensidade do estímulo, ou seja, S pequeno – T grande e o oposto
também é válido (Moreira & Medeiros 2019).

Secundárias:
Lei da Fadiga do Reflexo: lei de adaptação, após um organismo estar em
contato com um estímulo por um longo período, o organismo se acostuma com ele,
se adapta, desse modo não o estímulo não eliciará a mesma reposta de antes (Moreira
& Medeiros 2019).
Lei da Somação Temporal: após um longo período de repetição de um
estímulo, a resposta a esse pode se potencializar (Catania, 1999).
Existe outro tipo de comportamento reflexo denominado condicionado, esse
depende de aprendizagem e é desenvolvido de acordo com a ontogênese, ou seja, a
experiência pessoal de cada indivíduo. O reflexo condicionado surge devido ao fato
de os seres poderem adquirir e aprender novos reflexos ao longa da vida, sendo
assim, esse comportamento também vai afetar o Sistema Nervoso Central, as
glândulas, os músculos e eliciar um efeito no organismo, porém tem influência da
subjetividade desse indivíduo frente a determinados estímulos, dado o exposto é
válido afirmar que esse é um comportamento individual, e não da espécie. É um
processo no qual um S é substituído por outro, em outras palavras, um S que antes
era neutro passa a eliciar uma resposta que era eliciada por outro (Skinner, 2003).
A aprendizagem de um comportamento pode originar-se do meio social e
através de suas regras, mas ela também pode surgir a partir da observação de outros
seres e tentativa de cópia, imitação e repetição. Cada cultura apresenta uma série de
costumes e normas e, ao nascer, um organismo se apropria desse meio e aprende a
se desenvolver por meio da cópia de outros organismos que estão próximos. A
linguagem é um estímulo verbal de um organismo que pode se tornar uma instrução
e é seguida por outros organismos - pelo fato de transmitir conhecimento e expor
consequências. Ex.: conselhos, regras, sermões, etc. Ao invés de um indivíduo tentar
atingir um objetivo de ação por tentativa e erro (modelagem), ele apenas procura imitar
o comportamento de outro ser e aprender a partir desse. Quando uma ação é
reforçada por outro organismo ou sociedade, tende a se manter, pois todo
comportamento é determinado por suas consequências. Em suma, é valido concluir
que o comportamento de um organismo pode ser a tentativa de imitação do
comportamento de outro organismo, haja visto que esse foi reforçado e teve uma
consequência positiva no meio- o outro observou e emitiu o mesmo comportamento
com o intuito de obter o mesmo reforço (Moreira & Medeiros, 2019).
Modelagem é o nome do processo usado para que um novo comportamento
seja aprendido, ele visa uma resposta específica do organismo, para isso, reforça
outras respostas similares a final esperada. Através do reforço diferencial e mudança
de contingências, é possível aumentar a frequência dessas respostas e chegar cada
vez mais perto do comportamento desejado (Gomide & Weber, 1993). O reforço
acontece para que haja progressão no comportamento do organismo, à medida que
esse comportamento evolui, o reforço inicial é retirado e o observador passa a reforçar
as respostas ainda mais semelhantes à almejada, com o objetivo de aperfeiçoamento
do comportamento. O procedimento de modelar uma resposta e a tornar frequente
requer muita concentração, atenção, paciência e observação, é necessário saber a
hora certa de usar o reforço diferencial tendo em vista que essa habilidade deve ser
imediata, ou seja, logo em seguida da ação similar à final ansiada (Alloway, Wilson &
Graham, 2006). Outro aspecto relevante desse processo consiste no fato de que se
uma resposta intermediária é muito reforçada e fortalecida, existe grande chance de
o organismo não apresentar outras respostas futuras e mais próximas ao
comportamento-alvo, sendo assim, o reforço gradual e a cada etapa é extremamente
necessário para alcançar a meta final de resposta (Moreira & Medeiros, 2019).
Em suma, é valido concluir que a partir da modelagem é possível acrescentar
reações e atitudes a um organismo e, essas que não existiam antes, passam a ter
grande probabilidade de ocorrência. Também é importante ter em mente que ao
reforçar uma resposta, essa pode aumentar a frequência de outra, isto é, a eficácia
no desenvolvimento de uma aptidão pode favorecer a propensão de outra (Skinner,
2003).
O termo ‘comportamento operante’ foi desenvolvido por Burrhus Frederic
Skinner em 1957 para explicar o tipo de comportamento que não é desencadeado por
algum estímulo externo, isto é, é o organismo que atua. Esse comportamento modifica
o ambiente, gerando consequências que também agem sobre ele, o que pode servir
de influência para que certos comportamentos voltem a se repetir, essas influências
são chamadas de reforçadores – tornando essa relação bidirecional e interacionista –
sendo operante uma classe de respostas e, então “podemos apenas prever a
ocorrência futura de respostas semelhantes” (Skinner, 1953, pp. 64-65). Porém, em
1966, na sua nova publicação com C. B. Ferster, ele e Skinner desenvolvem sua
opinião do termo quando alegam que as possibilidades de reforço estão por toda
parte.
Segundo Honig e Staddon (1977) o comportamento operante só pode ser
estudado se o indivíduo afetar o ambiente a seu redor de alguma forma, sendo esse
efeito a resposta, ou seja, a resposta é um exemplo de comportamento operante. Ao
discorrer sobre seus estudos, Skinner (1950) utiliza como base a teoria de E. L.
Thorndike (1898), que alegou, ao propor a Lei do Efeito, que as respostas à certa
situação que são acompanhadas pela satisfação da vontade do sujeito tem mais
relação com a situação que, quando se repetir, pode gerar a mesma resposta
novamente e desenvolve que os reforçadores são emitidos logo após o
comportamento e ditam a probabilidade do mesmo voltar a acontecer e, nessas
situações, existem dois tipos diferenciados de reforço: o positivo, o qual envolve uma
recompensa direta, que se manifesta como um estímulo agradável; e o negativo, que
se classifica como a eliminação de um estimulo ou resultado desagradável após o
comportamento (apud. Baum, 2012). Em contraponto, o psicólogo alega que o
‘agradável’ e ‘desagradável’ são relativos para cada indivíduo e o que pode ser
positivo para alguém, também pode ser negativo para outro, o que impede a
padronização da Análise do Comportamento (Skinner, 1953).
Em relação aos estudos de Medeiros e Moreira (2007), fica clara sua opinião
sobre os reforçadores:
“São fundamentais para a aquisição, manutenção e fortalecimento do
comportamento. Pode-se observar que o reforço, também, diminui a
frequência de outros comportamentos (mal adaptados) e diminui a
variabilidade da topografia (forma) da resposta reforçada, buscando
reproduzir o comportamento que foi mais efetivo (Silva, M.; Silva, R.; Silva,
A. 2016. Pág. 96)”

Quando se trata de W. M. Baum (2005), o psicólogo alega que eventos


filogeneticamente relevantes são os reforçadores, ou seja, eventos que aumentam a
aptidão, já que propiciam a repetição do comportamento que os produz.

“Existem dois tipos de reforçadores: primários (incondicionados) e


secundários (condicionados). Os reforçadores primários estão diretamente
ligados as nossas configurações biológicas, ou seja, aquilo que foi
construído filogeneticamente tem a capacidade de aumentar a frequência
de um determinado comportamento, pois estão ligados às necessidades
básicas para a sobrevivência da espécie, garantindo, também, o bem estar
do organismo (Silva, M.; Silva, R.; Silva, A. apud BALDWIN; BALDWIN,
1998; SKINNER, 2003. Pág. 96).”

Assim como afirma Ramos-Cerqueira et al. (1999), ao se observar um


determinado comportamento sem qualquer intervenção aplicada é obtida a linha de
base daquele indivíduo em relação ao comportamento de interesse, isto é, a taxa de
emissão de uma resposta antes de ela ser reforçada ou punida experimentalmente.
(Moreira & Carvalho, 2017). Este repertório comportamental inicial do indivíduo pode
ser também chamado de nível operante, o qual é definido por Skinner (1969) como
uma “probabilidade prévia” de emissão de uma resposta, já estando presente na
história passada do sujeito alvo do experimento.
De acordo com Moreira e Carvalho (2017), o registro da linha de base feito
anteriormente à intervenção permite uma análise e comparação entre os
comportamentos de antes e depois do procedimento experimental, possibilitando
verificar se a intervenção foi efetiva. Com a coleta da linha de base dos sujeitos ainda
pode-se analisar quais variáveis realmente operaram no experimento, assim como
verificar de que forma os estímulos se comportaram: como um reforço ou punição.
(Ramos-Cerqueira et al., 1999)
Um esquema de reforçamento reside em um processo de conhecimento no
qual é necessário para saber quando uma resposta, ou mais de uma resposta,
consequentemente ocasionam um reforçamento, ou seja, este indica qual a
característica das respostas reforçadoras ou não reforçadoras. Seguindo a mesma
linha de raciocínio, o conceito dito em questão se divide em duas vertentes, sendo
estas: esquema de reforçamento contínuo e esquema de reforçamento intermitente.
O CRF – esquema de reforçamento contínuo e o mais simples em relação aos outros
– é um procedimento incluso no reforçamento positivo que consiste em reforçar todas
as respostas emitidas pelo organismo. Nesse esquema, a ocorrência das respostas
é, consideravelmente, rápida, sem um intervalo de tempo. O processo no qual o
esquema de reforçamento se constitui baseia-se na contagem das respostas emitidas
versus na medição do tempo em que estas respostas são emitidas (B. F. Skinner &
C. B. Ferster, 1957).
Uma das diferenças do esquema de reforçamento contínuo para o esquema de
reforçamento intermitente, além de que este não reforça todas as respostas, é a
facilidade do desenvolvimento de uma extinção, ou seja, o intermitente possui a
capacidade de extinguir uma resposta, já o contínuo não. Isso se dá pelo fato de que
a intermitente, muitas vezes, deseja reforçar somente alguns comportamentos e não
todos e, neste caso, a sequência destes comportamentos tendem a aumentar em
comparação ao reforço contínuo (Alloway, Wilson & Graham, 2006). O esquema de
razão é um dos tipos de arranjos do esquema de reforço intermitente e consiste em
fazer com que um organismo emita uma quantidade específica de respostas a fim de
reforça-las, além disso, há também o esquema de intervalo que é parecido com o
esquema de razão, entretanto, uma resposta só será reforçada depois de algum
intervalo de tempo, isto é, neste caso a quantidade de respostas não é importante.
Um esquema de intervalo pode ser variável do mesmo modo que um esquema de
razão poderá ser. A única distinção entre os dois tipos variáveis é que em relação ao
esquema de intervalo o que varia é o período e no esquema de razão o que varia são
as respostas. Em contrapartida, ainda existem mais duas formas de categorizar os
esquemas, as quais são: esquema de intervalo fixo que constitui-se pelo fato de um
comportamento só ser reforçado após um período de tempo o qual foi exposto, ou
seja, um indivíduo passa a semana inteira afadigado; quando chega sexta-feira este
se anima – neste caso, a resposta do sujeito foi, e será, reforçada somente e/ou perto
do final da semana. E o esquema de razão fixa consiste em uma quantidade específica
de emissão de respostas para que estas sejam reforçadas (A. C. Catania, 1999).

2. OBJETIVOS
Nível operante ou linha de base: o objetivo dessa etapa é observar o sujeito
experimental antes de sofrer qualquer tipo de intervenção experimental, como no caso
do Sniffy, antes de ser treinado, a fim de obter seu repertório comportamental e
posteriormente analisar se o experimento foi efetivo e trouxe mudanças no
comportamento do sujeito. (Alloway, Wilson & Graham, 2006).
Treino ao comedouro: o objetivo deste experimento é treinar o sujeito a associar
o som produzido pela liberação da pelota de alimento com a pelota de alimento estar
disponível no comedouro (Skinner, 1979). O treino ao comedouro consiste em reforçar
comportamentos desejados do sujeito do experimento, no caso, o processo se inicia
com o estabelecimento de padrões de comportamento do ratinho albino, Sniffy, que
recebe um reforço positivo (pelotas de alimento) sempre que se aproxima ou encosta
na alavanca, realizando o comportamento esperado, ao mesmo tempo que um som é
emitido até que, ao ouvir o som designado, o rato se encaminhava ao comedouro no
mesmo instante. E o experimento segue assim para que fique estabelecido esses
comportamentos desejados, e, com o tempo, vai ficando mais objetivo, ou seja, Sniffy
recebia um reforço se ficasse de pé na gaiola, agora, o ratinho só é recompensado se
ficar de pé de perto da alavanca a fim de chegar ao ponto em que ele só receberá as
pelotas se pressionar a alavanca. (Alloway, Wilson & Graham, 2006).
Modelagem da resposta da pressão à barra: a resposta a ser modelada, no
experimento do Sniffy é a resposta de pressionar a barra para obter alimento. A partir
do reforço diferencial aos comportamentos mais similares ao desejado, o rato é
ensinado e condicionado a pressionar a barra. Sendo assim, Sniffy vai ganhando
reforços cada vez que se aproxima mais do comportamento esperado pelo
observador, e com isso adquire uma resposta nova ao seu repertório de
comportamentos que não seria possível sem o processo de modelagem. O processo
tem sucesso quando Sniffy repete a ação de pressionar a barra 4 ou 5 vezes em um
período de 1 minuto, após esse fenômeno é válido observar as futuras respostas do
rato tendo a frequência de resposta cada vez maior. (Alloway, Wilson & Graham,
2006).
Esquema de reforçamento (CRF): tomemos o rato virtual como forma de
exemplo; no experimento toda vez que o animal pressiona a barra ele recebe pelotas
de alimento, portanto, o objetivo desse experimento é o reforçamento da resposta de
pressionar a barra várias e várias vezes, isto é, o comportamento se adequou ao
repertório do ratinho, além de ter sido aprendido muito mais rápido. Entretanto, o
experimento com o rato virtual pode ter o objetivo de reforçar apenas uma resposta
emitida por este, excluindo todos os reforçamentos anteriores. Se há um desejo que
Sniffy (o rato virtual) – para receber as pelotas de alimento – precise encostar apenas
uma patinha na barra, então terá que reforçar somente esse comportamento ou algum
comportamento próximo a isso, como por exemplo somente levantar a patinha
próximo a alavanca. Outro experimento utilizado seria o de esquema de intervalo fixo
no qual teria como objetivo uma resposta reforçada do ratinho após a exposição de
um período de 60 segundos, isto é, quanto mais perto destes 60 segundos mais vezes
o Sniffy irá pressionar a alavanca. Bem como no esquema de razão fixa onde o
objetivo do experimento é fazer com que o rato virtual emita um número fixo de
respostas, ou seja, pressionar a alavanca, para que consiga pelotas de alimento.
(Alloway, Wilson & Graham, 2006).

RESUMO
O objetivo dos experimentos iniciais é identificar a força da resposta de determinado
comportamento do rato para depois analisar a sua aprendizagem discriminativa até
um estímulo neutro ser seu próprio reforçador, a partir disso é necessário identificar
as respostas do animal diante a diferentes contingências e através dessa
identificação, o comportamento do sujeito será modelado por reforços diferenciais
para que assim seja possível reforçar todas as respostas omitidas do comportamento
de maneira progressiva até que atinja o comportamento alvo sem nenhum tipo de
intervenção. Para todos os experimentos foi utilizado o software Sniffy 3.0 pro. O
objetivo dos procedimentos de manutenção do RPB é comparar o desempenho do
sujeito sob esquemas de reforçamento intermitente. O experimento do Intervalo Fixo
constou de três procedimentos: IF2 segundos, IF 4 segundos e IF 6 segundos, iniciou-
se com o arquivo de CRF e o software foi programado para liberar reforço a cada 2
segundos no IF2s, sendo encerrado após o sujeito receber 100 reforços; foi salvo e a
partir desse arquivo o reforço foi programado para ser liberado a cada quatro
segundos no IF4s, sendo encerrado após a decorrência de 5 minutos, a partir desse
procedimento o reforço foi programado para ser liberado após um intervalo de tempo
de 6 segundos no IF 6s, encerrado após ter completado 10 minutos de duração. Já
no experimento de Intervalo Variável foi aplicado mais três procedimentos: IV 2
segundos, IV4 segundos e IV 6 segundos, iniciando com o arquivo de CRF, o software
foi programado para a liberação de reforço em intervalo médio de 2 segundos no IV2,
sendo este encerrado após o animal receber 100 reforços; foi salvo e a partir desse
arquivo o reforço foi organizado para ser liberado a cada 4 segundos no IV4, o qual
foi encerrado após 5 minutos; através desse procedimento, o reforço foi programado
novamente e dessa vez foi para que ele fosse liberado depois de um intervalo de
tempo de 6 segundos no IV6, que por sua vez, teve seu término depois de ter
completado 10 minutos de duração. O experimento de razão fixa foi realizado com 3
procedimentos: RF2, RF4 e RF6. Iniciando-se também com o arquivo do CRF e
através disso, na RF2 o software foi programado para a liberação de reforço após a
emissão fixa de 2 RPB, o qual foi encerrado após o sujeito receber 100 reforços; foi
salvo e a partir desse arquivo o software foi estruturado para os reforços serem
liberados depois da emissão continua de 4 RPB na RF4, este foi encerrado após 5
minutos de duração; através do procedimento anterior, o reforço foi organizado
novamente para a RF6 e dessa vez eles eram liberados após a emissão fixa de 6
RPB, esse teve seu término depois de um período de 10 minutos. O experimento de
razão variável foi realizado com 3 procedimentos: RV2, RV4 e RV6, iniciou-se com o
arquivo do CRF e no RV2 o software foi programado para a liberação de reforço após
a emissão média de 2 RPB, este foi encerrado após o sujeito receber 100 reforços; foi
salvo e a partir desse arquivo o software foi programado para liberar reforços depois
da emissão média de 4 RPB para a RV4, que por sua vez foi encerrada depois de 5
minutos de duração; o software foi programado novamente a partir do procedimento
anterior para a RV6 e dessa vez ele foi organizado para liberar reforços após a
emissão média de 6 RPB, sendo encerrado após 10 minutos de duração.
Palavras-chave: Reforço. Comportamento. Experimento. Aprendizagem
discriminativa. Contingências.

3. MÉTODO

SUJEITO

“O programa Sniffy Pro permite que você prepare e execute uma grande
variedade de experimentos de condicionamentos clássicos e operante, e lhe permite
colher e dispor dados de uma maneira que simula o modo como os psicólogos
trabalham em seus laboratórios. Além disso, em razão de o programa simular e
mostrar simultaneamente alguns dos processos psicológicos que os psicólogos
acreditam ser empregados pelos animais (e pelas pessoas), o Sniffy Pro apresenta-
lhe alguns aspectos da aprendizagem que você não poderia observar caso estivesse
trabalhando com um animal vivo. Em um rato real, a aprendizagem é o resultado de
interações bioquímicas entre bilhões de neurônios no cérebro. Como consequência
desses processos fisiológicos, os animais adquirem informações a respeito de
eventos no mundo externo e a respeito de como seu comportamento afeta esses
eventos. (...) Até certo ponto, o relacionamento entre processos neurofisiológicos e
explicações psicológicas da aprendizagem é análogo ao relacionamento entre a
atividade elétrica nos circuitos eletrônicos de seu computador e os processos
psicológicos simulados que formam a base para o comportamento de Sniffy. Seu
computador contém o equivalente a diversos milhões de transistores que, de certo
modo, são análogos aos neurônios no cérebro do rato. O programa Sniffy usa o
conjunto de circuitos eletrônicos de seu computador para simular os mecanismos
psicológicos que muitos psicólogos utilizam para explicar a aprendizagem em animais
e pessoas reais.” (Alloway, Wilson & Graham, 2006)

LOCAL

Sala de aula do bloco 3 da Pontifícia Universidade Católica do Paraná (PUC-PR).

INSTRUMENTOS/APARELHOS

Para a realização dos experimentos foram utilizados os seguintes


instrumentos/aparelhos:

a) laptop da marca Dell modelo latitude 3470, número do modelo 06F2 com
processador core i5 e armazenamento de 465 GB de identificação 1;
b) cronômetro através do celular Apple modelo 7;
c) cronometro através do celular Apple modelo XR;
d) software Sniffy 3.0 Pro.

PROCEDIMENTOS

O experimento de nível operante foi iniciado abrindo o software Sniffy 3.0 Pro.
Para iniciar, clicou-se na aba “Windows” e depois em “Experiment” nos direcionando
para uma janela onde clicamos em “Design Operant Experiment” ativando a opção de
“extinction”. O sujeito começou a trabalhar e anotamos a frequência minuto por minuto
dos comportamentos emitidos deste, ou seja: andar, farejar, limpar, parar, erguer (A,
F, L, P, E) bem como a resposta de pressão à barra (RPB). O experimento foi
encerrado em 30 minutos de observação e salvado ao clicar em “File” e logo após em
“Save as > Save in”, denominando o arquivo de “Nível Operante”. O arquivo foi salvo
no pendrive bem como na pasta do notebook.
O experimento de treino ao comedouro foi iniciado abrindo o software Sniffy 3.0
Pro do salvamento do experimento de nível operante, o qual foi realizado
anteriormente. Para abri-lo foi preciso clicar em file > open e abrir o arquivo de Nível
Operante e aplicar a opção continuous em experiment > design operant experiment.
Cronometramos o intervalo de tempo entre a disponibilidade de alimento e o tempo
de o rato comer a pelota, foi repetido até que a barra de “sound food” completasse
3/4, zerando o cronômetro a cada tentativa. O arquivo foi salvo no pendrive e na pasta
do notebook com o nome “Treino ao Comedouro” e para realizar esta etapa foi preciso
clicar em file > save as.
O experimento de modelagem de resposta a pressão à barra foi iniciado ao
abrir o software Sniffy 3.0 Pro clicando em file > open e selecionar o arquivo do
experimento anterior, que no caso foi o treino ao comedouro e apertar open
novamente. Esperava-se o sujeito emitir um comportamento próximo a barra,
reforçando-o com a pelota de alimento, isto é, foi preciso observar se o rato ficasse
na parede de trás da caixa; se ele erguesse na parede de trás da caixa; se ele
erguesse ao lado da barra; se ele erguesse em cima da barra e/ou se ele pressionasse
a barra (RPB). O experimento foi encerrado após o sujeito emitir 10 comportamentos
de resposta à barra consecutivos. Para salva-lo no pendrive bem como na pasta do
notebook clicamos em file > save as > save in e o nome dado ao arquivo foi
“Modelagem”, por fim, selecionamos a opção save novamente.
Deu-se início ao experimento do CRF (esquema de reforçamento) ao abrir o
arquivo “Modelagem” clicando em file > open. Para programar o software a fim de que
o alimento fosse disponibilizado automaticamente quando a barra fosse pressionada,
clicamos em experiment > design operant experiment e selecionamos a opção
continuous bem como a opção press bar. Anotamos a frequência do comportamento
de pressionar a barra a cada minuto, até que se completasse 30 minutos de
experimento. Por fim, para encerra-lo clicou-se em file > save as > save in e optamos
em salvá-lo no pendrive e na pasta do notebook, denominando o arquivo de “CRF”.
O experimento de intervalo fixo de 2 segundos iniciou-se ao clicar em file >
open e então, abrir o experimento de CRF que foi realizado anteriormente. Após essa
etapa, clicou-se em design operant experiment > fixed e selecionamos a opção de 2
segundos. Foi esperado que o sujeito emitisse 100 reforços de pressão a barra. Para
encerrar este experimento foi preciso clicar em file > save as > save in e optamos em
salvar no pendrive bem como na pasta do notebook. O arquivo foi denominado como
“FI2”.
O experimento de intervalo fixo de 4 segundos foi iniciado ao clicar em file >
open e ao abrir o arquivo de FI2. Para configura-lo nas expectativas recompensadas
clicamos em design operant experiment > fixed e selecionamos a opção de 4
segundos. Este processo teve como critério observar o sujeito durante 5 minutos. Para
encerrar este experimento, foi preciso clicar em file > save as > save in e salvar no
pendrive e na pasta do notebook o arquivo chamado “FI4”.
O experimento de intervalo fixo de 6 segundos se iniciou ao clicar em file >
open e selecionar o arquivo anterior de intervalo fixo de 4 segundos. Configuramos
esse experimento clicando em design operant experiment > fixed e colocamos a opção
de 6 segundos. O critério foi observar o rato durante 10 minutos de experimento. Para
encerrá-lo, clicou-se em file > save as > save in e optamos em denomina-lo como
“FI6” e salvá-lo no pendrive e na pasta do notebook.
O experimento de intervalo variável de 2 segundos foi iniciado ao clicar em file
> open a fim de abrir o procedimento de CRF feito anteriormente. Após isso, clicamos
em design operant experiment > variable e aplicamos a opção de 2 segundos. Este
experimento obteve como critério observar o sujeito até que se completasse 100
reforços. Finalizando essa etapa, foi preciso clicar em file > save as > save in e salvar
no pendrive bem como na pasta do notebook com o nome de “VI2”.
O experimento de intervalo variável de 4 segundos iniciou-se ao clicar em file
> open e ao abrir o experimento de VI2 realizado anteriormente. Posteriormente,
selecionamos o design operant experiment > variable e aplicamos a opção de 4
segundos. O critério imposto foi com a finalidade de observar o rato durante 5 minutos.
Encerrando este experimento, clicamos em file > save as > save in e salvamos no
pendrive bem como na pasta do notebook e, por fim, denominamos de “VI4”.
O experimento de intervalo variável de 6 segundos foi iniciado ao clicar em file
> open bem como ao abrir o experimento anterior denominado VI4. Configuramos este
processo clicando em design operant experiment > variable > 6 > seconds. Neste
procedimento, o critério foi observar o sujeito durante 10 minutos. Encerrando-o
selecionamos a aba file > save as > save in e optamos em salvar no pendrive e na
pasta do notebook. O arquivo foi denominado de “VI6”.
O experimento de razão fixa de 2 respostas foi iniciado ao clicar em file > open
a fim de abrir o experimento CRF realizado anteriormente. Configuramos ao clicar na
aba de design operant experiment > fixed e aplicar a opção de 2 respostas. Esse
procedimento dispôs de um critério de obter 100 reforços do sujeito e, ao encerrar,
tivemos que selecionar a opção file > save as > save in salvando-o com o nome de
“FR2” e guardando o arquivo no pendrive e na pasta do notebook.
O experimento de razão fixa de 4 respostas iniciou-se ao clicar em file > open
e ao abrir o arquivo de FR2 configuramos o procedimento na aba de design operant
experiment > fixed > 4 > responses. O critério deste experimento foi observar o rato
durante 5 minutos. Ao finalizar, selecionamos file > save as > save in para salvá-lo no
pendrive bem como na pasta do notebook com o nome de “FR4”.
O experimento de razão fixa de 6 respostas foi iniciado clicando em file > open
para abrir o experimento de FR4 realizado anteriormente. Para iniciar, selecionamos
a janela de design operant experiment > fixed para configurar 6 respostas. Este
procedimento obteve critério de observar o sujeito por 10 minutos. Após isso, o
experimento foi encerrado clicando em file > save as > save in a fim de salvar na pasta
do notebook além do pendrive com o nome de “FR6”.
O experimento de razão variável de 2 respostas iniciou-se ao clicar na aba file
> open a fim de abrir o arquivo de CRF realizado anteriormente. Neste procedimento,
configuramos em design operant experiment > variable > 2 > responses, no qual o
critério esperado foi de observar o sujeito emitir 100 reforços. Ao finalizá-lo, clicamos
em file > save as > save in para salvar no pendrive bem como na pasta do notebook
e denominamos de “VR2”.
O experimento de razão variável de 4 respostas foi iniciado ao clicar na aba file
> open para abrir o exercício de VR2 realizado anteriormente. Em seguida, para
configurar o experimento, tivemos que selecionar a janela de design operant
experiment > variable e clicamos na opção de 4 respostas para poder observar o rato
durante 5 minutos. Após finalizar o procedimento, foi preciso clicar em file > save as
> save in a fim de salvar no pendrive e na pasta do notebook com o nome de “VR4”.
O experimento de razão variável de 6 respostas iniciou-se clicando na aba file
> open para poder abrir o experimento feito anteriormente, o VR4. Configuramos ao
clicar na aba de design operant experiment > variable > 6 > responses a fim de
observar o sujeito durante 10 minutos de experimento. Ao finalizar, clicamos
novamente na aba file > save as > save in para salvá-lo com o nome de “VR6” e
guardá-lo no pendrive bem como na pasta do notebook.

4. RESULTADOS E DISCUSSÃO

O experimento de nível operante teve duração total de 30 minutos, bem como


o experimento do CRF (esquema de reforçamento contínuo). O exercício do treino ao
comedouro teve igualmente duração de meia hora, tendo sido exigido que o
completasse até que a barra de sound food atingisse 3/4, no entanto, neste
experimento em específico foi necessário ir um pouco a mais que 3/4, com a intenção
de que a próxima experimentação fosse mais acessível de manipular. Em seguida, o
exercício de modelagem, por sua vez, se estendeu por até 40 minutos. Os
experimentos de esquemas de intervalo e razão obtiveram praticamente os mesmos
critérios, uma vez que o de intervalo fixo de 2 segundos e o de razão fixa tiveram como
objetivo observar o rato Sniffy até que atingissem 100 reforços de pressão à barra, no
entanto, o primeiro procedimento exigia uma resposta a cada 2 segundos e o segundo
procedimento exigia um reforço a cada 2 respostas. No experimento de FI4, a pelota
de alimento só era liberada com a passagem de 4 segundos se encerrando em 5
minutos de procedimento, e no experimento de FI6 a aplicação foi com a mesma
estrutura, porém com números diferentes, ou seja, o sujeito só receberia o reforço a
cada 6 segundos durante 10 minutos de observação.
Os experimentos de intervalos variáveis obtiveram três etapas: de 2, 4 e 6
segundos. Nestes procedimentos, as pelotas de alimentos eram distribuídas
variavelmente, isto é, no esquema de intervalo variável de 2 segundos, a liberação do
reforço era dado ao animal em um intervalo médio de 2 segundos até que este
pudesse completar 100 RPBs. Já o intervalo variável de 4 segundos, a liberação do
reforço era dada em qualquer segundo deste intervalo em questão totalizando 5
minutos de experimento e no intervalo variável de 6 segundos os critérios são os
mesmos, ou seja, a pelota de alimento era liberada em qualquer período destes 6
segundos totalizando 10 minutos de experimento.
O experimento de razão fixa de 4 respostas consiste na liberação de reforço
após 4 RPBs emitidos pelo sujeito durante 5 minutos de procedimento, já o de razão
fixa de 6 respostas as pelotas de alimento eram distribuídas após a emissão de 6
RPBs com um período de 10 minutos. Os procedimentos de razão variável consistem
em liberar reforços em uma emissão média de 2, 4 e 6 RPBs. No esquema de 2
respostas o experimento durou até que o Sniffy completasse 100 reforços de pressão
à barra, no esquema de 4 respostas as pelotas de alimento eram liberadas
aproximadamente depois de 4 comportamentos emitidos resultando em 5 minutos de
procedimento e, por fim, no esquema de 6 respostas, o software programava liberar
os reforços após uma média de 6 comportamentos de RPBs totalizando 10 minutos
de experimento.
A Tabela 1 foi elaborada a partir dos dados levantados dos comportamentos de
andar, limpar-se, erguer-se, farejar, parar e das respostas de pressão à barra no
experimento do Nível Operante e do comportamento de resposta de pressão à barra
no experimento do CRF. Sua formatação levou em consideração a frequência das
respostas e o tempo em que os experimentos foram realizados para determinar a taxa
propriamente dita.

Nível Operante CRF


A L E F P RPB RPB
Frequência 151 143 88 185 97 1 131
Tempo (min.) 30 30 30 30 30 30 30
Taxa (r/min.) 5,03 4,77 2,93 6,17 3,23 0,03 4,37

Tabela 1 – Tabela comparativa entre a taxa da resposta de andar (A), limpar-se (L), erguer-se (E),
farejar (F), parar (P) e de pressão à barra (RPB) do sujeito nos experimentos de Nível operante e de
CRF.

A partir da análise da Tabela 1 foi observado um aumento no comportamento


de RPB do CRF (4,37 r/min) em relação ao nível operante (0,03 r/min), isso acontece
pois no CRF o rato virtual já passou por um treinamento, ou seja, seu RPB está
reforçado, enquanto no nível operante o comportamento ainda não tinha sido
instalado. Ambos os experimentos tiveram duração de 30 minutos, porém, o
experimento de Nível Operante possuiu 1 de frequência enquanto o CRF atingiu 131,
isso se deve ao fato de que quando uma resposta não experiencia uma intervenção
se obtém a linha de base do sujeito em relação ao tal comportamento, isto é, a taxa
de emissão antes de fortalecer a resposta, por isso, o nível operante neste
experimento dispôs de uma taxa inferior em comparação com o CRF (Ramos-
Cerqueira et al., 1999). Ademais, Skinner (1969) define a linha de base como nível
operante que consiste em uma “probabilidade prévia” de emissão de uma resposta, a
qual já estaria presente na história de vida do sujeito. Segundo Moreira & Medeiros
(2019) é esperado que ao final da sessão do experimento de CRF o animal esteja
pressionando a barra com uma frequência maior que a do seu início, assim como as
formas com que o sujeito pressiona a barra as quais ficarão cada vez mais parecidas
umas com as outras. Além disso, pode ser observado que a taxa, a frequência e o
tempo dos comportamentos de andar, farejar, limpar, parar e erguer não foram
registrados durante o experimento do CRF. Essa falta de registro pode ser sintetizada
pelo fato de os pesquisadores estarem sob supressão condicionada, fenômeno que é
citado por Murray Sidman (2009) como sendo um estado de ansiedade do indivíduo
quando ele está sob uma punição inevitável.
Ainda mais, a supressão condicionada também ocorre a partir de choques
inevitáveis de alguns indivíduos sob outros e esses mesmos choques acabam se
transformando em um efeito colateral desagradável (Sidman, 2009). No caso do
experimento do CRF, o efeito colateral sofrido devido a essa ansiedade, foi a falta das
anotações em relação aos 5 comportamentos citados no parágrafo anterior.
A Figura 1 foi elaborada com os dados de frequência dos comportamentos de
andar, farejar, limpar-se, erguer-se, parar e das respostas de pressão à barra, obtidos
nos experimentos do Nível Operante e do CRF, de forma a comparar a frequência
desse comportamento nos dois experimentos.

frequência dos comportamentos no NO e CRF


185
180
165 151
150
143
131
135
120
Frequência

105 97
88
90
75
60
45
30
15 1 0 0 0 0 0
0
RPB Andar Farejar Limpar Parar Erguer
Comportamentos

Nível Operante CRF

Figura 1 – Histograma comparativo entre a frequência dos comportamentos de andar, farejar, limpar-
se, parar, erguer-se e da resposta de pressão à barra (RPB) no Nível Operante e da frequência de RPB
no CRF.

Com base na figura apresentada, observa-se que a frequência de respostas de


pressão à barra (RPB) no Nível operante foi expressivamente menor que a frequência
desse mesmo comportamento no CRF, apresentando uma diferença de 130 vezes.
Essa diferença discrepante de respostas deve-se ao fato de que o Nível operante se
trata do repertório comportamental inicial do indivíduo, ou como afirma Ramos-
Cerqueira et al. (1999), comportamentos que foram observados sem qualquer
intervenção experimental. Enquanto que, no esquema de reforçamento contínuo
(CRF), as respostas emitidas pelo organismo são reforçadas de acordo com o
interesse do experimento em questão, como a RPB trabalhada nesta etapa,
aumentando a probabilidade de frequência desta (B. F. Skinner & C. B. Ferster, 1957).
Assim como descrito no texto explicativo da Tabela 1, a frequência dos
comportamentos de andar, farejar, limpar, parar e erguer não foram registrados
durante o experimento do CRF, fator que comprometeu também a elaboração da
presente figura, visto que impossibilitou os pesquisadores comparar tais
comportamentos nos dois experimentos. Esse fato deve-se à chamada supressão
condicionada (Sidman, 2009), já descrita anteriormente, resultando em um estado de
ansiedade e, assim, dados importantes para a pesquisa não foram levantados.
A Figura 2 foi preparada a fim de explicitar o tempo observado entre a
disponibilidade da pelota de alimento e o ato de ir se alimentar do Sniffy em cada
tentativa no experimento do treino ao comedouro.

Figura 2 – Curva de tempo absoluto a cada tentativa no experimento treino ao comedouro.

Referente a ela, pode-se observar que no decorrer do experimento o sujeito


totalizou 125 tentativas e que houve uma diminuição da topografia e um aumento da
estereotipia do comportamento deste, isto é, o tempo de reação de cada tentativa
passou a ter um padrão, se tornando um bem similar do outro. Esse fator vai de
encontro com o que Moreira e Medeiros (2019) apontam ao afirmar que a diminuição
da variabilidade da topografia é um resultado do reforçamento daquele
comportamento. Embora a topografia diminuiu notadamente entre as tentativas 11 e
79, observa-se que na tentativa 80 houve um maior tempo de reação devido,
provavelmente, ao experimentador, o qual pode ter perdido uma oportunidade de
ofertar a pelota de alimento, ou ofertou de maneira errônea, assim como aconteceu
na tentativa 12.
A Tabela 2 representa o experimento de modelagem, o qual foi analisado os
respectivos comportamentos: ficar no fundo da gaiola, erguer-se na parede do fundo
da gaiola, erguer-se ao lado da barra, erguer-se em cima da barra e pressionar a
barra. Neste exercício em específico o tempo não foi levado em consideração, uma
vez que era necessário somente o sujeito pressionar a barra 10 vezes para finaliza-
lo.

COMPORTAMENTO REFORÇO

Ficar no fundo da gaiola 21

Erguer-se na parede do fundo da gaiola 10

Erguer-se ao lado da barra 13

Erguer-se em cima da barra 14

Pressionar a barra 18

TOTAL 76

Tabela 2 – Número de reforços dados a cada comportamento desejado no experimento da modelagem.

É possível observar pelos dados da Tabela 2 que o sujeito necessitou de 58


reforços para poder instalar o comportamento de RPB em seu repertório, totalizando
76 comportamentos. Ademais, o comportamento de pressionar a barra obteve 18
reforços, ou seja, 8 a mais do que era necessário. Com as informações da Tabela 2,
pode-se articular com Gomide & Weber (1993) que afirma que, para que um novo
comportamento seja aprendido, é necessário reforçar respostas similares da
esperada, isto é, no experimento reforçamos comportamentos como ficar no fundo da
gaiola, erguer-se na parede do fundo da gaiola, erguer-se ao lado da barra e erguer-
se em cima da barra até que a resposta de pressão à barra fosse modelada. Além
disso, é de extrema importância a atenção no que o sujeito faz e em suas
consequências para que assim, seja formado o novo comportamento através dos
reforços diferenciais que se aproximam do comportamento desejado (Moreira &
Medeiros 2019).
O experimento de CRF (esquema de reforçamento contínuo), o qual analisou o
acúmulo das respostas do sujeito de pressão à barra, obteve duração de 30 minutos.
Nos primeiros 10 minutos ele pressionou a barra apenas 5 vezes e ao longo dos 20
minutos até o momento final o rato apresentou um avanço no comportamento, no qual
resultou em uma curva evolutiva no gráfico pertencente ao experimento em questão
(Figura 3). O sujeito totalizou 131 respostas de pressão à barra.

respostas de pressão à barra no


experimento CRF
140
FREQUÊNCIA DO COMPORTAMENTO

120

100

80

60

40

20

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
TEMPO (MIN)

Figura 3 – Curva da frequência acumulada de respostas de pressão à barra (RPB) no experimento de


CRF.

Pode-se observar na Figura 3 que a curva da frequência de acúmulo das


respostas do sujeito à pressão à barra foi crescente, sendo explícito no início do
experimento uma taxa próxima a 0, ou seja, a estereotipia estava baixa em relação ao
RPB, no entanto, ao longo do procedimento, o desempenho do rato obteve um salto
evolutivo em relação ao comportamento de pressionar a barra, principalmente a partir
de 26 minutos de experimento. A Figura 3 representa uma curva de CRF de
aceleração positiva devido ao fato dos aumentos gradativos de RPB, já de que em um
experimento de reforçamento contínuo a resposta é rápida, ou seja, não há intervalos
de tempo para que um comportamento seja reforçado, além de se basear na
frequência das respostas emitidas e na contagem do tempo (B. F. Skinner & C. B.
Ferster, 1957), os quais estão retratados no gráfico (Figura 3): linha vertical
(frequência do comportamento) e linha horizontal (tempo em minutos). Para podermos
reforçar a resposta do sujeito de pressionar a barra, tivemos que modelar seu
comportamento em um experimento antecedente, ou seja, fomos fortalecendo
progressivamente cada vez que ele chegasse próximo à barra até que somente o RPB
fosse estabelecido, diante disso, pode-se articular com a literatura de Alloway, Wilson
& Graham (2006) os quais afirmam que este comportamento se adequou ao repertório
do sujeito, assim possibilitando a gama quantidade de respostas de pressão à barra
ao longo dos 30 minutos em que o sujeito foi exposto durante o experimento.
A Figura 4 a seguir representa uma curva de frequência acumulada das
respostas de pressão à barra elaborada com os dados obtidos no experimento de
esquema de reforçamento intermitente de razão fixa (RF) 2, 4 e 6. A figura foi disposta
com a frequência em função do tempo do experimento em minutos.

Figura 4 – Curva de frequência acumulada de respostas de pressão à barra (RPB) reforçadas no


experimento de esquema de reforçamento intermitente de razão fixa (RF).
Pode-se observar na Figura 4 que o RF2 acumulou aproximadamente 100
respostas de pressão à barra durante 14 minutos de experimento, ou seja, o sujeito
foi submetido ao ganho de pelota de alimento – sendo programado pelo próprio
software – somente a cada 2 RPBs. Neste caso, os comportamentos foram constantes
com pequenas pausas durante um reforço para outro, isso se deve ao fato da
numeração do esquema de razão que é reforçado a cada 2 respostas emitidas pelo
rato Sniffy. Já no esquema de RF-4 e RF-6 o sujeito apresentou pausas um pouco
mais longa de um reforço para o outro, visto que somente no 4º RPB bem como no 6º
RPB ele era submetido a pelota de alimento. Ambos estes esquemas tiveram um
período de tempo menor comparado com RF-2, uma vez que o de 4 respostas obteve
duração de 5 minutos e o de 6 respostas 10 minutos . Segundo Moreira e Medeiros
(2019), a pausa ocorre devido ao fato da não apresentação de reforço logo após o
sujeito já ter pressionado a barra e ganhado a pelota de alimento, além do mais, na
Figura 4 observa-se que as curvas são constantes, principalmente no RF4 e RF6, pois
ocorreu uma alta taxa de frequência de respostas em um curto período de tempo. Na
curva azul (RF2) é demonstrado mais explicitamente alguns segmentos retos em
comparação ao eixo horizontal do tempo, pois isso ocorreu quando não havia emissão
de respostas (Moreira & Medeiros, 2019).
A Figura 5 foi elaborada de maneira semelhante que a Figura 4, no entanto,
esta refere-se aos dados das respostas de pressão à barra obtidos no experimento
de esquema de reforçamento intermitente de razão variável (RV) 2, 4 e 6.

Razão Variável 2, 4 e 6
120

100

80
Frquência

60

40

20

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Tempo (min.)

RV 2 RV 4 RV 6
Figura 5 – Curva de frequência acumulada de respostas de pressão à barra (RPB) reforçadas no
experimento de esquema de reforçamento intermitente de razão variável (RV).

Diante dos dados apresentados na Figura 5, pode ser observado que a curva
de RV2 obteve maior frequência de respostas de pressão à barra, uma vez que o
critério necessitava de 100 reforços para finalizar o experimento, no entanto, o sujeito
totalizou 108 RPBs. A curva do RV4 foi considerada a menor devido o experimento
ter levado apenas 5 minutos para ser encerrado, já o de RV6 levou 10 minutos. O rato
obteve 22 respostas acumuladas e 36 respostas acumuladas no experimento RV4
bem como no RV6, respectivamente. Em um experimento que se baseia na razão
variável, o sujeito obtém uma média em resposta, isto é, ele não mais irá receber um
reforço após um número determinado de comportamentos e sim, após uma
modificação de respostas que tendem a variar. Ademais, as pausas são quase
inexistentes levando a uma alta taxa de frequências, isso pode ser mostrado
explicitamente nas 3 curvas da Figura 5 onde estas são constantes (Moreira &
Medeiros, 2019).
A Figura 6 foi elaborada de forma a explicitar os dados da frequência das
respostas de pressão à barra obtidos no experimento de esquema de reforçamento
de intervalo fixo (IF) 2, 4 e 6 segundos. Os dados foram dispostos em uma curva de
frequência acumulada, sendo que o tempo foi medido em segundos.

Intervalo Fixo 2s, 4s e 6s


60

50

40
Frquência

30

20

10

0
65
10
15
20
25
30
35
40
45
50
55
60

70
75
80
85
90
95
1
5

100
105
110
115
120
125
130
135
140
145
150
155
160
165

Tempo (s.)

IF 2s IF 4s IF 6s
Figura 6 – Curva de frequência acumulada de respostas de pressão à barra (RPB) reforçadas no
experimento de esquema de reforçamento intermitente de intervalo fixo (IF).

Na Figura 6 as três curvas de IF demonstram longas pausas sendo


representadas pelos segmentos retos compatíveis com o eixo horizontal do tempo,
diante desse fenômeno, as taxas de respostas são consideravelmente baixas apesar
de apresentarem uma constância até que o software libere o reforço para o sujeito
(Moreira & Medeiros, 2019). Isso pode ser visto na curva IF2s em alguns segundos
como no 30s até o 55s e no 64s até 79s. A mesma coisa se aplica nas outras duas
curvas (IF4s e IF6s) onde demonstram ser muito mais constantes do que a de 2
segundos, essa inclinação denomina-se scallop que é quando ocorre um crescimento
rápido dos RPBs após a longa pausa pós-reforçamento, que faz com que a curva se
incline mais e depois se estabilize. Em um esquema de reforçamento de intervalo fixo
as taxas são menores, pois o reforçador só será liberado depois de um determinado
período de tempo, sendo estes de 2, 4 e 6 segundos (Moreira & Medeiros, 2019). No
esquema de IF2s o sujeito obteve 103 respostas acumuladas, no IF4s o sujeito
produziu 49 RPBs sendo estes 36 com reforço e 13 sem, já o IF6s apresentou um
total de 43 RPBs. A curva do esquema de intervalo fixo de 2 segundos permaneceu
mais inclinada que a do de variável devido ao erro do examinador na observação, pois
o IF2s teve duração total de 19 minutos, porém, dentre esses 19 minutos os
analisandos permaneceram 8 minutos parados sem anotar os dados, o que ocasionou
uma maior taxa de frequência de respostas, já que neste período de tempo o sujeito
acumulou 45 RPBs.
Para finalizar a apresentação dos dados dos experimentos de reforçamento
intermitente, na Figura 7 foi elaborada uma curva de frequência acumulada de
respostas de pressão à barra obtido no intervalo variável (IV) de 2, 4 e 6 segundos –
seguindo os mesmos padrões de cores e disposição da figura anterior.
Intervalo Variável 2s, 4s e 6s
120

100

80
Frquência

60

40

20

0
30
10

50
70
90
110
130
150
170
190
210
230
250
270
290
310
330
350
370
390
410
430
450
470
490
510
530
550
570
590
610
Tempo (s.)

IV 2s IV 4s IV 6s

Figura 7 – Curva de frequência acumulada de respostas de pressão à barra (RPB) reforçadas no


experimento de esquema de reforçamento intermitente de intervalo variável (IV).

A Figura 7 apresenta 3 curvas de um esquema de IV que possuem poucas


pausas de pós-reforçamento. Na curva azul representada pelo IV de 2 segundos, o
sujeito acumulou 119 RPBs nas quais 101 foram com reforços e as outras 18 foram
sem reforço. Na curva de IV4s o rato apresentou 68 RPBs e na curva de IV6s 201
RPBs. Pode-se observar que a Figura 7 possui uma inclinação menor comparado com
as curvas de frequência dos gráficos apresentados anteriormente, no entanto,
apresenta uma similaridade ao gráfico da Figura 6 por conta de erros cometidos no
momento da observação do experimentador durante o experimento, ocasionando uma
alteração dos dados e informações. Em contrapartida, há uma falta dos segmentos
paralelos ao eixo horizontal do gráfico, que consistem na pausa após um reforçador
ser liberado, isso se deve ao fato de que, como o experimento se baseia em um
intervalo variável de tempo, o sujeito não consegue presumir quando irá receber a
pelota de alimento, portanto, tende a pressionar mais vezes a barra a fim de não
perder o reforçador (Moreira & Medeiros, 2019).
A Figura 8 apresenta um histograma comparativo das frequências de respostas
de pressão à barra obtidas nos experimentos de esquema de reforçamento
intermitente de razão fixa e razão variável de acordo com cada razão utilizada pelos
experimentadores, a fim de explicitar as semelhanças e diferenças mais notáveis
destes experimentos.

frequência de RPB em RF e RV
120
108
104
100

80
Frequência

60

40 36
30
20 22
20

0
2 RBP 4 RBP 6 RBP

RF RV

Figura 8 – Histograma comparativo entre as frequências das respostas de pressão à barra (RPB) nos
experimentos de esquema de reforçamento intermitente de razão fixa (RF) e razão variável (RV) de
acordo com cada razão utilizada.

A partir da análise dessa figura, é possível perceber que a frequência no


experimento de razão variável é maior do que a de razão fixa nos 3 experimentos (2
RPB, 4RPB e 6RPB). Segundo Moreira e Medeiros (2019) o padrão comportamental
do esquema de reforçamento de razão variável é caracterizado por altas taxas de
resposta e pausas pós-reforçamento praticamente ausentes e ou irregulares.
Enquanto o padrão comportamental de razão fixa é caracterizado por pequenas
pausas pós-reforçamento e alta taxa de resposta. A partir da literatura percebe-se que
os resultados do experimento foram os esperados, uma vez que a taxa de resposta
na razão variável é mais alta devido as pausas pós-reforçamento serem irregulares,
na medida que o de razão fixa tem mais pausas frequentes, influenciando assim a
frequência de todos os experimentos.
Enquanto a Figura 9 foi elaborada com os dados obtidos nos experimentos de
reforçamento intermitente de intervalo fixo e variável de 2, 4 e 6 segundos cada. A
figura foi construída com o intuído de facilitar a compreensão das diferenças e
semelhanças dos respectivos experimentos.

frequência de RPB em IF e IV
120
103 101
100

80
69
Frequência

60
43 43
40 36

20

0
2s 4s 6s

IF IV

Figura 9 – Histograma comparativo entre as frequências das respostas de pressão à barra nos
experimentos de esquema de reforçamento intermitente de intervalo fixo (IF) e intervalo variável (IV)
de acordo com os segundos de cada intervalo escolhido.

A partir da análise desse histograma, é possível perceber que a frequência no


experimento de intervalo variável (4 segundos, 6 segundos) é maior do que a
frequência no do intervalo fixo (4 segundos, 6 segundos), porém, a frequência do
intervalo fixo 2 segundos foi maior do que a do intervalo variável 2 segundos. Segundo
Moreira e Medeiros (2019) o intervalo fixo possui baixas taxas de respostas e
consistentes pausas pós reforçamento. Isso ocorre porque as respostas ao longo do
intervalo nunca são reforçadas, causando assim a extinção. Sendo assim, é muito
improvável sua frequência ser alta. Já o intervalo variável é conhecido por ser um
esquema que possui taxas moderadas e constantes de respostas e ausência de
pausas pós reforçamento. Os autores explicam que essa ausência ocorre porque as
vezes respostas ocorridas imediatamente após a apresentação do estímulo reforçador
são novamente reforçadas, mas, em outras, só serão reforçadas após longos
intervalos (pág. 131). Através da literatura, conclui-se que os resultados para o
experimento foram o esperado na comparação entre o IF4 e o IV4 e entre o IF6 e o
IV6, visto que o intervalo fixo é esquema que produz maiores pausas pós reforçamento
e, consequentemente menores taxas de respostas também.
O fato da frequência do IF2 ter sido maior do que a do IV2 é justificado pelo
acontecimento de que o IF2 teve 19 minutos de duração, e dentre esses 19 minutos,
os pesquisadores cometeram um erro e não registraram as respostas de pressão a
barra durante 8 minutos, causando assim, uma diferença de 2 RPB a mais em relação
ao IV2.
A Tabela 3 foi preparada com os mesmos dados utilizados anteriormente nas
Figuras 01, 02, 03 e 04 referentes aos experimentos de reforçamento intermitente de
razão fixa e variável – de 2, 4 e 6 – e intervalo fixo e variável – de 2, 4 e 6 segundos.
Além das frequências utilizadas, na tabela consta o tempo em minuto de cada
experimento, sendo calculada, assim, a taxa em resposta/minuto (r/min.) de cada
esquema.

IF IV RF RV

2s 4s 6s total 2s 4s 6s total 2 4 6 total 2 4 6 total

Frequência 103 36 43 182 101 43 69 213 104 20 30 154 108 22 36 166

Tempo
11 5 10 26 10 5 10 25 14 5 10 29 14 5 10 29
(min.)

Taxa
9,4 7,2 4,3 21 10 8,6 7 25,6 7,4 4 3 14,4 7,7 4,4 3,6 15,7
(r/min.)

Tabela 3 – Tabela comparativa da frequência, tempo (min.) e taxa das respostas de pressão à barra (RPB)
nos experimentos de esquema de reforçamento intermitente de intervalo fixo (IF), intervalo variável (IV),
razão fixa (RF) e razão variável (RV).

Na Tabela 3 fica evidente um padrão nas taxas encontradas de respostas de


pressão à barra em cada um dos esquemas de reforçamento: a taxa diminui de acordo
com o aumento do tempo do intervalo/valor da razão. Como exemplo o primeiro
experimento apresentado, o de intervalo fixo (IF), as taxas encontradas de 2, 4 e 6
segundos de intervalo são 9,4 r/min, 7,2 r/min e 4,3 r/min, respectivamente. No entanto
os resultados encontrados no esquema de IF, especificamente, não foram os
esperados, ou seja, não são correlatos com o que a literatura diz. Segundo Moreira e
Medeiros (2019), o esquema de reforçamento de intervalo variável produz as menores
taxas de respostas em comparação com os outros esquemas de reforçamento
intermitente (IV, RF e RV), devido ao intervalo definido para liberação da recompensa,
o que gera uma improbabilidade da ocorrência do comportamento dentro deste
intervalo – o que não geraria recompensa. Essa discrepância entra os resultados
obtidos e a literatura pode ser explicada pelo fato de que o experimento de esquema
de IF foi o primeiro a ser realizado pelas experimentadoras entre os esquemas
intermitentes, o que pode ter gerado uma ansiedade e influenciado o registro correto
dos dados. Essa incoerência com a literatura também ocorre no experimento do
esquema de intervalo variável (IV), que teoricamente era para apresentar uma taxa
de resposta moderada em comparação com os esquemas de razão, aspecto que não
é observado na tabela, mas sim que o esquema de IV possui a taxa mais alta de todos
os esquemas (Moreira & Medeiros, 2019). Já nos esquemas de razão os dados foram
correlatos com a teoria no que diz respeito à taxa mais alta de respostas no esquema
de RV (7,7 r/min, 4,4 r/min e 3,6 r/min) em relação À RF (7,4 r/min, 4 r/min e 3 r/min),
visto que neste primeiro quase não há pausas pós-reforçamento, enquanto que no
segundo caso essa pausa está presente, mesmo que de maneira reduzida (Moreira &
Medeiros, 2019).
CONSIDERAÇÕES FINAIS

Diante dos experimentos realizados ao longo do trabalho em questão, o


principal aprendizado que se estabeleceu foi que nós, seres humanos, somos muito
mais complexos que os ratos, no entanto, os princípios do behaviorismo são os
mesmos. Somos modelados pelo ambiente em que crescemos e vivemos bem como
o rato virtual em que trabalhamos. Vale ressaltar que só aprendemos quando estamos
motivos para aprender e esta situação foi devidamente compreensível nos
experimentos. Algumas vezes era necessário voltar e fortalecer um determinado
comportamento do sujeito, uma vez que a resposta que queríamos que fosse emitida
não estava fortalecida. Esse trabalho nos proporcionou um ampliamento de
conhecimento, pois obtivemos uma visão mais clara de como é condicionar e modelar
um organismo, aplicando toda a parte teórica em que aprendemos dentro de sala de
aula. Ademais, foi possível compreender como o behaviorismo trabalha com a
observação e a relação do comportamento diante de suas contingências.
FOLHAS DE REGISTRO DOS EXPERIMENTOS REALIZADOS

NÍVEL OPERANTE
TREINO AO COMEDOURO
MODELAGEM
ESQUEMA DE REFORÇAMENTO CONTÍNUO (CRF)
INTERVALO FIXO 2s
INTERVALO FIXO 4s
INTERVALO FIXO 6s
INTERVALO VARIÁVEL 2s
INTERVALO VARIÁVEL 4s
INTERVALO VARIÁVEL 6s
RAZÃO FIXA 2
RAZÃO FIXA 4
RAZÃO FIXA 6
RAZÃO VARIÁVEL 2
RAZÃO VARIÁVEL 4
RAZÃO VARIÁVEL 6
REFERÊNCIAS

Alloway, T.; Wilson, G. & Graham, J. (2006). Sniffy: o rato virtual. São Paulo: Thomson Learning.

Andery, M. A; Micheletto, N. & Sério, T. M. (2009). Notas sobre a atualidade de Ciência e


Comportamento Humano, PUC-SP.

Andery, M. A.; Sério, T. M. (1999). O conceito de metacontingências: afinal, a velha contingência de


reforçamento é suficiente? (Cap. 12 p. 106-116). Sobre Comportamento e Cognição: Santo André.

Baum, W. M. (2005). Compreender o behaviorismo: Comportamento, cultura e evolução (2ª ed.) Porto
Alegre: Artmed.

Baum, W. M. (2012). Repensando o reforçamento: alocação, indução e contingência. (Tradução por


Diego Lima; Lunna Toffano de Abreu e Lima; Karollane Sapucaia; Andresa De Souza e Guilherme
Chirinéa)

Catania, A. C. (1999). Aprendizagem: Comportamento, linguagem e cognição (4ª ed.). Porto Alegre,
RS: Artmed. (Original publicado em 1998).

Ferster, C. B. & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.

Gomide, P. I. C. & Weber, L. N. D. (1993). Análise Experimental do Comportamento: Manual de


Laboratório (3ª ed.) pp. 59-64. Curitiba, PR: Editora UFPR.

Guilhardi, H. J. (2017). Comportamento verbal e reforço natural. São Paulo: Instituto de Terapia por
Contingências de Reforçamento Campinas.

Hanna, E. & Moreira, M. (2012). Bases Filosóficas e Noção de Ciência em Análise do Comportamento
Fundamentos de Psicologia: temas clássicos de psicologia à luz da análise do comportamento (cap. 1,
pág. 1-20). Editora: Guanabara Koogan.

Lopes, Carlos Eduardo. (2008). Uma proposta de definição de comportamento no behaviorismo radical.
Revista Brasileira de Terapia Comportamental e Cognitiva, 10(1), 1-13. Disponível em:
“<http://pepsic.bvsalud.org/scielo.php?script=sci_arttext&pid=S151755452008000100002&lng=pt&tlng
=pt.>”. Acesso em 14 de out. de 2020.

Matos, C. F. F. (2007). Comportamento operante. Disponível em:


<https://www.redepsi.com.br/2007/03/26/comportamento-operante/>. Acessado em 14 out. 2020.

Medeiros, C. Moreira, M. (2019). Princípios Básicos da Análise do Comportamento. São Paulo. Artmed

Micheletto, N. (1999). Bases filosóficas do Behaviorismo Radical. (Cap. 5, pág. 29-44). Sobre
Comportamento e Cognição: Santo André.

Micheletto, N. (1999). Variação e seleção: as novas possibilidades de compreensão do comportamento


humano (Cap. 13, pág. 117-131). Sobre Comportamento e Cognição: Santo André.
Moreira, M. B., Carvalho, L. C. (2017). Uma história de aprendizagem operante (1ª ed.). Brasília:
Instituto Walden4.

Ramos-Cerqueira, A. T. A. et al. (1999). Sobre Comportamento e Cognição: aspectos teóricos,


metodológicos e de formação em análise do comportamento e terapia cognitivista (2ª ed.). Santo André,
SP: ARBytes.

Silva, M. B.; Silva, R. S.; Silva, A. B. D. (2016). Reforçadores primários e secundários: uma análise das
contingências contidas no filme “Quem Quer Ser Um Milionário?”. CAOS – Congresso Acadêmico de
Saberes em Psico (v.1, 2016).

Skinner, B. F. (2003). Ciência e comportamento humano. São Paulo: Martins Fontes (Original publicado
em 1953).

Skinner, B. F. (1969). Contingências do reforço, uma análise teórica. Nova Jersey: Prentice-Hall.

Skinner, B. F. (1982). Sobre o behaviorismo. São Paulo, SP: Cultrix. (Original publicado 1974).

Sidman, M. (2009). Coerção e suas implicações. Tradução de Maria Amália Anderry e Tereza Maria
Séiro. [S.l.]: Livro Pleno.

Todorov, J. C. (2002). A evolução do conceito de operante. Psicologia: Teoria e Pesquisa, 18(2), 123-
127. https://doi.org/10.1590/S0102-37722002000200002

Watson, J. B. (1913). Psychology as the behaviorist views it. Psychological Review, 20(2), 158–177.

Você também pode gostar