Você está na página 1de 17

Curso de Bacharel em Psicologia

Disciplina: Análise Experimental do Comportamento I

Esquemas de reforçamento: Jerry recebe treinamento


Ariel Cristina de Melo Recio Torres – RGM: 1772328-1

Brasília

Novembro de 2018

RESUMO
Torres, A. C. M. R., Marinho, N. L., (2018). Análise Experimental do Comportamento.
Relatório Final. Departamento de Psicologia, Centro Universitário do Distrito Federal (UDF),
Distrito Federal.

O presente relatório se trata de um relato do experimento laboratorial feito em sala de aula


com o software Sniffy Pro for Windows – O Rato Virtual, com embasamento nas teorias da
Análise Experimental do Comportamento e na Caixa de Skinner. As atividades laboratoriais
empregaram o rato virtual como sujeito experimental junto aos conceitos de condicionamento
operante. O objetivo do experimento foi o condicionamento do rato virtual. Para isso foi feito
o registro de oito procedimentos: nível operante, treino ao comedouro, modelagem,
reforçamento contínuo, extinção, recondicionamento, discriminação e esquemas de
reforçamento. Neste relatório contém a descrição do sujeito experimental, do ambiente, dos
materiais, dos instrumentos e dos procedimentos detalhados, assim como os resultados junto
aos gráficos, e também, as folhas de registro utilizadas durante as aulas. Os gráficos
apresentados forma: nível operante versus reforçamento contínuo; fases experimentais
(modelagem, extinção e recondicionamento); treino discriminativo e por último um painel
comparativo dos esquemas de reforçamento VR20 e FR50. Por fim, foi apresentada um breve
discursão acerca dos resultados obtidos, e se, o objetivo do experimento foi atingido com
sucesso.

Palavras-chave: Caixa de Skinner; Sniffy pro for Windows; Análise experimental do


comportamento; Atividades laboratoriais; Rato virtual; Nível operante; Treino ao comedouro;
Modelagem; Reforçamento continuo; Extinção; Recondicionamento; Discriminação;
Esquemas de reforçamento.

1
Sumário
Resumo i
Sumário ii
Introdução 3
Método 5
Resultados 9
Discussão 13
Referências
bibliográficas.....................................................................................................14
Anexos................................................................................................................15

2
O presente experimento e relatório são baseados no comportamento operante, termo

cunhado por B. F. Skinner. Chama-se de operante aquele comportamento que produz

modificações no ambiente, e são influenciadas por essas consequências. É através do

comportamento operante que aprendemos novas habilidades, conhecimentos e até mesmo

nossa personalidade (Moreira e Medeiros, 2007, p. 47).

A definição de reforço, ainda segundo Skinner, a partir dos conceitos abordados em

aula pelo Professor Gustavo Tozzi, é todo e qualquer evento que ocorre tornando uma reação

mais frequente, aumentando a possibilidade desta reação se repetir.

Assim, o estudo em questão classifica-se como descritivo. Nessa linha foram

observados, registrados e descritos os seguintes comportamentos: pressionar a barra, farejar,

levantar, limpar-se e beber água. Quanto aos procedimentos, foram observados os: nível

operante (NO), treinamento ao comedouro, modelagem (MOD), reforço contínuo (CRF),

extinção (EXT), recondicionamento (REC), discriminação (DISC) e esquemas de

reforçamento (variável e fixa).

O nível operante (NO) foi feito para que obter uma linha de base e comparação para

saber, se, houve ou não a modelagem. E o treino ao comedouro teve com objetivo tornar o

som do comedouro um estímulo discriminativo.

No procedimento de modelagem (MOD) existe comportamentos iniciais e

intermediários que são modelados pelo reforçamento positivo. Ou seja, segundo Moreira e

Medeiros modelar “é uma técnica usada para ensinar um comportamento novo por meio de

reforço diferencial de aproximações sucessivas do comportamento alvo” (2007, p.62).

3
No esquema de reforçamento contínuo (CRF) a resposta emitida pelo organismo

sempre será reforçada, assim, todas as vezes que o organismo emitir uma resposta o reforço

virá logo em seguida. Portanto, o intuito é reforçar um comportamento desejado, ou seja, é

um processo de aprendizagem para que um novo comportamento seja aprendido. Para

Moreira e Medeiros (2007, p. 117), o CRF “toda resposta é seguida pelo reforçador.”

A extinção (EXT) operante é o retorno do comportamento ao nível operante após a

suspensão do reforço, ou seja, quando o reforço é suspenso gradativamente até seus níveis

básicos (nível operante), portanto, entende-se que os efeitos dos reforçadores são

temporários. Para haver a extinção, o comportamento tem que ser reforçado continuamente

antes. E após, recondicionamos o comportamento modelando-o novamente, porém esse

processo será mais rápido que a modelagem inicial.

No esquema de reforçamento intermitente o comportamento não mais será reforçado a

cada resposta, ou seja, aqui a resposta não será seguida de um reforçador. Nesse caso, o

reforçador virá de forma descontínua. O reforçamento intermitente é subdividido em quatros

vertentes, são elas: razão fixa, razão variável, intervalo fixo e intervalo variável. Para este

estudo, somente conceituaremos os termos de razão fixa (FR) e razão variável (VR).

O objeto da Análise Experimental do Comportamento é o comportamento, portanto, o

objeto do presente experimento é o comportamento do Rato Virtual, apelidado de Jerry. O

objetivo é condicionar o comportamento, através de reforços, do Jerry para que ele

pressionasse a barra sozinho e, assim, conseguir uma pelota de alimento.

4
MÉTODO
Sujeito

Para a realização deste experimento foi utilizado o simulador operacional Sniffy Pro

for Windows, que consiste em um rato virtual (Jerry) como sujeito experimental. O software

trata-se de um programa de computador desenvolvido por três psicólogos: Tom Alloway, Jeff

Graham e Lester Kramer. Esse software simula uma Caixa de Skinner, permitindo a

realização de experimentos de condicionamento clássico e operante sem o uso de um animal

vivo.

Ambiente, materiais e instrumento

O experimento foi realizado no laboratório de Análise Experimental do

Comportamento do Centro Universitário do Distrito Federal - UDF, onde o sujeito utilizado

era um rato virtual, portanto, se tratava de um laboratório de informática. O ambiente

consistia numa sala considerada grande, com tamanho aproximado de 21x9 metros,

possuindo cerca de 78 computadores distribuídos em fileiras, contendo em cada, mais ou

menos, 4 ou 5. A iluminação e temperatura são artificiais, sendo a temperatura produzida por

um ar condicionado. Nessa aula, alunos, de ambos os sexos e em duplas, realizavam o mesmo

experimento, contabilizando cerca de 50 alunos por aula. Portanto, esse ambiente não

facilitava a realização do experimento, influenciando diretamente em um dos procedimentos

que seria necessário o uso do som.

Para a realização do experimento foram necessários os seguintes materiais:

computador com o software Sniffy Pro for Windows instalado, folhas de registro (anexo)

5
para cada procedimento (8 no total), lápis, cronômetro (relógio ou cronômetro virtual obtido

da web) e calculadora. O presente experimento foi feito em laboratório de informática

durante 6 semanas, um dia por semana, com a instrução do Professor Gustavo Tozzi para fins

didáticos.

Procedimento

O primeiro procedimento realizado foi a prática do Nível Operante (NO). Nós

abrimos o software, abrindo automaticamente um rato experimentalmente ingênuo e clicamos

em Experimente e em seguida Design Operant Experiment, marcando Extinction. Nós

observamos e registramos, durante 20 minutos de minuto a minuto, a quantidade em que os

seguintes comportamentos foram apresentados: pressão a barra; farejar; levanta; limpar-se;

beber água. Ao final de cada procedimento nós salvamos o arquivo com o nome do

procedimento realizado, para que no próximo, abríssemos o que tínhamos feito.

Na semana seguinte fizemos o treino ao comedouro. Abrimos o arquivo “NO” e

repetimos os mesmos passos, porém ao invés de Extinction marcamos Continuous. O

objetivo desta prática foi tornar o som do comedouro um estímulo discriminativo, então, o

resultado final foi que sempre que havia o som, ele ia ao comedouro. Para que isso ocorresse,

nós liberamos muitas pelotas de alimento, não deixando-o ficar longe do comedouro. Por fim,

registramos a duração do experimento e a quantidade pelotas apresentadas.

No mesmo dia da prática treino ao comedouro, fizemos a Modelagem (MOD). Ao

abrir o arquivo “treino ao comedouro”, a prático se iniciou imediatamente, portanto, só o

abrimos quando as instruções (folha de registro) já estavam lidas. O objetivo dessa prática foi

ensinar o comportamento de pressionar a barra através da modelagem por aproximações

6
sucessivas. O primeiro passo foi escolher um comportamento que o nosso rato apresentasse

com uma certa frequência, o escolhido foi “farejar”, e toda vez que ele farejava nós dávamos

uma pelota de alimento. Nós fomos reforçando os comportamentos de “farejar próximo ao

comedouro” e “levantar próximo ao comedouro” antes de reforçarmos o comportamento de

pressionar a barra. Repetimos esse processo de reforçamento até que o Jerry pressionasse a

barra sozinho.

Após a modelagem fizemos a prática de reforçamento contínuo (CRF). Abrimos o

arquivo “MOD”, e novamente, assim que aberto a sessão experimental começou

imediatamente. Nós registramos, durante 20 minutos, a frequência de pressão a barra, farejar,

levantar, limpar-se e beber água.

No mesmo dia do CRF, fizemos também a pratica de extinção (EXT). Abrimos o

arquivo “CRF”, clicamos em Experiment e selecionamos a opção Design Operant

Experiment. Na janela aberta, clicamos em Extinction e deixamos a opção “Mute Pellete

Dispenser” marcada, habilitando tanto o reforçador primário (comida) quanto o secundário

(som). Registramos a frequência das respostas emitidas pelo sujeito: pressão a barra, farejar,

levantar, limpar-se e beber água. O exercício se encerrou quando o Jerry passou 5 minutos

consecutivos pressionando a barra não mais que duas vezes, podendo durar mais ou menos do

que 20 minutos.

Agora foi necessário aumentar novamente a frequência de pressão a barra, e fizemos

isso através do recondicionamento (REC). Abrimos o arquivo “EXT”, clicamos em

Experiment e logo em seguida em Design Operant Experiment. Na janela que se abriu,

clicamos em Continuous. Nesse procedimento nós selecionamos a pressão a barra novamente

e repetimos o procedimento inicial da modelagem, dando uma pelota de alimento sempre que

o Jerry chegava perto do comedouro. Anotamos o tempo que durou para que o Jerry

7
começasse a pressionar a barra. Assim que esse comportamento voltou ao repertório do rato,

começamos a registrar a frequência em que ele pressionava a barra, num período de 15

minutos.

O penúltimo procedimento foi o de discriminação (DISC). Novamente, abrimos o

arquivo do procedimento anterior, “REC”, clicamos em experimente, design Operant

experimente, escolhemos o tom S+ (1.25) e S- (1.0) no item discrimination e clicamos em

OK. Começamos então a registrar a frequência de pressão a barra durante a ocorrência do S+

e do S- por 30 minutos. Por conta do ambiente de sala de aula, não analisamos o som e sim a

vigência do S+ e S- através do gráfico acumulado do programa. Para isso, clicamos em

Windows e em cumulative record.

O ultimo procedimento foi o de esquemas de reforçamento, nós avaliamos o

comportamento de pressão a barra em dois esquemas distintos de reforçamento: VR e FR.

Cada esquema foi avaliado com dois tamanhos de componentes diferentes na seguinte ordem

de experimento: VR10, VR20, FR35 e FR50. Para isso, abrimos o arquivo “DISC”, clicamos

em experiment, design operant experiment e selecionamos variable. No espaço reservado

para o tamanho do componente do esquema, colocamos 10. Então, observamos, durante 20

minutos, todas as respostas ocorridas neste período, registrando na planilha 1. Além disso, na

segunda coluna, registramos o numero de reforçadores liberados por minuto. Finalizamos os

primeiros 20 minutos e salvamos o arquivo: EsqVR10.

Finalizada a primeira etapa, repetimos o mesmo processo da etapa anterior, porém

aumentando o tamanho do componente do esquema VR para 20. Registramos os mesmos

dados, durante 20 minutos, na planilha 2. Salvamos como EsqVR20. Finalizada a etapa,

mudamos o esquema de reforçamento de razão variável (VR) para razão fixa (FR)

selecionando Fixed. No espaço para o tamanho do componente, colocamos o valor 35.

8
Observamos, então, durante 20 minutos, todas as respostas ocorridas, registrando em na

planilha 3. Salvamos como EsqFR35. Para finalizar, repetimos o mesmo processo da etapa

anterior, porém aumentando o tamanho do componente do esquema FR para 50. Os mesmos

dados foram registrados na planilha 4, durante 20 minutos. Salvamos EsqFR50.

RESULTADOS
O objetivo dessa seção é apresentar os dados quantitativos coletados no experimento

realizado com o programa Sniff Pro for Windows. Tal treinamento tem o objetivo de habilitar

o estudante de psicologia para a prática da observação comportamental com base nas

premissas discutidas por Skinner. Serão apresentados quatro gráficos: comparativo entre NO

e CRF; um do treino discriminativo; das fases experimentais MOD, EXT e REC; e por último

um painel comparativo entre o VR20 e o FR50. E logo a baixo, terá uma pequena descrição

dos resultados obtidos.

9
NO versus CRF

222
Frequência Absoluta

140
118

78

35 33
24
11 4
3
Pressão a barra Farejar Levantar Limpar-se Beber água

Respostas

NO CRF
Gráfico 1: Respostas acumuladas observadas durante as fases de Nível Operante e
Reforçamento Contínuo (CRF) conforme categorias de respostas.

Ao se comparar (gráfico 1) o Nível Operante (NO) e o CRF observou-se que os

comportamentos no nível operante em maior frequência são os de reflexos inatos, visto que

farejar se repetiu por 140 vezes, levantar-se 78, limpar-se 33, beber água 11, sendo isso

dentro do tempo observado de 20 minutos. O comportamento de pressão a barra nesse

primeiro momento, por não se tratar de um comportamento inato, se repetiu apenas 3 vezes.

No CRF, podemos perceber a inversão do NO, pois, houve, entre um e outro, a modelagem

do comportamento de pressão a barra. Portanto, a frequência dos reflexos inatos foi menor

que o comportamento modelado. Em outras palavras, no CRF a barra de "pressão à barra" é

maior pois houve contingência de reforçamento. As outras barras são menores pois não houve

esta contingência, ou seja, o rato não poderia farejar e pressionar a barra ao mesmo tempo.

No NO não houve contingência de reforçamento.

10
Fases Experimentais
19

17
Tempo em minutos

6.48

MOD EXT REC

Gráfico 3: Comparação do tempo entre início da modelagem, extinção e a duração do


recondicionamento. Comportamento de pressão a barra.

Ao comparar, como mostra o gráfico3, a duração para modelagem, extinção e

recondicionamento, percebemos que na modelagem o tempo foi maior que no

recondicionamento. Isso aconteceu porque na modelagem nós ensinamos um novo

comportamento de pressionar a barra, que até então era muito raro e não se encontrava no

repertório comportamental do ratinho, então, levou-se 19 minutos para que isso ocorresse.

Após a modelagem, houve a extinção, portanto, a frequência do comportamento selecionado

retornou ao Nível Operante. Então, foi necessário aumentar novamente essa frequência

através do recondicionamento. O recondicionamento foi mais rápido, levando apenas 6:48

minutos, pois o comportamento de pressão a barra já estava no repertório do sujeito. Mesmo

ele tendo sido extinto.

11
Discriminação
120

100
Frequência Acumulada

80

60 S+
S-
40

20

0
1 3 5 7 9 11 13 15 17 19 21
Tempo em Minutos

Gráfico 4: Quantidade de respostas acumuladas de pressão à barra observadas durante a fase


de discriminação por um período de 35 minutos.

No gráfico 4, o S+ corresponde ao estímulo discriminativo enquanto o S- ao estímulo

delta. Nos primeiros momentos do experimento, o sujeito ainda não tinha feito a

discriminação, ou seja, ele emitiu mais ou menos o mesmo número de respostas para ambos

os estímulos presentes. Porém, quando a discriminação foi feita, ele continuou emitindo uma

mesma quantidade de resposta no estímulo discriminativo e começou a discriminar o

estímulo delta, emitindo assim um número menor de respostas.

Painel comparativo: VR20 e FR50

12
Frequência Acumulada

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Tempo em minutos

Gráfico 5: Quantidade de respostas acumuladas de pressão à barra observadas


durante a fase de reforçamento fixo e variável por um período de 20 minutos.

Foi identificado no gráfico 5, o padrão breaking run, ou seja, quanto maior o

componente (10, 20,35,50) maior a pausa para o reforço. Portanto, no procedimento

esquemas de reforçamento observou-se uma média variável do número de respostas para que

o reforço fosse liberado. As respostas eram as quantidades de pressões a barra realizadas pelo

rato, e os reforços, a quantidade de pelotas liberadas e ingeridas pelo rato, tudo isso sendo

registrado nas planilhas de minuto a minuto, até completar o total de 20 minutos. Na planilha

1 (VR10), o número de respostas exigido para cada reforço varia, gerando um total de 498

respostas, para 36 reforços. Na planilha 2 (VR20), o número de respostas exigido para cada

reforço também varia, mas as quantidades de reforços diminuíram. Foram um total de 683

respostas e 22 reforços. Na planilha 3 (FR35), o total de respostas foram 657 e 9 reforços. Na

planilha 4 (FR50), o total de respostas foram 581 e 4 reforços. Observou-se que a quantidade

de reforçador diminuiu e nem por isso reduziu o padrão de responder. Mostrando que seria

importante a manutenção da resposta.

13
DISCURSSÃO

A partir da análise dos resultados, obtidos com os experimentos, demonstrados no

item “resultados”, para Nível Operante versus CRF, fases experimentais, treino

discriminativo e painel comparativo dos esquemas de reforçamento, respectivamente,

verificou-se que há coerência entre os dados coletados e as afirmações feitas na introdução

deste relatório. O experimento mostrou que na análise do comportamento é possível modelar

comportamentos e também colocar esses comportamentos em extinção, podendo então

melhorar a qualidade de vida do indivíduo.

Os resultados obtidos, mostram que, nas condições favoráveis, o estudo pode ser

replicado e, também, relacionado diretamente com as vivências do dia a dia. Durante o

percurso, foram encontrados diversos obstáculos. Não conseguimos usar o som em sala de

aula, nem sempre a dupla estava completa, e até mesmo os procedimentos tiveram erro na

hora de salvar. Portanto, quando replicado, deverá prestar atenção e tomar cuidado com todas

essas variáveis.

Podemos assim destacar algumas modificações que devem ser feitas em futuras

replicações. A primeira delas seria não faltar nenhum procedimento, e estar sempre com sua

dupla para que não haja dificuldade para interpretar as folhas de registro e facilitar a

elaboração do relatório. Nesse sentido, poderia também utilizar de fones de ouvido nos

procedimentos que necessitam do som, tal qual o treino discriminativo.

14
REFERÊNCIAS BIBLIOGRÁFICAS

Moreira, M. B., & Carvalho. L. C. (2007). Princípios básicos da análise do comportamento

(1ª edição). Porto Alegre: Artmed.

15
ANEXOS

16

Você também pode gostar