Você está na página 1de 6

PSICOLOGIA COMPORTAMENTAL II

4o SEMESTRE
ESQUEMAS DE REFORAMENTO
O princpio bsico da Anlise Experimental do Comportamento o de que os
comportamentos operantes so controlados pelas suas conseqncias (ou estmulos
conseqentes). Isto significa que os comportamentos podem aumentar ou diminuir de
freqncia, em funo dos estmulos conseqentes que os seguem.
Um dos estmulos conseqentes estudados diz respeito ao reforo positivo, o qual
utilizado no procedimento de reforamento positivo. Este estmulo chamado reforo
positivo porque apresentado imediatamente aps uma dada resposta e aumenta a
freqncia dessa resposta. Pense no caso do comportamento de pedir um cigarro a um
colega. O reforo positivo esperado receber o cigarro (apresentao de cigarro). Quando
ele liberado, a probabilidade futura da emisso dessa resposta maior. Agora pense mais
um pouco: sempre que algum emite esse comportamento reforado? Nem sempre... e
pelos mais variados motivos: a pessoa a quem se pediu no fuma, ou no tem cigarros no
momento ou talvez no queira dar o cigarro!
Assim, muitos outros comportamentos nem sempre so reforados em todas as vezes que
os emitimos e, mesmo assim, ns continuamos a emiti-los... Isso nos leva a pensar que
exista uma programao para a ocorrncia do reforo, seja ela planejada previamente ou
no.
O modo pelo qual a ocorrncia do reforo programada denomina-se esquema de
reforamento.
Pode-se dividir os esquemas de reforamento em duas classes genricas: o esquema de
reforamento contnuo e o esquema de reforamento intermitente, de acordo com Whaley e
Malott (1980).
Quando se fala em um esquema de reforamento contnuo ou CRF (abreviao de
Contnuos Reinforcement), quer-se dizer que toda vez que uma dada resposta for emitida,
ela ser reforada. Por exemplo, em relao s respostas de pressionar a barra de um rato
albino, utiliza-se a apresentao de uma gota de gua como reforo positivo. Emprega-se
um esquema de CRF quando se programa que todas as respostas de pressionar a barra
emitidas sero reforadas com a apresentao da gota dgua.
Quando se fala em um esquema de reforamento intermitente, quer-se dizer que algumas
respostas sero reforadas.
O meio mais rpido e eficiente para se estabilizar rapidamente a freqncia de um
comportamento, aps a sua instalao no repertrio comportamental de um sujeito,
reforar cada resposta emitida, ou seja, utilizar um esquema de reforamento contnuo ou
CRF. No entanto, este no o meio mais econmico nem mais adequado para se manter um
comportamento depois de aprendido. Uma vez condicionado, este comportamento
geralmente reforado atravs de um esquema de reforamento intermitente.
Em relao aos esquemas intermitentes, sero analisados quatro esquemas bsicos,
divididos em duas classes: os de razo (fixa e varivel) e os de intervalo (fixo e varivel).

O diagrama resume os esquemas bsicos:


Esquemas de Reforamento
l. Contnuo ou CRF
2. Intermitentes: em razo (fixa ou varivel)
de intervalo (fixo ou varivel)

ESQUEMAS DE REFORAMENTO EM RAZO


Num esquema de reforamento em razo, o reforo liberado aps um certo nmero de
respostas. Por isso, costuma-se dizer que um esquema controlado pelo prprio organismo,
j que a ocorrncia do reforo depende da emisso da resposta por parte do organismo.
A) Esquemas de razo fixa FR
Sob este esquema de reforamento, o reforo liberado aps um nmero fixo de respostas.
A sigla que o representa FR (abreviao de Fixed Ratio). O nmero colocado aps a sigla
refere-se razo exigida. Por exemplo, FR-20 significa que a cada 20 respostas emitidas, o
sujeito recebe um reforo.
A resposta de subir os degraus da escada da faculdade at o primeiro andar reforada num
esquema em razo fixa, porque exigida uma quantidade fixa do comportamento de subir
degraus para chegar at o primeiro andar.
Uma lavadeira que cobra por nmero de peas lavadas pode ter seu comportamento sob um
esquema de reforamento em razo fixa se, a cada 10 peas lavadas (comportamento de
lavar roupa), ela cobrar uma certa quantia (FR-10). O mesmo ocorre a um vendedor que a
cada cinco colees de livros que vende (comportamento de vender colees), ele recebe
uma comisso a mais em dinheiro (FR-5).
Pode-se ter organismos que comeam a trabalhar sob um esquema de razo fixa com um
valor baixo e chegam at valores altos (por exemplo, comeam com FR-2 e chegam a FR120, 200 etc). Como conseguir isso? Deve-se utilizar, inicialmente, na fase de instalao da
resposta, um esquema de reforamento contnuo (CRF), depois passar para um esquema de
razo com valor mais baixo e ir aumentando gradualmente a razo. Por exemplo, pode-se
iniciar com um FR-2, FR-4, passar para FR-7, FR-10, at chegar a FR-120 (estes valores
so s um exemplo!).
Este aumento gradual na razo, at atingir valores bastante altos, evita que a resposta entre
em extino j que o reforo demorar para ser novamente liberado.
Em caso de haver um aumento brusco na razo, esse aumento chama-se distenso de razo
e evitado aumentando-se gradualmente a razo, at atingir o valor desejado.
Todos os esquemas de reforamento geram caractersticas especficas na freqncia das
respostas que esto sob um dado esquema.
O esquema de reforamento em razo fixa gera uma freqncia alta e constante de
respostas e uma pausa aps reforo. Nesse caso, ou o organismo se comporta em alta
freqncia ou ele no apresenta nenhum comportamento (faz uma pausa aps receber o
reforo positivo).
O tamanho da pausa depender da razo exigida, ou seja, do nmero de respostas exigido.
Quanto maior a razo, maior ser a pausa aps reforo. Em esquema de reforamento em
razo fixa com valores muito baixos no se observa claramente a pausa aps reforo, j que
essa pausa aumenta, conforme aumenta-se a razo.
2

B) Esquemas de razo varivel VR


Sob este esquema de reforamento, o reforo programado para ser liberado aps um
nmero varivel de respostas, em torno de uma mdia.
A sigla que o representa VR (abreviao de Variable Ratio). O nmero colocado aps a
sigla refere-se ao nmero mdio de respostas exigido para a liberao do reforo positivo.
Por exemplo: VR-20 significa que a cada 20 respostas em mdia, o organismo ser
reforado.
Suponha, por exemplo, que programamos reforar um sujeito quatro vezes, do seguinte
modo: na primeira vez, ele ser reforado aps emitir 11 respostas; na segunda vez, aps 23
respostas; na terceira vez, aps 31 respostas e na quarta vez, aps 15 respostas. Quanto d a
mdia dessas respostas?
Temos que somar todas as respostas e dividir o total por 4, que foi o nmero de reforos
liberados. Ento:
11 + 23 + 31 = 80
Temos que dividir 80 por quatro = 20
Portanto, temos nesse caso um VR-20
Vejamos alguns exemplos de comportamentos reforados sob um esquema de reforamento
em razo varivel.
Hoje em dia, no sempre que as pessoas reforam nosso comportamento de dizer bom
dia. O reforo positivo a ser dado poderia ser a apresentao de um sorriso, um aceno de
cabea ou de mo ou simplesmente responder bom dia. s vezes dizemos bom dia a
duas, quatro pessoas para obtermos um reforo ou at mesmo temos que dizer bom dia
duas ou trs vezes mesma pessoa para que ela nos reforce...
Oferecer livros de porta em porta um comportamento mantido em VR tambm. s vezes
oferece-se em duas portas e vende-se um livro (reforo positivo: apresentao de livro
vendido). Outras vezes, j na primeira porta se consegue vender o livro, depois somente na
oitava e assim por diante... O nmero de comportamentos a ser emitido varia para que seja
liberado um reforo positivo.
As mquinas tipo caa-nqueis reforam o comportamento de jogar em um esquema de
reforamento de razo varivel. Isso faz com que o comportamento de jogar acabe
ocorrendo com uma freqncia bastante alta e quase sem pausas aps reforo. s vezes,
alm disso, esse comportamento deve ser emitido um grande nmero de vezes para que
possa ser reforado, o que faz com que seja mantido em VR com valores bastante altos.
Dessa forma, observa-se que o esquema de reforamento em razo varivel gera uma
caracterstica especfica em relao ao comportamento por ele mantido. Ele gera alta
freqncia de resposta e no gera pausas aps reforo.
Da mesma forma que nos esquemas de reforamento em razo fixo, deve-se evitar a
distenso de razo, aumentando gradualmente os valores exigidos, para se evitar que a
resposta entre em extino.

ESQUEMAS DE REFORAMENTO DE INTERVALO


Nestes esquemas de reforamento, a liberao do reforo depende de dois fatores:
a) a passagem do tempo
b) a emisso da resposta aps o intervalo de tempo
Nos esquemas de reforamento vistos anteriormente, verificou-se que um reforo positivo
resultava exclusivamente do esforo do sujeito, ou seja, do nmero de respostas dadas,
independentemente de quanto tempo o sujeito demorasse para dar a quantidade de respostas
exigida. Quanto mais respostas o organismo apresentasse, mais reforos receberia. Assim,
nos esquemas de reforamento em razo, os reforos podem ser considerados como
independentes do tempo, importando sempre o nmero de respostas emitidas.
No entanto, nos esquemas de reforamento temporais (ou de intervalo), esto envolvidos
tambm os aspectos temporais em sua programao, como diz o prprio nome. No
importa quantas respostas o sujeito tenha dado: se no tiver passado tambm o tempo
estipulado, ele no receber o reforo positivo. Alm disso, esse reforo s ser apresentado
caso o sujeito emita pelo menos uma resposta aps a passagem do tempo.
A) Esquemas de reforamento de intervalo fixo FI
Sob este esquema de reforamento, o organismo reforado se emitir pelo menos uma
resposta aps um intervalo fixo de tempo.
Assim, se o comportamento de um organismo est sob um esquema de reforamento de
intervalo fixo 5 minutos, o reforo s ser liberado se ele emitir uma resposta aps 5
minutos. No importam quantas respostas ele emitiu durante os 5 minutos; ele pode ter
emitido 100, 200 respostas durante o intervalo e o comportamento no ser reforado.
Somente a primeira resposta que for emitida aps 5 minutos que ser reforada.
A sigla que representa o esquema de reforamento de intervalo fixo FI (abreviao de
Fixed Interval). O nmero colocado aps a sigla representa o valor especfico do intervalo
fixo.
Nesse tipo de esquema de reforamento, o desempenho do sujeito tambm adquire
caractersticas especficas: a freqncia de respostas baixa no incio do intervalo e
aumenta conforme se aproxima o final do intervalo.
Temos muitos exemplos de nossa vida diria, em que o comportamento esperado s ser
reforado aps a passagem de um tempo determinado. Por isso, acabamos nos comportando
na ltima hora, ou seja, h um aumento na freqncia da resposta no final do intervalo...
Um aluno que deve entregar um trabalho a seu professor em uma determinada data est
sendo mantido em um esquema de intervalo fixo quando por exemplo, a entrega deve ser
em trs semanas.
Este FI-3 gera um padro tpico de comportamento: h poucas respostas no incio do
intervalo e um aumento na freqncia da resposta no final do perodo. Assim, na primeira
semana da proposio da tarefa, o aluno comea a procurar algum material, sabe que deve
faze-lo, mas o prazo est longe... Pouco a pouco ele comea a se comportar mais
freqentemente em relao a fazer o trabalho e, geralmente, nos ltimos dias (para no
dizer na ltima noite), ele passa terminando seu trabalho, digitando etc...
Pensemos em um fiscal que costuma passar em uma repartio de hora em hora para
fiscalizar o trabalho dos operrios de uma fbrica. O comportamento de trabalhar dos

operrios est colocado sob um esquema de reforamento de intervalo fixo de uma hora
FI-1hora.
Imagine que esse fiscal marque se o operrio est trabalhando ou no e em caso de estar, o
operrio receber um extra em seu salrio, se tiver 100% de marcaes do fiscal...
Esse no seria um esquema de reforamento muito adequado produtividade da fbrica.
Por que? Ele gera a caracterstica tpica desse esquema: trabalhar pouco no incio do
intervalo e ir aumentando a freqncia da resposta conforme se chega ao final do intervalo.
Ento, os operrios poderiam recomear a trabalhar conforme fosse chegando a hora do
fiscal passar...
Se o comportamento do rato albino, no laboratrio for colocado sob um FI-3 minutos, ele
s ser reforado se emitir uma resposta de pressionar a barra, logo aps a passagem de trs
minutos.
Assim, as respostas de pressionar a barra dadas durante os trs minutos no sero
reforadas. Somente a primeira resposta que ele der aps os trs minutos que ser
reforada.
Olhar a caneca de leite colocada no fogo para ser reforado com apresentao de leite
fervendo pode ser um exemplo de um comportamento mantido sob FI. O nmero de vezes
que a pessoa olha a caneca de leite no interfere na apresentao do reforador positivo.
O reforo s ser liberado depois que a caneca estiver no calor um certo tempo fixo, desde
que se mantenha constante o tamanho da caneca, a quantidade de leite colocada, a
intensidade do fogo etc. Somente a primeira resposta de olhar a caneca que ser
reforada, aps ter se passado o tempo necessrio para a fervura.
B) Esquema de reforamento de intervalo varivel VI
Sob este esquema de reforamento, o organismo reforado se apresentar pelo menos
uma resposta aps a passagem de um intervalo varivel de tempo.
Assim, se o comportamento de um organismo est sob um esquema de reforamento de
intervalo varivel de 10 minutos VI-10 minutos, ele s receber o reforo positivo se
apresentar uma resposta aps um intervalo de tempo que gira em torno de 10 minutos,
ou seja, uma mdia de 10 minutos.
O mesmo clculo usado para os esquemas de reforamento em razo varivel
utilizado aqui, s que cada um dos valores representa o tempo e no mais um nmero de
respostas.
A sigla que representa o esquema de reforamento de intervalo varivel VI
(abreviao de Variable Interval). O nmero colocado aps a sigla representa o tempo
mdio para a liberao dos reforos.
Neste esquema de reforamento tambm h a necessidade da passagem do tempo e da
emisso de uma resposta aps a passagem do tempo estipulado.
O padro tpico de respostas gerado por este esquema de reforamento uma alta
freqncia de respostas, sem pausas aps o reforo.
Imagine aquele fiscal de repartio passando a intervalos variveis de tempo. Os
operrios nunca saberiam quando ele iria passar e, portanto, trabalhariam o tempo todo,
gerando uma alta freqncia de respostas, sem pausas aps reforo.
Olhar a rua numa certa direo a fim de verificar se o nibus vem vindo, ir at a janela
do apartamento a fim de ver se o namorado j chegou, atender ao telefone a espera
daquela notcia de emprego podem ser comportamentos mantidos em VI, se no se sabe
quando esses reforos positivos sero apresentados. No importa o nmero de vezes
5

que voc olhe a rua, nem o nmero de vezes que v janela e muito menos quantos
telefonemas atendeu: se no houver tambm a passagem de um tempo varivel, nada de
reforo positivo.
H uma caracterstica que pode ser acrescentada aos esquemas de reforamento de
intervalo. a disponibilidade limitada (ou Limited Hold).
Isso significa que o reforo est disponvel aps a passagem de tempo, mas por um
perodo restrito de tempo.
Por exemplo, num VI-10 minutos, com disponibilidade limitada de 15 segundos, o
reforo ficar disponvel aps a passagem de cada perodo de tempo, mas apenas por 15
segundos. Assim, se a resposta ocorrer durante esses l5 segundos de disponibilidade do
reforo, a resposta ser reforada. Se o organismo no responder durante os l5 segundos
ou responder aps os l5 segundos, ele perder esse reforo, comeando a contar um
novo intervalo de tempo, com outra disponibilidade limitada de l5 segundos e assim por
diante.
Isso faz com que a freqncia de respostas seja maior, a fim de evitar a perda do reforo
positivo.
No caso de fazer sinal para o nibus, sendo reforado com a parada do nibus, h uma
disponibilidade limitada, j que, passado o intervalo necessrio para o surgimento do
nibus, h um perodo limitado de tempo para fazer o sinal e ele parar. Se o sinal no
for feito nesse perodo, perde-se o reforo e um novo tempo deve passar para vir o
prximo nibus...
A disponibilidade limitada pode ser utilizada tanto nos esquemas de reforamento de
intervalo fixo como nos de intervalo varivel.
ESQUEMAS DE REFORAMENTO E RESISTNCIA EXTINO
Os esquemas de reforamento intermitente FR, VR, FI e VI , quando comparados ao
CRF, geram um aumento na resistncia extino. Isto , quando um procedimento de
extino iniciado, aps um organismo estar sob um esquema de reforamento
intermitente qualquer, o comportamento continua a ser emitido por um perodo mais
longo, at comear a diminuir de freqncia.
O comportamento de um organismo que estava em CRF e em seguida colocado em
extino, diminui de freqncia mais rapidamente do que um comportamento
anteriormente colocado sob qualquer esquema de reforamento intermitente.
Portanto, os esquemas de reforamento intermitente geram comportamentos mais
resistentes extino do que um esquema de reforamento contnuo.
Novamente, isso quer dizer que, durante o procedimento de extino, quando utilizado
logo aps o reforamento positivo com um esquema de reforamento intermitente, o
organismo demora mais para comear a diminuir a freqncia da resposta.

Você também pode gostar