Você está na página 1de 7

FUNDAMENTOS DA PSICOLOGIA EXPERIMENTAL

PASSO 09 - Esquemas de Reforamento


Objetivos: 1) Definir, descrever e dar exemplos de esquema de reforamento contnuo; 2) Responder questes
conceituais sobre reforamento intermitente; 3) Definir, identificar e dar exemplos de esquemas de reforo em
intervalo fixo e varivel; 4) Definir, identificar e dar exemplos de esquemas de reforo em razo fixa e varivel.
Definio e Caracterizao dos Esquemas
Nos passos anteriores deste curso, aprendemos a respeito do fortalecimento e do enfraquecimento de classes de
respostas operantes (reforamento e extino). Os conceitos explorados at o momento, entretanto, no permitem
explicar completamente situaes como as que seguem:
Por que ser que Dona Josefa faz apostas no jogo do bicho todos os dias se ela raramente ganha alguma aposta?
Por que ser que ainda h pessoas que torcem pelos clubes paraenses, se esses times raramente reforam o
comportamento de seus torcedores?
O comportamento de Dona Dora ir ao banco reforado pela obteno de R$ 300,00 de sua aposentadoria. Mas
por que ser que Dona Dora s vai ao banco uma vez por ms?
Por que ser que, quanto mais se aproxima das oito horas da noite, mais vezes a Mariana vai at a janela do
prdio onde mora e olha para o estacionamento onde seu namorado costuma colocar o carro, mesmo que ele ainda
no tenha estacionado o carro l?
Todas essas situaes nos sugerem que, muitas vezes, nem todas as respostas que emitimos so reforadas e, no
obstante, essa intermitncia de reforos no s capaz de manter nosso comportamento sob controle dos estmulos
discriminativos, como pode torn-lo mais persistente (mais resistente extino). interessante, portanto, estudar a
manuteno dos comportamentos operantes levando em considerao a quantidade ou a distribuio das respostas
necessrias para que se produza um determinado evento reforador. Esse o objetivo dos estudos sobre os
ESQUEMAS DE REFORAMENTO.
Os esquemas de reforamento so arranjos de contingncias de reforamento1 que especificam uma relao de
dependncia entre a quantidade de respostas, ou sua distribuio temporal, e a quantidade de reforos produzidos por
essas respostas. De acordo com Ferster e Skinner (1957) esquemas de reforamento so regras (ou critrios) que
especificam as relaes entre respostas e reforos.
O estudo dos esquemas de reforamento, como j foi dito, muito importante para compreendermos como
alguns de nossos repertrios so mantidos e com que dedicao nos engajamos em determinadas atividades em
detrimento de outras. Por exemplo, como ser a histria de distribuio de reforos que torna as pessoas mais
persistentes? Por que ser que olhamos sempre na caixa de correio quando entramos em casa? Por que ser que a
dona de casa experiente espera 40 minutos depois de pr a roupa na mquina de lavar antes de abri-la para tirar a
roupa limpa? As respostas a essas perguntas certamente passaro pela descrio dos esquemas em que as respostas
examinadas esto sendo reforadas.
Um terapeuta que pretende que seu cliente se torne mais atuante certamente precisa analisar a maneira como os
reforos so dispensados no ambiente em que a mudana deve ocorrer. Uma anlise cuidadosa nessa direo poderia
sugerir que o cliente pouco atuante devido ao fato de receber uma pequena quantidade (ou baixa densidade) de
reforos e que mudanas comportamentais que constitussem buscas de novos ambientes seriam favorecidas (Claro,
estamos falando de casos hipotticos e no pretendemos sugerir condutas teraputicas).
Em resumo ao que foi dito at aqui, esquemas de reforamento se referem a uma exigncia que deve ser
cumprida para que respostas possam ser reforadas.
Quando o esquema de reforamento especifica que todas as respostas de uma determinada classe operante sero
reforadas (um reforo para cada resposta), nomeamos o esquema de esquema de reforamento contnuo ou CRF
(Continuous Reinforcement). Esse um esquema que produz uma taxa de respostas2 moderadamente alta.
Um aspecto interessante a respeito do esquema de CRF que, apesar de produzir freqncias altas e contnuas da
resposta, o organismo submetido ao esquema de CRF pra de trabalhar por algum tempo cada vez que recebe um
reforo. Esse o conhecido fenmeno das pausas ps-reforamento que levou alguns pesquisadores a levantarem a
hiptese de que o reforo, alm de produzir um aumento na probabilidade de ocorrncia futura de resposta reforada,
teria uma funo inibitria imediata sobre essa resposta e outras da mesma classe operante.
O esquema de reforamento contnuo raro em nossa vida cotidiana. Se voc pensar um pouco, vai descobrir
que difcil encontrar uma resposta sua que seja reforada toda vez que ocorre. Fazendo um esforo, ns podemos
encontrar um exemplo que se aproxima de reforamento contnuo. o caso de uma criana mimada, que consegue
TUDO dos pais. Provavelmente, o comportamento de pedir da criana est sendo reforado pelos pais em CRF.

1
Uma contingncia uma relao de dependncia entre eventos (tipo: se..., ento...). Nesse sentido, o termo contingncia
mais geral que o termo esquema de reforamento, de modo que podemos dizer que os esquemas so exemplos de contingncias
para reforamento.
2
O termo taxa de resposta se refere quantidade numrica de respostas por unidade de tempo e uma excelente medida
comportamental. Por exemplo, se o sujeito emite 55 respostas em 10 minutos, a taxa de respostas ser de 5,5 respostas/minuto
(Tx=fi/T, onde Tx e a taxa, fi a freqncia acumulada da resposta e T o tempo).
Curso de Introduo Anlise Experimental do Comportamento Passo 09 2
Muito mais comuns na nossa vida e de muito interesse terico so os esquemas de reforamento intermitente,
nos quais, mais de uma resposta ou uma determinada distribuio temporal das respostas necessria para que
haja reforamento. H, portanto, duas bases para a definio dos esquemas de reforamento intermitente: a
quantidade de respostas emitidas ou a passagem de tempo.
Quando o reforamento depende da passagem do tempo, dizemos que o esquema intermitente de intervalo.
Quando o reforamento depende da emisso de um determinado nmero de respostas, dizemos que o esquema de
razo.

Intervalo Fixo e Intervalo Varivel:


Quando a resposta s reforada aps a passagem de intervalos de tempo fixos (invariveis) dizemos que o
esquema de intervalo fixo. Suponhamos que, em uma cidade muito organizada, haja um servio de metr to
eficiente que possvel dizer, sem nenhuma dvida, que passar um trem na estao exatamente a cada 15 minutos.
Um usurio desse metr poder emitir vrias respostas de olhar para o tnel do metr, mas s aps a passagem de 15
minutos que essa resposta ser reforada pela presena do trem se aproximando e, obviamente, pela possibilidade de
se tomar o trem.
Quando o intervalo de tempo que necessrio transcorrer para que a resposta seja reforada varivel, dizemos
que o esquema de intervalo varivel. Um exemplo desse tipo de esquema a contingncia na qual se engajam os
usurios dos nibus de Belm. Um intervalo varivel de tempo transcorre entre a passagem de um e outro nibus da
mesma linha. A resposta de olhar para a direo de onde vem o nibus reforada em um esquema de intervalo
varivel3.
Note que, em ambos os casos, o reforamento se torna mais provvel medida em que o tempo passa. A
quantidade de respostas que o sujeito emite durante o intervalo no altera a probabilidade de reforamento.
Essa uma importante caracterstica dos esquemas de intervalo. importante ressaltar, contudo, que o reforamento
nos esquemas de intervalo s ocorre aps uma resposta emitida depois que se encerra o intervalo (fixo ou varivel).
Nos dois exemplos acima, se o usurio no emitir as respostas necessrias para a produo da conseqncia
reforadora (olhar e dirigir-se para o nibus ou metr; gesticular para o motorista, no caso do nibus; tomar a
conduo) no haver reforamento.
Apesar de no ser fcil encontrar exemplos de esquemas puros em situaes fora do laboratrio, possvel
citarmos ainda alguns exemplos de esquemas de reforamento por intervalo. Quando voc vai fazer o seu cafezinho e
pe a gua no fogo para ferver, seu comportamento de ir at o fogo para ver se a gua est fervendo pode estar sendo
reforado em um esquema desse tipo. Olhar a cada momento se a gua j ferveu no vai faz-la ferver mais rpido: o
reforo (gua fervendo) se torna mais provvel medida que o tempo passa. Observe que este s um exemplo de
esquema de reforamento em FI se voc costuma usar a mesma quantidade de gua, a mesma vasilha, o mesmo bico
de gs, nas mesmas condies de ventilao do ambiente etc. Caso qualquer um desses fatores varie, a cada vez que
voc faz caf, o intervalo que a gua demora para ferver tambm varia e temos um intervalo varivel e no um
intervalo fixo. Se voc conhece um taperebazeiro, sabe que tem que chegar cedo em baixo do p para poder catar
muitos taperebs. Aps a catada da manh, para a resposta de ir de novo ao p ser reforada, deve transcorrer um
intervalo varivel de tempo desde a ltima visita, porque o tempo entre a queda de um tapereb e outro varia.
Nos esquemas de intervalo fixo e intervalo varivel a contingncia de reforamento em vigor para uma dada
resposta no sinalizada, e o indivduo exposto a um esquema de reforamento em intervalo tem uma nica dica
ambiental sinalizando a probabilidade de reforo para a resposta especificada: a passagem do tempo. Isso significa
que a freqncia da resposta vai se adaptando ao esquema medida que o sujeito exposto a ele. Emitindo a resposta,
ela algumas vezes reforada, outras vezes no. Se nenhuma resposta ocorrer, nunca ocorrer reforamento, mesmo
que passe mais tempo do que o especificado para que uma resposta, se emitida, seja reforada.
Vendo uma criana assistir a televiso, com um aparelho de controle remoto na mo, possvel ver o efeito do
esquema de intervalo (quase) fixo. Quando comea o intervalo comercial, a criana muda de canal e assiste a um
programa menos preferido, mas, medida que passa o tempo, a criana comea a mudar freqentemente para o canal
anterior, antes do intervalo comercial terminar. Quando a seqncia de mensagens comerciais previsvel, isto ,
repetida, o esquema de intervalo superposto por esses eventos ambientais que sinalizam a proximidade do reforo.
Por exemplo, quando o intervalo comercial sempre termina com a propaganda dequele canal de TV, o comportamento
de selecionar o canal de televiso fica sob controle deste estmulo (propaganda do programa) e no da passagem do
tempo. Isso poderia acontecer no laboratrio se ao final do intervalo o experimentador acionasse um interruptor
audvel para tornar a prxima resposta efetiva: o rato poderia discriminar esse rudo, e comear a emitir a resposta
apenas aps ouvi-lo. Isso significa que se um indivduo dispuser de um relgio, mesmo que a contingncia de reforo
dependa da passagem do tempo, ele pode ter a freqncia da resposta sob controle dos estmulos fornecidos pelo

3
Para encurtar a referncia, chamamos os esquemas pelas iniciais de seu nome em ingls. Assim, o intervalo fixo FI (de Fixed
Interval) e o intervalo varivel VI (de Variable Interval). Embora seja pouco louvvel - ou pouco lisonjeiro - o apelo aos nomes
estrangeiros, esta uma prtica comum em atividades cujas publicaes so feitas, quase sempre, em lngua estrangeira.
Curso de Introduo Anlise Experimental do Comportamento Passo 09 3
relgio e no diretamente sob controle do esquema de reforamento. Isso poderia determinar que o comportamento
do indivduo fosse diferente do comportamento tipicamente adaptado ao esquema.
No esquema de reforamento em intervalo varivel, a contingncia pode especificar a qualquer tempo que a
prxima resposta ser reforada. Responder depressa ou devagar no afeta a freqncia de reforo. Se houver pausas
longas, entretanto, pode ocorrer uma diminuio da freqncia mxima de reforos (a freqncia mxima de reforos
alcanada quando uma resposta ocorre sempre logo depois que cada reforo fica disponvel de acordo com o
esquema programado). Assim, quando exposto a um esquema de intervalo varivel, o sujeito tende a emitir as
respostas regularmente, sem muita pressa, mas, tambm, sem muita pausa entre as respostas.
Com longa exposio a um esquema, a freqncia da resposta tende a se adaptar de forma bastante tpica. No
esquema de Intervalo Fixo, por exemplo, normal que ocorra uma pausa mais ou menos longa, um perodo sem
emisso da resposta, aps cada reforamento, seguida de um jorro de respostas (um nmero grande de respostas
emitidas em um tempo curto) durante a parte final do intervalo, que vai at o final do mesmo, quando o reforo fica
disponvel e, ento, a primeira resposta a ocorrer reforada.
O registro cumulativo das respostas de presso barra emitidas por um rato privado de gua e exposto aos
esquemas de intervalo tende para as formas mostradas na figura a seguir:

Tempo Tempo

Figura 1 - Registro cumulativo das respostas de presso barra mantidas sob esquema de reforamento por
intervalo em ratos como sujeitos. A poro esquerda da figura apresenta os dados com esquema de FI e a poro
direita, VI.

Questes de Estudo
1. Podemos dizer que, no esquema de reforamento intermitente em intervalos fixos, o reforo liberado aps a
passagem de um tempo fixo desde o ltimo reforamento? Sim ou no? Porqu?
2. Descreva o desempenho em termos da freqncia esperada da resposta de presso barra emitida por um rato
aps vrias sesses de exposio a FI 1 minuto. Faa o mesmo para o esquema VI 1 minuto.
3. Descreva as curvas da figura acima. O que representa o eixo das ordenadas (eixo y)? o que representa o eixo
das abcissas (eixo x)? o que representa a linha inclinada? uma curva de freqncia simples ou acumulada? O que
representam os pequenos traos diagonais ao longo da linha inclinada? Se voc encontrar dificuldades para responder
a essas questes, procure ajuda de um(a) monitor(a) ou do professor.

Razo Fixa e Razo Varivel


Quando o reforamento depende do nmero de respostas desde o reforo anterior, dizemos que o esquema de
Razo. Como o nome indica, este esquema estabelece uma proporo (razo) entre o nmero de respostas dadas e o
nmero de reforos. Aqui, como no caso dos esquemas em intervalo, tambm temos Razo Fixa, se o nmero de
respostas exigidas para o reforamento sempre o mesmo (designado por FR, de Fixed Ratio), e Razo Varivel, se o
nmero de respostas varia de um reforamento para outro (designada por VR, de Variable Ratio). Vamos aos
exemplos:
Quando voc faz uma ligao telefnica, necessrio girar o disco (ou teclar) oito vezes para a ligao se
completar. Ou seja, voc emite sete vezes a mesma resposta (considerada aqui genericamente como digitar) at que
obtenha o rudo da ligao feita. Um esquema que exige um nmero fixo de respostas para que o reforo seja liberado
um esquema de razo fixa, no caso, um FR 7. Quando voc sobe os degraus da escada de seu prdio, a resposta de
subir um degrau est sendo submetida a um esquema de reforamento em razo fixa (FR): necessrio subir um
nmero fixo de degraus at chegar ao andar pretendido.
Como conseqncia da exposio ao esquema de razo fixa, desenvolve-se, em geral, taxas de resposta elevadas
e constantes at o reforo, seguidas de uma pequena pausa aps reforo que, apesar de fazer parte das caractersticas
do comportamento adaptado ao esquema, no faz parte da definio do esquema.
O esquema de razo varivel caracterstico dos jogos, apostas e vendas, onde o reforo depende da quantidade
de respostas que voc emite e essa quantidade varia de uma vez para outra. Por exemplo, o clssico vendedor de
enciclopdias, que bate de porta em porta: quando maior o nmero de portas em que ele bater, mais reforos recebe.
Se ele vender uma enciclopdia em uma casa, possvel que a prxima venda seja efetuada na casa seguinte e,
depois, pode ser necessrio falar com cinco pessoas diferentes at que nova venda ocorra. Ou seja, o reforamento (a
Curso de Introduo Anlise Experimental do Comportamento Passo 09 4
venda, ou mais especificamente a comisso gerada pela venda) depende de quantas respostas o vendedor emite, mas
no h um nmero fixo de respostas antes de cada venda. Se fosse necessrio determinar o valor da razo varivel a
que o vendedor est submetido, poderamos fazer uma mdia entre o nmero de respostas dadas e dividir pelo nmero
de reforos obtidos.
Em todos os exemplos acima, temos em comum o fato de que o reforo se torna mais provvel medida
que as respostas so emitidas, no importando o intervalo de tempo em que isso feito. Isso quer dizer que, se
o sujeito trabalha mais, ele obtm mais reforos. Essa uma importante caracterstica dos esquemas de razo.
Outras informaes sobre esquemas de reforamento
O nmero (fixo ou mdio) de respostas exigidas para reforamento ou o intervalo de tempo (fixo ou mdio) entre
cada reforamento indicado por ndices numricos colocados aps a abreviatura do nome do esquema. Assim, VI
30s se refere a um esquema de intervalo varivel, no qual o reforo fica disponvel aps 30 segundos, em mdia,
desde o ltimo reforamento; FR 10, a uma razo fixa, na qual o reforamento ocorre para cada dcima resposta aps
a ltima resposta reforada.
Comparando esquemas de razo com esquemas de intervalo, percebemos algumas diferenas fundamentais. Em
um esquema de intervalo, a probabilidade do reforo aumenta com a passagem do tempo, ou seja, o prprio sujeito
no pode fazer com que o reforo venha mais depressa ou mais devagar. Dessa forma, no faz diferena se o sujeito
emite uma nica resposta ou se ele responde o tempo todo, j que basta uma resposta aps ter decorrido o intervalo
para que o reforo ocorra. Por outro lado, nos esquemas de razo, o sujeito deve, necessariamente, emitir todas as
respostas exigidas para que o reforo ocorra: ou seja, a probabilidade de reforo aumenta com o nmero de respostas,
no importando em quanto tempo elas so emitidas.
Disso decorrem duas conseqncias:
1. mais fcil manter o desempenho reforado em esquema de intervalo do que o desempenho reforado em
esquemas de razo. Costumamos dizer que os esquemas de intervalo so dotados de um poder regenerativo que falta
aos de razo. Quer dizer o seguinte: supondo-se que o desempenho esteja to fraquinho que o sujeito quase nem
responde, uma nica resposta, se ocorrer, aps decorrido o intervalo, suficiente para produzir o reforo e fortalecer,
novamente, a resposta, aumentando a sua probabilidade futura.
2. Em condies semelhantes, a taxa de resposta mais alta em esquemas de razo do que em esquemas de
intervalo. Isso fcil de demonstrar quando se realiza um experimento em que o comportamento de um sujeito (o n
1) reforado em VR, e o do outro (o n 2) reforado em um VI, cujo intervalo entre reforos depende do intervalo
entre os reforos obtidos em esquema de razo varivel pelo sujeito n 1. Assim, se o sujeito 1 responde rapidamente,
o sujeito 2 recebe muitos reforos, ou pelo menos tem um VI com intervalos curtos; se o sujeito 1 responde devagar,
com taxa baixa, o sujeito 2 recebe poucos reforos ou est submetido a um VI com intervalo longo. No importa se o
sujeito 2 trabalha rpida ou lentamente, j que a freqncia de reforamento dele depende da taxa de respostas do
sujeito 1, caracterizando, para o n 2, um esquema de VI. Em experimentos que usam este procedimento, demonstrou-
se que a taxa do sujeito 1, submetido a VR, maior que a do sujeito 2, submetido a VI, apesar de ambos receberem o
mesmo nmero de reforos, com intervalos entre reforos iguais. Isso ocorre porque o esquema de razo refora
diferencialmente grupos de respostas, com intervalos entre respostas bem curtos, e em esquemas de intervalo o
comportamento de esperar reforado, ou seja, dar grandes distncias entre as respostas.
Vamos ver agora como se organizam, no tempo, as respostas que esto sob cada um dos esquemas de
reforamento que descrevemos.
Se for possvel isolar - para efeitos de registro, principalmente - o comportamento que est sob controle de cada
esquema, veremos que ele se distribui no tempo segundo um padro caracterstico. difcil fazer isso num ambiente
"natural", porque vrias respostas e esquemas variados ocorrem simultaneamente (veja: difcil no quer dizer
impossvel). Assim, vamos nos utilizar da situao de laboratrio, na qual podemos ter um organismo mais simples
trabalhando em um ambiente tambm mais simples. Aumentando o grau de Controle Experimental, o fenmeno que
queremos ver pode ser realado de modo a facilitar sua identificao e compreenso. Alis, esse foi o motivo pelo
qual muitas pesquisas a respeito dos esquemas de reforamento foram feitas com animais de laboratrio.
Uma forma til de visualizar o padro temporal de respostas em cada esquema utilizar um registrador
cumulativo. Trata-se, basicamente, de um aparelho eltrico que contm um rolo de papel, sobre o qual se prendem
penas com tinta de escrever. Uma vez ligado, o papel se desenrola com velocidade constante e a pena (uma espcie de
caneta), encostada nele, faz um trao reto. Porm, a cada resposta do sujeito (por exemplo, resposta de presso
barra), a pena sobe um pouquinho e fica, sem voltar ao ponto de partida, fazendo um traado de pequeninos degraus.
Se ligarmos um registrador cumulativo para cada esquema que descrevemos, vamos ver claramente o padro que as
respostas tomam atravs do tempo ou padro temporal de respostas (algo semelhante a esse tipo de registro
apresentado na Figura 1).
Um rato submetido a um esquema de reforo em Intervalo Varivel (VI) tende a pressionar a barra da caixa
experimental em taxa constante. Isso quer dizer que ele vai pressionar sempre no mesmo ritmo. A taxa vai ser mais
alta para VIs menores, diminuindo medida que o VI aumenta. Assim, um rato submetido a VI 30 segundos d mais
Curso de Introduo Anlise Experimental do Comportamento Passo 09 5
respostas por segundo que outro submetido a VI 3 minutos. No grfico acumulado, isso vai se mostrar pela
inclinao da curva: a curva para VI 30 seg. ser mais inclinada (mais "em p") que a de VI 3 min.
Em FI, o padro de respostas diferente: o sujeito pra de trabalhar logo aps um reforo e, decorrido um certo
tempo, retoma o comportamento de pressionar, mantendo um ritmo constante ou aumentando a taxa medida que o
reforo seguinte se aproxima. Essa parada que se segue ao reforo chamada de pausa ps-reforamento. O tamanho
do FI (a durao do intervalo) vai determinar a durao da pausa: quanto maior o intervalo, maior a pausa.
Uma pausa ps-reforamento tambm caracterstica do esquema de FR. Neste, a taxa de resposta, uma vez que
o animal volta a trabalhar, , em geral, bastante alta, mantendo-se at o prximo reforo. Portanto, ambos os
esquemas fixos (FR e FI) produzem uma pausa ps-reforamento. No caso do FI, este um perodo de extino (de
suspenso do reforo) sinalizado pelo prprio reforamento: medida que o animal vai sendo submetido ao esquema,
o reforo adquire a funo de sinalizar que, imediatamente aps a sua ocorrncia, segue um perodo durante o qual
no haver novos reforos. A mesma explicao - extino discriminada - tem sido invocada para a pausa ps-
reforamento em FR, embora possamos nos perguntar por que isso chega a ocorrer, j que o momento do
reforamento depende da rapidez com que o sujeito trabalha. A durao da pausa ps-reforamento parece depender
do nmero de respostas exigidas, embora o intervalo entre reforos parea ser uma varivel criticamente importante,
como veremos mais tarde.
No VR, a taxa tambm alta e as pausas, quando existem, so curtas e distribudas de forma no sistemtica.
Ambos os esquemas variveis - VR e VI - produzem um desempenho mais constante, com pouca ou nenhuma pausa e
a taxa de respostas praticamente no varia.
Todos os esquemas intermitentes tm em comum o fato de produzirem um desempenho mais resistente
extino. De fato, no momento em que se interrompe a apresentao do reforo, o efeito do reforamento sobre o
desempenho mantido por CRF eliminado (isto , volta a seu nvel operante) mais rapidamente do que o efeito sobre
o desempenho mantido por esquema intermitente. Uma explicao para isso a semelhana entre a situao de
reforamento em esquema intermitente e a situao de extino: em ambas, muitas respostas ocorrem sem que o
reforo ocorra. Assim, o sujeito se comporta em extino como se ainda estivesse num esquema intermitente cuja
freqncia de reforamento teria diminudo. Se pensarmos naquilo que o sujeito aprende quando se adapta a cada
esquema, fica fcil supor por que ocorrem tantas respostas em extino: nos esquemas de razo, o sujeito aprende a se
esforar, por assim dizer, para obter reforo. Nos esquemas de intervalo, ele aprende a esperar pela oportunidade de
reforo. Em extino, continua a se esforar ou a esperar
Isso frustra muitas tentativas que as pessoas fazem de mudar seu prprio comportamento (ou o de seus amigos),
passando a resposta que querem eliminar de um esquema contnuo para um esquema intermitente, na tentativa de
enfraquec-la.
O desempenho mantido por esquema intermitente , tambm, menos sensvel saciao, pois necessrio muito
mais respostas para cada reforo consumatrio e, assim, o sujeito emite muito mais respostas do que em CRF,
situao em que cada resposta produz um reforo.
Para finalizarmos este passo, veja o quadro comparativo abaixo, bem como a figura que compara do desempenho
adaptado a cada um dos esquemas acima estudados, alm de mais um exemplo e algumas questes de estudo.

Quadro comparativo dos quatro esquemas bsicos de reforamento.


Modo de Critrio para Liberao do SR+ Terminologia Caractersticas do Desempenho
Apresentao
Uma nica Resposta (1/1) CRF _ Rpida aquisio do responder (em
(Continuous relao aos intermitentes).
Contnuo Reinforcement) _ Menor resistncia extino (em
relao aos intermitentes).

Razo: Fixa: O Valor da Razo FR _ Altas taxas.


Nmero de Estvel. Ou seja, no (Fixed Reinforcement) _ Pausa ps-reforamento.
Respostas h variao na exigncia _ Responder desacelerado aps o
Em Valores do valor de respostas reforamento e gradualmente acelerado
Descontnuos necessrio para a at a produo do prximo
(diferentes de 1/1). produo do reforamento.
reforamento de
tentativa para tentativa.
Varivel: O Valor da VR _ Altas taxas.
Intermitente Razo Mutvel, Sendo (Variable _ Sem Pausa ps-reforamento.
Seus Valores Expressos Reinforcement) _ Responder constante (probabilidade
na Forma de Mdia. de reforamento igual a cada instante).
Curso de Introduo Anlise Experimental do Comportamento Passo 09 6
Intervalo: Fixo: O Valor do FI _ Pausa ps-reforamento.
Uma Resposta Intervalo Permanece o (Fixed Interval) _ Responder desacelerado aps o
Emitida Aps a Mesmo a Cada reforamento e gradualmente acelerado
Passagem de Um Tentativa. at a produo do prximo
Intervalo reforamento.
Temporal. _ Poder regenerativo.
Varivel: O Valor do VI _ Sem Pausa ps-reforamento.
Intervalo Muda, Sendo (Variable Interval) _ Responder constante (probabilidade
Seus Valores Expressos de reforamento igual a cada instante).
na Forma de Mdia. _ Poder regenerativo.

Figura 2. Registro cumulativo comparando o padro de comportamento adaptado aos quatro esquemas bsicos de
reforamento.

Da janela lateral do quarto de dormir da minha casa vejo uma


cerca-viva de hibiscos, sempre florida. Logo que amanhece o dia, um
beija-flor entra em ao, visitando as flores, enfiando seu longo bico
nelas. Em algumas demora-se um tempo maior do que em outras;
encontra nctar em algumas, que esto no ponto, e no em outras, muito
novas, muito velhas, ou j visitadas, pois alm do beija-flor, abelhas
visitam o jardim dos hibiscos. Tem certos dias que o beija-flor aparece de
novo l pelas nove da manh, a beijar as flores. Eu ento imaginava
como so diferentes os comportamentos do poeta e do analista do
comportamento. O poeta comea a cantarolar canes que tratam desses
temas de forma to bonita e o analista fica imaginando a diferena entre
os esquemas de reforo que mantm as respostas de beijar flores ao
amanhecer e s nove horas. Qual o esquema de reforo que mantm a
resposta de beijar-flor ao amanhecer? E s nove da manh? Qual a
diferena entre os esquemas em vigor nos dois horrios?
Curso de Introduo Anlise Experimental do Comportamento Passo 09 7

Questes de Estudo
1. O que significa a palavra razo no contexto dos esquemas intermitentes de reforamento? Qual a menor razo
possvel? Que nome se d a esse esquema de menor razo resposta/reforo? Qual a diferena entre razo fixa e
varivel?
2. Compare os esquemas de razo e intervalo com relao varivel que determina a mudana na probabilidade
de reforo.
3. Descreva o procedimento e o resultado do estudo descrito no texto em que a freqncia de reforos de um
sujeito depende da freqncia de reforos obtida por outro.
4. Porque a resistncia extino aumenta com a exposio a esquemas intermitentes de reforamento?

Bibliografia Complementar
Catania, C. A (1999). Aprendizagem: Comportamento, Linguagem e Cognio. Porto Alegre: ArtMed. Trad.
Deisy de Souza.
Ferster, C. S. & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton Century Crofts.
Harzem, P. & Harzem, A. L. (1981). Discrimination, inhibition, and simultaneous association of stimulus
properties: a theoretical analysis of reinforcement. In P. Harzem and M. D. Zeiler (Eds.), Advances in Analysis of
Behaviour, Vol. 2, Predictability, Correlation and Contiguity. New York: Wiley & Sons, pp. 81-124.
Millenson, J. R. (1975). Princpios de anlise do comportamento. Braslia: Coordenada