Você está na página 1de 3

Esquema de reforço contínuo e esquemas de reforçamento intermitente

O conceito de esquema de reforçamento diz respeito a que critérios um comportamento ou


conjunto de comportamento deve atingir para que ocorra o reforçamento. Descreve como se
dá a contingência de reforço, ou seja, a que condições os comportamentos devem obedecer
para ser liberado o reforçador. Existem dois tipos de esquemas de reforçamento: o contínuo e
o intermitente.
No esquema de reforço contínuo, todo comportamento é seguido do reforçador. Em
experimentação, o esquema é chamado de continuous reinforcement (reforço contínuo), mais
conhecido pela sigla CRF. Um exemplo desse tipo de esquema de reforço é toda vez que o
botão do controle da TV é apertado, ela liga. Comportamento: apertar o botão, reforço: TV
ligada. Nesse exemplo, dizemos que o comportamento de apertar o botão sempre é seguido
de seu reforçador, que é a TV ligar, ou seja, o comportamento é continuamente reforçado.
No dia-a-dia nem todos os comportamentos que emitimos são reforçados. Falamos, nestes
casos, sobre esquemas de reforçamento intermitente. A característica definidora dos
esquemas de reforçamento intermitente é o fato de que nem todas os comportamentos são
seguidos de reforço, e sim apenas uma parte deles.

Os principais esquemas de reforçamento intermitente: FR, VR, FI, VI

Existem quatro tipos principais de esquemas intermitentes: razão fixa, razão variável,
intervalo fixo e intervalo variável. Estes se organizam de acordo com o número de
comportamento para cada reforçador (esquemas de razão), o tempo entre reforçadores
(esquemas de intervalo).

Esquemas de razão
Os esquemas de razão se caracterizam por exigirem um certo número de comportamento para
a apresentação de cada reforçador, isto é, para que o reforço seja apresentado, é necessário
que seja emitido um certo número de comportamentos (mais do que um). Existem dois tipos
principais de esquemas de razão: razão fixa e razão variável.
Razão fixa: Neste esquema, o organismo deve emitir um número fixo de comportamento
para que ele seja reforçado. Em outras palavras, o número de comportamento exigido para a
apresentação de cada reforçador é sempre o mesmo. Exemplos de esquemas de razão fixa não
são fáceis de encontrar porque o nosso ambiente é extremamente mutável. Isto é, os
esquemas variáveis serão sempre mais comuns.
Mas um exemplo de reforço em esquema de razão fixa é o adotado em exercícios de
musculação. A cada 12 repetições do exercício, o reforço do descanso é liberado.
Descrevemos o esquema de reforçamento como razão fixa 12 ou simplesmente FR:12 (do
inglês fixed ratio). Este termo resume a contingência de que são necessários 12
comportamentos para a apresentação de cada reforçador.
Razão variável: Nesse esquema, muito mais comum em nosso cotidiano, o número de
comportamentos entre cada reforçador se modifica. Ela é representada pela sigla VR (do
inglês variable ratio). Por exemplo, quando dizemos que um comportamento está em razão
variável 10 ou VR:10, significa que, em média, a cada 10 comportamentos, um é reforçado.
Examinemos o seguinte experimento, em que o rato devia pressionar a barra em VR:10 para
obter água. Ao longo de uma sessão, o animal recebeu 5 reforços. A Tabela 1 indica quantos
comportamentos foram dados para a obtenção de cada um dos reforçadores. Se somarmos o
total de comportamentos emitidos, temos 50 comportamentos para um total de 5 reforços.
Dividindo um valor pelo outro, teremos 10, o que significa que, em média, foram necessários
10 comportamento para cada reforçador.

Ref N° compt
1° 12
2° 5
3° 8
4° 19
5° 6
Total: 50

Esquemas de intervalo
Nos esquemas de intervalo, o número de comportamentos não é relevante, bastando apenas
um para a obtenção do reforçador. O tempo decorrido desde o último reforçador é o principal
determinante de um novo comportamento ser ou não reforçado. De forma similar aos
esquemas de razão, os esquemas de intervalo podem ser fixos ou variáveis.
Intervalo fixo: No esquema de intervalo fixo, o requisito para que um comportamento seja
reforçado é o tempo decorrido desde o último reforçamento. O período entre o último
reforçador e a disponibilidade do próximo reforçador é sempre o mesmo para todos os
reforçamentos. Por isso, o nome intervalo fixo, ou seja, os reforçadores estarão disponíveis
depois de transcorridos intervalos fixos desde o último reforçador. Ele é representado pela
sigla FI (do inglês fixed interval). Um exemplo com o mesmo experimento com o rato seria
assim: se a resposta de pressão à barra estiver em FI: 1' (um minuto), as respostas de pressão
à barra só serão reforçadas quando passar um minuto desde o último reforço. Portanto,
quando o animal é reforçado, um cronômetro é disparado, contando o tempo até um minuto.
Depois de passado esse minuto, o próximo comportamento será reforçado. O processo se
repetirá para todos os reforçadores. Alguns pontos importantes devem ser notados. Primeiro,
o reforço somente será liberado caso o organismo se comporte, ou seja, se o rato não
pressionar a barra, não haverá reforço. Portanto, além do tempo, deve ocorrer pelo menos um
comportamento para que haja o reforço. Além disso, comportamentos no meio do intervalo
não são reforçados, mas, eles não produzem nenhum prejuízo à disponibilidade do reforço ao
final do intervalo.

Intervalo variável: O esquema de intervalo variável é similar ao intervalo fixo, com a


diferença de que os intervalos entre o último reforçador e a próxima disponibilidade não são
os mesmos, ou seja, são variáveis. Ele é representado pela sigla VI (do inglês variable
interval). Um exemplo com o mesmo experimento com o rato: ao longo de uma sessão, o
animal recebeu 5 reforços. A Tabela 2 indica quantos segundos se passaram desde o último
reforçador até o seguinte. Se somarmos o total de segundos, temos 60 para um total de 5
reforços. Dividindo um valor pelo outro, teremos 30, o que significa que temos um intervalo
variável 30 segundos (VI 30"), ou seja, que o reforço estará disponível a cada 30 segundos
em média.
Ref Tempo decorrido desde o último reforçador
1° 14
2° 6
3° 9
4° 20
5° 11
Total: 50

Tempo de disponibilidade (limited hold): Cotidianamente, os reforçadores não ficam


disponíveis sem tempo definido. Um recurso metodológico em experimentos para aumentar a
similaridade entre a situação cotidiana e a situação experimental é o tempo de
disponibilidade, o qual representa um limite temporal para o comportamento ser emitido.
Caso o organismo não emita o comportamento (p. ex, o rato não pressione a barra) dentro de
um limite de tempo desde o início da disponibilidade do reforço, esse deixa de estar
disponível, sendo reiniciada a contagem do intervalo para a próxima disponibilidade.
Portanto, se o comportamento de pressão à barra estiver em FI:1', com tempo de
disponibilidade de 10", o reforço estará disponível após transcorridos 60 segundos desde o
último reforçador. Entretanto, essa disponibilidade durará apenas 10 segundos. Caso o rato
não pressione a barra nesse intervalo de 10 segundos, o reforço deixará de estar disponível,
sendo contados mais 60 segundos até a próxima disponibilidade.

Você também pode gostar