Você está na página 1de 6

Machine Translated by Google

REVISTA DA ANÁLISE EXPERIMENTAL DO COMPORTAMENTO _ 1971, 15, 297-302 NÚMERO 3 (MAIO)

PORCENTAGEM DE REFORÇO DE RÁCIO FIXO E


DESEMPENHOS DE INTERVALO VARIÁVEL1

JOHN C. MCMILLAN
UNIVERSIDADE DA CAROLINA DO NORTE , CHAPEL HILL

Vinte a setenta por cento dos reforços programados para as performances de 80 de proporção fixa dos pombos
foram substituídos por um tempo limite de 4 segundos . As pausas após as proporções de reforço permaneceram
inalteradas com 80% de reforço, mas foram alongadas com porcentagens de reforço mais baixas . As pausas após
proporções não reforçadas foram mais curtas do que as pausas pós-reforço . Quando 50% dos reforços
organizados por um esquema de intervalo variável de 60 segundos foram substituídos por um tempo limite de 4
segundos , as pausas após a omissão do reforço aumentaram. Tanto as noções frustrantes de não-recompensa
quanto as de efeitos posteriores de reforço podem explicar os resultados de razão fixa ; nenhum dos dois explica
facilmente os dados de intervalo variável .

Quando reforços programados são substituídos quase completamente pela pausa abreviada
por timeout , o procedimento modificado é após o não-reforço. Davenport e Thompson
chamado de cronograma de reforço percentual . ( 1965) mostraram que o reforço percentual
Ferster e Skinner (1957) treinaram pombos em de desempenhos de razão fixa produz uma
esquemas de proporção fixa de valor pausa encurtada após a omissão do reforço .
intermediário , onde cada reforçador alimentar Da mesma forma, a omissão de reforço resulta
era seguido por um intervalo . Então eles em pausas curtas após não -reforço em um
retiveram de 15 a 50% dos reforços esquema (DRL) que reforça diferencialmente
programados . Esse procedimento produziu um longos tempos de inter-resposta (Davenport,
aumento na duração média e na variabilidade Flaherty e Dyrud , 1966). Davenport et ai.
da pausa após as corridas de razão . Zim também demonstraram que a diferença entre
Merman (1960) relatou aumentos semelhantes os comprimentos de pausa do DRL após o
na duração e na variabilidade da pausa sob reforço e o reforço omitido diminuíram à
reforço percentual com ratos que foram medida que a duração do tempo limite substituído pelo
obrigados a acionar uma alavanca em um O presente artigo relata uma investigação
procedimento de tentativas discretas . Além dos efeitos sobre desempenhos de razão fixa
disso , as durações das pausas não eram de várias porcentagens de reforço e a
diferenciáveis com base no fato de seguirem o interação entre a omissão de reforço e a
reforço ou a omissão do reforço . Embora os duração do timeout . Além disso, são
resultados desses dois experimentos sejam apresentadas evidências de reforço percentual
consistentes , o grupo de experimentos discutido de desempenho de intervalo variável ,
abaixo mostra um efeito diferente do reforço percentual em vários
sugerindo que esquemas
o efeito dede reforçoé. _
omissão dependente do c
Staddon e Innis (1966) mostraram que o
efeito do reforço percentual em esquemas de MÉTODO
intervalo fixo é um aumento na taxa de
resposta após a omissão do reforço em assuntos
comparação com a taxa após o reforço; uma Quatro pombos machos adultos da raça White
pausa encurtada após a omissão do reforço Carneaux foram mantidos com 75% de alimentação livre
em relação ao comprimento da pausa pós-
reforço também foi encontrada. Staddon e 'Esta pesquisa foi apoiada por NIMH Grant
Innis (1969) manipularam a duração do timeout MH-07534-06 para Marcus B. Waller e por Grants MH
substituindo reforços omitidos , mostrando -14121-01 e MH -15468-01 da mesma agência para
que o efeito da omissão de reforço diminuiu Vincent M. LoLordo, que leu criticamente várias
conforme a duração do timeout aumentou. versões anteriores deste papel. As reimpressões estão
disponíveis com o autor, Departamento de Psicologia,
Além disso, eles relataram que os aumentos Universidade da Carolina do Norte , Chapel Hill,
obtidos na taxa de resposta após a omissão Carolina do Norte 27514 .
do reforço foram contabilizados em 297
Machine Translated by Google

298 JOHN C. McMILLAN

pesos. Todas as aves tinham extensas histórias ção havia se estabilizado por cinco sessões consecutivas
com vários esquemas de reforço . As aves P172 antes de qualquer manipulação ser feita.
e P182 foram utilizadas no procedimento de A primeira manipulação envolveu a variação da
razão fixa ; P302 e P304 foram usados no porcentagem de reforços programados entregues ;
procedimento de intervalo variável . as porcentagens utilizadas foram 30, 50, 60 e 80%,
mas a ordem de apresentação foi diferente para as
Aparato A duas aves. Proporções reforçadas foram seguidas
câmara experimental usada no procedimento pela mesma sequência de eventos que ocorreram
de razão fixa media 10 por 12 por 12 polegadas durante o treinamento preliminar . _ As razões
(25 por 30 por 35 cm). Uma chave de resposta forçadas sem rédeas , que foram escolhidas
de 2 cm ( 1 pol. ) de diâmetro transiluminada com aleatoriamente com a restrição de que a primeira e a
luz branca foi centralizada no painel de inteligência trigésima razões sempre foram reforçadas, foram
20 cm (8 pol. ) acima do piso. Uma lâmpada seguidas por um tempo limite de 4 segundos . As
branca de 7 w colocada atrás de uma janela de respostas que ocorreram durante o reforço e o tempo
acrílico branco no canto superior direito fornecia limite foram contadas , mas não tiveram consequências
iluminação ambiente . Cada bicada ativava um programadas . A medida dependente foi a duração da pausa p
relé de feedback situado atrás do painel de inteligênciaEsse. valor foi medido a partir do início da luz
O reforçador era o acesso de 3,5 segundos ao interna e da luz principal após cada tempo limite.
alimentador cheio de grãos mistos e localizado 2,5 Cada condição de reforço percentual durou
pol. (6 cm) acima do piso centralizado sob a chave cinco sessões. A condição de linha de base
de resposta . O experimento foi controlado por foi restabelecida entre condições
circuitos eletromecânicos localizados em uma sala experimentais sucessivas e o desempenho
diferente daquela que abrigava a câmara foi estabilizado .
experimental ventilada . _ _ A câmara usada no Antes da segunda manipulação, foram dadas 10
procedimento de intervalo variável tinha iluminação sessões de linha de base ; durante essas sessões, a
ambiente fornecida por uma lâmpada branca de resposta final de cada proporção desligou a luz interna e
7,5 W localizada acima de um teto de acrílico a luz principal por 16 segundos. Os primeiros 3,5 segundos
branco ; em outros aspectos , assemelhava - se consistiam na apresentação do alimentador e os 12,5
muito à primeira câmara. As durações das pausas segundos finais eram o tempo limite. Sessenta por cento
no procedimento de razão fixa foram medidas de reforço foi então introduzido , durante o qual as
comutando a saída de um gerador de fluxo de proporções reforçadas produziram uma apresentação do
pulso de dez por segundo Foringer 1699 Ml para alimentador de 3,5 segundos , seguida por um tempo
um contador de impressão Sodeco (LVE 1530). As limite de 12,5 segundos . As proporções não reforçadas
durações das pausas no procedimento de intervalo produziram um tempo limite de 16 segundos . Em outros
variável foram cronometradas pelo mesmo gerador aspectos , o procedimento foi idêntico ao descrito acima.
de pulsos e impressas por um contador de impressão BRS POC-012
Intervalo .
variável . Os pombos P302 e P304
foram colocados diretamente em um esquema VI
de 30 segundos gerado a partir da progressão
Procedimento Proporção fixa . As sessões dada por Catania e Reynolds (1968) com N = 48 e
experimentais foram realizadas diariamente, cada t = 30 segundos . Após oito sessões, o cronograma
uma continuando até que 30 proporções fossem foi alterado para VI 60 seg com N = 60, t = 60 seg.
concluídas. Como P172 e P182 tinham históricos Como no procedimento de razão fixa , a luz
de bicar uma tecla de resposta , o experimento foi principal e a luz interna foram acesas durante todos
iniciado com um requisito de resposta FR 30 . Este os intervalos; a primeira resposta depois de
valor foi aumentado diariamente em 10 respostas decorrido um intervalo desligou a casa e as luzes
até atingir um valor final de FR 80 . Durante este durante 4 seg. Os primeiros 3,5 segundos desses
treinamento preliminar , a resposta terminal de cada 4 segundos consistiram na apresentação do
proporção desligou a luz interna e a luz principal por alimentador . Os 0,5 segundos finais foram o tempo
4 segundos ; os 3,5 segundos iniciais desse limite. Cada sessão de treinamento preliminar
período consistiam na apresentação do alimentador . terminava após 30 reforços. Após 10 sessões de
O 0,5 segundo final foi o tempo limite, durante o VI 60 segundos, a taxa de resposta e a duração da pausa ap
qual a câmara ficou escura e as respostas não A porcentagem de reforço foi então reduzida
tiveram efeito programado . As aves correram sob para 50% por 10 sessões adicionais .
essas condições de linha de base (100% de reforço ) até que a pausa
Intervalos quemédia diária durasse
terminam com respostas não reforçada
Machine Translated by Google

REFORÇO PORCENTUAL DAS RELAÇÕES E INTERVALOS 299

foram escolhidos como no procedimento de razão fixa ; descrito por Ferster e Skinner (1957). Durante
a resposta final nesses intervalos produziu um tempo todas as repetições da condição de linha de
limite de 4 segundos . Os intervalos reforçados foram base , durante toda a duração média da pausa
encerrados por um ciclo de reforço de apresentação do para P182 estabilizou em +2 segundos do valor
alimentador de 3,5 segundos , seguido de um intervalo obtido durante a condição inicial de reforço de 100% .
de 0,5 segundos . A duração da pausa e a taxa de Isso foi verdade para P172 em três das cinco
resposta foram medidas separadamente para cada intervalo.condições de linha de base ; as duas condições
de linha de base nas quais a média geral não
RESULTADOS
retornou ao valor inicial foram após reforço de
50% e após a segunda exposição a reforço de
Índice Fixo 60 % . As médias diárias das últimas cinco
Todos os dados do primeiro índice de cada sessões de cada condição de linha de base
sessão foram excluídos da análise seguinte geralmente caíram dentro de +3,5 segundos de
porque este índice foi iniciado em condições suas respectivas médias gerais . Ao mesmo
diferentes das existentes no início dos outros tempo , as taxas de resposta variaram em menos
índices . _ _ _ _ Para cada condição de linha de de +0,5 respostas por segundo entre as sessões.
base ( reforço de 100%) a duração média da As durações médias gerais das pausas das
pausa foi calculada para as cinco sessões finais condições anteriores de reforço de 100% e
individualmente. Além disso, a média geral foi as médias das sessões individuais após o
calculada para os dados combinados dessas reforço e a omissão do reforço são traçadas
sessões . Sob todas as condições de reforço na Fig. 1 para todas as porcentagens de
percentual , as médias foram calculadas sessão reforço . O primeiro painel para cada ave
por sessão . O desempenho mantido durante as mostra grandes diferenças nas pausas após
condições de reforço de 100% foi qualitativamente reforços obtidos e omitidos . A duração da
semelhante ao de pausa após o não reforço caiu abaixo do valor da linha

60B então% 80X B60X

o.

LUJ
Ln
n

LUr

P112
VOCÊ,.

a o .-

0
LUJ

LUJ
0n0-

SESSÕES
Fig. 1. Média de pausa de razão fixa após reforço ( círculos preenchidos ) e omissão de reforço ( círculos
abertos ) ao longo das cinco sessões de cada percentual de reforço . O ponto não conectado (B) é a pausa média
geral das cinco sessões anteriores à introdução do percentual de reforço indicado em cada painel .
Machine Translated by Google

300 JOHN C. McMILLAN

o valor após o reforço. Essas pausas mais ot.


curtas não foram produzidas por respostas por 60O 60X
meio do intervalo de tempo substituído por
reforço porque tais respostas raramente ocorriam.
Durante exposições sucessivas a porcentagens
reduzidas de reforço , as durações de pausa Lu
Ln
após o não reforço para P182 permaneceram
,,, tn

mais curtas do que o valor da linha de base e c:cc

o valor pós -reforço . As pausas após a omissão


0-
de reforçamento para P172 diminuíram de
maneira semelhante durante as três primeiras
P182 Pll2
exposições a porcentagens de reforçamento
reduzidas . No entanto, nos dois painéis finais , eu 2 3
234 4 S
o comprimento da pausa após o não reforço eu eu S

aumentou até exceder o valor médio após o SESSÕES


reforço com 30% de reforço . Fig. 2. Pausa média de razão fixa após reforço ( círculos
Uma segunda característica dos dados da Fig. 1 preenchidos) e omissão de reforço ( círculos abertos )
quando a duração do tempo limite era de 16 segundos.
é um aumento gradual na duração da pausa após O ponto não conectado (B) é o valor médio geral para as
o reforço em relação ao valor da linha de base cinco sessões anteriores com 100% de reforço.
durante a maioria das condições de reforço percentual .
A Figura 1 mostra que o aumento tende a
ocorrer em todos os percentuais de armadura DISCUSSÃO
com exceção de 80% . O procedimento de razão fixa no presente
O efeito de aumentar a duração do tempo limite com experimento resultou em dois resultados .
reforço de 60% é mostrado na Fig. 2. Quando a duração Primeiro, as durações das pausas após
do tempo limite era de 16 segundos , as durações da proporções reforçadas mostraram um aumento
pausa após o reforço aumentavam gradualmente para gradual em relação ao valor da linha de base em
valores que excediam a condição de linha de base todas as porcentagens de reforço , com exceção
anterior , um resultado semelhante ao obtido com de 80%. A natureza do esquema de reforço percentual usad
reforço de 60% quando a duração do tempo limite foi de 4 segundos.
As durações das pausas após o não-reforço Identidade I

para P182 foram geralmente da mesma


você

duração daquelas após o reforço; as pausas LeJ


P302
C)
=.
após o não reforço para P172 permaneceram
mais curtas do que aquelas após o reforço. LuC)

c:
Variável Intervalo
A duração da pausa durante o primeiro
intervalo de cada sessão foi novamente excluída
da análise . A duração da pausa da linha de base
mostrada na Fig. 3 é a duração média geral da
pausa nas cinco sessões finais de 100% de LUJ
Cr') /\.' ,P30- 4
reforço. Para as 10 sessões de reforço de 50% , =r

LAJ
os comprimentos médios das pausas foram
computados separadamente para intervalos Cr_a :

.
após reforço e omissão de reforço . Esses
valores também são mostrados na Fig. 3. A
duração média da pausa após o reforço ...,~~., , 1,i ., ., ., ,
6
permaneceu essencialmente inalterada em B 5
1 2 3 104 7 8 9

relação à duração da pausa da linha de base SESSÕES


para ambas as aves. Ao contrário dos resultados Fig. 3. Média de pausa de intervalo variável após
reforço ( círculos preenchidos ) e omissão de reforço
do procedimento de razão fixa, após o reforço ( círculos abertos ) ao longo das 10 sessões de reforço
omitido , a pausa aumentou em relação aos
de 50% . O ponto não conectado (B) é o valor médio
valores obtidos com 100% de reforço e após o reforço com
geral 50%.
para as cinco sessões anteriores com 100% de reforço.
Machine Translated by Google

REFORÇO PORCENTUAL DAS RELAÇÕES E INTERVALOS 301

que a probabilidade de uma razão não reforçada ção do efeito de omissão em termos do
era maior depois de uma razão reforçada do que controle discriminativo exercido pelo reforçamento . _
depois de uma razão não reforçada ; essa De acordo com esse relato, as condições de
dependência sequencial foi ainda maior depois estímulo existentes imediatamente após o reforço
que duas razões foram reforçadas em esquemas de razão fixa e intervalo fixo
sucessivamente . _ Se os sujeitos estivessem exercem efeitos posteriores inibitórios, produzindo
discriminando essas diferenças de probabilidade uma baixa probabilidade de resposta pós-reforço .
ao longo das sessões de reforço percentual , A origem desses efeitos posteriores inibitórios
isso poderia explicar tanto o aumento na duração não foi especificada. No entanto, quando algum
da pausa após as razões reforçadas quanto o outro evento (por exemplo, tempo limite) substitui
achado de que o aumento tendeu a surgir o reforço, esses efeitos posteriores inibitórios
gradualmente. O fato de que um aumento na ainda ocorrem, por meio da generalização do
duração da pausa pós-reforço não foi obtido em estímulo , mas em um grau menor , resultando
80% de reforço pode refletir a possibilidade de em uma pausa muito mais curta após o não
que poucas razões não reforçadas ocorreram reforço. Staddon (1970) relatou dados de um
em 80% para que a discriminação fosse adquirida . procedimento no qual as respostas dos pombos
O segundo resultado, que o não reforço geralmente foram reforçadas de acordo com um esquema
resultou em pausas mais curtas em comparação com VI VI misto envolvendo reforço para não
aquelas após o reforço no mesmo esquema de reforço responder durante um dos componentes (DRO).
percentual ou em um esquema de 100% , foi chamado Ele obteve curvas de resposta cumulativas
de efeito de "omissão" ou efeito de "frustração" . negativamente aceleradas em função do tempo
pós-reforço . Quando o tempo limite foi
Descobertas semelhantes foram relatadas apresentado em vez do reforço durante o
para esquemas de intervalo fixo (Staddon e componente VI DRO , a taxa de resposta no
Innis, 1966; Staddon e Innis , 1969), esquemas próximo intervalo foi reduzida. A explicação de
DRL (Davenport et al ., 1966) e esquemas de fered foi novamente em termos das propriedades
razão fixa (Davenport e Thompson, 1965). discriminativas do reforçamento . Sugeriu -se
Staddon e Innis (1969) apontaram as que esse procedimento resultava em efeitos
semelhanças entre esses tipos de experimentos posteriores pós -reforço que eram excitatórios
operantes livres e procedimentos frustrantes em vez de inibitórios; quando o tempo limite foi
sem recompensa ( ver Amsel, 1958 ) , apresentado no lugar do reforço , os pós- efeitos
sugerindo que um único mecanismo excitatórios foram mais fracos por causa do
englobando diferentes classes de respostas e decréscimo da generalização , produzindo assim uma tax
procedimentos é responsável pela similaridade A noção de frustração e a hipótese dos efeitos
da omissão . Efeitos de frustração/frustração posteriores são igualmente capazes de interpretar
obtidos nos experimentos de operante livre e de pista .
os atuais resultados de razão fixa porque cada
Amsel atribui o efeito da frustração à uma prevê pausas mais curtas após o não
eliciação da "frustração" incondicionada pela reforço do que após o reforço. A interpretação
falta de recompensa. A frustração foi do resultado do intervalo variável é claramente
introduzida como um constructo motivacional mais complexa. Não está fora de questão que o
que contribui para o impulso, de modo que esquema de intervalo empregado no presente
quando um animal que foi treinado para experimento poderia ter resultado em efeitos
responder sob reforço contínuo (100%) se posteriores excitatórios após o reforço, caso em
depara com o não reforço da resposta que o não reforço resultaria em depressão da
previamente aprendida , ele executa a resposta ( pausas mais longas ) . Na medida
resposta com mais vigor devido ao aumento em que tais efeitos se desenvolvessem, os
do impulso. Embora o escopo explicativo do resultados desse procedimento seriam
efeito de frustração tenha sido originalmente consistentes com a hipótese de Staddon .
limitado ao procedimento de pista dupla , ele A teoria da frustração inicialmente parece
foi estendido para a situação de operante livre incapaz de interpretar os dados do intervalo
por Scull, Davies e Amsel ( 1970) e outros variável porque a resposta aprimorada é o
(Davenport e Thompson, 1965; Davenport et al. ,resultado
1966). usual do não reforço. No entanto,
Staddon e Innis (1966, 1969), por outro lado , antes de rejeitar explicitamente tal explicação ,
propuseram uma explicação não motivacional deve - se notar que um requisito para a elicitação
Machine Translated by Google

302 JOHN C. McMILLAN

da frustração incondicionada pela não recompensa a noção de recompensa não prevê a depressão
é que as condições de estímulo que prevalecem no da resposta resultante da falta de recompensa ,
momento da não recompensa devem ser um resultado obtido no presente experimento e
discriminadas pelo sujeito como aquelas que relatado anteriormente por Staddon (1970),
normalmente acompanham o reforço. Em esquemas usando um procedimento diferente .
de razão fixa , as características da resposta ( por
exemplo, frequência , dicas proprioceptivas , etc. ),
REFERÊNCIAS
bem como a ocorrência de reforço , podem se
tornar discriminativas com relação à disponibilidade do Amsel,
próximoA. O papel da não recompensa frustrante em situações
reforço.
Em um esquema como o atual esquema de de recompensa não contínua . Psychological Bulletin, 1958,
55, 102-119.
intervalo variável , as propriedades de resposta Catania, A. C. e Reynolds , G. S. Uma análise
e a ocorrência de reforçamento são quantitativa da resposta mantida por esquemas de
deliberadamente impedidas de se tornarem reforço de intervalo . Journal of the Experimental
discriminativas sobre reforçamento iminente . Analysis of Behavior , 1968, 11, 327-383.
Parece possível , então , que a omissão de Davenport, J. W., Flaherty, C. F., e Dyrud, J. P.
Persistência temporal de efeitos de frustração em teclas
reforçamento em esquemas de intervalo mon . Psychonomic Science, 1966, 6, 411-412.
variável não seja suficientemente discriminada paraDavenport,
resultar em J. W.frustração.
e Thompson, C. I. O efeito de frustração
Mesmo que se aceite esta interpretação, a de Amsel em macacos. Psychonomnic Science,
constatação de que as pausas após 1965, 3, 481-482.
Ferster, C. B. e Skinner, B. F. Esquemas de reforço .
intervalos não reforçados foram mais longas Nova York: Appleton-Century-Crofts, 1957.
do que aquelas após o reforço ainda requer
explicação. Se o tempo limite não fosse Scull, J., Davies, Kathryn e Amsel, A. Contraste
discriminado como uma instância de omissão comportamental e efeito de frustração em esquemas
de intervalo fixo múltiplos e mistos no rato . Journal
de reforço , a teoria da frustração sugeriria
of Comparative and Physiological Psychology, 1970,
que a omissão de reforço não teria efeito na força da 71,resposta
478-483. .
Assim, fica claro que a não recompensa no Staddon, J. E. R. e Innis, Nancy K. Um efeito
contexto operante pode ter efeitos além daqueles análogo à "frustração" em esquemas de reforço
facilmente caracterizados pela noção frustrante de de intervalo . Psychonomic Science, 1966, 4, 287-288.
não recompensa . Staddon, J. E. R. e Innis, Nancy K. Omissão de reforço
em esquemas de intervalo fixo . Journal of the
Em resumo, é difícil escolher entre as Experimental Analysis of Behavior, 1969, 12, 689-700 .
explicações frustrantes de não-recompensa e
de efeitos posteriores de reforço de efeitos Staddon, J. E. R. Efeito temporal no reforço: um efeito
de omissão de reforço no contexto de negativo de "frustração" . Learning and Motivation ,
1970, 1, 227-247.
esquemas de reforço . Essa dificuldade Zimnmerman, D. W. Reforço intermitente de respostas
existe porque a noção de efeitos posteriores controladas discriminativamente e séries de
exige que o reforço em esquemas de intervalo respostas. Jornal da Análise Experimental do
variável como o atual exerça efeitos posteriores Comportamento, 1960, 3 , 83-91.
excitatórios . Não há como determinar se
essa pré- condição foi atendida . Por outro lado , Recebido
o frustrante não
em 1 de junho de 1970.

Você também pode gostar