Você está na página 1de 38

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

PAPEL 4
Reforço

Os três capítulos da Parte 4 são dedicados ao reforço, o princípio mais importante e amplamente aplicado
da análise do comportamento. Reforço, uma relação comportamento-consequência enganosamente
simples, é o alicerce fundamental do comportamento operante. O Capítulo 11 apresenta a operação e
definição do efeito do reforço, explica como os reforçadores são classificados e identificados, descreve
brevemente como as condições de estímulo antecedentes modulam os efeitos do reforço, discute os fatores
que influenciam a eficácia do reforço, descreve técnicas de controle experimental para verificar se um
reforço positivo a contingência é responsável pelo aumento da resposta e oferece diretrizes para o uso
eficaz do reforço.
No Capítulo 12, Richard Smith e Brian Iwata descrevem um dos princípios de comportamento mais
consistentemente incompreendidos. Smith e Iwata definem o reforço negativo, uma contingência operante
na qual o responder aumenta como resultado do término, redução ou adiamento de um estímulo como
consequência comportamental; comparar e contrastar com reforço positivo e punição; distinguir entre
contingências de fuga e esquiva; descrever eventos que podem servir como reforçadores negativos; ilustrar
como a aplicação de reforço negativo pode ser usada para fortalecer o comportamento desejado; e discutir
questões éticas que surgem ao usar o reforço negativo.
Uma das descobertas mais importantes de Skinner foi que o reforço não precisa seguir todas as
respostas. De fato, sob muitos esquemas intermitentes de reforço – nos quais o reforço segue algumas, mas
não todas, ocorrências do comportamento alvo – a resposta ocorre em taxas mais altas e mais consistentes
do que sob um esquema contínuo de reforço, no qual cada resposta é reforçada. O Capítulo 13 descreve
como o reforço intermitente pode ser programado com base em várias combinações de resposta e/ou
requisitos temporais e identifica padrões característicos de resposta associados a cada programação. Os
praticantes que entendem como diferentes esquemas de reforço influenciam o comportamento podem
programar o reforço para uma aquisição mais eficaz e eficiente de novas habilidades e para melhorar o
desempenho e a resistência das habilidades estabelecidas.

283
CAPÍTULO 11
Reforço positivo

OBJETIVOS DE APRENDIZADO
• Defina e dê exemplos de reforço positivo.
• Defina e forneça exemplos de reforço condicionado e incondicionado.
• Descrever e fornecer exemplos do paradigma do condicionamento operante (ou seja, as contingências de três e quatro termos).
• Identifique potenciais reforçadores.
• Use parâmetros e esquemas de reforço apropriados para identificar reforçadores.
• Use procedimentos de privação de resposta (por exemplo, o princípio Premack).
• Identificar procedimentos de controle para reforço positivo.
• Use o reforço positivo de forma eficaz.

Olhando para trás, parece-me que a coisa mais importante que mas geralmente consistia em o aluno estar sentado e orientado em direção
aprendi na pós-graduação foi com outro aluno, Burrhus Frederic ao objeto ou pessoa apropriado (por exemplo, olhando os materiais do curso
Skinner (eu o chamava de Burrhus, outros o chamavam de Fred). Este ou o professor palestrante) e a participação na aula (por exemplo,
homem tinha uma caixa, dentro da qual havia uma caixa menor, escrevendo a tarefa, respondendo à pergunta do professor). A variável
dentro da qual ele colocaria um rato de laboratório faminto. Quando independente foi a atenção do professor, sinalizada por um observador que
o animal, em suas explorações, pressionava uma alavanca que se ergueu um pequeno quadrado de papel colorido que provavelmente não
projetava de uma parede, uma bolinha de comida era descarregada seria percebido pelo aluno-alvo. A este sinal, a professora atendeu a criança
em uma bandeja sob a alavanca. Sob tais condições, o rato movendo-se para sua mesa e fazendo um comentário verbal ou dando-lhe
aprenderia, em questão de minutos, às vezes segundos, como obter um tapinha no ombro.
sua refeição pressionando a alavanca. Continuava até a pressionar, Os efeitos da atenção contingente do professor no comportamento
às vezes em ritmo acelerado, quando as pelotas eram entregues de todos os seis alunos foram surpreendentes. A Figura 11.1 mostra os
apenas de vez em quando; e se o suprimento de comida fosse resultados para Robbie, um aluno da terceira série que era “um aluno
totalmente cortado, o animal ainda continuaria trabalhando por particularmente perturbador que estudava muito pouco” (p. 3). Durante a
algum tempo. linha de base, Robbie se envolveu no comportamento do estudo por uma
— Fred Keller (1982, p. 7) média de 25% dos intervalos observados. No restante do tempo, ele estalava
elásticos, brincava com objetos no bolso, conversava e ria com colegas de
classe e brincava com uma caixa de leite vazia de sua bebida servida

P
anteriormente. A maior parte da atenção que Robbie recebeu seguiu-se a
o reforço positivo é o princípio de comportamento mais comportamentos disruptivos e não-estudos.
importante e mais amplamente aplicado. Embora algumas Seguindo a linha de base, os experimentadores mostraram ao
pessoas continuem acreditando que os resultados da pesquisa professor um gráfico do comportamento de estudo de Robbie,
de laboratório com animais não são aplicáveis ao aprendizado apresentaram os resultados de estudos anteriores em que a atenção adulta
humano, em meados da década de 1960 pesquisadores estabeleceram contingente melhorou o comportamento infantil e discutiram os
o papel significativo do reforço positivo na educação e no tratamento. fundamentos do fornecimento de reforço social contingente.
“É seguro dizer que sem as detalhadas análises laboratoriais de reforço Os resultados do reforço contingente foram os seguintes: Durante o
de Skinner (Skinner, 1938), não haveria campo de 'análise de Reforço 1, o comportamento do estudo de Robbie aumentou para uma média de
comportamento aplicada' hoje, pelo menos não como a 71%. Quando uma reversão às condições basais foi introduzida, seu
conhecemos” (Vollmer & Hackenberg, 2001, p. 241). ). comportamento no estudo diminuiu para uma média de 50%; mas quando o
Apropriadamente, o artigo principal da primeira edição doJournal of professor de Robbie novamente forneceu atenção contingente para o
Applied Behavior Analysisrelataram um experimento mostrando os efeitos comportamento de estudo (Reforço 2), seu comportamento de estudo se
do reforço positivo no comportamento do aluno (Hall, Lund e Jackson, 1968). recuperou e se estabilizou em um nível variando entre 70% e 80% dos intervalos
Seis alunos do ensino fundamental que eram perturbadores ou demorados observados. Observações de acompanhamento durante um período de 14
frequentemente participaram deste estudo clássico. A variável dependente, semanas mostraram que o comportamento do estudo de Robbie se manteve em
comportamento de estudo, foi definida individualmente para cada aluno, 79%. O professor relatou mudanças de comportamento positivas associadas ao
dependendo da matéria a ser ensinada, aumento do comportamento de estudo de Robbie. Na última semana de

284
Capítulo 11 • Reforço Positivo285

Linha de base Reforço1 Reversão Reforço2 Pós-cheques


100

Robbie

80
Comportamento de estudo percentual

60 Figura 11.1Porcentagem de intervalos de


comportamento de estudo por um aluno da
terceira série durante as condições de linha de
base e de reforço. A seta para o primeiro ponto
40
de dados pós-verificação mostra quando a
sugestão do professor para prestar atenção foi
descontinuada.
20
Baseado em “Efeitos da Atenção do Professor no
Comportamento de Estudo” de RV Hall, D. Lund e D.
Jackson, 1968,Journal of Applied Behavior Analysis,1
0
, pág. 3. Copyright 1968 pela Society for the
5 10 15 20 25 30 35 Experimental Analysis of Behavior, Inc.
Sessões

Reforço 2, Robbie completou suas tarefas de ortografia de O estímulo que se apresenta como consequência, e que é
forma mais consistente, seu comportamento perturbador responsável pelo subsequente aumento do responder, é chamado de
diminuiu e ele continuou a estudar enquanto bebia seu leite e estímulo.reforço positivo, ou, mais simplesmente, um reforço. A
não brincava com a caixa depois. A intervenção de Robbie foi atenção do professor na forma de elogios positivos foi o reforço que
baseada no princípio do reforço positivo. aumentou o comportamento de estudo de Robbie. Água fria fluindo em
Este capítulo examina a definição e a natureza do reforço um copo e a visão de um pássaro colorido são os reforços para os dois
positivo, descreve métodos para identificar reforçadores comportamentos mostrados na Figura 11.2.
potenciais e avaliar seus efeitos, descreve técnicas de controle É importante lembrar que um reforçador não afeta (e
experimental para verificar se uma contingência de reforço não pode) afetar a resposta que segue. Ao apresentar esse
positivo é responsável pelo aumento da resposta e oferece ponto, Skinner (1953) nos lembrou que o reforço afeta a classe
diretrizes para o uso eficaz do reforço positivo. de resposta operante.

Não é correto dizer que o reforço operante “fortalece a


REFORÇO POSITIVO DEFINIDO resposta que o precede”. A resposta já ocorreu e não pode
ser alterada. O que muda é a probabilidade futura de
O princípio do reforço é enganosamente simples. “A relação
respostas na mesma classe. É o operante como uma classe
funcional operante básica para reforço é a seguinte: Quando um
de comportamento, e não a resposta como uma instância
tipo de comportamento (R) é seguido por reforço (SR) haverá um
particular, que é condicionada. (pág. 87)
aumento da frequência futura desse tipo de
comportamento” (Michael, 2004, p. 30).1No entanto, como Michael Skinner (1938, 1966) usou a taxa de resposta como o dado
apontou, três qualificações devem ser consideradas em relação às fundamental para sua pesquisa sobre reforço. Fortalecer um operante é
condições sob as quais os efeitos do reforço ocorrerão: (a) o tempo fazê-lo ocorrer com mais frequência.2No entanto, a taxa não é a única
entre o final de uma dada resposta e o início da mudança do dimensão do comportamento selecionada, moldada e mantida pelo reforço.
estímulo (ou seja, a apresentação reforçador), (b) a relação entre as O reforço também pode alterar a duração, latência, tempo entre respostas,
condições de estímulo presentes quando a resposta foi emitida e magnitude e/ou topografia do comportamento. Por exemplo, se o reforço
(c) o papel da motivação. Nesta seção, examinamos essas segue apenas respostas que se enquadram em uma faixa de magnitude –
qualificações e vários outros conceitos necessários para adquirir isto é, acima de uma força mínima, mas abaixo de uma força máxima – as
uma compreensão completa do reforço. respostas dentro dessa faixa ocorrerão com mais frequência. O reforço
dependente de respostas que atendam a vários critérios alterará a classe de
Operação e Efeito Definidor do Reforço resposta que atende a esses critérios (por exemplo, respostas de um golfista
Positivo praticando tacadas de 10 pés devem estar dentro de uma faixa estreita de
força e forma para serem bem-sucedidas).
Reforço positivoocorre quando uma resposta é seguida
imediatamente pela apresentação de uma mudança de estímulo que
Imediatismo do Reforço
aumenta a ocorrência futura de respostas semelhantes. A Figura 11.2
ilustra a contingência de dois termos — uma resposta seguida de perto Os efeitos diretos do reforço envolvem “relações temporais entre o
no tempo pela apresentação de um estímulo — e o aumento da comportamento e suas consequências que são da ordem de alguns
resposta futura que define o reforço positivo. Essa contingência de dois segundos” (Michael, 2004, p. 161). Embora pesquisas com animais
termos é o bloco de construção fundamental para a seleção de todo não humanos sugiram que até 30 segundos podem decorrer sem
comportamento operante. perda crítica de efeito (por exemplo, Bradley & Poling,
286Parte 4 • Reforço

R SR+ Efeito na Ocorrência Futura


de respostas semelhantes

Segure o copo sob a torneira e A água fria flui para


alavanca de pressão copo
Figura 11.2Contingência de dois termos
ilustrando reforço positivo: Uma resposta (R) é
seguida de perto no tempo por uma mudança
de estímulo (SR+) que resulta em uma maior
ocorrência de respostas semelhantes no
futuro. Usado com permissão de Skinner, BF Vire a cabeça e olhe para a esquerda Veja o pássaro colorido

(1953). Ciência e comportamento humano.


Nova York: Macmillan.

2010; Byrne, LeSage, & Poling, 1997; Critchfield & Lattal, 1993; Consequências atrasadas não reforçam o comportamento diretamente.
Lattal & Gleason, 1990; Wilkenfeld, Nickel, Blakely e Poling, 1992), Consequências atrasadas podem, quando combinadas com a linguagem,influência
um atraso de resposta ao reforço de apenas 1 segundo será menos comportamento futuro por meio do controle instrucional e do cumprimento de
eficaz do que um reforço entregue imediatamente. Isso ocorre regras. UMAregraé uma descrição verbal de uma contingência comportamental
porque comportamentos diferentes do comportamento alvo (por exemplo, “Sementes de nabo plantadas até 15 de agosto produzirão uma
podem ocorrer durante o atraso; o comportamento colheita antes de um congelamento mortal.”). Aprender a seguir regras é uma
temporalmente mais próximo da apresentação do reforçador será maneira de o comportamento de uma pessoa ficar sob o controle de
fortalecido por sua apresentação. Como Sidman (1960) descreveu: consequências que são muito atrasadas para influenciar diretamente o
“Se o reforçador não seguir imediatamente a resposta que foi comportamento. Uma afirmação do professor de piano como “Se você praticar
necessária para sua produção, então ele seguirá algum outro suas tarefas todos os dias por uma hora entre agora e a competição, você pode
comportamento. Seu maior efeito será então sobre o ganhar o primeiro lugar” poderia ter funcionado como uma regra que influenciava
comportamento que carrega, acidentalmente, com certeza, a a prática diária do aluno de piano. A prática diária da aluna era evidência de
relação temporal anterior mais próxima do reforço” (p. 371). comportamento governado por regras se a prática diária ocorresse por causa da
Malott e Shane (2014) discutiram a importância de um regra de seu professor.3Em outras palavras,comportamento governado por
breve atraso de resposta ao reforço, como segue: regrasé o comportamento controlado por uma regra (isto é, uma declaração
verbal de uma contingência antecedente-comportamento-consequência) que
[Se] você está tentando reforçar uma resposta, não ultrapasse o
permite que o comportamento humano fique sob o controle indireto de
limite de 60 segundos, empurre a outra extremidade - a extremidade
consequências temporariamente remotas ou improváveis, mas potencialmente
de 0 segundo. O efeito direto do reforço diminui rapidamente à
significativas. As condições a seguir fornecem fortes indicadores de que o
medida que você aumenta o atraso, até 3 ou 4 segundos. E mesmo
comportamento é o resultado do controle instrucional ou é um comportamento
um atraso de 1 segundo pode reforçar o comportamento errado. Se
governado por regras, em vez de um efeito direto de reforço (Malott, 1988;
você pedir a uma criança pequena que olhe para você e dê o reforço
Michael, 2004).
1 segundo após a resposta, é provável que você reforce o olhar na
direção errada. Assim, um problema com o reforço atrasado é que • Nenhuma consequência imediata para o comportamento é aparente.
ele reforça a resposta errada — aquela que ocorreu pouco antes da • O atraso resposta-consequência é superior a 30 segundos.
entrega do reforçador. (pág. 4) • Mudanças de comportamento sem reforço.
• Um grande aumento na ocorrência do comportamento
Um equívoco comum é que consequências atrasadas podem
ocorre após uma instância de reforço.
reforçar o comportamento, mesmo quando as consequências ocorrem
• Não existe nenhuma consequência para o comportamento, incluindo
dias, semanas ou mesmo anos após a ocorrência das respostas.
nenhum reforço automático, mas a regra existe.
“Quando o comportamento humano é aparentemente afetado por
consequências demoradas, a mudança é realizada em virtude da
O reforço não é um conceito circular
complexa história social e verbal do humano, e não deve ser pensada
como um exemplo de simples fortalecimento do comportamento por Outro equívoco comum é que o reforço é o produto do raciocínio
reforço” (Michael, 2004). , pág. 36). circular e, portanto, não contribui em nada para nossa
Por exemplo, suponha que uma aluna de piano pratique todos os compreensão do comportamento. Não tão. O raciocínio circular é
dias durante vários meses em preparação para uma competição estadual, na uma forma de lógica defeituosa em que o nome usado para
qual ela recebeu um prêmio de primeiro lugar por sua performance de piano descrever um efeito observado é confundido com a causa do
solo. Embora alguns possam acreditar que o prêmio reforçou sua prática efeito. Essa confusão de causa e efeito é circular porque o efeito
diária persistente, eles estariam enganados. observado é a única base para identificar a causa presumida.
Capítulo 11 • Reforço Positivo287

No raciocínio circular, a causa suspeita não é independente de seu [No entanto,] se dissermos, por exemplo, que um determinado
efeito – elas são uma e a mesma. estímulo fortalece um comportamento de respostaPorqueé um
Aqui está um exemplo de raciocínio circular que ocorre reforçador, estamos usando o termoreforçode forma circular.
frequentemente na educação. As dificuldades persistentes de um aluno em Isso éPorquefortalece o comportamento que chamamos de
aprender a ler (efeito) levam a um diagnóstico formal de uma dificuldade de estímulo umreforço. (pág. 4)
aprendizagem, que é então oferecido como uma explicação para as
Epstein (1982) passou a explicar a diferença entre usar um
dificuldades do aluno com a leitura: “O problema de leitura de Yoshi é devido
princípio demonstrado empiricamente, como o reforço em uma
à sua dificuldade de aprendizagem”. Como você sabe que Yoshi tem uma
explicação teórica do comportamento e usar um argumento circular.
deficiência de aprendizagem? Porque ele não aprendeu a ler. Por que Yoshi
não aprendeu a ler? Porque sua dificuldade de aprendizagem o impediu de Em alguns de seus escritos, Skinner especula que certo
aprender a ler. E ao redor e ao redor ele vai. comportamento (por exemplo, comportamento verbal) surgiu por
Da mesma forma, seria um raciocínio circular se disséssemos meio de reforço. Ele pode sugerir, por exemplo, que determinado
que a atenção do professor aumentou o comportamento de estudo de comportamento é fortePorquefoi reforçado. Este uso do conceito
RobbiePorqueé um reforço. Em vez disso, é correto dizer que, como o não é circular, apenas especulativo ou interpretativo. Usar a
comportamento de estudo de Robbie aumentou quando (e somente linguagem de reforço dessa maneira é razoável quando você
quando) foi imediatamente seguido pela atenção do professor, a acumulou uma grande base de dados. . . . Quando Skinner atribui
atenção do professor é um reforço. A diferença é mais do que a direção algum comportamento cotidiano a reforçadores passados, ele está
da relação, ou algum truque semântico. No raciocínio circular, a causa fazendo uma suposição plausível com base em uma grande base de
suspeita não é manipulada como uma variável independente para ver dados e princípios de comportamento estabelecidos sob condições
se afeta o comportamento. No raciocínio circular, tal manipulação controladas. (pág. 4)
experimental é impossível porque a causa e o efeito são os mesmos. A
Usado corretamente,reforçodescreve uma relação
dificuldade de aprendizagem de Yoshi não pode ser manipulada como
funcional demonstrada empiricamente (ou especulativa, em
uma variável independente porque, como usamos o conceito neste
uma análise teórica ou conceitual) entre uma mudança de
exemplo, nada mais é do que outro nome para a variável dependente
estímulo (consequência) imediatamente após uma resposta e
(efeito).
um aumento na ocorrência futura de respostas semelhantes. A
O reforço não é um conceito circular porque os dois
Tabela 11.1 mostra restrições e exemplos de uso apropriado
componentes da relação resposta-consequência podem ser separados,
dos termosreforço, reforço, reforço, ereforçar, como sugerido
permitindo que a entrega de uma consequência seja manipulada para
por Catânia (2013). O Quadro 11.1 descreve quatro erros
determinar se ela aumenta a ocorrência do comportamento que segue.
comumente cometidos ao falar e escrever sobre reforço.
Epstein (1982) descreveu-o da seguinte forma:

Se pudermos mostrar que uma resposta aumenta em


Relação entre Reforço e Condições de
frequência porque (e somente porque) é seguida por um
Estímulo Antecedentes
estímulo particular, chamamos esse estímulo dereforçoe sua
apresentação,reforço. Observe a falta de circularidade. O reforço faz mais do que aumentar a ocorrência futura do
Reforçoé um termo que invocamos quando observamos comportamento; também altera a função dos estímulos que precedem
certas relações entre eventos no mundo. . . . imediatamente o comportamento reforçado. Em virtude de ser

TABELA 11.1 O Vocabulário de Reforço*


Prazo Restrições Exemplos
reforço (substantivo) Um estímulo Pastilhas de comida foram usadas como reforço para as prensas de alavanca do rato.

reforçando (adjetivo) Uma propriedade de um estímulo O estímulo reforçador foi produzido com mais frequência do que os outros
estímulos não reforçadores.

reforço (substantivo) Como uma operação, a entrega de O esquema de proporção fixa de reforço entregava comida a cada
consequências quando ocorre uma resposta 10 bicadas na tecla.
Como processo, o aumento no O experimento com macacos demonstrou reforço produzido
responder que resulta do reforço por consequências sociais.
reforçar (verbo) Como uma operação, para entregar Quando um período de brincadeira livre foi usado para reforçar a
consequências quando ocorre uma resposta; conclusão do trabalho escolar da criança, as notas da criança melhoraram.
respostas são reforçadas e não organismos

Como um processo, para aumentar a O experimento foi projetado para descobrir se as estrelas douradas
resposta através da operação de reforço reforçariam o jogo cooperativo entre os alunos da primeira série.

* Este vocabulário é apropriado se e somente se existirem três condições: (1) Uma resposta produz consequências; (2) esse tipo de resposta ocorre com mais
frequência quando produz essas consequências do que quando não as produz; e (3) o aumento da resposta ocorrePorquea resposta tem essas consequências. Um
vocabulário paralelo é apropriado para punição (incluindoJusticeirocomo estímulo epunircomo um verbo), com a diferença de que uma consequência punitiva reduz
a probabilidade de resposta futura.
Baseado emAprendizagem, Temporário(5ª ed.) por AC Catania, 2013, p. 66. Cornwall-on-Hudson, NY: Sloan Publishing.
288Parte 4 • Reforço

CAIXA 11.1

Erros comuns ao falar e escrever sobre reforço


Um conjunto padrão de termos técnicos é pré-requisito para a Reforço Artificial
descrição significativa de qualquer atividade científica. A
Algumas vezes é feita uma distinção entre reforçadores naturais e
comunicação eficaz do projeto, implementação e resultado de
artificiais, como nesta afirmação: “À medida que as taxas de sucesso dos
uma análise de comportamento aplicada depende do uso preciso
alunos melhoraram, gradualmente paramos de usar reforçadores
da linguagem técnica da disciplina. A linguagem de reforço inclui
artificiais, como adesivos e bugigangas, e aumentamos o uso de
alguns dos elementos mais importantes do vocabulário do
reforçadores naturais”. Alguns autores sugeriram que as aplicações dos
analista do comportamento.
princípios de comportamento resultam em “controle artificial” (por
Nesta caixa, identificamos quatro erros cometidos com
exemplo, Smith, 1992). Uma contingência comportamento-consequência
frequência por estudantes de análise do comportamento aplicada
pode ser eficaz ou ineficaz como reforço, mas nenhum de seus elementos
ao descrever intervenções baseadas em reforço. Talvez o erro
(o comportamento, a consequência ou a mudança de comportamento
mais comum - confundir reforço negativo com punição não seja
resultante) é ou pode ser artificial.
discutido aqui. Esse erro de terminologia foi introduzido no
As contingências de reforço e os estímulos usados como
Capítulo 2 e recebe atenção adicional no Capítulo 12.
reforçadores em qualquer programa de mudança de
comportamento são sempre inventados — caso contrário, não
Reforçando a pessoa
haveria necessidade do programa, mas nunca são artificiais
Embora seja correto falar em apresentar umareforçopara um aluno (Skinner, 1982). A distinção significativa ao falar sobre
(por exemplo, “O professor entregava um token a Bobby cada vez que contingências de reforço não é entre o natural e o artificial, mas
ele fazia uma pergunta”), declarações como “O professor reforçava entre contingências que já existem em um determinado cenário
Bobby quando ele fazia uma pergunta” e “Chloe era reforçada com antes de um programa de mudança de comportamento e
elogios cada vez que soletrava uma palavra corretamente” estão contingências que são planejadas como parte do programa
incorretas.Comportamentossão reforçadas, não pessoas. O professor (Kimball & Heward, 1993). . Embora a eficácia final de um
de Bobby reforçou a pergunta, não Bobby. É claro que o reforço atua programa de mudança de comportamento possa depender da
e afeta a pessoa como um todo, na medida em que fortalece os mudança do controle de contingências planejadas para
comportamentos dentro do repertório da pessoa. No entanto, o foco contingências naturais, não existe reforço artificial.
procedimental e o efeito primário do reforço estão nos
comportamentos que ele segue. Reforço e feedback como sinônimos
Alguns oradores e escritores usam erroneamentereforçoe retorno
Prática como reforço para uma habilidade
intercambiavelmente. Os dois termos referem-se a diferentes
Os educadores às vezes dizem que os alunos devem praticar uma operações e resultados, embora alguns de cada termo englobem
habilidade porque “praticar reforça a habilidade”. A frase não apresenta partes do significado do outro termo.Comentáriosé a informação que
nenhum problema se o falante estiver descrevendo um resultado comum uma pessoa recebe sobre um aspecto particular de seu
da prática com a conotação da linguagem cotidiana dereforçar, como em comportamento após sua conclusão (por exemplo, “Muito bom,
“tornar algo mais forte” (por exemplo, para reforçar o concreto embutindo Kathy. Dois quartos equivalem a 50 centavos.”). O feedback é mais
barras de aço nele). Exercícios e prática bem projetados em uma frequentemente fornecido na forma de descrições verbais do
habilidade geralmente produzem um desempenho mais forte na forma de desempenho, mas também pode ser fornecido por outros meios,
melhor retenção, latência reduzida, taxas de resposta mais altas e/ou como vibração ou luzes (por exemplo, Greene, Bailey e Barber, 1981).
maior resistência (por exemplo, Johnson & Layng, 1994; Swanson & Sachse- Como o feedback é uma consequência que muitas vezes resulta no
Lee, 2000). Infelizmente, uma frase como “praticar reforça a habilidade” é aumento da ocorrência futura de comportamento, às vezes leva à
muitas vezes mal utilizada e mal interpretada como uso técnico da suposição errônea de que o reforço deve envolver feedback ou que
linguagem do condicionamento operante. reforço é apenas o termo de um behaviorista pararetorno.
Embora uma habilidade praticada geralmente seja mais forte como O reforço sempre aumenta a frequência futura de resposta. O
resultado da prática, a prática em si não pode ser um reforçopelo feedback pode resultar em (a) um aumento na ocorrência futura do
comportamento praticado. A prática refere-se à forma e à maneira pela desempenho do aluno como um efeito de reforço e/ou como um
qual a habilidade alvo é emitida (por exemplo, respondendo a tantos alerta ou instrução sobre como responder da próxima vez (por
problemas de matemática quanto você puder em 1 minuto). Praticar é um exemplo, “Sua caligrafia está melhorando, Jason, mas não se esqueça
comportamento que pode ser reforçado com várias consequências, como para cruzar seus T's”) e/ou (b) uma redução na ocorrência de algum
uma atividade preferida (por exemplo, “Pratique resolvendo esses aspecto do desempenho do aluno em função de punição ou instrução
problemas de matemática; então você terá 10 minutos de tempo livre”). (por exemplo, “Você deixou cair o cotovelo naquele arremesso. Não
Dependendo do histórico e das preferências de um aluno, a oportunidade faça isso.” ). O feedback pode ter múltiplos efeitos, aumentando um
de praticar uma determinada habilidade pode funcionar como um reforço aspecto do desempenho e diminuindo outro. O feedback também
para praticar outra habilidade (por exemplo, “Termine seus problemas de pode não ter nenhum efeito nas respostas futuras.
matemática; então você terá 10 minutos de prática de leitura repetida”).
Capítulo 11 • Reforço Positivo289

O reforço é definido funcionalmente por seu efeito na consequências sobre o comportamento, provavelmente é mais sensato seguir o
resposta futura; o feedback é definido por suas características conselho de Jack Michael (2004) e simplesmente usar linguagem descritiva
formais (informações sobre algum aspecto do desempenho). cotidiana e relações de senso comum.
A operação de um ou outro conceito não é necessária nem
A linguagem técnica usada incorretamente é pior do que a
suficiente para o outro. Ou seja, o reforço pode ocorrer na
linguagem do senso comum porque sugere que a situação é bem
ausência de feedback e o feedback pode ocorrer sem um
compreendida e pode substituir tentativas sérias de análise
efeito de reforço.
posterior. Até que sejamos capazes de fornecer uma análise precisa
dos vários processos relevantes para efeitos indiretos [de reforço],
Às vezes, a linguagem do senso comum é melhor
é melhor usar a linguagem descritiva comum. Assim, digamos que
A linguagem técnica da análise do comportamento é complexa, e “o pedido de subvenção bem sucedido ésusceptível de encorajar
dominá-la não é uma questão simples. Estudantes iniciantes de esforços futuros na mesma direção”, mas não diga isso como se
análise do comportamento não são os únicos que cometem erros de você tivesse a ciência do comportamento por trás de você. Pare de
terminologia. Profissionais bem treinados, pesquisadores se referir a acordos bem-sucedidos de uma disputa trabalhista
estabelecidos e autores experientes também cometem erros de vez como reforço para a greve, e a eleição bem-sucedida de um
em quando ao falar e escrever sobre análise do comportamento. Usar candidato político como reforço para a atividade política. . . . Não
conceitos e princípios comportamentais – como reforço positivo – fale sobre boas notas como reforço para um comportamento de
para explicar com confiança situações complexas envolvendo estudo eficaz, embora elas sejam, sem dúvida, responsáveis por
múltiplos processos e variáveis descontroladas e desconhecidas é mantê-lo em alguns casos. Basta dizer que eles são responsáveis
um erro que às vezes pega os analistas do comportamento mais por mantê-lo. Restrições desse tipo privarão alguns de nós da
atentos e conscientes. oportunidade de (incorretamente) exibir nosso conhecimento
Em vez de invocar a terminologia e os conceitos técnico, mas tanto melhor. (p. 165, ênfase no original)
de reforço para explicar a influência de

emparelhados temporalmente com a contingência resposta-reforçador, mudança em questão. Conforme apresentado no Capítulo 2,
os eventos antecedentes adquirem a capacidade de evocar (tornar mais operações motivadorasalterar a eficácia atual das mudanças de
prováveis) instâncias da classe de resposta reforçada. Conforme estímulo como reforço.
apresentado no Capítulo 2, umestímulo discriminativo(SD, pronunciado
As operações motivadoras (MOs) são variáveis ambientais que
“essdee”) é um estímulo antecedente correlacionado com a
têm dois efeitos sobre o comportamento: (1) alteram a eficácia de
disponibilidade de reforço para uma determinada classe de resposta.
reforço operante de alguns estímulos, objetos ou eventos
Respondendo na presença do SDproduz reforço; respondendo na
específicos (o efeito de alteração de valor); e (2) alteram a
ausência do SD(uma condição chamadadelta de estímulo(S∆,
frequência momentânea de todo comportamento que foi
pronunciado “ess-delta”) não. Como resultado dessa história de reforço,
reforçado por esses estímulos, objetos ou eventos (o efeito de
a pessoa aprende a dar mais respostas na presença do S.Ddo que na
alteração do comportamento). O efeito de alteração de valor, como
sua ausência. O comportamento é então considerado sobcontrole de
atraso de reforço de resposta, é relevante para a eficácia do
estímulo(ver Capítulo 17).
reforçador no momento do condicionamento, e afirmar que a
Com a adição do SD, a contingência de dois termos para reforço
consequência é uma forma de reforço implica que um MO
torna-se a contingência de três termos dooperante discriminado. A
relevante está em vigor e com força suficiente. (Michael 2004, p.
Figura 11.3 mostra exemplos de contingências de três termos para
31)
reforço positivo. Supondo que a água fria esteja reforçando e a pessoa
tenha um histórico de obter água fria apenas em torneiras azuis, é mais Em outras palavras, para que uma mudança de estímulo
provável que ela segure seu copo sob a torneira azul do refrigerador “funcione” como reforço a qualquer momento, o aprendiz já deve
(do que, digamos, uma torneira vermelha). Da mesma forma, quereristo. Esta é uma qualificação crítica em termos das condições
assumindo que ver um pássaro colorido é atualmente reforçador e uma ambientais sob as quais os efeitos do reforço serão vistos. Michael
pessoa tem um histórico de ver pássaros com mais frequência ao olhar (2004) explicou essa qualificação da seguinte forma:
para sons de chilrear (do que, digamos, outros sons ou silêncio), virar a
O efeito de alteração de comportamento é relevante para o
cabeça e olhar para a esquerda ocorrerá com mais frequência quando o
aumento da frequência futura do comportamento reforçado, e
chilrear é ouvido à esquerda.
deve ser adicionado como uma terceira qualificação à relação de
reforço operante: Em uma dada situação de estímulo (S) quando
O papel da motivação
um tipo de comportamento (R) é seguido imediatamente por
A fraseassumindo que a água fria está atualmente reforçando no reforço (SR) haverá um aumento na frequência futura desse tipo de
parágrafo anterior contém outra chave para entender o reforço. comportamento nas mesmas condições de estímulo ou
Embora o reforço seja comumente pensado como uma maneira de semelhantes,mas o aumento da frequência só será visto quando o
motivar as pessoas – e pode ser – a eficácia momentânea de MO relevante para o reforço que foi usado estiver novamente em
qualquer mudança de estímulo como reforço depende de um nível vigor. (p. 31, ênfase no original)
existente de motivação em relação ao estímulo.
290Parte 4 • Reforço

Efeito na Ocorrência Futura


SD R SR+ de respostas semelhantes

na presença de SD

Segure o copo sob a torneira e A água fria flui para


Torneira azul no refrigerador de água
alavanca de pressão copo

Som de chilrear para a esquerda Vire a cabeça e olhe para a esquerda Veja o pássaro colorido

Figura 11.3Contingência de três termos ilustrando reforço positivo de um operante discriminado: Uma resposta (R) emitida na presença
de um estímulo discriminativo (SD) é seguido de perto no tempo por uma mudança de estímulo (SR+) e resulta em um aumento da
ocorrência de respostas semelhantes no futuro quando o SDé presente. Um operante discriminado é o produto de uma história de
condicionamento em que as respostas na presença do SDproduziu reforço e respostas na ausência do SD(uma condição chamada
estímulo delta [S∆]) não foram reforçados (ou resultaram em uma quantidade ou qualidade de reforço reduzida do que no SDdoença).

As operações motivadoras assumem duas formas. Um MO que produzia água no passado. Da mesma forma, um guarda florestal
aumenta a eficácia atual de um reforçador é chamado deestabelecimento de declarando antes de uma caminhada que qualquer caminhante que
operação (EO)(por exemplo, a privação de alimentos torna o alimento mais descreve a coloração do pássaro que faz um certo som de chilrear receberá
eficaz como reforçador); um MO que diminui a eficácia atual de um um token de US $ 5 para a loja de presentes é um OE que (a) fará ver um
reforçador é umoperação de abolição (AO)(ex., a ingestão de alimentos pássaro que faz o som de chilrear eficaz como reforço e (b) aumentar a
reduz a eficácia do alimento como reforçador).4 frequência de todos os comportamentos (por exemplo, virar a cabeça para
Adicionando oestabelecimento de operação (EO)a um operante olhar ao redor, andar em silêncio) que produziram consequências
discriminado resulta em uma contingência de quatro termos, como mostra a semelhantes (neste caso, ver a fonte dos sons) no passado.
Figura 11.4. Passar várias horas em um quarto quente e abafado sem água é Em termos mais simples, as operações de estabelecimento (EOs)
um OE que (a) torna a água mais eficaz como reforço e (b) aumenta a determinam o que um indivíduoquerem qualquer momento específico.
frequência momentânea de todos os comportamentos que Os OEs são dinâmicos, sempre mudando. Eficácia do reforço

Efeito na Ocorrência Futura

OE SD R SR+ de respostas semelhantes

Sob Condições Semelhantes


no futuro

Privado de água por 2 horas Toque azul em Segure o copo sob a torneira Fluxos de água fria
em quarto quente e abafado refrigerador de água e empurre a alavanca no copo

O guarda florestal diz: “Depois da nossa

caminhada, qualquer um que descreva


Som de chilrear Vire a cabeça
o pássaro que faz esse som de Veja o pássaro colorido
para a esquerda e olhe para a esquerda
chilrear receberá um token de US $ 5

para a loja de presentes.”

Figura 11.4Contingência de quatro termos ilustrando reforço positivo de um operante discriminado tornado corrente por uma
operação motivadora:Dmais propensos a evocar o comportamento que foi reforçado por essa mudança de estímulo no passado.
Capítulo 11 • Reforço Positivo291

(o desejo) aumenta com níveis crescentes de privação e diminui interação social contínua (por exemplo, jogar um jogo simples,
com níveis de saciedade. Vollmer e Iwata (1991) demonstraram conversar) com o participante por 15 minutos.
como a eficácia reforçadora de três classes de estímulos – comida, Todos os cinco participantes responderam a taxas mais altas
música e atenção social – variava sob condições de privação e nas condições de privação do que nas condições de saciedade. A
saciedade. Os participantes foram cinco adultos com deficiências Figura 11.5 mostra os efeitos da privação e saciedade da atenção
de desenvolvimento, e a variável dependente foi o número de social sobre a eficácia da atenção social como reforço para dois dos
respostas por minuto em duas tarefas motoras – apertar um botão participantes do estudo, Donny e Sam. Outros pesquisadores
ou pegar pequenos blocos de um recipiente e colocá-los no buraco relataram achados semelhantes sobre os efeitos da privação e
no topo de outro recipiente. Todas as sessões duravam 10 minutos saciedade de vários estímulos e eventos como operações
e começavam com o experimentador dizendo: “Faça isso, [nome do motivadoras que afetam a eficácia relativa do reforço (por
participante]” e modelando a resposta. Durante a linha de base, as exemplo, Hanley, Iwata & Roscoe, 2006; Klatt, Sherman & Sheldon,
respostas dos participantes não receberam consequências 2000; North & Iwata, 2005; Zhou, Iwata e Shore, 2002).
programadas. Durante as condições de privação e saciedade, as
respostas foram seguidas por apresentação de comida, música ou Automaticidade do Reforço
atenção social. Inicialmente cada resposta era seguida pela
Uma conexão de reforço não precisa ser óbvia para o
consequência programada; isso gradualmente mudou para cada
indivíduo reforçado.
terceira, quinta ou décima resposta sendo seguida pela
— BF Skinner (1953, p. 75)
consequência.
Diferentes procedimentos foram utilizados para criar condições O fato de uma pessoa não ter que entender ou verbalizar a relação
de privação e saciedade para cada classe de estímulo. Com alimentos, entre suas ações e uma consequência reforçadora, ou mesmo
por exemplo, as sessões de condição de linha de base e de privação estar ciente de que uma consequência ocorreu, para que o reforço
foram realizadas 30 minutos antes do horário de almoço programado ocorra é conhecido como oautomaticidade do reforço. Skinner
de um participante; as sessões durante a condição de saciedade foram (1983) forneceu um exemplo interessante de automaticidade no
realizadas dentro de 15 minutos após o participante ter almoçado. Para terceiro e último volume de sua autobiografia,Uma questão de
atenção social, as sessões de condição de linha de base e de privação consequências. Ele descreveu um incidente que ocorreu em uma
foram conduzidas imediatamente após um período de 15 minutos em reunião de estudiosos ilustres que foram convidados a discutir o
que o participante estava sozinho ou foi observado que não teve papel da intenção na atividade política. A certa altura da reunião, o
interação social com outra pessoa. Imediatamente antes de cada psicólogo Erich Fromm começou a argumentar que “as pessoas
sessão na condição de saciedade, o experimentador forneceu não eram pombos”, talvez

Linha de base Privação Saciedade Privação


30
Donny
25

20

15

10

5
Respostas por minuto

Linha de base Saciedade Privação Saciedade Privação


30
Sam
25
Figura 11.5Respostas por minuto de
dois alunos durante a linha de base e
20
quando a atenção social foi usada
15 como reforço em condições de
privação e saciedade para atenção
10 social.
De “Estabelecendo Operações e Efeitos de
5 Reforço”, de TR Vollmer e BA Iwata, 1997,Journal
of Applied Behavior Analysis, 24, pág. 288.
0 Copyright 1991 pela Society for the Experimental
10 20 30 40 Analysis of Behavior, Inc. Reimpresso com
Sessões permissão.
292Parte 4 • Reforço

implicando que uma análise operante baseada no reforço positivo não influência sobre se o reforço segue. Os seres humanos se envolvem em
poderia explicar o comportamento humano, que Fromm acreditava ser o muitos comportamentos supersticiosos. Os esportes fornecem inúmeros
produto do pensamento e do livre arbítrio. Skinner contou o que aconteceu a exemplos: um jogador de basquete puxa seu short antes de dar uma falta,
seguir: um jogador de golfe carrega seu marcador de bola da sorte, um batedor
passa pela mesma sequência de ajustar suas pulseiras antes de cada
Decidi que algo tinha que ser feito. Em um pedaço de papel escrevi: arremesso, um fã de futebol universitário usa uma colar feito de nozes não
“Observe a mão esquerda de Fromm. Vou moldar [reforçar por comestíveis para trazer boa sorte ao seu time.5
aproximações sucessivas] um movimento de corte” e passou-o pela A importância de entender a arbitrariedade do reforço
mesa para Halleck [um membro do grupo]. Fromm estava sentado vai muito além de fornecer uma possível explicação para o
do outro lado da mesa e falava principalmente comigo. Virei minha desenvolvimento de comportamentos supersticiosos e
cadeira um pouco para que idiossincráticos inofensivos. A natureza arbitrária da
Eu podia vê-lo com o canto do meu olho. Ele gesticulava muito enquanto seleção por reforço pode explicar a aquisição e manutenção
falava, e sempre que sua mão esquerda surgia, eu olhava diretamente de muitos comportamentos desadaptativos e desafiadores.
para ele. Se ele trouxe a mão para baixo, eu balancei a cabeça e sorri. Em Por exemplo, a atenção social bem-intencionada de um
cinco minutos, ele estava cortando o ar com tanta força que seu relógio cuidador fornecida na tentativa de consolar ou distrair uma
de pulso não parava de escorregar em sua mão. (pp. 150–151, palavras pessoa que está se machucando pode ajudar a moldar e
entre colchetes adicionadas) manter o próprio comportamento que o cuidador está
tentando prevenir ou eliminar. Kahng, Iwata, Thompson e
Arbitrariedade do Comportamento Selecionado Hanley (2000) documentaram com uma análise funcional
No que diz respeito ao organismo, a única propriedade que o reforço social manteve o comportamento autolesivo
importante da contingência é temporal. (SIB) e a agressão de três adultos com deficiências de
— BF Skinner (1953, p. 85) desenvolvimento.

O reforço ocorre independentemente de uma conexão lógica ou


Reforço Automático
adaptativa entre o comportamento e uma consequência reforçadora.
Em outras palavras, o reforço fortalece qualquer comportamento que o Kennedy (1994) observou que os analistas de comportamento aplicados
preceda imediatamente. Essa natureza arbitrária do comportamento usam dois significados para definir o termoreforço automático. Em
selecionado é fundamental para entender o reforço. Todas as outras primeira instância, o reforço automático é determinado pela ausência
relações (por exemplo, o que é lógico, desejável, útil, apropriado) de mediação social (Vollmer, 1994, 2006). Nesse contexto,reforço
devem competir com a relação temporal entre comportamento e automáticorefere-se à relação de mudança comportamento-estímulo
consequência. “Dizer que o reforço é contingente a uma resposta pode que ocorre sem a apresentação de consequências por outras pessoas
significar nada mais do que seguir a resposta. . . o condicionamento (Vaughan & Michael, 1982; Vollmer, 1994, 2006). Em suma, o reforço
ocorre presumivelmente por causa apenas da relação temporal, automático ocorre independentemente da mediação social dos outros.
expressa em termos de ordem e proximidade de resposta e Os produtos de resposta que funcionam como reforço automático são
reforço” (Skinner, 1948, p. 168). muitas vezes na forma de uma consequência sensorial produzida
Skinner (1948) demonstrou a natureza arbitrária dos comportamentos naturalmente que “soa bem, parece bom, tem um gosto bom, cheira
selecionados pelo reforço em um de seus trabalhos experimentais mais famosos, bem, é bom ao toque, ou o movimento em si é bom” (Rincover, 1981,
“Superstition in the Pigeon”. Ele dava aos pombos uma pequena quantidade de pág. 1). Coçar uma picada de inseto para aliviar ou atenuar a coceira é
comida a cada 15 segundos, “sem qualquer referência ao comportamento do um exemplo comum de reforço automático.
pássaro” (p. 168). O fato de que o reforço fortalecerá qualquer comportamento Na segunda instância,reforço automáticoé
que siga imediatamente ficou evidente. Seis das oito aves desenvolveram assumido quando um comportamento persiste na
comportamentos idiossincráticos “tão claramente definidos, que dois ausência de qualquer reforçador conhecido (Hagopian,
observadores poderiam concordar perfeitamente na contagem de instâncias” (p. Rooker, & Yenokyan, 2018). Nestas situações “default”,
168). Um pássaro caminhou no sentido anti-horário ao redor da gaiola; outro assume-se que o reforço automático é a variável de
enfiou repetidamente a cabeça em um dos cantos superiores da gaiola. Dois controle (Fisher, Lindauer, Alterson, & Thompson, 1998;
pássaros adquiriram um “movimento pendular da cabeça e do corpo, em que a Ringdahl, Vollmer, Marcus, & Roane, 1997; Roscoe,
cabeça se estendia para a frente e balançava da direita para a esquerda com um Iwata, & Goh, 1998). Comportamentos auto-
movimento brusco seguido de um retorno um pouco mais lento” (p. 169). Os estimulatórios persistentes, aparentemente sem
pombos não exibiram nenhum desses comportamentos em “qualquer força propósito, repetitivos e auto-estimulatórios (p. Acredita-
perceptível” durante a adaptação à gaiola ou antes que a comida fosse se que essa “autoestimulação” seja um fator que
apresentada periodicamente. mantém o comportamento autolesivo (Iwata, Dorsey,
Qualquer que fosse o comportamento que os pombos estivessem Slifer, Bauman e Richman, 1994), movimentos repetitivos
fazendo quando a tremonha de comida aparecia, tendia a se repetir, o que estereotipados, puxões de cabelo (Rapp, Miltenberger,
tornava mais provável que ocorresse quando a comida aparecesse na Galensky, Ellingson e Long, 1999), roer unhas,
próxima vez. O reforço não era contingente (no sentido de dependente) do
comportamento; era apenas uma coincidência que o reforço às vezes Determinar que um comportamento pode ser
seguisse o comportamento. Tal comportamento acidentalmente reforçado é mantido por reforço automático e, quando possível, isolar
chamado de “supersticioso” porque não tem ou substituir a fonte desse reforço (ver Figura 8.5; Shore,
Capítulo 11 • Reforço Positivo293

Iwata, DeLeon, Kahng e Smith, 1997), tem implicações importantes Sundberg (1996) descreveu uma história de condicionamento de dois
para projetar intervenções para capitalizar a natureza de reforço estágios que pode explicar o reforço automático condicionado.
automático do comportamento ou neutralizá-lo. Como Vollmer
Por exemplo, uma pessoa pode persistir em cantar ou cantarolar uma
(1994) afirmou “. . . um objetivo claro da pesquisa deve ser
música ao voltar para casa depois de um filme, apesar de não haver um
desenvolver procedimentos destinados a identificar fontes
reforço direto óbvio para cantar. Para que esse comportamento ocorra
específicas de reforço automático. A avaliação eficaz pode permitir
como comportamento reforçado automaticamente, é necessário um
o desenvolvimento de tratamentos que envolvem reverter ou
histórico de condicionamento especial de dois estágios. No estágio um,
eliminar as contingências que mantêm um comportamento” (p.
algum estímulo (por exemplo, uma música) deve ser combinado com uma
191). Assumindo que tal avaliação fornece pistas importantes para
forma existente de reforço condicionado ou incondicionado (por exemplo,
intervenção, Vollmer propôs ainda cinco intervenções para reduzir
um filme agradável, pipoca, relaxamento). Como resultado, o novo
ou eliminar comportamentos mantidos por reforço automático .
estímulo pode se tornar uma forma de reforço condicionado (por
exemplo, ouvir a música pode agora ser uma nova forma de reforço

1.Elimine ou minimize as operações de estabelecimento com base condicionado). No estágio dois, a emissão de uma resposta (por qualquer

médica. Por exemplo, uma criança batendo na orelha ou coçando o motivo) produz um produto de resposta (isto é, os estímulos auditivos

braço repetidamente pode ser tratada com um antibiótico ou loção produzidos pelo canto da música) que tem semelhança topográfica com

medicamentosa para reduzir ou eliminar a estimulação aversiva aquele estímulo previamente neutro (por exemplo, a música), e pode

produzida por uma dor de ouvido ou coceira baseada em alergia que agora ter propriedades de auto-reforço. (págs. 22–23)

estabeleceu respostas de pancadas ou arranhões como um reforço


negativo. Vários teóricos sugeriram que o reforço automático
2.Tente um procedimento de extinção sensorial, eliminando ou pode ajudar a explicar o balbucio extenso de bebês e
reduzindo as fontes de estimulação visual, auditiva ou como o balbucio muda naturalmente, sem intervenção
proprioceptiva. O uso de luvas, roupas blindadas, capacetes e aparente de outros, de vocalizações indiferenciadas para
assim por diante servem como exemplos. os sons da fala de sua língua nativa (por exemplo, Bijou
3.Implementar reforço diferencial de intervenções de & Baer, 1965; Mowrer, 1950; Skinner, 1957; Staats &
comportamento alternativo (DRA), proporcionando assim uma Staats, 1963; Vaughan & Michael, 1982). Os cuidadores
“escolha” com uma fonte alternativa de reforço contingente ao frequentemente falam e cantam enquanto seguram,
comportamento apropriado. Um curso de ação forneceria uma alimentam e dão banho em um bebê. Como resultado
fonte diferente de estimulação visual, auditiva ou proprioceptiva do emparelhamento repetido com vários reforçadores
que competiria com o comportamento automaticamente (por exemplo, comida, calor), a voz do cuidador pode se
reforçado. Ensinar a pessoa a ligar um vibrador elétrico, tornar um reforçador condicionado para o bebê. O
televisão ou carrossel musical para obter estímulos alternativos balbucio do bebê é reforçado automaticamente quando
servem como exemplos. produz sons que combinam ou se aproximam dos do
4.Considere a punição para anular as contingências de cuidador. Nesse ponto,
manutenção atuais e, assim, capitalizar o fato de que (a) a
punição não requer o conhecimento das variáveis de Embora a ideia de que o reforço automático é um fator na aquisição precoce da linguagem tenha sido proposta

controle específicas e (b) as circunstâncias exigentes não repetidamente, poucas análises experimentais do fenômeno apareceram na literatura (por exemplo, Miguel, Carr, & Michael, 2002;

permitem um trabalho de detetive prolongado para Sundberg, Michael, Partington, & Sundberg, 1996; Yoon & Bennett, 2000). Sundberg e colegas (1996) relataram o primeiro estudo

determinar as contingências de reforço existentes. mostrando os efeitos de um procedimento de emparelhamento estímulo-estímulo na taxa com que as crianças emitiam novos sons

vocais sem reforço direto ou prompts para responder. Cinco crianças, com idades entre 2 e 4 anos e representando uma ampla gama
5.Implemente um programa de “pacote”. “É improvável que
de habilidades de linguagem, serviram como sujeitos. Durante a condição de pré-emparelhamento (linha de base), os pais e
qualquer intervenção derivada de operações de
treinadores em casa sentaram-se a poucos metros da criança e gravaram cada palavra ou som vocal emitido pela criança enquanto
estabelecimento, extinção sensorial, reforço diferencial ou
brincava com um trem e vários brinquedos. Os dados foram coletados em intervalos consecutivos de 1 minuto. Os adultos não
punição seja usada isoladamente de outros procedimentos. As
interagiram com o sujeito durante a linha de base de preparação. O procedimento de pareamento estímulo-estímulo consistia na
abordagens de tratamento de pacote são comuns tanto em
aproximação de um adulto familiar com a criança, emitindo um som vocal, palavra ou frase alvo e, em seguida, entregando
pesquisas quanto em ambientes clínicos. No caso de reforço
imediatamente um estímulo que havia sido estabelecido previamente como forma de reforço para a criança (p. elogios, saltando em
automático, é possível que uma abordagem de pacote seja
um pára-quedas segurado por adultos). Este procedimento de pareamento estímulo-estímulo foi repetido 15 vezes por minuto
altamente adequada”. (Vollmer, 1994, p. 203)
durante 1 ou 2 minutos. O adulto usou uma variedade Os adultos não interagiram com o sujeito durante a linha de base de

Cada uma dessas recomendações tem vantagens e desvantagens, e preparação. O procedimento de pareamento estímulo-estímulo consistia na aproximação de um adulto familiar com a criança,

nenhuma é uma “bala de prata” que abordará instantaneamente o efeito do emitindo um som vocal, palavra ou frase alvo e, em seguida, entregando imediatamente um estímulo que havia sido estabelecido

reforço automático no comportamento. Como Vollmer (1994) observa: previamente como forma de reforço para a criança (p. elogios, saltando em um pára-quedas segurado por adultos). Este

“Quando os reforçadores que mantêm um comportamento não estão sob o procedimento de pareamento estímulo-estímulo foi repetido 15 vezes por minuto durante 1 ou 2 minutos. O adulto usou uma

controle do terapeuta ou do experimentador (ou seja, o ambiente social), o variedade Os adultos não interagiram com o sujeito durante a linha de base de preparação. O procedimento de pareamento estímulo-

comportamento é especialmente difícil de avaliar e tratar” (p. 188). Ainda estímulo consistia na aproximação de um adulto familiar com a criança, emitindo um som vocal, palavra ou frase alvo e, em seguida,

assim, essas cinco recomendações fornecem uma direção para os analistas entregando imediatamente um estímulo que havia sido estabelecido previamente como forma de reforço para a criança (p. elogios,

determinarem sua eficácia em instâncias individuais. saltando em um pára-quedas segurado por adultos). Este procedimento de pareamento estímulo-estímulo foi repetido 15 vezes por

As respostas podem produzir reforço automático minuto durante 1 ou 2 minutos. O adulto usou uma variedade saltando em um pára-quedas segurado por adultos). Este procedimento

incondicionado ou condicionado. Sundberg, Michael, Partington e de pareamento estímulo-estímulo foi repetido 15 vezes por minuto durante 1 ou 2 minutos. O adulto usou uma variedade saltando em um pára-quedas s
294Parte 4 • Reforço

de alturas e entonações ao expressar o som, palavra ou frase alvo. reduzido ou eliminado com tempo limite, ignorando planejado
Durante a condição de pós-emparelhamento, que começou ou extinção.
imediatamente após os pares estímulo-estímulo, o adulto se • Afixação da etiquetareforço automáticoa um fenômeno
afastou da criança e as condições foram as mesmas da condição de observado muito rapidamente pode limitar nossa análise e
pré-emparelhamento. eficácia ao impedir esforços adicionais para identificar o
O emparelhamento estímulo-estímulo de um som, palavra ou frase comportamento real de manutenção do reforçador.
vocal com um reforçador estabelecido foi seguido por um aumento da • Quando as contingências socialmente mediadas são difíceis de organizar ou
frequência da palavra-alvo durante a condição pós-emparelhamento para simplesmente não estão disponíveis, os profissionais podem considerar o
todas as cinco crianças. A Figura 11.6 mostra os resultados de uma amostra reforço automático como um objetivo potencial.
representativa de um dos três pares realizados com o Sujeito 2, um menino
de 4 anos com autismo. O sujeito 2 tinha repertório verbal superior a 200 REFORÇADORES DE CLASSIFICAÇÃO
mandos, tatos e intraverbais, mas raramente emitia vocalizações
Nesta seção, revisamos a classificação técnica de reforçadores por sua
espontâneas ou engajados em brincadeiras vocais.6Durante a condição de
origem, bem como várias categorias práticas pelas quais praticantes e
pré-emparelhamento, a criança não disse a palavra alvo e emitiu outras
pesquisadores geralmente descrevem e classificam reforçadores por
quatro vocalizações a uma taxa média de 0,5 por minuto. O procedimento de
suas características formais. Independentemente do tipo ou
pareamento estímulo-estímulo consistiu em parear a palavramaçãcom
classificação, todos os reforçadores compartilham sua característica
cócegas aproximadamente 15 vezes em 60 segundos. Imediatamente após o
mais importante e definidora: todos os reforçadores aumentam a
emparelhamento, o sujeito disse “maçã” 17 vezes em 4 minutos, uma taxa de
ocorrência futura do comportamento que os precede imediatamente.
4,25 respostas por minuto. Além disso, a criança disse “cócegas” quatro
vezes no primeiro minuto da condição pós-emparelhamento. Os resultados
de Sundberg e colegas fornecem evidências de que os produtos de resposta Classificação dos Reforçadores por Origem
vocal das crianças podem ter funcionado como reforço condicionado Conforme apresentado no Capítulo 2, existem dois tipos básicos de
automático após serem pareados com outras formas de reforço. reforçadores: um reforçador que é o produto da evolução da espécie
(um reforçador incondicionado) ou um reforçador que é resultado da
Ao resumir os usos e limitações do reforço automático história de aprendizado do indivíduo (um reforçador condicionado).
como conceito, Vollmer (2006) sugeriu que:

• Os profissionais devem reconhecer que nem todo reforço é Reforçadores Incondicionados


planejado ou mediado socialmente. Umreforço incondicionadoé uma mudança de estímulo que
• Alguns comportamentos mantidos por reforço automático funciona como reforço, mesmo que o aluno não tenha um histórico
(por exemplo, autoestimulação, estereotipia) podem não ser particular de aprendizado com ela. (Os termosreforço primárioe

20
Preparando Emparelhamento Pós-emparelhamento

Sujeito 2
15
Respostas vocais cumulativas

Nova palavra “maçã”

Outra vocalização
10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Minutos

Figura 11.6Número cumulativo de vezes que uma criança de 4 anos com autismo vocalizou “maçã” antes e depois de “maçã” ter sido
emparelhado repetidamente com uma forma estabelecida de reforço. O reforço automático pode explicar o aumento da frequência da
vocalização da “maçã” da criança após o emparelhamento.
De “The Role of Automatic Reinforcement in Early Language Acquisition”, de ML Sundberg, J. Michael, JW Partington e CA Sundberg, 1996, A Análise do
Comportamento Verbal,13, pág. 27. Copyright 1996 pela Association for Behavior Analysis, Inc. Usado com permissão.
Capítulo 11 • Reforço Positivo295

reforço não aprendidosão sinônimos de reforçador incondicionado.) Como certamente não com os reforçadores primários (M&Ms). O papel
os reforçadores incondicionados são o produto da história evolutiva de uma amarelo adquiriu propriedades reforçadoras ainda mais poderosas
espécie (filogenia), todos os membros biologicamente intactos de uma do que os reforçadores primários de M&Ms, como demonstrado pela
espécie são mais ou menos suscetíveis ao reforço pelos mesmos recusa das crianças em aceitar M&Ms, exigindo, em vez disso,
reforçadores incondicionados. Por exemplo, comida, água, oxigênio, calor e pedaços de papel amarelo. (Para este exemplo, suponha que as
estimulação sexual são exemplos de estímulos que não precisam passar por crianças não tenham sido saciadas com M&Ms pouco antes da
uma história de aprendizado para funcionar como reforçadores. A comida sessão.) (p. 1368)
funcionará como um reforço incondicionado para um humano privado de
sustento; a água funcionará como um reforço incondicionado para uma Às vezes, pensa-se que o “poder” de um reforçador
pessoa privada de líquido, e assim por diante. condicionado é determinado pelo número de vezes que
O toque humano também pode ser um reforço incondicionado foi emparelhado com outros reforçadores. No entanto,
(Gewirtz & Pelaez-Nogueras, 2000). Pelaez-Nogueras e colegas (1996) uma afirmação como “Quanto mais frequentemente o
descobriram que os bebês preferiam interações face a face que tom for combinado com a comida, mais reforçador o
incluíam estimulação de toque. Dois tratamentos de condicionamento tom se tornará” não é completamente precisa. Embora
foram implementados em ordem contrabalanceada alternada. Sob a vários pares aumentem a probabilidade de que o tom
condição de toque, as respostas de contato visual dos bebês foram funcione como um reforçador condicionado em primeiro
seguidas imediatamente pela atenção do adulto (contato visual), lugar (embora um único par às vezes seja suficiente), a
sorrindo, arrulhando e esfregando as pernas e os pés dos bebês. As eficácia momentânea do tom como reforçador será uma
respostas de contato visual durante a condição sem toque foram função do OE relevante para o reforçador. (s) com o qual
seguidas por contato visual, sorrisos e arrulhos do adulto, mas sem o reforçador condicionado foi emparelhado. Um tom
toque. Todos os bebês do estudo emitiram contato visual por mais que foi emparelhado apenas com comida funcionará
tempo, sorriram e vocalizaram em taxas mais altas e passaram menos como um reforço eficaz para um aluno privado de
tempo chorando e protestando na condição contingente que incluía o comida,
toque. A partir desses resultados e de vários estudos relacionados, UMAreforçador condicionado generalizadoé um reforçador
Pelaez-Nogueras e colegas concluíram que “esses resultados sugerem condicionado que, como resultado de ter sido emparelhado com
que . . . a estimulação do toque pode funcionar como um reforço muitos reforçadores incondicionados e condicionados, não depende de
primário para o comportamento infantil” (p. 199). um OE atual para qualquer forma particular de reforço para sua
eficácia. Por exemplo, a atenção social (proximidade, contato visual,
elogio) é um reforçador condicionado generalizado para muitas
Reforçadores Condicionados pessoas porque ocorreu simultaneamente com muitos reforçadores.
UMAreforçador condicionado(às vezes chamado dereforço secundário Quanto mais reforçadores com os quais um reforçador condicionado
oureforço aprendido) é uma mudança de estímulo previamente neutra generalizado foi pareado, maior a probabilidade de que ele seja eficaz a
que adquiriu a capacidade de funcionar como um reforçador por meio qualquer momento. Como pode ser trocado por uma variedade quase
do emparelhamento estímulo-estímulo com um ou mais reforçadores ilimitada de reforçadores de apoio, o dinheiro é um reforçador
incondicionados ou reforçadores condicionados. Por meio de condicionado generalizado cuja eficácia geralmente é independente
emparelhamentos repetidos, o estímulo anteriormente neutro adquire das operações atuais de estabelecimento.
a capacidade de reforço do(s) reforçador(es) com o qual foi Às vezes, pensa-se que um reforçador condicionado é chamado
emparelhado.7Por exemplo, depois que um tom foi emparelhado de reforçador condicionado generalizado porque pode funcionar como
repetidamente com a comida, quando a comida é fornecida como um reforço em uma ampla gama de comportamentos. Isto, porém, não é
reforçador, o tom funcionará como um reforçador quando um OE fez assim. Qualquer reforçador é capaz de fortalecer a ocorrência futura de
da comida um reforçador atualmente efetivo. qualquer comportamento semelhante que precede imediatamente sua
Estímulos neutros também podem se tornar reforçadores condicionados ocorrência. Um reforçador condicionado é chamado de reforçador
para humanos sem emparelhamento físico direto com outro reforçador por meio condicionado generalizado porque é eficaz como reforço em uma
de um processo de emparelhamento chamado Alessi (1992)condicionamento ampla gama de condições de OE. Devido à sua versatilidade em
analógico verbal. condições de OE, reforçadores condicionados generalizados oferecem
grandes vantagens para os praticantes, que muitas vezes têm controle
Por exemplo, uma classe de crianças em idade pré-escolar que tem limitado dos OEs para reforçadores específicos.
recebido doces M&M por um bom trabalho escolar pode ver pedaços Reforçadores condicionados generalizados fornecem a base para a
de papel amarelo cortado e dizer: “Esses pedaços de papel amarelo implementação de umeconomia simbólica, um sistema baseado em reforço
são para o que as crianças grandes trabalham” (Engelmann, 1975, capaz de melhorar múltiplos comportamentos de múltiplos participantes
pp. . 98-100). Muitas crianças do grupo imediatamente recusam (Alstot, 2015; Campbell & Anderson, 2011; Hirst, Dozier, & Payne, 2016). Em
M&Ms e trabalham muito duro, mas aceitam apenas pedaços de uma economia de fichas, os participantes recebem fichas (por exemplo,
papel amarelo como recompensa. pontos, marcas de seleção, fichas de pôquer) dependendo de uma variedade
Poderíamos dizer que os pedaços de papel amarelo atuam como de comportamentos-alvo. Os participantes acumulam as fichas e as trocam
“reforços aprendidos”. Pesquisas de laboratório nos dizem que estímulos em momentos específicos por suas escolhas em um menu de reforços de
neutros se tornam reforçadores apenas por meio do emparelhamento direto backup (por exemplo, tempo livre, tempo de computador, lanches). Os
com reforçadores primários (ou outros “reforçadores aprendidos”). O papel sistemas de economia de tokens e as diretrizes para projetá-los e
amarelo não foi pareado com nenhum reforçador e implementá-los são descritos no Capítulo 28.
296Parte 4 • Reforço

Classificação de Reforçadores por Propriedades Reforçadores sensoriais


Formais Várias formas de estimulação sensorial, como vibração (por exemplo,

Quando os analistas de comportamento aplicados descrevem os massageador), estimulação tátil (por exemplo, cócegas, golpes com boá

reforçadores por suas propriedades físicas – uma prática que pode melhorar de penas), luzes piscantes ou cintilantes e música têm sido usadas

a comunicação entre pesquisadores, praticantes e as agências e pessoas que efetivamente como reforçadores (por exemplo, Bailey & Meyerson,

eles servem – os reforçadores são tipicamente classificados como 1969; Ferrari & Harris, 1981; Gast et al., 2000; Hume & Crossman, 1992;

comestíveis, sensoriais, tangíveis, ativos ou sociais. Rincover & Newsom, 1985; Vollmer & Iwata, 1991).

Reforçadores Tangíveis
Reforçadores Comestíveis
Itens como adesivos, bugigangas, materiais escolares, figurinhas e
Pesquisadores e praticantes usaram mordidas de alimentos preferidos,
pequenos brinquedos geralmente servem como reforços tangíveis. O valor
lanches, doces e goles de bebidas como reforços. Um uso interessante e
intrínseco de um objeto é irrelevante para sua eficácia final como reforçador
importante de comestíveis como reforçadores é no tratamento da recusa
positivo. Praticamente qualquer item tangível pode servir como reforço.
alimentar crônica em crianças. Por exemplo, Riordan, Iwata, Finney, Wohl e
Lembre-se dos alunos do jardim de infância de Engelmann (1975) que
Stanley (1984) usaram “alimentos altamente preferidos” como reforçadores
trabalhavam por tiras de papel amarelas!
para aumentar a ingestão de alimentos de quatro crianças em uma unidade
de tratamento hospitalar. O programa de tratamento consistiu em dispensar
Reforçadores de atividade
os itens alimentares de alta preferência (por exemplo, cereais, iogurte, frutas
enlatadas, sorvete) condicionadas ao consumo de um item alimentar-alvo Quando a oportunidade de se engajar em um determinado comportamento

(por exemplo, legumes, pão, ovos). funciona como reforço, esse comportamento é um reforçador da atividade. Os

Kelley, Piazza, Fisher e Oberdorff (2003) usaram reforços reforçadores de atividade podem ser atividades cotidianas (por exemplo, jogar um

comestíveis para aumentar o consumo de copo por Al, um menino de 3 jogo de tabuleiro, ler por lazer, ouvir música), privilégios (por exemplo, almoçar

anos que havia sido admitido em um programa de tratamento diário com o professor, atirar cestas, primeiro da fila) ou eventos especiais (por exemplo,

para recusa alimentar e dependência de mamadeira. Os pesquisadores uma ida ao zoológico ).

mediram a porcentagem de testes em que Al consumiu 7,5 ml de três McEvoy e Brady (1988) avaliaram os efeitos do acesso

líquidos diferentes do copo. Durante a linha de base, quando Al foi contingente a materiais lúdicos no preenchimento de planilhas de

elogiado se consumiu a bebida, seu consumo foi em média de 0%, matemática por três alunos com autismo e transtornos de

44,6% e 12,5% dos testes para suco de laranja, água e chocolate, comportamento. Durante a linha de base, o professor disse aos alunos

respectivamente. Durante o componente de reforço positivo da que completassem os problemas da melhor maneira possível e que

intervenção no copo, cada vez que Al consumia a bebida, o terapeuta o completassem outras tarefas inacabadas ou “encontrassem outra coisa

elogiava (como foi feito na linha de base) e entregava uma colher rasa para fazer” se terminassem as planilhas antes de decorridos 6 minutos.

de pêssegos (um alimento preferido) em sua boca. Al consumiu as três Não foram dadas outras instruções ou instruções para o

bebidas em 100% das tentativas durante a condição de reforço positivo. preenchimento das planilhas. A professora elogiou o preenchimento

Fahmie, Iwata e Jann (2015) descobriram que 12 indivíduos das planilhas.

diagnosticados com deficiência intelectual ou autismo e com idades entre 5 e No primeiro dia de intervenção para cada aluno, ele foi levado

22 anos preferiram o acesso de 15 segundos a um único reforço comestível para outra sala e mostrado uma variedade de brinquedos e materiais

(por exemplo, M&M, passas, pretzel) a 15 segundos. segundo acesso a um lúdicos. O professor disse ao aluno que ele teria aproximadamente 6

item de lazer (por exemplo, caixa de música, ursinho de pelúcia, maracá) e minutos para brincar com os materiais se atendesse a um critério diário

que os reforçadores comestíveis mantiveram a resposta um pouco mais para resolver problemas de matemática. A Figura 11.7 mostra os

longa do que os reforçadores de itens de lazer. Em relação às implicações resultados. Durante a linha de base, a taxa em que todos os três alunos

desses resultados para uma prática eficaz, Fahmie e colegas observaram: concluíram corretamente os problemas foi baixa (Dicky) ou altamente
variável (Ken e Jimmy). Quando o acesso contingente às atividades
Essas vantagens fornecem evidências a favor da inclusão de itens lúdicas foi introduzido, a taxa de conclusão de cada aluno aumentou e
comestíveis nas avaliações preliminares de preferência. Uma acabou excedendo os níveis de critério.
vantagem adicional dos reforçadores comestíveis é que eles são Premack (1959) levantou a hipótese de que reforçadores de atividade
entregues com mais facilidade e eficiência, o que pode ter um efeito podem ser identificados observando a distribuição relativa de comportamentos
benéfico geral no treinamento a longo prazo. No entanto, em uma situação operante livre. Premack acreditava que os próprios
pesquisadores (por exemplo, Ferrari & Harris, 1981; Rincover & comportamentos poderiam ser usados como reforçadores e que a frequência
Newsom, 1985) enfatizaram os benefícios relativos dos estímulos de relativa do comportamento era um fator importante para determinar a eficácia de
lazer durante o treinamento, afirmando que os estímulos de lazer um determinado comportamento como reforçador se a oportunidade de se
são mais naturais, são menos deletérios para a saúde (ver também envolver no comportamento dependesse de outro comportamento. oPrincípio de
Behavior Analysis Certification Board, 2014, Diretriz 4.10) e promover pré-moldagemafirma que tornar a oportunidade de se engajar em um
um engajamento mais ativo. É claro que os analistas de comportamento que ocorre em uma taxa relativamente alta de operantes livres
comportamento também são responsáveis por fornecer o (ou linha de base) contingente à ocorrência de comportamento de baixa
tratamento mais eficaz (Behavior Analyst Certification Board, 2014, frequência funcionará como reforço para o comportamento de baixa ocorrência.
Diretriz 2.09). Este estudo fornece algumas evidências adicionais Para um aluno que normalmente passa muito mais tempo assistindo TV do que
para ajudar a equilibrar esses objetivos. (p. 342, citações BACB fazendo lição de casa, uma contingência baseada no princípio Premack
atualizadas para a versão mais recente). (informalmente conhecido como
Capítulo 11 • Reforço Positivo297

Linha de base Acesso Contingente


6,0
Dicky
5,0

4,0

3,0 Problemas concluídos corretamente


Problemas concluídos incorretamente
2,0

1,0

0
(6.9)
6,0
Ken
5,0
Número por minuto

4,0

3,0

2,0

1,0

0
(6.3) (6.3)
6,0
Jimmy
5,0
Figura 11.7Número de problemas de matemática preenchidos
4,0
corretamente e incorretamente por minuto por três alunos de
3,0 educação especial durante a linha de base e acesso contingente a
materiais de jogo. As linhas horizontais tracejadas indicam os
2,0 critérios.

1,0 De “Contingent Access to Play Materials as an Academic Motivator for


Autistic and Behavior Disordered Children”, de MA McEvoy e MP Brady,
0 1988,Educação e Tratamento de Crianças,11, pág. 15. Copyright 1998
5 10 15 20 25 30 pelo Editorial Review Board ofEducação e Tratamento de Crianças.
Sessões Usado com permissão.

“Lei da vovó”) pode ser: “Quando você terminar sua lição de linha de base (Konarski, Johnson, Crowell e Whitman, 1980). Os
casa, você pode assistir TV”. pesquisadores descobriram que uma contingência na qual os alunos
Com base no conceito de Premack, Timberlake e Allison (1974) poderiam ganharmais tempocolorir do que eles fizeram na linha de base
propuseram ohipótese de privação de respostacomo um modelo para para completar os problemas de matemática foi ineficaz. Esses achados
prever se o acesso a um comportamento (o comportamento básicos foram reproduzidos em um estudo subsequente no qual o acesso à
contingente) funcionará como reforço para outro comportamento (a leitura (ou matemática, dependendo do assunto) dependia da matemática
resposta instrumental) com base nas taxas de linha de base relativas (ou leitura) (Konarski, Crowell, Johnson, & Whitman, 1982). No terceiro
em que cada comportamento ocorre e se o acesso ao comportamento estudo, Konarski, Crowell e Duggan (1985) levaram a hipótese de privação de
contingente representa uma restrição em comparação com o nível resposta um passo adiante, examinando a “reversibilidade do reforço”
básico de engajamento. Restringir o acesso a um comportamento dentro dos sujeitos; isto é, engajar-se em qualquer uma das duas atividades
presumivelmente atua como uma forma de privação que serve como – leitura ou matemática – poderia servir como reforço para o aumento do
OE, tornando a oportunidade de se engajar no comportamento restrito desempenho na outra atividade, em uma condição de privação de resposta
uma forma efetiva de reforço (Allison, 1993; Iwata & Michael, 1994). para a atividade contingente. A privação de resposta para leitura como
resposta contingente resultou em aumentos em matemática (resposta
Iwata e Michael (1994) citaram uma série de três estudos de Konarski instrumental); por outro lado, privação de resposta para matemática à
e colegas como demonstrando a veracidade e as implicações aplicadas da medida que a resposta contingente produzia aumentos na leitura. Em todos
hipótese de privação de resposta. No primeiro estudo, quando os alunos os três estudos, a restrição de resposta foi o fator chave para determinar se
tiveram acesso a colorir (um comportamento de alta probabilidade o acesso à resposta contingente seria reforçador.
contingente à conclusão de problemas de matemática (um comportamento
de baixa probabilidade), eles passaram mais tempo fazendo matemática, Iwata e Michael (1994) concluíram que os resultados
mas apenas se o esquema de reforço representasse uma restrição da coletivos dos estudos de Konarski e colegas ilustram cada uma das
quantidade de tempo gasto colorindo em comparação com três previsões baseadas na hipótese de privação de resposta
298Parte 4 • Reforço

(suponha que a proporção entre as taxas básicas de fazer lição de casa 1964; Harris, Johnston, Kelly e Wolf, 1964; Hart, Allen, Buell, Harris e
e assistir TV seja 1:2 nos exemplos a seguir): Wolf, 1964; Johnston, Kelly, Harris e Wolf, 1966). Descrevendo esses
primeiros estudos, Risley (2005) escreveu:
• Reforço de um comportamento alvo de baixa taxa quando o acesso a
um comportamento contingente de alta taxa é restrito abaixo dos Nunca tínhamos visto tanto poder! A velocidade e a magnitude dos
níveis básicos (por exemplo, 30 minutos de lição de casa dão acesso a efeitos sobre o comportamento das crianças no mundo real de
30 minutos de TV). simples ajustes de algo tão onipresente como a atenção do adulto
• Não reforço de um comportamento de baixa taxa quando o acesso a eram surpreendentes. Quarenta anos depois, o reforço social
um comportamento contingente de alta taxa não é restrito abaixo (atenção positiva, elogios, “pegar que eles são bons”) tornou-se o
dos níveis básicos (por exemplo, 30 minutos de lição de casa dão cerne da maioria dos conselhos e treinamentos americanos para
acesso a 90 minutos de TV). pais e professores – tornando esta, sem dúvida, a descoberta mais
• Reforço de um comportamento alvo de alta taxa quando o acesso ao influente da psicologia moderna. (pág. 280)
comportamento de baixa taxa é restrito abaixo dos níveis de linha de base
(por exemplo, 30 minutos de TV rendem 5 minutos de lição de casa).

Embora reconhecendo que os praticantes raramente projetam Devido à profunda importância desse fenômeno há muito
programas de reforço para aumentar a taxa de comportamentos, como conhecido, mas subutilizado, descrevemos um segundo estudo
assistir TV, que já ocorrem em altas taxas, Iwata e Michael (1994) mostrando os efeitos da atenção contingente como reforço do
observaram que: comportamento infantil. O primeiro volume doJournal of Applied
Behavior Analysisincluiu nada menos que sete estudos com base e
Há uma série de casos em que se pode desejar produzir um
extensão da pesquisa pioneira de Wolf e colegas sobre reforço
desempenho altamente acelerado (por exemplo, como no
social.8R. Vance Hall e colegas conduziram dois desses estudos.
desempenho acadêmico ou atlético superlativo que é bom para
Como o estudo de Hall, Lund e Jackson (1968), que introduziu este
começar). Nesses casos, não é necessário encontrar outra atividade
capítulo e do qual selecionamos o exemplo do uso de reforço
que ocorra em uma taxa mais alta para servir como reforço se
positivo por um professor com Robbie, os três experimentos
pudermos organizar um esquema de privação adequado com uma
relatados por Hall, Panyan, Rabon e Broden (1968) continuam a
atividade que ocorra em uma taxa relativamente baixa. (pág. 186)
servir como demonstrações poderosas dos efeitos da atenção do
Como acontece com todas as outras categorias descritivas de professor como reforço social.
reforçadores, não há uma lista a priori que revele quais atividades Participando de um dos experimentos estava um
funcionarão ou não como reforçadores. Uma atividade que serve como professor do primeiro ano cuja turma de 30 alunos da sexta
reforço eficaz para um aluno pode ter um efeito bem diferente no série exibiu taxas tão altas de comportamentos disruptivos
comportamento de outro aluno. Por exemplo, no estudo de Konarski, e fora da tarefa que o diretor da escola descreveu a turma
Crowell e colegas (1982), o acesso à matemática funcionou como reforço como “completamente fora de controle”. Ao longo do
para fazer mais leitura para três alunos, enquanto que ler foi o reforço para estudo, Hall, Panyan, Rabon e Broden (1968) mediram a
completar problemas de matemática para um quarto aluno. Muitos anos atenção do professor e o comportamento do aluno durante
atrás, um desenho clássico trouxe para casa esse ponto crucial muito bem. O um período de observação contínua de 30 minutos na
desenho mostrava dois alunos limpando obedientemente o quadro-negro e primeira hora do dia escolar. Os pesquisadores usaram um
as borrachas depois da escola. Um aluno disse ao outro: “Você está limpando procedimento de observação e registro de intervalo parcial
borrachas para punição!? Eu posso limpar borrachas como recompensa por de 10 segundos para medir o comportamento de estudo
completar minha lição de casa.” (por exemplo, escrever a tarefa, olhar no livro, responder à
pergunta do professor) e comportamento de não estudo
Reforçadores Sociais (por exemplo, falar, estar fora da cadeira, olhar pela janela,
Contato físico (por exemplo, abraços, tapinhas nas costas), proximidade brigando ou cutucando um colega). Os observadores
(por exemplo, aproximar-se, ficar em pé ou sentar perto de uma também registraram a ocorrência de atenção do professor
pessoa), atenção e elogios são exemplos de eventos que muitas vezes em cada intervalo.
servem como reforços sociais. A atenção do adulto é uma das formas Durante a linha de base, a turma teve uma porcentagem média de
de reforço mais poderosas e geralmente eficazes para as crianças. Os intervalos de comportamento de estudo de 44%, e o professor fez uma média de
efeitos quase universais da atenção social contingente como reforço 1,4 comentários após o comportamento de estudo por sessão (veja a Figura 11.8).
levaram alguns analistas do comportamento a especular que alguns “Quase sem exceção, aqueles [comentários] que se seguiram ao comportamento
aspectos da atenção social podem implicar reforço incondicionado (por do estudo foram de aprovação e aqueles que seguiram o comportamento de não
exemplo, Gewirtz & Pelaez-Nogueras, 2000; Vollmer & Hackenberg, estudo foram na forma de uma reprimenda verbal” (Hall, Panyan, Rabon, &
2001). Broden, 1968, p. 316). O nível de comportamento de estudo da turma foi de 90%
As demonstrações experimentais originais e a descoberta do poder em um dia em que o professor auxiliar apresentou uma aula de demonstração
da atenção social dos adultos como reforço para o comportamento das (veja os pontos de dados marcados por setas sólidas). Em três ocasiões durante a
crianças ocorreram em uma série de quatro estudos planejados por linha de base (pontos de dados marcados por setas abertas), o diretor se reuniu
Montrose Wolf e realizados pelos professores da pré-escola do Instituto de com o professor para discutir seus procedimentos organizacionais em um esforço
Desenvolvimento Infantil da Universidade de Washington em início dos anos para melhorar o comportamento dos alunos. Estas sessões de aconselhamento
1960 (Allen, Hart, Buell, Harris e Wolf,
Capítulo 11 • Reforço Positivo299

Linha de base Reforço1 Reversão Reforço2 Publicar

100

80

Porcentagem de tempo gasto estudando


60

40

20

0
5 10 15 20 25 30 35 40 45 50 55

40
Intervalos do Professor
Atenção ao estudo

20

0
5 10 15 20 25 30 35 40 45 50 55
Sessões
Figura 11.8Um registro do comportamento de estudo em classe e atenção do professor para o comportamento de estudo durante o período de leitura
em uma sala de aula da sexta série. Linha de base = antes dos procedimentos experimentais; Reforço 1 = maior atenção do professor para o estudo;
Reversão = afastamento da atenção do professor para estudo; Reforço 2 = retorno ao aumento da atenção do professor para o estudo. As verificações
pós-acompanhamento ocorreram até 20 semanas após o término dos procedimentos experimentais.
De “Instruindo professores iniciantes em procedimentos de reforço que melhoram o controle da sala de aula”, de RV Hall, M. Panyan, D. Rabon e M. Broden, 1968,Journal
of Applied Behavior Analysis,1, pág. 317. Copyright da Society for the Experimental Analysis of Behavior, Inc. Reimpresso com permissão.

resultou no professor escrever todas as tarefas no quadro (após o primeiro IDENTIFICAÇÃO DE POTENCIAIS REFORÇADORES
encontro) e alterar o quadro de assentos (após o terceiro encontro). Essas
mudanças não tiveram efeito aparente sobre o comportamento dos alunos. No laboratório, aprendemos a usar um teste simples: coloque
um doce na palma da mão, mostre-o à criança, feche o punho
Antes do primeiro dia da condição de reforço, o professor recebeu com bastante força ao redor do doce e veja se a criança tentará
dados de linha de base sobre o comportamento de estudo em classe e a afastar nossos dedos para chegar ao doce.
frequência de atenção do professor após o comportamento de estudo. O Se ele ou ela fizer isso, mesmo contra os dedos cada vez mais
professor foi instruído a aumentar a frequência de comentários positivos aos apertados, o doce é obviamente um reforço.
alunos quando eles estavam envolvidos no comportamento de estudo. Após — Murray Sidman (2000, p. 18)
cada sessão durante essa condição, o professor recebia dados sobre o nível
de comportamento de estudo da turma e a frequência de seus comentários O sucesso final de muitos programas de mudança de comportamento
que seguiam o comportamento de estudo. Durante a primeira fase de requer um reforço eficaz que o praticante ou pesquisador possa
reforço, os comentários do professor após o comportamento de estudo fornecer para aumentar as ocorrências futuras do comportamento
aumentaram para uma frequência média de 14,6, e o nível médio de desejado visado para melhoria. Felizmente, identificar reforçadores
comportamento de estudo foi de 72%. O professor, o diretor e os coletores eficazes e acessíveis para a maioria dos alunos é relativamente fácil.
de dados relataram que a classe estava sob melhor controle e que o ruído Sidman (2000) descreveu um método rápido e simples para determinar
havia diminuído significativamente. se o doce provavelmente funcionaria como um reforço. No entanto,
Durante um breve retorno das condições de base, o professor todo estímulo, evento ou atividade que possa funcionar como
forneceu “quase nenhum reforço para o comportamento de estudo”, e foi reforçador não pode ser mantido na palma da mão.
observada uma forte tendência de queda no comportamento de estudo em Identificar reforçadores robustos e confiáveis para alunos com
classe. O professor, o diretor e os coletores de dados relataram que o deficiências graves e/ou múltiplas pode representar um grande desafio.
comportamento perturbador e os altos níveis de ruído haviam retornado. As Embora muitos eventos comuns (por exemplo, elogios, música, tempo livre,
condições de reforço foram então restabelecidas, o que resultou em uma fichas) sirvam como reforçadores eficazes para a maioria das pessoas, esses
frequência média de 14 comentários do professor após o comportamento de estímulos não funcionam como reforçadores para todos os alunos. Tempo,
estudo e um nível médio de 76% de intervalos de comportamento de estudo. energia e recursos seriam perdidos se as intervenções planejadas
300Parte 4 • Reforço

falharam porque um praticante usou um reforço avaliação do reforço. Embora a avaliação de preferência seja um
presumido, em vez de real. procedimento eficiente na identificação de potenciais reforçadores a
Além disso, as preferências de reforço mudam, e a natureza partir de um grande número de estímulos, ela não avalia os efeitos
transitória e idiossincrática da preferência tem sido relatada reforçadores dos estímulos. (págs. 1–2)
repetidamente na literatura (Bishop & Kenzer, 2012; Carr, Nicholson, &
Higbee, 2000; DeLeon et al., 2001; Ortiz & Carr, 2000; Shapiro, Kazemi, A avaliação de preferência de estímulo identifica estímulos que

Pgosjana, Rios e Mendoza, 2016). As preferências podem mudar com a provavelmente são altamente preferidos e, portanto, provavelmente servem como

idade da pessoa, nível de interesse, hora do dia, interações sociais, reforçadores. Como Kelley, Shillingsburg e Bowen (2016) afirmam: “O valor das

níveis de privação e saciedade e a presença de operações de avaliações de preferência é fundamentado na medida em que os estímulos

estabelecimento (EOs) (Gottschalk, Libby, & Graff, 2000; Whitehouse, identificados funcionam, em última análise, como reforçadores para

Vollmer, & Colbert, 2014 ). O que um professor pede em setembro para comportamentos socialmente importantes” (p. 394).

determinar as preferências pode ter que ser repetido um mês depois A avaliação do reforçador, em contraste, coloca os reforçadores
ou um dia depois. Da mesma forma, um terapeuta que pergunta a um potenciais altamente preferidos em um teste direto, apresentando-os
cliente o que é reforçador durante uma sessão matinal pode descobrir contingentes às ocorrências de um comportamento e medindo os
que esse estímulo não é preferido em uma sessão vespertina (Bishop & efeitos do desempenho (Fisher, Piazza, Bowman e Amari, 1996). Nesta
Kenzer, seção, descrevemos uma variedade de técnicas desenvolvidas por
Depois de revisar 13 estudos publicados que avaliaram preferências e pesquisadores e profissionais para conduzir avaliações de preferência
reforçadores para pessoas com deficiências múltiplas profundas, Logan e de estímulo e avaliação de reforço (veja as Figuras 11.9 e 11.10). Esses
Gast (2001) concluíram que os estímulos preferidos nem sempre funcionam métodos formam um continuum de abordagens que variam de simples
como reforçadores, e os estímulos preferidos em um ponto no tempo e rápidas a mais complexas e demoradas.
mudaram mais tarde. Além disso, indivíduos com deficiências
comportamentais ou de desenvolvimento severas a profundas podem se Avaliação de preferência de estímulo
envolver em atividades por um tempo tão limitado, ou mudar as
preferências nas sessões de ensino, que é difícil determinar claramente se Avaliação de preferência de estímulo(SPA) refere-se a uma variedade

uma mudança de estímulo é um reforço (Bishop & Kenzer, 2012). de procedimentos usados para determinar (a) os estímulos que a

Para enfrentar o desafio de identificar reforçadores eficazes, pessoa seleciona diferencialmente, (b) o valor relativo de preferência

pesquisadores e praticantes desenvolveram uma variedade de hierárquica desses estímulos (alta preferência para baixa preferência),

procedimentos que se enquadram nos títulos duplos de avaliação de (c) as condições sob as quais essas preferências os valores mudam

preferência de estímulo e avaliação de reforço. A avaliação da quando as demandas de tarefas, estados de privação ou esquemas de

preferência do estímulo e a avaliação do reforço são frequentemente reforço são modificados e (d) se itens altamente preferidos servem

conduzidas em conjunto para determinar se um estímulo identificado como reforçadores efetivos. De um modo geral, a avaliação de

como reforçador realmente funciona como um (Kang et al., 2013; Lee, preferência de estímulo é conduzida usando um processo de três

Yu, Martin & Martin, 2010; Piazza, Fisher, Hagopian, Bowman, & Toole, etapas: (1) um grande conjunto de estímulos que podem servir como

1996; Whitehouse et al., 2014). Praça et ai. (1996) afirmam: reforçadores é coletado, (2) esses estímulos são apresentados à pessoa-
alvo sistematicamente para identificar a preferência e (3) ) itens de alta
Durante as avaliações de preferência, um número relativamente grande de e às vezes de baixa preferência são “testados” experimentalmente para
estímulos é avaliado para identificar os estímulos preferidos. Os efeitos de determinar as condições sob as quais eles servem como reforçadores
reforço de um pequeno subconjunto de estímulos (isto é, os estímulos (Livingston & Graff, 2018). É essencial que os praticantes limitem o
altamente preferidos) são então avaliados durante campo inicial de possíveis estímulos preferidos àqueles que têm boa

Avaliação de preferência de estímulo Avaliação do Reforçador

Perguntar Operante Livre Baseado em teste

artificial No
Pessoa Estímulo único
observação momento

Significativo Naturalista Emparelhado Simultâneo


outros observação estímulos horários

Pré-Tarefa
Múltiplos estímulos Múltiplo
escolha
horários

Progressivo
Razão
horários

Figura 11.9Avaliação de preferência de estímulo e métodos de avaliação de reforço para identificar potenciais reforçadores.
Capítulo 11 • Reforço Positivo301

Figura 11.10Avaliações de preferência de estímulo comumente usadas.

Nome da Avaliação (Citação) Descrição da Avaliação


Estímulo único (SS) (Pace et al., 1985) Através de uma série de tentativas, os estímulos são apresentados um de cada vez. As respostas de
aproximação (por exemplo, mover a mão ou o corpo em direção ao item) são registradas. As hierarquias de
preferência são estabelecidas calculando a porcentagem de respostas de aproximação por estímulo.

Estímulo pareado (PS) (Fisher et al., 1992) Através de uma série de tentativas, os estímulos são apresentados dois de cada vez; os indivíduos podem
abordar (ou seja, selecionar) apenas um item em uma tentativa. As respostas de aproximação são registradas.
As hierarquias de preferência são estabelecidas calculando a porcentagem de respostas de aproximação por
estímulo.

Múltiplos estímulos sem reposição No início de cada sessão, vários estímulos são colocados na frente do indivíduo, que pode
(MSWO) (DeLeon & Iwata, 1996) selecionar um. As respostas de aproximação são registradas. O item selecionado não é
substituído e as posições dos estímulos restantes são alteradas. Em seguida, o indivíduo
seleciona entre os itens restantes. Continue dessa maneira até que todos os itens tenham sido
selecionados ou o indivíduo pare de selecionar itens. Normalmente, várias sessões são
realizadas. As hierarquias de preferência são estabelecidas calculando a porcentagem de
respostas de aproximação por estímulo em todas as sessões.

Breve Operante Livre (FO) (Roane et al., 1998) Vários estímulos são colocados em uma mesa e os participantes são livres para se envolver com
qualquer um dos itens por 5 minutos. A duração do envolvimento com cada objeto (por exemplo,
manipulação de objetos) é medida. As hierarquias de preferência são estabelecidas classificando os
itens de acordo com a duração da manipulação do objeto para cada estímulo.

De “Avaliando as preferências de indivíduos com deficiências de desenvolvimento: uma pesquisa de práticas atuais”, de RB Graff e AM Karsten, 2012a,Análise
do Comportamento na Prática 5(2), pág. 38. Usado com permissão.

chances de funcionar como reforçadores; caso contrário, o processo de um procedimento operante livre pela observação da pessoa se aproximando,
avaliação será demorado e a intervenção adiada. interagindo ou se envolvendo com vários estímulos; e (3) medir as respostas a
Metodologicamente, o SPA pode ser conduzido usando pelo menos pares baseados em tentativas ou estímulos apresentados multiplicados,
cinco formas: estímulo único (SS), estímulo pareado (PS), operante livre (FO), substituindo ou não o estímulo após a seleção de preferência.
estímulo múltiplo com reposição de itens (MSW) e estímulos múltiplos sem Ao escolher qual método usar, os profissionais devem equilibrar
reposição de itens. MSWO). Cada método SPA tem vantagens ou três perspectivas concorrentes: (a) obter a quantidade máxima de
desvantagens em relação ao viés, tempo de avaliação necessário, dados de avaliação de preferência no menor período de tempo, mas
probabilidade de identificar reforçadores e a chance de que a própria com falsos positivos (ou seja, acreditar que um estímulo é preferido
atividade de avaliação possa evocar um comportamento problemático (veja a quando não é); (b) realizar uma avaliação mais extensa e demorada e
Figura 11.11) (Karsten, Carr e Lepper, 2011). trabalhosa que atrasará a intervenção, mas poderá produzir resultados
Conforme ilustrado na Figura 11.9, essas cinco variações mais conclusivos; e (c) avaliar o nível de habilidade dos colegas que
metodológicas podem ser agrupadas em três categorias: (1) peça à pessoa realizam a avaliação de preferência de estímulo e quaisquer
(ou outros significativos) para identificar estímulos preferidos; (2) empregar necessidades de treinamento inicial ou recorrente que tenham

Figura 11.11Ativos e barreiras associadas às avaliações de preferência de estímulo.

Método Ativos Barreiras potenciais

MSWO Probabilidade de identificar vários reforçadores em tempo mínimo Viés posicional, limitado a itens de mesa menores e
menos itens; requer mais tempo do que a avaliação FO
PS Propenso a identificar vários reforçadores, acomoda Viés posicional, requer mais tempo do que as avaliações
itens de mesa maiores e um número maior de itens MSWO e FO
SS Propenso a identificar vários reforçadores, acomoda itens Resultados falsos positivos, menos propensos a identificar
e atividades maiores preferências relativas do que os métodos MSWO e PS, exceto
quando a duração do engajamento também é medida

FO Menos propenso a evocar comportamento problemático, Menos propenso a identificar reforçadores múltiplos do que
requer tempo mínimo, acomoda itens e atividades outros métodos, exceto quando a avaliação é repetida sem o
maiores item mais preferido

Nota: MSWO = estímulo múltiplo sem reposição; PS = estímulo pareado; SS = estímulo único; FO = operante livre.
De “Description of a Practitioner Model for Identification Preferred Stimuli with Individuals with Autism Spectrum Disorders”, de AM Karsten, JE Carr
e TL Lepper, 2011,Modificação comportamental,35(4), pág. 350. Copyright pela Sage Publication. Reimpresso com permissão.
302Parte 4 • Reforço

(Folha et al., 2015). Para ajudar analistas e profissionais a decidir os níveis em serviço resolvem essa deficiência. Deliperi, Vladescu,
qual das cinco variações metodológicas empregar, Karsten et al. Reeve, Reeve e DeBar (2015) expõem a questão de forma sucinta:
(2011) propuseram um modelo de três etapas que progride de (a)
Devido à dependência de reforço nas intervenções para consumidores
escolher o SPA que provavelmente produzirá uma hierarquia
com deficiência, avaliar as preferências desses indivíduos é uma parte
precisa de estímulos de alta preferência, (b) modificar essa
importante de uma programação eficaz. A falha na identificação de
abordagem SPA com base em dados reais coletados durante o SPA
estímulos que funcionam como reforçadores pode comprometer
e (2011) c) verificar se os estímulos de alta preferência funcionam
programas de aquisição de habilidades e redução de comportamento.
como reforçadores.
Portanto, identificar e implementar procedimentos de treinamento
Ainda assim, um obstáculo prático pode afetar a implementação dos
eficazes são essenciais para aumentar a probabilidade de que a equipe
melhores modelos de SPA pretendidos. Graff e Karsten (2012a) afirmaram
realize avaliações de preferência e use os dados dessas avaliações para
que mais da metade dos respondentes de seu questionário SPA relataram
orientar sua seleção de consequências durante a programação
que tinham pouca ou nenhuma experiência com a condução de SPAs. Dado
subsequente. (pág. 324)
que a realização de algum nível de um SPA se tornou o padrão-ouro das
melhores práticas para identificar estímulos altamente preferidos e, em O Quadro 11.2 discute uma série de questões associadas aos
última análise, reforçadores (Leaf et al., 2018), parece importante que os praticantes de treinamento para realizar avaliações de preferência de
programas de treinamento no pré e no estímulo.

CAIXA 11.2

Treinando Profissionais para Realizar Avaliações de Preferência de Estímulo (SPA)

Identificar reforçadores é a chave para um programa de mudança de Quanto tempo leva para treinar uma pessoa
comportamento bem-sucedido. Mas profissionais de pré-serviço ou em inexperiente para conduzir um SPA?
serviço ocupados, inexperientes e inadequadamente treinados, que agora
A boa notícia é que, em várias sessões de treinamento, os trainees
também carecem de tempo e recursos, provavelmente não se envolverão
podem ganhar habilidade suficiente para conduzir um SPA,
na condução de avaliações de preferência de estímulo sem treinamento de
especialmente se o treinamento fornecer combinações de modelos de
um analista experiente (Graff & Karsten, 2012a). Embora não pretendam
vídeo, roteiros, narrações, prática, feedback e supervisão. (Fontes:
ser exaustivas, as seguintes perguntas frequentes podem fornecer um
Bovi, Vladescu, DeBar, Carroll e Sarokoff, 2017; Deliperi et al., 2015;
ponto de partida para abordar questões de treinamento de avaliação de
Weldy, Rapp e Capocosa, 2014)
preferência de estímulo para profissionais inexperientes, novatos ou mal
treinados em um contexto de treinamento individual ou em grupo.
O trabalho de garantia será necessário? O
treinamento pega?

Para que os SPAs sejam conduzidos, quais habilidades devem ser ensinadas?
Se futuras sessões de “reforço” ou “refresco” serão necessárias para
manter as habilidades depende de uma série de variáveis. Por exemplo, se
Parece haver consenso na literatura de que os profissionais praticantes iniciantes usam SPA apenas algumas vezes por ano, você pode
precisam de três habilidades principais: (1) identificar itens de esperar a perda da aquisição inicial de habilidades. Se, no entanto, eles
estímulo para a avaliação; (2) realizar o SPA com um confederado usarem o SPA regularmente, é mais provável que o treinamento inicial seja
ou consumidor real; e (3) pontuar e interpretar os resultados da mantido, especialmente se eles receberem feedback de acompanhamento
avaliação para determinar estímulos de alta e baixa preferência. e tiverem acesso a materiais de revisão (vídeos de treinamento prévio,
(Fonte: Deliperi et al., 2015) instruções incorporadas etc.). Nesses casos, como treinador de analista de
comportamento, você teria mais confiança de que as habilidades iniciais
Profissionais inexperientes podem aprender as seriam mantidas. (Fonte: Deliperi et al., 2015)
habilidades necessárias para conduzir avaliações de
preferência de estímulo confiáveis, precisas e valiosas? O treinamento em SPA funciona apenas para as categorias
“Ask” ou “Free Operant” do SPA?
Sim. Embora os métodos possam variar e depender de recursos locais
disponíveis, conectividade de Internet de banda larga e nível de Não. Vários pesquisadores mostraram que os analistas podem treinar
habilidade do treinador, é bem possível – até desejável – treinar (ou profissionais inexperientes para usarperguntar,operante livre, ebaseado
retreinar) praticantes inexperientes para usar SPA. Fazer isso dará ao em teste variações de SPA. A complexidade da metodologia SPA não é um
professor, pai ou cuidador orientação para usar esses dados de fator determinante ou autolimitante na formação. Os participantes
avaliação para determinar ainda mais reforçadores reais que afetarão inexperientes podem aprender uma variedade de métodos de SPA.
ocorrências futuras de comportamentos-alvo para as pessoas sob (Fontes: DeLeon & Iwata, 1996; Fisher et al., 1992; Hanley, Iwata, Roscoe,
seus cuidados. (Fonte: Ringdahl et al., 1997) 2006; Pace, Ivancic, Edwards, Iwata, & Page, 1985)
Capítulo 11 • Reforço Positivo303

Breves instruções escritas por si só — como aquelas encontradas Posso usar vídeo, multimídia ou um aplicativo de smartphone para
em uma seção de método de um artigo de jornal — serão ensinar o SPA?
suficientes para treinamento?
Sim. Os métodos de vídeo têm se mostrado eficazes, especialmente
Provavelmente não. Simplesmente fornecer uma oportunidade quando combinados como uma “abordagem de pacote”, incluindo
para profissionais inexperientes lerem oseção de métodode um feedback, texto incorporado, ensaio e supervisão. Além disso, os
artigo de jornal sobre SPA provavelmente não terá sucesso. treinadores podem usar aplicativos de smartphone (por exemplo,
Vários pesquisadores demonstraram que as instruções escritas Plickers.com) para realizar avaliações formativas básicas do SPA com
por si só não são robustas o suficiente para levar praticantes grupos de alunos. (Fontes: Hansard & Kazemi, 2018; Lavie & Sturmey,
inexperientes a um padrão pelo qual eles possam conduzir um 2002; Radley, Dart, Battaglia e Ford, 2018)
SPA sem supervisão. Materiais adicionais e suplementares são
necessários para “aprimorar” as instruções escritas. Esses Eu tenho um número de praticantes para ensinar. Posso ensinar
aprimoramentos podem incluir o fornecimento de fotos, modelos dentro de um contexto de grupo?
de vídeo, dramatização, narrações, feedback e assim por diante.
Sim. Os praticantes de ensino dentro de um contexto de pequenos grupos
(Fontes: Graff & Karsten, 2012b; Lavie e Sturmey, 2002; Ramon,
podem aumentar a eficiência do treinamento, sem perda de efeito. (Fonte:
Yu, Martin e Martin, 2015; Roscoe & Fisher, 2008; Shapiro et al.,
Weldy et al., 2014)
2016).

Eu moro em uma área rural/remoto. Posso usar o ensino à


Se eu desenvolver um manual de auto-instrução, isso distância com minha equipe?
funcionará?
Sim. Um dos benefícios notáveis das conexões de Internet de banda larga
Depende. Embora os manuais de autoinstrução possam ser uma de alta velocidade é que os links de telecomunicações podem ser
melhoria em relação a breves sinopses metodológicas escritas estabelecidos e operados remotamente. O treinamento de pessoal em
extraídas de periódicos, o escopo e a sequência do manual locais distantes parece ser pelo menos tão comparável ao treinamento
seriam de importância primordial. Caso contrário, seu estagiário presencial no que diz respeito à aquisição e manutenção de habilidades
pode ficar com o equivalente a “instruções escritas sozinhas”, que iniciais, mesmo sem contato pessoal ou instrutores no local. (Fonte:
não se mostraram eficazes. Usar apenas um manual de Higgins, Luczynski, Carroll, Fisher e Mudford, 2017)
autoinstrução dessa maneira equivaleria a um processo de A escolha de um método para ensinar praticantes inexperientes
“treinar e esperar”. No entanto, se o manual fornecer conteúdo depende da avaliação do treinador dos recursos atuais da equipe (por
introdutório, instruções passo a passo, uma lista de verificação de exemplo, tempo, instalações físicas, circunstâncias exigentes, localização) e
procedimentos, exercícios, uma chave de resposta e métodos necessidades do consumidor. seriam aconselhados a seguir uma
para registrar, resumir e interpretar dados SPA, a utilidade do sequência de “modelo-liderança-teste” para garantir o treinamento inicial
manual será consideravelmente aprimorada. Se o formador usar até o domínio. Se necessário, esteja preparado para fornecer sessões de
o feedback dos formandos como forma de melhorar a precisão e “reforço” de acompanhamento para garantir a manutenção e a retenção.
integridade do manual, o manual evoluiria ao longo do tempo Não assuma que “uma vez ensinado é para sempre aprendido”,
para um documento mais eficaz. (Fonte: Ramon et al., 2015) especialmente se o praticante tiver poucas oportunidades de implementar
o SPA após o treinamento inicial.

Perguntando sobre preferências de estímulo • Questões em aberto.Dependendo das habilidades linguísticas do


A preferência de uma pessoa por vários estímulos pode ser determinada aluno, uma avaliação aberta da preferência de estímulo pode ser feita
simplesmente perguntando do que ela gosta. Perguntar pode reduzir muito o oralmente ou por escrito. A pessoa pode ser solicitada a nomear
tempo necessário para uma avaliação de preferência de estímulo mais intrusiva e, preferências entre categorias gerais de reforçadores, por exemplo,
muitas vezes, produz informações que podem ser integradas a um programa de “O que você gosta de fazer em seu tempo livre?” “Quais são suas
intervenção. Existem várias variações de perguntar: perguntar à pessoa-alvo, comidas e bebidas favoritas?” “Existem algum tipo de música ou
perguntar a outras pessoas importantes na vida da pessoa ou oferecer uma artistas cuja música você gosta?” Uma avaliação aberta pode ser
avaliação de escolha antes da pergunta. realizada simplesmente pedindo ao aluno que liste o maior número
possível de atividades ou itens favoritos. Ela deve listar não apenas as
Perguntando à pessoa-alvo.Um método direto para determinar a coisas e atividades favoritas do dia a dia, mas também itens e
preferência de estímulo é perguntar à pessoa-alvo do que ela atividades especiais. A Figura 28.15 é simplesmente uma folha com
gosta. As variações típicas incluem fazer perguntas abertas, linhas numeradas nas quais os membros da família identificam
fornecer à pessoa uma lista de opções ou pedir-lhe para recompensas potenciais que gostariam de ganhar ao concluir tarefas
classificar uma lista de opções. em contratos de contingência.
304Parte 4 • Reforço

• Formato de escolha.Esse formato pode incluir perguntas como Ordene as preferências selecionadas com base em itens prováveis de alta
as seguintes: “Qual você faria muito trabalho duro para versus baixa preferência. Finalmente, os outros significativos são solicitados
conseguir?” “Você prefere comprar coisas para comer, como a identificar as condições sob as quais eles preveem que itens específicos
batatas fritas, biscoitos ou pipoca, ou fazer coisas como projetos podem funcionar como reforçadores (por exemplo, biscoitos com leite
de arte, jogar jogos de computador ou ir à biblioteca?” (Northup, versus apenas biscoitos). Como uma nota de advertência, no entanto, os
George, Jones, Broussard e Vollmer, 1996, p. 204) analistas devem estar cientes de que os estímulos identificados como
• Ordem de classificação.O aluno pode receber uma lista de itens altamente preferidos pela opinião de um outro significativosozinhopode
ou estímulos e instruído a ordená-los do mais para o menos nem sempre funcionar como um reforçador eficaz. Fisher et ai. (1996) nos
preferido. lembram: “A opinião do cuidador por si só é insuficiente para a identificação
precisa do reforçador” (p.14). No entanto, quando a opinião do cuidador é
Para alunos com habilidades linguísticas limitadas, imagens de itens, combinada com uma entrevista estruturada que fornece dicas, pistas e uma
ícones ou, preferencialmente, os estímulos reais podem ser apresentados gama mais ampla de potenciais reforçadores para o outro significativo
(Clevenger & Graff, 2005). Por exemplo, um professor, enquanto aponta para considerar, o relato do cuidador pode ser um complemento útil para outros
um ícone, pode perguntar a um aluno: “Você gosta de beber suco, usar o métodos.
computador, andar de ônibus ou assistir TV?” Os alunos simplesmente
acenam sim ou não. Oferecendo uma escolha de pré-tarefa.Nesse método, o praticante pede ao
Pesquisas foram desenvolvidas para avaliar as preferências dos participante que escolha o que quer ganhar por realizar uma tarefa. O
alunos. Por exemplo, professores do ensino fundamental podem usar o participante então escolhe um item entre duas ou três opções apresentadas
Pesquisa de Reforço Infantil, que inclui 36 recompensas em quatro (Piazza et al., 1996). Todos os estímulos apresentados como escolhas antes
categorias: itens comestíveis (por exemplo, frutas, pipoca), itens da pergunta terão sido identificados como estímulos preferenciais por
tangíveis (por exemplo, adesivos), atividades (por exemplo, projetos de outros procedimentos de avaliação. Por exemplo, um professor pode fazer a
arte, jogos de computador) e atenção social (por exemplo, um seguinte declaração: “Robyn, quando você terminar seus problemas de
professor ou amigo dizendo: “Eu gosto disso”) (Fantuzzo, Rohrbeck, matemática, você terá 10 minutos para jogar.Navio de guerracom Martin,
Hightower, & Work, 1991). Outros levantamentos são osCronograma de leia em silêncio ou ajude a Sra. Obutu a preparar o pôster de estudos sociais.
Pesquisa de Reforço Escolarpara alunos do 4º ao 12º ano (Holmes, Em qual atividade você quer trabalhar?” A escolha de uma consequência pelo
Cautela, Simpson, Motes, & Gold, 1998) e oAvaliação de Reforço para aluno não será necessariamente um reforço mais eficaz do que aquele
Indivíduos com Deficiências Graves(Fisher et ai., 1996). selecionado pelo pesquisador ou praticante (Smith, Iwata e Shore, 1995).
Embora perguntar por preferências pessoais seja relativamente
descomplicado, o procedimento não é totalmente infalível no que diz
respeito à confirmação de que uma escolha preferida servirá posteriormente Observação Operante Livre
como reforço (Whitehouse et al., 2014). “Má correspondência entre auto- As atividades em que uma pessoa se envolve com mais frequência quando é
relatos verbais e comportamento subsequente tem sido observada há muito capaz de escolher livremente entre os comportamentos, muitas vezes,
tempo e frequentemente demonstrada” (Northup, 2000, p. 335). Embora servirão como reforçadores eficazes quando contingentes ao envolvimento
uma criança possa identificar assistir a desenhos animados como um evento em comportamentos de baixa probabilidade. Observar e registrar em quais
preferido, assistir desenhos animados pode funcionar como um reforço atividades a pessoa-alvo se envolve quando pode escolher durante um
apenas quando a criança está em casa no sábado de manhã, mas não na período de acesso irrestrito a inúmeras atividades é chamado deobservação
casa da vovó no domingo à noite. operante livre. Uma medida de duração total do tempo que a pessoa se
Além disso, as pesquisas podem não diferenciar com precisão entre o envolve com cada item de estímulo ou atividade é registrada. Quanto mais
que as crianças afirmam ser itens de alta preferência e de baixa preferência tempo a pessoa se envolve com um item, mais forte é a inferência de que o
para reforçadores. Northup (2000) descobriu que as preferências de crianças item é preferido.
com transtorno de déficit de atenção e hiperatividade (TDAH) não Processualmente, a pessoa tem acesso irrestrito e
aumentaram além dos níveis de chance quando os resultados da pesquisa simultâneo a um conjunto predeterminado de itens ou atividades
foram comparados posteriormente às funções de reforço. “O número ou aos materiais e atividades que estão naturalmente disponíveis
relativamente alto de falsos positivos e o baixo número de falsos negativos no ambiente. Não há requisitos de resposta e todos os itens de
novamente sugerem que as pesquisas podem identificar com mais precisão estímulo estão disponíveis e ao alcance da pessoa. Um item nunca
estímulos que não são reforçadores do que aqueles que são” (p. 337). é removido após engajamento ou seleção. Segundo Ortiz e Carr
Apenas perguntar às crianças suas preferências uma vez pode levar a falsos (2000) e Karsten et al. (2011), a resposta operante livre é menos
positivos (ou seja, as crianças podem escolher um evento ou estímulo como provável de produzir comportamento problemático durante a
reforçador, mas pode não ser reforçador). avaliação que poderia ser observado se um estímulo fosse
removido. Observações operantes livres podem ser planejadas ou
Perguntando a outros significativos.Um conjunto de reforçadores potenciais
conduzidas em ambientes naturalistas.
pode ser obtido pedindo aos pais, irmãos, amigos ou cuidadores que
identifiquem as atividades, itens, alimentos, hobbies ou brinquedos que eles Observação Operante Livre Concebida.Os praticantes usam
acreditam que o aluno prefere. Por exemplo, oAvaliação Reforçadora para observação triada para determinar se, quando, como e até que
Indivíduos com Deficiências Graves (RAISD)é um protocolo de entrevista que ponto a pessoa se envolve com cada um de um conjunto
pede aos cuidadores que identifiquem os estímulos preferidos nos domínios predeterminado de atividades e materiais. A observação é artificial
visual, auditivo, olfativo, comestível, tátil e social (Fisher et al., 1996). Outros porque o pesquisador ou praticante “salga” o ambiente com uma
significativos então variedade de itens que podem ser de interesse do aprendiz.
Capítulo 11 • Reforço Positivo305

Figura 11.12Número de minutos que Mike passou envolvido em atividades durante 2 horas de tempo livre
depois da escola.

Atividade seg ter qua Desta forma sex Total


Leitura de lazer — 10 — 10 — 20
Assistir TV 35 50 60 30 30 205
Telefone com amigos 15 15 10 20 10 70
Jogar videogames 70 45 40 60 80 295
Brinque com brinquedo de — — 10 — — 10
construção Minutos observados 120 120 120 120 120 600

A avaliação operante livre pressupõe que a pessoa teve et ai., 1998).AbordagemAs respostas geralmente incluem qualquer
tempo suficiente para se movimentar e explorar o ambiente e teve movimento detectável da pessoa em direção ao estímulo (por exemplo,
a chance de vivenciar cada um dos estímulos, materiais ou olhar fixo, virar a cabeça, inclinar o corpo, alcançar a mão), umcontatoé
atividades. Imediatamente antes do período de observação contabilizado cada vez que a pessoa toca ou segura o estímulo, e
operante livre, o aluno recebe uma breve exposição não noivado é uma medida do tempo total ou porcentagem de intervalos
contingente a cada item. Todos os itens são então colocados à vista observados em que a pessoa interage com o estímulo (por exemplo,
e de fácil acesso ao aluno, que então tem a oportunidade de em que a pessoa segurou um massageador contra a perna). Supõe-se
experimentar e escolher entre eles livremente. Os observadores que quanto mais frequentemente a pessoa se aproxima, toca, segura
registram a duração total do tempo que o aluno se envolve com ou se envolve com um estímulo, mais provável é que o estímulo seja
cada item ou atividade de estímulo. preferido. Como DeLeon e colegas (1999) afirmaram, “a duração do
contato com o item é um índice válido do valor do reforço” (p. 114).
Observação Operante Livre Naturalista.Observação naturalista Estímulos preferidos são tipicamente rotulados ao longo de uma
ções de resposta operante livre são conduzidas no ambiente cotidiano hierarquia de estímulos de alta preferência (HP) a estímulos de baixa
do aluno (por exemplo, playground, sala de aula, casa). O mais preferência (LP) com base em critérios predeterminados (por exemplo,
discretamente possível, o observador observa como o aluno aloca seu estímulos escolhidos 80% ou mais das vezes são HP) (Carr et al., 2000;
tempo e registra o número de minutos que o aluno dedica a cada Northup, 2000; Pace et al., 1985; Piazza et al., 1996). As suposições implícitas,
atividade. Por exemplo, a Figura 11.12 mostra como um adolescente, mas testáveis, são que um estímulo altamente preferido servirá como
Mike, distribuiu seu tempo durante 2 horas de tempo livre todos os dias reforço e que a estabilidade da preferência é necessária antes que o
depois da escola. Os pais de Mike coletaram esses dados mantendo um tratamento possa começar. Embora essas suposições nem sempre sejam
gráfico do número total de minutos que seu filho esteve envolvido em válidas (Higbee, Carr, & Harrison, 2000; Verriden & Roscoe, 2016), elas
cada atividade. O gráfico de resumo da semana mostra que Mike provaram ser suposições eficientes e viáveis para começar.
jogava videogame no computador, assistia à televisão e falava ao As muitas variações da avaliação de preferência de estímulo baseada
telefone com seus amigos todos os dias. Em dois dias diferentes, Mike em tentativas podem ser agrupadas por método de apresentação como
passou 10 minutos lendo um livro da biblioteca e brincou com um novo estímulo único (escolha sucessiva), estímulos pareados (escolha forçada) e
brinquedo de construção por um breve período na quarta-feira. Duas estímulos múltiplos com ou sem substituição.9
atividades – assistir televisão e jogar videogames – ocorreram com mais
frequência e por mais tempo. Se os pais de Mike quisessem aplicar o Estímulo Único.Um método de apresentação de estímulo único, também
princípio de Premack introduzido anteriormente neste capítulo para chamado deescolha sucessivaoupreferência de engajamento de
aumentar a quantidade de tempo que ele passa lendo por prazer ou estímulo únicométodo, representa a avaliação mais básica disponível
brincando com o brinquedo de construção (ou seja, comportamentos para determinar a preferência. Simplificando, um estímulo é
de baixa probabilidade), eles podem fazer assistindo televisão ou apresentado por um clínico ou professor treinado, e a reação da pessoa
jogando videogame ( ou seja, comportamentos de alta probabilidade) ou o envolvimento com o estímulo é observada. Os comportamentos de
dependem de uma certa quantidade de tempo gasto lendo ou envolvimento incluem tocar, brincar, olhar ou segurar o estímulo por
brincando com o brinquedo de construção. um tempo predeterminado. Apresentar um estímulo de cada vez “pode
ser adequado para indivíduos que têm dificuldade em selecionar entre
Métodos baseados em testes dois ou mais estímulos” (Hagopian et al., 2001, p. 477).
Nos métodos baseados em tentativas de avaliação de preferência de Para realizar uma avaliação de estímulo único, estímulos-alvo em
estímulo, os estímulos são apresentados ao aluno em uma série de todos os sistemas sensoriais (ou seja, visual, auditivo, vestibular, tátil,
testes, e as respostas do aluno aos estímulos são medidas como um olfativo, gustativo e multissensorial) são disponibilizados ao
índice ou hierarquia de preferência. Uma ou mais das três medidas do participante por um breve período. O participante pode experimentar
comportamento do aluno são registradas na avaliação de preferência os estímulos um de cada vez, interagir com ele brevemente e, se for um
de estímulo baseada em tentativas: abordagem, contato (DeLeon & brinquedo, ver como ele funciona, antes do início do protocolo formal
Iwata, 1996) e envolvimento com o estímulo (DeLeon, Iwata, Conners & de avaliação. Em seguida, os estímulos são apresentados um de cada
Wallace, 1999; Hagopian, Rush, Lewin e Long, 2001; Roane, vez em ordem aleatória, e a reação da pessoa e/ou envolvimento com
306Parte 4 • Reforço

cada estímulo é registrado (Logan et al., 2001; Pace et al., 1985). As procedimento de avaliação poderia ser usado de forma eficiente, como
respostas de aproximação, evitação ou rejeição são registradas em sonda para identificar estímulos preferidos e que esses estímulos poderiam
termos de ocorrência (sim ou não), contagem (por exemplo, número de ser usados por pesquisadores e pais para melhorar habilidades musculares
toques por minuto) ou duração (isto é, tempo gasto envolvido com um importantes para uma criança com síndrome de Down.
item). Cada item do conjunto de estímulos propostos é apresentado
sequencialmente. Por exemplo, um espelho pode ser apresentado para Estímulos Emparelhados.Cada tentativa no método de apresentação de estímulos

determinar a duração do tempo em que o participante olha para ele, o pareados, também chamado de método de “escolha forçada”, consiste na apresentação

toca ou o rejeita completamente (ou seja, o empurra para longe). Cada simultânea de dois estímulos. O observador registra qual dos dois estímulos o aprendiz

item é apresentado várias vezes, e a ordem de apresentação deve ser escolhe. Para realizar uma avaliação de estímulos pareados, cada estímulo é combinado

variada. Uma vez que todos os estímulos foram apresentados, uma aleatoriamente com todos os outros estímulos no grupo proposto de estímulos a serem

hierarquia gráfica é construída com os estímulos listados nox-eixo e a comparados (Fisher et al., 1992). O número no grupo fica a critério do analista. Por

porcentagem de engajamento noy-eixo. Ao analisar os dados com um exemplo, Piazza e colegas (1996) usaram 66 a 120 tentativas de estímulos pareados para

gráfico de barras, presume-se que os estímulos classificados como os determinar a preferência do reforço. Os dados de uma avaliação de estímulos pareados

mais altos sejam os reforçadores preferidos.10 mostram quantas vezes cada estímulo é escolhido. Os estímulos são então ordenados

Boutot e DiGangi (2018) usaram um procedimento de avaliação de por ordem de preferência alta para baixa. Itens que receberam engajamento, jogo,

estímulo único para identificar brinquedos preferidos e não preferidos por manipulação ou seleção em mais de 80% dos pares são considerados itens de alta

Dominic, um bebê de 5 meses com síndrome de Down. Se Dominic olhasse preferência. Os itens de baixa preferência foram selecionados no nível de 50%. Pace e

para o brinquedo ativado por adulto por mais de 5 segundos, mudasse as colegas (1985) descobriram que apresentações de estímulos pareados produziam

expressões faciais enquanto olhava para o objeto (por exemplo, sorria) ou distinções mais precisas entre itens de alta e baixa preferência do que apresentações de

produzisse um movimento corporal acentuado (chutava as pernas ou estímulo único. A avaliação de preferência de estímulos pareados tem a vantagem de

acenava com os braços), o brinquedo era considerado preferido . Usando organizar todos os estímulos sequencialmente, fornecendo escolhas que de outra forma

esse método, os pesquisadores finalmente identificaram três brinquedos e não seriam possíveis durante um formato de apresentação de estímulo único. Desta

depois os empregaram como reforços para aumentar a porcentagem de forma, fornecendo assim escolhas que de outra forma não seriam possíveis durante um

tempo que Dominic manteve a cabeça em uma posição elevada durante o formato de apresentação de estímulo único. Desta forma, fornecendo assim escolhas que

tempo de bruços em uma condição “Sem Brinquedo” (veja a Figura 11.13). de outra forma não seriam possíveis durante um formato de apresentação de estímulo

Boutet e DiGangi (2018) concluíram que o estímulo único único. Desta forma,

Nenhum brinquedo Brinquedo Nenhum brinquedo Brinquedo Nenhum brinquedo Brinquedo

100
Porcentagem de tempo em posição elevada

90
80
70
60
50
40
30
20
10 Domingos

0
1 2 3 4 5 6

Brinquedo Nenhum brinquedo Brinquedo Nenhum brinquedo Brinquedo

100
Porcentagem de tempo em posição elevada

90
Figura 11.13Porcentagem de cada sessão de 2 minutos 80
em que Dominic elevou a cabeça acima de um ângulo 70
de 45° quando o pesquisador (painel superior) ou pai 60
(painel inferior) ativou um brinquedo preferido durante
50
a hora de bruços ou quando nenhum brinquedo estava
presente. 40

De “Effects of Activation of Preferred Stimulus on Tummy Time 30


Behavior of an Infant with Down Syndrome and Associated 20
Hypotonia”, de EA Boutot e SA DiGangi, 2018,Análise do
10 Domingos
Comportamento na Prática,11, pág. 146. Direitos autorais da
Association for Behavior Analysis International. Reimpresso 0
com permissão. 1 2 3 4 5
Sessões de 2m
Capítulo 11 • Reforço Positivo307

a probabilidade de finalmente identificar reforçadores é maior DeLeon e Iwata (1996) usaram uma adaptação das apresentações de
(Paclawskyj & Vollmer, 1995). estímulos múltiplos e estímulos pareados que descreveram como uma breve
Como todos os pares possíveis de estímulos devem ser apresentados, é avaliação de estímulopara reduzir o tempo necessário para determinar a
provável que a avaliação de estímulos pareados leve mais tempo do que a preferência do estímulo. Basicamente, na avaliação de estímulo breve, uma
apresentação simultânea de uma série de estímulos múltiplos. No entanto, vez que um determinado item de estímulo é escolhido, esse item énãovoltou
DeLeon e Iwata (1996) argumentaram que, em última análise, o método de para a matriz. Ensaios subsequentes apresentam um número reduzido de
estímulos pareados pode ser mais eficiente em termos de tempo porque “os itens para escolher (Carr et al., 2000; DeLeon et al., 2001; Roane et al., 1998).
resultados mais consistentes produzidos pelo método PS podem indicar que as DeLeon e Iwata (1996) descobriram que estímulos múltiplos sem reposição
preferências estáveis podem ser determinadas em menos sessões, ou até mesmo identificavam itens preferidos em aproximadamente metade do tempo que
em sessões únicas”. página 520)11. um procedimento de comparação de estímulos pareados o fazia. De acordo
com Higbee e colegas (2000), “Com um breve procedimento de preferência
Múltiplos Estímulos.O método de apresentação de múltiplos estímulos é de estímulo, os praticantes têm um método de identificação de reforço que é
uma extensão do procedimento de estímulos pareados desenvolvido por eficiente e preciso” (pp. 72-73).
Fisher e colaboradores (1992). O participante a ser avaliado escolhe um
estímulo preferido de um conjunto de três ou mais estímulos (Windsor, Diretrizes para selecionar e usar avaliações de
Piche, & Locke, 1994). Ao apresentar vários estímulos juntos, o tempo de preferência de estímulo
avaliação é reduzido. Por exemplo, em vez de apresentar uma série de
Os praticantes podem combinar procedimentos de avaliação para comparar
tentativas consistindo em todos os possíveis pares de estímulos de um
métodos únicos versus pareados, pareados versus múltiplos, ou operantes
grupo de seis estímulos e continuar até que todos os pares tenham sido
livres versus métodos baseados em tentativas (Ortiz & Carr, 2000).13Na
apresentados, todos os seis estímulos são apresentados simultaneamente.
prática do dia-a-dia, apresentações breves de estímulos usando abordagens
As duas principais variações da avaliação de preferência por
comparativas podem facilitar a identificação de reforçadores, acelerando
múltiplos estímulos são estímulos múltiplos com reposição (MSWI) e
assim as intervenções usando esses reforçadores. Para fins de ensino e para
estímulos múltiplos sem reposição (MSWO). A diferença entre os dois
iniciar a instrução o mais rápido possível, Karsten et al. (2011) recomendam o
está em quais estímulos são removidos ou substituídos em preparação
uso das opções FO e/ou MSWO, pois são eficientes e provavelmente
para a próxima tentativa após o participante indicar uma preferência
fornecem informações suficientes sobre uma hierarquia de reforçadores.
entre os itens exibidos. No procedimento de múltiplos estímulos com
Tung, Donaldson e Kang (2017) também afirmam que o procedimento FO
substituição, o item escolhido pelo aprendiz permanece na matriz e os
pode ser o método de escolha quando o comportamento do problema é
itens que não foram selecionados são substituídos por novos itens. No
antecipado quando os estímulos tangíveis são removidos durante o
procedimento de estímulos múltiplos sem reposição, o item escolhido é
processo de avaliação.
removido do array, a ordem ou colocação dos itens restantes é
Em resumo, um objetivo importante das avaliações de
rearranjada estruturalmente, e a próxima tentativa começa com um
preferência de estímulo é identificar os estímulos que são mais
número reduzido de itens no array (Brodhead, Al-Dubayan, Mates, Abel
altamente preferidos e, portanto, mais propensos a funcionar como
e Brouwers, 2016).12
reforçadores (Kelly, Roscoe, Hanley, & Schlichenmeyer, 2014). Cada
De qualquer forma, cada tentativa começa perguntando à pessoa:
método de avaliação de preferência apresenta vantagens e limitações
“Qual você quer mais?” (Higbee et al., 2000), ou instruindo a pessoa a
no que diz respeito à identificação de preferências (Karsten et al., 2011;
“Escolha um” (Ciccone, Graff, & Ahearn, 2005) e então continua até que todos
Roane et al., 1998). Os profissionais podem achar as seguintes
os itens da matriz original, ou a matriz de redução gradual, tenham sido
diretrizes úteis ao conduzir avaliações de preferência de estímulo
selecionados. A sequência inteira é geralmente repetida várias vezes,
(DeLeon & Iwata, 1996; Gottschalk et al., 2000; Higbee et al., 2000; Ortiz
embora uma única rodada de tentativas possa identificar estímulos que
& Carr, 2000; Roane et al., 1998; Roscoe, Iwata, & Kahng, 1999):
funcionam como reforçadores (Carr et al., 2000).
Os estímulos apresentados em cada tentativa podem ser os • Monitore as atividades do aluno durante o tempo anterior à sessão de
próprios objetos tangíveis, imagens dos itens ou descrições verbais. As avaliação de preferência de estímulo para estar ciente dos OEs que
comparações entre a condução de avaliações de preferência de podem afetar os resultados.
estímulo com objetos tangíveis em si versus imagens desses objetos • Use opções de avaliação de preferência de estímulo que
foram misturadas. Enquanto Brodhead et al. (2016) mostraram que o equilibrem o custo-benefício de avaliações breves (mas a
vídeo MSWO pode ser um complemento adequado para o MSWI possível ocorrência de falsos positivos) com avaliações
tangível, Higbee, Carr e Harrison (1999) descobriram que os objetos mais prolongadas, que, embora possam identificar
tangíveis produziram maior variação e distribuição de preferências do estímulos mais preferidos (e reforçadores), atrasam a
que os objetos de imagem. Cohen-Almeida, Graff e Ahearn (2000) intervenção.
descobriram que a avaliação de objetos tangíveis era tão eficaz quanto • Equilibre usando um método de preferência de estímulo que pode
uma avaliação de preferência verbal, mas os clientes concluíram a gerar uma classificação de estímulos preferidos contra um método
avaliação de preferência verbal em menos tempo. de avaliação que ocorre sem classificações, mas ocorre com mais
Em suma, a avaliação MSWO pode identificar estímulos que frequência, para neutralizar mudanças na preferência.
funcionam como reforçadores, pode exigir menos sessões ou menos tempo • Conduza uma breve avaliação de preferência de estímulo com menos
para ser concluído do que outras variações de avaliações de preferência, itens em uma matriz (ou seja, 3 em vez de 5 ou mais) quando o
produz uma hierarquia de preferência do aluno e parece ser adequado para tempo de avaliação for limitado.
uma ampla gama de alunos devido à rapidez administração e precisão na • Combine dados de vários métodos de avaliação e fontes de
identificação de potenciais reforçadores (Brodhead et al., 2016). preferência de estímulo (por exemplo, perguntando ao aluno
308Parte 4 • Reforço

e outros significativos, observação operante livre e métodos dados que mostram a eficácia desse estímulo em relação ao
baseados em testes). desempenho (melhorado ou diminuído), interações com itens
• Verifique se os estímulos identificados por qualquer método eficiente de semelhantes no passado (cachorro peludo, gato coberto de lã) e outras
SPA servem, em última análise, a essa função como reforço. preferências observacionais anteriores (Leaf et al., 2012).
• Reconhecer que, embora a preferência de estímulo possa ser estável Folha et ai. (2018) compararam avaliações formais de preferência de
para indivíduos ao longo do tempo (Kelley et al., 2016), existe a estímulos pareados com “análise de reforço no momento” usada para
possibilidade de que a preferência de estímulo mude, e mais SPAs determinar as taxas de aprendizagem de uma tarefa simples de rotulagem
podem ser necessários. de imagens por dois meninos pré-escolares com autismo. Processualmente,
• Para facilitar a avaliação do SPA em relação ao tempo, considere o uso de os professores realizaram uma avaliação de preferência de estímulos
categorias de estímulos. As categorias comestíveis podem incluir pareados para determinar os três principais itens preferidos. Durante o
chocolate, guloseimas gomosas, lanches crocantes e assim por diante. As ensino, se os meninos respondessem a uma pergunta corretamente, eles
categorias de brinquedos podem incluir, por exemplo, caminhões, carros e recebiam acesso a um dos três principais itens por 10 segundos. Se eles
carros de bombeiros. É provável que, se o SPA mostrar preferência por um responderam incorretamente, eles receberam feedback de que sua resposta
item dentro de uma categoria, outros itens não avaliados dentro dessa estava incorreta. Durante a condição do momento, o conjunto idêntico de
categoria também possam servir como reforçadores, mesmo que não itens da condição de estímulo pareado estava disponível, mas os professores
sejam inicialmente avaliados formalmente. tinham total liberdade sobre qual item entregar, dependendo de uma
resposta correta. Eles poderiam entregar o mesmo reforçador durante todas
as tentativas de aprendizado ou mudar o reforçador após cada tentativa. O
Avaliação do Reforçador
fator determinante foi seu julgamento momento a momento com base nos
A única maneira de saber se um determinado evento é ou não fatores citados acima.
reforçador para um determinado organismo sob determinadas Os resultados de Leaf et al. não mostraram diferença clara na
condições é fazer um teste direto. aquisição de habilidades para os meninos - eles aprenderam igualmente
— BF Skinner (1953, pp. 72-73) bem em ambas as condições, mas o procedimento no momento foi muito
mais eficiente com relação à divisão do tempo gasto na avaliação versus
Estímulos altamente preferidos podem nem sempre funcionar como
condições de ensino. Leaf e colegas concluíram afirmando: “Ao ensinar
reforçadores (Higbee et al., 2000); mesmo o doce que uma criança arrancou
indivíduos com dificuldades de aprendizagem, qualquer ganho incremental
da mão de Sidman pode não ter funcionado como reforço sob certas
na velocidade de aquisição por meio de avaliações formais de preferência
condições. Por outro lado, os estímulos menos preferidos podem servir
deve ser ponderado em relação ao tempo de ensino reduzido que resta após
como reforçadores sob algumas condições (Gottschalk et al., 2000). A única
a conclusão das avaliações, o que é um ponto que parece ser muito muitas
maneira de saber com certeza se um determinado estímulo serve como
vezes esquecido” (p. 23).
reforçador é apresentá-lo imediatamente após a ocorrência de um
comportamento e observar seus efeitos na resposta.
Avaliação do reforçadorrefere-se a uma variedade de métodos Avaliação do Reforçador de Cronograma Concorrente
diretos, baseados em banco de dados, usados para apresentar um ou mais
Quando duas ou mais contingências de reforço operam de forma
estímulos contingentes a uma resposta alvo e, em seguida, medir os efeitos
independente e simultânea para dois ou mais comportamentos,
futuros na taxa de resposta. Pesquisadores e praticantes desenvolveram
umesquema concorrente de reforçoestá em vigor. Quando usado
métodos de avaliação de reforço para determinar os efeitos relativos de um
como um veículo para avaliação de reforçadores, um esquema de
determinado estímulo como reforço sob condições diferentes e variáveis e
programação concorrente essencialmente coloca dois estímulos
para avaliar a eficácia comparativa de múltiplos estímulos como
um contra o outro para ver qual produzirá o maior aumento no
reforçadores para um determinado comportamento sob condições
responder quando apresentado como consequência do responder.
específicas. A avaliação ou análise do reforçador geralmente é realizada
Se um aprendiz aloca uma proporção maior de respostas a um
apresentando estímulos suspeitos de serem reforçadores “no momento” ou
componente do esquema concorrente sobre o outro, o estímulo
contingentes a responder dentro de esquemas de reforço simultâneos,
usado como consequência contingente para aquele componente é
múltiplos ou de proporção progressiva.14
o reforçador mais eficaz. Usar um esquema concorrente dessa
maneira mostra a eficácia relativa dos estímulos de alta preferência
Análise de reforço no momento (HP) e baixa preferência (LP) como reforçadores (Koehler, Iwata,
A análise de reforço no momento é conduzida por praticantes quando a Roscoe, Rolider e O'Steen, 2005; Piazza et al., 1996).
resposta de um aprendiz é seguida imediatamente pela apresentação Cronogramas simultâneos também podem ser usados para
de uma mudança de estímulo – neste caso, um estímulo que se determinar diferenças entrerelativoeabsolutoefeitos de reforço dos
presume ser um reforço – e o efeito é observado em aumentos na estímulos. Ou seja, um estímulo LP agora apresentado
ocorrência futura de respostas semelhantes (Leaf et al., 2018). Em contingentemente na ausência do estímulo HP servirá como reforço?
aplicações práticas, o analista, com acesso imediato a numerosos Roscoe e colegas (1999) usaram esquemas simultâneos para comparar
reforçadores presumidos, faz um julgamento instantâneo sobre qual os efeitos dos estímulos HP e LP como reforçadores para oito adultos
desses “reforçadores” provavelmente funcionará como tal e entrega com deficiências de desenvolvimento. Após as avaliações de
esse reforçador ao aprendiz. Ao decidir qual reforçador entregar, o preferência, foi estabelecido um esquema concorrente de reforço
analista considera o afeto atual do aprendiz (sorrir, franzir a testa), utilizando os estímulos de alta e baixa preferência. A resposta do alvo
interações anteriores com aquele item de estímulo (aproximar-se, foi pressionar qualquer um dos dois painéis de microinterruptores.
envolver-se, entrar em contato), Cada painel era de uma cor diferente. Pressionar um painel iluminaria
Capítulo 11 • Reforço Positivo309

uma pequena luz no centro do painel. Uma condição de treinamento Simultâneo solteiro

ocorreu antes da linha de base para estabelecer o painel pressionando BL Sr+ BL Sr+
10
os repertórios dos sujeitos e expô-los às consequências de responder.
8 HP
Durante a linha de base, pressionar qualquer um dos painéis não
6
resultou em consequências programadas. Durante a fase de reforço,
4 LP
um estímulo HP foi colocado em uma placa atrás de um dos painéis e
2 Sean
um estímulo LP foi colocado em uma placa atrás de outro painel. Todas
0
as respostas a qualquer painel resultaram no recebimento imediato do 5 10 15 20 25 30 35
item no prato atrás do respectivo painel (ou seja, um esquema de
Simultâneo solteiro
reforço FR 1). Sr+ Sr+
BL BL
Sob o esquema concorrente de reforço que permitiu aos 10
participantes escolher reforçadores no mesmo esquema FR 1, a maioria dos 8
participantes atribuiu a maior parte de suas respostas ao painel que 6
produziu o estímulo HP como reforço (por exemplo, veja os resultados para 4
Sean, Peter, Matt, e Mike na Figura 11.14). No entanto, esses mesmos 2

Respostas por minuto


Peter
participantes, quando mais tarde tiveram a oportunidade de obter estímulos 0
LP como reforçadores em uma contingência de esquema único (ou seja,
5 10 15 20 25
apenas um painel para empurrar), apresentaram níveis aumentados de Simultâneo solteiro

resposta acima da linha de base, semelhantes aos obtidos com os estímulos BL Sr+ BL Sr+
10
HP na agenda simultânea. O estudo de Roscoe e colegas (1999) demonstrou
8
como esquemas simultâneos podem ser usados para identificar os efeitos
6
relativos de estímulos como reforçadores. O estudo também mostrou que os
4
efeitos potenciais de um estímulo como reforçador podem ser mascarados
2 Matt
ou ofuscados quando esse estímulo é colocado contra outro estímulo em
0
uma programação simultânea. Nesses casos, um estímulo potencialmente 5 10 15 20
reforçador pode ser abandonado prematuramente.
Simultâneo
BL Sr+
10
8
Avaliação do Reforçador de Agenda Múltipla
6
UMAesquema múltiplo de reforçoconsiste em dois ou mais esquemas componentes de reforço para uma única
4
resposta com apenas um esquema componente em vigor a qualquer momento. Um estímulo discriminativo (SD)
2 Mike
sinaliza a presença de cada esquema componente, e esse estímulo está presente enquanto o esquema estiver em
0
vigor. Uma maneira que um esquema múltiplo poderia ser usado para avaliação de reforçadores seria apresentar o 5 10 15 20
Sessões
mesmo evento de estímulo contingente (ou seja, dependente de resposta) em cada ocorrência do comportamento alvo

em um componente do esquema múltiplo e em um esquema de tempo fixo (ou seja, , resposta independente) no outro
Figura 11.14Respostas por minuto durante horários
componente. Por exemplo, se um praticante quisesse usar um esquema múltiplo para avaliar se a atenção social
simultâneos e de linha de base de horário único e condições de
reforço para quatro adultos com deficiência intelectual.
funcionava como um reforço, ele forneceria atenção social contingente às ocorrências de jogo cooperativo quando um
“Efeitos de Reforço Relativo Versus Absoluto: Implicações para Avaliações
componente do esquema múltiplo estiver em vigor e durante o outro componente o praticante apresentaria a mesma
de Preferências” por EM Roscoe, BA Iwata e S. Kahng, 1999,Journal of
quantidade e tipo de atenção social, exceto em um horário fixo, independente do jogo cooperativo (isto é, reforço não
Applied Behavior Analysis,32, pág. 489. Copyright 1999 pela Society for the
contingente). O professor poderia aplicar a programação dependente de resposta durante o período de brincadeira da
Experimental Analysis of Behavior, Inc.
manhã e a programação independente de resposta durante o período de brincadeira da tarde. Se a atenção social

funcionasse como reforço, o jogo cooperativo provavelmente aumentaria em relação à sua taxa de base nos períodos

da manhã e, por não haver relação com o jogo cooperativo, a atenção provavelmente não teria efeito no período da

tarde. Esta situação segue um esquema múltiplo porque existe uma classe de comportamento (isto é, jogo
períodos de brincadeira) e diferentes condições de reforço (ou seja,
cooperativo), um estímulo discriminativo para cada contingência em vigor (isto é, manhã e tarde e a programação
dependente de resposta e independente de resposta).
independente de resposta durante o período de jogo da tarde. Se a atenção social funcionasse como reforço, o jogo

cooperativo provavelmente aumentaria em relação à sua taxa de base nos períodos da manhã e, por não haver relação
Avaliação do Reforçador do Cronograma de Razão Progressiva
com o jogo cooperativo, a atenção provavelmente não teria efeito no período da tarde. Esta situação segue um
As avaliações de preferência de estímulo com requisitos de resposta
esquema múltiplo porque existe uma classe de comportamento (isto é, jogo cooperativo), um estímulo discriminativo
baixos (por exemplo, FR 1) podem não prever a eficácia do estímulo
para cada contingência em vigor (isto é, manhã e tarde e a programação independente de resposta durante o período
como reforçador quando apresentado com requisitos de resposta mais
de jogo da tarde. Se a atenção social funcionasse como reforço, o jogo cooperativo provavelmente aumentaria em
altos (por exemplo, em um esquema de FR 10, um aluno deve
relação à sua taxa de base nos períodos da manhã e, por não haver relação com o jogo cooperativo, a atenção
completar 10 problemas para obter reforço). Como DeLeon, Iwata, Goh
provavelmente não teria efeito no período da tarde. Esta situação segue um esquema múltiplo porque existe uma
e Worsdell (1997) afirmaram:
classe de comportamento (isto é, jogo cooperativo), um estímulo discriminativo para cada contingência em vigor (isto é,

manhã e tarde Os métodos de avaliação atuais podem fazer previsões imprecisas


sobre a eficácia do reforço quando a tarefa usada em regimes de
treinamento requer mais respostas ou mais esforço
310Parte 4 • Reforço

antes da entrega do reforço. . . para algumas classes de DeLeon e colegas (1997) usaram uma proporção
reforçadores, aumentos simultâneos nas exigências de cronograma progressiva dentro de um esquema concorrente para testar a
podem ampliar pequenas diferenças nas preferências que não são eficácia relativa de dois estímulos preferidos semelhantes (por
detectadas quando as exigências são baixas. Nesses casos, uma exemplo, biscoito e bolacha) e dois estímulos diferentes (por
avaliação de preferência de estímulo envolvendo esquemas de exemplo, bebida e balão) como reforçadores para pressionar o
requisitos de resposta baixos (FR1) não prevê com precisão a painel de microinterruptores para Elaine e Rick, dois adultos
potência relativa de reforçadores sob requisitos de resposta com deficiência intelectual. Um painel era azul e outro amarelo.
aumentados. (págs. 440, 446) Os experimentadores colocaram dois reforçadores em placas
separadas e colocaram uma placa atrás de cada um dos
Os esquemas de proporção progressiva fornecem uma estrutura
painéis. Cada tentativa (24 por sessão para Rick; 14 por sessão
para avaliar a eficácia relativa de um estímulo como reforçador à
para Elaine) consistiu no sujeito empurrando um dos painéis e
medida que os requisitos de resposta aumentam. Em umesquema de
recebendo imediatamente o item no prato atrás daquele
reforço de razão progressiva, os requisitos de resposta para reforço são
painel. Durante a primeira fase, foi utilizado um esquema FR 1
aumentados sistematicamente ao longo do tempo, independentemente
(ou seja, cada resposta produzia o item do prato). Mais tarde,
do comportamento do participante. Em um esquema de proporção
Elaine e Rick deram respostas que produziram os dois itens
progressiva, o praticante gradualmente requer mais respostas por
diferentes aproximadamente nas mesmas taxas durante a fase FR 1 (veja os
apresentação do estímulo preferido até que um ponto de ruptura seja
dois níveis superiores na Figura 11.15). À medida que os requisitos de
alcançado e a taxa de resposta diminua (Roane, Lerman, & Vorndran,
resposta para receber os estímulos diferentes aumentavam, Elaine e Rick
2001). Por exemplo, inicialmente cada resposta produz reforço (FR 1), e
continuaram a alocar uniformemente as respostas entre os dois painéis. No
então o reforço é entregue após cada 2ª resposta (FR 2), então talvez
entanto, quando reforçadores inicialmente equivalentes e semelhantes
após cada 5ª, 10ª e 20ª resposta (FR 5, FR 10 e FR 20). Em algum
(alimentos em FR 1) foram comparados sob requisitos de cronograma
momento, um estímulo preferido pode não funcionar mais como
crescentes, as diferenças nas taxas de respostas nos dois painéis revelaram
reforçador (Tustin, 1994).

FR 1 FR 2 FR 5 FR 10 FR 20 FR 1
14
12
Beber
10
8
6
4
Balão
2 Elaine
0
5 10 15 20 25 30 35 40 45
FR 1 FR 2 FR 5 FR 10 FR 20
24
20 Bolacha
16
12
Número de Reforçadores Ganhos

8
4 Massageador
Rick
0
5 10 15 20 25 30 35 40 45
FR 1 FR 2 FR 5 FR 10 FR 1
14
12
10 Lasca

8
6
4 Pretzel
2 Elaine
0
5 10 15 20 25 30 35 40 45
FR 1 FR 2 FR 5 FR 10
24 Bolacha Figura 11.15Respostas por minuto durante a linha de base
20
de agendamento simultâneo e de agendamento único e
16 condições de reforço para dois adultos com deficiência
12 intelectual.
8 De "Emergence of Reinforcer Preference as a Function of Schedule
Rick
4 Requirements and Stimulus Similarity", de IG DeLeon, BA Iwata, H.
Biscoito
0 Goh e AS Worsdell, 1997,Journal of Applied Behavior Analysis,30,
5 10 15 20 25 30 35 40 45 pág. 444. Copyright 1997 pela Society for the Experimental Analysis
Sessões of Behavior, Inc. Usado com permissão.
Capítulo 11 • Reforço Positivo311

e preferências consistentes (veja as duas camadas inferiores na Figura mudanças nas condições ambientais e criteriosos na forma como planejam a
11.15). Por exemplo, quando Elaine precisou trabalhar mais para receber entrega de reforço em relação à atribuição de tarefas uma vez que a intervenção
comida, ela alocou a maioria de suas respostas para o painel que produzia esteja em andamento. Ou seja, pode ser melhor guardar alguns tipos de estímulos
salgadinhos em vez do que produzia pretzels. Da mesma forma, à medida preferidos para quando as demandas de tarefas são altas, em vez de substituí-los
que o número de respostas necessárias para receber reforço aumentou, Rick por outros estímulos igualmente preferidos quando as demandas de tarefas são
mostrou uma clara preferência por biscoitos em vez de bolachas. Esses baixas.
resultados sugerem que “para algumas classes de reforçadores, aumentos
simultâneos nas exigências de cronograma podem ampliar pequenas PROCEDIMENTOS DE CONTROLE PARA
diferenças de preferência que não são detectadas quando as exigências são
REFORÇO POSITIVO
baixas” (DeLeon et al., 1997, p. 446).
O aumento das necessidades de resposta dentro de um Os procedimentos de controle de reforço positivo são usados para
esquema concorrente pode refletir os efeitos do aumento das manipular a apresentação contingente de um potencial reforçador e
necessidades de resposta na escolha entre reforçadores e também observar quaisquer efeitos na frequência futura do comportamento.Ao
pode revelar se e sob quais condições dois reforçadores são controle, como o termo é usado aqui, requer uma demonstração
substituíveis um pelo outro. Se dois reforçadores têm a mesma função experimental de que a apresentação de um estímulo contingente à
(isto é, são efetivados pela mesma operação de estabelecimento), um ocorrência de uma resposta-alvo funciona como reforço positivo. O
aumento no preço (isto é, exigência de resposta) para um dos controle é demonstrado comparando as taxas de resposta na ausência
reforçadores levará a uma diminuição do consumo daquele item se um e na presença de uma contingência e, em seguida, mostrando que, com
reforço substituível for disponível (Green & Freed, 1993). DeLeon e a ausência e a presença da contingência, o comportamento pode ser
colegas (1997) usaram uma pessoa hipotética com uma ligeira ligado e desligado, ou para cima e para baixo (Baer, Wolf, & Risley,
preferência por Coca-Cola em vez de Pepsi como uma analogia para 1968). ). Historicamente, pesquisadores e praticantes têm usado a
explicar os resultados mostrados na Figura 11.15. técnica de reversão como a principal técnica de controle para reforço
positivo. Resumidamente, a técnica de reversão inclui duas condições e
Assumindo que Coca-Cola e Pepsi estão disponíveis por US$ 1,00 por
um mínimo de quatro fases (ou seja,ABAB). NoUMAcondição, o
porção e que uma pessoa tem apenas uma ligeira preferência por Coca-
comportamento é medido ao longo do tempo até atingir a estabilidade
Cola, o indivíduo pode alocar escolhas de maneira bastante uniforme,
na ausência da contingência de reforço. A ausência da contingência é a
talvez em função da saciedade periódica do item preferido, mas com
ao controledoença. NoBcondição, a contingência de reforço é
seleções um pouco mais gerais. de Coca. Agora suponha que o custo de
apresentada; o mesmo comportamento alvo continua a ser medido
cada um seja aumentado para US$ 5,00 por porção. A esse preço, é
para avaliar os efeitos da mudança de estímulo. A presença da
provável que a preferência pela Coca-Cola seja expressa. Por outro lado,
contingência de reforço é aexperimentaldoença. Se a taxa de resposta
um arranjo semelhante envolvendo Coca-Cola e tokens de ônibus pode
aumenta na presença da contingência, o analista então retira a
produzir resultados diferentes. Novamente, a US$ 1,00 por item, a seleção
contingência de reforço e retorna à contingência.UMAeBcondições para
aproximadamente igual entre as duas opções não seria surpreendente,
saber se a ausência e a presença da contingência irão diminuir e
supondo que a operação de estabelecimento de cada uma determina que
aumentar o comportamento alvo.
ambas são momentaneamente igualmente valiosas. No entanto, esses
itens têm funções distintamente diferentes e não são substituíveis; isso é,
No entanto, usar a extinção como condição de controle durante
a pessoa não é livre para trocar um pelo outro e continuar a receber
a fase de reversão apresenta problemas práticos e conceituais.
reforço funcionalmente similar na mesma proporção. É mais provável que
Primeiro, a retirada do reforço pode resultar em efeitos colaterais
a pessoa continue escolhendo igualmente, mesmo quando o preço de
produzidos pela extinção (por exemplo, um aumento inicial na taxa de
ambos os reforçadores aumenta substancialmente.
resposta, respostas emocionais, agressão — veja o Capítulo 24) que
afetam a demonstração de controle. Segundo, em algumas situações
O mesmo pode ser dito para os resultados obtidos no presente
pode ser impossível retirar completamente a contingência de reforço.
estudo. Quando as escolhas envolveram dois itens substituíveis, como um
Por exemplo, é improvável que um professor possa remover
biscoito e um biscoito, aumentos simultâneos no custo de cada um
completamente a atenção do professor durante oUMAdoença. Além
podem ter “forçado” a expressão de uma leve preferência por um dos
desses problemas, Thompson e Iwata (2005) observaram que, embora
itens. No entanto, quando reforços que provavelmente não seriam
substitutos, como um biscoito e um massageador, estavam disponíveis extinção tem sido frequentemente bem sucedida em reverter os
simultaneamente e igualmente preferidos, os aumentos no custo tiveram efeitos comportamentais do reforço positivo, seu uso como
pouco efeito sobre a preferência. (págs. 446–447) procedimento de controle apresenta dificuldades interpretativas.
Essencialmente, a extinção não isola adequadamente o reforço
contingênciacomo a variável que controla a resposta alvo, pois a
Embora o Estímulo X e o Estímulo Y possam funcionar como
mera apresentação do estímulo não pode ser descartada como uma
reforçadores quando as demandas da tarefa são baixas, ou quando o
explicação igualmente viável. (p. 261, ênfase adicionada)
esquema de reforço é denso, quando as demandas da tarefa
aumentam ou quando o esquema se torna mais enxuto (ou seja, mais De acordo com Thompson e Iwata (2005), “o procedimento
respostas exigidas por reforço), os participantes podem escolher de controle ideal para reforço positivo elimina a relação
apenas Stimulus Y. DeLeon e colegas (1997) apontaram que os contingente entre a ocorrência da resposta alvo e a apresentação
profissionais que estão atentos a essas relações podem ser mais céticos do estímulo enquanto controla os efeitos da mera apresentação do
em acreditar que as preferências originais serão mantidas sob estímulo” (p. 259) . Eles revisaram a eficácia de
312Parte 4 • Reforço

três variações da técnica de reversão como procedimentos de tempo do que o esquema NCR, talvez devido à eliminação do
controle para determinar o reforço: reforço não contingente (NCR), reforço acidental dos comportamentos alvo.
reforço diferencial de outro comportamento (DRO) e reforço
diferencial de comportamento alternativo (DRA).15
Reforço Diferencial de
Comportamento Alternativo
Reforço Não Contingente
Quandoreforço diferencial de um comportamento alternativo (DRA)
Reforço não contingente (NCR)é a apresentação de um potencial
é usado como condição de controle, o reforço potencial é
reforçador em um esquema de tempo fixo (FT) ou de tempo
apresentado contingente à ocorrência de uma alternativa desejável
variável (VT) independente da ocorrência do comportamento alvo.
ao comportamento alvo.16A técnica de reversão DRA inclui um
A apresentação independente da resposta do potencial reforçador
mínimo de cinco fases (ABCBC):UMAé uma condição de linha de
elimina a relação contingente entre o comportamento alvo e a
base;Bé uma condição de reforço, na qual o reforço potencial se
apresentação do estímulo, enquanto permite que quaisquer efeitos
apresenta contingente à ocorrência do comportamento alvo; eCé
da apresentação do estímulo por si só sejam detectados. Assim, o
uma condição na qual o reforço potencial é apresentado
NCR atende aos critérios de Thompson e Iwata (2005) para um
contingente à ocorrência de um comportamento alternativo (isto é,
procedimento de controle ideal para reforço positivo.
DRA). O analista então repetirá as fasesBeCverificar se o nível de
A técnica de reversão NCR envolve um mínimo de cinco fases
resposta diminui e aumenta em função da ausência e presença da
(ABCBC):UMAé uma condição de linha de base;Bé uma condição
contingência resposta-consequência.
NCR, onde o reforço potencial é apresentado em um esquema de
Thompson e Iwata (2005) resumiram as limitações do uso de
intervalo fixo ou variável independente do comportamento alvo; eC
DRO e DRA como procedimentos de condições de controle para
é uma condição na qual o potencial reforçador se apresenta
testar o reforço positivo:
contingente à ocorrência do comportamento alvo. oB eCas
condições são então repetidas para saber se o nível de resposta
[DRO e DRA] introduzem uma nova contingência que não
diminui e aumenta em função da ausência e presença da
estava presente no arranjo experimental original. Como
contingência resposta-consequência. A qualidade, a quantidade e a
resultado, as reduções na resposta alvo sob uma reversão de
taxa de reforço devem ser aproximadamente as mesmas durante o
contingência podem ser atribuídas a (a) término da
período contingente e não contingente.Be Ccondições da análise.
contingência entre a resposta alvo e o reforçador ou (b)
introdução de reforço pela ausência da resposta alvo ou pela
A NCR geralmente produz respostas persistentes, talvez por
ocorrência de uma resposta concorrente. Além disso, dado
causa do reforço acidental que às vezes ocorre com um esquema
que o reforço é fornecido contingente a alguma
independente de resposta, ou porque OEs semelhantes e condições de
característica de resposta durante a reversão de
estímulo antecedentes evocam a resposta persistente. Qualquer que
contingência, pode ser difícil controlar a taxa de
seja a causa, a resposta persistente é uma limitação do procedimento
apresentação do estímulo em condições experimentais e de
de controle NCR porque torna a obtenção de um efeito de reversão
controle. Se a resposta não for rapidamente reduzida (DRO)
(resposta reduzida) mais demorada do que a técnica de reversão com
ou realocada para respostas que produzem reforço (DRA), a
extinção. Alcançar o efeito pode exigir um contato prolongado com a
taxa de reforço na condição de controle pode ser baixa em
programação da NCR.
relação à taxa de reforço nas condições experimentais.
Quando isso ocorre, a estratégia de reversão de
Reforço Diferencial de Outro Comportamento contingência é funcionalmente semelhante ao procedimento
de extinção convencional. (pág. 267)
Um praticante usandoreforço diferencial de outro
comportamento (DRO)fornece um reforço potencial sempre
Dadas as considerações para a técnica de reversão com
que o comportamento alvo não ocorreu durante um intervalo
extinção e suas três variações, Thompson e Iwata (2005)
de tempo definido ou em um ponto específico no tempo. A
concluíram que a NCR oferece a demonstração mais completa
técnica de reversão DRO inclui um mínimo de cinco fases (
e inconfundível dos efeitos do reforço positivo.
ABCBC):UMAé uma condição de linha de base; Bé uma
condição de reforço, na qual o reforço potencial se apresenta
contingente à ocorrência do comportamento alvo; eCé a USANDO O REFORÇO DE FORMA EFICAZ
condição de controle DRO na qual o reforço potencial é
Oferecemos aos praticantes nove diretrizes para aplicar o reforço
apresentado contingente à ausência do comportamento alvo.
positivo de forma eficaz. Essas diretrizes vêm de três fontes principais:
O analista então repete aBeCcondições para determinar se o
as literaturas de pesquisa da análise experimental do comportamento,
nível de resposta diminui e aumenta em função da ausência e
a análise do comportamento aplicada e nossas experiências pessoais.
presença da contingência resposta-consequência.
O cronograma DRO permite a apresentação contínua da
Definir um critério inicial facilmente
contingência de reforço durante as fases de reversão do procedimento
alcançado para reforço
de controle. Em uma condição, a contingência está ativa com
ocorrências do comportamento alvo. Em outra condição, a contingência Um erro comum em aplicações de reforço é definir o critério
é ativa para a omissão do comportamento alvo. O procedimento de inicial de reforço muito alto, o que proíbe o comportamento do
controle DRO pode produzir o efeito de reversão em menos aprendiz de entrar em contato com a contingência. Para
Capítulo 11 • Reforço Positivo313

usar o reforço de forma eficaz, os praticantes devem estabelecer um comportamentos que receberam uma maior taxa de reforço com um
critério inicial para que as primeiras respostas do participante reforçador de qualidade inferior diminuíram em ocorrência. A qualidade do
produzam reforço e, em seguida, aumentar o critério de reforço reforçador também é relativa a outras consequências para a resposta
gradualmente à medida que o desempenho melhora. Heward (1980) atualmente disponível para o aluno.
sugeriu o seguinte método para estabelecer critérios iniciais de reforço Analistas de comportamento aplicados definem a magnitude (ou
com base no nível de resposta do aprendiz durante a linha de base (veja quantidade) de um reforçador como (a) a duração do tempo de acesso
a Figura 11.16). ao reforçador, (b) o número de reforçadores por unidade de tempo (ou
seja, taxa de reforço), ou (c) a intensidade do reforçador. Aumentos na
Para um comportamento que você deseja aumentar, defina o critério
magnitude do reforçador podem estar correlacionados com uma maior
inicial superior ao desempenho médio da criança na linha de base e
eficácia da relação comportamento-reforçador. No entanto, os efeitos
inferior ou igual ao seu melhor desempenho durante a linha de base.
da magnitude do reforçador não são bem compreendidos porque
Para um comportamento que você deseja diminuir em frequência, o
“poucos estudos aplicados examinaram os efeitos da magnitude na
critério inicial de reforço deve ser definido abaixo do desempenho médio
resposta em um arranjo operante único” (Lerman, Kelly, Vorndran,
da criança durante a linha de base e maior ou igual ao seu desempenho
Kuhn, & LaRue, 2002, p. 30). A consideração de quanto reforço usar
de linha de base mais baixo. (pág. 7)
deve seguir a máxima “Reforce abundantemente, mas não entregue a
loja”. Sugerimos que a quantidade de reforço seja proporcional à
Use reforços de alta qualidade de magnitude qualidade do reforçador e ao esforço necessário para emitir a resposta
suficiente alvo.
Reforçadores que mantêm a resposta em tarefas simples podem não ter a
Use reforços variados para manter operações de
potência de produzir níveis semelhantes de resposta em tarefas mais difíceis
estabelecimento potentes
ou mais longas. Os praticantes provavelmente precisarão usar um
reforçador de maior qualidade para comportamentos que exigem mais Os reforçadores geralmente diminuem em eficácia com o uso frequente.
esforço ou resistência. Um estímulo altamente preferido escolhido durante Apresentar uma superabundância de um reforçador específico provavelmente
as avaliações de preferência às vezes funciona como um reforçador de alta diminuirá a eficácia momentânea do reforçador devido à saciedade. Os praticantes
qualidade. Neef, Mace, Shea e Shade (1992), por exemplo, descobriram que podem minimizar os efeitos de saciedade usando uma variedade de reforçadores.
comportamentos que receberam uma taxa de reforço mais baixa, mas um Se a leitura de um livro específico sobre esportes funciona como um reforço e o
reforçador de maior qualidade, aumentaram em ocorrência, enquanto professor confia apenas nesse reforço,

Figura 11.16Usando dados de desempenho de linha de base dos alunos para definir critérios iniciais
de reforço.

As fórmulas de definição de critérios são


Para aumentar o comportamento:

média de linha de base6critério inicial…desempenho mais alto durante a linha de base Para

diminuir o comportamento:

média de linha de base7critério inicialVOCÊdesempenho mais baixo durante a linha de base

Exemplos
atuação Linha de base Faixa para
Comportamento Alvo Meta Mais baixo Altíssima Média Critério Inicial
Jogando sozinho Aumentar 2 minutos. 14 min. 6 min. 7-14 min.
Identificando letras de Aumentar 4 letras 9 letras 5 letras 6–9 letras
o alfabeto
Número de perna Aumentar 0 22 8 9-22
exercícios concluídos
Porcentagem de matemática Aumentar 25% 60% 34% 40-60%
problemas corretamente
resolvido

Número de digitação Diminuir 16 28 22 16–21


erros em uma letra
Número de calorias Diminuir 2.260 3.980 2.950 2.260–2.900
consumido por dia

De: “A Formula for Individualizing Initial Criteria for Reinforcement”, de WL Heward, 1980,Professor excepcional,
1(9), pág. 8. Usado com permissão.
314Parte 4 • Reforço

em última análise, ler esse livro pode não mais produzir reforço. Por Sempre que possível, os praticantes devem usar contingência de
outro lado, reforçadores conhecidos que nem sempre estão disponíveis reforço direto, especialmente com alunos com repertórios
podem ter maior eficácia quando são reintroduzidos. Se um professor comportamentais limitados.
demonstrou que “ser o primeiro da fila” é um reforço, mas usa esse
reforço apenas uma vez por semana, o efeito de reforço será maior do Combinar prompts de
que se “ser o primeiro da fila” for usado com frequência. resposta e reforço
Reforços variados podem permitir que estímulos menos preferidos Os prompts de resposta são estímulos antecedentes suplementares usados
funcionem como reforçadores. Por exemplo, Bowman, Piazza, Fisher, para ocasionar uma resposta correta na presença de um S.Dque acabará por
Hagopian e Kogan (1997) descobriram que alguns alunos responderam controlar o comportamento. Os analistas de comportamento aplicados
melhor a uma variedade de estímulos menos preferidos em comparação fornecem prompts de resposta antes ou durante o desempenho de um
com um acesso contínuo a um único estímulo mais altamente preferido. comportamento-alvo. As três principais formas de prompts de resposta são
Além disso, o uso de uma variedade de reforçadores pode manter a potência instruções, modelagem e orientação física.
de qualquer reforçador em particular mais alta. Por exemplo, Egel (1981) As instruções que descrevem a contingência podem funcionar como uma
descobriu que a resposta correta dos alunos e o comportamento na tarefa operação motivadora para aprendizes com habilidades verbais, tornando mais
eram maiores quando os alunos tinham acesso a um dos três reforçadores provável que eles entrem em contato com o reforçador mais rapidamente. Por
selecionados aleatoriamente ao longo das tentativas versus uma condição exemplo, Mayfield e Chase (2002) disseram a estudantes universitários que
de reforço constante na qual um dos estímulos era apresentado após cada estavam aprendendo cinco regras básicas de álgebra que ganhariam dinheiro por
sucesso. tentativas. Mesmo dentro de uma sessão, os professores podem respostas corretas e não seriam penalizados por respostas incorretas.
permitir que os alunos selecionem uma variedade de consequências de um Bourret, Vollmer e Rapp (2004) usaram prompts de resposta
menu. De forma similar, variar uma propriedade de um reforçador pode verbal durante uma avaliação dos repertórios de mando verbal
manter sua potência de reforço por mais tempo. Se as histórias em vocal de três participantes com autismo.
quadrinhos são usadas como reforço, ter vários gêneros diferentes de
histórias em quadrinhos disponíveis provavelmente manterá sua potência. Cada sessão de avaliação de vocalização consistiu em 10 tentativas,
cada uma com 1 minuto de duração. Um prompt não específico
Use contingências de reforço direto em vez de [descrevendo a contingência] foi entregue (por exemplo, “Se você
indireto quando possível quer isso, peça-me”) 10 s após o início do julgamento. Um prompt
incluindo um modelo do enunciado alvo completo (por exemplo, “Se
Com uma contingência de reforço direto, a emissão da
você quer isso, diga 'chip'”) foi entregue 20 s após o início do teste. O
resposta alvo produz acesso direto ao reforçador; a
participante foi solicitado a dizer apenas o primeiro fonema da
contingência não requer quaisquer medidas intervenientes.
resposta direcionada (por exemplo, “Se você quer isso, diga 'ch'”) 30 s
Com uma contingência de reforço indireto, a resposta não
após o início da tentativa. (págs. 131–132)
produz reforço diretamente. O praticante apresenta o
reforçador. Pesquisas sugerem que contingências de reforço O Capítulo 17 fornece uma discussão mais aprofundada sobre prompts de
direto podem melhorar o desempenho (Koegel & Williams, resposta, incluindo procedimentos específicos para combinar prompts de resposta
1980; Williams, Koegel & Egel, 1981). Thompson e Iwata (2000), com reforço e exemplos adicionais de uso de instruções verbais, modelagem e
por exemplo, ligaram as definições de contingências diretas e prompts de resposta de orientação física.
indiretas à diferença entre reforço automático (ou seja, direto)
e contingências socialmente mediadas(ou seja, indireto) e Inicialmente Reforce Cada Ocorrência do
resumiu sua pesquisa sobre aquisição de resposta sob Comportamento Inicialmente
contingências diretas e indiretas de reforço desta forma:
Forneça reforço para cada ocorrência do comportamento alvo (ou seja,
Em ambas as contingências, a conclusão de tarefas idênticas reforço contínuo) para fortalecer o comportamento, principalmente
(abrir um dos vários tipos de recipientes) produzia acesso a durante os estágios iniciais de aprendizagem de um novo
reforçadores idênticos. Sob a contingência direta, o reforçador comportamento. Depois que o comportamento for estabelecido,
foi colocado dentro do recipiente a ser aberto; na contingência diminua gradualmente a taxa de reforço para que algumas, mas não
indireta, o terapeuta segurava o reforçador e o entregava ao todas, ocorrências do comportamento sejam reforçadas (isto é, reforço
participante ao término da tarefa. Um participante intermitente). Por exemplo, um professor pode inicialmente reforçar
imediatamente executou a tarefa com 100% de precisão em cada resposta correta para palavras de visão impressas em cartões de
ambas as contingências. Três participantes mostraram memória flash e, em seguida, usar um esquema de proporção para
melhorias mais imediatas ou maiores no desempenho sob a reforço fino. Para firmar as respostas após o aprendizado inicial,
contingência direta. Os dois participantes restantes forneça reforço após duas respostas corretas por algumas tentativas,
apresentaram melhor desempenho apenas sob a contingência depois após cada conjunto de quatro respostas corretas e assim por
de reforço direto. Dados obtidos sobre a ocorrência de diante. Hanley e colegas (2001) gradualmente mudaram de um
comportamentos “irrelevantes” sob a contingência indireta (por esquema de reforço de 1 segundo de intervalo fixo (FI) muito denso
exemplo, alcançar o reforçador em vez de realizar a tarefa) (em um esquema FI, a primeira resposta alvo após o final do intervalo
forneceu algumas evidências de que esses comportamentos produz reforço) para esquemas mais finos com os seguintes
podem ter interferido no desempenho da tarefa e que sua incrementos de intervalos: 2 seg, 4 seg, 8 seg, 16 seg, 25 seg, 35 seg, 46
ocorrência era uma função do controle diferencial de estímulos. seg e, finalmente, para um FI 58 -seg agenda. O Capítulo 13 fornece
(pág. 1) mais informações sobre o uso do reforço contínuo e intermitente.
Capítulo 11 • Reforço Positivo315

Fornecer Atenção Contingente e um determinado aluno, os praticantes incorporam elogios e atenção


Elogios Descritivos contingentes em qualquer intervenção que implique reforço positivo.

Conforme discutido anteriormente neste capítulo, a atenção social


e o elogio são reforços poderosos para a maioria das pessoas. No Aumente gradualmente o atraso da
entanto, as melhorias comportamentais após o elogio geralmente resposta ao reforço
envolvem algo mais, ou completamente diferente, dos efeitos Recomendamos em uma diretriz anterior que os
diretos do reforço. Michael (2004) discutiu o erro conceitual comum praticantes reforcem cada ocorrência do comportamento-
de supor que o aumento da resposta após elogios e atenção é uma alvo durante os estágios iniciais de aprendizado e, em
função do reforço. seguida, diminuam a entrega de reforçadores mudando
para um esquema intermitente de reforço. Como as
Considere o uso comum deelogio descritivo, fornecendo
consequências que mantêm a resposta em ambientes
algum sinal geral de aprovação social (um sorriso mais
naturais costumam ser atrasadas, Stromer, McComas e
algum comentário como “Bom trabalho!”)e, além disso,
Rehfeldt (2000) nos lembraram que o uso de esquemas de
uma breve descrição do comportamento responsável
reforço contínuos e intermitentes pode ser apenas os
pela aprovação (“Gosto do jeito que você é . . . !”).
primeiros passos da programação de consequências para
Quando esse elogio é feito para uma pessoa
situações cotidianas. “Estabelecer as instâncias iniciais de
normalmente verbal com mais de 5 ou 6 anos de idade,
um repertório comportamental normalmente requer o uso
provavelmente funciona como uma forma de instrução
de consequências programadas que ocorrem
ou como regra, como se o elogiador tivesse dito: “Se você
imediatamente após a ocorrência da resposta alvo. No
quer minha aprovação contínua, você tem que . . . ” Por
entanto, o trabalho do analista do comportamento aplicado
exemplo, um supervisor de fábrica se aproxima de um
também envolve o uso estratégico do reforço retardado.17
funcionário que está limpando um derramamento de
Exemplos de táticas que os analistas de comportamento aplicados
óleo no chão de fábrica, sorri amplamente e diz: “George,
têm usado para ajudar as pessoas a aprender a responder efetivamente a
gosto muito da maneira como você está limpando esse
consequências atrasadas incluem (a) um intervalo de tempo de atraso para
derramamento antes que alguém pise nele. . Isso é
reforço que começa com um pequeno atraso que é gradualmente
muito atencioso da sua parte.” Agora suponha que
aumentado (Dixon, Rehfeldt e Randich, 2003). ; Schweitzer & Sulzer-Azaroff,
George limpe os vazamentos daquele momento em
1988); (b) um aumento gradual das exigências de trabalho durante o atraso
diante - uma mudança bastante grande no
(Dixon & Holcomb, 2000); (c) uma atividade durante o atraso para “preencher
comportamento, considerando que foi seguida por
a lacuna” entre o comportamento e o reforçador (Mischel, Ebbesen, & Zeiss,
apenas uma única instância de reforço.
1972); e, mais importante, (d) instrução verbal na forma de garantia de que o
(pp. 164–165, ênfase no original)
reforçador estará disponível após um atraso (por exemplo, “A calculadora
Um estudo de Goetz e Baer (1973) que investigou os efeitos mostrará a quantia de dinheiro a ser colocada em uma conta poupança para
do elogio do professor no jogo criativo de crianças pré-escolares você. todas as moedas em sua conta poupança em [dia]”) (Neef, Mace, &
com blocos de construção usou o elogio descritivo em uma Shade, 1993, pág. 39). Apresentamos mais sobre o uso de consequências
condição do estudo. “A professora observava com interesse, atrasadas para promover a generalização e manutenção de mudanças de
entusiasmo e alegria cada vez que a criança colocava e/ou comportamento no Capítulo 30.
reorganizava os blocos de forma a criar uma forma que não havia
aparecido anteriormente na(s) construção(s) daquela sessão. . . .
'Oh, isso é muito bom - isso é diferente'!)” (p. 212). As três meninas Mude gradualmente de reforçadores artificiais para
de 4 anos aumentaram a construção da diversidade da forma de reforçadores naturais
bloco durante cada fase do elogio descritivo contingente. Goetz e
Terminamos este capítulo com um extrato do relato perspicaz e
Baer não conduziram uma análise de componentes para
instigante de Murray Sidman (2000) sobre o que ele aprendeu nos
determinar quanto do desempenho melhorado das meninas
“primórdios” da aplicação de princípios comportamentais ao
poderia ser atribuído ao reforço na forma de atenção positiva (“Isso
comportamento humano. Ao descrever um projeto de 1965 a 1975
é muito bom!”) ou ao feedback recebido (“Isso é diferente!” ),coisas
que enfatizou o uso de reforço positivo com meninos entre 6 e 20
diferentescom os blocos chama a atenção do professor.”). Os
anos diagnosticados com deficiência intelectual e vivendo em uma
autores supõem que
instituição estatal, Sidman lembrou como a introdução de fichas
para algumas crianças, ou [reforçar a atenção ou elogio descritivo] como reforçadores condicionados generalizados acabou levando a
será suficiente sem o outro, mas para outras crianças, a mistura dos elogios da equipe do projeto e, posteriormente, ao próprio
dois será mais eficaz do que qualquer um sozinho. Em caso aprendizado, tornando-se poderosos reforços para os meninos.
afirmativo, então, para fins aplicados, um pacote de atenção
Começamos com os tokens, que tinham a vantagem de serem visíveis e
positiva e elogios descritivos é provavelmente a melhor técnica a ser
de fácil manuseio. Mais tarde, depois que os meninos aprenderam a
aplicada às crianças em geral. (p. 216, palavras entre colchetes
guardar fichas e a entender os números, pudemos introduzir pontos. Para
adicionadas)
alguns, os pontos acabaram levando a dinheiro. Como os meninos viram
Recomendamos que, na ausência de dados que demonstrem como ficamos satisfeitos quando eles ganharam as fichas e pontos que
que atenção e elogios produziram efeitos contraterapêuticos para lhes trouxeram outros reforços,
316Parte 4 • Reforço

nosso prazer também se tornou importante para eles, e nos tornamos O sucesso na manipulação do ambiente pode ser o último
capazes de usar o elogio como reforço. À medida que aprendiam cada vez reforço natural. Como Skinner (1989) apontou, esse poderoso
mais, muitos dos meninos descobriram que o que aprendiam lhes reforçador “não precisa ser planejado para fins de instrução; não
permitia lidar de forma mais eficaz com seu mundo cada vez maior. Para está relacionado a nenhum tipo particular de comportamento e,
eles, o próprio aprendizado tornou-se reforçador. (pág. 19) portanto, está sempre disponível. Nós chamamos issosucesso
.” (pág. 91)

RESUMO
Reforço Positivo Definido entre suas ações e uma consequência de reforço, ou
mesmo estar ciente de que uma consequência
1.O reforço positivo ocorre quando uma resposta é seguida
ocorreu, para que o reforço aconteça.
imediatamente pela apresentação de uma mudança de estímulo
que aumenta a ocorrência futura de respostas semelhantes. 11.O reforço fortalece qualquer comportamento que o preceda
imediatamente; nenhuma conexão lógica ou adaptativa entre o
2.O estímulo que se apresenta como consequência, e que é
comportamento e a consequência reforçadora é necessária.
responsável pelo subsequente aumento do responder, é chamado
de reforçador positivo, ou, mais simplesmente, de reforçador. 12.A importância de entender a arbitrariedade do reforço vai muito
além de fornecer uma possível explicação para o
3.A importância do imediatismo do reforço deve ser
desenvolvimento de comportamentos supersticiosos e
enfatizada; um atraso de resposta ao reforço de apenas idiossincráticos inofensivos. A natureza arbitrária da seleção
1 segundo será menos eficaz do que um reforço por reforço pode explicar a aquisição e manutenção de muitos
entregue imediatamente. comportamentos desadaptativos e desafiadores.
4.Os efeitos de consequências muito atrasadas no comportamento
13.O reforço automático refere-se à relação de mudança comportamento-
humano não devem ser atribuídos ao reforço, pois esses efeitos
estímulo que ocorre sem a apresentação de consequências por
diminuem rapidamente à medida que o atraso aumenta.
outras pessoas, ou é assumida quando um comportamento persiste
5.Um equívoco sustentado por alguns é que o reforço é um na ausência de qualquer reforçador conhecido.
conceito circular. O raciocínio circular é uma forma de lógica
defeituosa em que causa e efeito são confusos e não
Classificando Reforçadores
independentes um do outro. O reforço não é um conceito
circular porque os dois componentes da relação 14.Um reforçador incondicionado é uma mudança de estímulo que
respostaconsequência podem ser separados e a funciona como reforço, mesmo que o aprendiz não tenha um
consequência manipulada para determinar se aumenta a histórico particular de aprendizado com ele. (Os termosreforço
frequência do comportamento que segue. primárioereforço não aprendidosão sinônimos de reforçador
incondicionado.)
6.O reforço faz mais do que aumentar a ocorrência futura de
comportamento semelhante; também altera a função dos estímulos 15.Um reforçador condicionado (às vezes chamado dereforço secundárioou
que precedem imediatamente o comportamento reforçado. Em reforço aprendido) é uma mudança de estímulo previamente neutra
virtude de serem emparelhados temporalmente com a contingência que adquiriu a capacidade de funcionar como um reforçador por meio
reforçadora de resposta, os eventos antecedentes adquirem a do emparelhamento estímulo-estímulo com um ou mais reforçadores
capacidade de evocar (tornar mais prováveis) instâncias da classe de incondicionados ou reforçadores condicionados.
resposta reforçada. Um estímulo antecedente que evoca
16.Um reforçador condicionado generalizado é um reforçador
comportamento porque foi correlacionado com a disponibilidade de
condicionado que, como resultado de ter sido emparelhado com
reforço é chamado de estímulo discriminativo (SD).
muitos reforçadores incondicionados e condicionados, não
7.Um operante discriminado é definido por uma contingência de depende de um OE atual para qualquer forma particular de
três termos de SDSRSSR+. reforço para sua eficácia.

8.A eficácia momentânea de qualquer mudança de estímulo como 17.Quando os reforçadores são descritos por suas propriedades físicas, eles são
reforço depende de um nível existente de motivação em relação a tipicamente classificados como comestíveis, sensoriais, tangíveis, de
essa mudança de estímulo. Uma operação de estabelecimento atividade ou reforçadores sociais.
(OE) (por exemplo, privação) aumenta a eficácia atual de um
18.O princípio de Premack afirma que tornar a oportunidade de se engajar
reforçador; uma operação de abolição (AO) (por exemplo,
em um comportamento que ocorre em uma taxa relativamente alta de
saciedade) diminui a eficácia atual de um reforçador.
operante livre (ou linha de base) contingente à ocorrência de
9.Uma descrição completa do reforço de um operante comportamento de baixa frequência funcionará como reforço para o
discriminado envolve uma contingência de quatro comportamento de baixa ocorrência.
termos: EOSSDSRSSR+.
19.A hipótese de privação de resposta é um modelo para prever
10.A automaticidade do reforço refere-se ao fato de que uma
se o acesso a um comportamento (o comportamento
pessoa não precisa entender ou verbalizar a relação contingente) funcionará como reforço para outro.
Capítulo 11 • Reforço Positivo317

comportamento (a resposta instrumental) com base nas taxas de linha Procedimentos de controle para reforço positivo
de base relativas em que cada comportamento ocorre e se o acesso
24.Os procedimentos de controle de reforço positivo são usados para
ao comportamento contingente representa uma restrição em
manipular a apresentação contingente de um potencial reforçador e
comparação com o nível de engajamento da linha de base.
observar quaisquer efeitos na frequência futura do comportamento.Ao

Identificando Reforçadores Potenciais controle, como o termo é usado aqui, requer uma demonstração
experimental de que a apresentação de um estímulo contingente à
20.A avaliação da preferência por estímulo refere-se a uma variedade de ocorrência de uma resposta-alvo funciona como reforço positivo. O
procedimentos usados para determinar (a) os estímulos que a controle é demonstrado comparando as taxas de resposta na ausência
pessoa seleciona diferencialmente; (b) o valor relativo de preferência e na presença de uma contingência e, em seguida, mostrando que, com
hierárquica desses estímulos (alta preferência a baixa preferência); (c) a ausência e a presença da contingência, o comportamento pode ser
as condições sob as quais esses valores de preferência mudam ligado e desligado, ou para cima e para baixo.
quando demandas de tarefas, estados de privação ou esquemas de
reforço são modificados; e (d) se itens altamente preferidos servem, 25.Além de um projeto de reversão usando a retirada da

em última análise, como reforçadores efetivos. contingência de reforço (ou seja, extinção) como condição de
controle, reforço não contingente (NCR), reforço diferencial de
outro comportamento (DRO) e reforço diferencial de
21.A avaliação da preferência de estímulos pode ser realizada usando comportamento alternativo (DRA) podem ser usados como
pelo menos cinco formas: estímulo único (SS), estímulo pareado condições de controle para reforço.
(PS), operante livre (FO), estímulo múltiplo com substituição de
item (MSWI), estímulo múltiplo sem substituição de item. Usando o reforço de forma eficaz
MSWO). Essas cinco formas podem ser agrupadas em três
categorias: perguntar à pessoa-alvo e/ou outros significativos, 26.As diretrizes para aumentar a eficácia das
realizar observações operantes livres e conduzir avaliações intervenções de reforço positivo incluem:
baseadas em testes. • Estabeleça um critério inicial de reforço facilmente alcançado.

22.Estímulos preferidos nem sempre funcionam como reforçadores, e as


• Use reforçadores de alta qualidade de magnitude suficiente.

preferências de estímulos muitas vezes mudam com o tempo. • Use reforçadores variados para manter operações de estabelecimento
potentes.
23.A avaliação do reforçador refere-se a uma variedade de métodos diretos e
baseados em banco de dados para determinar os efeitos relativos de • Use contingências de reforço direto ao invés de indireto
um determinado estímulo como reforço sob condições diferentes e quando possível.
variáveis ou a eficácia comparativa de múltiplos estímulos como • Combine prompts de resposta e reforço.
reforçadores para um determinado comportamento sob condições • Reforce inicialmente cada ocorrência do comportamento.
específicas. A avaliação do reforçador é frequentemente conduzida com
• Forneça atenção contingente e elogios descritivos.
procedimentos no momento, esquemas simultâneos de reforço,
esquemas múltiplos de reforço e esquemas de reforço progressivo. • Aumente gradualmente o atraso da resposta ao reforço.
• Mude gradualmente de reforçadores artificiais para reforçadores naturais.

TERMOS CHAVE

reforçador condicionado reforço positivo comportamento governado por regras

de reforço automático Princípio de pré-moldagem Contingências Socialmente Mediadas

Reforço Condicionado avaliação de reforço Estímulo Avaliação de Preferência

Generalizado Reforço Positivo hipótese de privação de resposta Reforçador Incondicionado

QUESTÕES DE MÚLTIPLA ESCOLHA

1.Um professor quer entregar um adesivo para Johnny toda vez 2.As qualificações a serem consideradas ao utilizar o
que ele diz “por favor”. Isso seria considerado reforço reforço positivo são:
positivo se: uma.Atraso entre a resposta e a consequência
uma.O comportamento de dizer “por favor” aumenta com o tempo. b.Condições de estímulo quando a resposta foi emitida
b.O comportamento de dizer “por favor” diminui com o tempo. c.Força da motivação
c.O comportamento de dizer “por favor” não muda com o tempo. d.Todos esses
d.O comportamento da entrega de adesivos diminui com o Dica: (Veja “Usando o Reforço Efetivamente”)
tempo. Dica: (Consulte “Definição de Reforço Positivo”)
318Parte 4 • Reforço

3.Um exemplo de reforço(s) incondicionado(s) é: 9.Que informações uma avaliação de reforço de esquema

uma.Comida
concorrente fornece?

b.Água uma.Uma ordem de classificação de preferência para uma variedade de estímulos

c.Oxigênio b.Com que frequência as crianças selecionarão um estímulo


versus outro para indicar preferência
d.Cordialidade
c.Se um estímulo funciona ou não como reforçador e quão eficaz
e.Estimulação sexual
esse estímulo é como reforçador em comparação com outros
f.Todos esses estímulos
Dica: (Veja “Classificação de Reforçadores”) d.Todos esses
4.Um estímulo neutro pode ser transformado em reforçador por: e.Nenhum desses
uma.Emparelhando-o com um estímulo incondicionado Dica: (Veja “Avaliação do Reforçador”)
b.Emparelhando-o com uma resposta incondicionada
10.Quando duas ou mais contingências de reforço operam
c.Apresentando-o individualmente após uma resposta várias vezes independentemente e simultaneamente para dois ou mais
d.Um estímulo neutro não pode ser utilizado como reforço comportamentos, qual esquema de reforço está em vigor?

Dica: (Veja “Classificação de reforçadores”) uma.Múltiplo

5.Heather ouve um telefone tocar, então pega o telefone. Seu b.Misturado

marido fala com ela pelo telefone. Qual é o comportamento c.Proporção-Progressiva


nesta contingência de três termos?
d.Simultâneo
uma.Marido falando
e.Todos esses
b.Heather pega o telefone f.Nenhum desses
c.Telefone tocando
Dica: (Veja “Avaliação do Reforçador”)
d.Nenhum desses
11.Qual avaliação de reforço de esquema consiste em dois ou mais
Dica: (Consulte “Definição de Reforço Positivo”) esquemas de reforço de componentes para uma única resposta com
6.Um exemplo de operação motivadora é: apenas um esquema de componentes em vigor em um determinado

uma.Fome momento?

uma.Proporção-Progressiva
b.Rinite alérgica

c.Argumento com outro significativo b.Múltiplo


d.Todos esses c.Misturado

e.Nenhum desses d.Simultâneo

Dica: (Consulte “Definição de Reforço Positivo”) e.Todos esses


f.Nenhum desses
7.Qual das alternativas a seguir não é uma maneira apropriada de

identificar potenciais reforçadores? Dica: (Veja “Avaliação do Reforçador”)


uma.Escolha um estímulo que seja reforçador para outra pessoa 12.O modelo para prever se (a) o acesso a um comportamento funcionará

b.Pergunte à pessoa ou a outra pessoa significativa o que está reforçando como reforço para outro comportamento com base nas taxas de linha
de base relativas em que cada comportamento ocorre e (b) se o acesso
c.Observe a pessoa
contingente a um dos comportamentos representa uma restrição em
d.Meça as respostas da pessoa a testes baseados em tentativas
comparação com o nível de linha de base de engajamento é conhecido
Dica: (Consulte “Identificando potenciais reforçadores”) como:

8.A avaliação de preferência de estímulo refere-se a uma variedade de uma.Hipótese de saciedade de resposta
procedimentos para determinar:
b.Hipótese de contingência de resposta
uma.O estímulo que uma pessoa prefere
c.O Princípio do Premack
b.Os valores de preferência relativos desses estímulos
d.Hipótese de privação de resposta
c.As condições em que esses valores de preferência se mantêm
e.Nenhum desses
d.Todos esses Dica: (Consulte “Classificação de Reforçadores por
Dica: (Consulte “Identificando Reforçadores Potenciais”) Propriedades Formais”)
Capítulo 11 • Reforço Positivo319

13.A hipótese de privação de resposta foi construída sobre o conceito de 16.Qual das seguintes opções poderia ser usada como condição de
quem? controle ao avaliar os efeitos de um procedimento baseado em

uma.Premack reforçamento?

b.Skinner uma.Reforço não contingente

c.Watson b.Reforço diferencial de outro comportamento

d.Pavlov c.Reforço diferencial de comportamento alternativo

e.Nenhum desses d.Todos esses

Dica: (Consulte “Classificação de Reforçadores por e.Nenhum desses

Propriedades Formais”) Dica: (Consulte “Procedimentos de Controle para Reforço Positivo”)

14.O controle experimental ao avaliar o reforço 17.Quais das seguintes são diretrizes para um
positivo é demonstrado comparando: reforço eficaz?
uma.Taxas de resposta na presença de uma contingência uma.Escolher reforçadores que não são relevantes para o comportamento

b.Taxas de resposta na ausência de uma contingência alvo

c.Reforço de tempo fixo para reforço diferencial b.Usando reforçadores de baixa magnitude

d.Reforço diferencial de outro comportamento para outro c.Atrasar a entrega de um reforço


esquema de reforço, como reforço diferencial de d.Usando os mesmos reforçadores repetidamente
comportamento alternativo e.Nenhum desses
e.Todos esses Dica: (Veja “Usando o Reforço Efetivamente”)
f.Nenhum desses
18.Os praticantes aumentam a eficácia do reforço
Dica: (Consulte “Procedimentos de Controle para Reforço Positivo”) positivo quando atendem à ________ da apresentação
15.A apresentação de um potencial reforçador em um esquema do estímulo.
fixo ou variável independente da ocorrência do uma.Arranjo
comportamento alvo também é chamada de: b.Gestão
uma.Reforço contingente c.Administração
b.Reforço não contingente d.Todos esses
c.Punição contingente e.Nenhum desses
d.Punição não contingente Dica: (Veja “Usando o Reforço Efetivamente”)
e.Nenhum desses

f.Todos esses
Dica: (Consulte “Procedimentos de Controle para Reforço Positivo”)

PERGUNTAS DO TIPO DE ENSAIO

1.Explique brevemente os termos reforço positivo e métodos são perguntar à pessoa ou a outras pessoas
reforçador positivo. importantes, observar o indivíduo e medir as respostas da

Dica: (Consulte “Definição de Reforço Positivo”) pessoa a testes baseados em testes.)

Dica: (Consulte “Identificando Reforçadores Potenciais”)


2.Explique brevemente os termos reforçadores condicionados e
incondicionados e dê um exemplo de cada um. 5.Depois de identificar possíveis reforçadores, como

Dica: (Veja “Classificação de Reforçadores”) determinar se o estímulo é um reforçador? Descreva


brevemente qual procedimento de avaliação você usaria
3.Bob acabou de completar sua rotina de exercícios matinais. No e por quê.
caminho para tomar banho, Bob passa pela geladeira. Bob
Dica: (Consulte “Identificando Reforçadores Potenciais”)
pega uma maçã da geladeira. Bob come a maçã a caminho do
banho matinal. Descreva brevemente o exemplo acima 6.Descreva e dê um exemplo do procedimento de privação de
usando o paradigma do condicionamento operante. resposta. Explique sua resposta.
(Certifique-se de incluir motivação em sua resposta.) Dica: (Veja “Classificação de Reforçadores”)

7.Explique brevemente se o “controle” foi ou não demonstrado


Dica: (Consulte “Definição de Reforço Positivo”)
no gráfico. Apoie sua explicação com evidências do gráfico. (O
4.Descreva brevemente os prós e os contras dos três métodos controle requer uma demonstração experimental de que a
básicos para avaliações de preferência de estímulo. (Os três apresentação de um estímulo
320Parte 4 • Reforço

dependente da ocorrência de uma resposta-alvo funciona 8.Shawn está acima do peso e atualmente não faz nenhum tipo de
como um reforço positivo.) exercício diário. Seu médico recomendou que ele andasse 3 milhas
diariamente. Explique brevemente como o reforço positivo pode
Linha de base NCR DRA NCR DRA ser utilizado para ajudar Shawn a aumentar o comportamento de
25
caminhar. (Inclua um reforço proposto, o momento da entrega do
reforço proposto, contingência, motivação e uma declaração sobre
20 a maneira proposta de avaliar a eficácia do reforço proposto).
Taxa de Comportamento Alvo por

Dica: (Veja “Usando o Reforço Efetivamente”)


15
Minuto

10

0
1 3 5 7 9 11 13 15 17 19 21 23
Sessões

Dica: (Consulte “Procedimentos de Controle para


Reforço Positivo”)

NOTAS

1. Frases comofortalecendo o comportamentoeaumentando a probabilidade de 10. Para obter detalhes adicionais sobre a realização de avaliações de estímulo único,
resposta futuraàs vezes são usados para descrever o efeito básico do reforço. incluindo uma ficha de dados de amostra, consulte https://
Embora tais termos apareçam ocasionalmente neste livro, reconhecendo a www.kennedykrieger.org/sites/default/files/patient-care-files/
preocupação de Michael (1995) de que o uso de tais termos “encoraja uma single_stimulus_preference_assessment.pdf e Hagopian et al. (2001).
linguagem de variáveis intervenientes, ou uma referência implícita a algo diferente 11. Para obter detalhes adicionais sobre a realização de avaliações de preferência de
de um aspecto observável do comportamento” (p. 274), nós mais muitas vezes estímulos pareados, incluindo uma folha de dados de amostra, consulte https://
usam aumento da ocorrência futura (ou taxa)para se referir ao efeito primário do www.kennedykrieger. org/sites/default/files/patient-care-files/
reforço. paired_stimulus_preference_ assessment.pdf e Fisher et al. (1992).
2. Quando a consequência que produziu o aumento na resposta é melhor 12. Para obter detalhes adicionais sobre a realização de avaliações de preferência de
descrita como aterminaçãooucancelamentode um estímulo já presente, estímulo múltiplo sem substituição (MSWO), incluindo uma folha de dados de
reforço negativoocorreu. A natureza fundamental e as condições de amostra, consulte https://www.kennedykrieger.org/sites/default/files/patient-care-
qualificação para reforço positivo e reforço negativo são as mesmas: O files/mswo_preference_assessment.pdf e DeLeon e Iwata (1996).
comportamento aumenta no futuro. O reforço negativo é examinado 13. Para informações adicionais sobre os efeitos comparativos do SPA, ver
em detalhes no Capítulo 12. Verriden e Roscoe (2016) e Karsten et al. (2011).
3. Excelentes discussões sobre comportamento governado por regras podem ser 14. Esses esquemas de reforço e seus efeitos sobre o comportamento são
encontradas em Baum (2017); Chase e Danforth (1991); Hayes (1989); Hayes, descritos no Capítulo 13.
Zettle e Rosenfarb (1989); Malott e Shane (2014); Reitman e Gross (1996); 15. O Capítulo 8 apresenta as técnicas de controle ABAB, NCR, DRO e DRA no
Schlinger e Blakely (1987); e Vaughan (1989). contexto de projetos experimentais de caso único, e o Capítulo 25 discute
4. As operações motivadoras são descritas em detalhes no Capítulo 16. NCR, DRO e DRA em detalhes.
5. É um erro supor que todo comportamento supersticioso é resultado direto de reforços 16. O Capítulo 25 descreve DRO e DRA como táticas de mudança de comportamento para
adventícios. Muitos comportamentos supersticiosos são provavelmente o resultado de diminuir a frequência de comportamento indesejável.
seguir práticas culturais. Por exemplo, jogadores de beisebol do ensino médio podem usar 17. A passagem do reforço contínuo para um esquema intermitente de reforço às
seus bonés de dentro para fora e para trás quando um rali de última hora é necessário vezes é descrita como um meio de aumentar o atraso do reforço (por
porque viram jogadores da liga principal usarem esses “bonés de rali” exemplo, Alberto & Troutman, 2013; Kazdin, 2013). No entanto, um esquema
na mesma situação. intermitente de reforço não implica “reforço retardado”, a menos que
6. Mandos, tatos e intraverbais - três operantes verbais elementares descritos pela especificado. Embora apenas algumas ocorrências do comportamento-alvo
primeira vez por Skinner (1957) - são explicados no Capítulo 18. sejam reforçadas em um esquema intermitente de reforço (veja o Capítulo
7. Lembre-se, o ambiente faz o pareamento, não o aluno. O aprendiz não 13), o reforço é fornecido imediatamente após a resposta que atende à
precisa “associar” os dois estímulos. contingência. Por exemplo, em um esquema de reforço de razão fixa 10, cada
8. O primeiro volume doJournal of Applied Behavior Analysis(1968) é um tesouro de 10 respostas produz reforço imediato.Atraso no reforçoouatraso de reforço
estudos clássicos nos quais projetos experimentais simples e elegantes revelaram descreve o lapso de tempo entre a resposta e a entrega do reforçador após a
os poderosos efeitos do condicionamento operante e do gerenciamento de contingência ter sido satisfeita (por exemplo, o reforçador foi entregue 45
contingências. Encorajamos fortemente qualquer estudante sério de análise de segundos após cada 10ª resposta).
comportamento aplicada a lê-lo de capa a capa e a retornar a ele de vez em quando
para se inspirar.
9. Consulte https://www.kennedykrieger.org/sites/default/files/patient-care-files/
paired_stimulus_preference_assessment.pdf para obter etapas processuais detalhadas e
formulários de amostra associados para preencher uma variedade de SPAs.

Você também pode gostar