Escolar Documentos
Profissional Documentos
Cultura Documentos
Definição de comportamento operante Podemos ter a ideia de que muitos comportamentos surgirão através
da própria conscientização do indivíduo ou que reforçar seria o mesmo
que subornar/chantagear. Por exemplo, para fazer seu filho estudar,
No comportamento operante, o indivíduo modifica o ambiente devido não deve comprar presentes, mas conscientizá-lo sobre a importância
as suas respostas, que produzem consequências (alterações no do estudo para a sua vida futura. Moreira e Medeiros (2007) apontam
ambiente ou estímulos). Essas alterações, por sua vez, modificam as que essa lógica estaria errada, pois isso nada mais é do que descrever
respostas do organismo (aumento ou diminuição da frequência das uma relação: se você estudar (R) no futuro terá um bom emprego (S).
respostas). (Moreira e Medeiros 2007). As consequências estão no futuro (longo prazo) e assim o
comportamento será dificilmente mantido. Logo ele não “brota”,
Exemplo: um rato de laboratório foi colocado em uma caixa precisa ser ensinado. Para ensinar uma criança é necessário reforço
transparente com apenas uma barra a disposição que, ao ser imediato, como os arbitrários (um presente). Tais reforços tem a
pressionada, fornece um pouco de comida. O rato vai pressionar a função de manter o comportamento, assim, os reforços naturais tem
barra novamente? Não podemos afirmar com 100% de certeza que um maior probabilidade de surgir com a admiração dos colegas, boas
evento vai ocorrer, pois vários fatores podem afetar o comportamento. notas, entre outros.
Como por exemplo, o animal está privado de alimento? Se sim, a
probabilidade de pressionar a barra é alta. A ação do sujeito A partir do momento que os reforços naturais controlam o
(pressionar a barra) modificou o ambiente (aparecimento de comida comportamento, os arbitrários não serão mais necessários. Desde
ou estímulo), onde tal consequência alterou a resposta de pressionar a pequenos somos forçados a emitir certos comportamentos, como por
barra (o animal pressiona a barra mais vezes). No ambiente natural do exemplo, gostar de música: não é um processo que ocorre
animal não existe barra, assim podemos afirmar que ele aprendeu uma naturalmente, o indivíduo precisa ser reforçado para conhecer.
nova forma de obter alimento. Na próxima vez que encontrar uma
barra, a probabilidade de pressioná-la será maior (processo chamado REFORÇO INCONDICIONADO VS. REFORÇO CONDICIONADO
de condicionamento operante).
Segundo Skinner (2003), alguns tipos de recompensas são
Uma criança que pede um doce (R) e como consequência ganha o naturalmente reforçadas, sendo chamados como reforços primários ou
doce (S), em uma outra oportunidade ela provavelmente pedirá incondicionados. Tais consequências estão ligadas às variáveis
novamente, pois trata-se de um comportamento operante. A biológicas e da história evolutiva da espécie (filogênese). Por exemplo,
emissão da resposta (pedir doces) vai gerar uma consequência temos a necessidade de água para a sobrevivência, então, de tempos
(doce), que altera a probabilidade da criança pedir novamente em tempos (aumento de privação), a água se tornará um reforço sem a
(nesse caso, a probabilidade aumenta). Caso a mesma criança necessidade de aprendizagem. Outros exemplos são comida e sexo.
receba uma bronca (S), provavelmente não irá pedir o doce (R)
novamente. Nesse caso, a probabilidade da resposta de pedir o No cotidiano, a maioria dos comportamentos operantes tem
doce diminuiu. consequências de reforçadores condicionados. Não trabalhamos para
obter água, mas sim dinheiro. Com ele, podemos comprar água para
Doce → reforçamento positivo | Bronca → reforçamento negativo conseguir o reforço primário. Quando um estímulo é pareado com
outro estímulo, ele adquiriu as propriedades do mesmo, o que levaria o
A CONTINGÊNCIA DE TRÊS TERMOS dinheiro a ser um reforço condicionado/secundário (o dinheiro
adquiriu as propriedades reforçadoras da água por aprendizagem).
É a unidade básica para um analista do comportamento entender o Outros exemplos são: um carro (meio de busca para água e alimento no
seu objeto de estudo: o comportamento humano. mercado) e diploma (pareado a um emprego melhor, uma vida melhor,
mais dinheiro, alimento e proteção).
Aprendemos que o dinheiro é equivalente para conseguir outros bens,
por essa razão, pode ser chamado de reforço condicionado Extinção
generalizado, pois serve para adquirir tantos reforços incondicionados
quanto os condicionados. A extinção não é uma consequência do comportamento, mas sim a
ausência dessa consequência, caracterizada pela quebra da relação
Reforço positivo e negativo comportamental. Ou seja, é a suspensão de uma consequência
reforçadora anteriormente produzida por um comportamento.
As consequências do comportamento operante podem ser classificadas Exemplo: após 10 anos de namoro, João e Maria decidem se separar.
em dois tipos: reforço e punição (Skinner, 2003). Podemos observar que ao longo desses 10 anos, diversas relações
reforçadoras foram estabelecidas entre esse casal, por exemplo,
Reforço → aumenta a probabilidade de um determinado quando o João ligava (R), Maria atendia (S). Essa relação
comportamento voltar a ocorrer. comportamental foi mantida por reforçamento positivo ao longo de 10
Punição → diminui a probabilidade de um determinado anos. No entanto, após o término dessa relação, caso João ligue para
comportamento voltar a ocorrer. Maria, ela não irá mais atender os seus telefonemas. Inicialmente, João
irá ligar constantemente para Maria mas, com o passar do tempo, a
É errado estabelecer o que seria reforço ou punição antes de observar a frequência com que João irá ligar vai diminuindo. A queda na resposta
interação. Exemplo: uma criança que tira notas baixas (R) na escola não ocorre por quê houve uma consequência, mas sim porque não
e recebe uma bronca dos pais (S). Após a bronca a criança continua ocorreu a consequência. A relação de ligar e ser atendido por Maria foi
tendo notas baixas (R aumenta), ao contrário do esperado pelos quebrada.
pais. Temos um exemplo de reforço e não de punição. A bronca
estava associada à punição, já que os pais tinham a intenção de Extinção operante é quando o reforçamento de um comportamento
diminuir as notas baixas do filho. Contudo, depois de observar o previamente reforçado é descontinuado, como resultado a
que realmente ocorre, efetivamente a bronca funcionou como uma frequência de emissão desta classe de respostas cai no futuro.
forma da criança obter “atenção”. (Cooper et al., 2007).
Uma consequência apenas pode ser classificada como punitiva se Esquemas de reforço antes da extinção – se a resposta era reforçada
diminuir a probabilidade da resposta de acontecer (afetar o todas as vezes que ocorria (CRF) ou só algumas vezes. Quanto mais
organismo), assim diminuindo a sua frequência. Skinner e Sidman intermitente, maior a resistência à extinção.
(2003) apontam que a punição apresenta efeitos indesejáveis.
Modelagem
No senso comum definimos punição como algo desagradável, como
um castigo, ouvir um “não”, levar uma bronca, receber um tapa,
entre outros. O segundo problema reside no seguinte fato: o que é Entende-se como uma técnica usada para ensinar um
desagradável para mim não significa que será desagradável para o comportamento novo por meio de um reforço diferencial de
outro. A queda da resposta gerada pela punição vem acompanhada aproximações sucessivas do comportamento alvo. Consiste em
de respostas emocionais e da possibilidade daquele que aplica a reforçar algumas respostas que queremos (comportamento alvo) e
punição adquirir propriedades aversivas. Por essa razão, o uso da aplicar extinção nas respostas que não queremos. Para isso, é
punição não é recomendado para a prática clinica. necessário estabelecer etapas para a aprendizagem.
A análise do comportamento pode utilizar outras técnicas como Um exemplo clássico é o ensino da resposta de pressão à barra com
formas alternativas da punição: a extinção e a modelagem. um rato de laboratório, estando privado de comida: (1) reforçar
quando cheirar a barra, liberando comida (2) se o rato tocar a
barra, ele terá a resposta reforçada, mas se o rato cheirar a barra,
terá a resposta extinta (3) estabelecer outra resposta que se
aproxime do comportamento alvo (pressionar a barra), até que ele conforme a mudança de contexto (estímulos antecedentes, os pais),
se instale. podemos afirmar um comportamento operante discriminado.
O comportamento pode variar dependendo do contexto ou da situação. A explicação é simples: os dois estímulos antecedentes (100% e
Dessa forma, por exemplo, podemos observar respostas muito distintas 0%) são parecidos. Eles possuem propriedades físicas parecidas, o
de uma mesma pessoa em seu ambiente de trabalho e em sua que faz com que a mesma resposta seja evocada. Diante do estímulo
residência. “luz 50%” observamos uma frequência menor da resposta, se
comparada ao período de “luz 75”, e a frequência será menor ainda
Por que as pessoas se comportam de maneiras tão diferentes diante do estímulo “luz 25%”.
dependendo do contexto em que estiverem inseridas? Para a análise
do comportamento, devemos ter conhecimento de alguns termos CLASSE DE ESTÍMULOS
comuns: (1) estímulos antecedentes (2) discriminação (3) treino
discriminativo (4) estímulo discriminativo (5) estímulo delta. Por generalização, uma classe de estímulos (com propriedades
físicas em comum) passa a evocar uma mesma resposta (Moreira e
Os estímulos antecedentes formam o contexto (eventos ambientais) Medeiros, 2007).
antes da resposta ser emitida. A discriminação é quando o
comportamento muda diante da mudança de contexto. Exemplo: um violão não pode ter semelhanças físicas com um
piano, mas ambos podem avocar a mesma resposta – tocar
Em um experimento de laboratório, um rato será colocado em uma instrumentos. Temos uma classe de estímulos por função e não por
caixa, com mudança nos estímulos antecedentes: luz acesa e luz similaridade física.
apagada. As respostas de pressionar a barra com a luz acesa serão
reforçadas (gota de água) e as de pressionar a barra com a luz Retornando às situações iniciais, o estímulo “mãe” e “professora”
apagada não serão reforçadas. Iremos alternar, de minuto a minuto, estão evocando a mesma resposta de birra. Da mesma forma, uma
os períodos. Após certo tempo, o rato passa a pressionar a barra adolescente pode se esquivar de novos relacionamentos amorosos
com uma frequência significativamente maior no período de luz por semelhanças físicas e/ou funcionais entre o estímulo “ex-
acesa se comparado com o período de luz apagada. Logo, o rato namorado” e possíveis novos namorados.
passou por um treino discriminativo, que consiste em reforçar uma
resposta na presença de um estímulo (luz) e extingui-la diante de
outro (escuro).
Esquemas de reforçamento
O estímulo antecedente diante da resposta reforçada chama-se Segundo Moreira e Medeiros (2007), muitos comportamentos não são
de estímulo discriminativo (Sd) e o estímulo antecedente da resposta reforçados sempre que ocorrem, o que significa que não precisam ser
não reforçada irá adquirir o nome de estímulo delta (Sdelta). reforçados todas as vezes para continuarem sendo emitidos. Desse
modo, são reforçados de forma intermitente.
Uma criança que, diante do seu pai, emite a resposta de “fazer
birra” e seja reforçada positivamente com atenção e que, diante da Os esquemas de reforçamento tem a função de descrever quais são os
mãe, não seja reforçada, tenderá a fazer birra novamente apenas na critérios necessários que o organismo precisa fazer para receber o
presença do pai. Dizemos que o pai é um S d para a resposta de birra reforço. Existem duas formas de se reforçar um comportamento:
e a mãe um S delta. Como a criança se comporta de forma diferente
Reforço contínuo → toda resposta é seguida pelo reforçador. É
representado pela sigla CRF (continuous reinforcement). Exemplo: ligar Estímulos antecedentes e controle de estímulos
para a namorada e ela sempre atender.
COMPORTAMENTO REFLEXO
Reforço intermitente → nem toda resposta é seguida de reforço.
Exemplo: ligar para a operadora de telefone e após 20 tentativas ser Defini-se como uma relação entre estímulos e respostas, na qual
atendido. Outro exemplo seria jogar videogame. um estímulo elicia uma determinada resposta. Ou seja, certos
eventos ambientais antecedentes irão produzir uma
PRINCIPAIS ESQUEMAS – RAZÃO VS. INTERVALO resposta (Benvenuti, Gioia, Micheletto, Andery e Sério, 2009). Nos
comportamentos reflexos não dizemos que as respostas são
Esquemas de razão → o critério é a quantidade de respostas que o
emitidas, mas sim que são eliciadas (forçadas) a acontecer. O
organismo deve emitir. Esse esquema é dividido em fixos e variados:
estímulo produz (determina/força) uma resposta.
ESQUEMA DE TEMPO – COMPORTAMENTO SUPERSTICIOSO Em todos os exemplos acima há a prática da punição. Ela visa o
controle comportamental, mas carrega a marca da violência,
Contingência → relação causal entre o que o organismo realiza e a retaliação e hostilidade. É muito ouvido falar em formas punitivas
consequência que isso gera. como método de educação dos filhos, mas quais são os resultados?
Contiguidade → relação temporal entre os eventos, ou seja, de tempos O que eles poderiam aprender? E o mais importante: seria esse o
em tempos o evento irá ocorrer. Exemplo: chover. único método de educação? Muitos dos problemas nos quais um
psicólogo planeja e executa uma intervenção são decorrências da
Skinner (1999) em um experimento de laboratório, liberou comida prática da punição.
para um pombo independentemente do que fizesse a cada 10
segundos. Temos uma relação de contiguidade. Ocorreu um reforço “Por coerção eu me refiro a nosso uso da punição e da ameaça de
acidental. Provavelmente antes de ocorrer a liberação da comida, o punição para conseguir que os outros ajam como nós gostaríamos e à
animal estava emitindo alguma resposta (como levantar a cabeça), nossa prática de recompensar pessoas deixando-as escapar de nossas
essa sendo apresentada junto com a comida e tal padrão se punições e ameaças.” (Sidman, 2003).
manteve. Por suas características, o comportamento foi chamado
de supersticioso.
Exemplos de comportamentos coercitivos: trancar as portas da casa e O REFORÇADOR DO COMPORTAMENTO DE PUNIR
assim evitar um roubo; chefes punirem funcionários por erros no
trabalho; deixar um filho de castigo por nota baixa no boletim; um 1 – é uma resposta reforçada imediatamente;
marido chegar bêbado em casa e espancar a mulher e os filhos, etc... 2 – os estímulos punitivos não sofrem dos efeitos da saciação;
3 – é menos trabalhoso do que reforçar;
Se a coerção é a utilização da punição, podemos dizer que o responder 4 – é reforçado socialmente.
é punido após a eliminação de um reforçador positivo, ou com a
apresentação de um reforçador negativo. Como aponta Sidman (2003): 1 – É uma resposta reforçada imediatamente. Quanto mais
“Definimos punição sem apelar para qualquer efeito comportamental: imediato for a entrega, maior o fortalecimento do responder. O
punição ocorre quando qualquer ação seja seguida pela perda de efeito da punição é, no geral, imediato: essa pessoa tem o
reforçadores positivos ou com o ganho de reforçadores negativos.” comportamento alterado, e tal efeito da punição é rapidamente
observável no comportamento por quem pune. Se um
ORIGEM DA COERÇÃO comportamento ocorre várias vezes, então ele deve ser reforçado.
A interação do homem com a natureza sempre foi coercitiva. Nós 2 – Os estímulos punitivos não sofrem dos efeitos da saciação. Ao
adaptamos a coerção natural e a coerção social do mesmo modo: por contrário dos reforçadores, não há privação para os estímulos
meio de rotas de fugas. A rota mais útil seria evitar (ao invés de fugir) punitivos. Logo, a sua eficácia independe da privação. Basta
da coerção natural pela natureza. lembrar de como nunca estamos privados de broncas, notas baixas,
multas, brigas, dores, etc...
Toda espécie sofre com a coerção da natureza. Animais pode passar
por frio e fome, secas ou doença, assim como os humanos. É possível 3 – É menos trabalhoso do que reforçar. Aqui, é necessário treino
que a coerção teve início na espécie humana por meio da interação com para saber reforçar direito, pois além das pessoas não saberem
a natureza. Atualmente é fácil esquecer dos perigos naturais graças à reforçar, ainda reforçam a resposta errada. É muito mais fácil
evolução cientifica e tecnológica. Contudo, há os casos de moradores de punir: não precisamos de treino e punimos os outros com base no
ruas, que não estão imunes à coerção da natureza e passam frio e fome que funcionou conosco: “já que doeu em mim, vai doer nele”.
como qualquer outro ser humano.
4 – É reforçado socialmente. Há situações em que o reforço não
Muitos perigos naturais são inevitáveis, mesmo com todo o avanço provém apenas diretamente do controle comportamental, mas
científico. Por exemplo, ainda não encontramos um meio de escapar da também da própria sociedade. Possíveis exemplos são o terrorismo
morte. Podemos entender que a coerção natural foi reproduzida pelo e filmes de violência.
homem na sociedade que ele planejou: notas baixas, multas, broncas,
prisões, ameaças verbais e símbolos são exemplos de estímulos Para ocorrer a punição, um determinado comportamento deve
inventados pelo homem para punir outros homens. Eles não servem estar em curso, não podemos punir o “nada”.
para punir outros animais.
Exemplo de laboratório: um rato privado de água pressiona a barra
Em uma comunidade hostil, com uma educação baseada na e produz água. As medidas registradas na fase 1º (apresentação
punição, ameaças e punições seriam consideradas normais. Muitos d’água reforça a pressão da barra) serão comparadas com aquelas
acreditam que a punição é uma forma “natural” de educação. Notas obtidas na fase 2º (pressão da barra produz não apenas água, mas
baixas, ameaças de reprovação ou suspensão, são técnicas também choque). A manutenção da fase 2º é fundamental para
punitivas para o controle dos alunos em sala de aula. avaliarmos os efeitos da punição. Sem ela, não é possível avaliar se
os efeitos no responder devem-se pela retirada d’água ou da
Quem utiliza punição visa o controle comportamental. Contudo, há apresentação do choque. Além disso, com uma medida do mesmo
outra possibilidade de controle: o reforçamento positivo, que não comportamento antes (linha de base) e após (fase experimental) à
produz os frutos amargos da punição. introdução da punição, podemos ter certeza que variações na
frequência de respostas serão devido ao choque. Um esquema
É importante não confundir o reforçamento positivo com o negativo, desse estudo seria:
que seria um produto da punição. Segundo Sidman (2003), a correção
seria formada pela punição e seus efeitos colaterais que, dentro deles, Fase 1º (linha de base) → pressionar a barra (R) à água (estímulo
há o reforçamento negativo. Portanto, o controle coercitivo é uma reforçador – SR).
punição e um reforçamento negativo. Fase 2º (fase experimental) → pressionar a barra (R) à água (SR) e
choque (estímulo punitivo – SP).
Punição e seus efeitos É possível dizer que a resposta de pressionar foi suprimida? Não
necessariamente. Após o rato parar de responder, ele volta a
É importante lembrar que o comportamento de punir, quase sempre, pressionar a barra.
envolve duas pessoas que estão se comportando simultaneamente, no
mesmo episódio: a pessoa que aplica a punição (o agente punidor) e a Isso acontece porque o rato está privado de água e é a única
outra que “recebe” a punição (aquela cujo comportamento é punido). resposta do seu repertório que a produz. Os choques não eliminam
a privação, apenas reduziram a frequência da resposta que o
Quando o agente punidor aplica a punição, o que ele busca? Qual o produz. Esse é o principal problema com a punição, ela não altera o
motivo dele aplicá-la? Por que nós punimos? A principal razão do efeito reforçador do reforço (Skinner, 2003). E se o rato aprender
uso da punição é o controle comportamental. Ao aplicar a punição, outro modo de produzir água? Provavelmente, ele pararia de
o agente punidor passa a controlar e alterar o comportamento do pressionar a barra.
organismo punido.
Exemplo prático: as penas de detenção contra jovens infratore s.
Ao ver o seu filho fazendo bagunça, um pai pode repreendê-lo, Análise: roubar não produz apenas prisão (quando produz), mas
como gritando ou dando uma bronca. Provavelmente, o filho irá produz também: dinheiro, status, prestígio e outros reforçadores. O
cessar o comportamento desapropriado. Ou seja, o pai alterou o jovem rouba não para ser preso, mas porque é um dos poucos
comportamento do filho, ele passou a controlá-lo, e esse controle é modos (se não o único) dele ter acesso a tais reforçadores.
reforçador para quem está controlando – no caso, o pai – aquele Problema: como encontrar reforçadores tão potentes em seu
que aplica a punição. ambiente? O que ele pode fazer que produza os mesmos
reforçadores? Punir uma resposta que produz os reforçadores não mesmo uma pessoa que goste desse gênero de musica poderá se
ensina um jovem com produzi-las de outro modo. incomodar quando, por exemplo, ela estiver cansada ou com sono.
Nessas condições, o estímulo que a princípio possuía efeitos
O aumento das penas de prisões vai resolver o problema de crimes? reforçadores assumira funções punitivas. Desse modo, alguns
Não. Se voltarmos ao experimento, o que acontece se aumentarmos reforçadores em excesso poderão adquirir funções punitivas.
a voltagem do choque? Diminui a frequência de respostas? Não. Do Exemplo: a água é um reforçador primário mas, ao ficar dentro de
mesmo modo, aumentar as penas contra crimes não reduzirá o uma piscina cheia d’água sem saber nadar torna-a, nessas
numero de ocorrências criminosas. Isso ocorre porque muitos circunstancias, um estímulo punitivo.
criminosos não possuem outras “barras” para apertarem que
produzem os mesmos reforçadores. Os estímulos punidores são caracterizados como qualquer estimulação
excessiva, incomum, dolorosa ou perigosa a um organismo.
“Raramente invocamos justiça como uma razão para dar alguma
coisa boa para alguém que tenha se comportado bem. Alguém que Os estímulos punidores incondicionados (denominados “naturais”)
obtém “apenas sobremesa” não recebeu algo doce como um retorno seriam qualquer estimulação que ameaça a sobrevivência de uma
razoável por bom comportamento. Ao contrario, recebeu uma espécie e, portanto, são selecionados ao longo da história
punição por agir mal. Justiça passou a significar punição. O principio filogenética. São denominados desse modo porque seus efeitos
“a justiça prevalecerá”, nos faz sentir seguros já que sabemos que a sobre o comportamento não dependem de qualquer circunstância.
punição será aplicada a outros que se comportam mal. Na medida Alguns exemplos seriam: vírus, fogo, enchentes, terremotos, e tc...
em que o principio é aplicado a nós, ele é uma ameaça.” (Sidman,
2003). Os estímulos punidores condicionados são assim denominados
porque as suas funções punitivas dependem de certas
Tais circunstâncias podem parecer que ocorrem apenas em alguns circunstancias: a princípio, não eram punitivos. Devido ao
casos mais extremos. Muitas pessoas trabalham porque precisam. pareamento com algum outro estímulo punitivo (incondicionado ou
Ao apertarem a barra (trabalhar), elas produzem não apenas o condicionado), eles acabam adquirindo tais funções. Exemplos:
sustento, mas também choques. Muitos são aqueles que não gostam notas baixas, multas de transito, a palavra “não”.
do que trabalham (levam choques constantemente). Assim, eles
continuam a trabalhar porque não possuem outras alternativas. Situação: um rato de laboratório, na presença de luz, ao pressionar
a barra produz água. Esse mesmo rato, em uma segunda condição
Exemplo 2: após a fase inicial onde a pressão da barra é (ausência de luz), ao pressionar a barra, produz água mais choque.
sequenciada com água e choque, há a suspensão de ambos os
estímulos. O rato deverá parar de responder. Logo, reintroduzimos Condição 1 → luz (estímulo discriminativo/ Sd) – pressão à barra (R),
apenas o choque, caso observarmos um aumento na frequência da água (estímulo reforçador/ SR)
pressão da barra (R). O choque adquiriu funções reforçadoras ao
ser pareado com água (reforçador primário). Desse modo, um Condição 2 → ausência de luz (estímulo punidor condicionado, SPC) –
esquema do experimento seria: pressão à barra (R), água (estímulo reforçador, SR) e choque (estímulo
punidor, SP).
Fase 1º → pressão da barra (R) à água (SR) e choque (SP)
Em seguida, suspende-se a apresentação de água e choque até o rato Nessa situação, a ausência de luz adquiriu funções punitivas devido ao
parar de responder. pareamento com o choque. Quando a luz da caixa é ligada, o rato
Fase 2 → pressão da barra (R) à choque (SR) provavelmente pressionará a barra com frequência. Mas, quando a luz
é desligada, ele quase não pressiona a barra. Poderíamos dizer que a
Exemplo prático: os rituais de auto-flagelação em rituais religiosos luz desligada sinaliza ao rato que a punição está próxima se ele
são uma decorrência da aprendizagem que a “dor deve levar ao pressionar a barra.
amor”. Muitas pessoas aprendem, desde a infância, que o amor e
prazer devem ser consequência da dor. Não podemos culpá-las, a Exemplo prático: pais que frequentemente castigam seus filhos. Um
sociedade não lhes ensinou outros modos de produzir prazer. pai que bate no filho visando respeito não produzirá isso, mas sim
medo e afastamento da criança, pois a presença do pai foi pareado
com o castigo. O pai, agora, é um punidor condicionado pa ra a
Punidores condicionados e incondicionados criança. Ele não apenas sinaliza punição, mas a sua mera presença
também é um estímulo punidor condicionado. Pais que agem dessa
forma confundem respeito com punição, porque foram cria dos
Trecho do livro “coerção e suas implicações” de Murray Sidman
(2003): assim (e acabam por perpetuar essa criação, pois seus filhos
criarão seus netos da mesma maneira). O princípio é: “funcionou
“Exceto sob condições extraordinárias, confidentemente esperamos que comigo, funcionará nele”. Mas será que funcionou mesmo? Filhos
qualquer estimulação excessiva, incomum, dolorosa ou perigosa sirva geralmente aprendem que a casa dos avós é um lugar na qual eles
como punidor. Estes são os punidores naturais. Sua habilidade para podem fazer de tudo, porque a pessoa que pune (o punidor
parar comportamento em curso usualmente não depende de qualquer condicionado) não está presente. No caso, os pais.
outra circunstância.
Outro exemplo de punidor condicionado: um carro de polícia. Se você
Eventos que são usualmente neutros podem tornar-se punidores. A
estiver fazendo algo que levante suspeitas, não o fará na presença da
palavra “Não”, tão temida por muitas crianças e mesmo por adultos, é
policia. Quem já apanhou da policia não sente medo apenas do policial
apenas um conjunto complexo de sons que não tem poder em si de
que bateu, mas de vários estímulos no ambiente que foram pareados
controlar comportamento (...) De que fontes o “0”, simplesmente um
com o policial., um exemplo seria a viatura.
padrão de linhas sobre o papel, deriva sua extraordinária habilidade de
punir estudantes?
O segundo efeito da punição é a ocorrência de respostas emocionais da
Estes são chamados “punidores condicionados”, porque a sua habilidade
pessoa punida. Elas ocorrem imediatamente após a punição. Exemplos
para nos fazer parar de fazer algo é condicional a outras circunstancias.”
disso são: o choro, a pessoa ficar ruborizada e tremores. Essas
respostas são evocadas pela própria estimulação punitiva e afetam a
Existem estímulos “naturalmente” punidores, ou seja, aqueles
selecionados como punidor a partir da história de vida do tendência do organismo de se comportar (Skinner, 2003). Uma pessoa
organismo e da situação na qual ele é apresentado. Exemplo: em crise de choro, por exemplo, tende a se comportar em uma direção
música sertaneja tocada alta. A depender das circunstancias, oposta a aquela pessoa que passa por uma crise de raiva.
CONTINGÊNCIA DE PUNIÇÃO E REFORÇAMENTO NEGATIVO DA funcionando de maneiras diferentes. Podemos fazer choques
RESPOSTA DE MENTIR desaparecerem (reforçamento negativo); ou podemos tomar choques
(punição)... Assim, punição, alem do seu efeito habitual (reduzir a
(1) Uma criança comendo sobremesa antes do almoço (R) → (2) mãe conduta indesejável) também aumenta a probabilidade de outro
pune esse comportamento deixando a criança de castigo (SP) → (3) o comportamento: se possível, aquele que recebe punição irá desligá-la ou
filho mente para a mãe que não comerá mais (R) → (4) eliminação do fugir.” (Sidman, 2003).
castigo (SR-).
A fuga é uma resposta adaptativa à punição. Exemplo: a pessoa que
Atenção: um estímulo é punidor para qualquer resposta que antecede a rouba ao passar fome ou mata ao ser vítima de alguma violência.
sua apresentação e um reforçador negativo para qualquer resposta que Ambas as respostas são mantidas por reforçamento negativo: o roubo
a elimine. diminui a fome e o assassinato elimina o violentador. Ambas são
respostas de fuga mantidas pela utilização da coerção.
A resposta de mentir da criança é reforçada negativamente pela
retirada do castigo. É nesse momento que o estímulo punidor (SP) REFORÇADORES NEGATIVOS CONDICIONADOS
torna-se um reforçador negativo (SR-): quando aprendemos a escapar
(ou interromper) a punição imposta. Do mesmo modo que a punição cria punidores condicionados, o uso de
reforçamento negativo também cria reforçadores negativos
A ocorrência dessas respostas, que são reforçadas negativamente e são condicionados.
uma consequência direta da coerção (como a resposta de mentir do
filho para a mãe), seriam o terceiro efeito colateral da punição Todo estímulo pareado com um reforçador negativo também assume
(Skinner, 2003). Na análise do comportamento, chamamos essas funções reforçadoras. Assim, ao acompanhar o reforçador negativo, um
respostas de fuga e esquiva. estímulo originalmente neutro pode adquirir as mesmas funções. No
exemplo do laboratório, as pressões da barra são mantidas pela
eliminação da luz. Nesse caso, a luz é reforçador negativo
Fuga e esquiva condicionado.
Fuga e esquiva são consequências diretas da utilização de punição Possível outro exemplo: um aluno que foge da aula do professor X. A
no controle comportamental. Ambas são mantidas pelo princípio, o estímulo punitivo poderá ser o comportamento desse
reforçamento negativo. professor. Com o tempo, outros estímulos no ambiente também
adquirem funções reforçadores negativas, como a sala, o colega, ou até
DEFINIÇÃO DE FUGA a própria matéria ministrada pelo professor. Inicialmente, o aluno fugia
apenas da presença do professor, mas agora ele foge da série de
Fuga é toda resposta reforçada pela eliminação, diminuição, estímulos que foram pareados com ele.
interrupção, remoção ou retirada de um estímulo do ambiente. Tal
estímulo seria um reforçador negativo, pois a sua presença pune o Aprendemos via fuga, mas a aprendizagem é sempre menor quando
comportamento. Desse modo, respostas que enfraquecem seus efeitos comparado com a aprendizagem via reforçamento positivo. Isso
punitivos são reforçadas negativamente. acontece porque somos controlados via reforçamento negativo,
estamos sempre preocupados em eliminar ou evitar o pior.
Imagine um rato na caixa de Skinner. Nós apresentamos um choque ao
rato. Agora, ao pressionar a barra que encontra-se na parede da caixa, o No reforçamento positivo, há a preocupação em melhorar o que
rato interrompe o choque (reforçamento negativo). Após um período, o fazemos. Se o rato na caixa de Skinner recebesse um choque
choque é apresentado novamente ao rato e uma nova pressão à barra é imprevisível, dificilmente sairia de perto da barra. Um problema da
necessária para interrompê-lo. Ao eliminar o choque da caixa, a educação: os alunos, ao longo do tempo como estudantes, não estão
resposta de pressão da barra é reforçada negativamente. preocupados em melhorar o desempenho, mas apenas em não levar
choques (broncas de professores, situações vexaminosas em sala,
A vida diária é lotada de exemplos de fuga: ao receber uma multa, o notas baixas, chegar atrasado).
pagamento (R de fuga) produz a eliminação dela. Deixar o filho de
castigo quando, ao invés de estudar, ele joga vídeo game. O castigo DEFINIÇÃO DE ESQUIVA
pune a resposta de jogar e a suspensão do castigo ocorre quando ele
estuda (R de fuga). O estudar é reforçado pela suspensão do castigo. Esquiva é todo comportamento mantido por reforçamento negativo
que evita (adia) a apresentação de um estímulo punitivo.
No exemplo anterior do laboratório, o choque recebido pelo rato pune
qualquer resposta emitida imediatamente antes da sua apresentação. Existe o famoso ditado “é melhor prevenir do que remediar”. Também
Outro exemplo: muitos fumantes, quando ficam ansiosos, acendem um há momentos em que pensamos “eu poderia evitar essa situação” ou
cigarro e reduzem a ansiedade. “seria melhor se eu não viesse”. Tanto o ditado como os pensamentos
são decorrências de esquivas. Para um analista do comportamento, o
Todo reforçador negativo é um estímulo punidor que aprendemos a ditado poderia ser dito como “é melhor emitirmos esquivas do que
nos livrar. Todo estímulo punidor pune o comportamento que está fugas”, porque é melhor prevenir a apresentação de um estímulo
ocorrendo imediatamente antes. Exemplo: se uma pessoa não estudar punitivo do que remediar a situação e eliminá-lo: a prevenção seria
para uma prova, a nota baixa que ela tira punirá sua falta de estudo. uma esquiva.
Isso está incorreto. Na verdade, pune o que a pessoa fez ao invés de
estudar (como uma ida ao cinema ou namorar). Em uma próxima A esquiva é uma fuga elaborada, um comportamento mais adaptativo
oportunidade, é mais provável a pessoa estudar do que fazer alguma do que a fuga. É, provavelmente, o comportamento mais emitido ao
outra coisa. longo do cotidiano, ao tentar evitar um problema.
“Reforçamento negativo gera fuga. Quando encontramos um reforçador “Esquiva é geralmente um ajustamento mais adaptativo a punição do
negativo, fazemos de tudo que podemos para o desligarmos, para que a fuga. Faz mais sentido impedir um choque do que escapar depois
escapar dele. Se o encontrarmos novamente, faremos o que funcionou que ele tenha começado.” (Sidman, 2003).
antes. Reforçadores negativos também podem ser usados como
Outros exemplos: fingir dor de cabeça (R) e não ir até a casa da sogra
punidores. Uma maneira de punir pessoas é atingi-las com reforçadores
(adiar a apresentação de um estímulo punitivo); encher o tanque do
negativos como uma consequência de algo que tenham feito.
Reforçadores negativos e punidores, portanto, são os mesmos eventos carro (R) e evitar ficar parado com o carro na rua; trabalhar e evitar
desemprego; se informar sobre o trânsito e evitar congestionamentos;
não andar por certos lugares à noite e evitar ser assaltado. Um bom
outro exemplo de esquiva é a do aluno que foge da aula: ele entra na
sala apenas para responder chamada, ou assim que responde, sai. Até
aqui, é comportamento de fuga. Mas, com o passar do tempo, ele
descobre que é mais efetivo não vir para a aula: esquiva.
Outro exemplo: o filho que apanhou na escola e não quer mais ir. O pai
geralmente castiga o filho, porque acha que ele está com “preguiça” ou
não quer “obedecer”. Como o filho não conta para o pai que apanha dos
colegas (bullying), ele pensa que o problema é a falta “de caráter” ou de
“responsabilidade”. O pai não vê do que o filho está se esquivando.