Você está na página 1de 8

Análise do comportamento – processos básicos

Sd → estímulo discriminativo ou antecedente; representa a ocasião ou


o contexto em que o comportamento ocorre;
O que é comportamento? R → resposta do organismo;
S → consequência da ação do organismo no ambiente ou estímulos (do
Na psicologia, precisamos utilizar conceitos científicos para analisar inglês stimulus).
um comportamento. A definição de comportamento, segundo Skinner
(2003), é a seguinte: comportamento é uma interação (relação) entre o O reforço aumenta a probabilidade de um determinado
organismo e o meio ambiente. comportamento voltar a ocorrer, já a punição é um tipo de
consequência do comportamento que diminui a probabilidade dessa
Organismo é qualquer ser vivo que será objeto de análise. resposta ocorrer.
Ambiente é tudo ao redor desse organismo, incluindo outros seres
vivos e objetos físicos que fazem parte dele. Reforço natural vs. reforço arbitrário –
Ao analisar um comportamento, devemos primeiro estabelecer o
comportamento de quem (organismo) devemos analisar. Assim, deve- reforço condicionado
se observar as ações do organismo, chamadas de respostas (exemplos:
correr, comer, pensar, falar, estudar, entre outros). O ambiente, por sua
Segundo Moreira e Medeiros (2007), o reforço natural ocorre quando o
vez, vai prover a esse organismo estímulos, sendo considerado como
reforço é produto direto do próprio comportamento. Quando esse
qualquer mudança ambiental (exemplos: som, cheiro, imagem, gosto,
comportamento é produto indireto do próprio comportamento, chama-
entre outros). Desse modo, trabalhar em uma grande empresa para
se de reforço arbitrário.
obter salário é um exemplo de comportamento.
Exemplo: uma criança que aprende a tocar piano, inicialmente é
Em psicologia, focaremos no comportamento dos seres humanos.
influenciada pela mãe, que apresentará algum reforço para que ela
Podemos entender o pensamento como um comportamento que,
continue a tocar, como atenção (reforço arbitrário). À medida que ela
apesar de não poder ser visto, pode ser relatado, logo poderá ser objeto
aprende a tocar, está sendo reforçada pelo próprio som produzido e a
de análise.
melhora significativa desse som (reforço natural).

Definição de comportamento operante Podemos ter a ideia de que muitos comportamentos surgirão através
da própria conscientização do indivíduo ou que reforçar seria o mesmo
que subornar/chantagear. Por exemplo, para fazer seu filho estudar,
No comportamento operante, o indivíduo modifica o ambiente devido não deve comprar presentes, mas conscientizá-lo sobre a importância
as suas respostas, que produzem consequências (alterações no do estudo para a sua vida futura. Moreira e Medeiros (2007) apontam
ambiente ou estímulos). Essas alterações, por sua vez, modificam as que essa lógica estaria errada, pois isso nada mais é do que descrever
respostas do organismo (aumento ou diminuição da frequência das uma relação: se você estudar (R) no futuro terá um bom emprego (S).
respostas). (Moreira e Medeiros 2007). As consequências estão no futuro (longo prazo) e assim o
comportamento será dificilmente mantido. Logo ele não “brota”,
Exemplo: um rato de laboratório foi colocado em uma caixa precisa ser ensinado. Para ensinar uma criança é necessário reforço
transparente com apenas uma barra a disposição que, ao ser imediato, como os arbitrários (um presente). Tais reforços tem a
pressionada, fornece um pouco de comida. O rato vai pressionar a função de manter o comportamento, assim, os reforços naturais tem
barra novamente? Não podemos afirmar com 100% de certeza que um maior probabilidade de surgir com a admiração dos colegas, boas
evento vai ocorrer, pois vários fatores podem afetar o comportamento. notas, entre outros.
Como por exemplo, o animal está privado de alimento? Se sim, a
probabilidade de pressionar a barra é alta. A ação do sujeito A partir do momento que os reforços naturais controlam o
(pressionar a barra) modificou o ambiente (aparecimento de comida comportamento, os arbitrários não serão mais necessários. Desde
ou estímulo), onde tal consequência alterou a resposta de pressionar a pequenos somos forçados a emitir certos comportamentos, como por
barra (o animal pressiona a barra mais vezes). No ambiente natural do exemplo, gostar de música: não é um processo que ocorre
animal não existe barra, assim podemos afirmar que ele aprendeu uma naturalmente, o indivíduo precisa ser reforçado para conhecer.
nova forma de obter alimento. Na próxima vez que encontrar uma
barra, a probabilidade de pressioná-la será maior (processo chamado REFORÇO INCONDICIONADO VS. REFORÇO CONDICIONADO
de condicionamento operante).
Segundo Skinner (2003), alguns tipos de recompensas são
Uma criança que pede um doce (R) e como consequência ganha o naturalmente reforçadas, sendo chamados como reforços primários ou
doce (S), em uma outra oportunidade ela provavelmente pedirá incondicionados. Tais consequências estão ligadas às variáveis
novamente, pois trata-se de um comportamento operante. A biológicas e da história evolutiva da espécie (filogênese). Por exemplo,
emissão da resposta (pedir doces) vai gerar uma consequência temos a necessidade de água para a sobrevivência, então, de tempos
(doce), que altera a probabilidade da criança pedir novamente em tempos (aumento de privação), a água se tornará um reforço sem a
(nesse caso, a probabilidade aumenta). Caso a mesma criança necessidade de aprendizagem. Outros exemplos são comida e sexo.
receba uma bronca (S), provavelmente não irá pedir o doce (R)
novamente. Nesse caso, a probabilidade da resposta de pedir o No cotidiano, a maioria dos comportamentos operantes tem
doce diminuiu. consequências de reforçadores condicionados. Não trabalhamos para
obter água, mas sim dinheiro. Com ele, podemos comprar água para
Doce → reforçamento positivo | Bronca → reforçamento negativo conseguir o reforço primário. Quando um estímulo é pareado com
outro estímulo, ele adquiriu as propriedades do mesmo, o que levaria o
A CONTINGÊNCIA DE TRÊS TERMOS dinheiro a ser um reforço condicionado/secundário (o dinheiro
adquiriu as propriedades reforçadoras da água por aprendizagem).
É a unidade básica para um analista do comportamento entender o Outros exemplos são: um carro (meio de busca para água e alimento no
seu objeto de estudo: o comportamento humano. mercado) e diploma (pareado a um emprego melhor, uma vida melhor,
mais dinheiro, alimento e proteção).
Aprendemos que o dinheiro é equivalente para conseguir outros bens,
por essa razão, pode ser chamado de reforço condicionado Extinção
generalizado, pois serve para adquirir tantos reforços incondicionados
quanto os condicionados. A extinção não é uma consequência do comportamento, mas sim a
ausência dessa consequência, caracterizada pela quebra da relação
Reforço positivo e negativo comportamental. Ou seja, é a suspensão de uma consequência
reforçadora anteriormente produzida por um comportamento.

As consequências do comportamento operante podem ser classificadas Exemplo: após 10 anos de namoro, João e Maria decidem se separar.
em dois tipos: reforço e punição (Skinner, 2003). Podemos observar que ao longo desses 10 anos, diversas relações
reforçadoras foram estabelecidas entre esse casal, por exemplo,
Reforço → aumenta a probabilidade de um determinado quando o João ligava (R), Maria atendia (S). Essa relação
comportamento voltar a ocorrer. comportamental foi mantida por reforçamento positivo ao longo de 10
Punição → diminui a probabilidade de um determinado anos. No entanto, após o término dessa relação, caso João ligue para
comportamento voltar a ocorrer. Maria, ela não irá mais atender os seus telefonemas. Inicialmente, João
irá ligar constantemente para Maria mas, com o passar do tempo, a
É errado estabelecer o que seria reforço ou punição antes de observar a frequência com que João irá ligar vai diminuindo. A queda na resposta
interação. Exemplo: uma criança que tira notas baixas (R) na escola não ocorre por quê houve uma consequência, mas sim porque não
e recebe uma bronca dos pais (S). Após a bronca a criança continua ocorreu a consequência. A relação de ligar e ser atendido por Maria foi
tendo notas baixas (R aumenta), ao contrário do esperado pelos quebrada.
pais. Temos um exemplo de reforço e não de punição. A bronca
estava associada à punição, já que os pais tinham a intenção de Extinção operante é quando o reforçamento de um comportamento
diminuir as notas baixas do filho. Contudo, depois de observar o previamente reforçado é descontinuado, como resultado a
que realmente ocorre, efetivamente a bronca funcionou como uma frequência de emissão desta classe de respostas cai no futuro.
forma da criança obter “atenção”. (Cooper et al., 2007).

REFORÇAMENTO POSITIVO E NEGATIVO Burst de extinção – gera um aumento na frequência da resposta no


início, começa a ocorrer muito mais de imediato e com mais
Positivo → consequência do comportamento que aumenta (+) a sua intensidade, apenas depois que reduz a frequência.
frequência pelo acréscimo do estímulo no ambiente.
Na extinção ocorre o aumento da variabilidade da topografia da
Exemplo: eu trabalho (R) e a consequência é meu salário (S). O resposta, ou seja, a resposta começa a variar o seu padrão, a sua “cara”.
salário não estava presente no ambiente, foi a emissão da minha
resposta (trabalhar) que gerou a consequência no ambiente A extinção também gera efeitos colaterais, como a eliciação de
(salário). A probabilidade de eu continuar trabalhando (R) para respostas emocionais, como agressividade, ansiedade, frustração,
conseguir o salário (S) aumenta. Então temos um reforço, e esse entre outros (Moreira e Medeiros, 2007).
estímulo apenas aparece (+) quando eu emito a resposta.
Resistência à extinção – consiste no responder continuado mesmo após
Negativo → consequência do comportamento que aumenta a sua a quebra da relação, ou seja, a resposta continua a ocorrer mesmo não
frequência pela retirada (-) de um estímulo aversivo no ambiente. produzindo mais reforço. Isso se deve pelas características do
comportamento e da história individual do organismo (ontogênese).
Exemplo: eu trabalho (R) e a consequência é evitar a bronca do meu
chefe (S). O chefe estava presente no ambiente, ele é um estímulo TRÊS PRINCIPAIS FATORES QUE INFLUENCIAM A RESISTÊNCIA À
aversivo. Foi à emissão da minha resposta (trabalhar) que gerou a EXTINÇÃO
consequência no ambiente (retirada do chefe/evitar a bronca). A
probabilidade de continuar trabalhando (R) para evitar que meu chefe Número de exposições a contingência – o quanto que essa resposta era
me dê bronca (S) aumenta. Então temos um reforço, e esse estímulo reforçada. Quanto mais antigo e frequente, maior a resistência à
apenas desaparece (-) quando eu emito a resposta. extinção.

Custo da resposta – o quão trabalhoso é emitir a resposta. Se for algo


Punição mais custoso, menor é a resistência à extinção.

Uma consequência apenas pode ser classificada como punitiva se Esquemas de reforço antes da extinção – se a resposta era reforçada
diminuir a probabilidade da resposta de acontecer (afetar o todas as vezes que ocorria (CRF) ou só algumas vezes. Quanto mais
organismo), assim diminuindo a sua frequência. Skinner e Sidman intermitente, maior a resistência à extinção.
(2003) apontam que a punição apresenta efeitos indesejáveis.
Modelagem
No senso comum definimos punição como algo desagradável, como
um castigo, ouvir um “não”, levar uma bronca, receber um tapa,
entre outros. O segundo problema reside no seguinte fato: o que é Entende-se como uma técnica usada para ensinar um
desagradável para mim não significa que será desagradável para o comportamento novo por meio de um reforço diferencial de
outro. A queda da resposta gerada pela punição vem acompanhada aproximações sucessivas do comportamento alvo. Consiste em
de respostas emocionais e da possibilidade daquele que aplica a reforçar algumas respostas que queremos (comportamento alvo) e
punição adquirir propriedades aversivas. Por essa razão, o uso da aplicar extinção nas respostas que não queremos. Para isso, é
punição não é recomendado para a prática clinica. necessário estabelecer etapas para a aprendizagem.

A análise do comportamento pode utilizar outras técnicas como Um exemplo clássico é o ensino da resposta de pressão à barra com
formas alternativas da punição: a extinção e a modelagem. um rato de laboratório, estando privado de comida: (1) reforçar
quando cheirar a barra, liberando comida (2) se o rato tocar a
barra, ele terá a resposta reforçada, mas se o rato cheirar a barra,
terá a resposta extinta (3) estabelecer outra resposta que se
aproxime do comportamento alvo (pressionar a barra), até que ele conforme a mudança de contexto (estímulos antecedentes, os pais),
se instale. podemos afirmar um comportamento operante discriminado.

Segundo exemplo: uma mulher de 26 anos que faz parto à uma


criança do sexo masculino, prematuro, com baixo peso e problemas Generalização
respiratórios, que foi encaminhado para a UTI – Neonatal. A mãe se
recusava a ver e a tocar a criança. A psicóloga que atuava nesta UTI Boa parte daquilo que fazemos no presente é resultado de uma
elaborou um programa de atendimento que visava estimular a longa história de reforçamento pela qual passamos no decorrer de
interação dessa mãe com o seu bebê. O objetivo dessa intervenção nossas vidas. Repetimos comportamentos porque, em algum
foi de utilizar aproximações sucessivas da mãe com o bebê e, num momento, eles produziram consequências reforçadoras para nós.
primeiro momento, estimular o que fosse menos aversivo para se No entanto, como vamos explicar o comportamento de “fazer birra”
chegar ao comportamento alvo, ou seja, pegar o bebê no colo e de uma criança diante da professora, se ela nunca reforçou esta
acariciá-lo. resposta? Como explicar para uma adolescente que resiste em
iniciar um novo namoro, pois passou por uma experiência punitiva
É uma técnica de ensino e mudança de comportamento, muito utilizada com seu ex-namorado?
na clínica comportamental e na psicologia do esporte. Porém, para
funcionar, algumas dicas precisam ser seguidas: Voltando ao experimento com o rato de laboratório, poderemos ver
se houve generalização com o próximo passo, em que colocamos o
1) O reforço está ligado ao aumento da resposta que gera a rato (devidamente treinado) em uma nova situação. A cada um
consequência. É um erro estabelecer o que é um reforço para um minuto, a intensidade de iluminação da caixa irá mudar
organismo, antes de testar a efetividade deste; aleatoriamente entre cinco intensidades: 100%, 75%, 50%, 25% e
0%.
2) O reforço precisa ser imediato. Quando um organismo emite uma
resposta, o reforço precisa ser contingente. Quando mais imediato, Diante da intensidade 0% o rato praticamente não emite resposta,
maior será a chance de ocorrer novamente; o que era esperado, pois foi colocada em extinção nessa situação.
Diante da intensidade 100% observamos a maior frequência de
3) Ter flexibilidade nas respostas que serão reforçadas
respostas, onde nessa condição o rato foi sistematicamente
sistematicamente. Cada organismo tem seu próprio ritmo de
reforçado a pressionar a barra.
aprendizagem, portanto, a quantidade de etapas é relativa. É
importante observar o comportamento do organismo para estabelecer
E diante da intensidade 75%? O rato pressiona a barra com
quais respostas serão reforçadas e outras extintas. frequência considerável, inferior à intensidade 100%, mas superior
à intensidade 0%. Ele nunca havia sido treinado a responder desse
Discriminação modo nessa condição, mas observamos que o estímulo “luz 75%”
também emite a resposta.

O comportamento pode variar dependendo do contexto ou da situação. A explicação é simples: os dois estímulos antecedentes (100% e
Dessa forma, por exemplo, podemos observar respostas muito distintas 0%) são parecidos. Eles possuem propriedades físicas parecidas, o
de uma mesma pessoa em seu ambiente de trabalho e em sua que faz com que a mesma resposta seja evocada. Diante do estímulo
residência. “luz 50%” observamos uma frequência menor da resposta, se
comparada ao período de “luz 75”, e a frequência será menor ainda
Por que as pessoas se comportam de maneiras tão diferentes diante do estímulo “luz 25%”.
dependendo do contexto em que estiverem inseridas? Para a análise
do comportamento, devemos ter conhecimento de alguns termos CLASSE DE ESTÍMULOS
comuns: (1) estímulos antecedentes (2) discriminação (3) treino
discriminativo (4) estímulo discriminativo (5) estímulo delta. Por generalização, uma classe de estímulos (com propriedades
físicas em comum) passa a evocar uma mesma resposta (Moreira e
Os estímulos antecedentes formam o contexto (eventos ambientais) Medeiros, 2007).
antes da resposta ser emitida. A discriminação é quando o
comportamento muda diante da mudança de contexto. Exemplo: um violão não pode ter semelhanças físicas com um
piano, mas ambos podem avocar a mesma resposta – tocar
Em um experimento de laboratório, um rato será colocado em uma instrumentos. Temos uma classe de estímulos por função e não por
caixa, com mudança nos estímulos antecedentes: luz acesa e luz similaridade física.
apagada. As respostas de pressionar a barra com a luz acesa serão
reforçadas (gota de água) e as de pressionar a barra com a luz Retornando às situações iniciais, o estímulo “mãe” e “professora”
apagada não serão reforçadas. Iremos alternar, de minuto a minuto, estão evocando a mesma resposta de birra. Da mesma forma, uma
os períodos. Após certo tempo, o rato passa a pressionar a barra adolescente pode se esquivar de novos relacionamentos amorosos
com uma frequência significativamente maior no período de luz por semelhanças físicas e/ou funcionais entre o estímulo “ex-
acesa se comparado com o período de luz apagada. Logo, o rato namorado” e possíveis novos namorados.
passou por um treino discriminativo, que consiste em reforçar uma
resposta na presença de um estímulo (luz) e extingui-la diante de
outro (escuro).
Esquemas de reforçamento
O estímulo antecedente diante da resposta reforçada chama-se Segundo Moreira e Medeiros (2007), muitos comportamentos não são
de estímulo discriminativo (Sd) e o estímulo antecedente da resposta reforçados sempre que ocorrem, o que significa que não precisam ser
não reforçada irá adquirir o nome de estímulo delta (Sdelta). reforçados todas as vezes para continuarem sendo emitidos. Desse
modo, são reforçados de forma intermitente.
Uma criança que, diante do seu pai, emite a resposta de “fazer
birra” e seja reforçada positivamente com atenção e que, diante da Os esquemas de reforçamento tem a função de descrever quais são os
mãe, não seja reforçada, tenderá a fazer birra novamente apenas na critérios necessários que o organismo precisa fazer para receber o
presença do pai. Dizemos que o pai é um S d para a resposta de birra reforço. Existem duas formas de se reforçar um comportamento:
e a mãe um S delta. Como a criança se comporta de forma diferente
Reforço contínuo → toda resposta é seguida pelo reforçador. É
representado pela sigla CRF (continuous reinforcement). Exemplo: ligar Estímulos antecedentes e controle de estímulos
para a namorada e ela sempre atender.
COMPORTAMENTO REFLEXO
Reforço intermitente → nem toda resposta é seguida de reforço.
Exemplo: ligar para a operadora de telefone e após 20 tentativas ser Defini-se como uma relação entre estímulos e respostas, na qual
atendido. Outro exemplo seria jogar videogame. um estímulo elicia uma determinada resposta. Ou seja, certos
eventos ambientais antecedentes irão produzir uma
PRINCIPAIS ESQUEMAS – RAZÃO VS. INTERVALO resposta (Benvenuti, Gioia, Micheletto, Andery e Sério, 2009). Nos
comportamentos reflexos não dizemos que as respostas são
Esquemas de razão → o critério é a quantidade de respostas que o
emitidas, mas sim que são eliciadas (forçadas) a acontecer. O
organismo deve emitir. Esse esquema é dividido em fixos e variados:
estímulo produz (determina/força) uma resposta.

Razão fixa → o número de respostas emitidas para receber o reforço é


Essa relação fidedigna entre um evento ambiental, um estímulo e
sempre o mesmo, representado pela sigla RF (fixed ratio). Exemplo:
uma mudança resultante no comportamento, uma resposta, tem
Maria vende um pacote de suspiro com 20 unidades, custando 5 reais
sido denominada de reflexo (Catania, 1999).
cada. Então, a cada 20 respostas (suspiros) há um reforço (dinheiro).
Dizemos que a resposta foi “eliciada” justamente porque existe uma
Razão variada → o número de respostas emitidas para receber o
relação de fidedignidade entre os dois, seguramente na apresentação
reforço varia a cada momento, representado pela sigla VR (variable
do estímulo teremos uma dada resposta, 100% de probabilidade
ratio). Exemplo: Maria é diarista e ganha 100 reais (reforço) por
(Benvenuti, et al., 2009).
cada casa, onde cada casa possui seu próprio tamanho e quantidade
de cômodos diferentes (R). Para obter o mesmo reforço, cada casa AS DIFERENTES FUNÇÕES DOS ESTÍMULOS ANTECEDENTES
exige um número diferente de respostas.
Os estímulos antecedentes podem ter diferentes funções sobre as
Esquemas de intervalo → o critério para reforçamento é a respostas de um indivíduo. Nos comportamentos operantes, eles
passagem de tempo. Também é dividido em fixos e variados: podem evocar/emitir ou não determinadas respostas. Esses termos
indicam uma probabilidade, ao contrário do termo “eliciar”, que indica
Intervalo fixo → a passagem de tempo entre um reforço e outro é
que o estímulo irá forçar uma resposta a ocorrer. A presença destes
sempre o mesmo, representado pela sigla FI (fixed interval).
estímulos antecedentes fornece o contexto para certas respostas
Exemplo: Maria é vendedora e ganha 50 reais (reforço)
ocorrerem ou não.
diariamente, precisando comparecer no trabalho (R). Se vender
mais ou menos, ganha a mesma quantidade. A quantidade de
respostas emitidas (vender) não interfere na quantidade de Coerção, controle e punição
reforços recebida por ela. Assim, basta esperar o tempo passar para
receber o reforço.
O mundo é coercitivo: nós lidamos com os produtos da coerção
Intervalo variado → a passagem de tempo entre um reforço varia constantemente no cotidiano. Hostilidade, violência e punição são
a todo o momento, representado pela sigla VI (variable interval). apenas alguns aspectos que caracterizam a coerção.
Exemplo: Maria trabalha como autônoma. O trabalho está
disponível de tempos em tempos, portanto, o reforço estará Há pessoas hostis que são difíceis de manter um diálogo, violentas com
disponível desde que ela trabalhe. O reforço pode demorar horas seus vizinhos ou infortunados próximos, que procuram resolver seus
ou segundos. problemas promovendo chantagens e ameaças, que não medem
palavras ou ações ao ferirem os outros.
Dependendo do esquema de reforçamento, o sujeito vai emitir ma is
ou menos respostas. São notórios os casos de professores que estão preocupados mais com
métodos de disciplinamento e castigo dos seus alunos do que com
Razão → quanto maior o número de respostas emitidas, maior será métodos pedagógicos voltados a aprimorar o seu desempenho e
o numero de reforços recebidos. disciplina em sala de aula.
Intervalo fixo → emitir respostas a mais não irá influenciar na
quantidade de reforços emitidos, o importante seria esperar. No trabalho, existem chefes que, ao invés de conversarem ou
fomentarem diálogos, tratam qualquer desobediência às suas
Uma moça separada do seu ex-namorado liga constantemente (R) e orientações com xingos e desligamentos.
ele às vezes atende (reforço) – esquema VI. O rapaz reforça o
comportamento dela em VI, fazendo com que ela nunca pare de E nós mesmos, em muitos momentos, somos assim: violentos,
emitir respostas, pois não sabe quando vai ocorrer o reforço. hostis e desagradáveis com outras pessoas.

ESQUEMA DE TEMPO – COMPORTAMENTO SUPERSTICIOSO Em todos os exemplos acima há a prática da punição. Ela visa o
controle comportamental, mas carrega a marca da violência,
Contingência → relação causal entre o que o organismo realiza e a retaliação e hostilidade. É muito ouvido falar em formas punitivas
consequência que isso gera. como método de educação dos filhos, mas quais são os resultados?
Contiguidade → relação temporal entre os eventos, ou seja, de tempos O que eles poderiam aprender? E o mais importante: seria esse o
em tempos o evento irá ocorrer. Exemplo: chover. único método de educação? Muitos dos problemas nos quais um
psicólogo planeja e executa uma intervenção são decorrências da
Skinner (1999) em um experimento de laboratório, liberou comida prática da punição.
para um pombo independentemente do que fizesse a cada 10
segundos. Temos uma relação de contiguidade. Ocorreu um reforço “Por coerção eu me refiro a nosso uso da punição e da ameaça de
acidental. Provavelmente antes de ocorrer a liberação da comida, o punição para conseguir que os outros ajam como nós gostaríamos e à
animal estava emitindo alguma resposta (como levantar a cabeça), nossa prática de recompensar pessoas deixando-as escapar de nossas
essa sendo apresentada junto com a comida e tal padrão se punições e ameaças.” (Sidman, 2003).
manteve. Por suas características, o comportamento foi chamado
de supersticioso.
Exemplos de comportamentos coercitivos: trancar as portas da casa e O REFORÇADOR DO COMPORTAMENTO DE PUNIR
assim evitar um roubo; chefes punirem funcionários por erros no
trabalho; deixar um filho de castigo por nota baixa no boletim; um 1 – é uma resposta reforçada imediatamente;
marido chegar bêbado em casa e espancar a mulher e os filhos, etc... 2 – os estímulos punitivos não sofrem dos efeitos da saciação;
3 – é menos trabalhoso do que reforçar;
Se a coerção é a utilização da punição, podemos dizer que o responder 4 – é reforçado socialmente.
é punido após a eliminação de um reforçador positivo, ou com a
apresentação de um reforçador negativo. Como aponta Sidman (2003): 1 – É uma resposta reforçada imediatamente. Quanto mais
“Definimos punição sem apelar para qualquer efeito comportamental: imediato for a entrega, maior o fortalecimento do responder. O
punição ocorre quando qualquer ação seja seguida pela perda de efeito da punição é, no geral, imediato: essa pessoa tem o
reforçadores positivos ou com o ganho de reforçadores negativos.” comportamento alterado, e tal efeito da punição é rapidamente
observável no comportamento por quem pune. Se um
ORIGEM DA COERÇÃO comportamento ocorre várias vezes, então ele deve ser reforçado.

A interação do homem com a natureza sempre foi coercitiva. Nós 2 – Os estímulos punitivos não sofrem dos efeitos da saciação. Ao
adaptamos a coerção natural e a coerção social do mesmo modo: por contrário dos reforçadores, não há privação para os estímulos
meio de rotas de fugas. A rota mais útil seria evitar (ao invés de fugir) punitivos. Logo, a sua eficácia independe da privação. Basta
da coerção natural pela natureza. lembrar de como nunca estamos privados de broncas, notas baixas,
multas, brigas, dores, etc...
Toda espécie sofre com a coerção da natureza. Animais pode passar
por frio e fome, secas ou doença, assim como os humanos. É possível 3 – É menos trabalhoso do que reforçar. Aqui, é necessário treino
que a coerção teve início na espécie humana por meio da interação com para saber reforçar direito, pois além das pessoas não saberem
a natureza. Atualmente é fácil esquecer dos perigos naturais graças à reforçar, ainda reforçam a resposta errada. É muito mais fácil
evolução cientifica e tecnológica. Contudo, há os casos de moradores de punir: não precisamos de treino e punimos os outros com base no
ruas, que não estão imunes à coerção da natureza e passam frio e fome que funcionou conosco: “já que doeu em mim, vai doer nele”.
como qualquer outro ser humano.
4 – É reforçado socialmente. Há situações em que o reforço não
Muitos perigos naturais são inevitáveis, mesmo com todo o avanço provém apenas diretamente do controle comportamental, mas
científico. Por exemplo, ainda não encontramos um meio de escapar da também da própria sociedade. Possíveis exemplos são o terrorismo
morte. Podemos entender que a coerção natural foi reproduzida pelo e filmes de violência.
homem na sociedade que ele planejou: notas baixas, multas, broncas,
prisões, ameaças verbais e símbolos são exemplos de estímulos Para ocorrer a punição, um determinado comportamento deve
inventados pelo homem para punir outros homens. Eles não servem estar em curso, não podemos punir o “nada”.
para punir outros animais.
Exemplo de laboratório: um rato privado de água pressiona a barra
Em uma comunidade hostil, com uma educação baseada na e produz água. As medidas registradas na fase 1º (apresentação
punição, ameaças e punições seriam consideradas normais. Muitos d’água reforça a pressão da barra) serão comparadas com aquelas
acreditam que a punição é uma forma “natural” de educação. Notas obtidas na fase 2º (pressão da barra produz não apenas água, mas
baixas, ameaças de reprovação ou suspensão, são técnicas também choque). A manutenção da fase 2º é fundamental para
punitivas para o controle dos alunos em sala de aula. avaliarmos os efeitos da punição. Sem ela, não é possível avaliar se
os efeitos no responder devem-se pela retirada d’água ou da
Quem utiliza punição visa o controle comportamental. Contudo, há apresentação do choque. Além disso, com uma medida do mesmo
outra possibilidade de controle: o reforçamento positivo, que não comportamento antes (linha de base) e após (fase experimental) à
produz os frutos amargos da punição. introdução da punição, podemos ter certeza que variações na
frequência de respostas serão devido ao choque. Um esquema
É importante não confundir o reforçamento positivo com o negativo, desse estudo seria:
que seria um produto da punição. Segundo Sidman (2003), a correção
seria formada pela punição e seus efeitos colaterais que, dentro deles, Fase 1º (linha de base) → pressionar a barra (R) à água (estímulo
há o reforçamento negativo. Portanto, o controle coercitivo é uma reforçador – SR).
punição e um reforçamento negativo. Fase 2º (fase experimental) → pressionar a barra (R) à água (SR) e
choque (estímulo punitivo – SP).
Punição e seus efeitos É possível dizer que a resposta de pressionar foi suprimida? Não
necessariamente. Após o rato parar de responder, ele volta a
É importante lembrar que o comportamento de punir, quase sempre, pressionar a barra.
envolve duas pessoas que estão se comportando simultaneamente, no
mesmo episódio: a pessoa que aplica a punição (o agente punidor) e a Isso acontece porque o rato está privado de água e é a única
outra que “recebe” a punição (aquela cujo comportamento é punido). resposta do seu repertório que a produz. Os choques não eliminam
a privação, apenas reduziram a frequência da resposta que o
Quando o agente punidor aplica a punição, o que ele busca? Qual o produz. Esse é o principal problema com a punição, ela não altera o
motivo dele aplicá-la? Por que nós punimos? A principal razão do efeito reforçador do reforço (Skinner, 2003). E se o rato aprender
uso da punição é o controle comportamental. Ao aplicar a punição, outro modo de produzir água? Provavelmente, ele pararia de
o agente punidor passa a controlar e alterar o comportamento do pressionar a barra.
organismo punido.
Exemplo prático: as penas de detenção contra jovens infratore s.
Ao ver o seu filho fazendo bagunça, um pai pode repreendê-lo, Análise: roubar não produz apenas prisão (quando produz), mas
como gritando ou dando uma bronca. Provavelmente, o filho irá produz também: dinheiro, status, prestígio e outros reforçadores. O
cessar o comportamento desapropriado. Ou seja, o pai alterou o jovem rouba não para ser preso, mas porque é um dos poucos
comportamento do filho, ele passou a controlá-lo, e esse controle é modos (se não o único) dele ter acesso a tais reforçadores.
reforçador para quem está controlando – no caso, o pai – aquele Problema: como encontrar reforçadores tão potentes em seu
que aplica a punição. ambiente? O que ele pode fazer que produza os mesmos
reforçadores? Punir uma resposta que produz os reforçadores não mesmo uma pessoa que goste desse gênero de musica poderá se
ensina um jovem com produzi-las de outro modo. incomodar quando, por exemplo, ela estiver cansada ou com sono.
Nessas condições, o estímulo que a princípio possuía efeitos
O aumento das penas de prisões vai resolver o problema de crimes? reforçadores assumira funções punitivas. Desse modo, alguns
Não. Se voltarmos ao experimento, o que acontece se aumentarmos reforçadores em excesso poderão adquirir funções punitivas.
a voltagem do choque? Diminui a frequência de respostas? Não. Do Exemplo: a água é um reforçador primário mas, ao ficar dentro de
mesmo modo, aumentar as penas contra crimes não reduzirá o uma piscina cheia d’água sem saber nadar torna-a, nessas
numero de ocorrências criminosas. Isso ocorre porque muitos circunstancias, um estímulo punitivo.
criminosos não possuem outras “barras” para apertarem que
produzem os mesmos reforçadores. Os estímulos punidores são caracterizados como qualquer estimulação
excessiva, incomum, dolorosa ou perigosa a um organismo.
“Raramente invocamos justiça como uma razão para dar alguma
coisa boa para alguém que tenha se comportado bem. Alguém que Os estímulos punidores incondicionados (denominados “naturais”)
obtém “apenas sobremesa” não recebeu algo doce como um retorno seriam qualquer estimulação que ameaça a sobrevivência de uma
razoável por bom comportamento. Ao contrario, recebeu uma espécie e, portanto, são selecionados ao longo da história
punição por agir mal. Justiça passou a significar punição. O principio filogenética. São denominados desse modo porque seus efeitos
“a justiça prevalecerá”, nos faz sentir seguros já que sabemos que a sobre o comportamento não dependem de qualquer circunstância.
punição será aplicada a outros que se comportam mal. Na medida Alguns exemplos seriam: vírus, fogo, enchentes, terremotos, e tc...
em que o principio é aplicado a nós, ele é uma ameaça.” (Sidman,
2003). Os estímulos punidores condicionados são assim denominados
porque as suas funções punitivas dependem de certas
Tais circunstâncias podem parecer que ocorrem apenas em alguns circunstancias: a princípio, não eram punitivos. Devido ao
casos mais extremos. Muitas pessoas trabalham porque precisam. pareamento com algum outro estímulo punitivo (incondicionado ou
Ao apertarem a barra (trabalhar), elas produzem não apenas o condicionado), eles acabam adquirindo tais funções. Exemplos:
sustento, mas também choques. Muitos são aqueles que não gostam notas baixas, multas de transito, a palavra “não”.
do que trabalham (levam choques constantemente). Assim, eles
continuam a trabalhar porque não possuem outras alternativas. Situação: um rato de laboratório, na presença de luz, ao pressionar
a barra produz água. Esse mesmo rato, em uma segunda condição
Exemplo 2: após a fase inicial onde a pressão da barra é (ausência de luz), ao pressionar a barra, produz água mais choque.
sequenciada com água e choque, há a suspensão de ambos os
estímulos. O rato deverá parar de responder. Logo, reintroduzimos Condição 1 → luz (estímulo discriminativo/ Sd) – pressão à barra (R),
apenas o choque, caso observarmos um aumento na frequência da água (estímulo reforçador/ SR)
pressão da barra (R). O choque adquiriu funções reforçadoras ao
ser pareado com água (reforçador primário). Desse modo, um Condição 2 → ausência de luz (estímulo punidor condicionado, SPC) –
esquema do experimento seria: pressão à barra (R), água (estímulo reforçador, SR) e choque (estímulo
punidor, SP).
Fase 1º → pressão da barra (R) à água (SR) e choque (SP)
Em seguida, suspende-se a apresentação de água e choque até o rato Nessa situação, a ausência de luz adquiriu funções punitivas devido ao
parar de responder. pareamento com o choque. Quando a luz da caixa é ligada, o rato
Fase 2 → pressão da barra (R) à choque (SR) provavelmente pressionará a barra com frequência. Mas, quando a luz
é desligada, ele quase não pressiona a barra. Poderíamos dizer que a
Exemplo prático: os rituais de auto-flagelação em rituais religiosos luz desligada sinaliza ao rato que a punição está próxima se ele
são uma decorrência da aprendizagem que a “dor deve levar ao pressionar a barra.
amor”. Muitas pessoas aprendem, desde a infância, que o amor e
prazer devem ser consequência da dor. Não podemos culpá-las, a Exemplo prático: pais que frequentemente castigam seus filhos. Um
sociedade não lhes ensinou outros modos de produzir prazer. pai que bate no filho visando respeito não produzirá isso, mas sim
medo e afastamento da criança, pois a presença do pai foi pareado
com o castigo. O pai, agora, é um punidor condicionado pa ra a
Punidores condicionados e incondicionados criança. Ele não apenas sinaliza punição, mas a sua mera presença
também é um estímulo punidor condicionado. Pais que agem dessa
forma confundem respeito com punição, porque foram cria dos
Trecho do livro “coerção e suas implicações” de Murray Sidman
(2003): assim (e acabam por perpetuar essa criação, pois seus filhos
criarão seus netos da mesma maneira). O princípio é: “funcionou
“Exceto sob condições extraordinárias, confidentemente esperamos que comigo, funcionará nele”. Mas será que funcionou mesmo? Filhos
qualquer estimulação excessiva, incomum, dolorosa ou perigosa sirva geralmente aprendem que a casa dos avós é um lugar na qual eles
como punidor. Estes são os punidores naturais. Sua habilidade para podem fazer de tudo, porque a pessoa que pune (o punidor
parar comportamento em curso usualmente não depende de qualquer condicionado) não está presente. No caso, os pais.
outra circunstância.
Outro exemplo de punidor condicionado: um carro de polícia. Se você
Eventos que são usualmente neutros podem tornar-se punidores. A
estiver fazendo algo que levante suspeitas, não o fará na presença da
palavra “Não”, tão temida por muitas crianças e mesmo por adultos, é
policia. Quem já apanhou da policia não sente medo apenas do policial
apenas um conjunto complexo de sons que não tem poder em si de
que bateu, mas de vários estímulos no ambiente que foram pareados
controlar comportamento (...) De que fontes o “0”, simplesmente um
com o policial., um exemplo seria a viatura.
padrão de linhas sobre o papel, deriva sua extraordinária habilidade de
punir estudantes?
O segundo efeito da punição é a ocorrência de respostas emocionais da
Estes são chamados “punidores condicionados”, porque a sua habilidade
pessoa punida. Elas ocorrem imediatamente após a punição. Exemplos
para nos fazer parar de fazer algo é condicional a outras circunstancias.”
disso são: o choro, a pessoa ficar ruborizada e tremores. Essas
respostas são evocadas pela própria estimulação punitiva e afetam a
Existem estímulos “naturalmente” punidores, ou seja, aqueles
selecionados como punidor a partir da história de vida do tendência do organismo de se comportar (Skinner, 2003). Uma pessoa
organismo e da situação na qual ele é apresentado. Exemplo: em crise de choro, por exemplo, tende a se comportar em uma direção
música sertaneja tocada alta. A depender das circunstancias, oposta a aquela pessoa que passa por uma crise de raiva.
CONTINGÊNCIA DE PUNIÇÃO E REFORÇAMENTO NEGATIVO DA funcionando de maneiras diferentes. Podemos fazer choques
RESPOSTA DE MENTIR desaparecerem (reforçamento negativo); ou podemos tomar choques
(punição)... Assim, punição, alem do seu efeito habitual (reduzir a
(1) Uma criança comendo sobremesa antes do almoço (R) → (2) mãe conduta indesejável) também aumenta a probabilidade de outro
pune esse comportamento deixando a criança de castigo (SP) → (3) o comportamento: se possível, aquele que recebe punição irá desligá-la ou
filho mente para a mãe que não comerá mais (R) → (4) eliminação do fugir.” (Sidman, 2003).
castigo (SR-).
A fuga é uma resposta adaptativa à punição. Exemplo: a pessoa que
Atenção: um estímulo é punidor para qualquer resposta que antecede a rouba ao passar fome ou mata ao ser vítima de alguma violência.
sua apresentação e um reforçador negativo para qualquer resposta que Ambas as respostas são mantidas por reforçamento negativo: o roubo
a elimine. diminui a fome e o assassinato elimina o violentador. Ambas são
respostas de fuga mantidas pela utilização da coerção.
A resposta de mentir da criança é reforçada negativamente pela
retirada do castigo. É nesse momento que o estímulo punidor (SP) REFORÇADORES NEGATIVOS CONDICIONADOS
torna-se um reforçador negativo (SR-): quando aprendemos a escapar
(ou interromper) a punição imposta. Do mesmo modo que a punição cria punidores condicionados, o uso de
reforçamento negativo também cria reforçadores negativos
A ocorrência dessas respostas, que são reforçadas negativamente e são condicionados.
uma consequência direta da coerção (como a resposta de mentir do
filho para a mãe), seriam o terceiro efeito colateral da punição Todo estímulo pareado com um reforçador negativo também assume
(Skinner, 2003). Na análise do comportamento, chamamos essas funções reforçadoras. Assim, ao acompanhar o reforçador negativo, um
respostas de fuga e esquiva. estímulo originalmente neutro pode adquirir as mesmas funções. No
exemplo do laboratório, as pressões da barra são mantidas pela
eliminação da luz. Nesse caso, a luz é reforçador negativo
Fuga e esquiva condicionado.

Fuga e esquiva são consequências diretas da utilização de punição Possível outro exemplo: um aluno que foge da aula do professor X. A
no controle comportamental. Ambas são mantidas pelo princípio, o estímulo punitivo poderá ser o comportamento desse
reforçamento negativo. professor. Com o tempo, outros estímulos no ambiente também
adquirem funções reforçadores negativas, como a sala, o colega, ou até
DEFINIÇÃO DE FUGA a própria matéria ministrada pelo professor. Inicialmente, o aluno fugia
apenas da presença do professor, mas agora ele foge da série de
Fuga é toda resposta reforçada pela eliminação, diminuição, estímulos que foram pareados com ele.
interrupção, remoção ou retirada de um estímulo do ambiente. Tal
estímulo seria um reforçador negativo, pois a sua presença pune o Aprendemos via fuga, mas a aprendizagem é sempre menor quando
comportamento. Desse modo, respostas que enfraquecem seus efeitos comparado com a aprendizagem via reforçamento positivo. Isso
punitivos são reforçadas negativamente. acontece porque somos controlados via reforçamento negativo,
estamos sempre preocupados em eliminar ou evitar o pior.
Imagine um rato na caixa de Skinner. Nós apresentamos um choque ao
rato. Agora, ao pressionar a barra que encontra-se na parede da caixa, o No reforçamento positivo, há a preocupação em melhorar o que
rato interrompe o choque (reforçamento negativo). Após um período, o fazemos. Se o rato na caixa de Skinner recebesse um choque
choque é apresentado novamente ao rato e uma nova pressão à barra é imprevisível, dificilmente sairia de perto da barra. Um problema da
necessária para interrompê-lo. Ao eliminar o choque da caixa, a educação: os alunos, ao longo do tempo como estudantes, não estão
resposta de pressão da barra é reforçada negativamente. preocupados em melhorar o desempenho, mas apenas em não levar
choques (broncas de professores, situações vexaminosas em sala,
A vida diária é lotada de exemplos de fuga: ao receber uma multa, o notas baixas, chegar atrasado).
pagamento (R de fuga) produz a eliminação dela. Deixar o filho de
castigo quando, ao invés de estudar, ele joga vídeo game. O castigo DEFINIÇÃO DE ESQUIVA
pune a resposta de jogar e a suspensão do castigo ocorre quando ele
estuda (R de fuga). O estudar é reforçado pela suspensão do castigo. Esquiva é todo comportamento mantido por reforçamento negativo
que evita (adia) a apresentação de um estímulo punitivo.
No exemplo anterior do laboratório, o choque recebido pelo rato pune
qualquer resposta emitida imediatamente antes da sua apresentação. Existe o famoso ditado “é melhor prevenir do que remediar”. Também
Outro exemplo: muitos fumantes, quando ficam ansiosos, acendem um há momentos em que pensamos “eu poderia evitar essa situação” ou
cigarro e reduzem a ansiedade. “seria melhor se eu não viesse”. Tanto o ditado como os pensamentos
são decorrências de esquivas. Para um analista do comportamento, o
Todo reforçador negativo é um estímulo punidor que aprendemos a ditado poderia ser dito como “é melhor emitirmos esquivas do que
nos livrar. Todo estímulo punidor pune o comportamento que está fugas”, porque é melhor prevenir a apresentação de um estímulo
ocorrendo imediatamente antes. Exemplo: se uma pessoa não estudar punitivo do que remediar a situação e eliminá-lo: a prevenção seria
para uma prova, a nota baixa que ela tira punirá sua falta de estudo. uma esquiva.
Isso está incorreto. Na verdade, pune o que a pessoa fez ao invés de
estudar (como uma ida ao cinema ou namorar). Em uma próxima A esquiva é uma fuga elaborada, um comportamento mais adaptativo
oportunidade, é mais provável a pessoa estudar do que fazer alguma do que a fuga. É, provavelmente, o comportamento mais emitido ao
outra coisa. longo do cotidiano, ao tentar evitar um problema.

“Reforçamento negativo gera fuga. Quando encontramos um reforçador “Esquiva é geralmente um ajustamento mais adaptativo a punição do
negativo, fazemos de tudo que podemos para o desligarmos, para que a fuga. Faz mais sentido impedir um choque do que escapar depois
escapar dele. Se o encontrarmos novamente, faremos o que funcionou que ele tenha começado.” (Sidman, 2003).
antes. Reforçadores negativos também podem ser usados como
Outros exemplos: fingir dor de cabeça (R) e não ir até a casa da sogra
punidores. Uma maneira de punir pessoas é atingi-las com reforçadores
(adiar a apresentação de um estímulo punitivo); encher o tanque do
negativos como uma consequência de algo que tenham feito.
Reforçadores negativos e punidores, portanto, são os mesmos eventos carro (R) e evitar ficar parado com o carro na rua; trabalhar e evitar
desemprego; se informar sobre o trânsito e evitar congestionamentos;
não andar por certos lugares à noite e evitar ser assaltado. Um bom
outro exemplo de esquiva é a do aluno que foge da aula: ele entra na
sala apenas para responder chamada, ou assim que responde, sai. Até
aqui, é comportamento de fuga. Mas, com o passar do tempo, ele
descobre que é mais efetivo não vir para a aula: esquiva.

Possível exemplo clínico de esquiva: quando o cliente não aparece na


sessão sistematicamente, ou quando um terapeuta desmarca sempre
com o mesmo cliente. Como Moreira e Medeiros (2005) apontam: na
época do presidente Sarney, as pessoas faziam uma grande compra no
começo do mês (estocar alimento) para evitar pagar mais caro depois –
esquiva.

ESTUDO DA ESQUIVA NO LABORATÓRIO

Imagine um rato na caixa experimental. Ocasionalmente uma


lâmpada é acesa no alto da caixa, com duração de cinco segundos.
Quando ela apaga, é apresentado um choque. Se o rato responder
na presença da luz, ele evita o choque. Assim→ luz (SPA) → pressão
à barra (R) → adiamento do choque (SR-).

Conclusão: sempre ocorre algum sinal de aviso de que a punição


ocorrerá, sendo um punidor condicionado. A luz, ao ser pareada
(associada) com o choque, também assume funções punitivas. Esse
punidor condicionado é denominado de estímulo pré-aversivo (SPA).
Exemplo prático: a luz do painel alerta sobre o tanque vazio do carro
(SPA), encher o tanque de gasolina nesse momento evita com que o
carro fique parado posteriormente.

Contudo, nem sempre a sinalização que acompanha o estímulo punitivo


é físico. Pode ser a passagem do tempo. Exemplo: o encontro com a
sogra. Um possível sinal de aviso, nesse caso, seria a passagem do
tempo, o número de dias que faltam para o encontro.

Outro exemplo: o filho que apanhou na escola e não quer mais ir. O pai
geralmente castiga o filho, porque acha que ele está com “preguiça” ou
não quer “obedecer”. Como o filho não conta para o pai que apanha dos
colegas (bullying), ele pensa que o problema é a falta “de caráter” ou de
“responsabilidade”. O pai não vê do que o filho está se esquivando.

Por evitarmos choques futuros, as causas da esquiva parecem diminuir


esses choques (manter os choques afastados). Porém, as causas da
esquiva estão no passado (nos choques que levamos e aprendemos a
esquivar) e no presente (na frequência reduzida de choques que
levamos). Nesse ponto, Sidman (2003) diz o seguinte:

“A primeira causa da esquiva está um nosso passado, nos choques que já


tomamos. Estes nos levam a fugir ou escapar; se tivermos sorte suficiente
para encontrar uma barra de esquiva, nós a pressionaremos.
Pressionar uma barra reduz o número de choques que tomamos.
Portanto, a segunda causa da esquiva está no presente, na frequência
reduzida atual de choques. Pressionamos a barra não porque choques
não virão no futuro, mas porque experienciamos choques no passado e
porque pressionar a barra provoca um menor numero de choques
agora.” (Sidman, 2003).

Exemplo: podemos evitar algo desagradável diante de nós, como um


trânsito de manhã, ao seguir para um outro caminho. Na verdade,
agimos assim porque, no passado, ao ouvirmos notícias sobre o
trânsito, fomos reforçados a seguir por tal caminho e porque, no
presente, nós continuamos a evitá-lo emitindo essa resposta. Caso não
evitássemos, emitiríamos outra esquiva.

Pela quantidade de punição que ocorre no mundo, muitos organismos


desenvolveram formas complexas de esquiva. Uma análise completa
deve não apenas estudar as possíveis formas que uma esquiva assume,
como também determinar quais as variáveis controladoras da esquiva.

Você também pode gostar