Você está na página 1de 6

Condicionamento Operante: Definição, Como Funciona + Exemplos

Tiago Azevedo06/08/20160

Como Reforço e Punição modificam o comportamento

O condicionamento operante (por vezes referido como condicionamento instrumental) é um


método de aprendizado que ocorre através de recompensas e punições para o
comportamento. Através de condicionamento operante, uma associação é feita entre um
comportamento e uma consequência para esse comportamento.

Por exemplo, quando um rato de laboratório pressiona um botão azul, ele recebe uma bolinha
de comida como recompensa, mas quando ele aperta o botão vermelho ele recebe um leve
choque elétrico.

Como resultado, ele aprende a pressionar o botão azul, mas evitar o botão vermelho.

A história do condicionamento operante

BehaviorismoO condicionamento operante foi cunhado pelo behaviorista BF Skinner, razão


pela qual você pode ocasionalmente ouvi-lo referido como condicionamento Skinneriano.
Como um behaviorista, Skinner acreditava que não era realmente necessário olhar para
pensamentos e motivações internas, a fim de explicar o comportamento. Em vez disso, ele
sugeriu, devemos olhar apenas para as causas externas, observáveis do comportamento
humano.

Através da primeira parte do século 20, o behaviorismo havia se tornado uma grande força
dentro da psicologia. As ideias de John B. Watson dominaram essa escola de pensamento
desde o início. Watson focava nos princípios do condicionamento clássico , sugerindo que
poderia tomar qualquer pessoa, independentemente da sua origem e treiná-la para ser
qualquer coisa que ele escolhesse.

Enquanto os primeiros behavioristas tinha centrado os seus interesses na aprendizagem


associativa, Skinner estava mais interessado em como as consequências de ações das pessoas
influenciavam seu comportamento.
Skinner usou o termo operante para se referir a qualquer “comportamento ativo que atua
sobre o meio ambiente para gerar consequências” (1953). Em outras palavras, a teoria de
Skinner explicou como podemos adquirir a gama de comportamentos aprendidos que
exibimos a cada dia.

Sua teoria foi fortemente influenciada pelo trabalho do psicólogo Edward Thorndike, que
propôs o que chamou de lei do efeito. De acordo com este princípio, as ações que são seguidas
por resultados desejáveis são mais suscetíveis de serem repetidas, enquanto aquelas seguidas
por resultados indesejáveis são menos susceptíveis de serem repetidas.

O condicionamento operante se baseia em uma premissa bastante simples – ações que são
seguidas por reforço serão reforçadas e tem mais probabilidade de ocorrer novamente no
futuro. Se você contar uma história engraçada na classe e todo mundo rir, provavelmente você
vai ser mais propenso a contar essa história de novo no futuro.

Por outro lado, as ações que resultam em punição ou consequências indesejáveis serão
enfraquecidas e terão menos probabilidade de ocorrerem novamente no futuro. Se você
contar a mesma história novamente em outra classe, mas ninguém rir, desta vez, você vai ser
menos propenso a repetir a história novamente no futuro.

Tipos de comportamentos

Skinner distinguiu entre dois tipos diferentes de comportamentos: comportamentos


respondentes e comportamentos operantes . Comportamentos respondentes são aqueles que
ocorrem automaticamente e reflexivamente, como puxar sua mão de volta de um fogão
quente ou levantar sua perna quando o médico bate em seu joelho.

Você não tem que aprender esses comportamentos, eles simplesmente ocorrem de forma
automática e involuntariamente.

Comportamentos operantes, por outro lado, são aqueles sob nosso controle consciente.
Alguns podem ocorrer espontaneamente e outros propositadamente, mas são as
consequências dessas ações que influenciam ou não as ocorrências futuras. Nossas ações
sobre o meio ambiente e as consequências dessa ação tornam-se uma parte importante do
processo de aprendizagem.

Enquanto o condicionamento clássico pode explicar comportamentos respondentes, Skinner


percebeu que não poderia ser responsável por uma grande quantidade de aprendizagem. Em
vez disso, Skinner sugeriu que o condicionamento operante tinha importância muito maior.

Skinner inventou dispositivos diferentes durante sua infância e ele colocou essas habilidades
para trabalhar durante seus estudos sobre o condicionamento operante. Ele criou um
dispositivo conhecido como câmara de condicionamento operante, na maioria das vezes
referida hoje como uma caixa de Skinner. A câmara era essencialmente uma caixa que poderia
conter um pequeno animal tal como um rato ou pombo. A caixa também continha uma barra
ou a chave que o animal poderia pressionar para receber uma recompensa.

A fim de controlar as respostas, Skinner também desenvolveu um dispositivo conhecido como


um gravador cumulativo. O dispositivo gravava respostas como um movimento ascendente de
uma linha de modo a que as taxas de respostas poderiam ser lidas por olhar para o declive da
linha.

Componentes do condicionamento operante

Alguns conceitos-chave no condicionamento operante:

Reforço

O reforço é qualquer acontecimento que reforça ou aumenta o comportamento que se segue.


Existem dois tipos de reforços:

Reforçadores positivos são eventos favoráveis ou resultados que são apresentados após o
comportamento. Em situações que refletem o reforço positivo, uma resposta ou
comportamento é reforçada pela adição de algo, como elogio ou uma recompensa direta.

Reforçadores negativos envolvem a remoção de eventos ou resultados desfavoráveis após a


exibição de um comportamento. Nestas situações, a resposta é reforçada pela remoção de
algo considerado desagradável.
Em ambos os casos de reforço, o comportamento aumenta.

Punição

Punição é a apresentação de um evento adverso ou resultado que provoca uma diminuição no


comportamento que se segue. Existem dois tipos de punição:

Punição positiva, por vezes referida como punição por aplicação, apresenta um evento
desfavorável ou resultado a fim de enfraquecer a resposta que se segue.

Punição negativa, também conhecida como a punição por remoção, ocorre quando um evento
favorável ou resultado é removido após um comportamento ocorrer.

Em ambos os casos de punição, o comportamento diminui.

Esquemas de reforço

Skinner também descobriu que, quando e com que frequência comportamentos eram
reforçadas desempenhava um papel na velocidade e força da aquisição. Ele identificou vários
diferentes esquemas de reforço:

Reforço contínuo envolve a entrega de um reforço cada vez que uma resposta ocorre.
Aprendizagem tende a ocorrer de forma relativamente rápida, no entanto, a taxa de resposta
é muito baixa. Extinção também ocorre muito rapidamente uma vez que o reforço é
interrompido.

Esquema de razão fixa são um tipo de reforço parcial. As respostas são reforçadas apenas após
a ocorrência de um número específico de respostas. Isso normalmente leva a uma taxa de
resposta bastante estável.

Esquema de intervalo fixo é outra forma de reforço parcial. Reforço ocorre apenas após um
certo intervalo de tempo decorrido. As taxas de resposta permanecem relativamente estáveis
e começam a aumentar à medida que o tempo de reforço se aproxima, mas lentas
imediatamente após o reforço tem sido entregue.

Esquema de reforço de razão variável também é um tipo de reforço parcial que envolve
reforçar o comportamento depois de um variado número de respostas. Isto leva a uma alta
taxa de resposta e as taxas de extinção lentas.
Esquema de reforço de intervalo variável é a forma final de reforço parcial que Skinner
descreveu. Esta agenda envolve a entrega de reforço após um período variável de tempo
decorrido. Isto também tende a conduzir a uma taxa de resposta rápida e lenta taxa de
extinção.

Exemplos do condicionamento operante

Podemos encontrar exemplos de condicionamento operante funcionando ao nosso redor.


Considere o caso de crianças que completam a lição de casa para ganhar uma recompensa de
um pai ou professor, ou funcionários que acabam projetos para receber elogios ou promoções.

Nestes exemplos, a promessa ou possibilidade de recompensas provoca um aumento no


comportamento, mas condicionamento operante pode também ser usado para diminuir um
comportamento. A remoção de um resultado desejável ou aplicação de resultado negativo
pode ser utilizada para diminuir ou prevenir comportamentos indesejáveis. Por exemplo, uma
criança pode ser informada de que vai perder privilégio do recreio se falar fora de hora em sala
de aula. Este potencial para a punição pode levar a uma diminuição da indisciplina.

Saiba mais: As diferenças entre condicionamento clássico e condicionamento operante

Inscreva-se no nosso Canal de Psicologia no Youtube

Referências

Domjan, M. (2003). The Principles of Learning and Behavior, Fifth Edition. Belmont, CA:
Thomson/Wadsworth.

Skinner, B. F. (1935) Two types of conditioned reflex and a pseudo type Journal of General
Psychology, 12, 66-77.

Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Cambridge,


Massachusetts: B.F. Skinner Foundation.
Skinner, B. F. (1948). Superstition’ in the pigeon. Journal of Experimental Psychology, 38, 168-
172.

Skinner, B. F. (1953). Science and human behavior. New York: Simon & Schuster.

Thorndike, E. L. (1905). The elements of psychology. New York: A. G. Seiler.

Por Kendra Cherry

Posts relacionados:

Você também pode gostar