Você está na página 1de 21

UNIVERSIDADE FEDERAL DE SANTA MARIA

CE – FUE FUNDAMENTOS DA EDUCAÇÃO


Prof. Dr. Vicente A. Seibert

TEORIA DO CONDICIONAMENTO OPERANTE

B. F. Skinner é o autor da teoria do condicionamento operante. Esta é sua principal


contribuição para a psicologia. Skinner fez seu doutorado na universidade de ‘Harward’. Iniciou
trabalhando na universidade de Minnessota e depois retornou a ‘Harward’ onde foi catedrático
numa cadeira de Psicologia. Sua obra teve muita influência na psicologia do século XX. Entre
suas obras de destaque temos: The behaviour of organisms, Walden two, The technology of
teaching e Beyond freedom and dignity.

A abordagem de Skinner se enquadra numa posição ambientalista. Neste enfoque,


todos os comportametos são modelados por forças ambientais. Os fatores ambientais que
atuaram sobre um indivíduo - ao longo de sua vida - são determinantes do grau e modo como
reage às situações ambientais, ou seja, de como ele vai se comportar. O comportamento é
controlado por estímulos externos. Tudo o que é aprendido é explicado pela história do
condicionamento que o indivíduo teve, desde os comportamentos mais elementares, até o
raciocínio, as características pessoais como tiques nervosos, manias, modos de reação
afetiva, etc.

Sua concepção é qualificada como mecanicista. Sua maneira de analisar o


comportamento é elementarista e associacionista. Em suas posições teóricas Skinner
subentende ou supõe que o ser humano é neutro e passivo e que o comportamento pode ser
descrito em termos mecanicistas. (Conf. BIGGE, M. 1964. p. 118). Para ele o psicólogo deve
restringir seu estudo às correlações entre estímulo e resposta e não construir elementos,
ligações fisiológicas ou mentais intervenientes entre os estímulos e as respostas. Assim
representa uma extensão das primeiras psicologias mecaniscistas de S – R como o
conexionismo desenvolvido por Thorndike e o behaviorismo desenvolvido por Watson.
(Conf. BIGGE. 1964. p. 118). Skinner não nega a existência de processos mentais e
fisiológicos. Ele simplesmente ignora o que ocorre dentro da mente, e concentra sua atenção
nas relações funcionais entre estímulo e resposta. Skinner evita o problema mentalistico indo
direto as causas físicas anteriores, sem precisar levar em conta hipotéticos estados
intermediários como os sentimentos ou estados de ânimo. (Conf. 1974. p. 13).
Skinner insiste em limitar o estudo científico ao comportamento observável; seus
únicos dados são os adquiridos pela observação sensorial. (Conf. BIGGE. 1964. p.114). Skinner
propõe que a ciência do ser humano se volte da suposição de qualidades inerentes como
Prof. Dr. Vicente A. Seibert

fatores causais e que modelariam o comportamento para as condições externas. São elas que
modelam e mantém o comportamento do ser humano. Ao fazer esta virada nos afastamos do
mal definido e remoto para o observável e o manipulável. (Conf SKINNER, in ULRICH. 1966.
p. 19).

Em suma, o objeto da psicologia é o comportamento observável. O comportamento


observável é a única preocupação própria do psicólogo desta abordagem. Para Skinner “a
psicologia é uma ciência do comportamento manifesto e somente do comportamento
manifesto” (in. BIGGE, M. 1964. p. 114).
A metodologia, a maneira de fazer ciência em psicologia segue o modelo da física.
Skinner formula suas teses sob o pressuposto básico de que há leis na natureza, (Conf. in.
KOCH. S. 1959. p. 369); uma ordem que inclui o comportamento humano. A função da ciência
é descobrir esta ordem, ou seja, as leis pré-existentes que regem nosso mundo. O
conhecimento destas leis permite a predição e o controle do comportamento. (Conf. BIGGE.
1964. p.119).
Todavia, Skinner não se considera um teórico da aprendizagem, nem seu trabalho
uma teoria, mas uma análise funcional do comportamento.

ORIGEM E DETERMINISMO AMBIENTAL DO COMPORTAMENTO

A ciencia do comportamento deve levar em consideração somente os fatos que


possam ser objetivamente observáveis no comportamento de uma pessoa relacionado com o
ambiente onde vive. (Conf. SKINNER, 1974. p. 13). Estados mentais, sentimentos não são
tomados em conta, sendo subjetivos e fruto da introspecção não são dados válidos para uma
ciência que para Skinner segue os moldes das ciênicas empíricas. Skinner também descarta
enfaticamente os propósitos. (Conf. SKINNER, in ULRICH 1966 p. 333). Dizer que fazemos
algo por que gostamos ou porque temos algum objetivo em vista está fora da abordagem
científica do comportamento. De acordo com Michael e Meyerson, “o modelo
comportamentalista visa especificar, sem referência a fatores não-observáveis, hipotéticos e
determinados a partir de dentro, as condições e os processos pelos quais o ambiente controla o
comportamento humano” (ULRICH 1966 p. 23).
A teoria da causalidade ambiental do comportamento está baseada no que Skinner
considera uma das grandes contribuições de Freud para o pensamento ocidental, a da aplicação
do princípio da causa e efeito ao comportamento humano (Conf. in MILLON, 1973. p. 185).
Todo comportamento possui uma causa. Algum efeito ambiental o determina. A preocupação
de Skinner era com as causas do comportamento. Queria saber porque o ser humano se
comporta dessa ou daquela maneira. (Conf. BIGGE. p. 120). Conhecendo as causas é possível
predizer e controlar o comportamento. Esta é a tarefa da psicologia. Skinner sugere uma
tecnologia do comportamento que consistiria na aplicação da ciência para influenciar,
modificar e modelar o comportamento humano.

2
Prof. Dr. Vicente A. Seibert

O comportamento das pessoas é controlado pelo ambiente. O comportamento é uma


função de influências ambientais. “A análise experimental do comportamento vai diretamente
às causas antecedentes que estão no ambiente” ( SKINNER. 1974. p. 30).

São as condições externas que sustentam e modelam o comportamento do ser


humano. (Conf. SKINNER, in ULRICH 1966 p. 19). Identificando as causas, pode-se manipular
o comportamento das pessoas. O cientista estuda o comportamento em função das condições
em que ocorre e dos fatores que o determinam e avalia as probabilidades de ocorrência. Ele
reuniria dados relativos à frequência de respostas em determinadas situações e faria
previsões seguras sobre a possibilidade de que uma resposta futura de mesmo tipo venha
ocorrer em situação semelhante. Assim a psicologia alcançaria o mesmo grau de previsão e
controle do comportamento que foi obtido pelas ciências físicas. (conf. BIGGE. 1964. p. 120-
3).
Grande parte das teses de Skinner foram obtidas no treinamento de animais,
prncipalmente ratos (Conf. in. KOCH. S. 1959. p. 369). Na famosa caixa de Skinner um rato
era treinado a apertar uma alvanca para obter alimento. Para o comportamentalismo no
comportamento de humanos e animais não há diferença qualitativa apenas de complexidade.
Sendo animais apropriados para fazer experimentos; organismos próprios para analizar
esperimentalmente a estrutura dos processos psicológicos. Neste caso, segundo Bolachi, a
psicologia deixa de ser uma ciência metafísca e se torna análise científica do
comportametno; tornando-se uma ciência experimental (Conf. SKINNER 1974. p. XI).
Skinner e colaboradores lograram enorme êxito no treinamento de animais e assim
imaginaram também fazer o mesmo com seres humanos. Por exemplo, dando comida a um
pombo no momento certo ele foi treinado a efetuar algumas respostas bem definidas como dar
um passo para frente ou para o lado ou esticar o pescoço quando determinado estímulo físico
era produzido no ambiente onde se encontrava. (BIGGE. 1964. p.114). O alimento dado após o
desempenho funciona como reforço. Sempre que se reforça determinado comportamento ou
resposta aumenta a probabilidade de que o comportamento seja repetido (Conf. BIGGE. 1964.
p. 114).
Nas escolas, o comportamento dos alunos, pode ser modelado pelo arranjo, em
cuidadosa seqüência, de situações para obtenção das respostas desejadas, que serão
devidamente reforçadas, (condicionamento). Para Skinner a aprendizagem pode ser
programada e as ‘máquinas de ensinar’ são os meios mais apropriados para realizar a
aprendizagem escolar.

O CONDICIONAMENTO OPERANTE

Skinner se deu conta de que nem todos os comportamentos são reações ou respostas a
estímulos (ou seus substitutos) que originalmente impelem um organismo a dar uma resposta ou
desempenhar um comportamento. Em outros termos, não são respostas a estímulos que fazem
com que elas sejam dadas automaticamente. Por exemplo, não há nada que faça uma criança

3
Prof. Dr. Vicente A. Seibert

empurrar ou puxar uma porta para abrí-la. Mas automatizamos isso e quando estamos dentro da
sala puxamos a porta ao acionar o trinco (para sair) e estando fora, a empurramos (para entrar).
Mas você, certamente já deu com o nariz em alguma porta onde isso era invertido?! Então, neste
caso modificamos nossa ação (R: resposta) diante de tal porta (S: estímulo) e assim evitamos um
estímulo gerado em função da consequência (que no caso é desagradável). Todavia para efetuar
essa modificação na resposta, foi necessário desempenahr a ação e experimentar o efeito.

A conseqüência (o efeito que obtivemos) atua sobre a associação da resposta com o


estímulo ou situação estimuladora. (Skinner emprega, neste caso, o termo reforço; pois se trata de
uma resposta (ou comportamento) que é mantida com certa freqüência ou regularidade).

O que Skinner enfatiza é que muitos, senão a maioria dos comportamentos que
fazemos cotidianamente não iniciou como uma reação a um estímulo (C. Respondente), mas
foram efetuados eventualmente ou em função de necessidades de adaptação ao meio, que exige
respostas novas. O que faz com que sejam mantidos e repetidos são as conseqüências que se
seguem à resposta ou os estímulos então experimentados. O fato de que as respostas são
desempenhadas com regularidade se deve ao reforço. O reforço pode ser positivo ou negativo.

Às vezes pergunto para os alunos, para exemplificar situações de condicionamento,


por quê a gente gira a torneira para o lado que abre? Ou, por quê, quando acontece de faltar
energia, mesmo sabendo disso, ao passar para outra sala, acionamos a chave? Agimos com base
no reflexo condicionado, neste caso, de tipo operante. O efeito (estímulos experimentados) que
sempre se seguiu a esses atos, faz repetir a ação (R: resposta ou comportamento nesta situação
estimuladora (S) ou numa similar). Estando escuro na sala onde entramos, acionamos a chave de
luz.) Acontece que associamos uma coisa à outra e depois executamos automaticamente. Pessoas
muito habituadas a desligar a luz ao sair da sala desligam mesmo quando ainda tem gente dentro.
Em suma, automatizamos respostas que desempenhamos sem nos dar conta. Isso é
condicionamento!) Assim vivemos num quase contínuo de relações estímulo - resposta. Quando
chegamos ao colégio nos dirigimos à sala. A porta da sala é estímulo (S) para bater (R) nela. A
porta sendo aberta é novo S para a R de pedir permissão. A permissão concedida, ela passa a ser
um novo S para entrar (R) e assim seguimos; vemos nossa carteira e nos dirigimos....

Se você prender um gato ou um passarinho numa gaiola pela primeira vez ele não tenta
sair pela portinhola, mas arranha em toda parte. Depois de algumas semanas uma caturrita tenta
até abrir a portinha da gaiola. E. Thorndike realizou diversos experimentos com gatos. Ele
colocava um gato faminto numa gaiola que possuía um dispositivo que, ao ser tocado, abria a
portinhola. Nas primeiras vezes em que era posto aí ele se debatia e arranhava em qualquer parte
das grades. Acidentalmente acionava o dispositivo. Após umas 5 a 7 vezes em que era recolocado
(variando de um animal para outro) diminuía, gradativamente, o tempo para sair. Após umas 15 a
20 reintroduções ele simplesmente se virava, acionava o dispositivo alcançando o alimento posto
do lado de fora. Ele passou a agir (R) somente no estímulo (S) que leva ao efeito, pois associou a
R ao S em função do efeito (ou reforço nos termos de Skinner). Repare que no início o

4
Prof. Dr. Vicente A. Seibert

dispositivo não respresenta algo diferenciado (S) e nem possuía o gato uma ação (comportamento
ou resposta) dirigida (R) para o mesmo. Isso passou a existir em função das consequências desta
ação. Thorndike falava da lei do efeito, ou seja, a estabilização de uma R diante de um S em
função do êxito. (No caso, as tentativas fracassadas são abandonadas e as bem sucedidas são
mantidas). Mas Skinner traduziu essa lei pelo reforço.
A resposta (i.é; a ação dirigida ao dispositivo) é um comportamente novo no repertório
do animal e foi associada a um estímulo que também psssou a ter significado em função do que
experimentou após o desempenho. Skinner denomina isso de reforço. Em outros termos, o
comportamento inédito; é adquirido e desepenhado diante de um estímulo que também é novo.
Ao contrário do concicionamento clássico (Pavlov) ele não é baseado (no início não há )em uma
relação S -- R já existente, ou seja, de natureza biológica. Mas ela será estabelecida em função do
reforço.

Com essa conceitualização Skinner abre a psicologia para o processo social o que é
tipico no ser humano, ou seja, comportamentos que não são determinados pela natureza mas,
devidos à influência ambiental. Assim, ao mostrar como se pode intervir para condicionar
comportamentos novos e desejados, a tese dos watsonianos (behavioristas que segue o
pensamento de J. Watson) de que qualquer resposta possível pode ser relacionada com
qualquer estímulo (Conf. BIGGE, 1984. p. 57). é por ele, sustentada e ampliada. A partir disso
imaginou ser possível modelar uma sociedade planejada. (Conf. SKINNER, in ULRICH. 1966. p.
16).

TIPOS DE COMPORTAMENTO

A concepção de comportamento de Skinner está relacionada com sua visão


ambientalista. É característica da abordagem behaviorista definir o comportamento em termos
moleculares. Sendo que as influênicias ambientais sempre ocorrrem na interação do organismo
com seu meio, a chave para caracterizar o comportamento está na relação entre estímulo e
resposta. Os psicólogos da abordagem behaviorista definem o comportamento como ações
resultantes de forças ou estímulos exercidos sobre um organismo. Assim a explicação para os
comportamentos é encontrada na forças (estímulo) ambientais que atuam sobre um organismo.
(Conf. BIGGE. 1964. p. 94 ).
Sob a perspectiva behaviorista, o comportamento é definido como “o movimento de
um organismo ou de suas partes no espaço em relação a um esquema de referência oferecido
pelo próprio organismo ou por um outro quadro de referência exterior a ele, que podem ser
vários objetos externos ou campos de força” (BIGGE, M. 1964. p. 114).
Segundo a classificação de Skinner, há dois tipos de comportamento: O
comportamento respondente e o operante. Para Skinner o estudo apropriado do
comportamento deve ser da relação entre uma mudança na situação (estímulos) e a mudança
na resposta. E isso se dá por meio de duas formas de aprendizagem. Uma é o
condicionamento respondente e a outra o operante. (Conf in ISAACSON et allii p. 257). A cada

5
Prof. Dr. Vicente A. Seibert

tipo de comportamento está associado um tipo de condicionamento ou aprendizagem (conf. p.


257).

a - Comportamento Respondente:

Nesta forma de comportamento, também denomiado classico, a resposta é


determinada por um estímulo. São os chamados comportamentos reflexos. Todas as
respostas que podem ser identificadas como reflexos são exemplos de comportamento
respondente. Por exemplo: Contração da pupila a um feixe de luz mais intenso, salivação ao
contato com o doce na boca. O comportamento respondente é eliciado automaticamente na
presença do estímulo. Quer dizer que o comportamento é causado por um estímulo. (Conf.
BOLACHI. 1974. p. XIII). O estímulo que faz com que a resposta seja emitida pelo organismo é o
estímulo incondicionado. Um estímulo neutro, que nada tem a ver com a relação original, pode
adquirir, pelo processo de condicionamento, o mesmo poder do original.
Aprendizagem no condicionamento respondente: Um estímulo novo é
emparelhado com aquele que eliciou a resposta. Convém destacar que naturalmente já há
um S para uma R. E possuindo o poder de fazer a resposta ser dada pelo organismo.
Após vários emparelhamentos, o novo estímulo também é capaz de eliciar a
mesma resposta. Um novo estímulo (originalmente neutro) é combinado com uma resposta já
exitente pela associação ou substituindo o anterior. Foi o que Pavlov realizou no seu famoso
experimento com cães. Mas trata-se de respostas já existentes na bagagem natural do
organismo. O animal aprende apenas a dar esta resposta na presença de um outro estímulo.

b - Comportamento Operante:

Skinner diferencia um operante de um reflexo e do reflexo condicionado de Pavlov. O


Operante se estabelece sem haver uma relação causal entre uma resposta e um estímulo. (Conf.
BOLACHI. 1974. p. XIII). Trata-se de ações efetuadas aleatoriamente ou espontanemente, mas
que não são, inicialmente, determinadas por um estímulo. Elas serão estabilizadas em relação a
um estímulo em função do que sucede após o desempenho. (Ex. Veja o experimento de
Thorndike com o gato preso na gaiola).

Um operante é definido em termos de seus efeitos sobre a experiência (ação ou


comportamento). Em outros termos, as conseqüências dos atos. No condicionamento operante o
que conta são os estímulos que ocorreram após o desempenho de uma ação (R); as
consequências, os efeitos, enfim, os reforços que um ato teve no passado). É em função disto que
reagimos de um ou outro modo. Repetimos os comportamentos que obtiveram uma recompensa
(reforço positivo) ou agimos de um modo que evitamos algum tipo de estímulo (reforço
negativo), algo desagradável, por exemplo. Entende Skinner que é em função do que sucede ao
desempenho de uma ação ou comportamento que serão aumentadas (caso em que se fala de
condicionamento) ou diminuídas as probabilidades de resposta (caso em que se fala de extinção).

A maior parte do comportamento humano é operante. O comportamento operante

6
Prof. Dr. Vicente A. Seibert

inclui tudo o que fazemos e que tem efeito no mundo exterior ou opera nele. São atos
iniciados pelo organismo: abrir uma porta ou torneira, ligar um aparelho, andar, senta numa
cadeira, dançar, escrever, tomar cerveja, sorrir, estudar, etc. Estes atos são influenciados
pelas suas conseqüências. Não se pode saber apriori, qual estímulo provocará a emissão de
uma determinada resposta. O comportamento operante é controlado por suas conseqüências –
estímulos de reforço - que se seguem à emissão do comportamento.

PROCESSO DE CONDICIONAMENTO OPERANTE

Dificilmente haverá na vida diária, algum comportamento que não venha


acompanhado por alguma espécie de conseqüência agradável ou adversa. Estas conseqüências
constituem as recompensas e punições, que desempenham um papel importante na vida
diária. As pessoas tendem a se comportar de modo a obterem recompensas e a evitar
punições. (Segundo Skinner, isso ocorre, não por imaginar pura e simplesmente, mas por que
já passaram por semelhante experiência). Em muitos casos, a freqüência das ações das pessoas
(respostas) são reduzidas ou aumentadas pelas conseqüências que os efeitos do meio produzem
no indivíduo. Podem-se utilizar recompensas e situações dolorosas para modificar
comportamentos.

No condicionamento operante o estímulo importante é o que se segue


imediatamente à resposta, constituindo o reforço. Qualquer resposta emitida e acompanhada
do reforço é fortalecida. Para haver condicionamento operante é preciso que ocorra um
aumento na freqüência da resposta, à qual o estímulo se seguiu. Eventos ou estímulos que se
seguem a uma resposta e tendem a aumentar a probabilidade de ocorrência desta resposta
são chamados reforçadores. Por exemplo: Um rato pressiona uma alavanca e obtém alimento.
Por isto, o rato terá mais probabilidade de pressionar a alavanca outra vez. O que muda é a
futura probabilidade de resposta de mesma espécie. Não é a resposta específica que é
fortalecida, mas a tendência geral a produzir resposta.

O processo de condicionamento operante pode ser descrito sem qualquer referência


ao estímulo que atua antes que a resposta ocorra. (isso, antes de ser estabelecida em
associação a um estímulo, ou um conjunto – situação estimuladora - à qual será associado em
função do reforço). Todavia é preciso que o organismo efetue o comportamento para que
possa obter o reforço. O organismo (o animal) deve primeiro desempenhar a resposta e então
a ‘recompensa’ é providenciada. (Conf . BIGGE. 1964. p. 101).
O processo de condicionamento operante é muito simples. Um comportamento
emitido na presença de determinado estímulo fica associado a este e será mais provavelmente
repetido em circunstãncia similar (S) se receber reforço. (SKINNER, 1974. p. 47).
Para efetuar o condicionamento de novos comportamentos, a operação é bem
simples: O experimentador espera a resposta que pretende condicionar seja emitida e então
apresenta, imediatamente, uma recompensa. Sendo que nas repetições da resposta o reforço
continuar sendo apresentado, a resposta tende a também ocorrer mais frequentemente. Desta

7
Prof. Dr. Vicente A. Seibert

maneira o experimentador pode controlar e modelar o comportamento de um animal, por


exemplo. (Conf. in ISAACSON et allii p. 268).
Por exemplo, para reforçar o comportamento do rato de pressionar uma alavanca,
basta esperar o desempenho e então aplicar a conseqüência reforçadora. A aprendizagem
ocorre pelo feed back (reforço) à resposta anterior. (BIGGE. 1964. p. 101).

O reforço operante é, por isso, contingente - depende da - de uma resposta.


Podemos representar de forma simplificada:
S – R – S Ref. (Estímulo de reforço).

O condicionamento operante iniciou com a Lei do Efeito de Thorndike que afirma


que o comportamento é realizado devido as suas conseqüências. Porém, Skinner reformulou
este conceito, afirmando que um organismo se comporta de determinado modo devido às
conseqüências que no passado, se seguiram a um comportamento idêntico. (Conf. BIGGE.
1964. p. 96).

O condicionamento é assim denominado por que o resultado do processo é a


formação de respostas condicionadas. Uma resposta condicionada é uma R que foi associada a
ou é evocada por um estímulo. (Conf. BIGGE 1964. p. 94).
Todo comportamento - exceção do comportamento respondente - é determinado
pelas conseqüências reforçadoras. Havendo determinado comportamento - padrão - deve
existir alguma espécie de reforço que o mantém. Neste sentido se entende a causalidade no
comportamento; uma experiência anterior é responsável - devido ao reforço - pela repetição
da resposta em uma situação estimuladora com características idênticas.
Assim veremos como através das técnicas de condicionamento se explica e se pode
efetuar a influencia ambiental no comportamento individual. Todos os padrões de
comportamento são, em última análise, resultado da influência ambiental.

APRENDIZAGEM E CONTROLE DO COMPORTAMENTO

Skinner objetivava formular o conceito de comportamento numa base


rigorosamente experimental. Para tanto era necessário individuar as variáveis principais do
comportamento operante e as relações que caracterizam essas variáveis dizem respeito ao
processo de aprendizagem.
No experimento clássico de Skinner, a caixa de Skinner, ele analisa com precisão as
reações de um rato faminto; como ele aprende a obter comida. Nessa caixa há um dispositivo
que ao ser tocado é liberada uma bolotinha de ração. Logo que o rato é posto na caixa ele
executa numerosos comportamentos; corre em volta, fareja em torno; e acidentalmente aciona
o dispositivo que libera uma bolota de ração. Com o passar do tempo diminui a frequência de
comportamentos aleatórios e aumenta o comportamento de pressionar a alvanca do
dispositivo. Skinner registrava os resultados e verificou que cada vez que o rato acionava o

8
Prof. Dr. Vicente A. Seibert

dispositivo se alterava a probabilidade de resposta; o alimento obtido reforça o


comportamento de acionar o dispositivo. A ração é o estímulo reforçador e o processo de
reforço (receber a ração após o desempenho acertado) estabelece a associação da resposta com
o dispositivo discriminado como um estímulo (S) perante o qual irá desempenhar a resposta
aprendida (S - R). (Conf. ISAACSON. et allii. 1965. p. 260). Reforçadores são empregados para
dirigir ou modelar comportamentos emitidos.
De maneira semelhante Skinner conseguia modelar o comportamento de um pombo,
colocado numa gaiola, de esticar o pescoço. Toda vez que o pombo levanta a cabeça acima de
certa linha o experimentador libera uma bolota de ração. Uma vez que este comportamento foi
devidamente estabelecido por reforços ele elevava a linha e a comida é liberada quando ergue
ainda mais a cabeça de modo que sucessivamente se alcança um comportamento do pombo
esticar o pescoço na presença de certo estímulo. (Conf. BIGGE. 1964. p. 116).
O condicionamento operante é o processo de aprendizagem pelo qual uma resposta
se torna mais frequente ou provável. (Conf. BIGGE. 1964. p. 114).
A aquisição e manutenção de uma nova resposta se deve ao reforço. “Reforçamento
é o processo pelo qual o comportamento operante é gerado e mantido (i. é, aprendido);
portanto, é esencial para a análise dos efetitos do ambiente no desenvolvimento individual
desde as primeiras etapas da vida. Qualquer fato estímulo (‘stimulus event’) que, quando
sucede diretamente uma respsosta idêntica, sistematicamente aumenta a taxa daquela resposta”
(GEWIRTZ, J. in FOSS, M. B. 1970. p. 219).
Segundo Skinner, tudo o que sabemos do condiconamento operante diz respeito a
viabilizar que aumente ou diminua a tendência de um comportamento ocorrer em determinada
ocasião. (Conf. 1974. p. 182). (A diminuição está relacionada ao procedimento de extinção;
conf. abaixo).

LEI DO CONDICIONAMENTO OPERANTE: se a ocorrência de uma (resposta) operante é


seguida pela apresentação de um estímulo de reforço, a probabilidade de fortalecimento é
aumentada. (Conf. BIGGE, M. 1964. p. 125).

MODALIDADES DE REFORÇAMENTO: REFORÇO POSITIVO E NEGATIVO

O termo reforçador positivo é usado, aproximadamente como sinônimo do termo


mais comum recompensa. No entanto, uma recompensa pode ou não ser um reforçador
positivo, ou seja, pode haver diferença na experiência feita do estímulo, entre aquele que
aplica e aquele que recebe, sobre o que constitui uma recompensa. Dessa forma, apenas
aqueles estímulos (eventos ou experiências) que ocorrem após um comportamento, fazendo
com que aumente a sua freqüência, são definidos como reforçadores positivos.

O procedimento de introduzir um reforçador (S de reforço), imediatamente após


uma resposta, resultando num aumento na freqüência daquela resposta, é chamado
condicionamento. Uma resposta que, associada a certo S é dada mais frequentemente do que
não, na presença deste, é uma resposta condicionada. Tanto no reforço positivo como no

9
Prof. Dr. Vicente A. Seibert

reforço negativo, a probabilidade de resposta é aumentada.

O reforçador negativo é o evento ou objeto que, ao ser retirado ou removido acaba


por fortalecer determinada resposta. Quando a supressão de um dado evento subseqüente a
um operante aumentar a probabilidade da resposta ocorrer em situações semelhantes, estamos
diante de um reforço negativo.
O adjetivo negativo é empregado para indicar que se trata da supressão de algo. E o
reforço, por aumentar a probabilidade de resposta. O reforço negativo reforça os
comportamentos que livram os organismos de experiências irritantes. Para Skinner respostas
podem ser aprendidas pela associação com o término de estímulos negativos que são definidos
como estímulos que afetam desfavoravelmente a tendência de resposta. Sendo que, mediante
determinada resposta, um estímulo deixa de ser experimentado (ou sua intensidade é
reduzida), e que ele reforça essa resposta, então estamos na presença de um reforço negativo
(para tal R). (Conf. ISAACSON et allii p. 268).

Os reforçadores positivos e negativos são às vezes divididos em duas classes gerais:


Intrínsecos e extrínsecos. O reforço é intrínseco quando o comportamento a ser reforçado se
reforça por si mesmo. A resposta é por si mesma fonte de sentimento de prazer e assim o ato é
automaticamente reforçado cada vez que ocorre. Nos reforçadores intrínsecos incluem-se
as respostas que atendem motivos básicos do organismo - impulsos fisiológicos -e, atividades
que proporcionam estimulação sensorial (dançar, jogar, excursões), empreendimentos que
satisfazem a curiosidade, (leitura, experimentação), o senso de progresso ou de domínio
que deriva de uma realização, de ser competente ou de vencer um hábito. Comportamentos
que ajudam um organismo a evitar a dor (fugir de um inimigo, aplicar um remédio que
evita uma irritação cutânea) também são intrinsecamente reforçadores. Atividades
intrinsecamente compensadoras nem sempre são reforçadoras desde o início.

A maior parte dos comportamentos do cotidiano das pessoas é reforçada por suas
conseqüências externas ou extrínsecas. (O comportamento operante á mais frequente pois ele
traz consigo consequências que acabam sendo refoçadoras).

EXTINÇÃO E ESQUECIMENTO

No condicionamento operante, uma resposta é fortalecida através do reforço.


(Comportamentos habituais são mantidos por reforços). Através da extinção é enfraquecida ou
eliminada. O efeito da extinção é o contrário do reforçamento. A extinção exaure a
predisposição para responder que o condicionamento produz no organismo.
O procedimento de extinção de um comportamento se faz mediante a suspensão do
reforço que o mantém. A extinção de um comportamento se verifica pela redução gradual na
freqüência de emissão, como resultado do procedimento de extinção, até atingir a
freqüência anterior ao condicionamento. O comportamento ainda é repetido, mas como não
recebe mais o reforço se enfraquece, torna-se menos frequente e, enfim, deixa de ser efetuado

10
Prof. Dr. Vicente A. Seibert

mesmo na presença da situação estimuladora em que ocorria.


Tratando-se de esquecimento, um comportamento também deixa de ser emitido.
Porém, não como resultado de retirada de reforço. O esquecimento consiste numa diminuição
na probabilidade de que um comportamento seja desempenhado, em razão de não ter sido
emitido por um longo período de tempo. O esquecimento se verifica quando a resposta
deixa de ser emitida por muito tempo depois de ter sido condicionada.

Na extinção permite-se que a resposta ocorra, sem receber reforço. No


esquecimento impede-se que a resposta ocorra por um longo período de tempo. Em ambos
os casos verifica-se a diminuição da freqüência de resposta. No esquecimento esta diminuição
ocorre devido à falta de oportunidade para responder. Na extinção é devido a inexistência de
reforço para o comportamento. (Conf. BIGGE, M. 1964. pp. 96, 128,132).
Esquecimento é a perda de um hábito com a passagem do tempo. (Conf. BIGGE, M.
1964. p. 133). Skinner dá um significado mais específico ao termo do que o usual em que a
gente diz que esquce algo em algum lugar ou de fazer alguma coisa. Mas são coisas puntuais.
Em seguida poderemos relembrar disso bem como dos habitos que deixamos de desempenhar,
mas estes, não sendo mais praticados são eliminados do repertório de comportamentos.

APRENDIZAGEM E CONDICIONAMENTO

Condicionamento e aprendizagem são conceitos diferenciados. Para Skinner a


aprendizagem está estreitamente relacionada a condicionamento. A essência da aprendizagem
no condiconamento operante não é a substituição de estímulo, mas a mudança de repostas
(conf. BIGGE. 1964. p. 101).
Para os neobehavioristas, incluindo Skinnner, aprendizagem é uma mudança mais ou
menos permanente no comportamento como resultado da prática. O processo de aprendizagem
consiste na impressão de novos padrões de reações num organismo ‘maleável e passivo’
(‘pliable and passiv’).” (Conf. BIGGE. 1964. p. 94).
No exemplo do rato da caixa de Skinner, se constata que a associação do estímulo
de reforço com a ação de acionar o dispositivo (pressionando uma alavanca) resulta no
aumento da probabilidade de resposta; mesmo que agumas vezes o próprio reforço falhe, a
resposta persiste sendo efetuada na presença da alavanca.
A aprendizagem pode ser definida como uma mudança no comportamento que se
manifesta como efeito de um processo de reforçamento. (Conf. BOLACHI. 1974. p. XIII). Esta é
uma definição mais estrita e de acordo com Skinner.
Há outros autores que apresentam um conceito mais aberto, como, por exemplo,
Hays. Aprendizagem pode ser razoavelmente definida como uma mudança no comportamento
produzida pela experiência. (Ou como consequência de eventos). (Conf. HAYS. 1973. p. 177).
Entendendo-se que a aprendizagem envolve a integração das experiências é um
conceito muito mais amplo do que condicionamento. A aprendizagem abrange o conjunto de
atividades e habilidades que animais e seres humanos adquirem através do contato com seu

11
Prof. Dr. Vicente A. Seibert

meio. (Conf. NUTTIN, J. 1953. p. 38). Entretanto, o significado de condicionamento é muito


mais específico e exato do que o de aprendizagem: é o aumento na freqüência de uma resposta
que foi, recentemente, associada com um reforçador sob condições explícitas.

CLASSIFICAÇÃO DOS ESTÍMULOS REFORÇADOREs


Os estímulos capazes de reforçar um comportamento podem ser de quatro tipos: a -
Estímulos primários: Estes podem ser qualificados apriori como positivos ou negativos. Os
estímulos primários positivos estão ligados à sobrevivência do organismo ou da espécie. Ex:
alimento, descanso, água, afeto, etc. Os estímulos primários negativos são opostos aos
positivos. Põem a vida em risco, e por isso são evitados. Ex: choque elétrico, ruído elevado,
ferimentos, etc.
b - Estímulos reforçadores secundários: Por si mesmos são estímulos neutros. Não
possuem
a propriedade - incondicionada - de modificar a conduta. Porém, adquirem seu
poder reforçador quando associados a reforçadores primários. Ex. dinheiro, prêmios.
c - Estímulos reforçadores generalizados: São estímulos reforçadores secundários;
com a diferença de estarem associados a vários primários, de modo que são capazes de
controlar uma amplitude muito maior de comportamentos. Ex. elogios, aprovação.
d - Reforçadores sociais: Constitui uma classe de reforçadores muito importantes
na nossa sociedade. Seu poder reforçador independe de uma privação específica e são muito
eficazes no controle do comportamento. Ex. aprovação nas suas diferentes formas como
poder, honrarias, diplomas, etc.

A seguir veremos alguns procedimentos e técnicas específicas empregadas para


controlar o comportamento.

ENCADEAMENTO
Nossos comportamentos habituais sempre constituem respostas a estímulos, que
adquirimos ao longo da vida. Passamos de um comportamento a outro dentro de um
fluxo contínuo com variadas estimulações. Os nossos atos parecem ser uma seqüência em
progresso contínuo, onde uma resposta leva a outra de forma sucessiva. Ocorre que muitas
respostas emitidas produzem ou alteram as variáveis que controlam a resposta sucessiva.
Temos, então, o que denominamos encadeamento.
A maioria dos comportamentos humanos ocorre em cadeia: Uma resposta torna-se
o estímulo para a seguinte. Trata-se de uma seqüência de estímulos discriminativos e respostas
na qual cada resposta produz uma mudança no meio, a qual atua como um estímulo
(discriminativo) para a resposta seguinte. Ex. Vestir uma calça em etapas sucessivas: Pegar a
calça adequadamente, por os pés, puxá-la, etc. Inicialmente cada etapa é reforçada e
finalmente o conjunto do ato.

DIFERENCIAÇÃO DE RESPOSTA

12
Prof. Dr. Vicente A. Seibert

Dentre um conjunto de comportamentos semelhantes se procede ao reforçamento


de uma das respostas, ao passo que outras não são reforçadas É um reforçamento diferencial.
Inúmeras aptidões se desenvolvem através das diferenças no reforço de respostas variadas.
Muitos reforços - diferenciação - podem ser providos por exigências mecânicas do ambiente de
um organismo. Ex. jogar uma bola à cesta de basquete. O reforço se dá ao soltá-la no
momento e com a execução apropriada. Em habilidades aprendidas que são mais complexas, o
reforço deve ser provido por um professor. Neste caso o reforço que desenvolve a
habilidade, deve ser imediato.

MODELAGEM
A modelagem ou método de aproximação sucessiva é usado para a aprendizagem
de novas respostas operantes. A modelagem de comportamentos consiste no reforçamento
diferenciado de respostas que se aproximam de um comportamento final desejado. O
procedimento inicia com uma resposta inicial que está relacionada ao comportamento
terminal em pelo menos uma dimensão significativa. Sucessiva e gradualmente se avança no
reforço daquelas respostas que se aproximam mais e abandonando-se as anteriores, até chegar
ao comportamento terminal que estará então condicionado. Na modelagem ou método de
aproximação sucessiva, cada comportamento intermediário reforçado pode ser considerado
um elo de uma cadeia que tem uma única função: progredir para alcançar a resposta final.
Vejamos um exemplo de modelagem. Skinner ensinava um pombo a caminhar
traçando um 8. Naturalmente um pombo não anda fazendo percursos com esta forma. Para
iniciar o processo de condicioná-lo a dar esta forma de resposta é preciso iniciar reforçando
respostas dele que tenham alguma coisa a ver com um semicírculo e depois seguir reforçando
o que se direciona para completar um 8, mas, não reforçar os passos que se desviam.
A modelagem é um processo mais abrangente que a diferenciação de resposta. Na
modelagem, a diferenciação de resposta é em geral um objetivo intermediário. Depois que
uma resposta, dentre várias, foi estabelecida, passa-se a reforçar uma outra que se aproxima
mais da resposta final escolhida.

GENERALIZAÇÃO E DISCRIMINAÇÃO
No reforçamento de comportamentos desejados e na modelação ainda podem ser
empregados dois outros procedimentos, a generalização e a discriminação.
As respostas fortalecidas por meio de reforçamentos realizadas em um conjunto de
circunstâncias tendem a espalhar-se ou generalizar-se para situações semelhantes.
Havendo semelhança no ambiente pode ocorrer a generalização. O comportamento pode ser
desempenhado neste ambiente devido às semelhanças com as circunstâncias em que a
resposta foi estabelecida. A generalização se deve às propriedades comuns que os estímulos
apresentam entre si. Por exemplo: Se a mãe recompensava o filho quando lhe prestava
atenção, é muito provável que assim se comporte diante da professora. Se um estudante teve
sucesso ao expor um trabalho, é muito provável que também se saia bem ao expor sua
opinião em uma assembléia de estudantes. Na generalização de estímulo acontece uma

13
Prof. Dr. Vicente A. Seibert

resposta de modo similar a estímulos diferenciados. A discriminação é o processo oposto.

A discriminação de resposta se relaciona ao reforçamento de comportamentos em


uma situação e não em outra, isto é, condicioná-la na presença de um estímulo e extinguí-la
na presença de outro. Uma resposta pode ser dada a vários estímulos diferentes. A
diferenciação ocorre, à medida que se estabelece a resposta para somente um dos estímulos.
Por exemplo: um aluno faz gracinhas na sua roda de amigos e tem a admiração destes. Na sala
de aula é repreendido. Ele deixa de responder na segunda situação estimuladora.

Quando há dois ou mais estímulos muito semelhantes entre si, ocorre, geralmente,
uma considerável generalização entre eles. Neste caso o comportamento discriminativo é mais
difícil de ser estabelecido. Havendo uma grande diferença entre os estímulos,
provavelmente haverá uma mínima generalização entre eles. Entretanto, a discriminação
será facilmente estabelecida.

RELAÇÕES COM A PRÁTICA

ISAACSON e outros autores da obra ‘The Science of Behavior’ afirmam que as


teorias, a espinha dorsal da psicologia, não são necessariamente absolutamente verdadeiras ou
falsas; mas, “elas tendem a oferecer explicações, compreensões e previsões do fenômeno do
comportamento” (1965 p. 09). Enfatizamos essa tese pois esperamos proporcionar ao
estudante diversas contribuições integrando psicologia e educação e esperamos que possa
auxiliar a entender mais ou melhor a realidade do ser humano em desenvolvimento, do
comportamento, principalmente em situações educacionais.

Destacamos algumas das teses e contribuições dos autores Behavioristas e


principalmente de Skinner que tiveram muita repercussão no meio educacional. O alcance das
pesquisas de Skinner sobre processos de aprendizagem promoveram um dos mais destacados
incentivos em desenvolvimentos educacionais. (Conf. in ISAACSON et allii p. 269). Esses
pesquisadores pretendiam oferecer uma explicação científica para o comportamento, (a qual,
todavia, não permanece livre de questionamentos).

A ciência explica o comportamento em termos de causa ou condições ambientais.


Agora deve ser possível produzir o comportamento de acordo com um plano ou simplesmente
arranjando as condições apropriadas. Assim poderemos produzir seres felizes, instruidos,
talentosos, bem comportados e produtivos. (Conf. SKINNER, in ULRICH 1966 p. 11). Isso
seria efetuado por meio de planejamento cultural. Skinner preconiza que numa cultura
controlada não iria haver desordem. (Conf. p. 16); e que uma Cultura científica que adotasse
os princípios do condicionamento operante teria, a longo prazo, mais chances de sobreviver.
(Conf. BIGGE. 1964. p. 127). Naturalmente o espaço mais indicado para se encetar tal
empreitada é a educação.

14
Prof. Dr. Vicente A. Seibert

Skinner com o sucesso de aprendizagem obtido em seus experimentos com animais


se convenceu que o condicionamento operante também seria frutífero caso aplicado na
educação. O controle mais eficiente da aprendizagem e do comportamento seria por meio do
apoio instrumental (operante). Ele reconhece que o trabalho próprio do professor é modelar o
comportamento, conseguir que as crianças escrevam e pronunciem corretamente. Mas, entende
que a principal tarefa é conseguir colocar o comportamento das crianças sob controle de
estímulo apropriado.

O comportamento se desenvolve no ambiente, nas relações do organismo com o


meio; Também a aprendizagem tem lugar no inter-jogo entre S e R (estímulo e resposta).
Deste modo a questão da natureza do processo de aprendizagem deve ser centrada nas relações
entre processos de estímulos e respostas e o que ocorre entre eles. (BIGGE. 1964. p. 94).
Entretanto, para aos behavioristas o foco se limita aos aspectos exteriores.

Para os psicólogos associacionistas (S - R) a aprendizagem ocorre junto com


mudança observável de comportamento e qualquer mudança de comportamento é
aprendizagem e inversamente. A aprendizagem ocorre quando uma nova resposta é
condicionada, por ex. Quando o pombo passa a elevar o pescoço acima de certa linha da
gaiola, como resultado dos reforços.

Vimos como Skinner iguala aprendizagem e condicionamento. Para que a


aprendizagem ocorra, no condicionamento operante, é preciso que a resposta seja emitida e
depois recompensada; A recompensa reforça a resposta dada. Portanto a essência da
aprendizagem não é substituição de estímulos, mas modificação de respostas. Há um feed back
do estímulo de reforço sobre a resposta anteriormente efetuada. Para os behavioristas a
educação deve assumir a forma de reforçamento positivo ou negativo. (BIGGE. 1964. p. 96).

O PROCESSO DE ENSINO NA ABORDAGEM SKINNERIANA.

No ambiente em que vivem, as crianças aprendem naturalmente. O objetivo da


educação é acelerar a aprendizagem e fazer com que adquiram habilidades que não poderiam
aprender espontaneamente. A educação ainda direciona a aprendizagem, visando colocar o
comportamento sob controle de estímulos.
No entendimento de Skinner os alunos não aprendem simplesmente porque algo
lhes é mostrado ou narrado. As pessoas aprendem devido às conseqüências de seus atos.
Lembram algo porque foram reforçadas para lembrar aquilo que viram ou ouviram.
O papel desempenhado pelo reforço é decisivo na aprendizagem. Para Skinner, a
aprendizagem ocorre devido ao reforço. A aprendizagem não ocorre devido à presença do
estímulo ou da resposta, mas devido às contingências de reforçamento. O reforço positivo
fortalece a resposta. (Conf ISAACSON. 1965. p. 270).
Na educação é preciso concentra-se no lado do reforço. O que importa é arranjar as

15
Prof. Dr. Vicente A. Seibert

situações de maneira que as respostas dadas pelo sujeito sejam reforçadas. Desde que a
aquisição é a dimensão importante da aprendizagem uma escala de reforçamento contínuo
deve ser empregada. Os reforços devem se aplicados imediatamente tendo assim sua
probabilidade de ocorrência aumentada. (Conf. ISAACSON. 1965. p. 270).

A RELAÇÃO PROFESSOR – ALUNO

A proposta educacional de Skinner resulta num ensino centrado no professor


(“teacher centered classroom”) (Conf. BIGGE,. 1964. p. 136). Ele é o centro do processo, que
determina o rumo, as atividades e submete os alunos a seus propósitos.

O ensino se dá apenas quando o comportamento que se deseja ensinar pode ser


colocado sob controle de certas contingências de reforço. O papel do professor no
processo instrucional é o de arranjar as contingências de reforço de modo a possibilitar ou
aumentar a probabilidade de que o aprendiz exiba o comportamento desejado. A função
principal do professor é a programação de contingências, muito mais do que se preocupar com
a seleção de estímulos. Programar contingências significa dar o reforço no momento
apropriado. Reforçar as respostas que levarão o aprendiz com maior probabilidade a
posteriormente desempenhar o comportamento desejado.

Vimos acima que o processo de aprendizagem consiste na impressão de novos


padrões de reações num organismo maleável (‘pliable’) e passivo.” (Conf. BIGGE. 1964. p. 94).
Assim a natureza do processo de aprendizagem está centrado no estudo das relações de
estímulos e respostas e o que ocorre entre eles. Sendo que o foco está no comportamento, um
professor que segue esta orientação se empenha para mudar o comportamento dos alunos numa
direção pre-determinada. Ele precisa aplicar os estímulos apropriados no momento certo, ou
seja quando um comportamento desejado foi desempenhado. “No condicionamento operante os
professores são considerados arquitetos construtores do comportamento dos alunos” (BIGGE,
M. 1964. p. 113).
Para que o professor consiga colocar o comportamento das crianças sob controle de
estímulos apropriados ele precisa efetuar o que Skinner denomina de instrução programada.

A instrução programada é um sistema de ensino e aprendizagem em que o conteúdo


previamente definido é repartido em pequenos e separados passos apresentados numa
sequência lógica que facilita a aprendizagem pelo aluno. O passo sucessivo estará apoiado no
anterior. O aluno pode avançar passo a passo no seu próprio ritmo sendo prontamente
reforçado a cada passo. (Conf. BIGGE. 1964. p. 134). O professor reforçaria uma série de
aproximações sucessivas até chegar ao comportamento final desejado. (Conf. BIGGE. 1964. p.
135). Essa forma de instrução pode ser apoiada por máquinas de ensinar.

Skinner entende que a melhor maneira de ensinar é centralizando as atividades no


condicionamento operante. A ênfase deve estar no reforçamento, ao invés de uso de

16
Prof. Dr. Vicente A. Seibert

controle aversivo. Embora o comportamento possa ser controlado através do uso de


estímulos aversivos, não se constitui na forma mais produtiva de obter uma boa
aprendizagem. Em muitas situações os alunos estudam para fugir às conseqüências
desagradáveis como castigos, repreensões, críticas, ridicularizações, notas baixas, etc.
Quando predomina este clima no âmbito da aprendizagem, o alcançar a resposta correta
deixa de ser o evento mais importante, de modo que o aluno estuda para fugir aos estímulos
aversivos. Predominará um comportamento de fuga ao invés de um comportamento voltado
para aquisição de novas habilidades.
Diversos pontos são ainda importantes para alcançar eficiência na aprendizagem. O
estímulo reforçador deve ser aplicado imediatamente após a resposta correta. Havendo um
lapso de tempo mais longo, o poder reforçador do estímulo-reforço diminui. (BIGGE. p. 135).
É necessário que o aluno perceba a relação entre a resposta e o reforço. A aprovação
imediatamente após uma resposta correta possui, em termos de recompensa, um efeito maior
sobre o organismo. “Os operantes – série de atos – são reforçados ou fortalecidos de modo a
aumentar a probabilidade de sua ocorrência no futuro. Neste processo é de suma importância que
os professores empreguem programas de reforçamento apropriadametne cronometrados e
espaçados’ (BIGGE, M. 1964. p. 114).
A sociedade e o sistema educacional empregam, predominantemente, estímulos
reforçadores generalizados, como diplomas, aprovação no semestre, medalhas, etc. Estes
reforçadores funcionam para o comportamento de freqüentar a escola, mas nunca reforçam, ou
só fracamente, o conteúdo das aulas em si mesmo. Além disto, o reforçamento deve ser
programado e aplicado em série. O ensino deveria ser cuidadosamente planejado, avançando
etapa por etapa onde se reforça uma série de aproximações sucessivas, até o
comportamento final. O reforçamento precisa ainda ser aplicado em uma freqüência
regular. A infreqüência de reforçamento é contraproducente. Porém, para que um professor
possa aplicar adequadamente, precisaria dispor de um número muito elevado de reforços e
aplicá-los aos alunos de sua classe dentro de uma seqüência rigorosamente planejada. Como
isto é muito difícil Skinner sugere o emprego das máquinas de ensinar.

Trata-se de equipamentos que colocam séries de questões curtas e o aluno responde


em certo espaço próximo da questão. Elas exigem as respostas dos alunos e as corrigem
imediatamente. A máquina é feita de um modo que seja difícil ao aluno responder
erradamente. Quando a resposta é correta ela é imediatamente reforçada pela máquina (Conf.
HOLLAND, J. in. ULRICH. 1966 p. 75) Desta forma cada aluno pode trabalhar e progredir
individualmente e ao seu ritmo. Esse emprego de uma máquina está baseada na crença de
que a aprendizagem eficiente depende do estudante produzir um grande número de
respostas corretas. (Conf. ISAACSON. 1965. p. 269).

O objetivo da utilização máquinas de ensinar é que elas supririam uma


deficiência no reforçamento de respostas corretas que se verifica no dia a dia e nas aulas. O
professor não podendo aplicar os reforços para cada aluno logo após a resposta é

17
Prof. Dr. Vicente A. Seibert

substituído pela máquina que responde imediatamente. Com a máquina o aluno emite a sua
resposta e recebe imediatamente a confirmação do seu êxito. A vantagem das máquinas
está no fato de que elas respondem mais rapidamente do que as situações naturais do dia-a-
dia.
O professor não seria substituído. Ele permaneceria como orientador dos alunos.
Ele ficaria livre de corrigir muitos exercícios e de repetições dos conteúdos. Com o uso da
máquina, ainda seria tirado dele o aspecto aversivo de controle da resposta de estudar (do
aluno) e, disporia de muito mais tempo para se aprofundar na sua área.

RELAÇÃO ALUNO – ALUNO

À Primeira vista pode parecer que nesse ensino programado tudo ocorra em função
do professor. O professor arranja de um modo mais eficiente as situações de reforço do que o
ambiente naturalmente providenciaria. Ele corrige as infrequências e elimina estímulos
conflitantes, enfim corrige as deficiências usuais. No entanto, os alunos, embora não esteja
previsto interagirem em atividades, eles não deixam de constituir um ambiente reciprocamente
influenciador. As realizações elevadas de uma criança que se sobressai são reforçadoras. Mas
quando sempre são as mesmas e ainda recebem muita atenção por isso em detrimento das
outras que não atingem o mesmo nível, isso pode com o passar do tempo ser adverso para as
demais. Assim, o que o professor propõe como reforço pode afetar os alunos entre si, como
por exemplo, estimular a concorrência pode oportunizar efeitos adversos. Reforçar
exageradamente os melhores resultados pode parecer depreciativo para aquele que não se sai
tão bem. Um aluno é premiado pelo sucesso e isso pode ser aversivo para outro, de modo que
pode criar uma situação estimuladora desfavorável para a aprendizagem. (Conf. BIGGE, M.
1964. p. 137).

A QUESTÃO DA PUNIÇÃO

O conhecimento logrado com as técnicas de condicionamento operante levou


Skinner a abordar um assunto relevante para a criação e a educação: O emprego de castigos
por pais e professores como meio de controlar o comportamento das crianças e alunos.

O emprego de castigos para controlar o comportamento das crianças e mesmo de


adultos foi largamente empregado e muitas pessoas ainda estão convencidas quanto à sua
eficácia. Você se admiraria em saber que por meio da punição pelo castigo é possível
perpetuar as resposta que se deseja eliminar? (Conf in ISAACSON et allii p. 269).

A punição ou o emprego de castigos disciplinadores talvez seja, historicamente, o


método ao qual pais e professores mais recorreram na prática educativa. Skinner discorda
dessa prática em vista de suas novas técnicas para controlar o comportamento, no caso, o
emprego de reforços.

18
Prof. Dr. Vicente A. Seibert

Obviamente a punição é um processo diferente do reforço. “Enquanto reforçamento


envolve a apresentação de um reforçador positivo ou a remoção de um negativo, a punição
consiste na apresentação de um estímulo negativo ou a remoção de um positivo” (Conf.
BIGGE, M. 1964. p. 129). As contingências punitivas são exatamente o oposto do
reforçamento. (Conf. SKINNER. 1974. p. 63).
Usualmente se entende a punição como um procedimento disciplinar desagradável
onde uma estímulação aversiva é imposta ao organismo ou a retirada de algum tipo de
recompensa. Exemplos historicamente empregados; agressão física como puxão de orelha,
fazer ajoelhar por certo tempo ou ficar com o nariz contra parede ou no canto do pensamento’,
uma suspensão de privilégios, aplicação de multa ou prisão para quem viola as leis da
sociedade.
Nessa maneira mais usual se entende a punição como um procedimento em que um
individuo (repesentante da ordem social) aplica estímulos desagradáveis a um outro (aluno,
criança , cidadão transgressor). Contudo, a dor de barriga após a ingestão de um alimento
impróprio também é considerada castigo. Da mesma forma o dedo que dói após enfiar no bolo
quente que a mãe acabou de desenfornar. Ou seja, trata-se de conseqüências que atuam sobre
um comportamento, geralmente proibido.

A punição é empregada com a finalidade de reduzir tendências em determinados


comportamentos ou mesmo eliminá-los do repertório de comportamentos do sujeito punido.
A punição é entendida de duas formas. Aplicação de um estímulo desagradável, por
exemplo, castigo físico (neste caso se confunde facilmente com reforço negativo) e pela
supressão de algo agradável para o organismo (geralmente entendido como reforçador
positivo), por exemplo: mesada, um passeio, um bombom.

Aparentemente as pessoas parecem supor que o castigo produz o efeito contrário ao


das recompensas. Se recompensarmos alguém por determinado comportamento, a tendência
será de que seja repetido. Com a punição parece que se espera o contrário, ou seja, que o
comportamento punido seja suprimido. Mas, em geral, não é isso que acontece. Geralmente a
supressão do comportamento indesejado é só temporária e com o passar do tempo ele
reaparece. Thorndike já havia feito experimentos em humanos e mostrou que a recompensa
fortalecia o comportamento precedente, mas a punição não o enfraquecia (Conf. BIGGE, 1964.
p. 130).
A supressão temporária e o retorno do comportamento castigado não se verifica em
todos os casos. Esse, entretanto, não é, em geral, o caso de punições muito severas ou
aplicadas precocemente. Elas destróem o comportamento.

Todavia, conforme exposto acima, geralmente, quando o castigo deixa de ser


aplicado ou perde sua influência, a resposta suprimida volta após determinado período. Ela
retorna pelo fato haver alguma forma de reforço atuando nela. Por essa razão o castigo volta a
ser aplicado de tempos em tempos. Mesmo assim há quem acredita que a punição possui um
poder de controle do comportamento e que é um método eficaz.

19
Prof. Dr. Vicente A. Seibert

Todavia, esse esquema intermitente sustenta o comportamento punidor (dos agentes


punidores). O poder de controle se estabelece porque o punidor é reforçado como tal. Passa a
ser temido, evitado ou mesmo ludibriado (tentativas).

Além da supressão imediata do comportamento punido, a punição possui ainda


outros efeitos importantes. A aplicação repetida de castigos produz um condicionamento
aversivo relativo à situação estimuladora. A criança associa os estímulos que precedem a
punição com ela. Se a mãe diz ‘não, não faça isso’ e depois castiga, a repetição desta situação
leva à associação das palavras com a ação efetuada na seqüência, de modo que com o passar
do tempo a mãe não precisa mais aplicar o castigo. Basta dizer ‘não, não’ e a criança inibe seu
comportamento, pois, anuncia o castigo. (Conf. SKINNER. 1974. p. 63). O mesmo pode valer
para uma carranca numa sala de aulas.
Isso pode parecer benéfico, mas há que considerar que isso pode terminar gerando
ansiedade na criança. Outros condicionamentos como vergonha e culpa podem ocorrer e isso
pode bloquear o comportamento normal do indivíduo e interferir na naturalidade de
desempenhos socialmente aceitáveis como a aprendizagem. Há alunos que têm dificuldades
em testes porque passaram por situações em que estes foram usados como forma de castigo ou
em situações ameaçadoras.
Um outro efeito que a punição produz é a tentativa de evadir-se à estimulação
aversiva (comportar-se de forma a evitar a punição). Assim são desempenhados
comportamentos em que se evita entrar em contato com os estímulos associados com a
situação estimuladora que ocasionou o castigo. A criança que meteu o dedo no bolo ou
encostou na chapa quente fica longe do fogão quando sente que está quente. Mas você não
veria tal criança afastar-se definitivamente da cozinha! Após determinado tempo pelo fato de
evitar a situação estimuladora o castigo não acontece e o sujeito relaxa, ou seja, se enfraquece
o poder reforçador (reforço negativo) dos estímulos que fazem com que evite a situação.
Resultado, ela acaba retornando sempre mais perto até que acontece novamente. Assim se
estabelece um círculo vicioso que às vezes, se repete por muito tempo. Segundo ISAACSON et
alii, a punição pode reduzir a tendência de resposta, mas ela não afeta a força operante. (Conf.
1965. p. 268). De modo que, por meio do castigo é possível perpetuar as respostas que se
deseja eliminar. (Conf. 1965. p. 269).
Os pais gostam de retirar privilégios das crianças como, por ex. proibir de brincar
em determinado horário ou de assistir ao programa favorito, etc. Os professores usam manter
as crianças na sala durante o intervalo, ou excluí-las da sala de aula quando não se comportam.
Os pais mandam para o quarto. Neste caso, ser afastada ou excluída representa uma punição se
o fato da criança estar na sala representa uma situação recompensadora que não deseja perder.
Entretanto, há que considerar um risco: De que a punição gere uma situação em que outras
recompensas se tornam reforçadoras. Uma criança pode preferir ser excluída da sala de aula
caso não ache interessante estar aí ou ter que fazer exercícios chatos. Pode ser mais
interessante correr pela rua e assim um comportamento de fuga pode estar sendo reforçado, o
que atua em desvantagem para o procedimento educativo.

20
Prof. Dr. Vicente A. Seibert

Enfim, por meio da punição o comportamento indesejado não é efetivamente


suprimido, mas a supressão temporária é alcançada a um custo bastante elevado em termos de
eficácia e felicidade. Skinner concluiu que, a longo prazo, a punição resulta em desvantagem
tanto para o sujeito que é punido, quanto para o agente punidor. Contudo, o mesmo não se
verifica no emprego de reforços, os quais podem ser arranjados de modo a serem de
vantagem para ambos. (BIGGE, M. 1964. p. 130).

Uma maneira mais efetiva de lidar com comportmentos indesejados, sugerida a


partir do condicionamento operante é enfraquecer comportamentos recorrendo a outros
procedimentos como a manipulação do reforço. Para Skinner o melhor a se fazer é a
retirada do reforço que sustenta este comportamento. Caso não se possa estabelecer as
condições para efetuar a extinção (retirada do reforço) uma tentativa válida seria
condicionar outro comportamento incompatível com o mesmo no lugar deste. Uma
punição branda poderia auxiliar pelo fato de que a supressão temporária permite reforçar
um comportamento alternativo, mas o reforço positivo direto é sempre melhor pelo fato
de que, ao menos aparentemente, não produz sub-produtos indesejáveis.

Bibliografia e Referências Bibliográficas


BARTZ, Wayne H. (Org.) Readings in General Psychologie, 2ª ed. Iowa State University.
Iowa. (USA), 1969.
BIGGE, Morris L. Learning Theories for Teachers and Parents. Harper & Row. New York,
Evanston, London, 1964.
BUSS, H. Arnold. Psychology Behavior in Perspective. New York: John Wiley & Sons,
1978.
FOSS, M. B. (ed). Determinants of Infant Behavior I. Methuen & Co. London, 1970.
HAYS, Peter. New Horizons in Psychiatry. 3 ed. Harmondsworth (England): Peguin
Books Ltd., 1971.
ISAACSON, R., HUTT, M, and BLUM, M. Psychology The Science of Behavior. New
York: Harper & Row, 1965.
MILLON, Theodore. Theories of Psychopatology and Personality. Philadelphia, London
Toronto, W. B. Sauders Co; 1973.
NUTTIN, Joseph. Tâche Reussite et Echec. Publications Universitaires de Louvain.
Louvain, 1953.
PAVLOV, Ivan. P. Experimental Psychology. New Yok: Philosophical Library, 1957.
______ La Psychopathogie et la Psychiatrie. Moscou, Ed. En Langues Etrangeres, 1961.
SCHELL, Robert E. e HALL, Elizabeth. Developmental Psychology Today. 3 ed. San
Diego, USA: Random House, 1979.
SKINNER, B. F. Beyond Freedom and Dignity. New York: Knopf, 1971.
______ La Scienza dell Comportamento. Trad. Maria Gallone. SugarCo Edizione. Milano.
1974.
ULRICH, Roger, STACHNIK, T. e MABRY, J. Control of Human Behavior. Glenview
(Illinois USA): Scott, Foresman and Co; 1966.

21

Você também pode gostar