Você está na página 1de 5

Condicionamiento operante

También llamado condicionamiento instrumental, el condicionamiento operante


es una forma de aprendizaje distinta del condicionamiento pavloviano. Se
puede distinguir de este último porque el condicionamiento operante concierne
al aprendizaje de la respuesta, mientras que el condicionamiento pavloviano se
enfoca al aprendizaje del estímulo. Tarpy (1941)

La experimentación del condicionamiento operante establece sus inicios en los


experimentos de Thorndike. En estos experimentos se colocaba a los gatos en
una caja truco, cuando se manipulaba el pestillo de la caja, la puerta se abría,
entonces, el gato podía acceder a la comida que se encontraba en el exterior
de la caja.
Cuando se colocaba al gato por primera vez en la caja, se registraban
conductas aleatorias hasta que por casualidad golpeaban el pestillo que abría
la caja. Cuando finalizaba un ensayo, el gato era introducido de nuevo a la
caja. Thorndike observó que con el paso de los ensayos se apreciaba un claro
incremento el la eficiencia para abrir la caja, midiendo esto por ejemplo, en el
tiempo que al paso de los ensayos se volvía menor.
El condicionamiento instrumental debe definirse en función de los procesos
utilizados para fortalecer una respuesta instrumental.

En el condicionamiento instrumental se utilizan términos similares a los del


condicionamiento pavloviano, sin embargo podemos observar diferencias
notables:

Estímulo: Un estímulo condicionado es aquél que sigue a la respuesta, no


hace falta que los estímulos sean explícitos.

Estímulo discriminativo: Es el estímulo que indica si el reforzador está


disponible o no.

Respuesta Incondicionada: Respuesta refleja provocada por el estímulo


incondicionado.
Respuesta Instrumental: Respuesta motora relativamente arbitraria, como
presionar una palanca.

Podemos apreciar que el condicionamiento operante consta también de


diversas fases, cuando la respuesta ya está establecida se dice que hay una
adquisición, mas cuando la respuesta deja de presentarse estamos hablando
de una fase de extinción

El condicionamiento instrumental se puede emplear con cuatro tipos


fundamentales de aplicación:
El condicionamiento de recompensa, el cual es el más común y se emplea
presentando ante una respuesta del sujeto, un resultado deseable o estímulo
apetitivo. Existe también el entrenamiento por omisión, en el cual el resultado
contingente una respuesta es la supresión de un estímulo apetitivo. Otra forma
de condicionamiento instrumental es el castigo, en este procedimiento, el
resultado de la respuesta es un estímulo aversivo o no deseable, esto, provoca
una disminución en la tasa de respuesta. La última de las formas del
condicionamiento operante es el reforzamiento negativo, en el cual la respuesta
es contingente a la supresión de un estímulo aversivo.
En este condicionamiento se presentan fenómenos como el escape y la
evitación, refiriéndonos al escape como la interrupción de un estímulo
condicionado aversivo, y la evitación como la respuesta que un sujeto emite
para evitar la presentación de una situación aversiva cuando ya se encuentra
en ella.

En el condicionamiento operante se define reforzador como aquel estímulo que


eleva las tasas de respuesta y siendo así, el castigo el estímulo que reduce o
anula las tasas de respuesta del sujeto.

El principio Premack nos ilustra cuando una actividad preferible es contingente


y refuerza la ejecución de otra con menos preferencia.
Para el condicionamiento operante debemos tener en cuenta ciertas
especificaciones, como la clase y la topografía de respuesta. El sujeto debe
emitir la respuesta deseada antes de recibir el reforzador. La técnica más
frecuente es el modelamiento por aproximaciones sucesivas a la respuesta, en
este moldeamiento se refuerzan las aproximaciones sucesivas a la respuesta
que queremos como criterio.

Debemos tomar en cuenta también factores como la contigüidad y la


contingencia del reforzador, que probablemente nos llevarán a obtener a tasas
de respuesta deseadas.

En el ambiente natural del sujeto rara vez se refuerzan todas las conductas que
emite, por lo cual las respuestas se estudian también con programas
intermitentes, es decir, que no todas las conductas del sujeto son reforzadas.

En los programas de razón se refuerza al sujeto por el número de conductas


tipificadas que emite, en el programa de razón fija (RF), el sujeto recibe el
reforzador por realizar determinado número de respuestas, se puede presentar
un fenómeno denominado tensión del programa, en el cual existe una
aceleración negativa al incrementar el valor del programa de razón fija.

En el programa de razón variable (RV), el número de respuestas para obtener


el reforzador varía de un reforzamiento a otro y viene definido por el número
medio de respuestas requeridas, la tasa de respuesta de este programa suele
ser alta y estable.

En los programas de intervalo la recompensa se presenta después de


presentarse la respuesta si y solo si ha pasado un tiempo determinado antes
impuesto por el experimentador. En un programa de intervalo fijo (IV) se
refuerza la primera respuesta después de un tiempo constante establecido, en
este programa se presenta un efecto de pausa después del reforzador y un
fenómeno definido como explosión al acercarse la entrega del reforzador.
En el programa de intervalo variable (IV) el tiempo entre la presentación de un
reforzador y otro varía.

En el programa RDB, el sujeto tiene que refrenar su respuesta hasta cierto


periodo de tiempo, si hace esto, se refuerza la siguiente conducta.

La diferencia entre los programas de razón y los de intervalo es que en los


programas de razón se obtiene una probabilidad mayor de tasas más altas,
además que los TERs son más acentuados en los programas de intervalo.

En los programas combinados la recompensa solo es contingente si el sujeto


emite respuestas acordes a los dos programas impuestos. También existen los
programas denominados tándem, en los cuales el sujeto cumple los requisitos
de programas individualmente sucesivos para obtener el reforzador. Podemos
emplear también, los programas encadenados, donde cada programa va
seguido de una clave externa. Los programas mixtos se definen por presentar
varios programas en orden aleatorio y el sujeto puede obtener el reforzador por
cada uno de estos, por último, en los programas múltiples los programas
componentes son señalados por estímulos discriminativos

Se puede hablar de autocontrol cuando observamos una conducta de elección,


es decir que el sujeto puede responder ante un reforzador con una magnitud
importante, pero no ante uno pequeño.

En los programas de reforzamiento intermitente podemos apreciar u fenómeno


común; el aumento en la resistencia a la extinción, aunque también existe el
factor saciedad, el cual impide que las tasas continúen en aumento o
constantes.

Otro factor a considerar es la indefensión aprendida la cual se presenta cuando


las consecuencias aversivas no son contingentes a la respuesta del sujeto.
Aura Gabriela
Camacho Trejo

Universidad
Nacional Autónoma
de México

Grupo 2211

Você também pode gostar