Você está na página 1de 5

TEMA 7: Aprendizaje (II)

CONDICIONAMIENTO INSTRUMENTAL Y OPERANTE

En este condicionamiento los organismos aprenden una asociación, pero diferente a la


anterior: la asociación es entre la conducta realizada por un organismo y las consecuencias que
siguen a dicha conducta.

Thorndike: los gatos y la Ley del Efecto.

De manera simultánea al establecimiento del condicionamiento clásico de Pavlov, Thorndike


formuló las leyes del condicionamiento operante y publicó su tesis doctoral La inteligencia
animal: estudio experimental sobre los procesos asociativos en animales. Thorndike introdujo
gatos hambrientos dentro de cajas, desde donde podían ver y oler la comida pero no
alcanzarla. Los animales aprendieron que, tirando de un trozo de cuerda, se les permitía salir y
llegar hasta la comida. Los gatos aprendieron por ensayo y por error; realizaban un
determinado número de comportamientos diferentes mientras estaban en la caja y acertaban
solo por casualidad. Sin embargo, en cuanto aprendieron el truco, no realizaban aquellos
comportamientos improductivos. Thorndike explicó el aprendizaje de los gatos refiriéndose al
premio que habían conseguido y a la asociación que los gatos habían hecho entre la cuerda y la
comida. Denominó a este proceso la Ley de Efecto, la cual manifiesta que cuando las acciones
de un animal son acompañadas o seguidas de una experiencia satisfactoria, el animal
relacionará tal ejecución con la satisfacción obtenida, y estará más propenso a realizar las
mismas acciones si se encuentra en situaciones similares.

 Principios del condicionamiento operante. Skinner siguió la tradición de Thorndike de


trabajar con animales para descubrir los procesos del aprendizaje. Estas
investigaciones le condujeron a descubrir los principios del aprendizaje operante
(reforzamiento, adquisición, extinción, generalización y discriminación). Skinner
observó semejanzas y diferencias entre el CC y el CO: 1ª  en el CC la asociación se
realiza entre un EC y un EI, mientras que en el CO la asociación es entre las respuestas
y sus consecuencias. 2ª en el CC el EI no depende de la respuesta del sujeto
mientras que en el CO las consecuencias sí dependen de la respuesta de un sujeto. 3ª
 en el CC la respuesta es, generalmente, involuntaria y en el CO es, generalmente,
voluntaria. 4ª en el CC la RC se parece mucho a la RI mientras que en el CO es
arbitraria y no se parece a la forma de reaccionar ante un reforzador.
 Triple relación de contingencia. La contingencia se define como el conjunto de
condiciones temporales bajo las cuales una respuesta va seguida de ciertas
consecuencias. Skinner habla de la triple relación de contingencia para expresar las
relaciones que existen entre la ocasión en que ocurre una respuesta, la respuesta
misma y las consecuencias reforzantes. La contingencia de tres términos es una triple
relación que comprende: eventos antecedentes a la conducta (estímulos
discriminativos), respuesta diferenciadas y eventos consecuentes a la ocurrencia de la
conducta.
 El estímulo discriminativo es un estímulo que antecede a una conducta y cuya función
es la de controlar a ésta. Es el estímulo en cuya presencia la probabilidad de una
conducta operante es elevada. Proporcionan la ocasión para realizar una respuesta.
 Consecuencias y reforzamiento. En el CO las consecuencias de la conducta son
clasificadas de acuerdo a los efectos de la conducta subsecuente. Cuando una
consecuencia incrementa la probabilidad o fortalece la repetición, el proceso se
denomina reforzamiento positivo. Otro concepto fundamental es el de reforzador
negativo. Éste, al igual que el positivo, incrementa la probabilidad de la conducta
cuando se aplica contingentemente a esta, pero la operación es muy diferente: el
reforzador elimina un estímulo que es desagradable para el organismo. A este
estímulo desagradable se le llama estímulo aversivo.

Adquisición, extinción y recuperación

Adquisición. Proceso mediante el cual un organismo aprende una conducta que no estaba en
su repertorio. El proceso está determinado por los siguientes factores: reforzamiento de la
conducta, tiempo entre respuesta y refuerzo, cantidad y calidad de refuerzo, estado
motivacional del organismo (p.ej., mucha o poca hambre)

Extinción. Reducción en la fuerza de una conducta operante condicionada, mediante la


suspensión del reforzamiento. Existen dos tipos de extinción: respondiente y operante. En el
CC la extinción es equivalente al debilitamiento de un reflejo. La persistencia en la tendencia a
emitir la respuesta operante después de que se ha suspendido su reforzamiento se conoce
como resistencia a la extinción.

Generalización. Tendencia a responder con la misma respuesta ante estímulos que son
parecidos (por ejemplo, llamar “Lolo” a perrito y cuando va al parque llamar “Lolo” al gatito o a
la ardilla). La generalización suele ser mayor cuanto más similares sean los estímulos con el
original del condicionamiento. A menudo, la generalización, se atribuye a que no se consigue
discriminar o prestar atención a las diferencias entre los estímulos. Un fenómeno frecuente es
el de denominado gradiente de generalización, una función que relaciona una medida de las
respuestas con los estímulos distribuidos a lo largo de un continuo. La generalización no
ocurre sólo con los estímulos, también se generalizan las respuestas. La frecuencia de
reforzamiento de una respuesta produce un incremento en la frecuencia de otras respuestas
similares. Si un niño ha sido reforzado ante un hombre a decir “papá”, dirá ante ese estímulo
palabras similares como “tatá” o “dadá”.

Discriminación. Diferencias fiables en la conducta en presencia de dos o más estímulos. Se


considera un proceso opuesto a la generalización. La generalización suele ocurrir al comienzo y
durante el aprendizaje, mientras que la discriminación ocurre cuando el aprendizaje está bien
asentado. Un procedimiento para establecer la discriminación es el método de contrastes
(fortalecer una respuesta mientras se debilita otra).
Programas de reforzamiento

Es simplemente un patrón de recompensas que mantiene las respuestas condicionadas.

 Los resultados de los programas de reforzamiento tienen diferentes efectos en la


frecuencia de las respuestas. Si el reforzamiento se basa en el número de respuestas,
la persona tiene más control sobre la temporalidad del reforzamiento. Cuanto más
rápido se acumule el número de respuestas correctas, más rápido llegará el
reforzamiento.
 Reforzadores primarios y secundarios. A lo largo de los años, los psicólogos han
estado interesados por saber qué es lo que hace que un reforzador refuerce. Una de
las primeras explicaciones fue plantada por Hull con su teoría de la reducción de
impulsos.
 Principio de encadenamiento. Consiste en una serie de respuestas enlazadas de tal
manera que los estímulos discriminativos de una respuesta son los reforzadores de la
anterior. Las conductas complejas se dividen en pequeñas unidades de conducta, o
eslabones. Cada eslabón contiene un Ed, una conducta y una consecuencia. El
conjunto de eslabones forman la cadena que es la conducta compleja. El
procedimiento para encadenar conductas complejas se denomina aproximaciones

Principio de Premack

El Principio de Premack remarca que cualquier actividad que un organismo descubre como
favorita (que desarrolla de forma espontánea en estado libre) puede ser usada como
reforzador para incrementar aquellas conductas que se dan con baja frecuencia. Ejemplo: los
profesores prometen a sus alumnos que si realizan determinadas actividades pesadas, podrán
disfrutar de actividades deseadas por ellos.
Medición de la conducta operante

Existen dos procedimientos para hacer que la conducta ocurra. Uno de los procedimientos es
el de ensayos discretos (Thorndike). Se coloca al animal en una caja, y él debe descubrir la
forma de salir para obtener la recompensa. En estas condiciones, después de que el animal
sale y consume la comida, hay que volver a meterlo en la caja para iniciar un nuevo ensayo.

El otro procedimiento, utilizado por Skinner, se denomina operante libre. La característica


básica de este experimento es que la emisión de cada respuesta deja al organismo libre para
responder nuevamente, puesto que ni es sacado del ambiente experimental ni se retira el
mecanismo de respuesta.

Parámetros para medir el CO:

 Tasa de respuesta: número de respuestas por unidad de tiempo.


 Latencia: lapso transcurrido entre el inicio de una estimulación y la emisión de una
respuesta.
 Tiempo entre respuestas: tiempo que transcurre entre la ocurrencia de dos
respuestas.
 Probabilidad: probabilidad de emisión de una conducta dentro de un intervalo
específico
 Amplitud de respuesta: la intensidad o amplitud de respuesta puede ser la fuerza del
picoteo.

Medición de la conducta humana

El CO tiene grandes aplicaciones a la conducta humana, esa tecnología se ha concretado en


una especialidad aplicada denominada modificación de conducta. En esta especialidad, una de
las condiciones para intervenir en definir con claridad el nivel operante, es decir, el nivel de
frecuencia al que ocurre una respuesta antes de ser intervenida. El período en el que se hacen
los registros de nivel operante se llama período de línea basal. Para registrar una conducta, la
forma más sencilla es ir anotando una marca cada vez que ésta ocurre, pero este método es en
caso de que la conducta sea poco frecuente. Para registrar conductas que ocurren con mucha
frecuencia se utiliza una técnica llamada muestreo de tiempo. Con esta técnica, la conducta se
registra cada x horas.

Paradigmas experimentales operantes

 Paradigma de recompensa, la conducta es seguida de un reforzador positivo, no suele


haber Ed. Con este paradigma se ha podido descubrir algunas relaciones:
o Contingencia entre respuesta y reforzamiento y el efecto de la demora del
reforzamiento
o Magnitud del reforzamiento, a mayor magnitud del reforzamiento más rápido
será el aprendizaje o condicionamiento.
o Nivel del impulso, referido al estado motivacional
o Calidad del reforzamiento, no es lo mismo comer un filete que un plato de
pasta, una fruta o un helado (la relación no es muy sustentada)
 Paradigma de escape. Existe una condición presente en el ambiente (reforzador
negativo), cuya eliminación es un reforzador para el organismo. La conducta de escape
está condicionada por: la intensidad del estímulo incondicionado, cantidad de
reforzamiento y demora en la terminación de la descarga.
 Paradigma de evitación. Se caracteriza porque la conducta del animal trae como
consecuencia la no aparición de un estímulo aversivo. Las variables que afectan este
paradigma son: la intensidad del EI, el intervalo entre EC y EI, intervalo entre ensayos y
aprendizaje previo.
 Teoría de los dos factores de Mowrer. Mowrer plantea que, un animal, en una
situación de aprendizaje de evitación, aprende a dar una respuesta emocional
condicionada – temor – al sonido que precede al estímulo doloroso. Mowrer consideró
el desarrollo del aprendizaje de evitación como un proceso de dos etapas: aprender a
evitar un estímulo desagradable y aprender una asociación de ER entre la situación,
incluyendo el EC y una respuesta que haría que el organismo se alejara del sonido.

Indefensión aprendida

La indefensión es la convicción, por parte de un animal o una persona, de que ha perdido el


control, de que nada de lo que pueda hacer reportará cambio alguno en ningún aspecto
importante de su vida. Explicaciones similares pueden utilizarse en el maltrato físico de
mujeres y niños.

 Paradigma de castigo. Modelo de condicionamiento operante en el que la conducta va


seguida de un evento negativo. Para que sea efectivo el castigo debe aplicarse bajo
ciertas condiciones: modo de presentación, intensidad del castigo, inmediatez del
castigo, duración del castigo, constancia y reforzamiento de conductas incompatibles.

Efectos secundarios del castigo. El uso de procedimientos que impliquen acciones


desagradables debe ser manejado con cautela. El castigo puede tener varios efectos negativos
secundarios, pues la mayoría de nosotros tenemos una fuerte respuesta emocional ante él.
Todos tendemos a evitar la gente o las situaciones que en un pasado nos han causado dolor o
sufrimiento. El intento de evitar o escapar de situaciones desagradables, es también una
respuesta predecible. Si las consecuencias de suspender un examen son muy severas, el
alumno aprenderá a copiar, al igual que, si las consecuencias de asistir a clase son
desagradables, los estudiantes pueden hacer novillos.

Técnicas de modificación de la conducta

Estas técnicas han resultado muy útiles para el control del comportamiento. Ideas
superficiales sobre algunas de las técnicas más comunes: moldeamiento, desvanecimiento,
economía de fichas (token economic), contrato de contingencias y concentración en las
conductas positivas.

Você também pode gostar