Você está na página 1de 21

Psicologa del aprendizaje

Cristina Gil

TEMA 6: CONTROL DE LA CONDUTA POR ESTMULO


1. CONTROL PAVLOVIANO Y CONTROL OPERANTE
Como ya sabemos las RI se dan ante determinados EI, y mediante el condicionamiento clsico esa
respuesta se puede dar ante otro estmulo, el EC, de forma que tanto el EI como el EC elicitan respuestas
reflejas, RI y RC.
En la conducta operante en cambio, la respuesta no es disparada de forma automtica por la presencia de
un evento antecedente (EI o EC). La emisin de la respuesta depende de muchos factores, por lo que su
prediccin es una probabilidad. Esta probabilidad viene determinada por las consecuencias que le han
seguido en el pasado, por la motivacin del individuo, por los costes que tiene, etc. Esto no quiere decir
que la conducta operante no est controlada por la estimulacin antecedente. Los procedimientos de CO y
los programas de refuerzo/castigo aumentan o disminuyen la probabilidad de que una conducta se emita
en el futuro, siempre dentro de algn contexto. Y cuando ese contexto es contingente con la presencia de
algn procedimiento y/o programa, adquiere propiedades de control sobre la operante. Que haya muchas
variables dependientes no implica la negacin de cada una de ellas por separado, solo hay que tener ms
elementos en cuenta para mejorar la prediccin/control de la conducta.
Los eventos de control en la conducta operante, el contexto al que nos referimos, se denominan estmulos
discriminativos (Eds) y pueden ser positivos o negativos. Los estmulos discriminativos positivos (Ed+ o E+),
tambin llamados simplemente discriminativos son los que mantienen una contingencia positiva con el
reforzamiento de alguna conducta, ya sea mediante un entrenamiento de recompensa (reforzamiento
positivo) o de escape/evitacin (reforzamiento negativo). Los estmulos discriminativos negativos (Ed- o E-),
tambin llamados estmulos delta, seran aquellos contingentes con el castigo (castigo positivo), con el
entrenamiento de omisin (castigo negativo), o con la extincin de una conducta. La presencia de un Ed+
aumenta las probabilidades de que se emita la conducta con cuyo reforzamiento ha sido contingente, y la
presencia de un Ed- disminuye esa probabilidad. Es importante sobre los Eds saber que:
1. Un mismo Ed puede modificar la probabilidad de emisin de varias conductas, no son exclusivos.
De la misma manera una conducta puede estar bajo el control de diferentes Eds
2. La presencia de un Ed no modifica la probabilidad de cualquier operante, solo de aquellas con las
que ha mantenido alguna relacin de contingencia con su reforzamiento, castigo o extincin
3. La presencia de un Ed no implica la aparicin de un reforzador o estmulo aversivo por s mismo,
indica que existe una alta o baja probabilidad de que tras emitir la conducta esta sea reforzada o
castigada.
4. Si una conducta est bajo el control de un Ed+ debe haberse condicionado tambin uno o ms
Ed- para esa misma conducta, y a la inversa.
5. De la misma forma que el control de un EC puede extinguirse, el control de un Ed puede
desaparecer si la conducta deja de mantener la contingencia que mantena durante la adquisicin
con la consecuencia.
De la misma forma que en el aprendizaje de CC no se puede entender la respuesta refleja sin el estmulo
que la desencadena, en anlisis de la respuesta operante debe tener en cuenta a los discriminativos que la
controlan. sta es la contingencia mnima pero no la nica, la cantidad y complejidad de los estmulos de
control pueden, y de hecho suelen, aumentar extraordinariamente.

Psicologa del aprendizaje

Cristina Gil

2. GENERALIZACION Y DISCRIMINACIN
Desde la perspectiva funcional, un estmulo puede ser cualquier evento siempre y cuando su presencia
produzca alguna reaccin en el sujeto. Cada evento se etiqueta segn el papel que representa respecto a
otros eventos.
Desde la perspectiva estructural o topogrfica (basada en propiedades fsicas) un estmulo puede ser
exteroceptivo si proviene del medio externo, o interoceptivo si proviene del medio interno (como el latido
del corazn, malestar gstrico). Otra posible distincin son los estmulos propioceptivos, que son aquellos
generados por la posicin y el movimiento del cuerpo. Una ltima distincin, algo ms compleja, son los
estmulos relacionales, que son aquellos que dependen de la conexin que mantienen entre s dos o ms
elementos. Por ejemplo si reforzamos la respuesta decir igual ante dos figuras idnticas, pero la
castigamos ante dos figuras diferentes, el E+ que adquiere el control no es ni cada figura por separado ni el
conjunto, sino la relacin que mantienen entre s.
Lo ms importante es saber que desde el punto de vista estructural, los estmulos estn compuestos por
rasgos o propiedades. Un crculo rojo puede ser un estmulo unitario, pero est formado por diferentes
propiedades, como tamao, color, tacto, velocidad a la que se mueve Y esas propiedades pueden ser
compartidas por otros eventos que el observador etiqueta como estmulos diferentes. Todos los estmulos
comparten algn rasgo y todos se diferencian de los dems en algn otro. No existen ni dos
completamente iguales, ni dos completamente diferentes. Por eso ante estmulos semejantes puede ser o
no adaptativo comportarse de la misma manera dependiendo de las exigencias del entorno, y para
ajustarse a esas exigencias los organismos han desarrollado dos capacidades complementarias y contrarias:
la generalizacin y la discriminacin.
Cuando un estmulo adquiere cierto control sobre la conducta (EI, EC o Ed) todos los rasgos que lo
componen adquieren cierto grado de control, probablemente algunos ms que otros. Esto implica que
cualquier estmulo que comparta alguno de esos rasgos, tambin puede ejercer cierto control sobre esa
conducta del sujeto, y cuntas ms o menos propiedades compartan, el control ser ms o menos parecido
al que ejerce el estmulo que se ha condicionado. Por tanto aunque no hayamos tenido experiencia con
algn estmulo, dependiendo de lo que se parezca (comparta rasgos) a un EI, EC o Ed, controlar nuestra
conducta. Este fenmeno se denomina generalizacin del estmulo y es considerada por algunos autores
como una capacidad innata seleccionada por su valor adaptativo, porque permite comportarnos de
manera efectiva ante estmulos nuevos.
Pero no siempre lo adaptativo es responder de la misma forma ante estmulos diferentes (generalizar), en
ocasiones pequeas diferencias entre estmulos pueden tener consecuencias completamente diferentes
para la misma topografa de conducta. Por ejemplo la llave del coche puede ser casi igual que la de nuestra
casa, pero meter la llave en una u otra cerradura tiene consecuencias diferentes. La discriminacin
consiste en responder de manera diferente ante estmulos diferentes, y al contrario que la generalizacin,
esta capacidad requiere de entrenamiento. A este entrenamiento se le denomina condicionamiento
discriminativo o reforzamiento diferencial, y al comportamiento resultante conducta discriminativa o
respuesta diferencial.
Hay dos tipos de entrenamiento discriminativo, que ms adelante se explican detalladamente, pero a
modo de ejemplo seran:
a) Control pavloviano. Presentamos de forma contingente positiva un sonido (EC1) y una descarga (EI)
mientras que hacemos que una luz (EC2) mantenga contingencia nula con la descarga.
2

Psicologa del aprendizaje

Cristina Gil

Consideramos que existe control por el estmulos si la RC excitatoria aversiva solo es elicitada en
presencia del EC1 y no del EC2, es decir si el sujeto discrimina entre el EC1 y EC2. Si la respuesta se
da ante los dos estmulos, o no se emite ante ninguno, no existira tal control.
b) Control operante: hacemos que el reforzamiento positivo de una conducta correlacione
positivamente con la presencia de una luz roja (E1) y negativamente con la luz verde (E2). Si el
sujeto emite la respuesta correcta (R) con una tasa mayor (o ms frecuentemente, o ms
intensamente) en presencia del E1 que en presencia del E2, consideramos al a luz roja como un Ed+
para esa conducta, y a la luz verde como un Ed-. La ejecucin del sujeto prueba de esta forma que
discrimina entre ambos estmulos, es decir que su conducta se encuentra bajo el control de stos.
Aspectos importantes respecto a la dicotoma generalizacin/discriminacin:
1. El control por el estmulo es un continuo en cuyos extremos se encuentran la generalizacin y la
discriminacin, en posiciones opuestas. Esto significa que cuando un sujeto est demostrando una
alta generalizacin tambin podra etiquetarse como una baja discriminacin, y a la inversa. Se
considera que existe un mayor control por el estmulo cunto mayor es la discriminacin
demostrada, mientras que ante un alto grado de generalizacin se estima que el control por el
estmulo es bajo.
2. La generalizacin no es ms adaptativa que la discriminacin, ni al contrario. Que una cosa u otra
sea ms adaptativa va a depender de las exigencias del ambiente. La generalizacin de un estmulo
va descendiendo a medida que el sujeto es expuesto a reforzamiento diferencial ante variaciones
de dicho estimulo. No obstante, en trminos generales, cunto mayor es nuestra discriminacin
entre los estmulos ms fino es nuestro ajuste al medio, ya que emitimos respuestas diferenciales
ante pequeas variaciones del contexto.
3. La generalizacin y la discriminacin se pueden producir con todos los estmulos que ejercen
control sobre la conducta, incluido los estmulos discriminativos. Los Eds (a pesar de su nombre)
estn sujetos tambin a la generalizacin. Cualquier modalidad de paso de cebra, por ejemplo,
puede ejercer el mismo control sobre nuestra conducta de cruzar la calle que la que ejerce la
modalidad concreta con la que se ha condicionado dicha respuesta, por supuesto, este control va a
depender de cuanto se parecen.

3. MEDICIN DEL CONTROL POR EL ESTMULO: LOS GRADIENTES DE GENERALIZACIN


Pavlov ya observ el fenmeno de la generalizacin de estmulos en sus experimentos. Hay varias teoras
explicativas del fenmeno, que se explican a lo largo del captulo, pero independientemente de a cul nos
acojamos, el hecho es que el control que un estmulo no entrenado (estmulo de prueba o generalizado)
ejerce sobre una conducta es directamente proporcional a su semejanza con el estmulo que adquiri ese
control durante un proceso de condicionamiento (E+ o E- original o criterio). Podemos comprobar esta
relacin a travs de varios mtodos o procedimientos:

Psicologa del aprendizaje

Cristina Gil

1. Estmulo nico. Consiste en entrenar varios grupos de sujetos para que un estmulo adquiera cierto
control (convirtindolo en un E+ o en un E-) y despus exponer a cada grupo a un estmulo de prueba
diferente, en cuanto a su parecido con el estmulo original. Comparando la respuesta entre los grupos
ante el estmulo de prueba se observara que cuanto mayor es el parecido de ste con el estmulo
original mayor es la fuerza (probabilidad, tasa, intensidad, etc.) de la respuesta.
2. Estmulos mltiples. Tras entrenar el estmulo criterio se presenta junto a otros estmulos diferentes,
uno cada vez, y en extincin (sin que aparezca la consecuencia tpica de la fase de adquisicin). Se
medira la fuerza de la respuesta ante todas las combinaciones entre el estmulo original y los estmulos
de prueba en cada sujeto. Fuerza que, tericamente, debera decrecer en funcin de lo distinto que sea
el estmulo de prueba que se presenta junto al original.
3. Generalizacin mantenida. El ltimo de los mtodos que vamos a ver consiste en alternar ensayos
reforzados con el estmulo criterio con ensayos en los que se presenta algn estmulo de prueba en
extincin. De esta forma, el sujeto tiene experiencia con todos los estmulos de prueba generalizados
varias veces y en orden aleatorio.
El uso de un mtodo u otro conlleva ventajas y desventajas. En los procedimientos de Estmulos Mltiples y
de Generalizacin Mantenida los sujetos son expuestos a todas las combinaciones estmulos originalprueba o estmulos de prueba seleccionados por el experimentador. El orden en el que stos son
presentados puede alterar la fuerza de la respuesta. La presentacin repetida y aleatoria de dichos
estmulos (o compuestos), e incluso el contrabalanceo del orden en el que aparecen, es una forma de
controlar ese efecto. El procedimiento de Generalizacin Mantenida, adems, asegura el control del
estmulo original ya que el sujeto sigue teniendo experiencias reforzadas con l, pero alternar ensayos
reforzados con el E+ con ensayos en extincin con los estmulos de prueba puede favorecer la
discriminacin del estmulo original, provocando que los resultados muestren una menor generalizacin.
Los procedimientos de Estmulo nico, sin embargo, aunque son ms costosos, ya que al realizar
comparaciones entre grupos requieren de ms tiempo y recursos, evitan la posible influencia en la
respuesta de la experiencia con varios estmulos de prueba. Sin embargo, como cualquier estudio de
grupo, el control de variables individuales es menor que en los estudios de caso nico.
Independientemente del mtodo que se utilice, el
fenmeno es suficientemente robusto para
mostrar una relacin sistemtica entre el
parecido de los estmulos prueba con el estmulo
original y la cantidad de control que ejercen
sobre la conducta. La representacin grfica a
este decremento en la fuerza de la respuesta en
funcin del alejamiento del parecido con el
estmulo criterio, es lo que se denomina una
gradiente de generalizacin.
El control por estmulo no se limita a que en presencia de cierto evento aparezca una determinada
respuesta. Los Ed- tambin ejercen control sobre la conducta, ya que en su presencia esa respuesta es muy
improbable, podramos decir que controlan su no aparicin o la aparicin de otras respuestas diferentes.
De la misma forma, los estmulos condicionados inhibitorios tambin ejercen control sobre la respuesta,
aunque sta no pueda medirse directamente (lo que suele denominarse como silencio conductual).

Psicologa del aprendizaje

Cristina Gil

La exposicin a estmulos generalizados semejantes a discriminativos positivos o ECs excitatorios generan


gradientes, como el de la Figura 1, con forma de U invertida, en los que la mayor cantidad de respuesta se
observa en los valores cercanos al E+ original y van decreciendo segn se alejan de l, tanto si disminuye
como si aumenta el valor del rasgo. A este tipo de gradientes se les denomina excitatorios. No obstante, si
los estmulos de prueba se parecen a discriminativos negativos o a ECs inhibitorios el tipo de gradientes es
muy diferente.
Un experimento prototpico fue realizado por Weisman y Palmer, en el que usaron la tcnica de sumacin
como medida indirecta del control de los estmulos delta (Ed-).
Los autores entrenaron como E+ una tecla verde
y como E- una tecla verde con una lnea vertical
blanca, despus presentaron en la prueba de
generalizacin la tecla verde cruzada por lneas
con diferente inclinacin cada vez (de -30 a
+30). En la Figura 2 puede verse cmo el nmero
de respuestas registrado va aumentando a
medida que el estmulo de prueba presentado se
diferencia ms del E- original. El gradiente
inhibitorio, al contrario que el excitatorio, tiene
forma de U y suele ser menos inclinado.
La forma del gradiente no slo nos informa de la naturaleza del estmulo de control original (E+ o E-), sino
tambin, en funcin de la pendiente del gradiente, del grado de generalizacin/discriminacin que
demuestra el sujeto. En trminos generales, cunto ms plana es la pendiente que forma ms
generalizacin se ha producido (menos discriminacin) y cuando ms inclinado menos generalizacin (ms
discriminacin). La explicacin es que un alto grado de respuestas diferenciales (mucha discriminacin,
poca generalizacin) implica que la mayora de respuestas se dan de forma exclusiva ante el estmulo de
control original, o ante los que se parecen mucho, de manera que cambios sutiles son suficientes para que
los estmulos de prueba no controlen la respuesta objetivo. De la misma forma, si el sujeto sigue
respondiendo aunque los estmulos presentados difieran mucho del discriminativo (o EC) original
obtendremos un gradiente plano. En la Figura 3 se muestran dos ejemplos de gradientes propios de una
alta discriminacin y otros dos propios de una alta generalizacin, uno excitatorio y otro inhibitorio.
Las gradientes de generalizacin nos permiten
confirmar o no la existencia de respuestas
diferenciales y tambin determinar cunto tiene
que modificarse el ambiente para producir un
cambio en la conducta del individuo. La forma
que adquiere una gradiente de generalizacin, es
decir, el grado de generalizacin o discriminacin
de un estmulo, est determinada por diversos
factores relacionados tanto con el propio
estmulo como con la experiencia previa o con el
tipo de entrenamiento de discriminacin.

Psicologa del aprendizaje

Cristina Gil

4. CONTROL CONDICIONAL
Las situaciones simples, en las que un solo estmulo causa una determinada conducta, son fciles de
replicar en un laboratorio, pero no son habituales en contextos fuera del mismo. Las causas que
determinan que realicemos una conducta u otra son complejas, es decir, dependen de ms de una variable
(sin contar factores motivaciones, de historia, genticos) y, lo que lo hace ms complejo an, de la
interaccin de esas variables entre s.
Cuando el control que ejercen ciertos estmulos sobre nuestra conducta est matizado, o depende de la
presencia de otros eventos consideramos que estamos ante un caso de control condicional. Es importante
sealar que estos eventos no afectan directamente a la conducta sino que lo hacen a travs de los
estmulos de control simple (modificando su funcin), de hecho, su presencia en solitario no ejerce ningn
control especfico sobre el comportamiento.
El control condicional implica la adicin de un nuevo trmino a la contingencia mnima. En el CC o
pavloviano la contingencia simple de EC y el EI requiere un evento diferente, denominado modulador para
convertirse en contingencia de control condicional. En el CO, la contingencia mnima est formada por EdR-Er, y el nuevo evento de control, denominado estmulo condicional, aumentara el nmero de elementos
de la contingencia a cuatro.

4.1. Modulacin
Los pioneros del estudio del control condicional en el CC fueron Rescorla y Holland, que empezaron a
estudiarlo casi simultneamente y de forma paralela a mediados de los 80. Por eso existe cierta duplicidad
de trminos para referirse al estmulo de control condicional, porque Holland lo denomin Establecedor
de la ocasin y Rescorla Facilitado y desde entonces se han utilizado ambos indistintamente. De hecho
tambin pueden usarse tanto establecimiento de la ocasin y facilitacin como modulacin para
referirse al control condicional pavloviano.
En una situacin de modulacin la contingencia que mantienen el EC y el EI depende de la aparicin de un
estmulo anterior. Por ejemplo, si tras una luz, la aparicin de un sonido va seguida de comida, pero en
ausencia de la luz, el mismo sonido no va seguido de comida, la luz terminar modulando la funcin del
sonido como EC excitatorio apetitivo. El esquema sera:
Luz sonido (EC) - comida (EI)
//
Luz no sonido (EC) no comida (EI) //

no luz sonido (EC) no comida (EI)


no luz no sonido (EC) comida (EI)

Se pueden observar en este hipottico experimento dos cuestiones importantes:


1. La contingencia EC-EI es positiva tras la presentacin de la luz, (luz EC-EI // luz noEC noEI) pero es
negativa cuando no ha aparecido la luz. En trminos de control de respuesta, tras la presentacin
de la luz el EC elicita una respuesta condicionada excitatoria apetitiva, mientras que en ausencia de
la luz la respuesta elicitada por el mismo EC es inhibitoria apetitiva.
2. La luz (el modulador) no mantiene ninguna relacin de contingencia con la aparicin del EI, ni
negativa ni positiva. Si ignoramos del esquema anterior el EC, es decir el sonido, vemos que la luz
predice la presentacin comida con un 50% de probabilidad, y la no presentacin tambin con un
50%. Vamos, que no predice en absoluto, ya que no hay una contingencia, no es informativa.
Esto confirma que los estmulos que adquieren propiedades moduladoras no elicitan por si mismos
respuestas, ni excitatorias ni inhibitorias, sino que modifican la funcin de los EC con los que se asocian. La
exposicin frecuente de un modulador en solitario no hace que pierda su efecto, es decir no hay extincin
siempre que no se quiebre la conexin que mantuvo con la relacin EC-EI en la adquisicin.
6

Psicologa del aprendizaje

Cristina Gil

4.2. Discriminacin condicional


Lashley es considerado el pionero en definir este fenmeno, as como en indicar las propiedades fsicas de
los estmulos controladores. En su experimento expuso a tres ratas en cajas de salto a una tarea en la que
los Eds eran siempre un par de tringulos equilteros, uno hacia arriba, y el otro invertido. Los dos
aparecan en cada ensayo, aunque variaba el fondo cada vez que las ratas conseguan 20 ensayos sucesivos
sin error. Cuando el fondo era negro, se les forzaba a saltar hacia el tringulo que apuntaba arriba, y
cuando el fondo era blanco se las requera saltar hacia el que estaba invertido. Con este experimento se
estableci una clase de control de estmulo sobre los sujetos, de manera que la direccin o sentido de la
reaccin era condicional con respecto a un estmulo adicional de la situacin, lo que el autor denomin
reaccin condicional. Ms tarde l mismo demostr que se poda alterar aleatoriamente el fondo de un
ensayo a otro sin perjudicar la ejecucin de los sujetos, es decir que mantenan el control adquirido.
Las discriminaciones condicionales se definen como aquellas situaciones de control operante en las que la
funcin de los Eds (como positivos o negativos) depende de la presencia de otro evento, el estmulo
condicional. En muchas ocasiones a los estmulos condicionales se les etiqueta como Muestras y a los Eds
como Comparaciones.
Por tanto la contingencia operante en este tipo de situaciones aumenta de tres (Eds respuesta
consecuencia) a cuatro trminos (Eds R C E. condicional) lo que se podra esquematizar as:
E. condicional1 Ed1 R C

// E. condicional1 Ed1 no R no C

E. condicional1 Ed2 R no C

//

E. condicional1 Ed2 no R C

E. condicional2 Ed1 R no C //

E. condicional2 Ed1 no R C

E. condicional2 Ed2 R C

E. condicional2 Ed2 no R no C

//

En este ejemplo, la presencia del estmulo condicional 1 convierte al Ed1 en un discriminativo positivo para
la conducta R, y al Ed2 en un discriminativo negativo para la misma conducta. Sin embargo el estmulo
condicional 2 convierte al Ed1 en un discriminativo negativo, y al Ed2 en discriminativo positivo. La
presencia de un estmulo condicional u otro determina la funcin del Ed y por tanto su control sobre la
conducta. El estmulo condicional por s solo no controla ninguna respuesta, sino la interaccin entre el
condicional y el discriminativo.
Ejemplo: podemos considerar que el interruptor de la luz es un Ed para la conducta de pulsar, pero su
funcin depende de otros eventos, como que la luz ya est encendida o que sea de da. En presencia de
la luz (EC1) el interruptor (Ed1) cumple funciones de Ed- para la conducta de pulsar, en presencia de la
oscuridad (EC2) sus funciones seran de Ed+.
Aunque los estudios de las discriminaciones condicionales son muy extensos y diversos, la mayora de ellos
son modificaciones de un procedimiento pragmtico con estmulos visuales y palomas como sujetos, que
es el procedimiento de tres teclas. En este procedimiento el e. condicional es presentado en la tecla central
de una cmara operante, y los Eds aparecen en las teclas laterales, equidistantes de la tecla central y del
comedero dnde se dispensa el reforzador.
Las medidas tpicas de ejecucin en una discriminacin condicional son la velocidad de adquisicin (n1 de
ensayos hasta un determinado criterio de aprendizaje) y la precisin (porcentaje de ensayos con respuesta
correcta). Otra medida que se relaciona con la precisin es la latencia. La manipulacin de diversas
variables puede facilitar o dificultar la ejecucin de los sujetos expuestos al aprendizaje de
7

Psicologa del aprendizaje

Cristina Gil

discriminaciones condicionales. Por lo general estas variables afectan simultneamente a la velocidad de


adquisicin de aprendizaje y tambin al nivel asinttico que los sujetos llegan a alcanzar.
Hemos visto que la presencia de un e. condicional u otro modifica la funcin del Ed (como positivo o
negativo). Esta relacin de control estimular puede seguir extendindose aadiendo un nuevo estmulo
que, en este caso, cambie la funcin del e condicional, que a su vez modifica la del Ed. Es una cadena de
control estimular, y al nuevo estmulo se le denomina de segundo orden, selectores o informativos.
En un procedimiento tpico de discriminacin condicional de segundo orden (Figura 4) se presenta un
estmulo complejo informativo que ejemplifica el criterio de igualacin que debe cumplirse al
seleccionar un estmulo de comparacin respecto al estmulo de muestra.

El criterio de igualacin que determina el estmulo de segundo orden puede ser de igualdad (cundo se
muestran dos estmulos fsicamente idnticos); de semejanza (cuando los elementos que forman el
estmulo de segundo orden comparten ciertos rasgos pero difieren en otros); o de diferencia (cuando no
comparten ningn rasgo significativo).
Este procedimiento es diferente a las discriminaciones condicionales de primer orden. en una igualacin a
la muestra de segundo orden es necesario que el sujeto sea capaz de describir verbalmente la relacin
entre los estmulos de segundo orden, ya que en caso contrario su presencia podra interferir: a) la
presentacin visual gana en complejidad al haber una mayor cantidad de estmulos presentes, b) los
estmulos de segundo orden pueden ser incluidos como parte del arreglo de comparacin de primer
orden.

5. FACTORES QUE AFECTAN AL CONTROL POR EL ESTMULO


En trminos generales, cunto ms se diferencien dos situaciones ms sencillo es distinguirlas, y cundo
ms se diferencien los elementos que las componen mayor ser la diferencia global. Siguiendo esta lgica y
cindonos a una contingencia operante, si exponemos a un sujeto a un entrenamiento tipo Ed1-R1-C1 /
Ed2-R2-C2, cunto ms se diferencien Ed1 de Ed2, R1 de R2, y C1 de C2, mayor ser la diferencia global
entre ambas contingencias y ms fcil ser distinguirlas, o lo que es lo mismo, discriminar entre ellas.
Hacer ms distintivos los eventos de control (los estmulos que sealan diferentes contingencias de
reforzamiento), requerir respuestas diferenciales o aplicar consecuencias distintas, son mtodos que
aumentan la velocidad de adquisicin de la discriminacin. La mayor parte de las variables que vamos a ver
pueden entenderse bajo esta norma, pero no son las nicas.
8

Psicologa del aprendizaje

Cristina Gil

5.1. Relacionados con los estmulos


5.1.1. Capacidad sensorial
Para que un evento adquiera control sobre la conducta de un organismo es imprescindible que funcione
como un estmulo para dicho individuo, y esto no siempre es posible. La parte de la realidad ante la que
podemos reaccionar es como mximo aquella para la que nuestros rganos sensoriales estn preparados.
Existen sonidos, olores y colores fuera del rango de audicin, olfato y vista humano que s funcionan como
estmulos para otras especies. Las diferentes presiones de supervivencia que cada especie ha tenido que
superar han seleccionado rganos sensoriales con capacidades distintas, que permiten reaccionar ante
unos eventos y no ante otros. Tambin se dan diferencias entre individuos de una misma especie, aunque
en menor grado.
La orientacin del sujeto respecto al evento aade una nueva limitacin a la parte de la realidad que puede
funcionar como estmulo, por ejemplo el valor del rasgo tamao va a ser muy diferente segn la
distancia que separe el objeto del observador. El evento es nico, el estmulo es diferente para cada
individuo.
5.1.2. Facilidad relativa de condicionamiento de los elementos de un compuesto
Ya hemos visto que ciertas variables hacen que el CC y el CO se den en mayor o menor medida. Diferencias
en la saliencia entre varios estmulos (por intensidad, relevancia, funcin) puede dar lugar a un fenmeno
de ensombrecimiento cuando se condicionan a la vez, determinando cul de ellos adquiere control sobre
la conducta refleja y cul no. Este mismo fenmeno puede afectar al CO, si un Ed est constituido por dos
componentes, la adquisicin del control por parte del componente menos saliente puede ser impedida por
la presencia de un componente ms eficaz. El ensombrecimiento indica que los estmulos pueden competir
por adquirir el control sobre la conducta, de manera que los ms intensos o destacables dificultan el
condicionamiento de los ms dbiles.
5.1.3. Modalidad sensorial
Hay una gran variedad de estmulos que se pueden utilizar con xito en los estudios, aunque los ms
comunes con animales han sido los visuales, concretamente teclas iluminadas de distintos colores o con
lneas en distintas orientaciones. Tambin se han usado sonidos, imgenes en movimiento, objetos
tridimensionales, olores o incluso estmulos interoceptivos.
Como decamos los visuales son los ms comunes. En las aves su sistema visual las hace especialmente
apropiadas para discriminar este tipo de estmulos. Los estudios con palomas han permitido determinar
que ciertas caractersticas de las imgenes son ms efectivas que otras en el entrenamiento de
discriminacin, por ejemplo tienen mayor precisin cuando los estmulos de muestra son colores.
5.1.4. Discriminabilidad
Intuitivamente hablamos de discriminalidad como lo fcil o difcil que resulta distinguir un estmulo de
otro. Operativamente podramos definirlo como el cambio en la estimulacin necesaria para producir un
cambio en el comportamiento. Se ha encontrado que, cuanto mayores son las diferencias en las
caractersticas fsicas de los estmulos, ms sencilla es la tarea de discriminarlos.
No solo tenemos que referirnos a caractersticas fsicas de los estmulos como medida fiable de
discriminalidad, existen muchas influencias ambientales en este proceso. Por ejemplo factores inherentes
a las situaciones experimentales, como la exposicin a los estmulos, influyen tanto en la discriminalidad
como en la asociabilidad de stos y en la respuesta de observacin que producen.
9

Psicologa del aprendizaje

Cristina Gil

5.1.5. Intensidad de los estmulos discriminativos


En general, la intensidad de los Eds entrenados afecta de manera muy aguda a los gradientes de
generalizacin, hacindolos menos simtricos y desplazando el mximo de respuesta ante un valor
diferente al Ed+ original. Aunque se puede pensar que esto pasa por un efecto energizador de la
conducta (por el nivel de intensidad) se ha observado que ocurre lo mismo ante un Ed+ dbil y un Edintenso. La mayora de los gradientes generados por estmulos de prueba intensos suelen responder a una
funcin monotnica, en lugar de una curva con un mximo de respuesta. Esta funcin es creciente cuando
el Ed+ es ms intenso que el Ed-, y decreciente en el caso inverso.
5.1.6. Aprendizaje del rasgo positivo
Cuando el elemento predictivo nico que distingue al E+ del E- forma parte fsicamente de la presentacin
del E+, los sujetos aprenden con mayor facilidad que cuando el rasgo distintivo forma parte de la
presentacin del E-. En su estudio los autores entrenaron a un grupo de palomas para picotear una tecla
verde con un cuadrado blanco superpuesto a cambio de comida (E+) y a no hacerlo cuando la tecla era slo
verde (E-), mientras que el picoteo de otro grupo de palomas fue reforzado con comida cuando la tecla era
slo verde (E+) y no cuando estuvo superpuesta con el cuadrado blanco (E-). Se encontr que el
aprendizaje de discriminacin fue mejor en los animales para los que el rasgo distintivo (el cuadrado
blanco) estuvo en el E+. A este fenmeno se le denomina aprendizaje del rasgo positivo.

5.2. Relacionados con la respuesta


5.2.1. Relacin respuesta-reforzador
La naturaleza de la respuesta requerida para obtener el reforzador es otro factor que puede determinar
cul de los componentes de un Ed adquiere control sobre la conducta. Dobrezcka y otros realizaron un
experimento que muestra la importancia de la respuesta para el control por el estmulo. Dichos
investigadores entrenaron a unos perros en una discriminacin izquierda-derecha o actuar-no actuar
(grupos 1 y 2, respectivamente) mediante estmulos auditivos que diferan tanto en su posicin (detrs o
delante de los sujetos) como en su naturaleza (el sonido de un zumbador o de un metrnomo). Durante el
transcurso de la prueba, la posicin de los dos sonidos fue intercambiada. Los resultados mostraron que la
respuesta diferencial izquierda- derecha era principalmente controlada por la posicin de los sonidos,
mientras que la respuesta diferencial actuar-no actuar era controlada principalmente por la naturaleza de
los sonidos.
Es decir, el aprendizaje de discriminar izqda.-dcha. fue ms fcil cuando los sonidos se presentaban en
diferentes localizaciones que cuando eran de diferente tipo; y el aprendizaje de actuar-no actuar era ms
fcil con diferentes tipos de sonidos que con el mismo presentado en diferentes posiciones. Por tanto
parece probable que las respuestas que estn diferenciadas por la localizacin (como izda.-dcha.) queden
bajo el control de la distinta posicin de los Eds; y las diferenciadas por su naturaleza bajo el control del
tipo de estmulo.
5.2.2. Respuesta de observacin a la muestra
Establecer como requisito una respuesta de observacin a la muestra facilita en gran medida el aprendizaje
de las discriminaciones condicionales. Se considera un requisito de observacin a la muestra cuando se
refuerza alguna conducta del sujeto orientada al estmulo condicional. El ejemplo ms comn es retener la
aparicin de los estmulos de comparacin hasta que el sujeto toca la muestra.
10

Psicologa del aprendizaje

Cristina Gil

Otro efecto importante del requerimiento de respuestas a la muestra es que parece influir en el nivel
asinttico de la discriminacin. Se ha comprobado que despus de la adquisicin de una discriminacin en
la que se requera picar a la muestra, el porcentaje de aciertos baj entre un 10 y un 25% cuando se
elimin este requisito.
Adems, aadir requisitos adicionales de razn fija hace ms eficiente este mtodo. En un estudio sobre
adquisicin de la discriminacin condicional con 1, 10, 20 y 40 respuestas a la muestra, se observ que el
grupo de una respuesta necesit de ms del doble de sesiones para adquirir la discriminacin que el grupo
de 40 respuestas.
Tambin se ha encontrado que cuando la propia conducta es el elemento de muestra a discriminar, el
nmero de respuestas puede facilitar la adquisicin del aprendizaje. En un experimento para comprobarlo
con palomas, a los animales a los que se les impidi la respuesta de observacin mediante reforzamiento
diferencial de otras respuestas, necesitaron entre 1200 y 6000 ensayos para alcanzar el criterio de
aprendizaje mientras que en el grupo en el que se pedan cinco respuestas a la muestra se necesit como
promedio unos 500 ensayos para alcanzar el mismo criterio de aprendizaje.
5.2.3. Respuesta diferencial
La ultima variable relacionada con la respuesta es la posibilidad de que los sujetos realicen respuestas
diferentes ante cada estmulo de control, bien como requisito del propio entrenamiento o bien requiriendo
una respuesta de observacin que permita el surgimiento espontneo (entendido como no exigido) de
conductas diferenciales. Por ejemplo, en un experimento se encontr que el aprendizaje de la
discriminacin condicional era ms rpido cuando se requera un programa diferente para cada muestra
(RF 16 y RDB 3) que cuando a ambas se aplicaba el mismo programa de RF o RDB (Razn Fija y
Reforzamiento Diferencial de Tasas Bajas, respectivamente).
Se ha constatado tambin que estas respuestas diferenciales pueden aparecer aunque las contingencias
del experimento no lo requieran, e incluso aunque se castigue especficamente.

5.3. Relacionados con la experiencia previa


La historia del sujeto, en cuanto a su experiencia con el reforzamiento diferencial, influye no slo en la
velocidad con la que adquiere nuevas discriminaciones, sino tambin en el grado de generalizacin que
muestra en discriminaciones ya adquiridas.
5.3.1. Disposiciones de aprendizaje
Harlow realiz un estudio con monos a los que someta a problemas de discriminacin de objetos
mediante un aparato que permita recompensar la eleccin correcta y ocultar los objetos ante la
incorrecta. Los resultados mostraron que en las primeras discriminaciones el aprendizaje fue lento, pero a
medida que los animales experimentaban con un mayor nmero de problemas, la tasa de aprendizaje
aumentaba.
Lawrence entren a un grupo de ratas en una tarea de discriminacin, una vez superado el criterio de xito
las expuso a un nuevo entrenamiento discriminativo pero de mayor dificultad que el anterior. Los
resultados mostraron una velocidad de aprendizaje mucho mayor en los sujetos de este grupo al
compararlos con los de otro grupo que no tuvieron la primera experiencia. El autor lo interpret en

11

Psicologa del aprendizaje

Cristina Gil

trminos de atencin: los sujetos en el primer entrenamiento, al ser ms sencillo, atendan mejor a la
dimensin relevante del estmulo y eso les facilit despus la discriminacin ms difcil.
Este experimento ha sido rebatido, por ejemplo con otro con un grupo de palomas en un estudio similar
pero cambiando la naturaleza del estmulo de control (primero discriminando colores, y luego inclinacin
de lneas). Tambin se observ una mejora debida al entrenamiento previo pero no poda explicarse por
mayor atencin a la dimensin del estmulo de la primera discriminacin, porque era distinto. El autor
defiende que lo que mejora es la capacidad general del sujeto para resolver problemas de discriminacin,
no slo el hecho de atender a un rasgo concreto.
Los resultados de estos experimentos nos permiten concluir, por tanto, que la experiencia con cualquier
problema de discriminacin, independientemente de qu dimensin se utilice o de su dificultad, favorece
las habilidades generales de resolucin de problemas que ayudan al organismo a afrontar un problema
difcil posteriormente. No obstante, existen matices a esta regla general, como por ejemplo el tipo de
cambio dimensional.
La generalizacin de la discriminacin aprendida a otra discriminacin, puede ocurrir entre problemas en
los que se altera la misma dimensin del estmulo: cambio intradimensional (por ejemplo en la fase 1
reforzar responder ante el color rojo y extinguir ante el verde; y en la fase 2 posterior reforzar ante azul y
extinguir ante amarillo)., o cuando se utiliza un nuevo problema de discriminacin que implica una
dimensin estimular distinta: cambio extradimensional o interdimensional (fase 1 los mismos estmulos
rojo y verde que en el otro ejemplo, pero en la fase 2 discriminar sonidos de diferente frecuencia).
Normalmente, los cambios intradimensionales se aprenden con mayor facilidad que los cambios
interdimensionales.
5.3.2. Efecto de sobreaprendizaje en la inversin
Mackintosh entren a dos grupos de ratas para realizar una discriminacin con el mismo criterio de
eficacia (escoger entre una caja blanca y otra negra para recibir comida), pero a uno de ellos les expuso a
100 ensayos adicionales de entrenamiento en esa misma discriminacin. Tras esto, entren a ambos
grupos en la discriminacin inversa, es decir la caja con comida ahora era la contraria que en la fase
anterior. El autor encontr que el grupo que haba recibido entrenamiento extra aprendi la discriminacin
inversa en menos tiempo que el otro grupo. A este fenmeno se le denomina sobreaprendizaje en la
inversin y es un poco contraintuitivo, porque se podra pensar que en entrenamiento extra fortalecera
la discriminacin aprendida de la primera fase, y aprender lo contrario requerira ms ensayos despus,
pero no ocurre as.
5.3.3. Experiencia de reforzamiento no diferencial
Waller reforz con comida a cuatro grupos de ratas por recorrer un callejn, variando la pintura de dicho
callejn (gris o a rayas) y la probabilidad de reforzamiento (50% o 100%), lo que deja este diseo 2x2:

En la segunda fase del estudio todos los sujetos fueron reforzados diferencialmente (el 100% de las veces)
por elegir recorrer un corredor pintado con lneas inclinadas 45 a la derecha (E+) o con lneas inclinadas
45 a la izquierda (E-). Se midi como variable dependiente el nmero de ensayos necesarios para elegir el
12

Psicologa del aprendizaje

Cristina Gil

E+, en otras palabras, la velocidad de adquisicin de la discriminacin. Los resultados no mostraron


diferencias significativas entre los grupos 1 y 2, aquellos que haban tenido experiencia con el callejn gris.
Sin embargo, el grupo 4 requiri de muchos ms ensayos que el grupo 3 para aprender la discriminacin.
Waller consider estos resultados como un apoyo directo de la teora atencional de la discriminacin,
argumentando que la experiencia con un reforzamiento dbil (50%) frente a las rayas haba provocado que
estos sujetos desatendieran dicha dimensin del estmulo en la fase 2.
La experiencia con reforzamiento no diferencial puede afectar incluso a aprendizajes anteriores con
estmulos diferentes. Honing en un estudio entren a palomas para discriminar entre una lnea negra
horizontal y otra vertical (fase 1). Para la fase 2 dividi los sujetos en dos grupos. A uno de ellos se le
reforz diferencialmente para responder a una luz azul como Ed+ mientras se extingui la respuesta a una
luz verde como Ed-. El otro grupo fue reforzado con una probabilidad de 0,5 independientemente del
estmulo ante el que respondieran, es decir no se les aplico reforzamiento diferencial. La fase siguiente
consisti en la prueba de generalizacin de la discriminacin adquirida por ambos grupos en la fase 1. Se
presentaron 8 estmulos verticales de diferente inclinacin. Se encontr un mayor grado de generalizacin
en el grupo que haba sido expuesto en la fase 2 sin entrenamiento discriminativo. Es decir, la fase de
exposicin a contingencias de reforzamiento no diferencial afect a una discriminacin aprendida con
anterioridad, reduciendo su nivel, aunque los eventos involucrados no estaban relacionados (lneas frente
a colores).
Honig tambin interpret los resultados en trminos de factores atencionales. Segn el autor, el
reforzamiento diferencial en la Fase 2 mantuvo la atencin de los sujetos que fueron expuestos a l. En
otras palabras, los entrenamientos discriminativos potencian la atencin, reduciendo de esta forma la
generalizacin.

5.4. Relacionados con el entrenamiento discriminativo.


5.4.1. Tipos de entrenamiento discriminativos
Si tenemos que disear la manera en la que vamos a entrenar una discriminacin simple lo primero que
debemos decidir es si los estmulos de control (al menos un Ed+ y un ED-) van a aparecer juntos en cada
ensayo o por separado, es decir, solo uno de los dos en cada ensayo.
Un entrenamiento simultneo es cuando el Ed+ y el Ed- aparecen juntos, a la vez en cada ensayo. La
conducta dirigida al Ed+ (por ejemplo, pulsar la tecla en la que aparece) sera contingente con el
reforzamiento, y la dirigir al Ed- sera sometida a extincin o castigo. El resultado es que, con suficiente
entrenamiento, los sujetos terminan respondiendo exclusivamente sobre el Ed+.
En el entrenamiento sucesivo no aparecen los estmulos antecedentes al mismo tiempo, sino que en
determinados momentos est presente uno y en otras ocasiones est presente el otro. Este entrenamiento
se denomina procedimiento de discriminacin de respuesta / no respuesta (o go-no go), ya que el sujeto
acaba respondiendo en los ensayos en los que est presente el Ed+ y no hacindolo en los que est
presente el estmulo delta o Ed-.
En lneas generales, la adquisicin de discriminaciones simples son ms lentas cuando el procedimiento es
sucesivo que cuando es simultneo. En estos dos casos que acabamos de ver, se establece una situacin
con dos condiciones: una reforzada y la otra no reforzada. Pero esto no tiene porqu ser siempre as,
pudindose usar dos condiciones ambas reforzadas, pero de distinta manera cada una de ellas.
13

Psicologa del aprendizaje

Cristina Gil

Un ejemplo de discriminacin simultnea es el programa concurrente, en el que el sujeto est expuesto a


dos programas simultneamente. Por ejemplo programas de IV como IV30 IV 60, dnde la primera
respuesta una vez transcurrido el tiempo medio especificado en cada programa es la reforzada.
En el caso de discriminacin entre programas de reforzamiento en el que se utiliza una aproximacin
sucesiva se denomina programa mltiple, y en l los diferentes programas se presentan de manera
secuencial en el tiempo y con un Ed diferente para cada uno de ellos. De esta manera se desarrollan dos o
ms respuestas diferenciales a dos (o ms) estmulos siempre que cada uno de ellos seale un programa
diferente de reforzamiento. Por ejemplo, con un Ed+ rojo funciona con un programa de RV y con el Ed+
verde un programa de IF. Como se ve, puede existir respuesta diferencial sin que se tengan que producir
respuestas ante un estmulo y ausencia de respuestas ante otro diferente.
En los primeros estudios sobre discriminaciones condicionales los estmulos de muestra permanecan a la
vista de los sujetos durante todo el tiempo que duraba el ensayo. Por ejemplo en una misma cartulina, el
fondo hace de estmulo de muestra y la forma representada de estmulo de comparacin. Esta modalidad
en la que se encuentran presentes a la vez se denomina discriminacin condicional simultnea.
Recientemente han sido comunes los experimentos en los que los e. de muestra y de comparacin no
estn presentes nunca de forma simultnea, sino que media un intervalo de tiempo entre la desaparicin
del e. de muestra y la aparicin del e. de comparacin. Esta manipulacin da lugar a las discriminaciones
condicionales demoradas. En el caso de la discriminacin condicional de demora cero, los e. de
comparacin son presentados inmediatamente despus del apagado del e. de muestra.
La introduccin de una demora entre la presentacin del e. de muestra y el de comparacin afecta mucho
a todos los ndices de ejecucin de discriminaciones condicionales. Aunque hay diferencias entre especies,
se puede afirmar que en general los aumentos en la demora conllevan decrementos en la ejecucin. El
simple hecho de eliminar la muestra en el momento en que aparecen las comparaciones (procedimiento
de demora cero) aumenta el nmero de ensayos necesarios para aprender la discriminacin con respecto a
una discriminacin condicional simultnea.
5.4.2. Eficacia relativa de los elementos del estmulo como seales para el reforzamiento
En un experimento fueron condicionados dos grupos de ratas con un procedimiento de ensayo discreto,
reforzando el 50% de los ensayos por presionar una palanca en presencia de un estmulo compuesto de
una luz y un sonidos de dos posibles. Para el grupo 1, la luz con cualquiera de los sonidos era reforzada
siempre en el 50 % de los ensayos; para el grupo 2 la luz con un sonido era reforzada siempre, y la luz con
el otro sonido nunca era reforzada.
Grupo 1: luz+tono1 reforzado 50 % // luz+tono2 reforzado 50 %
Grupo 2: luz+tono1 - reforzado 100% // luz+tono2 reforzado 0%
En relacin a los dos tonos, la luz era mejor predictor del reforzamiento para el grupo 1 que para el grupo
2. En el grupo 1 los sonidos no aadan ninguna informacin a la que la luz ya aportaba, por eso
respondieron ms a la luz los sujetos de este grupo que los del grupo 2. En el grupo 2 respondieron ms al
tono1 que a ningn otro estmulo, reflejando que era el mejor predictor del reforzamiento.
Los resultados sugieren que los Eds tienen un poderoso efecto sobre la conducta, no por estar
emparejados con el reforzador, sino porque sealan la forma o el momento en que se va a producir el
reforzamiento. Si un estmulo es mejor predictor de la disponibilidad del reforzamiento que otro, es ms
probable que adquiera el control de la conducta operante.
14

Psicologa del aprendizaje

Cristina Gil

5.4.3. Tipo de reforzamiento


El control por el estmulo depende no slo de la eficacia relativa del estmulo como seal para el
reforzamiento, sino tambin de la naturaleza del reforzador utilizado. Ciertos tipos de estmulos tienen
ms probabilidad de ejercer un control sobre la conducta con reforzamiento positivo que con
reforzamiento negativo (entrenamiento de evitacin/ escape).
En un experimento con palomas, la respuesta de apretar un pedal fue reforzada en presencia de un
estmulo compuesto que consista en un sonido y una luz roja. Con reforzamiento de comida, la luz
consigui ms control sobre la conducta. Con reforzamiento de evitacin de una descarga, el sonido
consigui ms control.
Esto indica que el control por el estmulo sobre la conducta instrumental est en parte determinado por el
tipo de reforzamiento que se utilice. Los estmulos visuales parece que tienen ms posibilidades de adquirir
control sobre la conducta reforzada positivamente, y las claves auditivas es ms probable que adquieran
control de la conducta negativamente reforzada (al menos con palomas).
5.4.4. Consecuencia diferencial
En tareas de discriminacin simple, se ha demostrado que si se usan consecuencias diferenciales para cada
combinacin entre Ed y la respuesta, se mejoraba la discriminacin. Si ante el estmulo E1 el sujeto tiene
que emitir la respuesta R1 para recibir la consecuencia C1 (comida, por ejemplo) y ante el E2, la R2 para
recibir la C2 (distinta, como agua por ejemplo) la velocidad del aprendizaje ser mucho mayor que si se
hubiera usado un solo tipo de reforzador.
En cuanto a las discriminaciones condicionales, aunque la mayora de los trabajos que utilizan este tipo de
procedimientos lo hacen aplicando el mismo reforzador en todos los casos, algunos estudios han
encontrado un efecto facilitador del uso de distintos tipos de reforzadores en funcin de la comparacin
correcta. Por ejemplo usando comida o sacarosa, un nmero diferente de pellets (bolitas de comida) con
diferentes probabilidades de reforzamiento, o con reforzadores primarios frente a la posibilidad de avanzar
al siguiente ensayo. Todos los autores que lo comprobaron coinciden en que el reforzamiento diferencial
favorece la adquisicin de la discriminacin condicional.
5.4.5. Duracin del intervalo entre ensayos
El lapso de tiempo programado entre la finalizacin de un ensayo y la presentacin del siguiente ejerce
tambin un efecto importante en la adquisicin de la discriminacin. Se ha comprobado con palomas con
diferentes duraciones del intervalo entre ensayos (0, 5, 15, 25 y 60 seg) mostrando que con un intervalo de
0 segundos se mostraba una ejecucin a niveles de azar, mientras que los grupos con 25 y 60 segundos
eran los que mejor hacan la tarea. No obstante, una vez que la discriminacin condicional ha sido
adquirida, parece que la duracin del intervalo ejerce poco efecto sobre la precisin, excepto cuando el
intervalo se elimina por completo. Incluso los sujetos que haban llegado a un nivel estable de ejecucin
reducen su nivel de aciertos al esperado por azar cuando se les introduce en preparaciones con 0 segundos
de intervalo entre ensayos.
5.4.6. Grado de entrenamiento
La relacin entre la extensin del reforzamiento diferencial (nmero de ensayos de entrenamiento, tasa de
reforzamiento, etc.) y el grado de generalizacin se ha adelantado varias veces a lo largo del captulo.
Cuanto mayor es el entrenamiento para la adquisicin de la discriminacin ms acusado es el gradiente
formado en la prueba de generalizacin, es decir, menor generalizacin se observa
15

Psicologa del aprendizaje

Cristina Gil

En un trabajo se reforz a las palomas por responder a una tecla cruzada con una lnea vertical (Ed+). Se
midi la respuesta de los sujetos ante seis estmulos parecidos al Ed+ en los que se vari la inclinacin de la
lnea, en cuatro momentos diferentes (se dividi a los sujetos en grupos): tras 2, 4, 7 y 14 sesiones. Los
resultaron mostraron claramente que el gradiente de generalizacin se iba haciendo ms acusado en
funcin del nmero de sesiones de entrenamiento al que haba sido expuesto cada grupo.
5.4.7. Entrenamiento en discriminacin sin errores
Desarrollado por Terrace, este procedimiento minimiza las respuestas al Ed-, reduciendo tanto el nmero
de errores cometidos por el sujeto como las reacciones emocionales asociadas a la aplicacin de extincin
o castigo. En su experimento Terrace reforz a palomas por responder a una luz roja (Ed+) que se aplic
durante todo el experimento con la misma intensidad y duracin. El Ed- (una luz verde), sin embargo, se
presentaba a una intensidad tan baja y durante tan poco tiempo que no permita responder a l. A lo largo
del procedimiento se fue aumentando la intensidad y la duracin del Ed- hasta equipararse a la que haba
tenido desde el principio el Ed+. Los resultados mostraron que, si los cambios en el Ed- son
suficientemente graduales, los sujetos pueden adquirir la discriminacin simple sin cometer ningn error,
es decir, sin responder al Ed-.
Este tipo de procedimientos permiten optimizar la adquisicin de la discriminacin, muy til en sujetos con
necesidades educativas especiales, como por ejemplo nios autistas.
El mismo principio puede seguirse en el entrenamiento de discriminaciones condicionales. Por ejemplo
puede presentarse la muestra y la comparacin correcta a un nivel de intensidad mayor que la
comparacin incorrecta, e ir aumentando el nivel de esta ltima progresivamente. En lugar de la
intensidad, tambin se puede variar el tamao.
5.4.8. Intervalo entrenamiento-prueba
El gradiente se va haciendo cada vez ms plano segn aumenta el tiempo entre el entrenamiento y la
prueba. El paso del tiempo por tanto aumenta la generalizacin, es decir, que los estmulos diferentes al
Ed+ ejercen mayor control cuanto ms lejana se encuentra la finalizacin del entrenamiento.
Esto se ha comprobado reforzando la respuesta de un grupo de palomas ante una tecla cruzada por una
lnea blanca vertical. En la prueba de generalizacin se presenta el Ed+ y otros seis estmulos en los que se
modifica la inclinacin de la lnea. Se aplica la prueba un minuto, un da y una semana despus del
entrenamiento, y se comprueba que como ya hemos dicho el gradiente se iba haciendo cada vez ms
plano segn el tiempo entre entrenamiento y prueba era mayor.

6. INTERACCIONES EXCITATORIAS-INHIBITORIAS
Las diferencias que hemos sealado antes entre estmulos en cuanto al valor dentro del mismo rasgo o en
cuanto a la existencia de diferentes rasgos, los conceptos de cambio intradimensional e interdimensional,
pueden distinguirse tambin dentro de la misma discriminacin.
Se considerara una discriminacin como intradimensional si ambos Eds (tanto el ed+ como el ed-) son
idnticos en todo excepto en el valor de uno de sus rasgos (por ejemplo dos objetos idnticos en tamao,
forma, que solo se diferencien en el color).
La adquisicin de discriminaciones intradimensionales da lugar en las pruebas de generalizacin a los
fenmenos de desplazamiento del mximo y el efecto de tendencia central.

16

Psicologa del aprendizaje

Cristina Gil

6.1. Desplazamiento del mximo


Hanson en 1959 observ por primera vez este fenmeno en su experimento. Entr a tres grupos de
palomas a discriminar entre dos sonidos que slo se diferenciaban en su longitud de onda. Se distribuy a
los sujetos en cinco grupos, en todos se reforz ante el sonido de 550 nm que funcionaba como Ed+. Sin
embargo el sonido en cuya presencia se extingua la respuesta, el Ed-, vari en funcin de la condicin. Tras
el entrenamiento se comprob la respuesta de los sujetos ante diferentes estmulos de prueba, que iban
de 480 a 600 nm. En la tabla se pueden ver los valores de entrenamiento y prueba, y el mximo de
respuestas de media. Los nicos sujetos que no recibieron entrenamiento en discriminacin, vamos que no
se les aplic extincin en ningn momento, fueron los del grupo 5.

El grupo 5, el nico que no haba sido sometido a extincin frente a otro sonido con diferente longitud de
onda, fue el nico grupo que demostr el mximo de respuestas ante el Ed+ original. En el resto de grupos
se produce un alejamiento del valor en el que se observa el mximo de respuestas, y este alejamiento es
ms amplio cunto ms cercano est el valor del Ed- al del E+.
A este fenmeno se le denomina Desplazamiento del Mximo. Spence sugiri una teora para explicarlo.
Segn l, el entrenamiento en discriminacin incide tanto en el discriminativo positivo como en el negativo
(tanto en el EC excitatorio como en el inhibitorio) y, por tanto, ambos estmulos adquieren un control del
comportamiento que puede generalizarse a otros estmulos semejantes. Cuando la discriminacin ha sido
intradimensional, las diferencias entre los estmulos se limitan al valor en una sola dimensin (dentro de un
continuo), de manera que los estmulos de prueba mantienen parecido tanto con el E+ como con el E-.
Spence destaca que todos los estmulos, los condicionados y los generalizados, tienen un efecto tanto
excitatorio como inhibitorio, de manera que el efecto (la conducta provocada) podra entenderse como la
suma algebraica de ambas tendencias.

Para calcularlo hay que tener en cuenta que en la grfica que vamos a tomar de ejemplo (la de la izda. de la
figura 5):
1. Se han tomado los valores hipotticos de respuesta que se observaran si el E+ y el E- hubiesen
adquirido su funcin de manera independiente, es decir, como si no se hubiese entrenado una
discriminacin intradimensional.
17

Psicologa del aprendizaje

Cristina Gil

2. El gradiente slo est mostrando la fuerza excitatoria de cada estmulo de prueba presentado, pero
para realizar la suma algebraica de tendencias es necesario contemplar tambin la fuerza
inhibitoria. Para ello tomaremos como valor de referencia el mximo de respuestas observado en
cada gradiente (9 en el gradiente excitatorio y 5 en el inhibitorio). Si, por ejemplo, ante 530 nm. se
observasen 4 unidades de respuesta en el gradiente excitatorio, sta sera su fuerza excitatoria en
ese gradiente, mientras que su fuerza inhibitoria sera 5 (9-4).
La Tabla 4 muestra cmo se calcularan los valores del gradiente fruto de la interaccin entre el E+ y el Esiguiendo estos principios.

Los datos hipotticos de la figura 5 nos aportan informacin sobre las caractersticas de este fenmeno:
El desplazamiento del mximo se produce en el sentido del E- al E+. En nuestro ejemplo, si el E- es
495 nm. y el E+ 510 nm., de existir un desplazamiento del mximo tendra que ser ante un estmulo
con un valor superior a 510 nm.
El desplazamiento del mximo es mayor cuanto ms cercanos se encuentran los valores del E+ y el
E-. Esto puede comprobarse comparando el gradiente neto de la grfica de la izquierda con el de la
grfica central, en la que apenas se observa desplazamiento. Esta caracterstica se ha replicado con
una amplia variedad de estmulos y especies.
Cuanto mayor es la discriminacin mostrada por el individuo de los E+ y E- menor es el efecto de
desplazamiento producido por la interaccin entre ambos. La grfica de la derecha tiene los valores
del E+ y E- idnticos a la grfica de la izquierda, sin embargo, no se observa desplazamiento del
mximo.
Aunque el fenmeno se denomine Desplazamiento del mximo, al menos tericamente, tambin
se produce un desplazamiento del mnimo. Adems, este valor dependera de las mismas
variables que el valor en el que se observa el mximo de respuesta, excepto porque su
desplazamiento se producira en el sentido del E+ al E-.
Cuanto mayor es la interaccin (ms proximidad entre E+ y E- y /o gradientes ms planos) menor es
el valor absoluto de conducta observada.
A pesar de la robustez del fenmeno, existen caractersticas tanto del entrenamiento como de la prueba o
de los propios estmulos utilizados que determinan su aparicin. Por ejemplo, se ha comprobado que el
entrenamiento en discriminacin sin errores no produce desplazamiento del mximo en la prueba de
generalizacin. O si la fase de evaluacin es suficientemente larga, tampoco se observa este
desplazamiento.
Lo que vamos a ver en el siguiente apartado, el efecto de tendencia central, es una de las variables que
modulan el desplazamiento del mximo que ms inters ha despertado.
18

Psicologa del aprendizaje

Cristina Gil

6.2. Efecto de la Tendencia General


Hasta ahora hemos visto pruebas de generalizacin en las que se presentaban estmulos generalizados con
valores tanto superiores como inferiores a los Ed+ y/o Ed- entrenados. Esta distribucin ms o menos
simtrica de los estmulos de prueba da lugar a curvas normales cuyo valor intermedio es el Ed+ o Edoriginal, siempre que no se produzca un desplazamiento del mximo. Pero qu aspecto presentara el
gradiente de generalizacin si los estmulos de prueba presentados no se distribuyeran de esa manera?
Thomas y Jones respondieron la pregunta con un experimento con humanos. Se present una luz verde
(525 nm.) durante un minuto, y se advirti a los participantes que la recordaran para poder identificarla
despus. En la fase de evaluacin los sujetos fueron distribuidos en tres grupos que diferan en los
estmulos de prueba presentados: todos por debajo del Ed+, todos por encima del Ed+, u ordenados de
manera simtrica. Los sujetos tenan que determinar cul de ellos era el mismo que el color mostrado al
principio pulsando una tecla. Los resultados se resumen en la Tabla 5.

Recordar que el Ed+, el que se present al principio y que tenan que identificar, era el mismo para los tres
grupos, y todos tuvieron la oportunidad de sealarlo en la fase de prueba. Pero esto slo ocurri en el
grupo con la distribucin simtrica. En los dos grupos restantes el mximo de respuestas se desplaz en el
sentido del Ed+ original hacia el valor medio de los estmulos presentados. Este es el Efecto de Tendencia
central, y es uno de los mayores apoyos empricos del enfoque relacional. Este enfoque defiende que la
respuesta generalizada no se basara en respuestas a las caractersticas fsicas absolutas de los estmulos,
sino a sus referencias relativas en funcin de los estmulos con los que tiene experiencia.
Para comprobar si afecta la distribucin de los estmulos de prueba a la interaccin entre el Ed+ y el Ed- en
una discriminacin intradimensional, Thomas y su equipo realizaron un experimento con humanos en el
que consiguieron modificar el sentido del desplazamiento del mximo. En su estudio se utilizaron 11
intensidades de luz blanca clasificadas en orden creciente del 1 al 11. Se entren a 40 estudiantes
universitarios a discriminar entre dos de esas intensidades. En un grupo se reforz responder ante la
intensidad de grado 2 (Ed+) y se castig la respuesta ante la de grado 4 (Ed-). En el otro grupo el Ed+ fue el
estmulo 4 y el Ed- el estmulo 2. La fase de prueba consisti en la exposicin a seis series en las que se
presentaban de manera aleatoria todos los estmulos, los once.
En ambos grupos se encontr un desplazamiento del mximo respecto al valor del E+ entrenado muy
cercano a 6, la media de los valores de los estmulos de prueba. En el grupo en el que el Ed+ fue de grado
2, el mximo de respuesta se observ ante el estmulo 5; mientras que el grupo en el que el Ed+ era 4, se
desplaz al estmulo 7. Pero lo ms destacable es que el desplazamiento en el primer grupo se produjo en
el sentido del Ed+ (2) al Ed- (4).
Estos resultados no invalidan el fenmeno de desplazamiento del mximo. En primer lugar porque el
efecto de tendencia central, hasta ahora, solo se ha comprobado con humanos; en otras especies se sigue
replicando el desplazamiento del mximo de forma consistente. En segundo lugar no todas las
investigaciones con humanos obtienen resultados coherentes con l. Por tanto an hay un debate abierto
sobre este tema.
19

Psicologa del aprendizaje

Cristina Gil

7. OTRAS TEORIAS SOBRE LA GENERALIZACIN


por qu razn estmulos que nunca han participado en una contingencia de aprendizaje pueden ejercer
control sobre la conducta de un individuo?
Las primeras hiptesis explicativas a esta pregunta, como la de Pavlov o Hull, se fundamentaron en
considerar la generalizacin como un proceso primario, y no como el efecto o subproducto de otro proceso
diferente.
Pavlov se centraba en el concepto de irradiacin, semejante al efecto de onda al tirar un objeto al agua.
Segn l cada estmulo produce excitacin en una zona concreta del crtex cerebral, de manera que
estmulos parecidos pueden activar zonas fsicamente adyacentes. Esto implica que la irradiacin de la
excitacin es ms dbil a medida que se distancia del centro de excitacin correspondiente al Ed+ original.
Hull defenda por su parte que el cerebro no perciba los estmulos como algo nico, con un solo valor por
dimensin, sino que cada rasgo era registrado con una horquilla de valores. Cuando un estmulo adquiere
control sobre cierta conducta, ese control no es exclusivo del valor de las dimensiones con las que se ha
presentado, sino que es compartido por valores cercanos. Se condicionan regiones de valores, no valores
concretos, de forma que cuntos ms valores compartan el e. de prueba con las regiones condicionadas
con el Ed+ original, mayor ser el control que ejercer.
Hay otras explicaciones que no entienden la generalizacin como un proceso primario. Estan las que
consideran la generalizacin como un fallo en la discriminacin (la denominada hiptesis inversa y la teora
atencional), y las que critican el concepto de inhibicin (la teora de la respuesta mltiple).

7.1. Hipotesis inversa: Blough


Esta hiptesis mantiene que la generalizacin se debe a que los sujetos no pueden discriminar entre los e.
de prueba a los que son expuestos. Es decir es la capacidad de los sujetos para discriminar ciertos
estmulos lo que determina si mostrarn o no generalizacin.
Blough la puso a prueba entrenando palomas para que discriminaran una longitud de onda (color)
concreto como Ed+. En funcin del grupo el valor del Ed+ variaba desde 480 nm. A 645 nm. En la prueba
comprob los gradientes que se formaban en cada grupo exponindoles a valores cercanos al E+, tanto
inferiores como superiores. Los resultados mostraron que el gradiente ms pronunciado se observaba en
los valores cercanos a 600 nm., mientras que se iban volviendo ms planos (menos discriminacin, ms
generalizacin) segn los estmulos de prueba del grupo se alejaban de 600 nm., tanto por debajo dentro
del espectro como por arriba.
La autora concluy que la visin de las palomas es especialmente sensible a variaciones en ese punto del
espectro, distinguen mejor ciertos colores que otros. Y es esa capacidad en el rango cercano a los 600 nm.
lo que minimiz la generalizacin.

7.2. Teora atencional: Shutherland y Mackintosh


Considera que el fallo en la discriminacin (responsable de que se produzca la generalizacin) se debe a la
falta de atencin hacia el rasgo pertinente del Ed, de que correlaciona con el reforzamiento. Distinguen dos
procesos:
1. El cerebro recibe y procesa la info sensorial a travs de analizadores especficos que representan
cada dimensin del estmulo por separado (color, brillo, tamao). La fuerza de cada analizador
depender, al inicio del entrenamiento y antes del reforzamiento, de la saliencia de la dimensin. El
20

Psicologa del aprendizaje

Cristina Gil

reforzamiento afectara a la fuerza de los analizadores activos, de manera que la dimensin ms


saliente se condicionar ms que el resto
2. Se desarrolla un vnculo entre una respuesta especfica y un analizador. Por ejemplo una unin
entre elegir la tela roja (en lugar de la verde) y el analizador correspondiente al color.

7.3. Respuesta mltiple: Staddon


En los estudios sobre generalizacin se suele reforzar diferencialmente una respuesta concreta y despus
se miden ciertos parmetros de esa respuesta ante estmulos diferentes a los utilizados en el
entrenamiento. De esa forma la ocurrencia de la respuesta objetivo ante estmulos parecidos al Ed+ se
considera fruto de las propiedades excitatorias de los estmulos generalizados, y su ausencia o descenso
efecto de sus propiedades inhibitorias. Esto limita los estudios tericos a una sola conducta, la conducta
objetivo.
La teora de Respuesta Mltiple de Staddon propone romper con esta concepcin incluyendo dentro del
anlisis del fenmeno el resto de conductas que despliega el sujeto, adems de la respuesta objetivo.
Staddon diferencia entre dos categoras de conducta: las terminales y las de nterin. Las primeras estaran
controladas por la presencia del Ed+ y fortalecidas por la aparicin del reforzador, y las segundas seran
aquellas que aparecen en ausencia del Ed+ (o presencia del Ed-) y que son reforzadas por otro tipo de
eventos diferentes al reforzador programado por el experimentador.
Esto representa un enorme cambio respecto al resto de teoras que hemos visto en el captulo, ya que se
reemplaza el concepto de inhibicin por el de competicin. Las respuestas terminales quedaran bajo el
control excitatorio de los E+ mientras que las conductas de nterin estaran controladas por los E-. De esta
manera, ambas tendencias excitatorias se generalizaran a todo el conjunto de estmulos de prueba
presentados durante la evaluacin, y el resultado de esta competencia formara los diferentes gradientes.

21