Você está na página 1de 8

Historia de la psicometra

Tomado de: Notas de psicometra- Aura Nidia Rojas Herrera (1998)

Pueden encontrarse algunos intentos de hacer medicin muy antiguos: el Imperio Chino, los
griegos, la edad media y hasta la Biblia; tal vez el ejemplo ms reportado sobre estos primeros
intentos es la clasificacin del mdico griego Galeno, quien clasifica a los seres humanos segn
los humores en sanguneo, colrico, flemtico y melanclico en lo que podra verse como una
primera propuesta de escala nominal para medicin de la personalidad. Aunque la literatura est
llena de ejemplos como el anterior, lo que se conoce hoy como psicometra empez a tomar
forma slo hasta el siglo XIX.
El famoso episodio del joven auxiliar en el Observatorio Astrolgico de Greenwich, cuyos
registros del tiempo de paso de las estrellas a travs de una lnea del campo visual del telescopio,
diferan sistemticamente de los de su maestro, se convirti gracias a las elaboraciones de los
psicofsicos, en la evidencia de que algunas diferencias humanas podan cuantificarse. Mediante
monitoreos de los registros de los astrnomos en dicho observatorio Bessel (1816) observ que
haba variaciones en la rapidez con que reaccionaban los individuos a estmulos visuales, dando
lugar a lo que se conocera como la ecuacin personal. Quetelet, matemtico belga, fue el
primero en plantear que la teora matemtica de la probabilidad poda aplicarse a las mediciones
humanas.
Por otra parte, los trabajos de Esquirol (1838), mdico francs que se interes por el estudio del
retraso mental, constituyen un avance interesante en la medicin de este trastorno que tendra
implicaciones en el futuro desarrollo de tcnicas ms refinadas para la medicin del mismo.
Pueden resumirse en tres los aportes de Esquirol: Por una parte hace distincin entre los
alienados, con profundos trastornos emocionales y los retrasados mentales con deficiencias de
tipo intelectual; de otra parte intenta algunas clasificaciones de los diversos grados de retraso
mental y finalmente, identifica el lenguaje como el criterio ms fiable para evaluar y clasificar
los trastornos mentales. En esta misma lnea se encuentran las contribuciones de su compatriota
y colega Segun (1866) quien, con su rechazo a la nocin de incurable del retraso mental, crea
la primera escuela para retrasados y disea algunos procedimientos de adiestramiento
bsicamente sensorio-motor, algunos de los cuales forman parte de los llamados test no
verbales de inteligencia.
Desde una perspectiva muy diferente, ya que estaban ms interesados por plantear
generalizaciones que por analizar diferencias, se encuentran los primeros psiclogos
experimentales del laboratorio de Wuntd, (1879) en Leipzig. Estos personajes, a quienes la
historia reconoce como los fundadores de la psicologa experimental, tuvieron gran importancia
en los desarrollos de la medicin en psicologa: Por una parte disearon algunas pruebas de
sensibilidad y tiempos de reaccin a estmulos visuales, auditivos y de otros sentidos, marcando
la pauta para la mayora de trabajos que en la misma lnea se desarrollaron a finales de siglo
XIX y por otra, con su rigor cientfico, pusieron de manifiesto la necesidad de controlar las
condiciones de prueba y tipificar procedimientos.
Sin duda uno de los personajes que ha merecido el mayor reconocimiento por sus interesantes
aportes no slo en la medicin en psicologa sino en otros campos como la biologa, es Sir Francis
Galton. Este polifactico ingls interesado por el estudio de la herencia, sinti rpidamente la
necesidad de medir las caractersticas humanas as que creo un laboratorio antropomtrico en
Londres (1884) para el cual dise varias pruebas de agudeza y discriminacin sensorial con la
conviccin de que stos le permitan medir el intelecto. Algunos de tales instrumentos como la
barra de Galton y el silbato de Galton se han utilizado para medicin de la discriminacin visual
de longitud y del grado de sensibilidad a tonos altos, respectivamente, hasta hace muy poco
tiempo. Adems del diseo de instrumentos de medicin sensorial, Galton fue el primero en
utilizar las escalas de estimacin, los cuestionarios y la asociacin libre; pero tal vez el aporte
que no ha sido suficientemente reconocido fue el haber seleccionado y adaptado algunas
tcnicas matemticas para el anlisis de los resultados de sus pruebas y la medicin de las
diferencias individuales y el haber introducido la idea de variacin concomitante entre dos
medidas[1], constituyndose en el precursor de lo que hoy se conoce como coeficientes de
correlacin, anlisis de regresin y otros procedimientos de anlisis cuantitativos en investigacin
con humanos.
De acuerdo con las ideas de Galton sobre la medicin de la inteligencia y convencido de que era
casi imposible medir objetivamente funciones complejas, el psiclogo norteamericano James
McKeen Catell, discpulo de Wundt en el laboratorio de Leipzig, dise y aplic un sinnmero de
test de discriminacin sensorial, tiempo de reaccin, memoria y otras. A Catell se le debe
adems, la rpida difusin de aplicacin de pruebas en Norte Amrica y los primeros intentos
por validarlas con criterios externos; sin embargo, el hecho que con mayor frecuencia se reporta
en torno a sus aportes es haber introducido en la literatura psicolgica el trmino de test
mental (1890). Aunque, por este hecho, a Catell se le reconoce como el padre de los test
mentales, las dos ltimas dcadas del siglo pasado fueron testigos de una gran cantidad de
trabajos que pretendan desarrollar medidas de funciones psicolgicas complejas. Entre ellos se
encuentran los trabajos de los alemanes Oehrn (1889), Kraepelin (1895) y Ebbinghaus (1897),
los norteamericanos Jastrow (1891), Mnsterberg (1891), Bolton (1892), J. A. Gilbert (1897),
los italianos Guicciardi y Ferrari (1896) y muchos otros, algunos de los cuales empezaban a
cuestionar el hecho de que los resultados de los test mentales no guardaran correspondencia
con el xito acadmico.
Dos de estos trabajos merecen captulo aparte: Por un lado, los intentos de medicin de procesos
psicolgicos complejos en el campo de la psicopatologa presentado por Kraepelin (1895), quien
construy una cantidad de test que pretendan medir diversos rasgos que permitieran
caracterizar a los individuos, se constituyeron en los precursores de las mediciones objetivas de
la personalidad. Por otra parte, los tests de completacin de frases de Ebbinghaus (1897) fueron
los nicos de los desarrollados en esa poca, que permitieron una prediccin adecuada del
rendimiento acadmico y an hoy forman parte de la mayora de pruebas de inteligencia.
Sin embargo, el honor de la publicacin de la primera escala de medida de inteligencia le
correspondi al francs Alfred Binet, quien en compaa de Henri haba publicado en 1895, un
artculo que criticaba los tests existentes hasta el momento por dedicarse a mediciones muy
precisas de funciones muy elementales; y propona otros que abarcaban funciones ms
complejas aunque medidas menos precisas. En este contexto, la primera escala de medida de
inteligencia, que reuni las experiencias anteriores e introdujo adems preguntas sobre juicio,
comprensin y razonamiento, fue desarrollada por Binet y Simon y se public en 1905. En la
segunda revisin de esta escala se propone un procedimiento sistemtico para obtener los
puntajes de prueba y se introduce el concepto de Edad mental (1908), y en la revisin de Terman
(1916), conocida como Stanford-Binet, aparece la idea de Cociente Intelectual.
La edad mental de Binet y Simon se obtena gracias al ordenamiento de los elementos de la
escala en orden creciente de dificultad y su agrupacin por niveles de edad. Tal agrupacin
obedeca a criterios empricos, reuniendo los elementos que podan ser contestados
correctamente por nios normales de cada edad cronolgica desde 3 a 13 aos; la edad mental
era el nivel al que llegaba cada examinado, esto es, el nivel que alcanzaba dentro de esta
graduacin. Tratndose de un ndice tan sencillo tuvo gran aceptacin por ser la primera
propuesta de una unidad de medida que aunque no alcanzaba el nivel de precisin de las
utilizadas hasta el momento dentro de los mediciones sensoriales, tena el gran mrito de ser
propia de la psicologa. La principal limitacin de esta unidad era sin embargo, que su
interpretacin dependa de lo que se esperara de la ejecucin del examinado dada su edad
cronolgica; es decir, saber que un nio tena una edad mental de 4 aos no reportaba mayor
informacin a cerca de si su nivel estaba dentro de lo normal o por el contrario estaba por
encima o por debajo de lo que se esperara de l. La propuesta de Terman supera tal limitacin
construyendo una unidad cuyo resultado es interpretable: el famoso C.I. no era otra cosa que
la razn edad mental de Binet sobre la edad cronolgica multiplicado por 100, de manera que
los puntajes al rededor de 100 (edad mental = edad cronolgica) indicaban normalidad, para
cualquier nivel de edad del examinado. Esta unidad de medida de inteligencia, con todas sus
limitaciones, tiene una gran importancia en la psicometra ya que con ella, los test psicolgicos
lograron un reconocimiento nunca antes alcanzado hasta el punto de que el C.I. se convirti casi
en un mito.
Terminada la segunda dcada del presente siglo los tests psicolgicos gozaban de gran
popularidad, el concepto de C.I. era ya ampliamente conocido y la Americana Psychological
Association (A.P.A.) mostraba gran inters en el desarrollo de pruebas psicolgicas. La decisin
de Estados Unidos de participar en la Primera Guerra Mundial y de la APA en colaborar en dicha
empresa, puso de manifiesto algunas limitaciones de los tests psicolgicos conocidos hasta el
momento. Por una parte, se trataba de instrumentos que deban ser aplicados de manera
individual y por psiclogos experimentados lo cual no resultaba conveniente si se trataba de
seleccionar grandes nmeros de personas para el ejrcito norte americano. Robert Yerkes (1917)
y su equipo designado precisamente por la APA, recolect todos los tests disponibles y algunos
no publicados y conformaron una primera prueba de aplicacin colectiva conocida como Test
Army Alfa, basada en los trabajos an no publicados de Arthur Otis. Por otra parte, las pruebas
conocidas hasta el momento no permitan la evaluacin de personas analfabetas, con
deficiencias de lenguaje o que no conocieran el idioma, nuevamente los trabajos de Otis sirvieron
como base para el desarrollo del primer test de inteligencia no verbal conocido como el Test
Army Beta. Finalmente, el concepto de C.I., a partir de edad mental y edad cronolgica no
resultaba muy adecuado cuando se trataba de evaluar adultos, as que nacieron las primeras
formas de puntuacin de los tests a partir de normas de grupo; basadas en la comparacin de
la ejecucin de un individuo en la prueba, con el desempeo promedio del grupo (poblacin) al
que pertenece segn algunas variables de inters como sexo, edad o escolaridad. Este tipo de
unidad de medida sigue siendo utilizado hoy.
As la tercera dcada del presente siglo fue testigo de una inusitada popularizacin del uso de
los tests psicolgicos hasta el punto de que la psicologa se asociaba con trminos como test
o C.I.. Segn Anastasi (1974) ... el florecimiento de los test, ocurrido en los aos veinte,
basado en el uso indiscriminado de los mismos, puede haber causado tanto retraso como
progreso en los test psicolgicos.. Sin embargo, mientras en Norte Amrica estaba en pleno
auge el desarrollo y uso de test psicolgicos para muchsimos fines, otros autores se
preocupaban ms por los anlisis matemticos que brindaran mayor soporte a sus resultados y
por el desarrollo de modelos tericos y de anlisis sobre todo en el campo de la medicin de la
inteligencia. Se destacan en esta lnea los trabajos de los ingleses Spearman, Thompson y Burt,
que fueron continuados y perfeccionados por los norte americanos Kelley y Thurstone.
Charles Spearman, basado en las ideas de Galton y en los posteriores trabajos de Karl Pearson
sobre su medida de correlacin, haba iniciado desde 1904 una serie de trabajos sobre las
funciones cognoscitivas. Apoyado en la observacin de que las matrices de correlaciones
entre tests cognoscitivos eran positivas y jerrquicas[2], plantea su famosa teora de dos
factores y sustenta matemticamente sus conclusiones (1927). Segn esta teora las
puntuaciones en los testscognoscitivos pueden explicarse a travs de dos factores: uno general,
conocido como el factor g, que es comn a todas las funciones medidas en los tests y uno
especfico, s, que sera exclusivo de cada una. El principal contradictor de las ideas de Spearman
es su compatriota Thompson quien, basado en las mismas evidencia demuestra con el mismo
rigor matemtico que las correlaciones observadas por Spearman pueden explicarse por las leyes
del azar operando sobre un conjunto complejo de elementos independientes que constituyen la
inteligencia. Por su parte, otro ingls Burt (1941) vena sosteniendo que las correlaciones entre
los tests podan ser satisfactoriamente explicadas a travs de: a) un factor general, varios
factores comunes de mayor o menor nivel de generalidad y c) tantos factores especficos como
tareas o tests. Sin embargo, el desarrollo y refinamiento de lo que hoy se conoce como anlisis
factorial o multifactorial en psicometra, se le debe al norteamericano Thurstone.
El psiclogo estadounidense L. L. Thurstone (1935, 1947) inicia lo que Bla Szkely (1978) ha
denominado la segunda etapa del anlisis factorial, al introducir los principios del lgebra
matricial en el anlisis de las tablas de correlacin logrando as representaciones n dimensionales
de las relaciones entre test, la extraccin de los posibles factores explicativos para resumir de
manera ms o menos fiel la misma informacin de la matriz original, y el desarrollo de mtodos
de rotacin de tales ejes buscando la estructura simple que facilitara la interpretacin de los
resultados. Es evidente que el diseo de estos procedimientos abra las puertas para la medicin
de aptitudes ms especficas y para dar respuestas ms satisfactorias a los cuestionamientos
que venan plantendose desde la dcada anterior a cerca de las diferencias intraindividuales
observadas en el desempeo frente a pruebas de inteligencia general. En lo que a desarrollo de
instrumentos se refiere, el resultado directo de las investigaciones de Thurstone sobre el anlisis
factorial y la identificacin de aptitudes primarias, fue la batera conocida como test de Chicago
de Aptitudes Mentales Primarias (PMA), publicada por primera vez en 1941. La versin de esta
batera en 1962, con algunas adaptaciones y modificaciones sigue utilizndose hoy en el contexto
educativo y laboral; y las tcnicas de anlisis factorial propuestas por Thurstone son an muy
utilizadas para el anlisis de diversas pruebas psicolgicas.
Mientras esto ocurra se haban desarrollado una serie de pruebas de uso en diversas reas de
aplicacin de la psicologa. Por una parte, en 1939 se publicaba la escala de Inteligencia de
Wechsler-Bellevue con la intencin de proponer un instrumento de medida adecuado para
adultos, que presentara elementos y sistemas de puntuacin ms adaptados para este tipo de
poblacin. Esta escala fue la primera versin de la que hoy se conoce como Escala de inteligencia
para adultos de Wechsler (WAIS), muy utilizada en diferentes contextos. Por otra parte se
adelantaban los trabajos del neurlogo alemn Kurt Goldstein y el psiclogo Gelb, quienes una
vez terminada la primera guerra mundial haban iniciado el desarrollo de algunos instrumentos
de medicin neuropsicolgica, con base en la observacin de jvenes soldados que haban
sufrido lesiones cerebrales. Como resultado de este trabajo se disearon los test de formacin
de conceptos que pretendan evaluar el deterioro de la actitud abstracta como consecuencia de
la lesin cerebral, y que siguen utilizndose hoy en evaluacin neuropsicolgica. Sin embargo
Goldstein slo logr el diseo definitivo de su prueba, compuesta por 5 test, despus de haber
emigrado a Estados Unidos y en compaa de Scheerer, trabajo que fue publicado en 1941. En
esta misma lnea se desarroll el test de formacin de conceptos de Hanfman y Kasanin (1942),
con base en un instrumento de clasificacin de objetos que haba sido elaborado por Vigotsky.
En mediciones de personalidad tambin se haban hecho avances interesantes en lo que a
desarrollo de pruebas se refiere: Una de ellas es la hoja de datos personales de Woodworth,
considerada el precursor de los hoy llamados inventarios de personalidad, que se haba
desarrollado durante la primera guerra mundial pero slo se conoci y emple fuera del contexto
militar despus de que sta terminara. Por otra parte Hartshorne y May (1928-1930) haban
desarrollado algunos test de ejecucin con la intensin de medir aspectos como mentira, robo y
espritu de cooperacin en nios escolares. Con una perspectiva diferentes E. K. Strong publicaba
en 1943 sus cuestionarios de intereses vocacionales para hombres y mujeres. Pero tal vez el
trabajo de mayor trascendencia en esta lnea es el registro multifsico de la personalidad de
Hathaway y Mckinley (1940), primera versin del Inventario Multifastico de Personalidad de
Minnesota MMPI que tiene varias traducciones, adaptaciones y estandarizaciones y sigue siendo
utilizado hoy. Tal vez hasta el momento ningn instrumento de medicin de la personalidad ha
sido objeto de tantos estudios, aplicaciones e investigaciones en diferentes reas de la psicologa
(clnica, laboral, educativa), como el MMPI.
En este contexto: la popularizacin del uso de los tests psicolgicos, el reconocimiento de
diferencias intraindividuales en el desempeo en test de funciones intelectuales, los fuertes
avances en el desarrollo de mtodos matemticos y estadsticos para el anlisis de los resultados
de los mismos y el diseo de algunas pruebas psicolgicas de utilidad en psicologa clnica,
educativa, laboral y en neuropsicologa; Estado Unidos decide intervenir en la segunda guerra
mundial y nuevamente los psiclogos norteamericanos se ven enfrentados a algunas demandas
por parte del ejrcito. Esta vez la respuesta fue la creacin de las bateras de aptitud mltiple
o pruebas diferenciales de la lnea del PMA, que permitan la evaluacin de funciones mucho
ms especficas y la clasificacin de personal para tareas especializadas como pilotos,
bombarderos, operadores de radio y otras. Ejemplos de estos instrumentos son la Aircrew
Classification Battery, el Army General Classification Test (AGCT) y el Armed Forced Qualification
Test (AFQT)[3]. Con las dos ltimas se levantaron escalas de calificacin estandarizadas
conocidas como Army Standard Scores.
Sin embargo, la mayora de bateras o pruebas diferenciales se conocieron despus de terminada
la guerra cuando el ejercito las cedi para uso civil y en los aos subsiguientes se observ un
incremento significativo en el nmero de trabajos que buscaban el diseo de esta clase de
instrumentos, la mayora de ellos construidos con base en el procedimiento recientemente
conocido de anlisis factorial. Algunos de los instrumentos ms conocidos de esta generacin
son el Test de clasificacin de aptitudes de Flanagan (FACT), la batera de test de aptitud
general (GATB) y el test de aptitudes diferenciales (DAT). El primero de ellos, cuyos progresos
empezaron a conocerse en 1947, fue el resultado de algunos trabajos iniciados durante la
segunda guerra mundial con el objeto de disear instrumentos de clasificacin de personal de
las fuerzas areas y se orienta haca el consejo profesional y la seleccin de personal. La GATB
fue diseada por el State Employment Service estadounidense (1956) con base en resultados
de anlisis factorial de bateras preliminares y con el objeto de contar con un instrumento til
para consejo profesional y laboral. Finalmente, el DAT, que fue publicado originalmente en 1947,
fue construida como instrumento para orientacin vocacional en el campo educativo, ha sido
objeto de muchos estudios en esa rea y en consecuencia han aparecido varias revisiones
algunas de las cuales se siguen utilizando hoy.
En este mismo perodo la evaluacin educativa, que haba venido reemplazando sus formas
convencionales por los famosos test, desde la aparicin de la primera versin del Stanford
Achiement Test haca ya un par de dcadas; entra definitivamente en la honda de las mediciones
objetivas y estandarizadas. Vale destacar aqu los trabajos de E. L. Thorndike y otros educadores
y psiclogos dedicados a aplicar y refinar las tcnicas de construccin, utilizacin y calificacin
de pruebas de rendimiento escolar; y la creacin, en 1947, del Educational Testing Service (ETS)
encargado de la construccin y evaluacin de pruebas en el rea educativa y laboral. Tal vez el
instrumento ms conocido en esta lnea es el Graduate Record Examination (GRE), que se haba
originado en 1936, pas a manos del ETS en 1948 y sigue utilizndose como instrumento de
seleccin de estudiantes universitarios en Estados Unidos. En este contexto lleg formalmente
la psicologa a Colombia y lo hizo precisamente como psicometra en el campo Educativo. En
1940? se crea la seccin de psicotecnia en la Facultad de Medicina de la Universidad Nacional
de Colombia con el fin de seleccionar los aspirantes a ingresar a esta institucin y en 1948 se
inicia la enseanza de la psicologa en la carrera de medicina de la Universidad Nacional de
Colombia en lo que Meja (1993) llama la poca dorada de la psicometra en Colombia (1939-
19??).
Durante las dos dcadas siguientes se desarrollaron nuevos instrumentos de medicin en
muchas reas y se revisaron y publicaron nuevas versiones y adaptaciones de los ya existentes;
sin embargo, lo que parece caracterizar este periodo es la aparicin de trabajos sobre teora de
la medicin, los principios y fundamentos de la medicin en psicologa, los problemas de validez
y confiabilidad y en sntesis, la construccin de una teora psicomtrica. En lo que tiene que ver
con desarrollo y revisin de pruebas se pueden mencionar, entre muchos otros: el cuestionario
de 16 factores de la personalidad de Catell (16PF) desarrollado mediante anlisis factorial y
publicado en 1951; el cuestionario de personalidad de Eysenck, resultado de las investigaciones
que sobre estructura de personalidad haba venido adelantando desde 1947; el inventario de
temperamento de Guilford-Zimmerman (1956), las escalas Wechsler de inteligencia[4]; la
tercera revisin de la escala de inteligencia de Stanford-Binet (Terman y Merrill, 1960) y los
inventarios de intereses vocacionales (1966) e intereses generales de Kuder (1964), revisiones
de la hoja de intereses vocacionales de Kuder que haba sido publicada en 1948. De otra parte,
una ligera revisin de la bibliografa existente permite verificar que en este periodo se produjeron
las grandes obras sobre teora y procedimientos psicomtricos que son de uso corriente an.
Corriendo el riesgo de omitir algunos de mucha importancia, se pueden citar trabajos como la
publicacin de Gulliksen, H. (1950) titulado teora de los test mentales; los trabajos de Cronbach
y colaboradores sobre validez y confiabilidad en las pruebas psicolgicas, publicados entre 1951
y 1957; las publicaciones de Guilford (1954) sobre mtodos psicomtricos, de Rasch (1960)
sobre modelos probabilsticos para pruebas de logro e inteligencia y de Guiselli (1964) sobre
teora de la medicin psicolgica; la teora de Guilford sobre la estructura de la inteligencia
humana, cuya primera edicin apareci en 1967; la gran cantidad de artculos publicados por
Paul Horst entre 1949 y 1960 y su libro sobre medicin y prediccin psicolgica en 1968; la
teora estadstica de los puntajes de test mentales de Lord y Novick (1968), los trabajos de
Eysenck sobre estructura de la personalidad, publicados a partir de los 50s y el muy conocido
texto de Magnusson sobre teora de los test (1969).
A pesar de la gran produccin de trabajos sobre teora psicomtrica y el empeo de algunos
psiclogos por brindar sustento terico y tcnico al uso de los mismos en una gran diversidad
de campos; a partir de la dcada de los sesenta se puede identificar lo que Anastasi (1974)
denomina la revuelta anti-test. Esta poca, si as puede llamarse, se caracteriz no slo por un
evidente escepticismo por parte de acadmicos y pblico en general a cerca de la utilidad de las
pruebas psicolgicas, sino por algunas posiciones abiertamente en contra de los mismos.
Algunas de las publicaciones que tal vez tuvieron ms impacto en este sentido fueron las de
Gross en 1962, Hoffman en el mismo ao y Black en 1963 (Citados por Anastasi, 1974); con
ttulos tan sugestivos como The brain watchers, The tyranny of testing y They shall not pass,
respectivamente; en las que no slo se pona en duda la utilidad de los tests sino que se hacan
serias crticas a su uso. Algunas de tales crticas de tipo tcnico: cuestionaban la capacidad de
las pruebas para brindar informacin confiable sobre las aptitudes, la inteligencia o la
personalidad del examinado y por tanto la utilidad de los resultados con fines predictivos tiles
en el campo educativo, laboral o clnico. Otras eran de tipo tico y filosfico con afirmaciones a
cerca de la violacin de la intimidad del examinado; la indebida divulgacin y utilizacin de los
resultados de las pruebas; la falta de responsabilidad en el manejo de las implicaciones
emocionales de la aplicacin y conocimiento de resultados de las pruebas; la visin limitada y
reduccionista del individuo a partir de los resultados de las pruebas y en fin, la pretensin de
cuantificar lo no cuantificable: el ser humano. Finalmente, haba objeciones de tipo poltico: las
pruebas pretendan medir conformismo social o, en todo caso favorecan a quienes mostraban
determinadas preferencias polticas o filosficas; las pruebas desfavorecan a determinados
grupos tnicos o con diferencias culturales; y en nuestro medio el uso de pruebas lleg a
identificarse con imperialismo norteamericano. Probablemente algunas de las crticas eran
razonables y se deban al abuso de los instrumentos de medicin por parte de profesionales
inescrupulosos o no capacitados, otras podran atribuirse a desconocimiento de las limitaciones
de las pruebas y otras, podran verse como reaccin al fenmeno aceleradsimo de
implementacin y uso de pruebas. En fin, dejemos que algn historiador se interese por analizar
estos hechos desde una ptica mucho ms completa que la que podemos tener desde aqu.
Como era de esperarse, la revuelta anti-test ha dejado sentir sus efectos. Probablemente uno
de ellos sea el hecho de que los modelos de anlisis de instrumentos psicolgicos que se
generaron entre las dcadas de los 70 y 80 son an hoy muy poco conocidos, al menos en
nuestro medio, y apenas se estn empezando a valorar y a utilizar sobretodo en el campo
educativo. Uno de ellos es el modelo bayesiano. A pesar de que Thomas Bayes haba expuesto
los fundamentos de lo que hoy se conoce como teora estadstica bayesiana en 1763, se
necesitaron casi dos siglos[5] para que algunos estadsticos vieran en l una alternativa de
anlisis de algn inters y slo hasta hace un par de dcadas empezaron a verse sus aplicaciones
y utilidad en el anlisis de pruebas psicolgicas. De manera muy sinttica puede expresarse el
sentido del teorema de Bayes como el enunciado formal de las relaciones entre la conocida
probabilidad a priori, la informacin que se tenga sobre el fenmeno de inters y la probabilidad
a posteriori; lo cual permite hacer estimaciones teniendo en cuenta la informacin adicional que
se tenga proveniente de p.e. experiencias previas. Este principio general ha tenido implicaciones
en la interpretacin de resultados de pruebas psicolgicas y en el diseo y construccin de las
mismas. Por una parte, permite estimar la posicin de un sujeto en un nivel del atributo que
pretende medir la prueba teniendo en cuenta tanto su desempeo actual como la informacin
previa que se tenga sobre l. Por otra parte, si lo que se desea con la construccin y aplicacin
de una prueba es estimar con precisin el nivel del examinado en el atributo, el anlisis bayesiano
permite identificar el punto ms adecuado para obtener informacin que permita el
posicionamiento rpido y preciso del sujeto. Estas aplicaciones y el uso de nuevas tecnologas
como los cumputadores, han permitido el desarrollo de los instrumentos conocidos como
pruebas hechas a la medida en las cuales cada elemento de la prueba es seleccionado con base
en la informacin que se tenga sobre el sujeto y en la respuesta que d al elemento anterior.
Otro inters de los psiclogos en las ltimas dcadas ha sido el sesgo de las pruebas y los
elementos que las componen. Tal sesgo puede verse de manera muy sencilla, a travs de las
discrepancias de dificultad y discriminacin de los elementos de la prueba o de puntaje promedio
y confiabilidad de la prueba total, en grupos diferentes. Rasch haba propuesto en 1960 un
procedimiento, que no depende de la poblacin a la que se aplic la prueba, para posicionar sus
elementos en un nivel del atributo. Sin embargo, ha sido Wright en compaa de Panchapakesan
(1969) y de Stone (1979), quienes han mostrado la utilidad de este tipo de anlisis en algunas
de sus publicaciones sobre anlisis de tems y diseo de pruebas.
Finalmente, dos modelos de anlisis multivariados que han sido objeto de estudio de algunos
psiclogos y socilogos en los ltimos aos han sido el Patn Analysis y los Structural equation
modeling. Estos modelos han mostrado utilidad en la comprobacin de hiptesis de relaciones
entre grupos de variables, el primero de ellos como una extensin de los anlisis de regresin
donde se puede analizar ms de una variable dependiente (Klem, L, 1995) y el segundo como
procedimiento para poner a prueba modelos que incluyen tanto variables observadas como
variables latentes y diferentes tipos de relaciones entre ellas. Algunas publicaciones sobre este
ltimo tema son Bollen, K. A. (1989); Apodaka y Pez (1992) y Hoyle, R. (1995).
Aunque en la actualidad no se ha iniciado en Colombia un estudio cuidadoso de los ltimos
avances en modelos cuantitativos de aplicacin en psicologa, lo cual se evidencia por la ausencia
de estos temas dentro de los programas de los cursos de psicometra o de mtodos cuantitativos
en las Facultades de Psicologa en nuestro pas; algunos hechos parecen indicar un cambio de
actitud frente a la medicin psicolgica. El fortalecimiento del Servicio Nacional de Pruebas, pese
a todos sus contradictores; la implementacin cada vez ms generalizada de procedimientos de
seleccin en las grandes universidades; la exigencia explcita de la Constitucin Nacional de
Colombia (1991) en cuanto al ingreso a las entidades del Estado, por sistemas de mritos; y los
subsecuentes desarrollos legales en las diferentes ramas del Poder Pblico, que prevn la
utilizacin de medidas objetivas dentro de los concursos de ingreso; se estn convirtiendo en
demandas apremiantes que exigen de los psiclogos volcar su atencin sobre los mtodos
cuantitativos. Desde esa perspectiva, probablemente quien escriba la historia de la Psicologa en
Colombia dentro de unas dcadas, podr afirmar que el principio del segundo milenio fue la
poca del resurgimientode la psicometra.

[1] En sus Notas sobre la historia de la correlacin Karl Pearson (1920), refirindose al trabajo
de Galton titulado Typical laws of heredity in man (1877), escribe: Aqu aparece por primera
vez una medida numrica r de lo que se conoce como reversin, que ms tarde Galton
llam regresin . Esta r es la fuente de nuestro smbolo para el coeficiente de
correlacin. Maxwell (1979).
[2] Una matriz de correlaciones es una tabla que presenta los valores de todas las
correlaciones entre un grupo de variables, dos a dos. Es entonces simtrica, los elementos de
la diagonal principal son iguales a 1 y se dice que es jerrquica cuando sus columnas son
proporcionales.
[3] Una presentacin detallada de las caractersticas de estos instrumentos y otros
desarrollados en el mismo contexto, se encuentra en Anastasi (1974)
[4] Son tres instrumentos conocidos como escala Wechsler de inteligencia para nios (WISC)
publicada en 1950; la escala Wechsler de inteligencia para adultos (WAIS) publicada en 1955 y
la escala Wechsler de inteligencia para niveles preescolar y primario (WPPSI) publicada en
1967. Todas han sido traducidas al espaol y estandarizadas en varios pases y son de uso
muy comn en diversas reas como educacin, psicologa clnica y neuropsicologa.
[5] El artculo de Bayes apareci publicado nuevamente en 1958 en la revista Biometrika,
despertando el inters de algunos acadmicos (Martz y Waller, 1982)

PUEDE ENCONTRARSE EN : http://www.humanas.unal.edu.co/psicometria/nosotros/historia/

Você também pode gostar