Escolar Documentos
Profissional Documentos
Cultura Documentos
El concepto de validez hace referencia al grado de relacin entre el test y el constructo que se
quiere medir: cuanto ms estrecha sea esta relacin ms vlido ser el test. Es importante
aclarar que cuando se habla de la relacin entre el test y el constructo, en realidad se hace
referencia a la relacin entre las puntuaciones obtenidas por los sujetos en el test y la medida
obtenida en el indicador o indicadores del constructo.
Tras aos de estudios, se concluy que existen tres tipos de validez: de contenido, relativa al
criterio (que incluye a la predictiva y la concurrente) y de constructo. Se asume que los
distintos tipos de validez van unidos a los objetivos concretos en el uso de los tests, de ah la
importancia de definir cules van a ser estos objetivos:
Actualmente parece haber un acuerdo generalizado en que, desde el punto de vista cientfico,
la nica validez que se debe de considerar es la de constructo y que las otras dos quedaran
incluidas dentro de esta, siendo estrategias para comprender mejor lo que mide el test. Ya no
se habla de distintos tipos de validez y la validacin de los tests es un proceso continuo que
permite obtener distintos tipos de evidencia emprica. Un proceso de validacin ideal debe
incluir los tipos de evidencia incluidos en los tres tipos tradicionales de validez.
1
Psicometra | Tema 6: La validez de las inferencias (I)
Validacin de contenido
El objetivo general en un estudio de validacin de contenido es analizar hasta qu punto los
elementos o tems que componen el test son una muestra representativa y relevante del
constructo sobre el que se van a realizar las inferencias:
Ejemplo: supongamos que un grupo de 100 expertos ha de juzgar la relevancia de 3 tems para
medir la calidad de la enseanza (constructo de inters). En la tabla se muestran las
valoraciones de los expertos a cada tem, donde la categora 1 indica un mal ajuste entre el
tem y el constructo y la categora 5 un muy buen ajuste.
Calculando las medianas para los tres tems, obtenemos que: MedA=4, MedB=2,25 y
MedC=2,90.
Ante estos resultados se puede decir que el tem A tiene un muy buen ajuste y, por tanto, se le
puede considerar relevante para la medida de la calidad de la enseanza. Los otros dos no
deberan incluirse puesto que el ajuste no es muy bueno.
Escala
tems
1 2 3 4 5
A 0 10 10 60 20
B 20 40 30 120 0
C 10 20 50 10 10
Validacin de constructo
Este tipo de validacin da significado a las puntuaciones de los tests: permite obtener
evidencia de que las conductas observables que se han elegido como indicadores del
constructo realmente lo son.
2
Psicometra | Tema 6: La validez de las inferencias (I)
Si se confirman las relaciones postuladas en las hiptesis planteadas, se puede considerar que
tanto el constructo como el test son tiles.
Los estudios de validacin del constructo se centran en analizar la estructura interna y externa
del test:
Interna: estudiar las interrelaciones entre las puntuaciones obtenidas por los sujetos
en los distintos tems del test.
Externa: estudiar las relaciones entre las puntuaciones obtenidas en el test y otras
medidas del mismo constructo obtenidas en variables relevantes externas al mismo.
Entre los mtodos para validar el constructo destacan el mtodo de la matriz multimtodo-
multirrasgo y el anlisis factorial.
La matriz multimtodomultirrasgo
Este mtodo permite el anlisis de la estructura externa de uno o varios tests. La lgica es la
siguiente:
Ejemplo: supongamos que se quieren medir tres constructos: razonamiento numrico (RN),
factor espacial (FE) y razonamiento abstracto (RA), para lo cual se han elaborado tres
procedimientos con distinto formato: Verdadero-Falso (V-F), Eleccin mltiple (E-M) y Frases
incompletas (F-I).
Para analizar la validez convergente y discriminante, se aplican todas las pruebas a una muestra
de sujetos, obteniendo unos resultados a partir de los cuales se calculan todas las
intercorrelaciones posibles, recogidas en la matriz que se presenta a continuacin:
Los valores de las diagonales (entre corchetes) son los distintos coeficientes de
fiabilidad. Se corresponden a la correlacin entre las puntuaciones obtenidas al medir el mismo
constructo utilizando el mismo procedimiento (p. ej.: test paralelos).
Los valores en negrita corresponden a las correlaciones obtenidas al medir distintos
constructos con los mismos procedimientos.
Los valores subrayados y en cursiva son las correlaciones obtenidas al medir el mismo
constructo con distintos procedimientos. Son los indicadores de la validez convergente.
3
Psicometra | Tema 6: La validez de las inferencias (I)
Uno de los problemas de este procedimiento es que no existe un criterio estadstico para tomar
decisiones acerca de si el test tiene realmente validez convergente y discriminante, tan slo se
puede decir que parece haber evidencia de su existencia o ausencia. Para obtener mayor
informacin se est utilizando el anlisis factorial confirmatorio.
El Anlisis Factorial
El anlisis factorial (AF) incluye una serie de tcnicas que tratan de representar y explicar un
conjunto de variables observables (tems, conjunto de test, escalas, etc.) mediante un nmero
ms reducido de variables inobservables (o latentes) llamadas factores.
Ejemplo: supongamos que a la matriz del ejemplo anterior se le aplica alguna tcnica de AF y
que la estructura factorial encontrada es la que se presenta en la siguiente tabla.
Se puede observar que se han obtenido 2 factores: el primero agrupa las medidas
correspondientes a las variables utilizadas como indicadores del constructo razonamiento
numrico (RN) junto a dos correspondientes al constructo razonamiento abstracto (RA). El
segundo factor est definido por todas las medidas correspondientes a las variables utilizadas
como indicadores del constructo razonamiento espacial (RE) junto a otras dos
4
Psicometra | Tema 6: La validez de las inferencias (I)
Se suelen utilizar dos tipos de ndices o medidas para describir la capacidad de un test o
conjunto de tests para predecir un criterio: medidas correlacinales (coeficiente de validez,
determinacin, valor predictivo, etc.) y las medidas de error en prediccin (errores de
estimacin).
Este tipo de estudios se realizan desde dos perspectivas diferentes en funcin del uso del test y
del tipo de inferencias que se quieran realizar:
Si los tests se van a utilizar para la seleccin, clasificacin o colocacin de personas (en
programas o puestos de trabajo), lo interesante es analizar la validez predictiva del
test. La validez predictiva es la capacidad para pronosticar el rendimiento posterior de
los su jetos a partir de las puntuaciones del test.
Si se trata de hacer un diagnstico, es ms adecuado llevar a cabo un estudio de
validez concurrente.
Para disear un estudio de validacin referida al criterio es necesario seguir una serie de
pasos:
5
Psicometra | Tema 6: La validez de las inferencias (I)
6) Determinar el grado de relacin entre las puntuaciones obtenidas por los sujetos en el
test y la medida del criterio.
Thorndike y Hagen consideran que lo sindicadores deben cumplir una serie de requisitos:
6
Psicometra | Tema 6: La validez de las inferencias (I)
El coeficiente de validez
Se define como la correlacin entre las puntuaciones obtenidas por los sujetos en el test
predictor y las obtenidas en el criterio. El tipo de correlacin utilizada para el clculo del
coeficiente de validez depender del tipo de las variables implicadas.
Tabla 3. Tipos de correlaciones en funcin del tipo de variables incluidas.
Indicador Test
criterio Continua Dicotomizada Dicotmica
Continua Pearson Biserial Biserial puntual
Dicotomizada Biserial Tetracrica biserial
Dicotmica Biserial puntual biserial
= +
Donde:
7
Psicometra | Tema 6: La validez de las inferencias (I)
2
= 1 (en puntuaciones directas y diferenciales)
2
= 1 (en puntuaciones tpicas)
Intervalos de confianza
Debido a los errores de estimacin que se cometen al hacer los pronsticos, ms que
estimaciones puntuales conviene hacerlas por intervalos. Los pasos a seguir son:
Coeficiente de determinacin
Equivale al coeficiente de validez al cuadrado y representa la proporcin o porcentaje de la
varianza de las puntuaciones de los sujetos en el criterio (variable dependiente) que se puede
pronosticar a partir del test (variable independiente o predictora). Es la varianza comn entre
el test y el criterio.
2
. . =
Coeficiente de alineacin
Indica la proporcin que representa el error tpico de estimacin respecto a la desviacin tpica
de las puntuaciones en el criterio. En la medida en que el error tpico sea ms pequeo que la
desviacin tpica, este ndice K ser menor. K vara entre 0 y 1: ser mximo cuando el
coeficiente de validez sea 0 y mnimo cuando el coeficiente de validez sea 1.
2
. . = = = 1
2
. . . = 1 = 1 1
Ejemplo
Supongamos que se quiere llevar a cabo un estudio de validacin relativa al criterio de un test
de aptitud mecnica (X), para lo cual ser aplica a una muestra de sujetos representativa de la
poblacin en la que se va a utilizar el test. Estos sujetos son evaluados posteriormente pos sus
8
Psicometra | Tema 6: La validez de las inferencias (I)
Dado que ambas variables son cuantitativas, para calcular el coeficiente de validez se utiliza el
coeficiente de correlacin de Pearson:
6 473 43 61
= = 0,73
[6 711 612 ][6 335 432 ]
Dado que el valor mximo del coeficiente de validez es 1, se puede deducir que el test tiene
buena capacidad predictiva. Una vez calculado este coeficiente, se calculan las ecuaciones de
regresin en puntuaciones directas, diferenciales y tpicas.
2 ( )2
= = 2,12
2
= = 1,46
9
Psicometra | Tema 6: La validez de las inferencias (I)
Para hacer la estimacin en puntuaciones tpica shay que tener en cuenta que el error tpico
2
de estimacin es diferente y hay que calcularlo: = 1 = 0,69. El error mximo por
tanto ser: = = 1,35.
Aplicacin de las ecuaciones de regresin al valor X=13 para obtener las puntuaciones
pronosticadas:
o Puntuaciones directas: = 3,15 + 0,395 (13) = 8,28.
o Puntuaciones diferenciales: = 0,395 (13 10,17) = 1,18.
o Puntuaciones tpicas: = 0,73 = 0,53.
= 8,26 2,86
= 1,18 2,86
= 0,53 1,35
10