Validez de Un Instrumento (Modo de Compatibilidad)

UNIVERSIDAD NACIONAL DE ASUNCIN
FACULTAD DE FILOSOFA
CARRERA DE PSICOLOGA
AREA BSICA
CTEDRA DE PSICOMETRA BSICA
3er. Curso 3ra. Seccin (Turno Tarde)
LIC. CARLOS FERNANDO RIEGO CABRAL
Cualquier cosa que existe, existe en alguna cantidad.
Thorndike, 1918.
Cualquier cosa que existe en cantidad, puede medirse.
McCall, 1939
Lewis R. Aiken (1996) Test Psicolgicos y Evaluacin
Lic. Carlos F. Riego C.
VALIDEZ DE UN INSTRUMENTO
en Investigacin Cuantitativa
VALIDEZ DE UN INSTRUMENTO
en Investigacin Cuantitativa
Qu es valido?
En lenguaje cotidiano decimos que es vlido si es
slido, si est bien fundado en principios y evidencias.

En trminos legales cuando es ejecutado con las
formalidades apropiadas. Ej. Contrato vlido,
testamento vlido. Es la significacin o grado de
veracidad de algo.

En lenguaje de Evaluacin Psicolgica, Validez es un
trmino usado conjuntamente con la significacin de
una puntuacin de prueba.
Concepto de Validez

La palabra validez cuando se aplica a una prueba se
refiere a un juicio concerniente a lo bien que mide de
hecho una prueba lo que pretende medir.

De manera especfica, es un juicio basado en evidencia
sobre lo apropiado de las inferencias extradas de las
puntuaciones de prueba.

Qu es inferencia? Es un resultado lgico o
deduccin en un proceso de razonamiento.

Las caractersticas de validez de las pruebas y las
puntuaciones de prueba son expresadas con
frecuencia con trminos aceptable o dbil.

En un juicio de validez hay inherente un juicio de
utilidad de un instrumento de medicin. til
desde
el
punto
de
vista
cientfico
(Nunnally, 1978, p.86)

Entonces Qu es Validacin?
Es
el
proceso
de
recopilacin
y
valoracin
de
la
evidencia
de
validez.

Tanto quien elabora la prueba como el administrador
de la misma pueden desempear una funcin en la
validacin de una prueba para un propsito especfico.

OBS: Es responsabilidad del elaborador de la prueba
suministrar evidencia de la validez en el manual de la
misma.

En ocasiones puede ser apropiado para los
administradores de la prueba realizar sus propios
estudios de validacin con los grupos de personas que
respondern la prueba. Estos estudios de validacin
local son necesarios cuando el usuario de la prueba
planea alterar de alguna manera el formato,
instrucciones, lenguaje o contenido de la prueba.

Los estudios de validacin local tambin seran
apropiados cuando la prueba ser usada con una
poblacin de personas que difiere de alguna manera
significativa de la poblacin en la que fue
estandarizada.
Cmo se procede a valorar la validez de una prueba?
Una forma de conceptualizar la validez se ha dado con
respecto a la siguiente taxonoma de tres categoras:
Validez de contenido.
Validez relacionada con un criterio.
Validez de constructo.
Esta
perspectiva
de
la
validez,
a
la
que
hace
referencia
Guion
(1980)
como
la
perspectiva trinitaria
es
la
que
prevalece
en
el
campo
de
la
psicologa
en
la
actualidad
lo
ha
sido
al
menos
desde
la
dcada
de
1950.
Dentro del contexto de la taxonoma de tres categoras,
la validez de una prueba puede evaluarse:
1.
Examinando a fondo su contenido.
2.
Relacionando las puntuaciones obtenidas en la
prueba con otras puntuaciones de prueba u otras
medidas.
3.
Realizando un anlisis general no slo de la forma en
que las puntuaciones de la prueba se relacionan
dentro de algn marco terico para comprender el
constructo al que la prueba est diseada a medir.

No son mutuamente excluyentes; cada uno deber
considerarse como un tipo de evidencia que, con otras,
contribuye a un juicio de la validez de la prueba.

Un administrador de pruebas puede no necesitar conocer
los tres tipos de evidencia de validez. Depender
del
uso
que
se
le
vaya
a
dar
a
la
prueba.
VALIDEZ APARENTE

Se relaciona ms con lo que la prueba parece
medir que con lo que en realidad mide. La validez
aparente es un juicio concerniente a lo relevante
que parecen ser los reactivos de la prueba.

Planteado de otra forma, si una prueba parece
medir en forma clara lo que pretende medir
primera
vista, podra decirse que tiene una validez
aparente alta. Ej. Una prueba de personalidad por
escrito que mida Introversin/Extroversin.
Qu debe preguntar?
1. Creo que valgo tanto como cualquier otra
persona?
-Totalmente en desacuerdo
-Moderadamente en desacuerdo
-Parte de acuerdo y parte desacuerdo
-Moderadamente de acuerdo
-Totalmente de acuerdo
2. Tengo muchas ganas de vivir
-Nunca o casi nunca
-Algunas veces
-Bastante veces
-Casi siempre
-Siempre
3. Muchas veces cuando tengo que hacer un halago,
no s qu decir
-No me identifico en lo absoluto; la mayora de las
veces no me ocurre o no lo hara
-Ms bien no tiene que ver conmigo, aunque alguna
vez me ocurra
-Me describe aproximadamente, aunque no siempre
acte o me sienta as
-Muy de acuerdo y me sentira o actuara as en la
mayora de los casos
4. Te gusta salir a menudo?
-S
-No
5. Tienes muchos amigos?
-S
-No
6. Prefieres leer o realizar otras actividades antes que
conocer gente?
-S
-No
Respuestas:
1-Autoestima. 4-Extroversin.
2-Ideacin suicida Depresin. 5-Extroversin.
3-Habilidades Sociales. 6-Introversin.

Por otra parte, una prueba de personalidad en la que
la responden se les hacen preguntas sobre una
variedad de manchas de tintas puede ser percibida por
lo general como una prueba con validez aparente baja.
Pueden preguntar:
Cmo dicen que vieron en mis respuestas a las
manchas de tinta algo que tiene que ver en realidad
con la personalidad?
Ejemplo: Persona
bajo
la
lluvia
(Aparicin
de
paraguas
en
el
dibujo
relacionado
con
baja
tolerancia
la
frustracin)
,
Rorschach,
Test
de
los
Colores,
etc.

A diferencia de los juicios concernientes de la
confiabilidad de una prueba y a la validez de
contenido, constructo o relacionada con un criterio de
una prueba, los juicios concernientes a la validez
aparente de una prueba son considerados con
frecuencia desde la perspectiva de quien responde la
prueba en oposicin a la del administrador de la
prueba.
Ejemplo: La
falta
de
Validez
Aparente
podra
contribuir
una
falta
de
confianza
con
respecto
a
la
efectividad
percibida
de
la
prueba,
con
una
disminucin
consecuente
en
la
motivacin
de
quien
la
responde
para
hacer
su
mejor
esfuerzo.

Su preocupacin podra derivarse de una creencia de que
dichas pruebas dar como resultado conclusiones
invlidas.

Desde la perspectiva del administrador de la prueba, la
Validez Aparente tambin puede ser importante ya que
contribuye (o deja de contribuir) a la confianza del
administrador en la prueba.
VALIDEZ DE CONTENIDO

Es un juicio concerniente a lo adecuado del muestreo
que hace una prueba del comportamiento
representativo del universo de comportamiento del
que la prueba estaba diseada para tomar una
muestra.
Ejemplo: El universo de comportamientos (indicadores)
denominado Bienestar Psicolgico es muy amplio.
Podramos
esperar
que
dicha
prueba
contendra
reactivos
que
hicieran
un
muestreo
de
situaciones
hipotticas
en
el
trabajo.....
.
Bienestar Psicolgico Laboral

Mi trabajo da sentido a mi vida.
-Nunca
-Raras veces
-Algunas veces
-Con frecuencia
-Casi siempre

Mi trabajo es creativo, variado y estimulante.
-Nunca
-Raras veces
-Algunas veces
-Con frecuencia
-Casi siempre

Estoy discriminado/a en mi trabajo.
-Nunca
-Raras veces
-Algunas veces
-Con frecuencia
-Casi siempre
Bienestar en Relacin con la Pareja

Atiendo el deseo sexual de mi esposo/a.

Mi esposa/o y yo estamos de acuerdo en la mayora
de las cosas.

Cuando estoy en casa no aguanto a mi mujer en ella
todo el da.
Bienestar Psicolgico Subjetivo

Acostumbro a ver el lado favorable de las cosas.
-Nunca
-Algunas veces
-Bastantes veces
-Casi siempre
-Siempre

Me gusta lo que hago.
-Nunca
-Algunas veces
-Bastantes veces
-Casi siempre
-Siempre

Creo que no puedo superar mis errores y debilidades.
-Nunca
-Algunas veces
-Bastantes veces
-Casi siempre
-Siempre

Con respecto a las pruebas de rendimiento educativo,
se acostumbra considerar a una prueba como una
medida con contenido vlido cuando
la
proporcin
de
material
cubierto
por
la
prueba
se
aproxima
la
proporcin
de
material
cubierto
en
el
curso.
Ejemplo: El
desarrollo
del
programa
de
estudio
del
curso,
del
libro
de
texto,
etc.

Para que una prueba de empleo tenga un contenido
vlido, ste debe ser una muestra representativa de las
habilidades relacionadas con el trabajo requerida para
el empleo.
Ejemplo: Un
Psiclogo
Laboral,
interesado
en
desarrollar
un
instrumento
para
seleccionar
a
las
personas
con
mayor
capacidad para las ventas,
decide
utilizar
tres
cuatro
indicadores...
1.
Capacidad para expresarse verbalmente
(razonamiento verbal): conversacin y escucha;
2.
capacidad de relacionamiento (sociabilidad);
3.
independencia, como una medida de la capacidad
para la toma de decisiones e iniciativa;
4.
agresividad para las ventas.
CUANTIFICACION DE LA VALIDEZ DE CONTENIDO

Uno de los mtodos creados para cuantificar la
validez de contenido fue elaborado por LAWSHE
(1.975), quien propuso una frmula simple para
cuantificar el grado de consenso pidiendo a un
grupo de expertos que determinen la validez de
contenido de una prueba.

Incluye a un grupo de jueces y cada miembro del
jurado responde a la siguiente pregunta para cada
uno de varios reactivos:
El indicador o contenido utilizado en este reactivo
es: o ....
La habilidad o conocimiento medido por este reactivo
es:
Esencial
til pero no esencial
No necesaria
para medir este Factor? o
para el desempeo del trabajo?

Lawshe desarroll una frmula denominada Razn de
Validez de Contenido:
n
N/2
CVR =
e
=
N/
2
CVR = Razn de Validez de Contenido.
ne = nmero de expertos que indican esencial.
N= Nmero total de expertos.
tem 1:
nN/2 4(10/2) 4-5 -1
CVR =
e
= ===
-0,20
N/2 10/2 5 5
tem 2:
nN/2 5(10/2) 5-5 0
CVR =
e
= ===
0,00
N/2 10/2 5
5
CVR = Razn de Validez de Contenido.
ne = nmero de expertos que indican esencial.
N= Nmero total de expertos.
tem 3:
nN/2 7(10/2) 7-5 2
CVR =
e
= ===
0,40
N/2 10/2 5 5
tem 4
nN/2 9(10/2) 9-5 4
CVR =
e
= ===
0,80
N/2 10/2 5
5

Cuadro 6.1: Valores mnimos de la razn de validez de
contenido para asegurar que es improbable que el
acuerdo se deba al azar.
Nmero de
expertos
Valor mnimo
5 .99
6 .99
7 .99
8 .85
9 .78
10 .62
11 .59
VALIDEZ DE CRITERIO

Es un juicio respecto a lo adecuado que puede ser el
uso de una puntuacin de prueba para inferir la
posicin ms probable del individuo en alguna medida
de inters, siendo
la
medida
de
inters
el
criterio.

Dos tipos de evidencias de validez se incluyen bajo el
encabezado de Validez con base en Criterios:
1 Validez Concurrente y 2 Validez Predictiva.

1 Validez Concurrente: Es un ndice del grado en que
una puntuacin de prueba se relaciona con alguna
medida criterio obtenida al mismo tiempo (en forma
concurrente).

2 Validez Predictiva: Es un ndice del grado en que
una puntuacin de prueba predice alguna medida
criterio.
Pero. QU ES UN CRITERIO?
Un Criterio puede definirse como la norma contra la
cual es valorada una prueba o una puntuacin de
prueba.
Desde el punto de vista operativo un criterio puede
ser cualquier cosa:
Ejemplo: Nmero
de
ventas
de
un
producto,
ficha
clnica
con
el
Dx.
de
un
paciente,
notas
de
un
colegio,
desempeo
laboral,
ndice
de
ausentismo,
puntaje
de
una
prueba,
cantidad
de
tiempo,
etc.

La frmula se lee como sigue: el coeficiente de validez
es menor o igual que la raz cuadrada del coeficiente
de confiabilidad de la prueba multiplicado por el
coeficiente de confiabilidad del criterio.
Es relevante un criterio adecuado!
1.
Es de esperar, por ejemplo, que una prueba que
pretende decirnos algo de la aptitud, actitud,
diagnstico, etc. de un individuo, se haya validado
usando alguna especie de criterio que incluya datos
obtenidos por otros profesionales o personas.
2. Una medida criterio adecuada tambin debe ser
vlida para el propsito para el que se est usando.

Si una prueba (X) se est usando como el criterio para
validar una segunda prueba (Y), entonces debe existir
evidencia de que la prueba X es vlida.
Ejemplo: Si,
un
manual
de
prueba
para
una
prueba
diagnstica
de
personalidad
report
que
la
prueba
haba
sido
validada
usando
como
criterio
Diagnsticos
hechos
por
un
grupo
de
expertos
galardonados
en
psicodiagnstico, el administrador de la prueba podra
desear investigar ms a fondo, ya sea leyendo en el
manual o escribindole al editor de la prueba, respecto a
variables como:
a)
Las definiciones especficas de trminos y categoras
diagnsticas.
b)
La naturaleza precisa de los antecedentes,
capacitacin y experiencia del grupo de expertos
galardonados y
c)
La naturaleza y extensin del contacto fuera de la
prueba, de los miembros del grupo de expertos con
los sujetos diagnosticados.
3.
De manera ideal, un criterio tampoco est
contaminado.

La contaminacin del criterio es
el
trmino
aplicado
una
situacin
donde
la
medida
criterio
en
s
se
ha
basado,
al
menos
en
parte,
en
medidas
de
prediccin.
Ejemplo: Supongamos
que
acabamos
de
completar
una
investigacin
de
la
precisin
con
la
que
una
prueba
llamada
MMPI
predijo
diagnsticos
en
la
poblacin
de
pacientes
del
Hospital
Neuropsiquitrico.

En este estudio, quien lleva a cabo el pronstico es el
MMPI y el criterio es el diagnstico psiquitrico
obtenido de las fichas clnicas de los pacientes.

Supongamos adems que, mientras estamos en el
proceso de anlisis de nuestros datos, alguien nos
informa que el diagnstico para cada paciente en el
Hospital Neuropsiquitrico fue determinado, al menos
en parte, por puntuaciones de la prueba MMPI.
An deberamos proseguir con nuestro anlisis?
Por supuesto que no. Debido a que la medida
pronosticadora a contaminado a la medida criterio.
VALIDEZ CONCURRENTE

Si las puntuaciones de prueba se obtienen ms o
menos al mismo tiempo que las medidas criterio, las
medidas de relacin entre las puntuaciones de prueba
y el criterio proporcionan evidencia de Validez
Concurrente.

Las declaraciones de Validez Concurrente indican el
grado en que las puntuaciones de prueba pueden ser
usadas para estimar la posicin presente de un
individuo en un criterio.
Ejemplo: La
puntuaciones
(
o
clasificaciones)
hechas
con
base
en
una
prueba
de
psicodiagnstico
fueran
ser
validadas
contra
un
criterio
de
pacientes
psiquitricos
ya
diagnosticados.

En ocasiones se explora la validez concurrente de una
prueba (a la que llamaremos Prueba A en
construccin) con respecto a la forma en que se
compara con otra prueba (a la que llamaremos Prueba
B).

En otros estudios, las investigaciones anteriores
demuestran en forma satisfactoria la Validez de la
Prueba B. As, la prueba B se usa como lo que se
conoce como el criterio de validacin.
VALIDEZ PREDICTIVA

La relacin entre las puntuaciones de la prueba
pueden obtenerse en un momento y las medidas
criterio obtenerse en un momento futuro
proporcionan un indicio de la Validez Predictiva de la
prueba.

Es decir con cuanta precisin las puntuaciones de la
prueba predicen alguna medida criterio.
Ejemplo: Puntaje
del
ingreso
y
promedio
de
calificaciones
en
la
universidad.

Adems, en otros escenarios donde podran
emplearse pruebas, las Validez Predictiva alta de una
prueba puede ser un auxiliar muy til para quienes
toman decisiones para seleccionar a:
estudiantes
exitosos,
trabajadores
productivos,
convictos
que
son
buenos
para
salir
bajo
palabra,
homicidio,
suicidio,
etc.

Los juicios de la validez relacionada con un criterio,
sea concurrente o predictiva, se basan en dos tipos
de evidencia estadstica:
El Coeficiente de Validez y los Datos de Expectativa.
1.
Coeficiente de Validez: es
un
coeficiente
de
correlacin
que
proporciona
una
medida
de
la
relacin
entre
las
puntuaciones
de
prueba
las
puntuaciones
en
la
medida
criterio.

Ejemplo: el coeficiente de correlacin calculado a
partir de una puntuacin (o clasificacin) en una
prueba psicodiagnstica y la puntuacin (o
clasificacin) criterio asignada por
psicodiagnosticadores es un ejemplo de un coeficiente
de validez.

Normalmente, la prueba estadstica ms utilizada para
determinar la validez entre dos medidas es el
coeficiente de correlacin de Pearson.

Sin embargo, dependiendo de variables como el tipo
de datos, el tamao de la muestra y la forma de
distribucin (Normalidad -Homocedasticidad),
podran usarse otros coeficientes de correlacin.
2.
Datos de Expectativa: Muestran la distribucin de las
puntuaciones obtenidas en el test por uno o ms
grupos de individuos en tablas cruzadas con el
rendimiento en el criterio.

Partiendo de que existe un grado de correlacin
grande entre las puntuaciones del test y las medidas
del criterio, esta informacin puede utilizarse para
calibrar la probable posicin en el criterio de los
individuos que obtienen diferentes puntuaciones.
Tabla de Expectativa: Relacin entre las puntuaciones
obtenidas a mitad y a final de curso
Porcentaje que obtienen cada nota final
Nmero
de casos
Suspenso Aprobado Notable Sobresaliente
Puntuacin a
mitad de
curso
90 o ms
Entre
80 y 89
Entre
70 y 79
Entre
60 y 69
59 o
menos
8
23
33
67
11
25
46
67
33
22
50
31
67
17
Fuente: Urbina, S. (2007, pp. 138-139)
Qu tan alto debera ser un coeficiente de validez para
que un administrador o un elaborador de pruebas
infieran que la prueba es vlida?

No hay reglas para determinar el rango mnimo
aceptable de un coeficiente de validez. De hecho,
Cronbach y Gleser (1965) advirtieron contra el
establecimiento de tales reglas.

Afirmaron que los coeficientes de validez no necesitan
ser tan elevados.

Debe permitir al administrador de la prueba tomar
decisiones precisas dentro del contexto nico en el
que se est usando una prueba.

En esencia, el coeficiente de validez debera ser lo
bastante alto para que conduzca a la identificacin y
diferenciacin de personas que respondern la prueba
con respecto a un atributo o atributos deseados.

Validez incremental: Los administradores de pruebas
implicados en la prediccin de algn criterio a partir de
puntuaciones de prueba a menudo estn interesados
en la utilidad de pronosticadores mltiples.

El valor de incluir ms de un pronosticador depende de
un par de factores: 1 Validez predictiva (Ya explicado)
y 2 Validez incremental.

2 Validez incremental: Es el grado en que un
pronosticador adicional explica algo de la medida
criterio que no estaba explicado por los otros
pronosticadores.
Ejemplo: Cuando se predice algo como el xito
acadmico.
Un estudio de pronosticadores potenciales del
promedio de calificaciones puede revelar:
a) tiempo pasado en la biblioteca, Correlacionan con el
promedio de b) tiempo dedicado al estudio y
calificaciones
c)
cantidad de horas de sueo.
Entonces Cul es la forma ms eficiente de predecir el
promedio de calificaciones?

Empleando un enfoque con los principios de la validez
incremental, es comenzar con el mejor pronosticador,
el pronosticador que se correlaciona de manera ms
alta con el promedio de calificaciones.
Ejemplo: El
tiempo
dedicado
al
estudio.
Entonces,
utilizando
tcnicas
de
regresin
mltiple,
uno
analiza
la
utilidad
de
los
otros
pronosticadores.

OJO: An cuando el tiempo pasado en la biblioteca se
correlaciona de manera alta con el promedio de
calificaciones, puede no poseer validez incremental si
se superpone demasiado con el primer pronosticador.

Dicho de otra manera, si el tiempo dedicado al estudio
y el tiempo pasado en la biblioteca se correlacionan de
manera tan alta entre s que reflejan en esencia lo
mismo, entonces slo uno de ellos necesita incluirse
como pronosticador; incluir ambos proporcionara
poca informacin nueva sobre uno solo.

En contraste, uno puede encontrar que la cantidad de
sueo durante los exmenes tiene buena validez
incremental debido a que refleja un aspecto diferente
de la preparacin para los exmenes (descansar) que
el primer pronosticador (estudiar).

La validez incremental se utiliza para mejora la
prediccin.
Promedio de
Calificaciones
Tiempo en la
biblioteca
Tiempo
dedicado al
estudio
Tiempo en la
biblioteca
0,78 * 1 0,96 **
Tiempo
dedicado al
estudio
0,80 * 0,96 ** 1
Horas de sueo
(descanso)
0,67 * 0,12 -0, 23
*. La correlacin es significante al nivel 0,05 (bilateral)
.
**. La correlacin es significante al nivel 0,01 (bilateral)
.
TASA BASAL y VALIDEZ PREDICTIVA

La teora de la decisin aplicada a las pruebas y la
medicin psicolgica: tasa base, ndice de aciertos,
ndice de fallas, falso positivo y falso negativo.

Tasa base puede definirse como el grado en que un
rasgo, comportamiento, caracterstica o atributo
particular existe en la poblacin (se expresa en
proporcin).

ndice de aciertos (Sensibilidades-Especificidad)
puede definirse como la proporcin de personas que
una prueba identifica con precisin como poseedoras
o que exhiben un rasgo, comportamiento,
caracterstica o atributo particular.
Ej. Proporcin
de
pacientes
oncolgicos
en
quienes
se
identifica
con
precisin
(correctamente)
como
poseedoras
o
que
exhiben
un
rasgo,
comportamiento,
caracterstica
o
atributo
particular.

Sensibilidad: Proporcin de individuos con la
enfermedad que presentan un resultado positivo.
Indica lo buena que es la prueba para identificar a las
personas enfermas.

Especificidad: Proporcin de individuos sin la
enfermedad que presentan un resultado negativo.
Indica hasta qu punto es buena la prueba para
identificar a los individuos que no tienen la
enfermedad.

ndice de fallas (Falso positivo y falso negativo) puede
definirse como la proporcin de personas en las que
una prueba falla en identificar como que tienen o no
tienen un atributo particular.

Falla equivale a una prediccin imprecisa.

Falso positivo es una falla en la cual la prueba predijo
que quien la respondi posee
la caracterstica o
atributo particular que se est midiendo.

Falso negativo es una falla en la cual la prueba predijo
que quien la respondi no
posee
la caracterstica o
atributo particular que se est midiendo.
Aplicacin prctica de los procedimientos de Validez:
Situacin real
Casos (+) Control (-) Falso
Positivo a b a + b (+)
Negativo c d c + d (-)
.
= a + c b + d a + b + c + d
Sensibilidad Especificidad
Enfermedad
Presente Ausente
Prueba
Positiva Verdaderos positivos Falsos positivos Total de pruebas positivas
Negativa Falsos negativos Verdaderos negativos Total de pruebas negativas
.
= a + c b + d N

Sensibilidad: a/(a+c).100

Tasa Base: (a+c)/(a+b+c+d).100

Especificidad: d/(b+d).100

Valor Predictivo Positivo: a/(a+b).100

Falso Positivo: b/(b+d).100

Valor Predictivo Negativo: d/(c+d).100

Falso Negativo: c/(a+c).100
Aplicacin del MBI en una poblacin con una tasa base
alta de Sx. de Burnout
Situacin real
Quemado No quemado Falso
Resultados
de la prueba
Quemado 91 13 104 11,81 (+)
No quemado 19 97 116 17,27 (-)
110 vs.110 S= 110 110 220
82,7% 88,2%
Tasa Base: (110/220).100 = 50%
Sensibilidad: (91/110).100 = 82,7%
Especificidad: (97/110).100 = 88,2%
Falso Positivo: (13/110).100 = 11,81%
Falso Negativo: (19/110).100 = 17,27%
Valor Predictivo Positivo: (91/104).100 = 87,5%
Valor Predictivo Negativo:(97/116).100 = 83,62%
del MBI en una poblacin con una tasa base
alta de Sx. de Burnout
Situacin real
Quemado No quemado Falso
Resultados
de la prueba
Quemado 91 13 104 11,81 (+)
No quemado 19 97 116 17,27 (-)
110 vs.110 S= 110 110 220
82,7% 88,2%
Tasa Base: (110/220).100 = 50%
Sensibilidad: (91/110).100 = 82,7%
Especificidad: (97/110).100 = 88,2%
Falso Positivo: (13/110).100 = 11,81%
Falso Negativo: (19/110).100 = 17,27%
Valor Predictivo Negativo:(97/116).100 = 83,62%
Aplicacin de la escala CISNEROS en una poblacin con
una tasa base baja de Acoso Psicolgico (Moobing)
Situacin real
Acosado No acosado Falso
Resultados
de la prueba
Acosado 41 112 153 11,78% (+)
No acosado 09 838 847 18% (-)
50 vs.950 S= 50 950 1.000
82% 88,2%
Tasa Base: (50/1000).100 = 5%
Sensibilidad: (41/50).100 = 82%
Especificidad: (838/950).100 = 88,2%
Falso Positivo: (112/950).100 = 11,78%
Falso Negativo: (09/50).100 = 18%
Valor Predictivo Negativo: (838/847).100 = 98,93%
* CISNEROS = Cuestionario Individual sobre Psicoterror, Negacin, Estigmatizacin y
Rechazo en Organizaciones Sociales.
de la escala CISNEROS en una poblacin con
una tasa base baja de Acoso Psicolgico (Moobing)
Situacin real
Acosado No acosado Falso
Resultados
de la prueba
Acosado 41 112 153 11,78% (+)
No acosado 09 838 847 18% (-)
50 vs.950 S= 50 950 1.000
82% 88,2%
Tasa Base: (50/1000).100 = 5%
Sensibilidad: (41/50).100 = 82%
Especificidad: (838/950).100 = 88,2%
Falso Positivo: (112/950).100 = 11,78%
Falso Negativo: (09/50).100 = 18%
Valor Predictivo Negativo: (838/847).100 = 98,93%
* CISNEROS = Cuestionario Individual sobre Psicoterror, Negacin, Estigmatizacin y
Rechazo en Organizaciones Sociales.
VALIDEZ DE CONSTRUCTO

Es un juicio de lo apropiado de las inferencias
extradas de las puntuaciones de prueba respecto a
posiciones individuales en una variable llamada
constructo.

Un constructo es una idea cientfica informada
elaborada o construida para describir o explicar el
comportamiento.
Ej. Si
la
prueba
es
una
medida
vlida
del
constructo,
quienes
obtienen
puntuaciones
altas
y
quienes
obtienen
puntuaciones
bajas
se
comportarn
como
lo
predice
la
teora.
Evidencia de validez de constructo:

Evidencia de Homogeneidad: La homogeneidad,
tambin denominada consistencia interna, por lo
general se refiere a lo bien que mide una prueba un
solo concepto.

Evidencia de cambios con la edad: La naturaleza de
algunos constructos es tal que se esperara que
ocurrieran cambios en ellos a lo largo del tiempo.
Ej. Comprensin lectora, maduracin motriz, etc.

Evidencia de cambios preprueba/posprueba: La
evidencia que muestra que las puntuaciones de
prueba cambian como resultado de alguna
experiencia entre una preprueba y una posprueba
puede ser evidencia de validez de constructo.
Ej. Satisfaccin
matrimonial,
medida
poco
despus
de
haber
contrado
nupcias
y
una
posprueba
aplicada
poco
despus
de
solicitar
el
divorcio
(empleando
slo
parejas
que
consultaron
abogados
especialistas
en
divorcios
para
los
propsitos
del
grupo
experimental
en
este
estudio)
.

Evidencia de grupos distintos: Tambin conocido
como el mtodo de grupos contrastados, una forma
de proporcionar evidencia de la validez de una prueba
es demostrar que las puntuaciones en la prueba
varan en una forma predecible como una funcin de
la pertenencia a algn grupo.
El razonamiento aqu es que si una prueba es una
medida vlida de un constructo particular, entonces..
las puntuaciones de prueba de grupos de personas que
se supone que difieren con respecto a ese constructo
tendran puntuaciones de prueba
correspondientemente diferentes.
Ej. Grupo
de
Casos
(pacientes
con
Depresin)
grupo
de
Control
(estudiantes
universitarios
sin
Depresin)

Evidencia convergente: Puede provenir de diversas
fuentes, como otras pruebas o medidas diseadas
para evaluar el mismo constructo (o uno similar). Por
tanto, si las puntuaciones en la prueba sometida a
validacin de constructo tienden a correlacionarse
altamente en la direccin predicha con las
puntuaciones en pruebas anteriores, ms establecidas
y ya validadas diseadas para medir.....
el mismo constructo (o uno similar), ste sera un
ejemplo evidencia convergente.
Ej. Satisfaccin
matrimonial
con
adaptacin
matrimonial.
Depresin
y
ansiedad.

Evidencia discriminante: Un coeficiente de validez
que muestra poca relacin (estadsticamente
insignificante) entre puntuaciones de prueba y/u otras
variables con las que las puntuaciones en la prueba
que se est sometiendo a validez de constructo no
debera correlacionarse desde el punto de vista
terico proporciona evidencia
discriminativa
de la
validez de constructo.
Ej. Neuroticismo
y
Psicoticismo.
Razonamiento
verbal
razonamiento
matemtico.

Anlisis Factorial: La evidencia convergente o
discriminativa de la validez de constructo puede
obtenerse por medio del uso del anlisis factorial.
Anlisis factorial es un trmino abreviado singular que
es usado para describir una clase de procedimientos
matemticos que estn diseados para identificar
factores
o variables especficas que comnmente son
atributos, caractersticas o dimensiones en las que
pueden diferir las personas.
Un trmino empleado por lo comn en el anlisis
factorial es la carga
factorial. La carga de un factor en
una prueba transmite informacin del grado en que el
factor determina la puntuacin o puntuaciones de
prueba.

Referencia Bibliogrfica:
Cohen, R. y Swerdlik M. (2001) Pruebas y
Evaluacin Psicolgicas. Editorial McGraw
Hill. 4 Edic. Mxico.
Hulley S. y Cummings S. (1993) Diseo de la
Investigacin Clnica. Editorial Doyma.
Espaa.
Urbina, S. (2007) Test Psicolgicos. TEA
Ediciones. Madrid.

Validez de Un Instrumento (Modo de Compatibilidad)

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Validez de Un Instrumento (Modo de Compatibilidad)

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDAD NACIONAL DE ASUNCIN

Você também pode gostar