Escolar Documentos
Profissional Documentos
Cultura Documentos
Miguel Fernández
Ítem o reactivo:
Señales o indicadores del constructo en el mundo real.
Definiciones operacionales de los constructos.
Reactivos que elicitan conductas que forman parte del constructo
Se supone que el constructo determina las respuestas a los ítems y que por lo tanto estas
respuestas nos permiten inferir el nivel del constructo.
Deben relacionarse, pero no diferir del constructo.
2. Análisis estadístico
Se realiza según si la prueba posee ítems de máximo o de típico desempeño.
Ítem de máximo desempeño: Una de las alternativas se considera la correcta, de acuerdo con
criterios externos (teóricos). Se usa en evaluación de conocimientos y aptitudes.
1
Análisis de Ítem Técnicas Psicométricas II Prof. Miguel Fernández
𝒑₊𝒒 = 𝟏
Interpretación de la dificultad:
P Valoración
˃ 0.80 Muy fácil
0.60-0.80 Fácil
0.40-0.60 Promedio
0.20-0.40 Difícil
< 0,20 Muy difícil
Resultado deseado: los ítems deben encontrarse en niveles entre fácil y difícil. Los ítems muy fáciles
o muy difíciles de responder no benefician al estudio, pues contaminan la medición de la variable.
Resultado deseado: tiene que ser mayor a 0.20, de lo contrario carece de capacidad para discriminar
entre sujetos con niveles altos y sujetos con niveles bajos de la variable.
Resultado deseado: la opción correcta debe tener una correlación positiva y significativa (mayor a
0.3) con el puntaje total del test. De lo contrario, produce error de medición, es decir, disminuye la
confiabilidad de la prueba. Los distractores u opciones incorrectas deben tener correlación negativa.
Ítem de típico desempeño: Ninguna de las alternativas se considera correctas, pues no existen
implicaciones estadísticas de que es “malo” puntuar alto o bajo en el test. Es, entonces, el tipo de
ítem usado en las escalas de variables psicológicas. En este caso interesa la respuesta que mejor
2
Análisis de Ítem Técnicas Psicométricas II Prof. Miguel Fernández
describa la conducta común del sujeto. Por supuesto, pueden existir implicaciones clínicas o
normativas que determinen que uno o ambos extremos de la distribución son desfavorables para el
sujeto; por ejemplo: si el test mide síntomas de un trastorno, lo deseable desde criterios clínicos
sería puntuar bajo, o si el test mide ciertas conductas que se pueden considerar desadaptativas si
se presentan en déficit o en exceso, lo deseable sería no puntuar ni muy bajo ni muy alto.
A. TENDENCIA DE RESPUESTA
Media y análisis de frecuencia de las diferentes alternativas. Resultado deseado: no hay un patrón
deseado.
B. CAPACIDAD DISCRIMINATIVA
Misma definición que en el análisis de ítem de máximo desempeño. Se calcula mediante la varianza
del ítem. Resultado deseado: debe ser mayor a 0.20.
C. PODER DISCRIMINATIVO
En el caso de los tests de ítem de máximo desempeño, este es el indicador más importante. Su
definición es la misma que en el análisis de ítem de máximo desempeño. Se calcula mediante la
correlación entre el ítem y la puntuación total del test (o dimensión, si es el caso). Resultado
deseado: debe ser una correlación significativa y positiva (igual o mayor a 0.30).
Se calcula el alfa de Cronbach (confiabilidad por consistencia interna) excluyendo el ítem que se
analiza, de manera hipotética en la que se presentaría la prueba después de haber eliminado dicho
ítem. Resultado deseado: no debe ser mayor que el alfa original de la prueba, pues eso significa que
el ítem disminuye la confiabilidad de la prueba.
Importante: la eliminación de un ítem debe ser un último recurso, pues las pruebas con poca
cantidad de ítems también son propensas a perder confiabilidad. El principio básico es que a mayor
número de ítems (longitud de la prueba), mayor confiabilidad de medición.
3
Análisis de Ítem Técnicas Psicométricas II Prof. Miguel Fernández
Ejemplos
1. Una prueba de ansiedad tiene una confiabilidad de 83,9% (alfa de Cronbach = 0,839). El análisis
estadístico de ítem de típico desempeño arroja los siguientes resultados:
Correlación ítem-
Alfa si el ítem se ha
Ítem total (poder
suprimido
discriminativo)
1 ,416 ,832
2 ,564 ,825
3 ,469 ,830
4 ,382 ,833
5 ,300 ,836
6 -,030 ,869
7 ,299 ,836
8 ,387 ,833
9 ,479 ,830
10 ,627 ,822
11 ,407 ,832
12 ,377 ,834
13 ,568 ,825
14 ,421 ,832
15 ,301 ,836
16 ,166 ,839
17 ,301 ,837
18 ,375 ,833
19 ,464 ,830
20 ,338 ,835
21 ,067 ,851
22 ,180 ,839
23 ,298 ,836
24 ,292 ,836
25 ,494 ,830
26 ,282 ,836
Los ítems 16 y 22 poseen un poder discriminativo bajo, pero no afectan mucho la confiabilidad de
la prueba (si los ítems se eliminan, el alfa no sube a lo que originalmente era), por lo que el
investigador puede escoger entre a) aceptarlos, dado que no son tan ineficientes o b) modificarlos
con el objetivo de mejorar su correlación con la prueba y, por ende, la confiabilidad total del
instrumento.
Por su parte, los ítems 6 y 21 poseen un poder discriminativo muy bajo (incluso negativo en el primer
caso) y afectan significativamente la confiabilidad de la prueba (el alfa subiría varios puntos si se
eliminan los ítems). Debido a esto, el investigador puede escoger entre a) modificarlos con el
objetivo de mejorarlos, o b) eliminarlos del instrumento, descartándolos de la versión final.
4
Análisis de Ítem Técnicas Psicométricas II Prof. Miguel Fernández
“¿Cuál es el nivel de escala que evalúa orden entre sujetos y posee un cero absoluto y objetivo?”
A. Ordinal B. Proporción C. Intervalo
Escogencia
Opción (personas que p S2 r Aceptar Modificar Eliminar
seleccionaron)
A 21 0,246
B* 11 0,27 0,19 0,114
C 9 -0,406
N= 41
11 personas (de 41 que presentaron la prueba) seleccionar la opción correcta, lo que le da al ítem
un índice de dificultad de 0,27, lo que significa que es un ítem difícil. El nivel de capacidad
discriminativa es de 0,19, por lo que parece que el ítem no discrimina muy adecuadamente entre
las personas que saben y las que no, y se puede apreciar que la opción correcta no tiene una
correlación ítem-total (poder discriminativo) muy significativa. Además, la correlación del primer
distractor (opción A) está dando positiva, lo cual influye negativamente en el ítem. En vista a esto,
el evaluador puede decidir entre a) modificar la redacción del ítem, intentando aumentar su
capacidad discriminativa y corregir las correlaciones que no están dándose adecuadamente, o b)
eliminar el reactivo, descartándolo de la prueba.
Nota reflexiva: desde la redacción del ítem podemos ver por qué no funcionó excelentemente en
la estadística. Las reglas generales para redactar un ítem es que el enunciado no debe sugerir o
sugestionar ninguna respuesta. Si el evaluador pregunta acerca de una escala que evalúa “orden” la
mayoría de las personas estarán inclinados a responder por la opción A que parece relacionarse solo
porque dice “ordinal”. Por ello el ítem es difícil, pues confunde a los evaluados al estar mal
formulado, y por ende las correlaciones en la columna r son inadecuadas. Para empezar, la palabra
“orden” no es ni importante ni fundamental en la definición de la escala de proporción, por lo cual
se puede prescindir de ella en la redacción del enunciado.