Interpretación de Puntajes Obtenidos

Análisis de Ítem Técnicas Psicométricas II Prof.
Miguel Fernández
Ítem o reactivo:
 Señales o indicadores del constructo en el mundo real.
 Definiciones operacionales de los constructos.
 Reactivos que elicitan conductas que forman parte del constructo
 Se supone que el constructo determina las respuestas a los ítems y que por lo tanto estas
respuestas nos permiten inferir el nivel del constructo.
 Deben relacionarse, pero no diferir del constructo.
Fases del Análisis de ítem
1. Prueba de los ítems

2. Análisis estadístico
3. Selección de los ítems
1. Prueba de los ítems

Informal
• Se aplica a 5 o 10 sujetos
• Se evalúa la comprensión de instrucciones, formato de respuesta y del lenguaje.
Formal (prueba piloto)
• Muestra representativa
• Se utilizará para el análisis estadístico
2. Análisis estadístico
Se realiza según si la prueba posee ítems de máximo o de típico desempeño.
ANÁLISIS DE ÍTEM DE MÁXIMO DESEMPEÑO
Ítem de máximo desempeño: Una de las alternativas se considera la correcta, de acuerdo con
criterios externos (teóricos). Se usa en evaluación de conocimientos y aptitudes.
A. DIFICULTAD DEL REACTIVO (p)

Es la proporción de selección de una opción de respuesta, de la correcta para el test de máximo
desempeño, o simplemente proporción de selección para los de típico desempeño. Representa
también la media del ítem en los test de máximo desempeño dicotómico.
#𝒔𝒖𝒋𝒆𝒕𝒐𝒔 𝒒𝒖𝒆 𝒆𝒍𝒊𝒈𝒊𝒆𝒓𝒐𝒏

𝒑=
𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒔𝒖𝒋𝒆𝒕𝒐𝒔
1
Análisis de Ítem Técnicas Psicométricas II Prof. Miguel Fernández
Su contraparte es el valor q, que equivale al promedio de personas que escogen respuestas

incorrectas (distractores), o dicho de otro modo, que no seleccionan la opción correcta:
#𝒔𝒖𝒋𝒆𝒕𝒐𝒔 𝒒𝒖𝒆 𝒏𝒐 𝒆𝒍𝒊𝒈𝒊𝒆𝒓𝒐𝒏

𝒒=
𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒔𝒖𝒋𝒆𝒕𝒐𝒔
Al tratarse de proporciones, el valor de la sumas de ambas debe ser 1
𝒑₊𝒒 = 𝟏
Interpretación de la dificultad:
P Valoración
˃ 0.80 Muy fácil
0.60-0.80 Fácil
0.40-0.60 Promedio
0.20-0.40 Difícil
< 0,20 Muy difícil
Resultado deseado: los ítems deben encontrarse en niveles entre fácil y difícil. Los ítems muy fáciles
o muy difíciles de responder no benefician al estudio, pues contaminan la medición de la variable.
B. CAPACIDAD DISCRIMINATIVA (s2)

Viene dada por el producto de p×q e indica la capacidad del ítem para diferenciar entre los sujetos.
Su máximo valor es 0.25.
𝒔𝟐 = 𝒑 × 𝒒
Resultado deseado: tiene que ser mayor a 0.20, de lo contrario carece de capacidad para discriminar
entre sujetos con niveles altos y sujetos con niveles bajos de la variable.
C. PODER DISCRIMINATIVO (r)

Es la correlación entre el puntaje en el ítem y el puntaje en el test total.
Resultado deseado: la opción correcta debe tener una correlación positiva y significativa (mayor a
0.3) con el puntaje total del test. De lo contrario, produce error de medición, es decir, disminuye la
confiabilidad de la prueba. Los distractores u opciones incorrectas deben tener correlación negativa.
ANÁLISIS DE ÍTEM DE TÍPICO DESEMPEÑO
Ítem de típico desempeño: Ninguna de las alternativas se considera correctas, pues no existen
implicaciones estadísticas de que es “malo” puntuar alto o bajo en el test. Es, entonces, el tipo de
ítem usado en las escalas de variables psicológicas. En este caso interesa la respuesta que mejor
2
describa la conducta común del sujeto. Por supuesto, pueden existir implicaciones clínicas o
normativas que determinen que uno o ambos extremos de la distribución son desfavorables para el
sujeto; por ejemplo: si el test mide síntomas de un trastorno, lo deseable desde criterios clínicos
sería puntuar bajo, o si el test mide ciertas conductas que se pueden considerar desadaptativas si
se presentan en déficit o en exceso, lo deseable sería no puntuar ni muy bajo ni muy alto.
A. TENDENCIA DE RESPUESTA
Media y análisis de frecuencia de las diferentes alternativas. Resultado deseado: no hay un patrón
deseado.
B. CAPACIDAD DISCRIMINATIVA
Misma definición que en el análisis de ítem de máximo desempeño. Se calcula mediante la varianza
del ítem. Resultado deseado: debe ser mayor a 0.20.
C. PODER DISCRIMINATIVO
En el caso de los tests de ítem de máximo desempeño, este es el indicador más importante. Su
definición es la misma que en el análisis de ítem de máximo desempeño. Se calcula mediante la
correlación entre el ítem y la puntuación total del test (o dimensión, si es el caso). Resultado
deseado: debe ser una correlación significativa y positiva (igual o mayor a 0.30).
D. ALFA DE LA ESCALA TOTAL AL ELIMINAR EL ÍTEM
Se calcula el alfa de Cronbach (confiabilidad por consistencia interna) excluyendo el ítem que se
analiza, de manera hipotética en la que se presentaría la prueba después de haber eliminado dicho
ítem. Resultado deseado: no debe ser mayor que el alfa original de la prueba, pues eso significa que
el ítem disminuye la confiabilidad de la prueba.
3. Selección de los ítems

Se hace en base al cumplimiento de los criterios antes mencionados. El investigador puede escoger
entre a) Aceptar el reactivo si cumple a la perfección con los criterios y, por lo tanto, beneficia a la
prueba integralmente, b) Modificar el reactivo, en caso de que no cumple con todos los criterios a
la perfección pero que no afecta muy negativamente a la prueba, y c) Eliminar el reactivo, si no
cumple apropiadamente con los criterios y contamina bastante la prueba.
Importante: la eliminación de un ítem debe ser un último recurso, pues las pruebas con poca
cantidad de ítems también son propensas a perder confiabilidad. El principio básico es que a mayor
número de ítems (longitud de la prueba), mayor confiabilidad de medición.
3
Ejemplos
1. Una prueba de ansiedad tiene una confiabilidad de 83,9% (alfa de Cronbach = 0,839). El análisis
estadístico de ítem de típico desempeño arroja los siguientes resultados:
Correlación ítem-
Alfa si el ítem se ha
Ítem total (poder
suprimido
discriminativo)
1 ,416 ,832
2 ,564 ,825
3 ,469 ,830
4 ,382 ,833
5 ,300 ,836
6 -,030 ,869
7 ,299 ,836
8 ,387 ,833
9 ,479 ,830
10 ,627 ,822
11 ,407 ,832
12 ,377 ,834
13 ,568 ,825
14 ,421 ,832
15 ,301 ,836
16 ,166 ,839
17 ,301 ,837
18 ,375 ,833
19 ,464 ,830
20 ,338 ,835
21 ,067 ,851
22 ,180 ,839
23 ,298 ,836
24 ,292 ,836
25 ,494 ,830
26 ,282 ,836
Los ítems 16 y 22 poseen un poder discriminativo bajo, pero no afectan mucho la confiabilidad de
la prueba (si los ítems se eliminan, el alfa no sube a lo que originalmente era), por lo que el
investigador puede escoger entre a) aceptarlos, dado que no son tan ineficientes o b) modificarlos
con el objetivo de mejorar su correlación con la prueba y, por ende, la confiabilidad total del
instrumento.
Por su parte, los ítems 6 y 21 poseen un poder discriminativo muy bajo (incluso negativo en el primer
caso) y afectan significativamente la confiabilidad de la prueba (el alfa subiría varios puntos si se
eliminan los ítems). Debido a esto, el investigador puede escoger entre a) modificarlos con el
objetivo de mejorarlos, o b) eliminarlos del instrumento, descartándolos de la versión final.
4
2. En una prueba de la materia Técnicas Psicométricas, se incluye el siguiente ítem:
“¿Cuál es el nivel de escala que evalúa orden entre sujetos y posee un cero absoluto y objetivo?”
A. Ordinal B. Proporción C. Intervalo
La respuesta correcta es la opción B. Se hace el análisis estadístico de ítem de máximo desempeño:
Escogencia
Opción (personas que p S2 r Aceptar Modificar Eliminar
seleccionaron)
A 21 0,246
B* 11 0,27 0,19 0,114
C 9 -0,406
N= 41
11 personas (de 41 que presentaron la prueba) seleccionar la opción correcta, lo que le da al ítem
un índice de dificultad de 0,27, lo que significa que es un ítem difícil. El nivel de capacidad
discriminativa es de 0,19, por lo que parece que el ítem no discrimina muy adecuadamente entre
las personas que saben y las que no, y se puede apreciar que la opción correcta no tiene una
correlación ítem-total (poder discriminativo) muy significativa. Además, la correlación del primer
distractor (opción A) está dando positiva, lo cual influye negativamente en el ítem. En vista a esto,
el evaluador puede decidir entre a) modificar la redacción del ítem, intentando aumentar su
capacidad discriminativa y corregir las correlaciones que no están dándose adecuadamente, o b)
eliminar el reactivo, descartándolo de la prueba.
Nota reflexiva: desde la redacción del ítem podemos ver por qué no funcionó excelentemente en
la estadística. Las reglas generales para redactar un ítem es que el enunciado no debe sugerir o
sugestionar ninguna respuesta. Si el evaluador pregunta acerca de una escala que evalúa “orden” la
mayoría de las personas estarán inclinados a responder por la opción A que parece relacionarse solo
porque dice “ordinal”. Por ello el ítem es difícil, pues confunde a los evaluados al estar mal
formulado, y por ende las correlaciones en la columna r son inadecuadas. Para empezar, la palabra
“orden” no es ni importante ni fundamental en la definición de la escala de proporción, por lo cual
se puede prescindir de ella en la redacción del enunciado.

Interpretación de Puntajes Obtenidos

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Interpretación de Puntajes Obtenidos

Enviado por

Direitos autorais:

Formatos disponíveis

Análisis de Ítem Técnicas Psicométricas II Prof.

Fases del Análisis de ítem

1. Prueba de los ítems

1. Prueba de los ítems

ANÁLISIS DE ÍTEM DE MÁXIMO DESEMPEÑO

A. DIFICULTAD DEL REACTIVO (p)

#𝒔𝒖𝒋𝒆𝒕𝒐𝒔 𝒒𝒖𝒆 𝒆𝒍𝒊𝒈𝒊𝒆𝒓𝒐𝒏

Su contraparte es el valor q, que equivale al promedio de personas que escogen respuestas

#𝒔𝒖𝒋𝒆𝒕𝒐𝒔 𝒒𝒖𝒆 𝒏𝒐 𝒆𝒍𝒊𝒈𝒊𝒆𝒓𝒐𝒏

Al tratarse de proporciones, el valor de la sumas de ambas debe ser 1

B. CAPACIDAD DISCRIMINATIVA (s2)

C. PODER DISCRIMINATIVO (r)

ANÁLISIS DE ÍTEM DE TÍPICO DESEMPEÑO

D. ALFA DE LA ESCALA TOTAL AL ELIMINAR EL ÍTEM

3. Selección de los ítems

2. En una prueba de la materia Técnicas Psicométricas, se incluye el siguiente ítem:

La respuesta correcta es la opción B. Se hace el análisis estadístico de ítem de máximo desempeño:

Você também pode gostar