Analisis de Items2

ESCUELA ACADEMICO PROFESIONAL DE PSICOLOGIA
ANALISIS DE ITEMS
Criterios para su hallazgo e interpretación
Walter Capa Luque
Lima – Perú
2016
2
NATURALEZA DE LOS ITEMS
¿Qué son los ítems?
Los ítems son unidades básicas que configuran el material o contenido de un

instrumento de medición. Esta unidad se compone de la pregunta o enunciado
en el que se presenta una situación problemática a la que el sujeto ha de dar
solo una respuesta siguiendo ciertas instrucciones de tipo formal. Al conjunto
de ítems referidos al mismo problema o variable se le denomina grupo de
ítems.
¿Qué significa análisis de ítems?
Por análisis de ítems se entiende el estudio de aquellas propiedades de ítems

que están directamente relacionadas con las propiedades del test y en
consecuencia influyen en ellas, esto debido a que el puntaje total es
considerado como la suma de los puntajes de los ítems, por lo tanto existen
relaciones directas entre los estadísticos de los ítems y los estadísticos del
puntaje total. El analizas de ítems tiene por objeto conocer el comportamiento
de cada una de las unidades básicas a través de los recursos estadísticos y
depende del modelo matemático utilizado (TCT / TRI). Este análisis
proporciona información necesaria para asegurar la validez y confiabilidad del
instrumento (Martínez, 1995).
El análisis de ítems se utiliza en la construcción del instrumento o en el proceso

de adaptación de una prueba ya construida, en el medio que se va a aplicar.
Un ítem contribuye a la confiabilidad del test cuando mide la misma clase de

puntaje verdadero que los otros ítems del test; es decir, si un ítem tiene
correlación positiva con los demás ítems.
Un ítem contribuye a la validez del test si mide la misma clase de puntaje

verdadero que la medida de criterio; es decir, si un ítem tiene una correlación
positiva con la medida de criterio.
Las características de los ítems pueden cuantificarse de forma rigurosa

utilizando índices estadísticos. Se han desarrollado numerosos índices pero los
más relevantes pueden clasificarse en alguna de las siguientes categorías:
índice de dificultad, índice de discriminación, índice de validez.
OBJETIVOS DEL ESTUDIO DE LOS ITEMS
 Identificar los ítems débiles o defectuosos

 Determinar el índice de dificultad de cada ítem
 Determinar la capacidad discriminante del ítem
 Determinar el tamaño final del test
Material preparado por Walter Capa Luque

3
PROCESO DEL ANALISIS DE ITEMS
1) Base de datos
Se obtiene una base de datos en los cuales deben figurar las respuestas de los
sujetos a cada ítem, para la presente práctica se trabajó con una muestra de 45
sujetos que respondieron a 13 ítems de una prueba de motricidad, cuyas
respuestas eran uno (1) si lograba la tarea, cero (0) no lo hacía.
La figura muestra la base de datos respectiva.
2) Índice de dificultad
Debido a que la teoría clásica de los test se desarrolló fundamentalmente en el

contexto de los test de aptitudes y rendimiento en los que los ítems tienen una
respuesta correcta y son puntuados de forma dicotómica; el índice de dificultad
se refiere a la proporción de sujetos que entre aquellos que se les ha aplicado
el ítem lo han respondido correctamente.
El índice puede tomar valores en el intervalo de 0.00 a 1.00. Cuando un ítem es

muy fácil el índice es muy elevado. Desde el punto de vista estadístico, el valor
preferible debe estar lo más cercano posible a 0.50, esto debido a que la media
y la varianza del test total se ven afectados por el índice de dificultad de los
ítems. En el caso de la media, la media del test es igual a la suma de los

4
índices de dificultad. En el caso de la varianza, la varianza del test será mayor

si la varianza del ítem también lo es. Por lo tanto, cuando mayor sea la
varianza del ítem mayor será el poder discriminativo del test, máximo poder
que se alcanza cuando el índice de dificultad es 0.50. Una varianza pequeña
esta indicando que las puntuaciones de los sujetos se posicionan de manera
muy agrupada sin establecer diferencias entre ellas, por lo que la variabilidad
de los resultados es pequeña también. Una varianza grande puede ser un
indicio claro de que el ítem o la prueba sirve para situar de manera diferencial a
los sujetos en el continuo que es la variable que se está midiendo. A medida
que el índice de dificultad se aleja de 0.50 en uno u otro sentido, la varianza del
ítem es menor, proporcionando el ítem menos discriminaciones (Muñiz, 1998).
Este índice es valido para los test de potencia o rendimiento donde es

esperable que los ítems no contestados reflejen desconocimiento por parte del
sujeto. Si el test es de personalidad, velocidad o de diagnóstico no es
adecuado ya que los ítems en ese caso no son fáciles ni difíciles.
Como puede verse en la Tabla 1, en primer lugar se obtienen una serie de

estadísticos descriptivos para cada ítem: la media, la desviación típica y el
número de personas que han respondido el ítem. Las medias de cada ítem
corresponden al índice de dificultad del ítem. En el ejemplo están
comprendidas entre 0.95 del ítem 2 y 0.24 del ítem 13. El ítem 5 tiene la mayor
desviación típica con 0.5046.
Tabla 1
Índice de dificultad del ítem
N Media Desviación Típica

M1 45 0.3333 0.4767
M2 45 0.9556 0.2084
M3 45 0.8222 0.3866
M4 45 0.8444 0.3665
M5 45 0.4667 0.5045
M6 45 0.6667 0.4767
M7 45 0.8889 0.3178
M8 45 0.7778 0.4204
M9 45 0.6000 0.4954
M10 45 0.6889 0.4682
M11 45 0.5556 0.5025
M12 45 0.3333 0.4767
M13 45 0.2444 0.4346
Como puede observarse el ítem 2 resulta ser el ítem más fácil (ID = 95.5%) y el
ítem 13 el más 24.44%).

5
 Los valores pueden ser en el intervalo de 0.00 a 1.00. 0 significa que

nadie contestó y 1 que todos lo contestaron. Por lo tanto ambos casos
deben ser eliminados.
 El valor ideal debe ser lo más cercano a 0.50.
 Es válido para los test de ejecución máxima (rendimiento, inteligencia,
etc.) donde es esperable que los ítems no contestados reflejen
desconocimiento por parte del sujeto.
Se mide la dificultad de los ítems a través de su media, según los siguientes

criterios:
* Muy fáciles : 0.9 a 1.00

* Medianamente fáciles : 0.7 a 0.8
* Media : 0.5 a 0.6
* Medianamente difícil : 0.3 a 0.4
* Muy difícil : 0.0 a 0.2
Los ítems entre valores 0.3 a 0.8 son aceptados.
3) Índice de Discriminación
Se refiere al poder discriminativo del ítem para distinguir entre aquellos sujetos
que puntúan altos y bajos en la variable objeto de medida. Es decir, un ítem
que tiene un índice de discriminación grande en el rasgo medido obtiene
puntuaciones claramente mas altas que aquellos que tienen un nivel de
desarrollo bajo. En consecuencia, el índice se define como la correlación entre
las puntuaciones de los sujetos en el ítem y sus puntuaciones en el test. En
este caso las variables a correlacionar serán el ítem y el test (Alvaro, 1993).
La relación entre cada ítem y el test se muestra en la Tabla 2. La primera

columna contiene la puntuación media en el test si eliminamos el ítem. Por
ejemplo, si eliminamos el ítem 1 la media del test sería 7.8. La siguiente
columna es la varianza del test si eliminamos el ítem. Por ejemplo, si
eliminamos el ítem 5 la varianza del test sería 6.6. La columna tercera contiene

6
el índice de discriminación o de homogeneidad corregido; es decir, la

correlación entre la puntuación de un ítem y la suma de las puntuaciones en los
ítems restantes (ítem – test). Por ejemplo, el índice de homogeneidad corregido
para el ítem 10 es 0.58, lo que nos indica que hay mucha relación entre este
ítem y los restantes. La última columna contiene el coeficiente de Alpha de
Cronbach si eliminamos el ítem. Por ejemplo, eliminar el ítem 1 provoca que el
coeficiente Alpha pase a ser 0.76 en el test de 13 ítems.
Tabla 2
Valores del índice de discriminación
Media varianza Item - Test Alpha

M1 7.8444 7.5434 0.1967 0.7698
M2 7.2222 7.7222 0.4491 0.7513
M3 7.3556 7.5525 0.2747 0.7590
M4 7.3333 7.2727 0.4445 0.7439
M5 7.7111 6.6646 0.5246 0.7320
M6 7.5111 6.6192 0.5868 0.7250
M7 7.2889 7.6192 0.3224 0.7549
M8 7.4000 7.5636 0.2359 0.7634
M9 7.5778 7.3404 0.2607 0.7637
M10 7.4889 6.6646 0.5800 0.7262
M11 7.6222 6.8313 0.4576 0.7404
M12 7.8444 7.0434 0.4012 0.7470
M13 7.9333 7.1545 0.4053 0.7465
Tal como se observa todos los ítems guardan una relación positiva con el
puntaje total, pero los ítems 1, 3, 8 y 9 no aportan mucho ya que sus
coeficientes son bajos y no significativos.
Índice de Discriminación (d) o Homogeneidad corregida (IHC)

 Indican qué tan adecuadamente separa o diferencia un reactivo entre
quienes obtienen puntuaciones altas y quienes obtienen puntuaciones
bajas en una prueba.
 Si la prueba y un ítem miden la misma habilidad o competencia,
entonces se espera que quien tuvo una alta puntuación en todo el test
deberá tener altas probabilidades de contestar correctamente el ítem.
 el índice se define como la correlación entre las puntuaciones de los
sujetos en el ítem y sus puntuaciones en el test.
 Esta medida se denota con una d.
 Según Kline (1995) este valor debe ser superior a 0.20
Muñiz. Fidalgo, Cueto, Martínez y Moreno (2005)

7
Muñiz. Fidalgo, García-Cueto, Martínez y Moreno (2005)
Coeficiente de asimetría de Fisher (g1)
 El coeficiente de asimetría de Fisher, junto con las medidas de

apuntamiento o curtosis se utilizan para contrastar si se puede aceptar
que una distribución estadística sigue la distribución normal. Esto es
necesario para realizar numerosos contrastes estadísticos en la teoría
de inferencia estadística.
Valores ± 1.5 indican presencia significativa de asimetría.

8
Coeficiente de curtosis de Fisher (g2
Valores ± 1.5 indican presencia significativa de curtosis.
Formato para presentar resultados de Análisis de los ítems
Tabla 1
Estadísticos descriptivos y parámetros de los ítems
Items FR M DE (g1) (g2) IHC h2
N CN AV CS S
Nota: FR: Formato de respuesta; M: Media; DE: Desviación estándar; g1: coeficiente de
asimetría de Fisher; g2: coeficiente de curtosis de Fisher; IHC: Índice de homogeneidad
corregida o Índice de discriminación; h2: Comunalidad.
Criterios para eliminación de ítems:

 Ítem con opción de respuesta que acumule más de 80% de preferencia,
o ítem sin preferencia es candidato para ser eliminado.
 Ítem con g1 o g2 mayor a ± 2.5 es candidato para ser eliminado.
 Ítem con IHC (d) ≤ 0.29 es candidato para ser eliminado.
 Ítem con h2 menores a 0.30 es candidato para ser eliminado.

9
Referencias:
Muñiz, J., Fidalgo, A. M., García-Cueto, E., Martínez, R. y Moreno, R. (2005).

Análisis de los ítems. Madrid: La Muralla.

Analisis de Items2

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Analisis de Items2

Enviado por

Direitos autorais:

Formatos disponíveis

ESCUELA ACADEMICO PROFESIONAL DE PSICOLOGIA

Walter Capa Luque

NATURALEZA DE LOS ITEMS

¿Qué son los ítems?

Los ítems son unidades básicas que configuran el material o contenido de un

¿Qué significa análisis de ítems?

Por análisis de ítems se entiende el estudio de aquellas propiedades de ítems

El análisis de ítems se utiliza en la construcción del instrumento o en el proceso

Un ítem contribuye a la confiabilidad del test cuando mide la misma clase de

Un ítem contribuye a la validez del test si mide la misma clase de puntaje

Las características de los ítems pueden cuantificarse de forma rigurosa

OBJETIVOS DEL ESTUDIO DE LOS ITEMS

 Identificar los ítems débiles o defectuosos

Material preparado por Walter Capa Luque

PROCESO DEL ANALISIS DE ITEMS

La figura muestra la base de datos respectiva.

Debido a que la teoría clásica de los test se desarrolló fundamentalmente en el

El índice puede tomar valores en el intervalo de 0.00 a 1.00. Cuando un ítem es

Material preparado por Walter Capa Luque

índices de dificultad. En el caso de la varianza, la varianza del test será mayor

Este índice es valido para los test de potencia o rendimiento donde es

Como puede verse en la Tabla 1, en primer lugar se obtienen una serie de

N Media Desviación Típica

Material preparado por Walter Capa Luque

 Los valores pueden ser en el intervalo de 0.00 a 1.00. 0 significa que

Se mide la dificultad de los ítems a través de su media, según los siguientes

* Muy fáciles : 0.9 a 1.00

Los ítems entre valores 0.3 a 0.8 son aceptados.

La relación entre cada ítem y el test se muestra en la Tabla 2. La primera

Material preparado por Walter Capa Luque

el índice de discriminación o de homogeneidad corregido; es decir, la

Media varianza Item - Test Alpha

Índice de Discriminación (d) o Homogeneidad corregida (IHC)

Muñiz. Fidalgo, Cueto, Martínez y Moreno (2005)

Material preparado por Walter Capa Luque

Muñiz. Fidalgo, García-Cueto, Martínez y Moreno (2005)

Coeficiente de asimetría de Fisher (g1)

 El coeficiente de asimetría de Fisher, junto con las medidas de

Valores ± 1.5 indican presencia significativa de asimetría.

Material preparado por Walter Capa Luque

Coeficiente de curtosis de Fisher (g2

Valores ± 1.5 indican presencia significativa de curtosis.

Formato para presentar resultados de Análisis de los ítems

Criterios para eliminación de ítems:

Material preparado por Walter Capa Luque

Muñiz, J., Fidalgo, A. M., García-Cueto, E., Martínez, R. y Moreno, R. (2005).

Material preparado por Walter Capa Luque

Você também pode gostar