Escolar Documentos
Profissional Documentos
Cultura Documentos
CONSTRUCCIÓN DE
INSTRUMENTOS DE EVALUACIÓN
Vicerrectoría Académica
Dirección General de Pregrado
Documento elaborado bajo la dirección de la Dra. Erika Castillo Barrientos junto
al equipo elaborador:
Así como los comentarios y sugerencias al texto realizadas por Sonia Bralic.
1.- Planificación de la
evaluación
Recursos n° del
Habilidad n° de ítems
(Conceptuales o Indicador de logro Tipo de ítems ítem en el
cognitiva a elaborar
procedimentales) instrumento
Identifica Inicio,
Estructura de los Selección
desarrollo y desenlace Conocer 3 1,2,3
relatos breves. Múltiple.
del cuento.
Inventa un cuento
considerando la
Producción de
estructura y los Crear 1 Abierta extensa. 4
relatos breves.
elementos narrativos
del cuento.
1 Una situación de evaluación corresponde a la organización de un contexto de demanda de desempeño, construido intencionadamente para demos-
trar el nivel de logro del o los resultados de aprendizaje evaluados; una situación de evaluación implica la necesidad de un instrumento con el que
recoger la información del desempeño del estudiante (Mineduc, 2013; Roegiers y Peysers, 2007).
Los criterios de evaluación2 refieren a uno o más se sugiere para ello recurrir a la literatura
aspectos específicos a observar respecto del especializada y/o al juicio de expertos.
desempeño esperado del estudiante declarado
en el RA del programa de la asignatura; por Tras finalizar la elaboración de la tabla de
tanto, permiten la construcción del instrumento especificaciones, el paso siguiente es construir
al estar directamente articulados con la tarea los ítemes (cerrados o abiertos), en el caso de
que desarrollará el estudiante (Azúa, 2011; instrumentos tipo prueba, o las instrucciones
Castillo & Cabrerizo, 2009). Una característica que constituirán la situación de evaluación,
importante de los criterios de evaluación es para dar cuenta de tareas o desempeños,
que deben estar claramente definidos, puesto así como la pauta que permitirá valorar la
que de éstos emergen los indicadores de acción del estudiante (lista de cotejo, escala
evaluación que darán cuerpo al instrumento; de valoración o rúbrica).
2 Los criterios de evaluación fueron abordados también en el documento Orientaciones para la Evaluación, en la sección correspondiente a ¿Qué
evaluar?
1.- Respecto de la situación anterior, ¿cuál es el fundamento legal que justifica la detención Enunciado o
de Juan Pérez? (2 puntos) pregunta
Caso 1:
Experimento con ratones
Para probar el efecto que tiene una vacuna aplicada a 516 ratones sanos, se realiza un experimento en un laboratorio.
El experimento consiste en identificar durante algunas horas la regularidad en el porcentaje de ratones que se enferman
al ser expuestos posteriormente al virus que ataca la vacuna. Las siguientes gráficas representan el porcentaje de
ratones enfermos al cabo de la primera, segunda y tercera hora de iniciado el experimento.
Figura n° 8: Ejemplo de ítem de selección múltiple con sesgo. Fuente: ICFES (s.f.) Ejemplos de Pregunta
Ratones
25 % 37,5% 43,75 % Enfermos
El caso 1 presenta un ejemplo de ítem con sesgo erradamente el 75% de ratones sanos
de accesibilidad visual, esto último dado que con el número 75; esto implica que el ítem
los estudiantes que presentan visión limitada presenta una complejidad artificial para
tendrán dificultades para leer los números efectos de recuperar un error de estas
que están al interior de las circunferencias, características;
números que son vitales para la determinación • en caso que el estudiante no tuviera
de la opción correcta. conocimientos disciplinarios al respecto,
hay al menos dos opciones que pueden
El caso 1 además presenta errores de descartarse con facilidad: C y D. C,
construcción dado que: porque es la única en que no hay valores
numéricos y D por ser la única que dispone
• incorpora una negación en el enunciado, de porcentajes.
aumentando con ello los niveles de error • dado lo anterior, el ítem implica una inversión
en la determinación de la opción correcta de tiempo y esfuerzo extra por parte del
y acercándose solo de modo tangencial estudiante, pero innecesarios.
a aquello que se pretende evaluar por
medio del ítem; Como todo instrumento de evaluación, los
• la opción correcta (A) implica solo una que son de respuesta cerrada de selección
confusión de términos matemáticos simples, múltiple tienen ventajas y desventajas las que
por cuanto el estudiante puede asociar se precisan en la tabla número 2:
Ventajas Desventajas
Permite medir cinco de los seis dominios cognitivos yyHay una tendencia a caer en la medición de con-
de la taxonomía de Anderson (2001). tenidos de “memoria” o la repetición de lo decla-
Permite medir conocimientos declarativos o concep- rado en clase.
tuales y procedimentales. yyPresentan limitaciones en la evaluación de conte-
Pueden emplearse en situaciones de evaluación con nidos procedimentales y relacionales.
intencionalidad diagnóstica y formativa, con miras a yyPara que queden bien construidos, necesitan alta
la retroalimentación del aprendizaje. inversión de tiempo del docente en su construc-
Pueden emplearse en situaciones de certificación de ción.
aprendizajes y/o evaluaciones sumativas; también yyPermite respuestas correctas por selección al
en procesos de acreditación, selección y admisión. azar.
Facilitan el proceso de corrección por parte del do-
cente.
Tabla nº 3
Ventajas y desventajas de los ítemes de respuesta abierta tipo extensa.
Ventajas Desventajas
Fácil de construir. yyLa corrección de las respuestas puede tender a un
Posibilita la evaluación de habilidades cognitivas mayor grado de subjetividad.
de nivel superior (analizar, evaluar, crear). yyAl ser abiertas las preguntas, permiten respuestas
Se puede aumentar el nivel de complejidad de res- que pueden caer en la ambigüedad.
puesta solicitando el análisis de dos o más fuentes yyLa elaboración de este tipo de ítems requiere de la
de información. elaboración simultánea de otros instrumentos para
Evita la respuesta al azar por parte del estudiante evaluar las categorías de respuesta (escala de va-
Permite evaluar a través de la respuesta del estu- loración, de preferencia rúbricas analíticas).
diante creatividad, argumentación, etc. yyRequiere mayor tiempo de respuesta por parte del
estudiante.
yyRequiere mayor tiempo de corrección por parte del
profesor.
Fuente: elaboración propia
Figura 9: Estructura de ítem de respuesta construida tipo extenso (Adaptado desde Tello, 2015).
Usted debe implementar una clase con uso de material didáctico en un nivel de
Kínder, que presenta estudiantes con diversos estilos de aprendizajes, intereses
y habilidades; esto en el marco del núcleo Relaciones Lógico Matemáticas y Estímulo o
Cuantificación, abordando específicamente el conteo. Para resolver esta situación, Contexto
responda las siguientes preguntas en el espacio asignado:
En relación con las características del estímulo • debe corresponder a una situación real que
o contexto, es preciso cautelar: requiera efectivamente de una solución o
• éste debiese realizar la exposición del de la opinión fundamentada del estudiante,
problema con claridad y procurando el para evitar medir solo conocimientos
uso de un lenguaje formal y disciplinario declarativos que podrían abordarse con
comprensible por los estudiantes; otro tipo de instrumentos o ítemes.
• debe contener los elementos suficientes Respecto del enunciado o pregunta, se
para efectos de la construcción de la recomienda:
respuesta, evitando la presencia de aquellos • explicitar con claridad lo que el estudiante
que resulten innecesarios; debe hacer, procurando formular en formato
Caso 2:
Figura 10: Ejemplo de ítem de respuesta construida tipo extenso.
En cuanto a la construcción de las escalas • Revise que las acciones a observar den
de valoración debe cautelar: cuenta de las características relevantes
• ítemes posibles de valorarse a través de del desempeño a evaluar, evitando que
una escala numérica, gráfica o descriptiva; la tarea solicitada corresponda a una
• ítemes que exponen una única acción petición excesiva de detalles sobre el
observable; aspecto a evaluar.
• ítemes en los que la acción se describe • La puntuación por respuesta dependerá
por medio de verbos de acción, que de la gradación de la escala seleccionada.
serán valorados de acuerdo a la escala
seleccionada. Finalmente, es necesario validar la escala
• Compruebe tener un mínimo de 3 acciones de valoración construida por medio del
específicas que se desean evaluar de juicio de expertos, fundamentalmente para
un desempeño. Este mínimo le permitirá cautelar la relación entre los ítemes y la
analizar los datos y determinar si el escala seleccionada. Una confusión en esta
desempeño está o no logrado. área puede generar dificultades durante la
aplicación, como en el caso 4:
El caso 4 corresponde a una escala de • Los ítemes nº3 y 4 evalúan dos elementos,
valoración con errores de construcción, lo que genera oposición entre ambos y
puesto que: dificulta la aplicación del instrumento (p. ej.:
una persona puede evitar el conflicto y sin
• Se establecen dos tipos de categorías para embargo, no ser un aporte particularmente
una escala de valoración de tipo descriptiva notable en cuanto a favorecer un buen clima).
(Siempre/excelente; que corresponden a
una escala de frecuencia y de calidad del La construcción y aplicación de las escalas
desempeño, respectivamente); esto genera de valoración implica ciertas ventajas y
ambigüedad en la aplicación. desventajas, expuestas en la tabla n° 5:
Figura n°15: Estructura de una rúbrica analítica (Adaptado desde Celis & García, 2015).
Escala
Criterio 0 1 2 3
Registro de anteceden- El estudiante El estudiante El estudiante El estudiante
tes: No registra registra 2 registra 4 de registra to-
Registra en bitácora los ninguno de de 6 de los 6 de los an- dos los an-
Descripción antecedentes personales los ante- antecedentes tecedentes tecedentes
criterio del entrevistado nombre, cedentes personales personales personales
edad, sexo, profesión, personales solicitados en solicitados solicitados
experiencia laboral, solicitados en la bitácora. en la bitá- en la bitá-
estudios post-grado. la bitácora. cora. cora.
El caso 5 expone una rúbrica analítica con evidenciar este tipo de desempeño. Por
errores de construcción, dado que: ejemplo: en la descripción del segundo
• Los criterios presentan dualidades en su criterio, la noción de “precisión” puede
descripción, lo que dificulta comprender a prestarse para interpretaciones diversas
qué aspecto del desempeño están refiriendo. durante la aplicación del instrumento.
(indicar ejemplo, dónde se observa esto) • La descripción de los desempeños es
• No queda clara la diferencia conceptual imprecisa, dado que no explicita la calidad
entre los niveles de desempeño establecidos: del desempeño, sino que la cantidad de
la categoría “satisfactorio” implica que cosas que el estudiante deja de hacer
“puede mejorar”, pero en el caso analizado, respecto del desempeño ideal; junco con
se considera ambas categorías como ello no precisa qué se va a considerar
distintas, donde además el “puede mejorar” como “usa pocos recursos”
aparece como un resultado inferior al de • La descripción del desempeño inadecuado
“satisfactorio”. corresponde a la inexistencia de evidencia
• La descripción de los desempeños ideales respecto del mismo (y por tanto con puntaje
o “excelentes” es ambigua, ya que no igual a cero), por lo que la columna debería
se explicita la forma en que se puede nombrarse como “no observado”.
Ventajas Desventajas
Evalúa los componentes de una tarea desagregada yySu elaboración es compleja, ya que necesita que
en niveles de desempeño. los niveles de desempeño evidencien diferencias
Favorece la evaluación de la tarea a evaluar, ya entre ellos.
que explicita en niveles lo que se espera del des- yySu elaboración requiere de mayor tiempo de cons-
empeño del estudiante, considerando los errores trucción.
más frecuentes.
2.- Una vez vaciados los datos, se puede • y los puntajes mínimo y máximo obtenidos
calcular para cada ítem: para cada ítem;
• la frecuencia, correspondiente a la cantidad
de veces que se obtiene un puntaje Algo similar se puede realizar por estudiante:
determinado en cada ítem u opción; determinar el promedio obtenido, así como su
• la media o el promedio, equivalente a la puntaje mínimo y máximo.
suma de todos los puntajes obtenidos Desde la perspectiva del aprendizaje, lo
para el ítem dividido por el número total esperable de un proceso de enseñanza-
de estudiantes. aprendizaje exitoso es que todos o la mayor
Ejemplo 3:
Frecuencia de puntajes Rangos de puntajes Calificación
4 estudiantes con puntaje más alto 48-50 7,0
6 estudiantes con puntaje en el rango 45-47 6,0
3 estudiantes con puntaje en el rango 46-41 5,0
12 estudiantes con puntaje en el rango 39-35 4,0
2 estudiantes con puntaje en el rango 32-27 3,0
2 estudiantes con puntaje en el rango 26-22 2,0
2 estudiantes con puntaje en el rango < 21 1,0
Para calcular la calificación se sugiere utilizar una planilla de cálculo, aplicando las fórmulas
que se presentan en la figura n° 17:
Figura n° 17: Fórmulas para calcular calificaciones. (Adaptado desde Himmel, Olivares y
Zabalza, 1999)
Calificaciones Aprobatorias Calificaciones Aprobatorias
E-D E
*3 +4 *3 +1
C–D D
Simbología:
C = puntaje máximo posible
D = puntaje mínimo de aprobación
E = puntaje estudiante
TIPOS DE RETROALIMENTACIÓN
Retroalimentación evaluativa Retroalimentación descriptiva
A1 B1 C1 D1
Premiar Aprobar Describir logros. Contribuir a generar mejores nive-
les de logro.
Ejemplos de retroalimentación Ejemplos de retroalimentación
Refuerzo positivo a tra- Aprobación positiva Se centra en elementos Se focaliza en el diálogo con el
vés de caras felices, pre- del docente: “bien he- específicos del apren- estudiante para reflexionar sobre
mios, entre otros. cho”, “muy bien, “eres dizaje exitoso: “Tu res- los resultados: “Estas fueron algu-
un buen estudiante”, puesta cumple con el nas de las respuestas del curso
etc. criterio de evaluación ¿Cuál o cuáles se justan más al
porque…” criterio de evaluación? ¿Por qué?”
A2 B2 C2 D2
Castigar Desaprobar Especificar los niveles Proponer estrategias para mejo-
de logro que se deben rar los niveles de logro.
mejorar.
Como se observa las retroalimentaciones de tipo Bajo esta lógica, una retroalimentación efectiva
A y B se caracterizan por estar más centradas se direcciona hacia los tipos C y D, sin olvidar
en la persona influyendo en la autoestima de que el solo hecho de entregar información
ella, mientras que C y D se focalizan en la tarea al estudiante careciendo de una orientación
del estudiante, evidenciándoles que el juicio concreta de mejora, no se considera como
de valor no es hacia ellos como persona, sino una retroalimentación efectiva; para lograrlo,
que hacia el desempeño evaluado. diversos autores, como Tunstall et al (1996) y
Stobart (2013), entre otros, sugieren que:
Tabla n° 12: Lineamientos para una retroalimentación efectiva (adaptado desde Amaranti, 2010).