CRITERIOS TCNICOS PARA EL DESARROLLO Y USO DE INSTRUMENTOS
DE EVALUACIN EDUCATIVA, 2014-2015
La Junta de Gobierno del Instituto Nacional para la Evaluacin de la Educacin (INEE), con fundamento en lo dispuesto en la fraccin IX del artculo 3o. de la Constitucin Poltica de los Estados Unidos Mexicanos; artculos 10, 11, 12, 13, 14, 15 fracciones III y VI, 17 fracciones I a la V, 26, 27 fracciones VII, X, XIII, 29, 38 fracciones VI, IX, X y XXI, 47, 49, 57 y 59 de la Ley del Instituto Nacional para la Evaluacin de la Educacin; emite los siguientes Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015 (en adelante Criterios Tcnicos). 1. Antecedentes La reforma constitucional en materia de educacin, estableci en la fraccin IX del artculo 3o. la creacin del Instituto Nacional para la Evaluacin de la Educacin, como un organismo constitucional autnomo que tiene por objeto coordinar el Sistema Nacional de Evaluacin Educativa (SNEE), con la atribucin de evaluar la calidad, el desempeo y los resultados del Sistema Educativo Nacional (SEN) en educacin preescolar, primaria, secundaria y media superior. De conformidad con los preceptos legales antes invocados, la Junta de Gobierno del Instituto disear y expedir los lineamientos generales de evaluacin educativa a los que se sujetarn las Autoridades Educativas en su conjunto para llevar a cabo las funciones de evaluacin. Asimismo, conforme a lo establecido en el artculo 26 de la Ley del Instituto Nacional para la Evaluacin de la Educacin, el Instituto, en el ejercicio de sus atribuciones, se regir por los principios y criterios tcnicos de objetividad, validez y confiabilidad, segn se establece en el artculo mencionado, as como en el diverso 29 del mismo ordenamiento, el Instituto tambin deber actualizar peridicamente los Criterios Tcnicos, los lineamientos y conceptos que establezca en materia de evaluacin de la educacin. Para ello, la Junta de Gobierno del INEE determinar la periodicidad
2
para su revisin y tomar en cuenta los avances cientficos y tcnicos en materia de educacin y de evaluacin. Los Criterios Tcnicos servirn de apoyo para cumplir con lo establecido en la fraccin XIII del artculo 27 de la Ley del Instituto Nacional para la Evaluacin de la Educacin, en lo referente a asesorar y, en su caso, supervisar el diseo y aplicacin de instrumentos de medicin para las evaluaciones de los componentes, procesos o resultados del SEN que realicen las Autoridades Educativas, en el marco de sus atribuciones y competencias. Conforme a lo establecido en las fracciones X y XXI del artculo 38 de la Ley del Instituto Nacional para la Evaluacin de la Educacin, la Junta de Gobierno del Instituto aprobar los proyectos de medicin y evaluacin que correspondan a componentes, procesos o resultados del SEN, en el mbito de su competencia. Las autoridades educativas federales, locales, municipales y organismos descentralizados, o las organizaciones e instituciones pblicas o privadas interesadas en el desarrollo de instrumentos de evaluacin, debern considerar los presentes Criterios Tcnicos para asegurar su calidad tcnica. Para este efecto, el Instituto revisar y, en su caso, har por escrito observaciones a los instrumentos; para ello recurrir a la documentacin y sistematizacin de evidencias sobre su diseo, construccin y uso. El propsito de los Criterios Tcnicos es el de proveer referentes para valorar la calidad de los instrumentos de evaluacin, de las prcticas evaluativas y de los usos de las evaluaciones. Aunque la valoracin de la calidad de los instrumentos de evaluacin educativa y de su aplicacin y usos dependen en gran medida del juicio de profesionales, los Criterios Tcnicos proveen un marco de referencia que asegure sean considerados los aspectos ms importantes de la evaluacin educativa. En general, los Criterios Tcnicos buscan propiciar que, dentro de los lmites posibles, la informacin tcnica relevante de las evaluaciones sea visible, de tal manera que aquellos involucrados en la toma de decisiones de poltica educativa estn bien informados sobre los alcances y limitaciones de los resultados que arrojan los instrumentos de evaluacin educativa en el pas.
3
Para la integracin de los presentes Criterios Tcnicos se consideraron distintos aspectos de los estndares de calidad tcnica para los instrumentos de evaluacin propuestos por organismos de evaluacin educativa internacionales y nacionales, como la European Commission (EC); el Grupo de Evaluacin de las Naciones Unidas (UNEG, por sus siglas en ingls); el Comit para el Desarrollo de Estndares de Pruebas Educativas y Psicolgicas de la American Educational Research Association (AERA), la American Psychological Association (APA) y el National Council on Measurement in Education (NCME); el Joint Committee on Testing Practices (JCTP), el Educational Testing Service (ETS), el Centro Nacional de Evaluacin para la Educacin Superior (Ceneval) y el Instituto Nacional para la Evaluacin de la Educacin (INEE). Especialmente se retoman el enfoque y la lgica de los Estndares para los instrumentos de evaluacin educativos y psicolgicos 1 y el enfoque unitario de la validez 2 . En dichos enfoques, se proveen los fundamentos tericos y las orientaciones que deben tomarse en cuenta para la obtencin de evidencias de calidad tcnica y validez de los resultados de las evaluaciones, tanto educativas como psicolgicas.
2. Definicin de trminos Para los efectos de los presentes criterios, se emplean las siguientes definiciones: I. Aplicadores: Personas fsicas con la funcin de auxiliar en la aplicacin de los instrumentos de evaluacin. II. Alto impacto: Se indica cuando los resultados del instrumento tienen consecuencias importantes para las personas o las instituciones; por ejemplo, en los procesos de admisin o certificacin.
1 American Educational Research Association (AERA), American Psychological Association (APA) y National Council on Measurement in Education (NCM). (1999). Standards for educational and psychological testing. Washington, D.C.: American Educational Research Association.
2 Messick, S. (1989). Validity. En R.L. Linn (Ed.), Educational measurement (3a. ed., pp 13-104). Nueva York: American Council on Education/MacMillan.
4
III. Confiabilidad: Cualidad de las mediciones obtenidas con un instrumento, que se caracterizan por ser consistentes y estables cuando este se aplica en distintas ocasiones. IV. Constructo: Elaboracin terica formulada para explicar un proceso social, psicolgico o educativo y cuya adecuada descripcin permite que sea susceptible de ser observable o medible. V. Criterio de evaluacin: Indicador de un valor aceptable sobre el cual se puede establecer o fundamentar un juicio del valor sobre el desempeo de una persona. VI. Desempeo: Es el resultado obtenido por la persona evaluada con un instrumento de evaluacin educativa. VII. Dominio: Conjunto de conocimientos, habilidades, destrezas, actitudes u otros atributos que tienen las siguientes propiedades: lmites, extensin y definicin. Tambin se puede aplicar a contenidos, procedimientos u objetos. VIII. Educacin bsica: Tipo de educacin que comprende los niveles de preescolar, primaria y secundaria en todas sus modalidades, incluyendo la educacin indgena, la especial y la que se imparte en los centros de educacin bsica para adultos. IX. Educacin media superior: Tipo de educacin que comprende el nivel de bachillerato, los dems niveles equivalentes a ste, as como la educacin profesional que no requiere bachillerato o sus equivalentes. X. Especificaciones de tareas evaluativas o reactivos: Descripcin detallada de las caractersticas relevantes que se espera tengan los sujetos al sustentar el instrumento de evaluacin y que es posible observar a travs de las tareas evaluativas o los reactivos. Tienen el papel de guiar a los comits acadmicos en la elaboracin y validacin de las tareas evaluativas o los reactivos y que estos cuenten con los elementos necesario para construirlos alineados al objeto de medida o constructo que se desea evaluar a travs del instrumento.
5
XI. Estndar: Principio de valor o calidad en la conduccin y uso de los procedimientos de evaluacin y que son acordados por expertos en evaluacin. XII. Estndar de desempeo: Es un criterio conceptual que delimita el marco interpretativo de las puntuaciones obtenidas en un instrumento de evaluacin y que refiere a lo que la persona evaluada es capaz de hacer en trminos de conocimientos, destrezas o habilidades en el contexto del instrumento. XIII. Evaluacin: Accin de emitir juicios de valor que resultan de comparar los resultados de una medicin u observacin con un referente previamente establecido. XIV. Instrumento de evaluacin: Tcnicas de medicin y recoleccin de datos que suelen tener distintos formatos, atendiendo a la naturaleza de la evaluacin, por ejemplo, instrumentos de seleccin de respuesta, instrumentos de respuesta construida, cuestionarios, observaciones, portafolios, entre otros. XV. Jueceo: Mtodo en el cual se utiliza la opinin de expertos (denominados jueces) para determinar, entre otras cosas, la pertinencia de la validez de las tareas evaluativas o los reactivos respecto a un dominio; el establecimiento de estndares o puntos de corte; as como la calificacin de reactivos de respuesta construida. XVI. Medicin: Proceso de asignacin de valores numricos a atributos de las personas, objetos o eventos de acuerdo con reglas especficas que permitan que sus propiedades puedan ser representadas cuantitativamente. XVII. Muestra: Subconjunto de la poblacin de inters que refleja las variables medidas en una distribucin semejante a las de la poblacin. XVIII. Objeto de medida: Conjunto de caractersticas o atributos que se miden en el instrumento de evaluacin. XIX. Prueba piloto de las tareas evaluativas o los reactivos: Recoleccin preliminar de datos sobre los elementos de un nuevo instrumento de
6
evaluacin a fin de valorar su funcionamiento en una poblacin especfica para realizar ajustes orientados a su mejora y a su posterior aplicacin. XX. Protocolo de aplicacin estandarizado: Procedimiento para la conduccin de la aplicacin de un instrumento de medicin acorde a reglas especficas y detalladas que garanticen que las condiciones de evaluacin sean las mismas para todos los examinados. XXI. Punto de corte: En instrumentos de evaluacin con referencia a un estndar de desempeo, es la puntuacin mnima o criterio a alcanzar o superar para considerar que el nivel de desempeo de una persona cumple con lo esperado y distinguirlo de otro que no. XXII. Instrumento de evaluacin referido a un criterio: Instrumento que permite comparar el desempeo de las personas evaluadas con un estndar pre-establecido. XXIII. Reactivo: Unidad bsica de medida de un instrumento de evaluacin que consiste en una pregunta o instruccin que requiere una respuesta del sujeto. XXIV. Rbrica: Herramienta que integra los criterios a partir de los cuales se califica una tarea evaluativa. XXV. Sesgo: Error en la medicin de un atributo (por ejemplo, conocimiento o habilidad), debido a una variable no controlada, como las diferencias culturales o lingsticas de las personas evaluadas. XXVI. Tarea evaluativa: Unidad bsica de medida de un instrumento de evaluacin que consiste en la ejecucin de una actividad que es susceptible de ser observada. XXVII. Validez: Juicio valorativo integrador sobre el grado en que los fundamentos tericos y las evidencias empricas apoyan la interpretacin de las puntuaciones de los instrumentos de evaluacin.
7
3. Introduccin Los Criterios Tcnicos que se presentan a continuacin suponen que un buen instrumento de evaluacin es el producto de una aplicacin cuidadosa y coherente de principios establecidos para el diseo, elaboracin y revisin de instrumentos de evaluacin. Estos principios refieren a un proceso de carcter secuencial en el que los productos de una fase se convierten en los insumos de la siguiente. Las fases del proceso de desarrollo de un instrumento de evaluacin que se consideran para la exposicin de estos Criterios Tcnicos son seis: 1) planeacin del instrumento de evaluacin, 2) elaboracin del instrumento de evaluacin, 3) aplicacin o administracin del instrumento, 4) procesamiento y anlisis de resultados del instrumento, 5) difusin y uso de los resultados y 6) informe tcnico del instrumento. Para cada una de estas fases se contemplan diversas acciones de verificacin documental que permitirn cotejar el nivel de cumplimiento de los criterios tcnicos expuestos.
Estos Criterios Tcnicos son aplicables a instrumentos de evaluacin educativa destinados a medir atributos de personas, ya sean de seleccin de respuesta (como los instrumentos de opcin mltiple), de respuesta construida (como los ensayos), o de desempeo (como el desarrollo de un plan de clase o una exposicin en el aula), y cualquiera que sea su forma de administracin (en lpiz y papel o dispositivos electrnicos).
4. Planeacin del instrumento de evaluacin Esta fase incluye las siguientes acciones: Conformacin de los cuerpos colegiados de especialistas; definicin del propsito y usos del instrumento de evaluacin; definicin del objeto de medida del instrumento de evaluacin y elaboracin de las especificaciones.
8
4.1 Conformacin de lo cuerpos colegiados de especialistas
4.1.1 Una vez que se concibe la idea de desarrollar un instrumento de evaluacin, debern integrarse los cuerpos colegiados de especialistas que participarn realizando diversas tareas en las distintas fases del desarrollo del instrumento. El principio que debe guiar la integracin de estos cuerpos colegiados es el de contar con expertos del campo o dominio a evaluar. Para su integracin, deber tenerse en cuenta la funcin especfica que cada uno de ellos cumplir en las distintas fases del proceso de desarrollo del instrumento. Los integrantes de estos cuerpos colegiados debern estar debidamente capacitados para las tareas especficas que habrn de realizar a lo largo del proceso del desarrollo del instrumento de evaluacin. Algunos especialistas podrn participar en ms de un comit con la finalidad de dar coherencia y continuidad al trabajo, y a los productos que se generen en cada fase.
4.1.2 El Consejo Tcnico ser la instancia responsable de definir los siguientes aspectos del instrumento: a) propsitos; b) usos que se darn a sus resultados; c) poblacin a la que se dirige; d) usuarios de la informacin que derive de su aplicacin y e) tipo de instrumento y modalidad de administracin. Asimismo, vigilar que las distintas actividades realizadas por los comits de especialistas, en los que se apoya para el desarrollo del instrumento, estn debidamente alineadas a estos aspectos.
4.1.3 Debern constituirse al menos cuatro comits de especialistas que apoyen al Consejo Tcnico para la realizacin de distintas tareas durante el proceso de desarrollo del instrumento de evaluacin: a) el Comit Acadmico, cuya funcin ser seleccionar, delimitar conceptualmente y justificar el objeto de medida o contenido del instrumento de evaluacin; b) el Comit de Especificaciones, que tendr como funcin precisar y operacionalizar el objeto de medida del instrumento de evaluacin; c) el Comit de Elaboracin de Tareas Evaluativas o Reactivos, cuyo propsito es elaborar las tareas evaluativas o los reactivos, a
9
partir de las especificaciones previamente desarrolladas por el Comit de Especificaciones y d) el Comit de Validacin, que tendr como funcin verificar que las tareas evaluativas o los reactivos del instrumento estn debidamente alineados con las especificaciones que operacionalizan el objeto de medida del instrumento, as como cuidar que las tareas evaluativas o los reactivos no presenten errores de contenido y se redacten en un lenguaje apropiado para la poblacin evaluada.
4.1.4 Estos cinco cuerpos colegiados (Consejo Tcnico, Comit Acadmico, Comit de Especificaciones, Comit de Elaboracin de Tareas Evaluativas o Reactivos, Comit de Validacin) debern ser coordinados por la instancia (dependencia o institucin) responsable del desarrollo del instrumento de evaluacin. Dicha instancia tendr como funcin: a) guiar, integrar y coordinar los trabajos de cada uno de los distintos cuerpos colegiados que participarn a lo largo del proceso de evaluacin; b) capacitar a los integrantes de estos cuerpos colegiados para que realicen adecuadamente sus funciones; c) realizar distintos mtodos de aseguramiento de la calidad mtrica del instrumento y d) elaborar el informe tcnico del instrumento de evaluacin.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar la fecha de instalacin de cada uno de estos cuerpos colegiados, as como el nombre, la formacin acadmica, la ocupacin y la institucin de procedencia de cada uno de sus integrantes. Asimismo, debern mostrarse los materiales que se utilizaron para la capacitacin de estos cuerpos colegiados.
4.2 Definicin del propsito y usos del instrumento de evaluacin 4.2.1 Debe definirse, de manera clara y concisa, lo que se pretende medir con el instrumento de evaluacin, esto es el propsito con el que se desarrolla, as como los usos e interpretaciones que se darn a sus resultados. Este paso es indispensable porque dirige todas las decisiones subsiguientes para el desarrollo
10
del instrumento. Para cada uso que se le d a los resultados del instrumento debern aportarse evidencias suficientes de que este uso es vlido, especialmente para las evaluaciones de alto impacto, donde las consecuencias de los resultados son importantes para las personas o las instituciones. Junto con el propsito y los usos de los resultados del instrumento, debe definirse tambien la poblacin objetivo, el tipo de instrumento y la modalidad en que se administrar, as como quines sern los usuarios de la informacin y si los resultados de las evaluaciones tendrn algn tipo de consecuencia, ya sea para la escuela, los directivos, los profesores o los alumnos. Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar la ficha tcnica del instrumento de evaluacin en la que se especifiquen los siguientes aspectos: propsito y poblacin objetivo; uso y alcance de sus resultados; tipo de instrumento, impacto o consecuencias de sus resultados; as como la modalidad y condiciones de administracin o aplicacin.
4.3 Definicin del objeto de medida del instrumento de evaluacin 4.3.1 Toda evaluacin deber contar con un marco terico que justifique los trminos en los que el objeto de medida se aborda en el instrumento de evaluacin. En el caso de los instrumentos de evaluacin alineados al currculo, debern contar con un marco explicativo que deje claro la manera en cmo el contenido del instrumento es una muestra significativa del currculo por evaluar. Por su parte, las evaluaciones basadas en rasgos o atributos psicolgicos (tales como habilidad intelectual, competencia o aptitud) debern presentar un marco de la teora sustantiva dado por la investigacin existente en el campo correspondiente. 4.3.2 La manera como se aborda el objeto de medida en el instrumento de evaluacin, debe establecerse fundamentalmente con base en el propsito y el marco terico del instrumento de evaluacin. Los criterios que se sigan para seleccionar los aspectos o elementos que lo constituyen debern ser explcitos y garantizar que se trata de aspectos o temas relevantes (importantes y
11
significativos para el propsito de la evaluacin), pertinentes (congruentes con los propsitos y alcances de la evaluacin) representativos (que constituyen una muestra significativa de los aspectos cruciales del objeto de medida) y viables para ser evaluados a travs del instrumento.
4.3.3 El contenido especfico del instrumento deber consignarse en una tabla de especificaciones en la que, por un lado, se ordenen jerrquicamente los aspectos o elementos a medir (por ejemplo, reas, subreas y temas) y, por el otro, el sistema de clasificacin de estos elementos o aspectos (por ejemplo, para el caso de la evaluacin del aprendizaje, se podra utilizar la clasificacin cognoscitiva de la versin modificada de la taxonoma de Bloom o la de Gagn). Para cada uno de los niveles jerrquicos considerados en la tabla, deber especificarse el nmero de tareas evaluativas o reactivos considerados para su evaluacin.
4.3.4 El grupo de especialistas que integran el Comit Acadmico deber aprobar el marco terico o explicativo del objeto de medida, la definicin conceptual del mismo y la tabla de especificaciones del instrumento.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar el marco terico y la definicin conceptual del objeto de medida del instrumento, as como los procedimientos empleados para seleccionar los contenidos especficos y para determinar la distribucin del nmero de tareas evaluativas o reactivos en cada nivel jerrquico del instrumento. Asimismo, deber contarse con el documento donde se detalle la taxonoma utilizada para clasificar los contenidos especificos del instrumento.
4.4 Elaboracin de las especificaciones
4.4.1 La fase de elaboracin de especificaciones forma parte del proceso de delimitacin del objeto de medida y tiene como finalidad precisar, en trminos observables, los aspectos especficos que lo constituyen (conocimientos, habilidades, competencias, actitudes o aptitudes). Las especificaciones son el
12
principal insumo para la elaboracin de las tareas evaluativas o los reactivos que conformarn el instrumento de evaluacin.
4.4.2 Las especificaciones debern elaborarse cuidando que contengan, al menos, los siguientes aspectos: a) una definicin de la accin observable del sujeto como evidencia de que presenta el rasgo o atributo medido o domina el contenido evaluado, b) una descripcin de las condiciones especficas bajo las cuales se espera que esta accin se realice en el contexto de la evaluacin y c) una tarea evaluativa o reactivo que ejemplifique cmo se concreta la medicin de lo que se establece en la especificacin.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber contar con las especificaciones elaboradas para cada aspecto del contenido del instrumento, firmadas por los especialistas participantes.
5. Elaboracin del instrumento de evaluacin
Esta fase incluye las siguientes acciones: a) la elaboracin de las tareas evaluativas o los reactivos y b) el pilotaje de las tareas evaluativas o los reactivos.
5.1 Elaboracin de tareas evaluativas o reactivos
5.1.1 Las tareas evaluativas o los reactivos son unidades bsicas de observacin que permiten hacer inferencias sobre la presencia del atributo medido o el nivel de desempeo alcanzado en el contenido especfico del instrumento de evaluacin. Su elaboracin debe realizarse en estricto apego a las especificaciones diseadas para cada aspecto del contenido del instrumento.
5.1.2 Debe cuidarse que el vocabulario empleado sea pertinente para la poblacin a la cual est dirigido el instrumento, as como que su redacin no produzca sesgo
13
(diferencias artificiales e injustas) en las respuestas de los evaluados por cuestiones culturales, lingsticas, religiosas, socioeconmicas, de gnero o caractersticas del contexto.
5.1.3 Mediante un proceso de jueceo en el que participen los especialistas del Comit de Validacin, debe verificarse que tareas evaluativas o los reactivos elaborados midan los aspectos que se pretenden medir con el instrumento, que no presenten errores de contenido y de sesgo, y se redacten en un lenguaje apropiado para la poblacin evaluada.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar la evidencia de que todas las tareas evaluativas o reactivos utilizados en el instrumento fueron aprobados por el comit de validacin (por ejemplo, actas de validacin).
5.2 Prueba piloto de las tareas evaluativas o reactivos 5.2.1 Una vez validadas las tareas evaluativas o los reactivos por el Comit de Validacin, debern someterse a prueba con grupos de participantes que tengan las caractersticas ms cercanas posibles a la poblacin a la que cual est destinado el instrumento, a fin de poder detectar fallas en su desarrollo o tener estimaciones preliminares de sus cualidades mtricas. 5.2.2 En caso de que sea imposible realizar una prueba piloto antes de su aplicacin final, deber incluirse un nmero mayor de tareas evaluativas o reactivos a los establecidos en la tabla de especificaciones del instrumento, para que con base en los resultados se puedan identificar las tareas evaluativas o reactivos con mejor calidad mtrica para ser utilizados en la calificacin. 5.2.3 En todos los casos se realizar el anlisis de dificultad y discriminacin de las tareas evaluativas o los reactivos sometidos a prueba; adicionalmente, para los reactivos de opcin mltiple tambin se analizar el comportamiento de sus distractores. Esta informacin servir para identificar y eliminar aquellas tareas
14
evaluativas o reactivos que no alcancen los ndices de calidad tcnica requerida para este tipo de instrumentos.
5.2.4 En el caso de instrumentos de evaluacin que requieren de jueceo para la calificacin de las tareas evaluativas o reactivos (por ejemplo, cuando se incluyen preguntas de respuesta construida que utilizan rbricas), adems del anlisis de dificultad y discriminacin, debern definirse y documentarse tanto el procedimiento de jueceo como la concordancia entre las valoraciones de los jueces.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar los resultados del anlisis de las tareas evaluativas o reactivos probados, as como los protocolos de lectura y calificacin utilizados.
6. Aplicacin o administracin del instrumento
De la poblacin evaluada 6.1 Uno de los aspectos cruciales que debe cuidarse es la administracin del instrumento a las personas evaluadas, vigilando que las acciones involucradas permitan que stas lo hagan bajo las mismas condiciones de tiempo, supervisin y apoyos materiales. 6.2 Con al menos un mes de antelacin, deber proporcionarse informacin a las personas evaluadas sobre los siguientes aspectos: a) caractersticas y contenido del instrumento; b) uso que se dar a los resultados; c) lugar, hora y duracin de la aplicacin del instrumento; d) materiales de apoyo que requerir para resolver el instrumento y e) requisitos que deber cumplir para tener acceso al lugar de la aplicacin del instrumento (por ejemplo, la presentacin de una identificacin oficial).
15
6.3 Las instrucciones y los materiales presentados a la poblacin evaluada debern ser lo suficientemente claros y detallados para que puedan responder el instrumento de evaluacin. Cuando se utilicen formas no habituales para registrar las respuestas (por ejemplo, aplicaciones por computadora), deber permitirse la realizacin de prcticas previas a las personas que respondern el instrumento de evaluacin.
De los aplicadores 6.4 Para la administracin del instrumento, deber desarrollarse un manual del aplicador en el que se establezcan, con toda claridad, las caractersticas de los materiales que manejar (por ejemplo, cuadernillo del instrumento, hojas de respuesta, formatos de registro de incidencias, material de apoyo, etctera), las posibles contingencias que pudieran ocurrir en el transcurso de la aplicacin y las acciones que deber tomar para enfrentarlas adecuadamente, as como los lmites y responsabilidades de los actores involucrados en la situacin de aplicacin. 6.5 El personal responsable de la aplicacin del instrumento de evaluacin deber estar previamente capacitado para realizar dicha tarea. Asimimismo, deber presentar condiciones de imparcialidad, asegurando que no participen como aplicadores las personas que tengan algn conflicto de intereses que puedan llegar a afectar los resultados de la evaluacin (por ejemplo, familiares o amigos de las personas evaluadas).
6.6 Los aplicadores debern estar presentes con suficiente antelacin (al menos dos horas antes) en el lugar en el que se realizar la aplicacin del instrumento, a fin de garantizar que se cumpla con todos los requerimientos fsicos y materiales indispensables para llevar a cabo adecuadamente el proceso de evaluacin.
6.7 Una vez iniciada la administracin del instrumento, el aplicador verificar que las personas por evaluar hayan comprendido cabalmente las instrucciones del
16
instrumento y, en su caso, atender aquellas dudas que estn dentro de su marco de competencia y en los trminos establecidos en el manual del aplicador.
Del resguardo de los materiales y la aplicacin 6.8 Los procedimientos para resguardar todos los materiales y productos que deriven del proceso de evaluacin debern contar con medidas de seguridad que salvaguarden su confidencialidad y el buen estado de los mismos, especialmente en las evaluaciones de alto impacto para los alumnos, docentes o instituciones. 6.9 Los materiales y productos del proceso de evaluacin, debern quedar bajo el resguardo de las autoridades competentes, quienes debern cuidar su posterior envo al rea responsable del anlisis del instrumento de evaluacin. 6.10 La aplicacin del instrumento de evaluacin se efectuar en espacios que renan las condiciones adecuadas de comodidad, higiene, iluminacin y ventilacin, as como aquellas especficas que se deban atender dada la naturaleza de la evaluacin y donde exista el mnimo posible de distracciones.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar los materiales utilizados para informar a las personas por evaluar sobre las caractersticas y contenidos del instrumento de evaluacin, as como de las particularidades de su aplicacin. Asimismo, deber contar con el manual del aplicador y con el documento donde se detallen los protocolos de aplicacin y resguardo de los materiales.
17
7. Procesamiento y anlisis de resultados del instrumento 7.1 Uno de los aspectos fundamentales que debe llevarse a cabo antes de emitir cualquier resultado de un proceso de evaluacin es el anlisis psicomtrico del instrumento con el objetivo de verificar que cuenta con la calidad tcnica necesaria para proporcionar resultados confiables, acordes con el objetivo de la evaluacin. 7.2 Las tcnicas empleadas para el anlisis del instrumento dependern de su naturaleza, diseo de la muestra o tamao de la poblacin, as como de los objetivos especficos para el cual fue diseado. Sin embargo, en todos los casos, se debern aportar datos sobre la dificultad y discriminacin de sus reactivos o tareas evaluativas, as como sobre los indicadores de consistencia interna o estabilidad del instrumento y de validez de la interpretacin de sus resultados.
7.3 Los procesos anteriores debern permitir identificar las tareas evaluativas o los reactivos que contribuyen a la calidad mtrica del instrumento y slo estos deben incorporarse para la calificacin de las personas evaluadas, a fin de estimar con mayor precisin su desempeo. Este procedimiento debe permitir, al mismo tiempo, corroborar las claves de las respuestas correctas.
7.4 Deber realizarse el proceso de calificacin con base en protocolos estandarizados que incorporen los algoritmos y reglas de calificacin, considerando que deben ser claras para el pblico usuario del instrumento y que se correspondan con el propsito de la evaluacin.
7.5 Cuando se incluyan procesos de jueceo en la calificacin de un instrumento de respuesta construida, se documentarn con claridad los procedimientos y criterios que utilizarn los jueces en la calificacin de las respuestas. Tambin se proporcionar evidencia del grado de acuerdo entre las puntuaciones dadas por los jueces a fin de que la calificacin obtenida sea un resultado imparcial y objetivo de la medicin.
18
7.6 Para los instrumentos de evaluacin en los que se requiera determinar un punto de corte para establecer estndares de desempeo, el Comit Acadmico deber ser capacitado especficamente para ejercer su mejor juicio profesional y poder identificar cul es la puntuacin requerida para que la persona evaluada alcance un determinado nivel o estndar de desempeo. 3
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar los protocolos, algoritmos y reglas de calificacin, as como la manera correcta de interpretar los resultados. En los casos que se utilicen puntos de corte para definir niveles de desempeo, deber documentarse la racionalidad del proceso y las caractersticas de los juicios emitidos por los expertos, as como la evidencia de la idoneidad de su experiencia profesional y formacin acadmica que sustenten la validez de los niveles establecidos. Asimismo, deber documentarse los materiales utilizados para la capacitacin.
8. Difusin y uso de los resultados 8.1 La informacin de los resultados que se haga pblica deber incluir descripciones breves del propsito y las caractersticas del instrumento, precisando lo que pretende medir, las interpretaciones, conclusiones y decisiones que pueden basarse en sus resultados, as como cualquier informacin que ayude a evitar interpretaciones y usos inapropiados de los resultados. 8.2 Las organizaciones que conserven resultados de instrumentos de evaluacin de individuos, debern tener lineamientos explcitos en cuanto al tiempo que conservarn los resultados, su disponibilidad pblica y su uso a lo largo del tiempo. Lo anterior deber cumplir con lo establecido en la Constitucin Poltica de los Estados Unidos Mexicanos y leyes secundarias correspondientes, en lo referente a la proteccin de datos personales.
3 Para el caso del Servicio Profesional Docente, le corresponde definir este aspecto al INEE, de conformidad con lo establecido en el numeral I del Artculo 9 de los Lineamientos iniciales especficos para llevar a cabo la evaluacin del ingreso al Servicio Profesional Docente en Educacin bsica y Educacin media superior y lineamientos iniciales especficos para llevar a cabo la evaluacin para la promocin a cargos con funciones de Direccin (Directores) en Educacin media superior, para el ciclo escolar 2014-2015.
19
8.3 El reporte de resultados de la evaluacin deber ser consistente con el propsito, el objeto de medida y la tabla de especificaciones del instrumento de evaluacin. En los casos de los instrumentos de evaluacin referidos a un criterio, las etiquetas que identifiquen los estndares o niveles de desempeo, debern ser consistentes con la descripcin de lo que se espera sea capaz de hacer la persona evaluada para ser clasificada en cada categora de logro. Deber evitarse el uso de etiquetas estigmatizantes.
8.4 Ninguna decisin que tenga consecuencias importantes sobre los individuos o instituciones, se basar nicamente en los resultados de solo un instrumento de evaluacin, por lo cual, debern considerarse otras fuentes confiables de informacin que incrementen la validez de las decisiones que se tomen (por ejemplo, en los procesos de ingreso o admisin la experiencia previa, el promedio escolar, cartas de recomendacin o entrevistas).
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin deber documentar los formatos utilizados para reportar los resultados del instrumento, as como la racionalidad en la que se bas su diseo.
9. Informe tcnico del instrumento 9.1 La integracin de las evidencias de las fases del proceso de desarrollo del instrumento de evaluacin hasta aqu expuestos (planeacin del instrumento de evaluacin; elaboracin del instrumento de evaluacin; aplicacin o administracin del instrumento; procesamiento y anlisis de resultados del instrumento, as como la difusin y uso de los resultados) es fundamental para el uso e interpretacin vlidos de las puntuaciones o calificaciones obtenidas. Es por ello que, como parte final de todo este proceso, la instancia responsable del desarrollo del instrumento de evaluacin deber elaborar el informe tcnico correspondiente.
9.2 Dicho informe deber resumir los aspectos sustantivos documentados de cada una de las fases del proceso de desarrollo de un instrumento de evaluacin y que
20
han quedado sealados en los nueve apartados denominados Accin para la verificacin documental en cada caso. Adems deber contener recomendaciones para mejorar la calidad tcnica del instrumento de evaluacin.
Mxico, D.F., a los diez das del mes de abril de dos mil catorce.- As lo aprob la Junta de Gobierno del Instituto Nacional para la Evaluacin de la Educacin en la Quinta Sesin Extraordinaria 2014, celebrada el diez de abril de dos mil catorce. Acuerdo nmero SEAJG/3-14/01.O6,R.- La Consejera Presidenta, Sylvia Irene Schmelkes del Valle.- Rbrica.- Los Consejeros: Eduardo Backhoff Escudero, Teresa Bracho Gonzlez, Gilberto Ramn Guevara Niebla, Margarita Mara Zorrilla Fierro.- Rbricas.