Você está na página 1de 10

Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

SISTEMA ADAPTATIVO INFORMATIZADO PARA APOYAR EL ÁREA DE


PROGRAMACIÓN EN LA UNIVERSIDAD DE CÓRDOBA

COMPUTERIZED ADAPTIVE SYSTEM TO SUPPORT THE AREA OF PROGRAMMING


IN THE UNIVERSITY OF CORDOBA

8 , 9
Camilo Cervantes Salazar * Daniel Salas Álvarez

Recibido para publicación: 2 de marzo de 2016 - Aceptado para publicación: 14 de mayo 2016

RESUMEN
El presente trabajo de investigación tiene como propósito mostrar un sistema adaptativo
(ADAPTIKE) orientado a la web que permita administrar tests s informatizados enfocados
en el área de programación, para el cumplimiento de ésta meta se fundamentó en la
teoria de respuesta al ítem, se determinó la especificaci conformó un banco de preguntas
relacionados al área a evaluar, se determinó la arquitectura y la especificación de
requisitos del sistema, posteriormente se desarrolló el sistema y la validación del mismo,
con estudiantes y docentes del área de programación del programa de ingeniería de
sistemas en la Universidad de córdoba.
Palabras claves: Diseño, construcción, validación, ensayos, máquina.

ABSTRACT
This research aims to develop a web oriented information system (ADAPTIKE) that is able
to deliver computerized adaptive tests focused on the programming area. To fulfill this goal
8*
Ingeniero de sistemas, Universidad de Córdoba – Montería – Colombia
ccervantessalazar@correo.unicordoba.edu.co
9
Ingeniero de Sistemas, Magister en Informática,Director Grupo Socrates, Universidad de Córdoba –
Montería – Colombia dajosalas@gmail.com

28
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

a bank of questions related to the mentioned area was created, the system requirements
were determined from students and teachers who expressed their perceptions about
assessment in their academic context and also a research in scientific journals and books
about adaptive assessment models and item response theory. Subsequently, system
development was made and operation tests were conducted.
Key words: computerized adaptive test, item response theory, adaptive assessment
system.

De esta manera se evidencia la necesidad


1. INTRODUCCIÓN desarrollar una herramienta que aplique un
modelo de evaluación diferente al tradicional.
En el contexto de una institución de Se trata de los tests adaptativos
educación superior, los medios para evaluar informatizados, una forma de evaluación por
los conocimientos de los estudiantes es de computador que se adapta al nivel de
gran importancia debido a que mediante este conocimiento del estudiante evaluado
proceso se pueden verificar los resultados eligiendo la siguiente pregunta a plantear
que evidencien la apropiación de basándose en la estimación del nivel de
conocimiento y el aprendizaje de los conocimiento del estudiante en cada
estudiantes. momento e igualmente la decisión de finalizar
En la Universidad de Córdoba, los procesos el test.
de evaluación a estudiantes se caracterizan Los tests adaptativos informatizados (TAI)
por seguir la teoría clásica del test y se denominados comúnmente CATs por sus
administran por medio de sistemas de siglas en inglés (Computer Adaptive Tests)
información que permiten realizar es un tipo de test administrado por
evaluaciones online y también con tests a computador, donde la selección de la
papel y lápiz. siguiente pregunta a administrar y la decisión
Sin embargo, al revisar los resultados de de detener la prueba se realiza de forma
éstos tests en el área de programación se dinámica basada en el perfil del estudiante, el
observa una tendencia en la cual los cual es creado y actualizado durante la
estudiantes evaluados no logran obtener las interacción con el sistema [1].
calificaciones mínimas requeridas para
aprobar el test.
A partir de esta observación se llevó a cabo
un estudio en el cual buscaba conocer la
percepción de estudiantes y docentes sobre
la forma como se realizan los procesos de
evaluación en la institución.
Por medio de encuestas y entrevistas, los
estudiantes y docentes manifiestan que los
tests tradicionales cumplen su papel como
herramienta clave en la formación profesional
pero que requiere mejorar en aspectos como
la forma como se entrega el resultado del
test, en la cual se indica una calificación que
no permite conocer de forma detallada las
fortalezas y debilidades evidenciadas a partir Figura 1. Algoritmo TAI
de dicho test, y la calidad de las preguntas
del test, las cuales en ocasiones son Los tests adaptativos resultan más
demasiado complejas y no corresponden con convenientes que los tests tradicionales
los conocimientos que maneja el individuo
ya que tienden a ser más cortos, se
evaluado.
presenta un aumento en la precisión del

29
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

nivel de conocimiento del evaluado en un En 1990, se efectuó la primera


aspecto determinado y el mismo test se evaluación adaptativa computarizada a
muestra de diferentes maneras para gran escala en EE.UU. El departamento
cada individuo lo cual conduce a una de defensa norteamericano desarrolló el
disminución del fraude en la aplicación sistema CAT-ASVAB [5], el cual es la
del test [2]. versión adaptativa de la prueba ASVAB
El origen estos tests viene del usada para el enlistamiento de personal
investigador francés Alfred Binet [3] en las fuerzas armadas, y es obligatoria
quien en 1905 introdujo las bases de la para todo estudiante de último año de
adaptabilidad en los tests mientras bachillerato.
desarrollaba el test de inteligencia Binet. Los resultados obtenidos con los TAI's
Este test fue diseñado para identificar el han sido satisfactorios por tal motivo hoy
nivel de dificultad que es más apropiado en día, gracias a las condiciones
para cada examinado y se caracteriza tecnológicas actuales y el desarrollo
por usar bancos de ítems precalibrados, teórico de los últimos 60 años, ha
tener la capacidad de ajustar el nivel de prosperado el desarrollo y uso de los
dificultad inicial, aplicar reglas de TAI's en muchos campos de estudio.
selección de ítems y poseer una regla Por ejemplo, un tema fundamental en el
predefinida para la terminación del test. mundo actual es certificar la capacidad
A medida que las aplicaciones de las de manejar idiomas diferentes a la
evaluaciones en diversos campos se lengua de nacimiento, y para ello existen
volvieron prácticas comunes, surgió la herramientas como J-CAT [6], el cual es
necesidad de sistematizar dicho proceso un sistema de evaluación adaptativa que
para reducir costos y aprovechar el fue desarrollado ante la necesidad de
potencial de los recursos tecnológicos. evaluar y certificar el manejo del idioma
Sin embargo, la informatización de los japonés de estudiantes de intercambio
tests tuvo que esperar a que la que van a prepararse en Japón. La
tecnología fuera económicamente certificación de conocimientos no se
accesible para que su uso extensivo limita al lenguaje, también aplica para el
fuera un hecho factible. conocimiento general, tal es el caso de
En 1980, con el abaratamiento de los las pruebas GRE [7] y GMAT [8], el
computadores personales se hizo posible primero es un examen obligatorio para la
que se desarrollaran los primeros tests mayoría de los programas de postgrado
informatizados, los cuales se de Estados Unidos, y en menor medida
caracterizan por aplicar el mismo test en Europa y Canadá y el segundo es el
tradicional que se hace a papel y lápiz más usado en el mundo para medir las
pero con las ventajas que proporciona la aptitudes de los recién graduados en
tecnología. En esa década la mayoría de escuelas de Negocios y Finanzas. Sirve
tests estandarizados de Estados Unidos como criterio de selección para las
y Europa se hacían utilizando ésta clase admisiones a los MBA's principalmente
de tests. en los Estados Unidos y también en otros
Paralelamente, se abrió la posibilidad de lugares del mundo. Ambas evaluaciones
implementar sistemas para la aplicación se administran por medio de TAI’s.
de tests adaptativos computarizados También se realizaron aplicaciones en la
(TAI). El primer sistema comercial salud, con proyectos como CAT-Health
conocido para la aplicación de tests [9], un test adaptativo informatizado
adaptativos fue el MicroCAT Testing desarrollado en España para la medición
System [4], desarrollado por Assessment de la calidad de vida relacionada con la
Systems Corporation en 1984. salud de un paciente. Con éste se facilitó
la medición de los resultados reportados

30
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

por los pacientes en la práctica clínica, y 1|Θ), o simplemente 1, . Si el test está


un trabajo desarrollado por Ruo et. al [10] compuesto por 2preguntas, sabiendo los
en el cual los autores desarrollaron un CCIs, y suponiendo independencia local
CAT que les permitiera conocer datos de los ítems, es posible construir una
sobre la disnea como la severidad y función probabilística:
frecuencia del síntoma. El uso de CAT en ; 5=;
3 45 , 46 … 48 Θ = Π:, < 1, < , > = 1 … 2
este escenario es vital para minimizar la El valor máximo de esta función
carga del paciente. proporciona una estimación del valor
Con este contexto en mente, este trabajo más probable de Θ. Es posible obtener
busca desarrollar un sistema de una distribución de la probabilidad de Θ
información para la aplicación de tests aplicando 2 veces la regla de Bayes [12].
adaptativos informatizados que permita
realizar evaluaciones capaces de 2.2. Curva característica del Ítem (CCI)
adaptarse al nivel de conocimiento de Uno de los principales problemas de la
cada estudiante, el cual es estimado de IRT es hallar las CCIs. Han sido
acuerdo con las respuestas que ofrece propuestos muchos modelos. Los más
en cada pregunta, siguiendo los populares son aquellos que suponen que
fundamentos establecidos en la Teoría los CCIs pertenecen a una familia de
de Respuesta al Ítem y enfocado en el funciones que dependen de una, dos o
área de fundamentos de programación tres parámetros. Estas funciones se
construyen basándose en la función de
distribución normal o la función de
2. ESTADO DEL ARTE distribución logística.
Por ejemplo, basándose en la función
logística, para el modelo de 3-
2.1. Teoría de Respuesta al Ítem
parametros, el CCI puede describirse
La teoría de respuesta al ítem (TRI) se
como:
originó a finales de 1960 y tiene sus
raíces en la teoría de la medición
psicológica. Según Lord, el término latent
trait (característica latente), se refiere
originalmente a la deducción de hipótesis donde ?, es conocida como la dificultad
psicológicas que se suponían que debían de la pregunta; @, es el factor de
enmarcar el comportamiento observado adivinación, y A, el factor de
de un individuo. En el contexto de las discriminación [13].
evaluaciones, la definición de éste El factor de adivinación es la probabilidad
término se convierte en un atributo que de que un estudiante sin conocimiento
se identifica por la consistencia de las alguno resuelva la pregunta. La dificultad
respuestas del test [12]. Cada pregunta o representa el nivel de conocimiento en el
ítem en un test se le asigna una Curva cual el estudiante tiene la misma
Característica del Ítem (CCI) la cual es probabilidad de responder la pregunta
una función que representa la bien o mal excluyendo el factor de
probabilidad de que dada una respuesta adivinación. El factor de discriminación
correcta a esa pregunta dado un cierto es proporcional a la inclinación de la
nivel de conocimiento del estudiante curva. Sí el factor de discriminación es
Θ # (−∞, +∞) , definida como un número alto, es probable que los estudiantes con
real. Representamos esto por la nivel menor que ? fallen y los estudiantes
expresión: *(+, = 1|Θ) o simplemente *, . con nivel mayor que ? con mayor
Lógicamente, la probabilidad de fallar la seguridad contestarán la pregunta
pregunta es * +, = 0 Θ = 1 − *(+, = correctamente.

31
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

Los modelos matemáticos de la TRI


incluyen unos supuestos sobre los datos
a los cuales se le está aplicando el
modelo. Éstos supuestos hacen viable
algunas operaciones clave de la TRI
como el cálculo de la probabilidad de
responder un ítem correctamente
dependiendo de la habilidad del evaluado
y de su nivel de conocimiento.
Unidimensionalidad: La
unidimensionalidad se refiere al hecho de
que los ítems de un test adaptativo solo
Figura 2. CCI para un modelo de 3- miden una sola habilidad. Esto no se
parámetros (Fuente: Baker). puede garantizar completamente en un
test ya que existen multitud de factores
que influyen en el resultado final de la
Asumiendo que las formas de CCI evaluación. Por lo tanto los ítems del test
pertenecen a esta familia, el problema es deben contar con un factor dominante
formulado como la estimación de los que influya en el rendimiento del test
parámetros que se ajusta mejor. Para para ser considerados unidimensionales
estimar estos parámetros, es sabido que [13].
el modelo de 1-parámetro es Independencia local: La independencia
relativamente simple de usar y ofrece local ocurre entre las respuestas de dos
estimaciones confiables con 100 sujetos ítems de un test e indica que la
mínimo. El modelo de 2-parámetros toma respuesta de un ítem no tiene ninguna
en cuenta las posibles diferencias en la incidencia en la respuesta de otro ítem,
discriminación de los ítems y, aunque los es decir, son independientes una de otra.
resultados poseen mayor precisión, Esto permite calcular la probabilidad de
también significa que la mayor responder un conjunto de preguntas por
complejidad del modelo requerirá un medio del producto de la probabilidad de
mayor número de participantes, 200 por respuesta de cada una de las preguntas
lo menos. El modelo de 3-parámetros que conforman el conjunto [13].
tiene en cuenta el factor de adivinación,
pero el precio a pagar incluye una 2.4. Estimación de parámetros por
muestra de mínimo 1000 individuos [13]. máxima verosimilitud conjunta
La situación más común se encuentra Cuando se considera una muestra de B
cuando tanto la habilidad como los estudiantes respondiendo a 2 preguntas,
parámetros de dificultad de los ítems son la función de máxima verosimilitud
desconocidos. En este caso se necesita conjunta es:
una matriz formada por las respuestas
dadas por N estudiantes para un
conjunto de n ítems. donde se supone la existencia de
Hay muchos métodos de estimación de independencia local y 4C es el patrón de
tales parámetros, sin embargo los más respuesta de un estudiante
usados son el método de máxima correspondiente a los 2 ítems
verosimilitud conjunta y el método de considerados, D es un vector que sus
máxima verosimilitud marginal. componentes son B parámetros de la
habilidad de la persona (una por cada
2.3. Supuestos de la Teoría de estudiante); A, ?, @ también son vectores
Respuesta al Ítem formados por los parámetros de dificultad

32
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

del ítem [14]. En el modelo de 3- 3.2. Desarrollo


parámetros hay 32 parámetros de ítem, En esta etapa se eligieron las
en el modelo de 2-parámetros 22 y en el herramientas de desarrollo, los patrones
modelo de 1-parámetro 2 parámetros. de diseño, y se producirá el sistema
Entonces en el modelo de 3-parámetros siguiendo los parámetros de diseño
tendrán que ser estimados un total de establecidos en la etapa de diseño. Se
32 + B. Los valores de los parámetros se utilizó PHP como lenguaje de
consiguen al maximizar la función de programación y una arquitectura cliente-
verosimilitud o su logaritmo dado por: servidor siguiendo el patrón MVC. Se
contó con un sistema gestor de bases de
datos relacionales MySQL y tecnologías
web como Html5 y Javascript para las
La dificultad del ítem y la habilidad de la vistas.
persona no son determinadas
unívocamente por éste método. Para 3.3. Conformación del banco de ítems
eliminar esta solución indeterminada se Los tests adaptativos informatizados
elige una escala arbitraria para D y ?, requieren una cantidad amplia de ítems
usualmente la escala estándar con para poder ser ejecutados. Por tal razón
promedio 0 y desviación estándar 1. se hizo una búsqueda en internet del
Luego se seleccionan los valores mayor número posible de preguntas
iniciales para el parámetro de la habilidad relacionadas con el área de
de la persona, normalmente ln(# éxitos/# programación y luego se seleccionó un
fracasos); para cada uno [14]. subconjunto de ítems que fueran
Ahora los parámetros del ítem se adecuados a los propósitos del proyecto.
estiman de la misma forma que se Estos ítems fueron ingresados en el
describe en el paso anterior. En una sistema y posteriormente fueron
segunda fase, los parámetros del ítem se calibrados por medio de simulaciones
consideran conocidos y se estiman los con el programa WinGen [15] en el cual
parámetros de la habilidad. Este se establecen valores para los
procedimiento se repite hasta que se parámetros de los ítems de acuerdo con
alcancen las diferencias mínimas en los una distribución normal con promedio 0 y
estimadores de los parámetros entre dos desviación estándar 1.
etapas sucesivas.
3.4. Pruebas
En esta etapa se realizaron pruebas
3. MATERIALES Y MÉTODOS
unitarias de cada componente del
3.1. Análisis y diseño sistema y posteriormente se simula una
En esta etapa se llevó a cabo un análisis situación real usando dos estudiantes y
del problema para identificar los un docente quienes participarán en el
requerimientos funcionales y no proceso de evaluación usando el
funcionales del sistema. Luego se sistema.
modeló la información que el sistema
maneja y el flujo de información que
tenía lugar en el sistema de acuerdo a 4. RESULTADOS Y DISCUSIÓN
eventos, estados y condiciones 4.1. Sistema ADAPTIKE
particulares. En esta etapa se logró El sistema se desarrolló usando un
describir de forma detallada las modelo dividido en capas como lo
características del sistema que establece el patrón Modelo-Vista-
permitirían su posterior implementación. Controlador (Figura 2), en el cual se tiene
una capa de presentación para que los

33
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

usuarios puedan acceder a través de permiten administrar la información del


internet a la vista de la aplicación por sistema. Tienen en común que todos
medio de un navegador web. La interfaz realizan operaciones CRUD básicos
de usuario se implementa usando entre otras funcionalidades.
tecnologías orientadas a la web como • Control de acceso: Es un módulo que
Html, CSS, Javascript y PHP. La permite controlar los accesos a las
aplicación se encuentra alojada en un funcionalidades del sistema e identificar
servidor web apache, el cual representa a los usuarios que acceden al sistema
la capa de negocio del sistema. Allí se para se adapte al rol del usuario.
encuentra el núcleo del sistema, con sus Para la persistencia de la información
respectivos módulos y funcionalidades: que se maneja, se tiene una capa de
• Administración del test adaptativo: Es datos en la cual se encuentra un servidor
un módulo que permite ejecutar un test de bases de datos Mysql y una base de
adaptativo y procesar los resultados de datos que contiene las tablas utilizadas
dicho test, seleccionar las preguntas del por el sistema. Para la conexión con la
test y calcular los niveles de aplicación se cuenta con una interfaz de
conocimiento de los individuos conexión que es utilizada desde los
evaluados. controladores de la aplicación para poder
• Gestión de información: Agrupa todos comunicarse con la base de datos e
los módulos de gestión de datos que intercambiar información.

Figura 3. Arquitectura del sistema Adaptike

4.2. Pruebas y discusión

34
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

Para las pruebas del sistema se accede ingresa un valor numérico de -2 a 2


al sistema como evaluador quien cuenta siendo -2 el menor valor y 2 el mayor
con la opción de probar el test valor. Con esto se logrará que el test
adaptativo, administrar el banco de termine cuando el individuo alcance el
ítems, competencias, entre otras nivel de conocimiento configurado. Una
funciones. Se accede a la opción Tests y vez creado el test se procede a probarlo
luego crear test. Para la creación del test por medio de la opción administrar. El
se define la categoría a evaluar, la cual test muestra la primera pregunta y se
corresponde a la competencia que se diseñó una opción para verificar el
quiera poner a prueba, en este caso proceso de selección de ítems y
seleccionamos la de Programación, la demostrar la aplicación de la Teoría de
cual está asociada a un conjunto de Respuesta al Ítem en el proceso.
ítems previamente ingresados. Luego se
selecciona el tipo de criterio de parada
del test. Se cuenta con el criterio de
parada de número de ítems en el cual el
test para cuando cumple con el número
de ítems administrados definidos en esta
opción. También se cuenta con el criterio
de nivel de conocimiento, en el cual se

Figura 4. Ejecución del test adaptativo

Ésta opción está disponible haciendo actual del individuo, la respuesta correcta
click en la tecla D. Al hacer esto se y una tabla que muestra los datos de los
despliega una ventana emergente en la ítems disponibles para administrar y que
cual se muestra el nivel de conocimiento participan en la selección del ítem actual.

35
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

Figura 5. Debug del proceso de selección

Aparece el id del ítem, los parámetros a,


b, c y el indicador de Fisher, el cual REFERENCIAS
presenta la probabilidad de que el ítem
sea contestado correctamente por el [1]. W. J. van der Linden and C. A. W.
individuo teniendo en cuenta su nivel de Glas, Computerized Adaptive Testing:
conocimiento actual. Se elige el ítem que Theory and Practice. 2000.
tenga un máximo en esta probabilidad.
Gracias a esto se observa que el id del [2]. H. Wainer, N. J. Dorans, R. Flaugher,
ítem resaltado coincide con el id del ítem B. F. Green, and R. J. Mislevy,
administrado en el test. El Computerized Adaptive Testing: A
comportamiento del test continúa de la Primer. 2000.
misma manera hasta que el usuario
alcanza el nivel de conocimiento [3]. A. Binet and T. Simon, “Méthodes
configurado como criterio de parada del nouvelles pour le diagnostic du
test. niveau intellectuel des anormaux,”
Annee. Psychol., vol. 11, no. 1, pp.
191–244, 1904.
5. CONCLUSIÓN
Se consiguió implementar los algoritmos [4]. W. Patience, “MicroCAT Testing
de selección de ítems y de cálculo del System Version 3.0.,” J. Educ. Meas.,
nivel de conocimiento por medio de la vol. 27, no. 1, pp. 82–88, 1990.
estimación por máxima verosimilitud
conjunta. [5]. M. Pommerich, “The nine lives of
Se requiere la validación de expertos en CAT-ASVAB: Innovations and
el área de la psicometría y de la revelations,” Proc. 2009 …, 2009.
educación para que el sistema propuesto
pueda ser aplicado como una [6]. S. Imai, S. Ito, Y. Nakamura, K.
herramienta efectiva de evaluación. Kikuchi, Y. Akagi, H. Nakasono, A.
Honda, and T. Hiramura, “Features of

36
Camilo Cervantes, Sistema adaptattivo informatizado para apoyar el area de progrmación

J-CAT (Japanese Computerized [10]. B. Ruo, S. W. Choi, D. W. Baker, K.


Adaptive Test).” D. J. Weiss (Ed.), L. Grady, and D. Cella, “Development
Proceedings of the 2009 GMAC and validation of a computer adaptive
Conference on Computerized test for measuring dyspnea in heart
Adaptive Testing., 2009. failure.,” J. Card. Fail., vol. 16, no. 8,
pp. 659–68, Aug. 2010.
[7]. C. N. Mills and M. Steffen, “The
GRE Computer Adaptive Test : [11]. F. Lord, “Individualized Testing and
Operational Issues,” in Computerized Item Characteristic Curve Theory.,”
Adaptive Testing: Theory and 1972.
Practice, Springer Netherlands, 2000,
pp. 75–99. [12]. J. M. Fernández, Introducción a la
teoría de respuesta a los ítems.
[8]. Lawrence M. Rudner, Pirámide, 1997.
“Implementing the Graduate
Management Admission Test [13]. R. K. Hambleton, H. Swaminathan,
Computerized Adaptive Test,” in and H. J. Rogers, Fundamentals of
Elements of Adaptive Testing, Wim J. Item Response Theory. 1991.
van der Linden and C. A. W. Glas,
Eds. Springer New York, 2010, p. pp [14]. F. Baker, The basics of item response
151–165. theory. 2001.

[9]. P. Rebollo, E. García Cueto, P. C. [15]. K. T. Han, “WinGen: Windows


Zardaín, J. Cuervo, I. Martínez, J. software that Generates IRT
Alonso, M. Ferrer, and J. Muñiz, parameters and item responses,”
“[Development of the CAT-Health, the Applied Psychological Measurement,
first adaptive computerized test (CAT) 2007. [Online]. Available:
for the evaluation health-related http://www.umass.edu/remp/software/
quality of life in Spain].,” Med. Clin. simcata/wingen/homeR.html.
(Barc)., vol. 133, no. 7, pp. 241–51, [Accessed: 08-Apr-2015].
Jul. 2009.

37

Você também pode gostar